Búsqueda de código abierto 20 sistemas de motores de búsqueda de código abierto
Sphider
Sphider es un motor de búsqueda y araña web liviano desarrollado en PHP y utiliza mysql para almacenar datos. Puede usarlo para agregar funcionalidad de búsqueda a su sitio web. Sphider es muy pequeño, fácil de instalar y modificar y lo utilizan miles de sitios web.
RiSearch PHP
RiSearch PHP es un motor de búsqueda eficiente y potente, especialmente indicado para sitios web pequeños y medianos. RiSearch PHP es muy rápido. Puede buscar entre 5000 y 10000 páginas en menos de 1 segundo. RiSearch es un motor de búsqueda indexado, lo que significa que primero indexa su sitio web y crea una base de datos para almacenar palabras clave para todas las páginas de su sitio web para búsquedas rápidas. Risearch es un script de motor de búsqueda de texto completo que compila todas las palabras clave en el índice del documento, excepto las palabras clave que están excluidas según lo definido en el archivo de configuración. RiSearch utiliza el clásico algoritmo de indexación invertida (el mismo que los grandes motores de búsqueda), por lo que es más rápido que otros motores de búsqueda.
PhpDig
PhpDig es un rastreador web y motor de búsqueda desarrollado por PHP. Cree un glosario indexando páginas dinámicas y estáticas. Cuando se busca una consulta, se mostrarán páginas de resultados de búsqueda que contienen palabras clave de acuerdo con ciertas reglas de clasificación. PhpDig incluye un sistema de plantillas que puede indexar documentos PDF, Word, Excel y PowerPoint. PHPdig es adecuado para motores de búsqueda más profesionales y personalizados, y es la mejor opción para crear un motor de búsqueda vertical en un campo determinado.
OpenWebSpider
OpenWebSpider es una araña web multiproceso de código abierto (robot, rastreador) y un motor de búsqueda con muchas características interesantes.
Egothor
Egothor es un motor de búsqueda de texto completo eficiente y de código abierto escrito en Java. Con la naturaleza multiplataforma de Java, Egothor se puede aplicar en cualquier entorno. Puede configurarse como un motor de búsqueda independiente o usarse para la recuperación de texto completo en su aplicación.
Filtro de vacío arriba y abajo
Nutch es un motor de búsqueda de código abierto implementado en Java. Proporciona todas las herramientas que necesitamos para ejecutar nuestro propio motor de búsqueda. Incluye búsqueda de texto completo y rastreo web.
Motor de búsqueda de texto completo
Apache Lucene es un motor de búsqueda de texto completo basado en Java que puede agregar fácilmente la funcionalidad de búsqueda de texto completo al software Java. El trabajo principal de Lucene es indexar cada palabra del documento. La indexación mejora enormemente la eficiencia de la búsqueda en comparación con las comparaciones tradicionales palabra por palabra. Lucene proporciona un conjunto de API para leer, filtrar, analizar documentos, ordenar y usar índices. No sólo es potente y eficiente, sino que lo más importante es que los usuarios pueden personalizar sus funciones en cualquier momento según sus propias necesidades.
Ox
es un motor de búsqueda web escrito exclusivamente en Java.
BDDBot
BDDBot es un motor de búsqueda sencillo, fácil de entender y utilizar. Actualmente está rastreando las URL enumeradas en un archivo de texto (urls.txt) y guardando los resultados en una base de datos. También admite un servidor web simple que acepta consultas del navegador y devuelve resultados de respuesta. Se puede integrar fácilmente en su sitio web.
Zilverline
Zilverline es un buscador que busca el contenido del disco duro local o intranet a través de la web. Zilverline puede capturar contenido de PDF, Word, Excel, Powerpoint, RTF, txt, java, CHM, zip, rar y otros documentos para resumirlos e indexarlos. Los resultados encontrados en el disco duro local o en la intranet se pueden recuperar nuevamente. Zilverline admite varios idiomas, incluido el chino.
XQEngine
XQEngine es un motor de búsqueda de texto completo para documentos XML. Utiliza XQuery como lenguaje de consulta frontal.
Le permite consultar una colección de documentos XML mediante combinaciones lógicas de palabras clave. Es un poco como Google y otros motores de búsqueda que buscan documentos HTML. XQEngine es solo un componente compacto e integrable desarrollado en Java.
MG4J
MG4J le permite crear índices de texto completo comprimidos para grandes colecciones de documentos mediante el uso de técnicas de codificación de interpolación.
JXTA Search
JXTA Search es un sistema de búsqueda distribuido. Diseñado específicamente para redes y sitios web de igual a igual.
Yacy
Motor de búsqueda en red distribuida basado en YaCy p2p. También es un servidor proxy de almacenamiento en caché HTTP. Este proyecto es un nuevo método para construir una red de índice basada en una red p2p. Puede buscar índices propios o globales, rastrear sus propias páginas web o iniciar un rastreo distribuido.
Red-Piranha
Red-Piranha es un sistema de búsqueda de código abierto que realmente "aprende" lo que estás buscando. Red-Piranha se puede utilizar como motor de búsqueda personal para sistemas de escritorio (Windows, Linux y Mac), o como motor de búsqueda de intranet, o para proporcionar funcionalidad de búsqueda para su sitio web, o como motor de búsqueda P2P, o como conocimiento/documentación. combinado con una solución de gestión wiki, o busque la información de distribución RSS que desee, o busque en los sistemas de su empresa (incluidos SAP, Oracle o cualquier otra base de datos/fuente de datos), o para gestionar PDF, Word y otros documentos, o como una búsqueda Motor Información o servicios web (Web, Swing, SWT, Flash, MozillaNet), etc. que proporcionan contexto de búsqueda para su aplicación.
Liu
LIUS es un marco de indexación basado en el proyecto Jakarta Lucene. LIUS agrega funciones de indexación para múltiples formatos de archivos a Lucene, como: Microsoft Word, Microsoft Excel, Microsoft PowerPoint, RTF, PDF, XML, HTML, TXT, secuencia Open Office y JavaBeans. La indexación de JavaBeans es particularmente útil cuando queremos indexar la base de datos o cuando los usuarios simplemente usan tecnologías ORM persistentes como Hibernate, JDO, Torque y TopLink.
Apache Solr
Solr es un servidor de búsqueda de texto completo de alto rendimiento basado en Lucene desarrollado por Java5. Agregue documentos a la colección de búsqueda usando XML sobre Http. La consulta de esta colección también se realiza buscando el contenido, en lugar de buscar en sus propios documentos o archivos. Con reciente, puede buscar fácilmente grandes cantidades de datos (muchos gigabytes) en segundos. recreat adopta la sintaxis de búsqueda de Lucene, por lo que admite varios métodos de consulta, búsqueda de índices múltiples y búsqueda avanzada basada en tipos de archivos, y puede reescribir URL y conectar archivos a HTTP. También proporciona un buen soporte para chino.
recreat ofrece dos versiones: búsqueda en escritorio y búsqueda en servidor. Desktop Search proporciona la función de buscar rápidamente documentos y páginas web en computadoras de escritorio comunes en un entorno LAN. La versión del servidor se instala principalmente en servidores de red y se utiliza para buscar sitios web y servidores de archivos en un entorno LAN.