¿Qué es la recuperación de texto completo? Una introducción a la recuperación de texto completo.
La búsqueda de texto completo es un método de recuperación de datos de texto que relaciona todo el texto del archivo con los términos de búsqueda. Entonces, ¿cuánto sabes sobre la recuperación de texto completo? El siguiente es el contenido que compilé sobre qué es la recuperación de texto completo. ¡Espero que te guste!
Introducción a la recuperación de texto completo
.Introducción básica
La recuperación de texto completo es una recuperación para encontrar cualquier información de contenido en todo el libro o artículo almacenado en la base de datos. Puede obtener información sobre capítulos, secciones, párrafos, oraciones, palabras, etc. en el texto completo según sea necesario, lo que es similar a agregar una etiqueta a cada palabra en todo el libro, y también puede realizar diversas estadísticas y análisis. Por ejemplo, puede responder rápidamente a la pregunta "¿Cuántas veces aparece la palabra "Lin Daiyu" en "Un sueño de mansiones rojas"?
Temas relacionados
Derivación
Analizador de tokens de 1 gramo, 2 gramos, n-grama
Segmentación de palabras
Índice invertido
Modelo de algoritmo y estrategia de búsqueda
Booleano
Modelo estadísticoModelo probabilístico
Modelo base vectorial
Modelo semántico latente
Introducción a la recuperación del sistema
p>
Criterios de evaluación
Dos indicadores para juzgar el efecto de recuperación:
Tasa de recuperación = cantidad de información relevante detectada/cantidad total de información relevante (%)
Tasa de precisión = cantidad de información relevante detectada/cantidad total de información detectada (%)
Sistema de recuperación de texto completo para código fuente abierto
Apache Solr
BaseX
Clusterpoint Server (licencia gratuita para un solo servidor)
DataparkSearch
Ferret
Ht- //Dig
Hyper Estraier
KinoSearch
Lemur/Indri
Lucene
mnoGoSearch
Esfinge
Swish-e
Xapian
ElasticSearch
El concepto de optimización de temas
y cuestiones relevantes del chino
Segmentación de palabras (participios)
Análisis gramatical
Ediciones de libros antiguos
Mezcla de varios idiomas
Optimización
Palabras vacías
Etiquetado de partes del discurso
Archivo autorizado (archivo de autoridad)
Sistema de conocimiento, ontología
Tecnología de análisis de hipervínculos (clasificación de página)
Historia y tendencias futuras
Gratis búsqueda de frases