Colección de citas famosas - Colección de máximas - ¿Qué es la recuperación de texto completo? Una introducción a la recuperación de texto completo.

¿Qué es la recuperación de texto completo? Una introducción a la recuperación de texto completo.

La búsqueda de texto completo es un método de recuperación de datos de texto que relaciona todo el texto del archivo con los términos de búsqueda. Entonces, ¿cuánto sabes sobre la recuperación de texto completo? El siguiente es el contenido que compilé sobre qué es la recuperación de texto completo. ¡Espero que te guste!

Introducción a la recuperación de texto completo

.

Introducción básica

La recuperación de texto completo es una recuperación para encontrar cualquier información de contenido en todo el libro o artículo almacenado en la base de datos. Puede obtener información sobre capítulos, secciones, párrafos, oraciones, palabras, etc. en el texto completo según sea necesario, lo que es similar a agregar una etiqueta a cada palabra en todo el libro, y también puede realizar diversas estadísticas y análisis. Por ejemplo, puede responder rápidamente a la pregunta "¿Cuántas veces aparece la palabra "Lin Daiyu" en "Un sueño de mansiones rojas"?

Temas relacionados

Derivación

Analizador de tokens de 1 gramo, 2 gramos, n-grama

Segmentación de palabras

Índice invertido

Modelo de algoritmo y estrategia de búsqueda

Booleano

Modelo estadísticoModelo probabilístico

Modelo base vectorial

Modelo semántico latente

Introducción a la recuperación del sistema

p>

Criterios de evaluación

Dos indicadores para juzgar el efecto de recuperación:

Tasa de recuperación = cantidad de información relevante detectada/cantidad total de información relevante (%)

Tasa de precisión = cantidad de información relevante detectada/cantidad total de información detectada (%)

Sistema de recuperación de texto completo para código fuente abierto

Apache Solr

 BaseX

 Clusterpoint Server (licencia gratuita para un solo servidor)

 DataparkSearch

 Ferret

 Ht- //Dig

Hyper Estraier

KinoSearch

Lemur/Indri

Lucene

mnoGoSearch

Esfinge

Swish-e

Xapian

ElasticSearch

El concepto de optimización de temas

y cuestiones relevantes del chino

Segmentación de palabras (participios)

Análisis gramatical

Ediciones de libros antiguos

Mezcla de varios idiomas

Optimización

Palabras vacías

Etiquetado de partes del discurso

Archivo autorizado (archivo de autoridad)

Sistema de conocimiento, ontología

Tecnología de análisis de hipervínculos (clasificación de página)

Historia y tendencias futuras

Gratis búsqueda de frases