Colección de citas famosas - Libros antiguos - Cómo dividir el concepto de recuperación de información mediante segmentación

Cómo dividir el concepto de recuperación de información mediante segmentación

1. Preparación para la recuperación. 2. Seleccione el sistema de búsqueda. 3. Desarrollar patrones de búsqueda. 4. Ajusta la estrategia de búsqueda. 5. Seleccione literatura. 6. Obtenga el texto completo.

Se refiere a un método de recuperación en el que un programa informático de indexación escanea cada palabra de un artículo, indexa cada palabra e indica el número y la posición de la palabra en el artículo. Cuando el usuario realiza una consulta, el programa de recuperación busca basándose en el índice preestablecido y envía los resultados de la búsqueda al usuario. Este proceso es similar a buscar palabras en un diccionario.

Los métodos de recuperación de texto completo se dividen principalmente en recuperación palabra por palabra y recuperación palabra por palabra. La recuperación palabra por palabra se refiere a indexar cada palabra del artículo y descomponer las palabras en combinaciones de palabras durante la recuperación. Para diferentes idiomas, las palabras tienen diferentes significados. Por ejemplo, en inglés, las palabras y los caracteres son en realidad uno, pero en chino, las palabras y los caracteres son bastante diferentes. La búsqueda palabra por palabra se refiere a la indexación de palabras, es decir, las unidades semánticas del artículo. Al buscar, busque por palabra y pueda manejar sinónimos. El inglés y otros caracteres occidentales se dividen por espacios, por lo que la implementación es similar al procesamiento palabra por palabra y es fácil agregar procesamiento de sinónimos. Las escrituras orientales, como el chino, requieren la segmentación de palabras para lograr la indexación palabra por palabra. Este problema es una dificultad en la tecnología actual de recuperación de texto completo, especialmente en la tecnología de recuperación de texto completo china.