¿Cuáles son los tipos de listas de vocabulario integradas para temas clasificados?
Capítulo 7, Lenguaje temático en la organización de información en red (Yan Yupei)
Características de la organización de información de bases de datos en línea
(1) Existen instituciones o desarrolladores especializados. es desarrollado por una organización empresarial y equipado con personal profesional de organización y procesamiento de información. La organización de la información está más estandarizada y la descripción es más precisa.
(2) La mayoría de los recursos de información son información documental digitalizada, y su organización y recuperación tienen fuertes fundamentos teóricos y prácticos.
(3) El contenido de la información es altamente disciplinario y es más fácil lograr una organización y recuperación sistemática.
(4) La estructura de conocimientos y las necesidades de información del usuario son relativamente simples, el propósito de búsqueda es sólido y las preguntas de búsqueda son más profesionales.
(5) Generalmente, hay varios métodos de búsqueda para elegir y la eficiencia de la búsqueda también es mayor.
Características de la recuperación de palabras clave en bases de datos online.
⑴ Todas las palabras clave se indexan manualmente y algunas bases de datos incluso las expresan profesionales, por lo que la calidad es alta.
⑵ Algunas bases de datos tienen tablas de palabras clave para que los usuarios utilicen la navegación y la recuperación; /p>
⑶ Antes de la recuperación, generalmente es necesario seleccionar un tema principal y luego seleccionar bases de datos de diferentes disciplinas en el sistema de base de datos, de modo que la eficiencia de recuperación de palabras clave mejore enormemente y se reduzca la tasa de detección falsa. se mejora la tasa de precisión;
⑷ Generalmente, hay listas de palabras prohibidas más detalladas y profesionales, que estandarizan las palabras clave en mayor medida
⑸ Se pueden utilizar otros métodos de búsqueda como clave; mejorar Los medios auxiliares y las condiciones limitantes para la eficiencia de recuperación de palabras, especialmente la función de búsqueda secundaria, pueden reducir en gran medida el alcance y mejorar la tasa de precisión.
Tecnología de asistencia (7 ítems)
1. La búsqueda booleana es la regla básica para garantizar el correcto funcionamiento de la búsqueda de múltiples palabras clave. En la búsqueda simple de palabras clave, se mencionó que los espacios entre varias palabras clave pueden expresar la relación lógica predeterminada del sistema. En la recuperación avanzada de palabras clave, los usuarios deben utilizar operadores lógicos para convertir las preguntas de búsqueda en las expresiones lógicas correspondientes para su recuperación.
2. Búsqueda de truncamiento. Utilice caracteres de truncamiento para truncar palabras clave y utilice fragmentos de palabras clave para buscar.
3. Búsqueda restringida. Significa limitar el alcance de la búsqueda, reducir el alcance de la búsqueda, reducir la producción de información inútil y mejorar la tasa de precisión.
4. Búsqueda de ubicación. Algunos motores de búsqueda también ofrecen búsquedas limitadas por ubicación.
5. Búsqueda basada en el sistema de categorías. La búsqueda de palabras clave de algunos motores de búsqueda se puede utilizar junto con el sistema de búsqueda de clasificación que proporcionan.
6. Búsqueda relacionada. Esto significa que mientras el motor de búsqueda busca según la palabra clave ingresada, también mostrará automáticamente los sinónimos y sinónimos de la palabra clave al usuario.
7. Recuperación de tuberías. El símbolo de barra vertical | se puede utilizar en los motores de búsqueda para conectar dos o más palabras clave.
El concepto y función del vocabulario prohibido.
Concepto: Lista de palabras prohibidas se refiere a una lista de palabras en el sistema de búsqueda que excluye palabras que no tienen significado de búsqueda al enumerar palabras que no son de búsqueda. La lista de palabras prohibidas es una de las herramientas importantes del método de organización de materias. También es una herramienta auxiliar para la indexación y recuperación del lenguaje natural. Es una tecnología importante que promueve el desarrollo del lenguaje natural de las materias.
Función: El papel de las listas de palabras prohibidas
Podemos dividir el uso de listas de palabras prohibidas en dos tipos. Una es una lista de palabras prohibidas que se utiliza en el proceso de indexación de materias y la otra es una lista de palabras prohibidas que se utiliza en el proceso de recuperación.
⑴ Citar lista de palabras prohibidas
⑵ Buscar lista de palabras prohibidas
Buscar lista de palabras prohibidas es una lista de palabras que implementa anticontrol durante la etapa de recuperación, principalmente en Utilizado en sistemas de recuperación de lenguaje natural. El uso de la lista de palabras prohibidas puede filtrar palabras que no tienen significado de recuperación en la estrategia de búsqueda, retener las partes con significado real y luego enviarlas al sistema para su recuperación para obtener mejores resultados de recuperación.
Cómo mejorar la eficiencia de la recuperación (se desconoce el contenido específico, te lo diré después de consultar al profesor).
Diccionario de sinónimos y diccionario de antónimos.
1. El papel del diccionario de sinónimos y el diccionario de antónimos en el sistema de recuperación.
El diccionario de sinónimos y el diccionario de antónimos son una especie de herramientas de control y conversión de palabras de entrada.
2. Características del diccionario de sinónimos y diccionario de antónimos
⑴ Características del diccionario de sinónimos
① Palabras sujetas y palabras no sujetas en el diccionario de sinónimos La distinción es no es tan obvio El control de la relación entre palabras no es tan estricto como el tesauro. Se puede agregar, eliminar y modificar a voluntad.
② Además de recopilar palabras conceptuales, el diccionario de sinónimos también incluye sustantivos especiales, como nombres de personas, nombres de organizaciones, etc. El alcance de la lista de palabras es más amplio que el del tesauro.
③Además de los sinónimos generales, los sinónimos incluidos en el diccionario de sinónimos incluyen nombres científicos y nombres comunes, nombres nuevos y nombres antiguos, nombres completos y abreviaturas, nombres formales, apodos y modelos de un mismo producto, traducciones. en diferentes lugares, etc.
⑵ Características del diccionario de antónimos
① No distingue entre palabras sujetas y palabras no sujetas.
② Incluye antónimos y palabras negativas.
3. Aplicación del diccionario de sinónimos y el diccionario de antónimos en la recuperación de información de la red
Al aplicar el diccionario de sinónimos y el diccionario de antónimos, la eficiencia de búsqueda del sistema de recuperación de información de la red se puede mejorar enormemente.
Capítulo 8. El desarrollo del lenguaje temático en el país y en el extranjero (Wang Yanni)
El desarrollo del lenguaje temático extranjero
1. Periodo
1. Lenguaje de palabras de título
Un tipo temprano de lenguaje de tema es el método de título tradicional.
En 1856 se publicó el libro "Técnicas de catalogación de bibliotecas" de Christadoro en Inglaterra.
En 1854, la Merchant Library de Boston, EE. UU., recopiló e imprimió reglamentos de catálogos al estilo de un diccionario.
En 1895, apareció la "Lista de títulos de la Asociación Estadounidense de Bibliotecas".
1909-1914 Se publica la "Lista de títulos de la Biblioteca del Congreso".
Teoría y tecnología de recopilación de vocabulario:
En 1911, Kaiser propuso la fórmula del "nombre-aspecto especial".
En 1959, Metcalfe publicó la monografía "Clasificación e indexación de temas de documentos bibliotecarios".
En la primera mitad del siglo XX, bajo la influencia de LCSH, se publicaron al menos cientos de listas de títulos, incluidas "Lista de títulos de Sears", "Lista de títulos de ingeniería" y "Lista de títulos del índice de contadores". , "La "Lista de títulos de la empresa de servicios de información de asuntos públicos", etc., todavía están en uso.
2. Lenguaje de palabras unitarias
El método de palabras unitarias incluye dos formas: el método de indexación de combinación de tipo agujero y el método de indexación de combinación de tipo signo.
En 1939, Patton del Reino Unido creó el método de recuperación combinado "Bicon Card".
De 1951 a 1952, Taub y Gur propusieron sistemáticamente el "método de índice de combinación de palabras unitarias" y establecieron un sistema de tarjetas de palabras unitarias. Este método ha sido probado y aplicado durante mucho tiempo en el Centro de Artillería Naval de EE. UU., el Laboratorio de Productos de Aviación Linde, la Oficina de Patentes de EE. UU., DuPont Company y otras unidades.
2. El desarrollo del lenguaje de tesauros
Durante el período de 1947 a 1950, los Moores estadounidenses crearon términos especializados como tesauro, método de tesauro, recuperación de información y sistema de recuperación de información.
El tesauro compilado por DuPont en Estados Unidos en 1959 fue el primer tesauro auténtico del mundo.
En 1960, la Agencia de Inteligencia Técnica de las Fuerzas Armadas de Estados Unidos publicó el "ASTIA Thesaurus". La década de 1960 fue un período de rápido desarrollo de los tesauros, y este impulso continuó hasta la década de 1980, lo que convirtió al lenguaje de tesauros en el principal método de control de vocabulario para la recuperación de información.
3. Recopilación y desarrollo de lista de vocabulario integrado