Definición del Tesauro de Archivos Chinos
Esta norma adopta las siguientes definiciones
3.1 Archivos
Variedad de documentos históricos valiosos formados directamente por instituciones nacionales, organizaciones sociales e individuos en actividades sociales. [1.1 en DA/T1]
3.2 Asunto del archivo
El objeto o problema específicamente descrito en el archivo.
3.3 Encabezados de materia
También conocidos como descriptores (es decir, encabezamientos de materia formales). Al indexar y buscar archivos, el tesauro estipula las palabras utilizadas para expresar el tema del archivo.
3.4 Palabras clave informales
También conocidas como no tesauro. Es sinónimo o cuasi sinónimo de un encabezamiento de materia formal. Es una palabra incluida en la lista de encabezamientos de materia pero no puede usarse como identificador de archivo y solo sirve como guía.
3.5 Tesauro de archivos
Diccionario estandarizado compuesto por palabras temáticas que reflejan el contenido de los archivos y la relación entre ellos. Convierte el lenguaje natural de los archivos, indexadores o usuarios en una terminología. herramienta de control de lenguajes normalizados.
3.6 Indexación de materias
El proceso de asignar encabezados de materia a archivos. [5.6.2 en DA/T1]
3.7 Profundidad de indexación de materias
Se refiere al número de palabras de materia asignadas a un objeto de indexación.
4. Análisis de temas
El análisis de temas es la base de la indexación de temas. Al analizar las características del contenido de los archivos, los conceptos de los temas se pueden refinar y seleccionar con precisión.
4.1 Revisar los archivos
Al revisar los archivos, comprender y juzgar el contenido central y otros factores temáticos reflejados en los archivos.
4.1.1 Leer el título
El título del documento y expediente es un resumen del contenido del expediente. Cuando el título refleja con precisión el contenido central del archivo, leer el título es un atajo para analizar y refinar el tema, pero el título no puede usarse como la única base para refinar el concepto del tema.
4.1.2 Explorar el texto completo
Cuando el archivo no tiene título o el título no puede reflejar de forma completa y precisa el tema del archivo, debes explorar el texto completo. Al explorar el texto completo, debes concentrarte en comprender los temas y temas profundos que no se reflejan en el título, y descubrir temas ocultos. Al navegar por el texto completo, el objetivo es leer el principio, la conclusión y los títulos de los párrafos del texto completo. Si es necesario, lea los comentarios, el resumen, la introducción, el índice, los cuadros, las hojas de preparación, etc.
4.2 Tipo de tema
Los tipos de tema se pueden dividir en dos tipos: tema único y temas múltiples. Los temas únicos incluyen temas unitarios y temas compuestos (es decir, temas múltiples), mientras que los temas múltiples se componen de varios temas únicos.
4.3 Estructura del tema
Cualquier tema se compone de ciertos factores del tema. Los factores que constituyen un tema generalmente se pueden dividir en: factores de tema, factores generales, factores de ubicación, factores de tiempo y factores de género.
4.4 Selección de conceptos temáticos
A partir de la revisión del título del archivo o del texto completo, se refinan y seleccionan uno o varios conceptos temáticos en lenguaje natural que expresan el tema del archivo. Los principios para seleccionar los conceptos temáticos son:
a) Los conceptos temáticos seleccionados deben ser temas discutidos en los archivos
b) Los conceptos temáticos seleccionados deben tener un significado práctico de recuperación
; p>
c) El concepto del tema seleccionado debe poder expresar de manera integral y precisa el tema del archivo.
5. Selección e indexación de palabras
La indexación de palabras es el proceso de asignar identificadores de palabras temáticas a los conceptos analizados por el tema del archivo.
5.1 Los conceptos de materia seleccionados en el análisis de materia deben convertirse en encabezamientos de materia (encabezamientos de materia formales) en los encabezamientos de materia de los archivos para la indexación. La forma de escritura debe ser la misma que la del tesauro. la forma es consistente. Los encabezamientos de materia informales no se pueden utilizar como términos de indexación.
5.2 Las palabras de indexación deben utilizar palabras temáticas específicas en la lista de vocabulario de temas de archivos que correspondan directamente al concepto de tema de archivos.
5.3 Cuando no hay un término de materia específico que corresponda directamente al concepto de materia de archivo en el vocabulario, se deben seleccionar dos o más términos de materia para la indexación combinada.
5.3.1 La combinación debe ser una combinación conceptual. La combinación de conceptos incluye los dos tipos siguientes:
a) Combinación cruzada, es decir, combinación de palabras del mismo nivel. Se refiere al uso de dos o más palabras sujetas hermanas con relaciones entre conceptos para expresar sus correspondientes conceptos subordinados.
b) Combinación de aspectos, es decir, combinación limitada.
Se refiere a la combinación de una palabra sujeta que representa una cosa y una o varias otras palabras sujetas que representan un determinado atributo o aspecto de una cosa para expresar el concepto subordinado correspondiente.
5.3.2 Al ensamblar índices, dé prioridad a la combinación cruzada y luego considere la combinación de aspectos.
5.3.3 Se deben seleccionar para combinar las palabras temáticas que estén más relacionadas y más cercanas al concepto del tema del archivo. No se puede combinar con un nivel superior, es decir, no se puede combinar con su superior. o palabras sujetas subordinadas.
5.3.4 Los conceptos expresados en los resultados de la combinación deben ser claros y precisos, y sólo pueden expresar un concepto temático.
5.3.5 Para evitar detecciones falsas causadas por combinaciones falsas de múltiples temas, se pueden agregar símbolos de contacto para distinguir cada pregunta. El método es: use los números 1.2.3... después de la palabra del asunto para representar el símbolo de agrupación. Las palabras del asunto con el mismo número son un grupo de conceptos de agrupación relacionados. El "0" del número se denomina *** con un guión, lo que indica que el término temático se puede combinar con cualquier término temático indexado en el archivo.