Procesamiento de información
El llamado procesamiento de información se refiere a la selección, juicio, clasificación, catalogación, catalogación, organización, almacenamiento y análisis de una gran cantidad de información original recopilada de acuerdo con diferentes propósitos y requisitos, el proceso de convertirla en información con cierto valor de uso.
Por lo general, la información original recopilada es información inicial, desordenada y aislada. Sólo clasificando y organizando esta información de orden cero y convirtiéndola en información de alto orden regular, ordenada y sistemática se puede utilizar sólo mediante descripción e indexación se puede transformar la información de nivel cero en información de segundo nivel para facilitar el almacenamiento de información. recuperación y entrega. Por lo tanto, el proceso de procesamiento de información consiste en producir nueva información con alto valor y facilidad de uso para los usuarios basándose en la información original, aumentando así el valor de la información.
Según diferentes estándares, el procesamiento de la información se puede dividir de diferentes maneras.
Según la diferencia en el tiempo de respuesta del procesamiento, el procesamiento se puede dividir en procesamiento en tiempo real y procesamiento por lotes. El procesamiento en tiempo real se refiere al procesamiento inmediato de los datos enviados y la respuesta inmediata, que generalmente es adecuado para operaciones de rutina. El procesamiento por lotes se refiere a almacenar los datos enviados durante una cierta cantidad o tiempo antes del procesamiento centralizado, y generalmente es adecuado para negocios de análisis estadístico.
Según la profundidad de las funciones de procesamiento, el procesamiento se puede dividir en preprocesamiento, procesamiento comercial y procesamiento de toma de decisiones. El preprocesamiento es la simple organización de la información; el procesamiento comercial es analizar información y sintetizarla para ayudar en la toma de decisiones; el procesamiento de decisiones es la inferencia estadística de información para generar información para la toma de decisiones.
Según las diferentes herramientas de procesamiento, se puede dividir en procesamiento manual y procesamiento informático. El procesamiento manual es el uso de equipos artificiales para procesar información y existe principalmente en la etapa primaria del procesamiento de información. El procesamiento informático es el uso de computadoras para el procesamiento de datos, el procesamiento de datos sin procesar para producir tablas, gráficos y otros resultados.
3.4.2 Cribado de la información
El cribado de la información es el primer paso en el procesamiento de la información. Su propósito es eliminar lo falso y retener lo verdadero, eliminar lo aproximado y seleccionar lo esencial, y garantizar la exactitud y eficacia de la información.
Procedimiento de selección de información
Los procedimientos básicos para la selección de información incluyen principalmente los siguientes aspectos:
(1) Clasificación de información. La clasificación de la información es el requisito previo para la selección y discriminación de la información. Su propósito es estandarizar y organizar la información dispersa y desordenada para facilitar su procesamiento y análisis posteriores.
(2) Navegar y revisar. La navegación y la revisión son vínculos centrales en el filtrado y selección de información. El objetivo es eliminar información que sea obviamente falsa o inútil y retener información que sea obviamente verdadera o útil. Parte de la información que no se pueda determinar en este momento quedará en suspenso para su posterior procesamiento.
(3) Revisar nuevamente. Para información incierta, se deben utilizar consultas u otros métodos científicos para analizar e investigar nuevamente para determinar científicamente la selección y mejorar la precisión de la selección y discriminación de la información.
3.4.2.2 Objetos clave del cribado de información
(1) Información ficticia. Esta información es completamente ficticia e inventada y no tiene base fáctica. Principalmente debido a los malos motivos del recopilador de información, este tipo de información debe eliminarse.
(2) Añadir información. Aunque este tipo de información tiene una cierta base, algunas tramas y contenidos son agregados por los recolectores y transmisores de información a través de la imaginación subjetiva en lugar de basarse en hechos, y deben ser analizados y distinguidos.
(3) Exagerar la información. Este tipo de información a menudo exagera o reduce los hechos, lo que es una distorsión de los hechos y afectará gravemente la autenticidad y credibilidad de la información.
(4) Información sesgada. Este tipo de información es unilateral para enfatizar la causa de una acción o para reprimir los elementos de una acción. Si este tipo de información no se puede verificar y corregir, afectará el valor de uso de la información e incluso causará grandes pérdidas a los usuarios de la información.
(5)Información incompleta. La información obtenida únicamente a través de fenómenos o características individuales es información incompleta porque se ha obtenido incorrectamente a lo largo del tiempo o porque no se puede obtener la fuente de la información en sí. Este tipo de información generalmente requiere una recopilación adicional adicional.
(6) Información difusa. Este tipo de información proviene de rumores e insinuaciones de los recolectores de información, muchas veces con palabras como "dijo", "escuché", "probablemente", "posible", "hay señales", etc. Esta información tiene poca credibilidad y debe recopilarse y verificarse nuevamente.
(7) Reúna la información.
En el proceso de recopilación, procesamiento y transmisión de este tipo de información, información de diferentes lugares, diferentes momentos, diferentes condiciones y diferentes naturalezas a menudo se combina en la misma información en el mismo lugar, al mismo tiempo, bajo las mismas condiciones. y de la misma naturaleza. En general, este mosaico de información sigue siendo infundado.
3.4.2.3 Método de cribado de información
(1) Método de juicio sensorial. El método de juicio sensorial se refiere a un método en el que los procesadores de información se basan en sus propios conocimientos, habilidades y experiencia para juzgar intuitivamente la autenticidad y credibilidad de la información durante el proceso de exploración y revisión de la información original.
(2) Análisis comparativo. El análisis comparativo se refiere a un método en el que los procesadores de información realizan análisis comparativos de la misma información recopilada de diferentes canales para determinar la autenticidad y credibilidad de la información durante el proceso de selección e identificación de la información.
(3)Método de juicio de expertos. El método de juicio de expertos se refiere a un método en el que los expertos determinan el valor de cierta información que no se puede seleccionar en este momento.
(4) Método de discusión en grupo. El método de discusión colectiva se refiere al método de consulta colectiva, que utiliza la sabiduría colectiva para determinar la selección de cierta información de la que los individuos no pueden sacar conclusiones.
(5) Método de verificación in situ. El método de verificación in situ se refiere al método de instruir al personal de recopilación de información o al personal de procesamiento de información para que profundice en el sitio para verificar la autenticidad de la información en cuestión.
(6) Métodos matemáticos de contabilidad. La contabilidad matemática se refiere a un método de procesamiento en el que los procesadores de información vuelven a calcular cuando tienen preguntas sobre la información original. Este método puede corregir rápidamente las distorsiones de la información causadas por errores en la recopilación y el cálculo de la información, errores administrativos o errores durante la transmisión.
3.4.3 Clasificación de la información
La selección de información es el procesamiento aproximado de la información y la clasificación de la información es el procesamiento fino de la información. Sólo clasificando y organizando la información podemos almacenarla, recuperarla, transmitirla y utilizarla mejor.
3.4.3.1 Procedimientos básicos de clasificación de la información
(1) Determinar el método de clasificación. En la actualidad, existen muchos métodos de clasificación de información, incluida la clasificación regional, la clasificación de contenido, la clasificación de temas, la clasificación de tiempo y la clasificación integral. El método de clasificación utilizado determina directamente el orden de los materiales informativos. Por lo tanto, determinar la clasificación es la base y el requisito previo para la organización de la información.
(2) Implementar la organización de la información. Este es el segundo paso en la clasificación de la información, que consiste en clasificar los materiales informativos para su uso posterior.
(3) Organizar la información. Una vez clasificada la información, también existe el problema de organizar los materiales informativos de la misma categoría. Al organizar la información, la información puede convertirse en un sistema de información organizado.
3.4.3.2 Métodos específicos de clasificación de la información
(1) Clasificación regional. La clasificación regional se refiere al método de dividir la información según diferentes regiones.
(2) Clasificación temporal. La clasificación temporal se refiere a un método de dividir la información en orden cronológico. La clasificación temporal también se puede dividir por año, mes y día.
(3) Clasificación de contenidos. La clasificación de contenidos se refiere a un método de clasificar la información en función de los diferentes contenidos que contiene. Por ejemplo, según la industria, la información se puede subdividir en información agrícola, información industrial, información comercial, información de servicios, información turística, información empresarial, información de infraestructura, información financiera, información financiera, etc.
(4) Clasificación integral. La clasificación integral es un método para dividir la información de manera integral según el tiempo, la región y el contenido. Según diferentes combinaciones, la clasificación integral se puede dividir en clasificación de dominio de tiempo, clasificación de dominio de tiempo regional, clasificación de dominio de contenido, clasificación de dominio de tiempo de contenido, clasificación de contenido de tiempo regional, clasificación de tiempo de contenido regional, clasificación de dominio de contenido de dominio de tiempo y tiempo- Clasificación del dominio de contenido.
Descripción de la información
La descripción de la información, también conocida como descripción de la información, se refiere al análisis, selección y registro de las características externas y características parciales del contenido de la información de acuerdo con ciertas reglas de gestión y normas técnicas. A través de la descripción de la información se forma un registro que refleja las características de contenido y las características externas de la información original, que es una entrada o elemento. Un catálogo es una herramienta de recuperación e informes de archivos que organiza muchos elementos en un orden determinado. Una entrada es un microcosmos de un tipo de documento y un catálogo es un microcosmos de un lote de documentos.
3.4.4.1 Estandarización de la descripción de la información
La estandarización de la descripción de documentos se refiere a las especificaciones vinculantes sobre los principios, contenido y formato de la descripción de un documento dentro de un ámbito nacional o internacional. Para desarrollar y utilizar recursos documentales, es necesario obtener un lenguaje consistente de información bibliográfica para describir las características de los documentos y los métodos para informar y recuperar documentos. En la década de 1960, muchos países implementaron la estandarización de la documentación en sus propios países.
Sobre esta base, el grupo de trabajo de la Federación Internacional de Asociaciones e Instituciones Bibliotecarias (IFLA) comenzó a formular estándares internacionales de descripción de documentos en 1971 y publicó oficialmente la Descripción Bibliográfica Estándar Internacional (ISBD) en 1974, que ha sido ampliamente aceptada por países de todo el mundo. mundo. La bibliografía estándar internacional resuelve con éxito los siguientes problemas:
(1) Hacer que los elementos de descripción del documento y su orden de disposición sean intercambiables, es decir, lograr la unificación internacional de las descripciones de los documentos.
(2) Supera las barreras del idioma y facilita la identificación de descripciones de documentos de varios países. Incluso los lectores que no entienden un idioma pueden identificar términos descriptivos a través del sistema de símbolos.
(3) Ayuda a convertir bibliografías generales en formato de catálogo legible por máquina.
Con el fin de establecer y mejorar el sistema unificado de presentación de informes documentales de mi país, llevar a cabo intercambios internacionales de información bibliográfica y desarrollar y utilizar mejor los recursos de información documental, mi país ha establecido el Sexto Subcomité del Comité Técnico Nacional de Normalización. de Documentación (Subcomité de Descripción Bibliográfica). Con los esfuerzos conjuntos de la Asociación de Bibliotecas de China y la Sociedad de Bibliotecas de China, en julio de 1983 se publicaron oficialmente los "Principios generales de descripción de documentos" de la serie de normas nacionales de descripción de documentos. Desde entonces, se han introducido una tras otra varias subreglas, incluidas reglas para registrar libros generales, publicaciones seriadas, mapas, archivos, libros antiguos, diarios de recuperación y referencias.
3.4.4.2 Formato de catálogo legible por máquina
Marc (Catálogo legible por máquina) es la abreviatura de catálogo legible por máquina. Se registra en medios de almacenamiento informático en forma de código y una estructura específica, y es un directorio reconocido y leído por las computadoras.
Del 65438 al 0965, la Biblioteca del Congreso comenzó a desarrollar un catálogo legible por máquina. La cinta MARC ⅰ ⅰ se produjo en 1966. La cinta MARC ⅱ se publicó oficialmente en 1969 y, posteriormente, se publicaron archivos de datos MARC como monografías, publicaciones seriadas, archivos y manuscritos, materiales visuales, partituras musicales, mapas, etc. Debido a que el formato MARC fue desarrollado por la Biblioteca del Congreso, se llama USMARC (también llamado LCMARC). En 1977, la IFLA publicó por primera vez el "Formato de catálogo universal legible por máquina UNIMARC", que ha sido revisado continuamente desde entonces.
CNMARC es el formato de catálogo chino legible por máquina, desarrollado por la Organización Bibliográfica Nacional China basada en UNIMARC. WH/T0503-96 fue lanzado como el estándar de la industria cultural del pueblo chino. Esto cumple con la normativa ISO2709. Basado en UNIMARC, se conservan todos los campos definidos en UNIMARC y se complementan las definiciones de campos exclusivas de las publicaciones chinas. Por ejemplo, agrega los siguientes campos y subcampos: 091 número de libro unificado; 092 número de pedido; 093 número de patente; 690 "Clasificación de bibliotecas chinas"; 692 Clasificación de libros de la Academia de Ciencias de China, etc.
3.4.4.3 Doberman Core Standard
Doberman Core Standard es la abreviatura de DC. El formato de los metadatos de DC fue formulado por OCLC (Online Computer Library Center, Inc.) y NCSA (Centro Nacional para Aplicaciones de Supercomputación) que llevaron a cabo conjuntamente el primer taller (es decir, Taller de metadatos DCLC/NCSA), con el objetivo de encontrar un recurso de información. formato de descripción que es conciso, flexible y fácil de dominar y utilizar para bibliotecarios no profesionales para mejorar el desarrollo y la utilización de los recursos de información de la red. Los objetos de operación se limitan a recursos de texto electrónicos en Internet. La conferencia dio como resultado 13 elementos de metadatos que llevan el nombre de Dubin, la ubicación de la conferencia. En el tercer taller celebrado en septiembre de 1996, DC Metadata amplió aún más el procesamiento de objetos a recursos de imágenes. Para describir de manera integral los recursos de imágenes, se agregaron dos elementos de descripción, elemento de descripción y elemento de gestión de derechos, y se modificaron los nombres de algunos elementos de descripción, lo que resultó en 15 elementos de descripción. 1997 10 En la quinta serie de seminarios celebrada en Helsinki, Finlandia, se aclaró además que la función principal del formato de metadatos DC se centra en la descripción o explicación de los recursos de información, en lugar de la evaluación de los recursos de información. Por lo tanto, 15 elementos de metadatos. se dividen en las siguientes tres categorías:
(1) Elemento de metadatos de descripción del contenido del recurso. Existen los siguientes elementos de metadatos en esta clase:
Título: el nombre del recurso proporcionado por el creador o editor del recurso.
Creador: El creador del recurso.
Asunto: Palabras clave que pueden revelar el contenido temático o contenido temático del objeto recurso.
Descripción: una descripción de texto del contenido del recurso, incluido un resumen del objeto del documento o una descripción del contenido del trabajo de visualización.
Idioma: el tipo de idioma utilizado por el objeto de recurso.
Fuente: fuente de información de recursos secundarios. Los elementos regulares solo contienen información sobre el recurso actual. Si es necesario mostrar el recurso actual, el elemento puede incluir la fecha, el creador, el formulario, el logotipo u otros metadatos del recurso secundario.
Relación: Identificación de recursos secundarios y su relación con el recurso actual. Este elemento permite la asociación entre recursos relacionados y descripciones de recursos. Por ejemplo, catalogado de (es versión), traducido de (es basado en), extraído de (es parte de), formato convertido de (es formato), etc.
Cobertura: características espaciotemporales del contenido del conocimiento de recursos. El alcance espacial se refiere al área física, como latitud y longitud, nombres de lugares estandarizados, etc. El rango de tiempo se refiere al contenido del recurso (período de tiempo) en lugar del momento en que se generó el recurso (punto de tiempo) la descripción de tiempo adopta el mismo formato que el elemento de fecha;
(2) Elementos de metadatos de descripción de propiedad intelectual. Existen los siguientes elementos de metadatos en esta categoría:
Creador: la persona o institución con responsabilidad principal de crear el contenido intelectual del recurso.
Editor: la persona responsable de convertir el recurso a su forma actual, como una editorial, universidad, colegio o entidad corporativa.
Contribuyentes: se refiere a personas u organizaciones (como editores, redactores, ilustraciones, etc.) que no figuran en los elementos del creador y han realizado contribuciones importantes al contenido intelectual del recurso, y cuyas contribuciones son secundarios a los del creador.
Derechos: una declaración de gestión de derechos, o un identificador que apunta a una declaración de gestión de derechos, o un identificador que apunta a un servicio que proporciona contenido de información sobre gestión de derechos de recursos.
(3) Elemento de metadatos de clase de descripción de atributo externo. Existen los siguientes elementos de metadatos en esta clase:
Elemento de fecha: se refiere a la fecha relacionada con la creación del recurso o la disponibilidad del recurso.
Tipo: categoría de recursos, como novelas, poemas, informes, artículos, diccionarios, etc.
Identificador: Cadena o número que identifica de forma única un recurso. Por ejemplo, se pueden utilizar como identificadores URL y URN en la identificación de recursos de red, así como otros identificadores únicos universales, como números de libros estándar internacionales (ISBN) u otros nombres canónicos.
Formato: El formato de datos del recurso, utilizado para indicar qué software o hardware se requiere para mostrar y ejecutar el recurso, como texto, imágenes JPG, aplicaciones, etc.
Indexación de información
La indexación de información, también conocida como divulgación de información, es el proceso de seleccionar, resumir y refinar el contenido principal y otras características formales de la información. Esto incluye seleccionar características del formulario de información, analizar características del contenido de la información y convertirlas en contenido específico, como logotipos que reflejen el tema del contenido de la información.
3.4.5.1 Procedimiento de indexación de la información
El proceso de indexación de la información incluye generalmente tres enlaces.
(1) Análisis temático. Es decir, analizar los temas contenidos en la información, incluido principalmente el análisis del número de temas, es decir, cuántos temas contiene la información, análisis de la estructura del tema, es decir, cuántos factores de concepto de tema tiene cada tema; es decir, especificando qué temas contiene la información, cada uno cuáles son los elementos conceptuales del tema.
(2) Indexación temática. Convierta los resultados del análisis de temas en identificación de temas. Según el grado de divulgación de los temas de información, existen cuatro estrategias para la indexación de temas: ① Indexación general: es decir, el tema general de una entidad de información generalmente se indexa con un logotipo. ② Indexación integral: es decir, indexación detallada de todos los temas locales o diferentes temas y sus factores conceptuales de una entidad de información. ③ Indexación complementaria: además de la indexación general del tema general de una entidad de información, algunos temas locales y sus factores conceptuales también se indexan por separado. ④Indización clave: Indexación de las partes temáticas de entidades de información relacionadas con la naturaleza, tareas y propósitos del sistema de información.
(3) Inspección y revisión, es decir, inspección y revisión del proceso anterior y los resultados del análisis de materias y la indexación de materias, y finalmente los resultados formales de la divulgación de información.
3.4.5.2 Método de indexación de información
De acuerdo con las diferentes formas y propiedades de las marcas dadas en el proceso de indexación, la indexación de información generalmente se puede dividir en dos categorías: indexación de clasificación y temática. indexación.Categorías.
(1) Indexación de clasificación. La indexación de clasificación es un método para clasificar e identificar el contenido o las características formales de la información. A través de la clasificación e indexación, se pueden recopilar categorías de información con atributos temáticos de * * * *, y toda la información se puede organizar en un todo jerárquico y organizado de acuerdo con las relaciones temáticas entre varios tipos de información.
A juzgar por el método de compilación de la clasificación moderna, los métodos de clasificación incluyen principalmente clasificación jerárquica, clasificación combinada de facetas y clasificación híbrida:
1) Clasificación jerárquica. Esta clasificación se basa en la naturaleza temática del contenido del documento y es un sistema jerárquico dividido capa por capa según el orden lógico de las categorías de conocimiento, de general a específico, de simple a complejo. Sus características principales son: concentrar documentos por tema y especialidad, revelar las diferencias y conexiones en el contenido de varios documentos desde la perspectiva de la clasificación del conocimiento y proporcionar una manera de recuperar información del documento a partir de la clasificación de temas.
2) Clasificación de combinaciones de facetas. Este es un tipo de clasificación basada en los principios de análisis y síntesis. Su idea básica es: cualquier tema compuesto, por complejo que sea, se puede descomponer en los conceptos básicos correspondientes y, al mismo tiempo, se pueden expresar mediante la combinación de los conceptos básicos correspondientes; Por lo tanto, no es necesario enumerar todos los temas en detalle en la taxonomía, sino simplemente enumerar los diversos conceptos básicos por categoría en la tabla de categorías y asignar los números correspondientes.
3) Clasificación mixta. Esta clasificación es una combinación de las ventajas de las dos clasificaciones anteriores. Según la enumeración detallada de la tabla de clases, se utilizan ampliamente varios métodos de combinación. Como por ejemplo la Clasificación Decimal Internacional.
El método de clasificación jerárquica mencionado anteriormente se ha utilizado ampliamente en la clasificación y recuperación de documentos bibliotecarios desde la antigüedad, y todavía se utiliza ampliamente en el campo de la biblioteca y la información. Sus ventajas son: enfatiza la organización sistemática del conocimiento, se ajusta a los hábitos de comprensión de las personas y facilita a los usuarios la búsqueda de información bibliográfica relevante según el sistema temático, la estructura de árbol de categorías es adecuada para la gestión de la disposición de los documentos; y la disposición y organización de las herramientas de recuperación: para la identificación se utilizan números arábigos y letras latinas de uso habitual, lo que es universal y permite compartir recursos a través de una clasificación unificada internacionalmente. Por supuesto, el sistema de clasificación jerárquico también tiene limitaciones, como las limitaciones de su estructura y la escasa especificidad directa; no es adecuado para la indexación y recuperación desde múltiples ángulos; el sistema de categorías es fijo y preenumerado, y no puede reflejar nuevos temas; y cosas nuevas en el momento oportuno, lo que dificulta las modificaciones y adiciones.
(2) Indexación temática. La indexación de temas es un método de utilizar lenguaje natural estandarizado o no estandarizado como identificación de temas de información. Según los principios de selección de palabras, métodos de combinación, medidas normativas y métodos de preparación. El método temático se puede dividir en morfología del título, metamorfología, método de palabras clave y morfología narrativa.
1) Léxico de títulos. La morfología del título es un método para utilizar palabras de título (nombres estandarizados de cosas y términos sustantivos) como identificadores de identificación y recuperación del contenido del tema de la información. La fuente de las palabras del título es principalmente el nombre del objeto de indexación o sustantivos estereotipados comunes en el título. La preparación de las palabras del título se llama tabla de títulos. La característica principal de las palabras del título es la tabla preparada previamente. Las palabras de título se organizan en el vocabulario en combinaciones fijas y las búsquedas se realizan según las combinaciones establecidas. La función del vocabulario de títulos es gestionar y controlar las palabras de títulos optimizadas desde aspectos como el significado, la forma de las palabras, la relación entre las palabras y el uso. Asegúrese de que una cosa se exprese con una sola palabra del título y que cada palabra del título solo exprese una cosa o un significado para evitar confusiones durante el uso. La morfología del título tiene buena franqueza y especificidad, gran versatilidad y es adecuada para la recuperación de características, pero tiene poca flexibilidad.
2) Metamorfosis. "Metamorfosis" aboga por el uso de las unidades de vocabulario más básicas e indivisibles como palabras sujetas, que pueden extraerse del contenido de la información y luego estandarizarse para expresar un concepto independiente. Por ejemplo, "software de computadora" no es una palabra unitaria, pero "computadora" y "software" son palabras unitarias. En inglés, una palabra unidad suele ser una palabra. Las características destacadas de "Metamorfosis" son: enfatizar la unificación del vocabulario; enfatizar la combinación posterior. Aunque "Metamorfosis" mejora la flexibilidad del método de la materia, no es muy práctico debido al énfasis excesivo en la unificación del vocabulario, los métodos de procesamiento de vocabulario irrazonables, la facilidad para producir combinaciones incorrectas y la alta tasa de detección falsa.
3) Método de palabras clave. El método de palabras clave es un método que extrae directamente unidades de información significativas (palabras clave) que pueden expresar el concepto del tema del título, resumen o texto del material informativo como palabras temáticas, y luego las organiza en orden de palabras para la recuperación de información. La clasificación de palabras clave puede formar un sistema de índice para la recuperación de temas, como el "Índice de materias rotativo" en el "Índice de citas científicas", en el que las palabras clave se extraen de los títulos de los documentos. El método de palabras clave no está controlado por el léxico, es rápido y simple y es adecuado para la organización informática y la recuperación de información. Sin embargo, la desventaja es que la redacción del método de palabras clave no está estandarizada, lo que afecta la tasa de recuperación y la tasa de precisión de la información.
4) Narrativa. El tesauro es un método para seleccionar un tesauro de un tesauro para describir el tema de los materiales informativos mediante una combinación de conceptos, de modo que la indexación y la recuperación puedan alcanzar un nivel más alto de indexación.
La característica distintiva de la lexicografía es que múltiples descriptores pueden formar cualquier combinación lógica para formar una variedad de problemas de recuperación. La narratología absorbe las ventajas de los métodos disciplinarios mencionados anteriormente y tiene las ventajas de ser intuitiva, concreta, flexible, precisa en la indexación y conveniente para la recuperación, y ha sido ampliamente utilizada en la recuperación de literatura. En la actualidad, la mayoría de las herramientas de búsqueda y bases de datos nacionales y extranjeras utilizan tesauros. Los tesauros de uso común incluyen el tesauro INSPEC, el tesauro chino de ciencia y tecnología de energía atómica, el tesauro de ciencia y tecnología de defensa nacional, el tesauro chino de geología y el tesauro chino.
Almacenamiento de información
La información es abstracta y debe adjuntarse a algún tipo de soporte antes de poder expresarse. El proceso de adjuntar información a un soporte es el proceso de almacenar información.
El significado y la función del almacenamiento de información
El almacenamiento de información se refiere a registrar la información procesada en los soportes de información correspondientes de acuerdo con ciertas reglas y almacenarla de acuerdo con ciertas características y atributos de contenido de estos vectores. están organizados en procesos sistemáticos del sistema de recuperación. El significado y la función del almacenamiento de información son los siguientes.
(1) Es beneficioso para * * *. Una vez almacenada la información, los usuarios pueden disfrutar de la biblioteca de información y utilizarla repetidamente, lo que mejora la utilización de la información.
(2) Fácil de buscar. La información procesada se almacena para formar una base de datos de información, lo que proporciona una gran comodidad para que los usuarios recuperen la información requerida.
(3) Favorece la gestión centralizada de la información, aumenta la posesión de recursos de información y desarrolla recursos de información de alto nivel.
En resumen, al almacenar información, debemos considerar plenamente la conveniencia y eficiencia de su recuperación, para que esté ordenada, razonablemente clasificada, clara y fácil de recuperar.
3.4.6.2 Principales tecnologías de almacenamiento de información
La tecnología de almacenamiento de información tradicional se refiere a la tecnología de almacenamiento de impresión en papel, la tecnología moderna de almacenamiento de información incluye principalmente tecnología de almacenamiento de microfilmes, tecnología de almacenamiento de audio y video, computadora Tecnología de almacenamiento y tecnología de almacenamiento en disco óptico. Tienen las ventajas de una gran capacidad de almacenamiento, alta densidad, bajo costo y acceso conveniente, por lo que se utilizan ampliamente.
(1) Tecnología de almacenamiento de papel. La tecnología de almacenamiento de papel es la tecnología de almacenamiento más utilizada y la más antigua. Pero tiene muchas desventajas, como la baja densidad de la información almacenada, gran volumen, ocupa mucho espacio, el papel es fácil de quemar, se humedece, se enmohece, se apolilla, se desgasta, etc. , y no es fácil de salvar.
(2) Tecnología de almacenamiento en microfilm. La tecnología de almacenamiento en microfilm se refiere al uso de una cámara para microfilmar el contenido del material impreso en una película y luego revelarlo en microfilm para su almacenamiento. Las principales ventajas de la tecnología de almacenamiento en microfilm son: ① Alta densidad de almacenamiento, que puede ahorrar el 90% del espacio de almacenamiento de información en papel. ②El método de almacenamiento es simple, de bajo costo y económico. ③Larga vida útil, generalmente hasta 50 años en el medio ambiente y cientos de años en condiciones estándar. ④La micropelícula es fiel al trabajo original y no es propensa a errores. En comparación con otros métodos de almacenamiento, su tasa de error es 0. ⑤ La tecnología de microfilm se puede utilizar para estandarizar la gestión de documentos originales con especificaciones inconsistentes. La tecnología de microfilmes también se puede combinar con la tecnología informática y la tecnología de comunicación para lograr la recuperación automática. Su desventaja es que solo se puede leer con la ayuda de un microlector o una microcopiadora y no se puede leer en comparación, por lo que las condiciones de almacenamiento son muy estrictas.
(3) Tecnología de almacenamiento de audio y vídeo. La tecnología de almacenamiento audiovisual se refiere a una tecnología de almacenamiento de información que registra y almacena información en forma de grabación de audio o video, incluida la tecnología de almacenamiento de grabaciones de audio, tecnología de almacenamiento de video y tecnología de almacenamiento de películas.
(4) Tecnología de almacenamiento en disco óptico. La tecnología de almacenamiento en disco óptico es un nuevo tipo de tecnología de almacenamiento que utiliza láseres y computadoras para digitalizar información diversa, convertirla en señales ópticas y registrar la información en discos ópticos. La tecnología de almacenamiento en disco óptico tiene las siguientes características: ① alta densidad de almacenamiento y gran capacidad; (2) precio bajo y fácil de copiar (3) durabilidad y larga vida de almacenamiento; El disco está bien sellado y no debe verse afectado por polvo, gases nocivos ni campos electromagnéticos. También utiliza láser para acceso sin contacto y tiene una vida útil de más de 10 años. Su principal desventaja es que la tasa de error de bits es relativamente alta.
(5) Tecnología de almacenamiento informático. La tecnología de almacenamiento informático se refiere a la tecnología que utiliza la memoria interna y externa de la computadora para almacenar información. Según su función en la computadora, la memoria de la computadora se puede dividir en memoria interna y memoria externa. Entre ellos, la memoria trata directamente con la CPU, y sus características principales son alta velocidad, pequeña capacidad y alto precio. La memoria externa es principalmente el respaldo y complemento de la memoria y es ampliamente utilizada por la gente. Se caracteriza por una gran capacidad de almacenamiento, bajo costo y la capacidad de almacenar información permanentemente fuera de línea.
3.4.7 Análisis de la información
El análisis de la información es una parte indispensable del proceso de organización de la información. Es un proceso que utiliza información conocida para revelar los patrones de movimiento de cosas objetivas. Su tarea principal es que los investigadores de la información utilicen ciertos métodos y medios para resumir la información original en una nueva connotación de información a un nivel más profundo, más completo, más completo y más aplicable para satisfacer las necesidades de los usuarios para resolver temas específicos.
3.4.7.1 Función de análisis de la información
El análisis de la información tiene cuatro funciones básicas: organización, evaluación, predicción y retroalimentación.
(1) Función de clasificación: recopila y organiza información para cambiarla del desorden al orden.
(2) Función de evaluación: evalúa el valor de la información, eliminando así lo aproximado y seleccionando lo esencial, descartando lo falso y reteniendo lo verdadero.
(3) Función de predicción: Obtenga información desconocida o futura analizando el contenido de borradores revisados conocidos.
(4) Función de retroalimentación: revisar, evaluar, modificar y complementar las conclusiones de la predicción en función de los beneficios de consumo reales del usuario.
En general, estas cuatro funciones básicas están estrechamente relacionadas. La clasificación y evaluación de la información son las dos funciones básicas del análisis de la información, que preparan para la realización de funciones de predicción y retroalimentación. La predicción y la retroalimentación son dos funciones características del análisis de la información, que son expansiones y extensiones adicionales de las funciones de clasificación y evaluación de la información.
Método de análisis de información
El método de análisis de información es una herramienta para el análisis de información y un medio para lograr el análisis de información. Aunque el análisis de la información varía ampliamente en contenido, escala y alcance, sus objetivos comunes giran en torno a problemas específicos de toma de decisiones. A través de un análisis e investigación en profundidad sobre la historia del desarrollo y la situación actual del problema, podemos revelar sus reglas de desarrollo y predecir sus perspectivas y tendencias de desarrollo, lo que determina las características y atributos comunes de varios métodos de análisis. Los métodos de análisis de información incluyen principalmente análisis cualitativo y análisis cuantitativo.
(1) Método de análisis cualitativo. El método de análisis cualitativo, también conocido como método lógico, es un método de investigación basado en las técnicas de razonamiento lógico y análisis dialéctico, basado en información conocida, a través de una serie de medios lógicos como comparación, análisis y síntesis, razonamiento inductivo, etc. para revelar los patrones de desarrollo y las relaciones causales de las cosas. La ventaja del análisis cualitativo es el razonamiento riguroso y la fuerte intuición. Pero la principal desventaja es que su conclusión es sólo una tendencia cualitativa sin explicación cuantitativa, no es lo suficientemente específica y detallada y no puede adaptarse completamente a temas que requieren investigación cuantitativa como economía técnica o proyectos de ingeniería, pronósticos de mercado, etc.
(2)Método de análisis cuantitativo. Los métodos de análisis cuantitativo, es decir, los métodos matemáticos, son un término general para los métodos de investigación que utilizan matemáticas básicas, estadísticas matemáticas, matemáticas aplicadas y todos los demás procesamientos y cálculos matemáticos. Las características sobresalientes de estos métodos son: pueden describir cuantitativamente cosas y mostrar el grado específico de su desarrollo; cuando utilizan métodos matemáticos para estudiar la relación entre cosas, los investigadores están directamente expuestos a sistemas homomórficos de cosas como fórmulas o modelos. la cosa misma. Sin embargo, los métodos de análisis cuantitativo también tienen sus condiciones y limitaciones aplicables: las condiciones de contorno utilizadas en los cálculos matemáticos son abstraídas o asumidas por personas basándose en cosas objetivas. Al determinar la conclusión final, es necesario revisar o verificar si esta abstracción o suposición es cierta. razonable o consistente con la realidad objetiva; Varios datos de parámetros utilizados en los métodos matemáticos provienen de estadísticas objetivas y evaluaciones subjetivas, por lo que los resultados de la investigación del método matemático solo tienen una importancia relativa en las conclusiones de la investigación del análisis de la información. sistemas dinámicos y complejos, y cualquier objetivo El sistema homomórfico de cosas es esencialmente un sistema aproximado, estático y simplificado.
Se puede ver que los métodos lógicos y matemáticos tienen cada uno sus propios méritos. Es difícil separarlos por completo en la investigación de análisis de información. En términos generales, el análisis cualitativo es la base del análisis cuantitativo y tiene como objetivo proporcionar argumentos para las conclusiones del análisis cualitativo y confirmar los resultados del análisis cualitativo. En actividades específicas de análisis de información, tienden a combinar los dos métodos.