¡Ayúdame! ~~~
Tecnología de descubrimiento de recursos de información basada en Internet y su implementación
Wang Ji, Zou Tao, Yang Xiaojiang, Pan Zhang Jingui, Yan Fu
Resumen: Una gran cantidad de información heterogénea en Internet La estructura, distribución y dinámica de la información han provocado una "sobrecarga de información". En el contexto del desbordamiento de información, cómo proporcionar eficazmente a los usuarios servicios de descubrimiento de recursos basados en Internet se ha convertido en un tema de investigación importante y urgente. Los motores de búsqueda resuelven parcialmente el problema de la búsqueda de recursos, pero el efecto dista mucho de ser satisfactorio. Primero, este artículo propone una estrategia colaborativa distribuida de descubrimiento de recursos. Se analizan varias tecnologías clave involucradas en los servicios de descubrimiento de recursos, incluido el modelo de datos de cubos de documentos multidimensionales, la recuperación de documentos web, la recuperación bibliográfica basada en Z39.50 y la interfaz de usuario basada en agentes, y se brindan las soluciones correspondientes. Sobre esta base, este artículo construye un prototipo de sistema RDSCC, que mejora efectivamente la calidad del descubrimiento de recursos de Internet.
Palabras clave; descubrimiento de recursos, cubo de documentos multidimensional, Web, Z39.50, Agente
Número de clasificación de "Clasificación de biblioteca china": TP 391; >Tecnología y realización de recursos
Descubrimiento en línea
, Zou Tao, Jiang, Pan Jingui y Yan
(Laboratorio Nacional Clave de Tecnología de Software Novell, Universidad de Nanjing , Nanjing 210093)
(Departamento de Ciencias de la Computación y Tecnología, Universidad de Nanjing, Nanjing 210093)
La gran cantidad de información heterogénea, distribuida y dinámica en Internet ha llevado a " sobrecarga de información." Con la proliferación de información, proporcionar a los usuarios servicios eficaces de descubrimiento de recursos de Internet se ha convertido en un importante tema de investigación. Los motores de búsqueda han intentado solucionar este problema, pero sus resultados están lejos de ser satisfactorios. Este artículo propone primero una estrategia de descubrimiento de recursos colaborativos distribuidos basada en Internet. Luego, se estudian varias tecnologías clave involucradas en el descubrimiento de recursos, incluido el modelo de datos, la recuperación de documentos web, la recuperación de literatura basada en Z39.50 y la interfaz de usuario basada en agentes. Finalmente, se diseña un prototipo de sistema RDSCC para mejorar la calidad del descubrimiento de recursos en Internet.
Descubrimiento de recursos de palabras clave, cubo de documentos multidimensional, Web, Z39.50, agente
1 cita
La gente ha entrado en una era de información extremadamente rica. Por un lado, existen muchas fuentes de información, incluidos documentos web, libros y documentos, materiales digitales, etc. Esta información heterogénea se distribuye en el espacio de Internet. Por otra parte, la cantidad de información es enorme. Tomando como ejemplo los documentos web, actualmente hay 300 millones de páginas y este número todavía se duplica cada cuatro o seis meses [1]. Frente al océano de información, las personas se sienten abrumadas y muchas veces pasan mucho tiempo sin obtener buenos resultados. En este caso, ¿cómo proporcionar eficazmente servicios de descubrimiento de recursos basados en Internet para ayudar a los usuarios a encontrar y proporcionar información de una gran cantidad de recursos de información?
Buscadores tradicionales, como AltaVista, Yahoo, etc. , intenta resolver problemas de descubrimiento de recursos en Internet. Pero desde los aspectos de cobertura de recursos, precisión de recuperación, visualización de resultados de recuperación, mantenibilidad, etc. , sus efectos están lejos de ser satisfactorios. Además, los motores de búsqueda sólo permiten la recuperación de documentos web y carecen de soporte para otros recursos de información importantes, como las bibliografías. En vista de la situación actual del descubrimiento de recursos de Internet, se propone una estrategia colaborativa distribuida de descubrimiento de recursos y se analizan varias tecnologías clave involucradas en los servicios de descubrimiento de recursos, incluido el modelo de datos de cubos de documentos multidimensionales, la recuperación de documentos web y Z39.50- recuperación de literatura basada en agentes e interfaz de usuario. Sobre esta base, diseñamos un prototipo de sistema RDSCC para mejorar efectivamente la calidad del descubrimiento de recursos de Internet.
2 Estrategia de cooperación distribuida para el descubrimiento de recursos
Notamos que los motores de búsqueda adoptan un modo centralizado típico: intentan recorrer toda la Web e indexar todos los documentos que contiene para la búsqueda del usuario. Este modelo centralizado ha traído serios inconvenientes a la recuperación de documentos web, principalmente los siguientes: ① Cobertura limitada, se estima que el número de páginas web indexadas por cualquier motor de búsqueda es menos de un tercio del número total de páginas [2] ② El mantenimiento es difícil y la frecuencia de actualización de la base de datos del índice del motor de búsqueda es limitada, lo que a menudo provoca fallas en el índice [3] ③ Demasiado consumo, incluido el ancho de banda de la red, costosas instalaciones de hardware del motor de búsqueda, etc.
Los metabuscadores, como MetaCrawler, amplían la cobertura hasta cierto punto al combinar resultados de múltiples motores de búsqueda. La dependencia de los metabuscadores de los motores de búsqueda hace imposible resolver fundamentalmente los problemas anteriores. Con el rápido crecimiento en el tipo y cantidad de recursos de información, el modelo centralizado agrava las desventajas anteriores. Por un lado, los recursos de información a gestionar son extremadamente grandes y, por otro lado, cada sistema centralizado de descubrimiento de recursos tiene sus propios métodos y construcciones repetidas. Por lo tanto, creemos que el descubrimiento de recursos en Internet debería adoptar una estrategia de cooperación distribuida.
La estrategia de cooperación distribuida para el descubrimiento de recursos se refiere a dividir el espacio de recursos de información en Internet de acuerdo con ciertos principios y obtener varios subespacios de recursos de información. Para cada subespacio, se establece un sistema de descubrimiento de recursos para proporcionar los servicios de descubrimiento de recursos correspondientes. En la actualidad, la investigación en el campo de la informática distribuida y los sistemas multiagente ha logrado resultados fructíferos que pueden utilizarse para integrar estos sistemas caseros y heterogéneos de descubrimiento de recursos. Formar un grupo de búsqueda colaborativa en Internet. Los principios de división del espacio de recursos de información pueden basarse en áreas temáticas o áreas geográficas. Por ejemplo, podemos establecer un sistema profesional de descubrimiento de recursos de campo para investigadores de diferentes especialidades. Los usuarios pueden realizar solicitudes al sistema correspondiente según sus necesidades. Al utilizar una estrategia de descubrimiento de recursos colaborativos distribuidos, cada sistema de descubrimiento de recursos necesita administrar relativamente menos recursos de información, lo que puede reducir el consumo y facilitar el mantenimiento. Al mismo tiempo, la cobertura de cada sistema se amplía mediante la cooperación mutua, lo que indica que esta estrategia puede superar eficazmente las deficiencias del modelo centralizado y mejorar la calidad de los servicios de descubrimiento de recursos.
Tres tecnologías clave en los servicios de descubrimiento de recursos
El desarrollo de sistemas de descubrimiento de recursos es una tarea compleja que involucra muchos campos y tecnologías. Entre ellos, el modelo de datos es el núcleo del sistema, los documentos web y los datos bibliográficos son dos fuentes de información importantes del sistema y la interfaz de usuario determina directamente la eficiencia del sistema. A continuación, analizamos estas tecnologías clave respectivamente y brindamos las soluciones correspondientes.
3.1 Modelo de datos
En términos de gestión de recursos de información, las bases de datos son mejores que los sistemas de archivos planos. Por lo tanto, los sistemas de descubrimiento de recursos suelen utilizar bases de datos de documentos para almacenar recursos de información heterogéneos. La implementación interna de la base de datos de documentos generalmente adopta un modelo lógico semiestructurado, y su representación externa, es decir, la vista reflejada al usuario, constituye el modelo conceptual del sistema de descubrimiento de recursos. Por ejemplo, los motores de búsqueda suelen devolver al usuario una lista lineal en un orden fijo. Contiene el título, la URL y el resumen del documento web. En este modelo conceptual, los usuarios tienen que navegar uno por uno para encontrar documentos relevantes, lo que consume mucha energía. Este problema se vuelve más prominente cuando la cantidad de resultados devueltos es grande (lo cual suele ser el caso). Las investigaciones sobre el comportamiento de los usuarios muestran que los usuarios a menudo quieren ver los recursos de información desde múltiples ángulos. OLAP es una poderosa herramienta de análisis en un entorno de base de datos que proporciona a los usuarios vistas de datos multidimensionales. Aunque los recursos de información, como los documentos web, son esencialmente diferentes de las bases de datos, todavía creemos que la tecnología OLAP se puede utilizar como referencia. A continuación, presentamos el cubo de documentos multidimensional como un nuevo modelo conceptual para sistemas de descubrimiento de recursos.
La definición de dimensión D es 1. Se refiere a la perspectiva desde la cual las personas observan los documentos. Por ejemplo, los usuarios quieren ver documentos desde una perspectiva temporal y organizativa. Los usuarios suelen preocuparse por el estado del documento de una determinada categoría de tema. Metadatos como el tiempo, la organización y la clasificación temática constituyen aquí las dimensiones del documento.
Definición 2. Cubo de documentos multidimensional CDocument se refiere a un hipercubo (d1, d2,..., dm, Documento) con el documento como centro y los metadatos del documento (dimensión di) distribuidos alrededor del documento.
En el cubo de documentos multidimensional, se pueden realizar varias operaciones de análisis multidimensional, que incluyen dividir, cortar, rotar, desglosar, desglosar, etc. , generando así varias vistas de documentos, lo que permite a los usuarios observar diversas características de los recursos de documentos desde múltiples ángulos y comprender en profundidad la connotación de la información contenida en ellos. Por ejemplo, un usuario puede utilizar la división para seleccionar un subconjunto de documentos para una institución de una colección de documentos. Dentro de este subconjunto, se agrupan por contenido del tema y, dentro de un mismo tema, se agrupan por contenido del tema. También puede ampliar la vista profundizando para observar características específicas de cada subtema o de cada documento, como se muestra en la Figura 1.
Figura 1 Hipercubo de documentos y vista de texto multidimensional
Además de proporcionar a los usuarios métodos de visualización efectivos, también se puede realizar análisis estadístico en cubos de documentos multidimensionales para revelar la distribución. de características en recursos documentales.
Por ejemplo, podemos comparar documentos sobre diversos temas de diferentes instituciones en diferentes momentos para responder algunas preguntas que los motores de búsqueda no pueden responder, como "¿Qué universidad ha publicado más artículos en el campo de los gráficos y las imágenes en los últimos años?".
Cabe señalar que el cubo de documentos multidimensional mencionado anteriormente y el análisis de documentos multidimensionales deben basarse en el preprocesamiento de los recursos del documento utilizando lingüística informática y tecnología de procesamiento de información. Las dimensiones del documento provienen de metadatos preprocesados, como tiempo, autor, tema, etc.
3.2 Recuperación de literatura en Internet
En la actualidad, Internet se ha convertido en una fuente importante para que las personas obtengan información. Los algoritmos de recuperación de motores de búsqueda como Altavista son relativamente simples y tienen una precisión de recuperación limitada, por lo que no se puede garantizar la relevancia de los documentos web recuperados [3]. Yahoo clasifica documentos web para facilitar la navegación y la búsqueda de los usuarios, pero el trabajo de clasificación se realiza manualmente, lo que afecta en gran medida la cantidad de páginas que procesa (Yahoo! La cobertura de documentos web es mucho menor que la de Alta-vista, etc.) Por lo tanto, diseñamos un nuevo modelo de recuperación de documentos web, que incluye mantenimiento de corpus, mantenimiento de diccionarios, robots, generadores de vectores de características, entrenadores y clasificadores, como se muestra en la Figura 2. Este modelo puede analizar las necesidades de información de los usuarios y luego recopilar automáticamente documentos web que cumplan con las características objetivo para que los usuarios los revisen.
Figura 2 Modelo de recuperación de documentos web
En este modelo, utilizamos el modelo de espacio vectorial (VSM) [5] comúnmente utilizado como método de representación de las necesidades de información del usuario y las características del documento. VSM asigna cada (o cada) documento a un punto en un espacio vectorial extendido por un conjunto de vectores de términos ortogonales normalizados. Cada requisito de información del usuario o documento desconocido se puede expresar como un vector de características (T1. T2, W2;...tn, wn) en este espacio vectorial, donde Ti es el elemento de característica y Wi es el peso del elemento de característica. De esta manera, la comparación de documentos y las necesidades de información del usuario y la clasificación de documentos se transforman en coincidencia de vectores en el espacio vectorial. El modelo funciona en dos etapas: entrenamiento y clasificación.
(1) En la fase de capacitación, los usuarios primero crean un corpus, es decir, se les da un lote de documentos de muestra que representan sus necesidades de información (cada documento está marcado con un identificador de categoría). El generador de vectores de características utiliza una biblioteca de diccionarios (diccionarios comunes y diccionarios profesionales) para representar el documento de capacitación como una serie de vectores de características. El formador cuenta los vectores de características de cada categoría de documentos de formación y genera un vector de características que representa esa categoría.
(2) En la etapa de clasificación, el módulo del robot primero recopila documentos web localmente. El generador de vectores de características representa el documento local que se clasificará como una serie de vectores de características. El clasificador hace coincidir el vector de características del documento a clasificar con el vector de características de categoría generado por el entrenador para obtener la clasificación del documento y devuelve al usuario el documento clasificado que cumple con la condición de umbral de similitud.
Aplicaciones prácticas muestran que este modelo puede clasificar automática y rápidamente una gran cantidad de documentos web [6]. Gracias al uso de diccionarios técnicos profesionales, la precisión de la clasificación es significativamente mayor que la de los sistemas ordinarios orientados a documentos y la relevancia de los documentos web recuperados para las necesidades del usuario está bien garantizada.
3.3 Recuperación de información bibliográfica basada en Z39.50
Los libros y documentos son otra fuente importante para que las personas obtengan información, por lo que la recuperación bibliográfica en línea es una parte importante del sistema de descubrimiento de recursos. Tradicionalmente, los servicios de búsqueda bibliográfica en línea de las bibliotecas los proporciona Telnet. En los últimos años, muchas bibliotecas han proporcionado interfaces gráficas para la búsqueda bibliográfica en forma de Web y CGI. Un inconveniente importante de estos servicios son las interfaces de búsqueda bibliográfica inconsistentes entre las bibliotecas. Si los usuarios quieren buscar en cada biblioteca, deben familiarizarse con la interfaz correspondiente. Con este fin, ISO desarrolló el protocolo Z39.50 como estándar para recuperar bibliografías de bibliotecas remotas [7]. Z 39.50 es un protocolo de capa de aplicación que se ejecuta en el protocolo TCP/IP. Especifica la estructura de datos y las reglas de intercambio de datos involucradas en el proceso de consulta del cliente al servidor y extracción de registros de resultados. Esto resuelve el problema de heterogeneidad de las interfaces de recuperación de bases de datos bibliográficas existentes. En la actualidad, este estándar ha sido adoptado por muchas bibliotecas extranjeras. No hay ninguna biblioteca en China que proporcione servicios de recuperación bibliográfica basada en Z39.50. Hemos diseñado un modelo de recuperación bibliográfica en línea basado en Z39.50 y hemos desarrollado con éxito la primera bibliografía nacional. Servicio de recuperación basado en el sistema de recuperación de información bibliográfica Z39.50 [8], como se muestra en la Figura 3.
Figura 3 Modelo de recuperación de información bibliográfica basado en Z39.50
En este modelo las bibliografías de la biblioteca se almacenan en una o varias bases de datos bibliográficas en el servidor de bases de datos. El servidor Z39.50 escucha las solicitudes de conexión de los usuarios (InitRequest) en el puerto especificado. Una vez que la conexión se establece exitosamente, el cliente Z39.50 emite una solicitud de búsqueda. El servidor Z39.50 convierte la consulta estándar Z39.50 "abstracta" recibida en una consulta SQL "concreta", la envía al servidor de base de datos backend para su ejecución y genera un conjunto de resultados de la consulta. Luego, el servidor Z39.50 devuelve la ejecución de la consulta y algunos resultados al cliente Z39.50, y el cliente puede emitir PresentRequest varias veces para obtener todos los datos bibliográficos en el conjunto de resultados. Para permitir que un cliente Z39.50 consulte las bibliografías de varias bibliotecas al mismo tiempo, utilizamos multiproceso (multiproceso) en el cliente para establecer conexiones simultáneamente con varios servidores y posprocesar los resultados de la consulta, incluidos sintetizar varios resultados de consultas de proceso y eliminar bibliografías duplicadas.
3.4 Interfaz de usuario basada en agentes
En el sistema de descubrimiento de recursos, la interfaz de usuario desempeña el papel de puente entre los usuarios y los recursos de información. Debido a la gran capacidad, dinámica y complejidad de los recursos de información, la interacción tradicional persona-computadora parece ser inadecuada. La interfaz de usuario basada en agentes se considera un gran avance en la resolución de problemas de interacción persona-computadora [9]. En la actualidad, aunque la investigación sobre la tecnología de agentes es muy popular, no existe una conclusión unificada sobre su definición y características. Desde la perspectiva de la abstracción del software, damos la siguiente definición.
Definición 3. El agente es un método abstracto que se puede utilizar para describir sistemas complejos y la interacción entre el sistema y los usuarios.
Definición 4. Un agente de interfaz de usuario es una abstracción visual utilizada por los usuarios cuando interactúan con un sistema informático y puede representarse simplemente como un cuadrilátero (tarea, conocimiento, limitaciones, estado). Entre ellos, el conocimiento es una base de conocimiento que almacena el conocimiento aprendido del mundo exterior, como las necesidades de información, los intereses y los pasatiempos de los usuarios. Una restricción es un conjunto de restricciones, como los límites de usuario sobre cuánto tiempo puede ejecutarse un agente. El estado es una colección de estados de ejecución del agente; la tarea es un módulo de resolución de tareas que utiliza reglas de inferencia para procesar eventos y completar tareas en función de la base de conocimientos, el conjunto de restricciones y el conjunto de estados.
A los ojos del usuario, el agente de interfaz de usuario es una aplicación semiautónoma. Por un lado, tiene conocimiento, comprende las necesidades y pasatiempos del usuario, puede completar de manera inteligente una tarea en nombre del usuario y tiene la capacidad de aprender y adaptarse; Los usuarios pueden observar el estado de su actividad, pausarla o reanudarla temporalmente, o incluso cancelarla permanentemente. En un sistema de descubrimiento de recursos, las tareas realizadas por los agentes de interfaz de usuario son diversas. Cuando se agreguen al sistema recursos de información de interés para el usuario, el Agente se lo notificará al usuario. Los agentes también pueden filtrar recursos de información y crear interfaces personalizadas según las necesidades o preferencias del usuario. Como puede verse, la interfaz de usuario basada en agentes proporciona a los usuarios información compleja y engorrosa.
4 Prototipo de sistema de descubrimiento de recursos basado en Internet
Basado en la discusión anterior, desarrollamos un prototipo de sistema de descubrimiento de recursos RDSCC (Sistema de descubrimiento de recursos para comunidades informáticas). RDSCC es un sistema profesional de descubrimiento de recursos informáticos. Su propósito es brindar servicios de descubrimiento de recursos de Internet a investigadores en este campo para que puedan dominar información completa y actualizada en esta especialidad. La estructura del sistema se muestra en la Figura 4.
Figura 4 Prototipo del sistema de descubrimiento de recursos de Internet RDSCC
RDSCC consta de ocho módulos. Entre ellos, el sistema de base de datos documental es responsable de gestionar los recursos documentales semiestructurados. Para mejorar la usabilidad, utilizamos un servidor web para proporcionar servicios de descubrimiento de recursos a los usuarios. Como intermediario entre el servidor web y el sistema de base de datos de documentos, el convertidor puede convertir el contenido de la base de datos de documentos al formato HTML. La entrada del usuario también se puede convertir en operaciones para el sistema de base de datos de documentos. El clasificador y recopilación de documentos web descarga documentos web relacionados con la computadora que satisfacen las necesidades de información del usuario y los clasifica automáticamente. El extractor de metadatos extrae metadatos de documentos clasificados y el importador almacena e indexa los documentos y metadatos en una biblioteca de documentos web.
Z39.50 Gateway proporciona servicios de recuperación bibliográfica basados en Z39.50, que pueden consultar simultáneamente varias bibliotecas (incluidas qué bibliotecas consultar y qué bibliografías informáticas consultar) en función de las solicitudes de consulta enviadas por los usuarios a través de formularios HTML.
Los usuarios pueden utilizar el navegador para realizar diversas operaciones de análisis de documentos multidimensionales y leer y recuperar el contenido de la biblioteca de documentos desde múltiples ángulos. El sistema también utiliza tecnología Agnet para proporcionar a los usuarios un mecanismo de perfil. Los usuarios pueden suscribirse a documentos y personalizar la interfaz de navegación.
5 Conclusión
En el contexto del desbordamiento de información, los servicios de descubrimiento de recursos basados en Internet son una dirección de investigación prometedora. Los usuarios pueden obtener información de diferentes sistemas de descubrimiento de recursos distribuidos. Este artículo propone una estrategia colaborativa distribuida de descubrimiento de recursos y estudia tecnologías clave como el modelo de datos, la recuperación de documentos web, la recuperación de literatura y la interfaz de usuario involucradas en el desarrollo de sistemas de descubrimiento de recursos. Se presenta brevemente un prototipo de sistema de servicio de información de red RDSCC. Todavía hay muchas cuestiones que merecen un debate en profundidad en esta área, entre ellas: la implementación de la colaboración distribuida entre múltiples servidores de descubrimiento de recursos en un entorno informático DCOM/CORBA utilizando HTML, XML y otras especificaciones para extraer metadatos de documentos web será el próximo; trabajo paso a paso.
*Este proyecto cuenta con el apoyo del Noveno Proyecto Quinquenal de Investigación en Ciencia y Tecnología de la Provincia de Jiangsu (Proyecto No. BE96017) y el Proyecto de Automatización de Bibliotecas de la Comisión Provincial de Educación de Jiangsu.
Sobre el autor: Wang Jiji, hombre, nacido en junio de 1973, candidato a doctorado. Sus principales intereses de investigación son las redes informáticas y el procesamiento de información.
Zou Tao, hombre, nacido en junio de 19701, candidato a doctorado. Sus principales intereses de investigación son las redes informáticas y el procesamiento de información.
Yang Xiaojiang, hombre, nacido en junio de 1965, candidato a doctorado. Sus principales intereses de investigación son los hipermedia y el procesamiento de la información.
Pan Jingui, hombre, nacido en junio de 1952, es profesor. Su principal dirección de investigación es el middleware y la tecnología de agentes.
Zhang, hombre, nacido en junio de 1939, profesor, supervisor doctoral. Sus principales intereses de investigación son multimedia, CAD y gráficos, y procesamiento de información.
Autor: Departamento de Ciencias de la Computación y Tecnología, Laboratorio Estatal Clave de Nueva Tecnología de Software, Universidad de Nanjing, Nanjing 210093.
Referencias
1 Gudivada V N et al. Recuperación de información en la World Wide Web. IEEE Internet Computing, 1997, 1(5): 58~68
2 Lawrence S, Giles C L. Busque en la World Wide Web. Science, 1998, 280(5360): 98~100
3 Lawrence S, Giles C L. Mejora del análisis contextual y de páginas de las búsquedas web. IEEE Internet Computing, 1998, 2(4): 38~46
4Wang Zifei et al. Tecnología de almacenamiento de datos y procesamiento analítico en línea. Beijing: Science Press, 1998.
(Wang Shan et al. Tecnología de almacenamiento de datos y OLAP. Beijing: Science Press, 1998)
5 Salton G et al. Modelo de espacio vectorial para indexación automática. Comunicaciones de la ACM, 18(5): 613~620
6, Zhang, et al. Diseño e implementación de sistema de recolección de datos basado en web. Revista de la Sociedad China de Información Científica y Tecnológica, 18(3):195 ~ 201.
(Zou Tao, Zhang et al. Diseño e implementación de un sistema de recopilación de información. Revista de la Sociedad China de Información Científica y Técnica, 18(3):195 ~ 201
7 ANSI. Recuperación de información (Z39.50): Definición de servicio de aplicación y especificación de protocolo. Instituto Nacional Estadounidense de Estándares/NISO Z39.50-1995 Bethesda, MD: NISO Press, 1995
8 Yang Xiaojiang, Zhang. , , etc. utilizan Z39.50 para proporcionar servicios de búsqueda bibliográfica en línea. Journal of Software, 10 (8): 824 ~ 828
(Yang Xiaojiang et al. Recuperación de literatura basada en Z39.50. Journal of Software, 10(8) ): 824~828)
9 Baecker R et al., "Lectura interactiva entre humanos y computadoras: hacia el año 2000" Morgan Kaufman Publishers, 1995