Intercambio Académico | Intercambio Abierto de Big Data Científico: Modelos y Mecanismos
Palabras clave del artículo: Big data científico; apertura de datos; modelo de intercambio; mecanismo de intercambio
Fuente del artículo: "Teoría y práctica de la inteligencia"
p>Importancia y antecedentes de la investigación: Los datos científicos son un resultado importante de las actividades de investigación científica y son de gran importancia para la innovación científica y tecnológica y el desarrollo económico y social. Con el vigoroso desarrollo de la computación en la nube, Internet de las cosas y los grandes dispositivos científicos, los datos científicos están creciendo a un ritmo sin precedentes y la humanidad ha entrado en la era de los grandes datos. Se ha convertido en el núcleo de las actividades de investigación científica y en el elemento impulsor central de la innovación y el desarrollo científico y tecnológico. Como motor de la revolución digital, los “grandes datos” brindan nuevas oportunidades para muchas investigaciones científicas. El paradigma científico comienza a pasar de estar basado en modelos a estar basado en datos.
Resumir los modelos típicos, las partes interesadas relevantes, los factores de influencia clave y los mecanismos clave para el intercambio abierto de big data científicos, y promover el intercambio abierto de datos científicos a nivel internacional.
Modo de intercambio de datos unitarios de equipos científicos
Razones para este modo: objetivos de investigación ambiciosos, problemas complejos y altos costos
Categoría: grandes equipos científicos, Grandes proyectos de investigación a gran escala de cooperación interinstitucional
***Ruta de intercambio: los datos sin procesar se generan de acuerdo con el plan de recopilación de datos de las tareas de investigación relevantes, y los datos sin procesar y los datos procesados se almacenan en los datos. centro que presta servicio al gran dispositivo científico o sistema de servicio, y se compartirá primero dentro del alcance de los colaboradores que participan en la tarea de investigación correspondiente. Después de un cierto período de tiempo
se compartirán algunos o todos los datos (. el período de tiempo y el rango de datos estarán determinados por el gran dispositivo científico (dependiendo de la política o regulaciones de apertura de datos) publicado centralmente y abierto al público a través del centro de datos o sistema de servicio.
Modelo de registro distribuido impulsado por una cooperación de área amplia
Método: mediante la construcción de una plataforma de servicio de intercambio de datos integral físicamente distribuida y unificada lógicamente entre alianzas o a nivel mundial. Abrir, compartir e intercambiar datos científicos. investigar datos dentro Registro centralizado de datos, metadatos, productos y servicios. Un portal de datos unificado es responsable de conectar varios recursos de datos registrados para proporcionar a los usuarios servicios integrales de recuperación y posicionamiento de datos. Finalmente, un sistema de servicios de datos distribuidos proporciona servicios de adquisición de datos. . Las organizaciones de cooperación internacional han formulado principios de datos abiertos que requieren que los miembros garanticen un acceso integral, abierto, oportuno, gratuito (de bajo costo), no discriminatorio y sin restricciones a metadatos, datos, productos y servicios en la medida de lo posible sin violar políticas y regulaciones. Al mismo tiempo, los proveedores de datos deben garantizar que los datos hayan sido certificados autorizadamente y garantizar la estabilidad y fiabilidad de los servicios de datos. Los organismos de cooperación internacional promueven el desarrollo sostenible de la cooperación internacional en investigación científica mediante la celebración de reuniones plenarias periódicas, la formulación de planes, la firma de acuerdos, la organización de actividades, etc.
Modelo de depósito centralizado basado en un repositorio de datos
Impulsado por la cultura abierta y compartida de la disciplina, los principios abiertos y compartidos y diversas políticas de archivo de datos de revistas, personal de investigación científica, autores de artículos y científicos. las instituciones de investigación depositan datos de forma centralizada a través del repositorio de datos y utilizan la función de publicación en línea proporcionada por el repositorio de datos para publicar, compartir y reutilizar recursos de datos científicos.
Publicación de datos científicos
La publicación de datos se divide principalmente en tres categorías: publicación de datos en un sentido amplio, publicación de datos en el tipo de apéndice de revista y publicación simultánea de conjuntos de datos y descripciones de datos. En sentido estricto, la publicación de datos se refiere principalmente al último tipo.
Data Mart
Según la forma organizativa de los proveedores de datos, los data marts se pueden dividir en dos modelos típicos: En Yi Datatang (www.
datatang . com), los propietarios de datos dispersos utilizan la plataforma comercial de Datatang para lograr un intercambio interactivo para los usuarios finales. En las transacciones de mercados de datos representadas por mercados de teledetección, las fuentes de datos las proporciona una única entidad integrada y de gran escala.
Referencia:
La base de datos PRIDE y herramientas y recursos relacionados en 2019: mejora del soporte para datos de cuantificación Texto completo del documento - Academic Fan (xueshufan.com)
Radiómica: el proceso y los desafíos texto completo - Academic Fan (xueshufan.com)