Características técnicas de la plataforma de análisis de opinión pública en Internet de Founder
Tecnología de procesamiento del lenguaje natural
Según las estadísticas, el 80% de la información digital existe actualmente en forma no estructurada y la mayor parte de la información se describe en lenguaje natural. Fundador Zhisi El sistema de apoyo a la decisión asistida de alerta temprana de opinión pública, como sistema de aplicación de análisis de información, puede realizar análisis y extracción en profundidad de formas de texto descritas en lenguaje natural.
Tecnología de segmentación automática de palabras
La tecnología de segmentación automática de palabras es la base para el procesamiento y análisis de la información china. Una segmentación incorrecta de palabras puede dar lugar a una semántica de la información completamente errónea. El sistema de apoyo a las decisiones de alerta temprana de opinión pública del fundador Zhisi se basa en diccionarios y reglas, y utiliza de manera integral métodos de modelos de lenguaje basados en análisis de probabilidad para lograr una precisión de segmentación de palabras del 99%. Se puede segmentar de acuerdo con diferentes aplicaciones de acuerdo con requisitos específicos.
Tecnología automática de palabras clave y resumen automático
Fundador del sistema de apoyo a la toma de decisiones de alerta temprana de opinión pública de Zhisi basado en el análisis semántico del texto, que considera de manera integral la frecuencia de las palabras, la parte del discurso y la información de ubicación para lograr Palabras clave automáticas precisas y resúmenes automáticos. Al mismo tiempo, se utilizan tecnologías como el análisis de referencias para hacer que el resumen sea más legible.
Tecnología de recuperación de información
Tecnología de recuperación de texto completo
El motor de texto completo del sistema de apoyo a las decisiones de alerta temprana de opinión pública del Fundador Zhisi combina texto completo tradicional Tecnología de recuperación con la última tecnología de búsqueda WEB. Combinados, los indicadores de rendimiento del motor de búsqueda mejoran enormemente. Al mismo tiempo, combina una variedad de tecnologías relacionadas para proporcionar métodos de búsqueda enriquecidos y sinónimos y otros métodos de búsqueda inteligentes.
Tecnología de minería de datos
Clasificación automática y agrupamiento automático
La clasificación consiste en obtener un modelo de las características de los atributos de cada clasificación aprendiendo el conjunto de entrenamiento y luego utilizar este modelo Clasificar datos cuya clasificación se desconoce. Una aplicación típica es que el sistema clasifique automáticamente el conjunto de documentos después de aprender y entrenar algunos documentos de clasificación conocidos. La diferencia clave con la agrupación es que tiene un proceso de aprendizaje.
Agrupar consiste en dividir los datos de un conjunto de datos en subconjuntos con cierto significado, de modo que las diferencias (distancias) de datos en diferentes subconjuntos sean lo más grandes posible y las diferencias (distancias) de datos en el mismo El subconjunto es lo más grande posible. Pequeño. Un ejemplo de aplicación típico es que en una base de datos espacial, los puntos de datos se dividen en diferentes grupos según su distribución espacial.
Búsqueda similar y eliminación de duplicados
La búsqueda similar consiste en encontrar instancias de objetos o subconjuntos de objetos que sean similares al objeto de consulta especificado en la colección de objetos. Por ejemplo, busque páginas, imágenes u otra información similar al contenido especificado en la WEB.
En aplicaciones prácticas, se encuentran artículos con información de opinión pública casi idéntica para eliminar la información de opinión pública, se forman informes especiales, análisis de antecedentes, etc. en función de la similitud de los temas del artículo.