Colección de citas famosas - Mensajes de felicitación - ¿Cuál es la velocidad de segmentación de palabras del algoritmo de coincidencia máxima directa en la segmentación de palabras chinas? ¿Cuál es la tasa de precisión aproximada?

¿Cuál es la velocidad de segmentación de palabras del algoritmo de coincidencia máxima directa en la segmentación de palabras chinas? ¿Cuál es la tasa de precisión aproximada?

Depende principalmente de la estructura de su vocabulario, el valor inicial de la longitud máxima de la palabra, el número de búsquedas en el diccionario y el número de coincidencias, y luego se obtiene la complejidad del tiempo, si no recuerdo mal. la complejidad del algoritmo hash original debería ser 2,89. Leí un documento en 2011 y propuse un algoritmo mejorado con una complejidad temporal de 2,291...

Además, el algoritmo de segmentación de palabras no está intacto. Por ejemplo, la estructura de vocabulario de algunos motores de búsqueda utiliza la estructura de árbol de Tire, por lo que no es necesario establecer la longitud máxima de la palabra, pero existen compensaciones en términos de espacio de memoria. Incluso hay motores de búsqueda que reducen el número de búsquedas en el diccionario. y aumentar el número de coincidencias...

Así que simplemente le daré una velocidad de segmentación de palabras de memoria pura de 189,3 m/M, pero este algoritmo cambió a 497,6 ms/M en un servidor de configuración superior, lo que hace no tiene sentido...

Recuerdo que alguien dijo en alguna literatura que la segmentación de palabras en sí no es más bien una etapa necesaria del procesamiento posterior. Por lo tanto, a menos que estés estudiando algoritmos, no sirve de mucho. Tiene sentido simplemente perseguir la velocidad y precisión de esta cosa