Cómo utilizar el diccionario de segmentación de palabras chinas
1) Método de coincidencia máxima positiva (dirección de izquierda a derecha);
2) Método de coincidencia máxima inversa (de derecha a izquierda) );
3) Segmentación mínima (minimizar el número de palabras recortadas de cada frase).
Los métodos anteriores también se pueden combinar entre sí. Por ejemplo, el método de coincidencia máxima directa y el método de coincidencia máxima inversa se pueden combinar para formar un método de coincidencia bidireccional.
Los resultados estadísticos muestran que la tasa de error al usar solo la coincidencia máxima directa es 1/169, y la tasa de error al usar solo la coincidencia máxima inversa es 1/245. Sin embargo, esta precisión está lejos de satisfacer las necesidades reales. En los sistemas de segmentación de palabras reales, la segmentación mecánica de palabras se utiliza como método de segmentación inicial, y la precisión de la segmentación debe mejorarse aún más mediante el uso de otra información del lenguaje.