Las ventajas y desventajas de los tres métodos de corte de palabras
1. La ventaja de la segmentación de palabras basada en árbol trie es que aprovecha las características de recuperación de cadenas del árbol trie. En la segmentación de palabras, no necesita saber la longitud de la palabra, solo necesita hacer coincidir hacia abajo según un nodo del árbol hasta encontrar la posición final. La desventaja es que construir el diccionario es más complicado.
2. La ventaja de utilizar 2 participios de palabras completas es que son rápidos. Al construir la posición hash de la tabla hash receptora de palabras y la tabla de índice de palabras, la velocidad de consulta es rápida. La desventaja es la baja precisión.
3. La ventaja de la segmentación palabra por palabra es que combina las ventajas de almacenamiento de la dicotomía de palabras completas y las ventajas de consulta del árbol Trie. Alta precisión, coincidencia palabra por palabra, sin ambigüedad.