Colección de citas famosas - Colección de máximas - La siguiente función puede lograr la segmentación de palabras, pero ¿por qué no puede eliminar las palabras vacías? ¿Cuál es el problema?

La siguiente función puede lograr la segmentación de palabras, pero ¿por qué no puede eliminar las palabras vacías? ¿Cuál es el problema?

Creo que este puede ser un código incorrecto. También me encontré con esta situación, así que encontré este problema y verifiqué muchas cosas sin éxito.

Al principio, utilicé GB2312 para procesar todos los datos. Más tarde, leí el documento mediante segmentación de palabras entrecortadas y decía que UTF-8 debería usarse correctamente, así que escribí un fragmento de código para cambiar el texto a UTF-8. Luego, el archivo de palabras vacías también se guarda en utf-8, pero en lugar de código, use Notpad. Desde entonces, no he podido dejar de usar las palabras del documento.

Más tarde, se agregaron al código varias listas explícitas de palabras vacías. Cuando las palabras separadas no estén en la lista, genere esas palabras. Como resultado, todas las palabras de la lista se desactivaron correctamente.

Te sugiero que intentes ajustar el código nuevamente.

Además, usé Python2.7.10 al principio porque las palabras vacías no respondían. Encontré una página web que decía que se puede usar con Python 3.4, así que cambié a Python 3.4.3, pero no funcionó, así que hice lo que hice arriba. Aún no lo he probado con Python 2.7, supongo que el problema es similar. ...

¡Vamos, anfitrión! Mang Cheng Xuyuan, ¡vamos!