Colección de citas famosas - Frases motivadoras - Minería de sinónimos en minería de datos

Minería de sinónimos en minería de datos

Durante el proceso de búsqueda, es necesario utilizar sinónimos para mejorar la recuperación. Por ejemplo, un usuario busca lápiz labial, pero el nombre del producto no contiene la palabra clave lápiz labial, como lápiz labial de color xxx. Pero las dos palabras en realidad se refieren al mismo producto. Luego cuando el usuario busca, no encuentra el producto correspondiente. En este momento, se puede utilizar un diccionario de sinónimos para resolver este problema. Elasticsearch se utiliza como motor de búsqueda. Al consultar e indexar datos, la consulta y el documento primero se segmentan y luego las palabras específicas se reemplazan con un índice de sinónimos.

Por ejemplo: diccionario de sinónimos lápiz labial = & gt color lápiz labial color brillo de labios

Entonces, ¿vuelve a surgir la pregunta? ¿Cómo crear un diccionario de sinónimos?

En primer lugar, mucha gente pensará en utilizar word2vec para extraer sinónimos. De hecho, de acuerdo con el principio de Word2vec, las palabras similares topK extraídas por Word2Vec son en realidad palabras relacionadas basadas en la relación * * * *, no solo sinónimos, por lo que habrá mucho ruido.

Usa word2vec para minar

Como se muestra en la imagen de arriba, aunque palabras similares como riqueza, riqueza y riqueza han regresado, pobreza y pobreza también han regresado, y sus significados son exactamente antónimos, por lo que usar el word2vec completo sin supervisión para extraer sinónimos es ineficaz.

Hay dos ideas sobre los sinónimos de minería de word2vec.

Referencia:

/p/33942535

/question/40777785/answer/88189037

/info-detail-2486542.html