Clasificación y principios de funcionamiento de los motores de búsqueda.
1. Índice de texto completo
La clasificación de motores de búsqueda menciona el concepto de motores de búsqueda de texto completo que extraen información de sitios web para crear bases de datos web. Los motores de búsqueda tienen dos funciones de recopilación automática de información. Una es la búsqueda regular, es decir, de vez en cuando, el motor de búsqueda envía activamente un programa "araña" para buscar sitios web de Internet dentro de un determinado rango de direcciones IP. Una vez que descubre un nuevo sitio web, extrae automáticamente la información del sitio web y la URL y la agrega a su propia base de datos.
2. Índice de directorio
El índice de directorio, también conocido como recuperación de clasificados, es el primer servicio en Internet que proporciona consultas de recursos WWW. Principalmente recopila y organiza recursos de Internet y asigna sus URL a diferentes categorías de catálogos de temas relacionados según el contenido de las páginas web buscadas, formando un índice de estructura de árbol de clasificación similar al catálogo de una biblioteca.
3. Metabúsqueda
Después de aceptar la solicitud de consulta del usuario, el metabuscador busca en varios motores de búsqueda al mismo tiempo y devuelve los resultados al usuario. Los metabuscadores famosos incluyen InfoSpace, Dogpile, Vivisimo, etc. Entre los metabuscadores chinos, el motor de búsqueda Star es uno de los más representativos. En términos de clasificación de los resultados de búsqueda, algunos clasifican directamente los resultados de la búsqueda por fuente, como Dogpile, otros reorganizan y combinan los resultados según sus propias reglas;
Cómo funcionan los motores de búsqueda:
Paso 1: Rastreo
Los motores de búsqueda utilizan un software específico para rastrear enlaces en páginas web y rastrear de un enlace a otro Enlaces Son como arañas que se arrastran sobre una telaraña, por eso se les llama "arañas" y "robots". Existen ciertas reglas para el rastreo de las arañas de los motores de búsqueda y es necesario seguir algunos comandos o el contenido de los archivos.
Paso 2: recoge los elementos de almacenamiento.
Los motores de búsqueda rastrean páginas web a través de enlaces de seguimiento de arañas y almacenan los datos rastreados en la base de datos de la página original. Los datos de la página son exactamente los mismos que el HTML obtenido por el navegador del usuario. Las arañas de los motores de búsqueda también detectarán contenido duplicado al rastrear la página. Una vez que encuentran una gran cantidad de contenido plagiado, incluido o plagiado en un sitio web de menor autoridad, es probable que dejen de rastrear.
Paso 3: Preprocesamiento
El motor de búsqueda rastreará la página devuelta por la araña y la procesará previamente en cada paso.
Paso 4: Clasificación
Después de que el usuario ingresa la palabra clave en el cuadro de búsqueda, el programa de clasificación llama a los datos de la base de datos del índice, calcula la clasificación y se la muestra al usuario. El proceso interactúa directamente con el usuario. Sin embargo, debido a la gran cantidad de datos en los motores de búsqueda, aunque se pueden realizar pequeñas actualizaciones todos los días, las reglas de clasificación de los motores de búsqueda generalmente se actualizan en diferentes etapas del día, la semana y el mes.
Datos ampliados:
Diez principales motores de búsqueda:
1, Baidu
Baidu es el motor de búsqueda chino más grande del mundo y el más grande Sitio web chino. Robin Li se fundó en Zhongguancun, Beijing, en octubre de 2000 y se compromete a brindar a las personas una forma "simple y confiable" de obtener información. La palabra "Baidu" proviene del poeta chino Xin Qiji de la dinastía Song, quien dijo: "Puedes encontrarlo en mil Baidus", lo que simboliza la búsqueda persistente de Baidu de la tecnología china de recuperación de información.
2. Google
Google (nombre chino: Google), una empresa de tecnología multinacional estadounidense, está comprometida con la búsqueda en Internet, la computación en la nube, la tecnología publicitaria y otros campos, desarrollando y proporcionando una gran número de productos y servicios basados en Internet, cuyos principales beneficios proceden de servicios publicitarios como AdWords. Google fue fundado por Larry Page y Sergey Bloom, quienes en ese momento estaban estudiando un doctorado en ciencia y tecnología en la Universidad de Stanford, por lo que también se les llamaba "Google Guys".
3. American Yahoo Company (que proporciona servicios de recuperación de información de Internet)
Yahoo es un famoso portal de Internet en los Estados Unidos y uno de los creadores del milagro de Internet de finales del siglo. Siglo XX. Sus servicios incluyen motores de búsqueda, correo electrónico, noticias y más. Su negocio cubre 24 países y regiones, brindando servicios de red diversificados a más de 500 millones de usuarios independientes en todo el mundo. También es una empresa global de medios, comercio y comunicaciones por Internet.
4. Sogou
Sogou es una subsidiaria de Sohu. Se lanzó el 3 de agosto de 2004 para mejorar las habilidades de búsqueda de Sohu. Principalmente dedicado al negocio de búsqueda de Sohu.
Mientras buscaba servicios, también se introdujeron el método de entrada Sogou y el navegador de alta velocidad Sogou.
5. Aiwen
Como el primer motor de búsqueda interactivo inteligente chino, Aiwen ha superado los modelos de búsqueda superiores representados por GOOGLE y Baidu. Sina "iAsk" no sólo conserva las poderosas funciones de la tecnología de algoritmos tradicional en las búsquedas web convencionales, sino que también compensa las deficiencias inherentes de la tecnología de algoritmos tradicional en la inteligencia y la interactividad de la interfaz de búsqueda con una plataforma interactiva única de preguntas y respuestas.
6. Soso
Soso es un sitio web de búsqueda propiedad de Tencent y uno de sus principales departamentos comerciales. El sitio web se lanzó oficialmente y comenzó a funcionar en marzo de 2006. Actualmente, Soso se ha convertido en uno de los tres motores de búsqueda preferidos por los internautas chinos. Proporciona principalmente servicios de búsqueda prácticos y convenientes para los internautas y realiza todos los servicios de búsqueda de Tencent. Es uno de los componentes importantes de la estrategia general de vida en línea de Tencent.
7. Youdao
Youdao es una subsidiaria de NetEase que utiliza tecnología de big data para proporcionar aplicaciones de Internet móviles. NetEase Youdao Company ha lanzado una serie de productos como Youdao Dictionary, Youdao Cloud Notes, Huihui.com y Youdao Promotion.
8. Zhongsou
Zhongsou es el principal proveedor de aplicaciones tecnológicas y servicios de motores de búsqueda de tercera generación de China. Basándose en el motor de búsqueda de tercera generación y widgets personalizados, logra la integración del conocimiento humano y la tecnología de búsqueda, y proporciona a los internautas y a las empresas una nueva experiencia de motor de búsqueda de tercera generación a través de dos sitios web principales, aplicaciones móviles y plataformas de servicios en la nube. y otros transportistas.
Búsqueda 9360
La búsqueda integral 360 es un metabuscador y un tipo de motor de búsqueda. Ayuda a los usuarios a seleccionar y utilizar motores de búsqueda apropiados entre múltiples motores de búsqueda para implementar operaciones de recuperación a través de una interfaz de usuario unificada. Es un mecanismo de control global para varias herramientas de recuperación distribuidas en la red.
10, Skynet
El predecesor de Skynet Search fue Skynet de la Universidad de Pekín. Skynet de la Universidad de Pekín, desarrollado por el Laboratorio de Red de la Universidad de Pekín, es el resultado de la investigación del proyecto nacional clave de ciencia y tecnología "Codificación china-inglés y descubrimiento de información distribuida". El 29 de octubre de 1997, la Universidad Tianwang de Pekín proporcionó oficialmente servicios de búsqueda y navegación de información web a la mayoría de los internautas en CERNET. Este fue el primer motor de búsqueda nacional basado en la búsqueda de índices web.
Enciclopedia Baidu-Motor de búsqueda