Gestión del clúster ES

La gestión de índices de ES /p/3cb80dcf514f

ES generalmente funciona en modo clúster, lo que no solo puede mejorar las capacidades de búsqueda de ES, sino también manejar las capacidades de búsqueda de big data. Al mismo tiempo, también aumenta la tolerancia a fallas y la alta disponibilidad del sistema, y ​​es puede buscar datos a nivel de PB.

La siguiente figura es un diagrama esquemático de la estructura del clúster ES:

Resuma los siguientes conceptos en la figura anterior:

1 y nodos

Clúster ES Compuesto por varios servidores, cada servidor es un nodo (solo se implementa un proceso ES en este servicio).

2. Dividir

Cuando tenemos una gran cantidad de documentos, por limitaciones de memoria y disco duro, y con el objetivo de mejorar la potencia de procesamiento, la tolerancia a fallos y la alta disponibilidad del ES. , dividimos el índice en varios segmentos, y cada segmento se puede colocar en un servidor diferente, de modo que varios servidores puedan proporcionar servicios de indexación y búsqueda al mundo exterior.

Cuando llega una solicitud de búsqueda, se realizará una consulta a partir de cada fragmento y, finalmente, los datos consultados se fusionarán y se devolverán al usuario.

3. Replicación

Para mejorar la alta disponibilidad de ES y el rendimiento de búsqueda, replicaremos una o más réplicas en fragmentos y las almacenaremos en otros servidores, de modo que incluso si el servidor actual Incluso si cuelga, los servidores con réplicas aún pueden proporcionar servicios como de costumbre.

4. Nodo principal

Habrá uno o más nodos maestros en un clúster. La función del nodo maestro es la gestión del clúster, como agregar y eliminar nodos. Después de que el nodo maestro cuelgue, ES volverá a seleccionar un nodo maestro.

5. Reenvío de nodos

Cada nodo conoce la información de otros nodos. Podemos enviar una solicitud a cualquier nodo y el nodo que recibe la solicitud la reenviará a otros nodos para consultar datos.

El siguiente ejemplo implementa la creación de un clúster de dos nodos. Configuramos 2 sectores de índice, una copia para cada sector.

Nodo maestro: el nodo maestro se utiliza principalmente para la gestión e indexación de clústeres, como agregar nodos, asignar segmentos, agregar y eliminar índices, etc. Nodo de datos: el nodo de datos almacena fragmentos de datos y es responsable de las operaciones de indexación y búsqueda. Nodo de cliente: el nodo de cliente solo existe como cliente solicitante y la función del cliente también es la de equilibrador de carga. Los nodos cliente no almacenan datos, simplemente reenvían solicitudes a otros nodos de forma equilibrada.

Configure la función del nodo a través de los siguientes dos parámetros:

Node.master: #¿Se le permite servir como nodo maestro?

Node.data: #Permite almacenar datos como nodos de datos.

Node.ingest: #Si está permitido ser un nodo colaborativo,

Cuatro combinaciones:

Master=true, data=true: son ambos el nodo maestro y el nodo de datos.

Master=false, data=true: solo nodos de datos.

Master=true, data=false: es solo el nodo maestro y no almacena datos.

Master=false, data=false: No es ni un nodo maestro ni un nodo de datos. En este punto, se puede establecer en verdadero para indicar que es el cliente.

Descomprima Elasticsearch-6.2.1.zip.

El puerto http del servicio externo del nodo 1 es 9200.

El puerto de administración del clúster es 9300.

Configurar elasticsearch.yml

Nombre de nodo: xc_node_1

El contenido de Elasticsearch.yml es el siguiente

La operación es la misma como nodo 1.

1) Utilice el cabezal para conectar uno de los nodos.

La figura anterior muestra que se han creado dos nodos con éxito.

2) Cree una biblioteca de índice a continuación con ***2 segmentos, una copia para cada segmento.

Como puedes ver en la imagen de arriba, * * * hay cuatro sectores, dos de los cuales son duplicados.

3) Cada nodo está equipado con un separador de palabras IK.

Compruebe el estado del clúster de Elasticsearch accediendo a GET /_cluster/health.

Indica el estado de salud en tres colores: verde, amarillo o rojo.

Verde: todos los segmentos primarios y de réplica funcionan con normalidad.

Amarillo: todos los sectores principales se ejecutan normalmente, pero algunos sectores de réplica no.

Rojo: Uno de los cortes principales no funciona correctamente.

1) Crea un mapa y escríbelo en el documento.

Conecta cualquiera de estos nodos para crear un mapa y escribirlo en el documento.

2) Buscar

Iniciar una solicitud de búsqueda a otro nodo para consultar todos los datos.

3) Apagar un nodo

ES volverá a seleccionar un nodo maestro (asumiendo que puede ser el nodo maestro al configurar el nodo).

En este momento, es normal iniciar una solicitud de búsqueda al nodo activo.