Colección de citas famosas - Consulta de diccionarios - Capacitación en Java de Beida Jade Bird: ¿Cómo resolver los problemas de los microservicios y la arquitectura de sistemas distribuidos?

Capacitación en Java de Beida Jade Bird: ¿Cómo resolver los problemas de los microservicios y la arquitectura de sistemas distribuidos?

Si comprende tecnologías como los microservicios y la arquitectura de servidores distribuidos, también debería tener sus propios conocimientos únicos sobre cómo resolver problemas como daños y pérdidas causados ​​por errores en el funcionamiento del sistema.

Capacitación informática de hoy/Echemos un vistazo a las soluciones a los problemas que surgen durante el funcionamiento del servidor.

Con el auge de los microservicios y las arquitecturas de nube distribuida, la Web se vuelve cada vez más compleja, los fallos "aleatorios" son cada vez más difíciles de predecir y nos volvemos cada vez más dependientes de estos sistemas. . grande.

Estos fallos provocaron grandes pérdidas a la empresa y causaron grandes problemas a los usuarios, afectando sus compras online, transacciones o interrumpiendo su trabajo.

Incluso los fallos más simples pueden afectar a los resultados de una empresa, por lo que el tiempo de inactividad se ha convertido en un KPI para muchos equipos de ingeniería.

En 2017, el 98 % de las empresas dijeron que una hora de inactividad les costó más de 65 438 millones de dólares.

Las interrupciones del servicio pueden costar a las empresas millones de dólares.

Recientemente, el CEO de British Airways reveló que en mayo de 2017 se produjo un fallo técnico que provocó que miles de pasajeros quedaran varados en el aeropuerto, provocando que la compañía perdiera 80 millones de libras.

Las empresas necesitan encontrar formas de resolver estos problemas, porque cuando ocurra el siguiente incidente, ya será demasiado tarde.

Así surgió la ingeniería del caos.

La ingeniería del caos tiene como objetivo cortar los fallos de raíz, es decir, identificarlos antes de que causen perturbaciones.

Al crear fallas de manera proactiva, podemos probar el comportamiento del sistema bajo diversas tensiones, identificar y solucionar problemas de fallas y evitar consecuencias graves.

La ingeniería del caos compara lo esperado con lo que realmente ocurre para mejorar la flexibilidad del sistema mediante la "destrucción consciente".

Una breve historia de la ingeniería del caos La ingeniería del caos apareció por primera vez en las empresas gigantes de Internet. Estas empresas tienen sistemas distribuidos a gran escala. Debido a que estos sistemas son tan complejos, requieren nuevos medios para probarlos.

En 2010, el equipo de NetflixEngTools desarrolló ChaosMonkey.

En ese momento, Netflix migró de la infraestructura física a AWS. Para garantizar que la falla de la instancia de AWS no afecte la experiencia del usuario de Netflix, desarrollaron esta herramienta para probar el sistema.

SimianArmy nació en 2011. Agrega un modo de inyección de fallas basado en ChaosMonkey y puede probar más escenarios de fallas.

Netflix cree que las características de la nube son la redundancia y la tolerancia a fallos, pero ningún componente puede garantizar el 100% de disponibilidad, por lo que deben diseñar una arquitectura de nube en la que el fallo de un único componente no afecte al conjunto. sistema.

Netflix abrió ChaosMonkey en GitHub en 2012, afirmando que "han encontrado una manera de resolver fallas inesperadas importantes.

Al crear fallas constantemente, nuestro servicio se vuelve más flexible.

En 2014, el equipo de Netflix creó un nuevo personaje llamado Chaos Engineer.

Bruce Wong inventó este personaje y Dan Woods lo promovió entre la comunidad de ingenieros.

Dan Woods explica: "Aprendí más sobre ingeniería del caos de Kolton Andrus, quien lo llamó prueba de inyección de fallas"

2014 10 cuando el cofundador de Gremlin, Kolton Andrus, todavía estaba aquí en Netflix, le propusieron. el concepto de prueba de inyección de fallas (FIT) basado en SimianArmy, que permite a los desarrolladores controlar de manera más flexible el "rango fatal" de fallas inyectadas.

Debido a que SimianArmy a veces falla, lo que lleva a fallas muy graves, los desarrolladores de Netflix sospechaban. A partir de esto, FIT pudo controlar mejor la granularidad de las fallas, por lo que propusieron el concepto de ingeniería del caos.