Secuenciación de tercera generación (Nanopore)
Primero presentamos a los protagonistas de la secuenciación de Nanopore:
Lector: En la naturaleza, existe una proteína transmembrana que puede incrustarse en la membrana celular como un canal iónico o molecular, y tiene propiedades naturales. Nanoporos de proteínas. Después de una modificación por ingeniería genética artificial, se obtiene la proteína Reader necesaria para la secuenciación de Nanopore.
Membrana: La proteína Reader estará incrustada en una membrana de alta resistividad (membrana de polímero sintético). Hay soluciones iónicas en ambos lados de la membrana, se aplican diferentes potenciales a ambos lados y los iones. estar en los poros fluye, formando una corriente eléctrica.
Motor: Durante la construcción de la biblioteca de nanoporos, es necesario conectar una dinamina al adaptador para empujar moléculas de ADN o ARN hacia el interior del nanoporo. Tomando como ejemplo la ADN helicasa como motor (dinamina), no solo puede desenrollar la doble hélice y convertirla en una sola hebra, sino que también puede proporcionar fuerza impulsora.
Tether: Esta proteína se utiliza para anclar las hebras de ADN o ARN, evitando que floten en la solución y permitiéndoles entrar en el nanoporo.
En este momento, una de las cadenas desenredadas pasará a través del poro de la proteína. Cuando pase a través del poro de la proteína, perturbará el flujo estable de iones en ambos lados de la membrana. Diferentes bases tienen diferentes efectos sobre el flujo de iones, lo que producirá diferentes tamaños de corriente, formando así el siguiente diagrama de señal de corriente.
Utilizando estas señales actuales y utilizando software informático para identificarlas, se infiere el tipo de base y se completa la secuenciación.
Aunque existen muchos tipos de secuenciadores Nanopore, todos son plataformas basadas en chips Nanopore, que van desde secuenciadores de las series PromehION y GridION compuestos por múltiples conjuntos de chips hasta secuenciadores tan pequeños como el Tipo C que se pueden conectar a un teléfono móvil. Teléfono Secuenciadores portátiles de la serie MnION con USB de ordenador.
La más famosa aquí es la serie MnION. En agosto de 2016, la astronauta estadounidense Kate Rubins completó la secuenciación de ADN en condiciones de microgravedad en la Estación Espacial Internacional.
Al realizar la secuenciación, generalmente solo es necesario conectarlo como se muestra a continuación, lo cual es obvio por su portabilidad. Por ejemplo, se puede utilizar directamente para recolectar muestras en áreas epidémicas y realizar análisis en tiempo real, ahorrando así una gran cantidad de tiempo y recursos valiosos para el trabajo de prevención de epidemias.
Durante la secuenciación, deje caer la biblioteca preparada o la solución de muestra en los pequeños orificios del chip y comience a secuenciar.
Hay 2048 pocillos de membrana en un chip, que es un orificio en el chip, y cada pocillo contiene un lector de nanoporos.
Cada cuatro pozos comparten un Amplificador (amplificador de señal). Hay 512 amplificadores de señal en un chip, es decir, 512 conjuntos de pozos.
Después de iniciar el secuenciador, la máquina realiza una autoprueba y clasifica cada grupo de pozos según su eficiencia. Cuando comienza la secuenciación, el instrumento utiliza primero los pocillos más eficientes de cada grupo de pocillos. Después de funcionar durante 8 horas, el instrumento reemplaza los pocillos con la segunda mayor eficiencia, y así sucesivamente.
Sin embargo, en uso real, sólo 1200 pozos pueden funcionar correctamente.
El motivo del fallo de los pocillos:
La biblioteca 1D es un ADN bicatenario que se funde en una cadena sentido y una cadena antisentido y se secuencia por separado. Tiene una base. Precisión de llamadas de alrededor del 85%.
Actualmente, existen dos métodos para construir bibliotecas 1D:
Conectar adaptadores en ambos lados del ADN. Otros pasos son similares a los de las bibliotecas 1D.
El conector de este tipo de bibliotecas permite secuenciar la segunda hebra siguiendo muy de cerca a la primera.
Dado que se pueden detectar dos hebras, pueden corregirse entre sí, mejorando así la precisión de la interpretación de la base y alcanzando una precisión de la base de más del 90%.
Sin embargo, debido a factores como la calidad de la biblioteca y la actividad proteica, no todas las segundas cadenas se detectarán después de la primera.
Durante el proceso de secuenciación, la señal obtenida no se mide una señal base a la vez. Pero según la longitud longitudinal del poro de la proteína Reader, R9 tiene aproximadamente 5 bases de largo, lo que significa que las señales eléctricas de 5 bases se medirán al mismo tiempo. Este no es un proceso de evaluación simple.
Actualmente, Nanopore utiliza un método de aprendizaje automático, Recurrent Neural Network (RNN), para interpretar bases.
En pocas palabras, el proceso consiste en utilizar las formas de onda de señales eléctricas de secuencias de bases conocidas como conjuntos de entrenamiento y conjuntos de prueba, y luego obtener el modelo corrigiendo los parámetros. Finalmente, el diagrama de forma de onda de la secuencia desconocida recién detectada se compara con él para mejorar la precisión de la interpretación.
Sin embargo, todavía hay errores de lectura:
Tomando el chip R9 como ejemplo, durante el proceso de secuenciación, primero se utiliza un voltaje de 180 mV, y cada 10 minutos, el voltaje La dirección se invierte durante un breve periodo de tiempo para activar el poro de proteína del lector bloqueado o atascado. Sin embargo, este proceso también devolverá las hebras DAN normalmente secuenciadas.
A medida que aumenta el tiempo de uso del electrodo, el voltaje del electrodo variará, por lo que cada dos horas, aumente el voltaje en 5 mV para compensar el efecto.
Chip R9, la velocidad de secuenciación es de 250 bases/s y un chip puede obtener aproximadamente 5 ~ 10 secuencias de bases G.
Cada nueva proteína Reader, motor y membrana producida por Nanopore Company tendrá un nuevo número de versión de chip. Las reglas generales de nomenclatura son las siguientes:
Por ejemplo, R9 se refiere a E. Proteína lectora modificada con proteína CsgG de coli.
Referencia:
/watch?v=RcP85JHLmnI
/watch?v=E9-Rm5AoZGwamp;t=13s
/watch ?v=sv9fFeSd3kE
/