Secuenciación por nanoporos
Cómo funciona la secuenciación por Nanopore en pocas palabras:
Los nanopores son diminutos poros sintéticos de proteínas (piense en ellos como pequeños túneles) unidos a una membrana que permiten el paso del ADN a través de ellos. Tenga en cuenta que existe una corriente eléctrica interna constante causada por el paso de iones (es decir, átomos con carga eléctrica) a través del nanoporo. Cuando una molécula de ADN atraviesa el nanoporo, cada nucleótido provoca una pequeña perturbación en la corriente iónica interna del poro. Esta perturbación es medida posteriormente por un chip con una frecuencia de 5 kHz. La alteración de la corriente eléctrica medida se genera como una señal “squiggle”, que luego se guarda en archivos informáticos en formato fast5 o pod5. Dado que combinaciones específicas de nucleótidos generan perturbaciones características en la corriente iónica, esta señal squiggle puede traducirse en código genético mediante algoritmos especializados, como las redes neuronales. En este contexto, la producción de la señal squiggle y de los datos de secuencia genética se denomina “secuenciación”, mientras que la traducción únicamente de la señal squiggle a datos de secuencia de ADN se conoce generalmente como “basecalling”. La tecnología Nanopore permite realizar basecalling en tiempo real, reduciendo el intervalo entre la secuenciación de la muestra y la producción de datos. El basecalling también puede realizarse posteriormente, lo cual suele hacerse cuando se utilizan algoritmos de basecalling más precisos pero computacionalmente más exigentes. Estos algoritmos se denominan: Fast, High Accuracy (HAC) y Super High Accuracy (SUP), y representan un equilibrio entre la precisión de la secuencia y los recursos computacionales necesarios para ejecutarlos.
Nucleótido se refiere a cualquiera de los 4 bloques moleculares de construcción, o bases, que forman el llamado código genético en el ADN: estas son adenina (A), citosina (C), guanina (G) y timina (T).
En este caso, una lectura de secuenciación es una secuencia inferida de squiggle o, más comúnmente, de pares de bases (es decir, señal squiggle tras el proceso de basecalling) que corresponde a la totalidad o a una parte de un único fragmento de ADN.
Precisión de las lecturas: antes y ahora
Históricamente, la secuenciación por Nanopore ha presentado una tasa de error más alta que otras tecnologías de secuenciación de ADN. Algunos estudios en los últimos años informaron de una tasa de error en las lecturas de secuenciación de hasta un 8%, debida principalmente a las dificultades de los nanopores para distinguir con precisión los homopolímeros.
Sin embargo, gracias a mejoras en las flow cells, la química de reacción y la bioinformática, junto con la secuenciación dúplex (basecalling simultáneo de las cadenas de ADN directa y complementaria inversa), esta tasa de error en las lecturas de secuenciación se ha reducido hasta un 0,6%. Diversos estudios han demostrado que Nanopore puede producir códigos de barras de ADN que son >99,99% idénticos a los códigos de barras obtenidos mediante Sanger, a una fracción del coste.
Homopolímero: una molécula formada por la repetición de una única unidad. En secuencias de ADN esto correspondería a una de las 4 bases (es decir, A, C, G o T) repetida varias veces consecutivas.
Código de barras de ADN: una secuencia de ADN relativamente corta (<1kb) que contiene suficiente variación para distinguir entre especies. El nombre “código de barras” deriva de que cumple una función muy similar a los códigos de barras utilizados en inventarios de almacén.
Longitud de lectura y rendimiento
La secuenciación por Nanopore es una de las dos únicas tecnologías de secuenciación capaces de producir lecturas largas con precisión. Al utilizar kits de secuenciación estándar, la mayoría de las lecturas suelen tener una longitud aproximada de 10–100 kb, mientras que el uso de kits de secuenciación de lecturas ultralargas puede generar lecturas de entre 100 y 300 kb, siempre que el ADN sea de buena calidad. En algunos casos se han reportado lecturas extremadamente largas, denominadas “whales”, de varios megabases (Mb) de longitud.
La cantidad de datos producidos por una secuenciación Nanopore dependerá del modelo utilizado. Por ejemplo: mientras que un MinION produce en promedio entre 10 y 20 Gb por flow cell, el PromethION de mayor tamaño puede producir hasta 200 Gb por flow cell.
Kilobase (kb) = 1000 bases (nucleótidos) Megabase (Mb) = 1.000.000 bases Gigabase (Gb) = 1.000.000.000 bases
Cómo podemos beneficiarnos de la secuenciación Nanopore para el monitoreo de la biodiversidad
Probablemente una de las características más atractivas de la secuenciación Nanopore en el ámbito de la conservación y el monitoreo de biodiversidad es la portabilidad y el bajo coste de inversión de sus dispositivos. El MinION, el secuenciador más pequeño, cabe fácilmente en el bolsillo y puede adquirirse por alrededor de ~2.000 $. Esto le proporciona esencialmente la capacidad de secuenciar ADN en cualquier lugar con una inversión inicial un orden de magnitud inferior a la de otras tecnologías.
La posibilidad de secuenciar directamente en el lugar de estudio o in situ ofrece varias ventajas. Permite aplicar enfoques novedosos de monitoreo genético de la biodiversidad en países con alta biodiversidad que con frecuencia carecen de la infraestructura, el equipamiento y la experiencia necesarios para hacerlo. De este modo, la secuenciación portátil puede democratizar estos métodos mediante el fortalecimiento de capacidades locales. Además, la secuenciación en campo puede reducir el intervalo entre la recolección de muestras y la generación de datos, al disminuir el tiempo de transporte de las muestras y reducir también los costes y la carga administrativa que a menudo implica la exportación de muestras.
Combinada con métodos de muestreo de ADN ambiental, la secuenciación portátil Nanopore ofrece una nueva forma de monitorear la biodiversidad. Los datos que indican la presencia de una o varias especies pueden generarse y analizarse cerca de la fuente de la muestra. Si desea conocer más sobre cómo utilizamos la secuenciación Nanopore para el monitoreo in situ de la fauna silvestre en Zambia basado en ADN ambiental, lea nuestro artículo de blog relacionado.



