Menú

Fragmentación NGS Uncategorized

Fragmentación del ADN en NGS ¿qué necesito entender y como afecta a mi proyecto de secuenciación?

Las metodologías en purificación de ácidos nucleicos constituyen el pilar básico de las técnicas que se basan en análisis moleculares en biomedicina. Las muestras de partida son muy variadas, desde aislados celulares hasta muestras fijadas en formalina o incluidas en parafina y abarcan técnicas desde PCR a tiempo final hasta secuenciación de alto rendimiento, por lo que el impacto de las diferentes técnicas de fragmentación del material genético puede aumentar la precisión, desarrollo de algoritmos para corregir errores de análisis, optimización en productos de PCR de cara a una secuenciación de amplicones, aumentar la especificidad en las secuencias a fragmentar, aumento del rendimiento y la integridad en la fragmentación  y en general buscar herramientas que mejoren la calidad de los datos obtenidos en los resultados tanto en técnicas rutinarias como para metodologías superiores en análisis específicos como por ejemplo la detección de genes de fusión, SNVs y SNPs.

En nuestro caso vamos a centrarnos en cómo afectan los métodos de fragmentación del material genético en NGS, donde la construcción de las bibliotecas constituye un paso clave para el análisis e interpretación de resultados.

¿Entonces, como afectan los métodos de fragmentación del ADN a la identificación de variantes?

Las distintas técnicas de fragmentación del ADN pueden introducir errores de secuenciación únicos, lo que podría afectar a la precisión de la identificación de variantes.

La fragmentación por sonicación utiliza ondas ultrasónicas para cortar el ADN se ha consolidado como una herramienta muy útil por su capacidad de producir fragmentos de tamaño uniforme, sin embargo, la sonicación puede introducir daño oxidativo en el ADN, en particular lesiones que pueden generar artefactos en forma de sustituciones. Un ejemplo es la lesión oxidativa en 8-oxo-G que como consecuencia provoca sustituciones como C:G>A>T y C:G>G:C, que son errores de secuenciación habituales en bibliotecas generadas por sonicación.

Más allá del daño oxidativo, la sonicación también puede crear lecturas de artefactos quiméricos que contienen secuencias repetidas invertidas (IVS) que surgen cuando los fragmentos de ADN monocatenario que contienen esos IVS de la misma molécula aparean durante la reparación de los extremos, lo que lleva a la inclusión de secuencias de la cadena opuesta. 

Por otro lado, están los métodos de fragmentación enzimática que se basa en el uso de endonucleasas para la digestión del ADN, una alternativa muy popular a la sonicación debido a su facilidad de uso, escalabilidad y pérdida mínima de ADN. No obstante, la fragmentación enzimática a menudo introduce más SNVs y deleciones que la sonicación asociados principalmente a secuencias palindrómicas. 

Es importante resaltar que los tipos específicos de artefactos generados variarán según el protocolo exacto de sonicación o fragmentación enzimática utilizado.

Estos artefactos pueden generar identificaciones de variantes con resultados que complican el análisis posterior y dar lugar a interpretaciones erróneas.

¿Y qué estrategias mitigan la generación de estos errores?

El modelo PDSM (partial single strands derived from a similar molecule) sugiera que el ADN bicatenario se escinde aleatoriamente mediante sonicación, lo que crea moléculas monocatenarias parciales, que pueden unirse a secuencias complementarias en otros fragmentos monocatenarios de la misma molécula. Este apareamiento da como resultado lecturas quiméricas y a la introducción de mutaciones durante la reparación de los extremos y la amplificación por PCR de la biblioteca que se quiere construir.

El modelo PDSM también explicaría estos errores de la fragmentación enzimática. En este caso, las endonucleasas crean mellas en el ADN generando regiones monocatenarias. Si estas regiones contienen secuencias palindrómicas, podrían emparejarse con secuencias complementarias de la misma molécula. La subsiguiente reparación de los extremos y la formación de las llamadas A-tailing, pueden introducir mutaciones y lecturas quiméricas. A diferencia de la sonicación, las mutaciones en estas lecturas quiméricas se introducen antes de la amplificación por PCR en su mayoría.

¿Cómo se comparan los métodos de fragmentación del ADN?

Para esta comparativa nos vamos a centrar en la fragmentación para la preparación de bibliotecas en Hybrid-capture Sequencing, técnica muy utilizada para la secuenciación de exoma, genotipado, descubrimiento de nuevos genes, InDels y detección de SNPs poco frecuentes.

Las diferentes comparativas realizadas han encontrado una cantidad significativamente mayor de artefactos como SNVs, inserciones y deleciones en bibliotecas preparadas mediante fragmentación enzimática, lo que sugiera que, si bien esta ofrece conveniencia y escalabilidad, introduce más errores de secuenciación que afecta directamente a la identificación precisa de variantes.

Como se ha comentado anteriormente, los artefactos involucrados principalmente son lecturas quiméricas que contienen secuencias repetidas invertidas (IVS) cis y trans para el caso de la fragmentación por sonicación y las lecturas de artefactos quiméricos con secuencias palindrómicas con bases no coincidentes para el caso de la fragmentación enzimática.

Otro factor son los tiempos donde ocurre la mutación, ya que se observó una distinción bastante interesante en los tiempos de introducción de las mutaciones. En la fragmentación por sonicación, las mutaciones parecen surgir durante la PCR, mientras que, en la enzimática, se incorporarían antes de la amplificación por PCR, durante los pasos de reparación final y de formación de los A-tailing, lo que sugiere que cada método de fragmentación influye en la etapa en la que se introducen los errores.

En conclusión ¿qué necesito tener en cuenta a la hora de elegir un método u otro?

Las herramientas bioinformáticas ayudan a mitigar estos errores como algoritmos que identifican y filtran posibles variantes de artefactos en función de la presencia de IVS y PS en el genoma de referencia. Estos algoritmos reducen significativamente la cantidad de variantes que darían faltos positivos en los resultados tanto en los conjuntos de datos de sonicación como en los de fragmentación enzimática y por extensión asegurarían la precisión en la identificación de las variantes en el flujo de trabajo de la NGS.

Aparte del filtrado bioinformático, la optimización de los parámetros de fragmentación puede ayudar a reducir esos errores, lo que enfatiza la importancia de los enfoques bioinformáticos para mitigar errores relacionados con la fragmentación. Un ejemplo sería la selección de los parámetros de sonicación de manera óptima para minimizar el potencial daño oxidativo que se generaría en el ADN. De forma similar, el uso de enzimas con un sesgo de secuencia mínimo podría reducir la tasa de error durante la fragmentación enzimática.

Por lo tanto, la elección del método de fragmentación adecuado requeriría de una consideración cuidadosa de la aplicación específica y el potencial de la tasa de error en un proyecto de secuenciación. Comprender las características y mecanismos de estos errores es crucial para la interpretación precisa de los datos y para la toma de decisiones informadas a partir del análisis de estos.

Suscríbete a nuestra newsletter para conocer en profundidad nuestras áreas de especialización

    Newsletter Newsletter Newsletter
    Newsletter Newsletter Newsletter