
Fragmentação do ADN em NGS: o que preciso compreender e como afeta o meu projeto de sequenciação?
As metodologias de purificação de ácidos nucleicos constituem a base fundamental das técnicas de análise molecular em biomedicina. As amostras de partida são muito variadas, desde isolados celulares até amostras fixadas em formalina ou incluídas em parafina, e abrangem técnicas desde PCR de ponto final até sequenciação de alto rendimento. Assim, o impacto das diferentes técnicas de fragmentação do material genético pode aumentar a precisão, permitir o desenvolvimento de algoritmos de correção de erros, otimizar os produtos de PCR para sequenciação de amplicões, aumentar a especificidade nas sequências a fragmentar e melhorar o rendimento e a integridade na fragmentação. Em geral, procura-se melhorar a qualidade dos dados obtidos, tanto em técnicas de rotina como em metodologias avançadas, como por exemplo a deteção de genes de fusão, SNVs e SNPs.
Neste caso, vamos centrar-nos no impacto dos métodos de fragmentação do ADN em NGS, onde a construção das bibliotecas constitui um passo-chave para a análise e interpretação dos resultados.
Então, como afetam os métodos de fragmentação do ADN a identificação de variantes?
As diferentes técnicas de fragmentação do ADN podem introduzir erros de sequenciação únicos, o que pode comprometer a precisão na identificação de variantes.
A fragmentação por sonicação, que utiliza ondas ultrassónicas para cortar o ADN, é uma técnica amplamente utilizada devido à sua capacidade de produzir fragmentos com tamanhos uniformes. No entanto, a sonicação pode induzir danos oxidativos no ADN, sobretudo lesões que causam artefactos sob a forma de substituições. Um exemplo é a lesão oxidativa 8-oxo-G, que pode originar substituições como C:G>A:T e C:G>G:C, erros comuns em bibliotecas geradas por sonicação.
Além dos danos oxidativos, a sonicação também pode criar leituras quiméricas com sequências invertidas repetidas (IVS). Estas surgem quando fragmentos de ADN de cadeia simples com IVS da mesma molécula se emparelham durante a reparação dos extremos, levando à inclusão de sequências da cadeia oposta.
Por outro lado, a fragmentação enzimática utiliza endonucleases para digerir o ADN. É uma alternativa popular pela sua facilidade de uso, escalabilidade e pela perda mínima de ADN. Contudo, a fragmentação enzimática tende a introduzir mais SNVs e deleções do que a sonicação, associadas especialmente a sequências palindrómicas.
Importa referir que os tipos de artefactos variam consoante o protocolo específico de sonicação ou fragmentação enzimática utilizado.
Esses artefactos podem gerar chamadas de variantes que dificultam a análise subsequente e conduzem a interpretações erradas.
E que estratégias ajudam a mitigar esses erros?
O modelo PDSM (partial single strands derived from a similar molecule) sugere que o ADN bicatenário é fragmentado aleatoriamente por sonicação, criando moléculas parcialmente de cadeia simples que se podem emparelhar com sequências complementares noutros fragmentos da mesma molécula. Este emparelhamento dá origem a leituras quiméricas e à introdução de mutações durante a reparação dos extremos e a amplificação por PCR.
Este modelo também explicaria os erros na fragmentação enzimática. As endonucleases criam quebras no ADN, originando regiões de cadeia simples. Se estas contiverem sequências palindrómicas, podem emparelhar-se com sequências complementares da mesma molécula. A reparação dos extremos e a formação do chamado A-tailing podem introduzir mutações e leituras quiméricas. Ao contrário da sonicação, na fragmentação enzimática estas mutações ocorrem sobretudo antes da PCR.
Como se comparam os métodos de fragmentação do ADN?
Focamo-nos aqui na fragmentação para preparação de bibliotecas em Hybrid-capture Sequencing, uma técnica amplamente usada na sequenciação de exomas, genotipagem, descoberta de novos genes, deteção de InDels e SNPs raros.
Vários estudos comparativos observaram uma quantidade significativamente maior de artefactos como SNVs, inserções e deleções em bibliotecas preparadas com fragmentação enzimática. Isto sugere que, embora esta técnica seja prática e escalável, introduz mais erros de sequenciação, afetando diretamente a precisão na identificação de variantes.
Como já referimos, os principais artefactos são as leituras quiméricas com IVS (cis e trans) no caso da sonicação, e as leituras com sequências palindrómicas com bases não coincidentes no caso da fragmentação enzimática.
Outro fator importante é o momento em que ocorrem as mutações. Observou-se que na sonicação surgem sobretudo durante a PCR, enquanto na enzimática aparecem antes, durante a reparação final e a formação do A-tailing, o que indica que cada método influencia a etapa em que os erros são introduzidos.
Concluindo: o que devo ter em conta ao escolher um método?
As ferramentas bioinformáticas ajudam a mitigar estes erros através de algoritmos que identificam e filtram variantes de artefactos com base na presença de IVS e PS no genoma de referência. Estes algoritmos reduzem significativamente os falsos positivos tanto em bibliotecas por sonicação como enzimáticas, garantindo assim a precisão na identificação de variantes nos fluxos de trabalho em NGS.
Além disso, a otimização dos parâmetros de fragmentação pode ajudar a reduzir erros. Por exemplo, escolher cuidadosamente os parâmetros de sonicação pode minimizar os danos oxidativos no ADN. De igual forma, o uso de enzimas com baixo viés de sequência pode reduzir a taxa de erro na fragmentação enzimática.
Assim, a escolha do método de fragmentação adequado requer uma análise cuidadosa da aplicação específica e da taxa de erro potencial. Compreender os mecanismos e características destes erros é fundamental para interpretar corretamente os dados e tomar decisões informadas a partir dos resultados da análise.