Um guia para métodos e software de previsão de estruturas proteicas

Para exercer suas funções biológicas, as proteínas se dobram em uma ou mais conformações específicas, ditadas por interações não covalentes complexas e reversíveis. A determinação da estrutura de uma proteína pode ser alcançada por técnicas demoradas e relativamente caras, como cristalografia, espectroscopia de ressonância magnética nuclear e interferometria de polarização dupla. O software de bioinformática foi desenvolvido para calcular e prever estruturas de proteínas com base em suas seqüências de aminoácidos.

Uma recapitulação da estrutura da proteína

Como alternativa às técnicas experimentais, as ferramentas de análise e previsão da estrutura ajudam a prever a estrutura da proteína de acordo com suas seqüências de aminoácidos. A resolução da estrutura de uma determinada proteína é altamente importante na medicina (por exemplo, no design de medicamentos) e na biotecnologia (por exemplo, no design de novas enzimas). O campo da previsão de proteínas computacionais está, portanto, evoluindo constantemente, após o aumento do poder computacional das máquinas e o desenvolvimento de algoritmos inteligentes.

Existem quatro níveis de estrutura proteica (figura 1). Na previsão da estrutura proteica, a estrutura primária é usada para prever estruturas secundárias e terciárias.

Estruturas secundárias de proteínas são dobragem localizada dentro da cadeia polipeptídica que é estabilizada por ligações de hidrogênio. As estruturas proteicas secundárias mais comuns são hélices alfa e folhas beta.

A estrutura terciária é a forma final da proteína, uma vez que as diferentes estruturas secundárias se dobram em uma estrutura 3D. Essa forma final se forma e é mantida unida por meio de interação iônica, pontes de dissulfeto e forças de van de Waals.

Quatro níveis de estrutura proteica. Imagem de Khanacademy.org.

Métodos e software de previsão de estruturas proteicas

Um grande número de software de previsão de estrutura é desenvolvido para características e particularidades específicas de proteínas, como previsão de desordem, previsão de dinâmica, previsão de conservação de estrutura, etc. As abordagens incluem modelagem de homologia, segmentação de proteínas, métodos ab initio, previsão de estrutura secundária e hélice transmembranar e previsão de peptídeo sinal.

A escolha do método certo sempre começa usando a sequência primária da proteína desconhecida e pesquisando homólogos na base de dados de proteínas (figura 2).

Gráfico de tomada de decisão para o método de previsão de estrutura de proteínas.

Aqui estão alguns métodos detalhados para previsão da estrutura da proteína:

  • Ferramentas de previsão de estrutura secundária

Essas ferramentas prevêem estruturas secundárias locais baseadas apenas na sequência de aminoácidos da proteína. As estruturas previstas são então comparadas ao escore DSSP, que é calculado com base na estrutura cristalográfica da proteína (mais no escore DSSP aqui).

Os métodos de previsão para estrutura secundária dependem principalmente de bancos de dados de estruturas de proteínas conhecidas e métodos modernos de aprendizado de máquina, como redes neurais e máquinas de vetores de suporte.

Aqui estão algumas ótimas ferramentas para previsão de estrutura secundária.

  • Estrutura terciária

As ferramentas de previsão da estrutura terciária (ou 3-D) se enquadram em dois métodos principais: Ab initio e modelagem comparativa de proteínas.

Os métodos de previsão de estrutura de proteínas ab initio (ou de novo) tentam prever estruturas terciárias a partir de sequências com base em princípios gerais que governam a energética de dobramento de proteínas e / ou tendências estatísticas de características conformacionais que as estruturas nativas adquirem, sem o uso de modelos explícitos.

Toda a informação sobre a estrutura terciária de uma proteína é codificada em sua estrutura primária (ou seja, sua sequência de aminoácidos). No entanto, um número enorme deles pode ser previsto, dentre os quais apenas um possui a energia livre mínima e a estabilidade necessárias para ser dobrada adequadamente. A previsão da estrutura protéica ab initio, portanto, requer grande quantidade de poder computacional e tempo para resolver a conformação nativa de uma proteína e continua sendo um dos principais desafios da ciência moderna.

Os servidores mais populares incluem Robetta (usando o pacote de software Rosetta), SWISS-MODEL, PEPstr, QUARK. Navegue por uma lista exaustiva aqui.

Se uma proteína de estrutura terciária conhecida compartilhar pelo menos 30% de sua sequência com um homólogo potencial de estrutura indeterminada, métodos comparativos que cobrem a estrutura desconhecida putativa com a conhecida podem ser utilizados para prever a estrutura provável da desconhecida. A modelagem da homologia e o enfoque de proteínas são duas estratégias principais que usam informações anteriores sobre outras proteínas semelhantes para propor uma previsão de uma proteína desconhecida, com base em sua sequência.

O software de modelagem de homologia e de segmentação de proteínas inclui RaptorX, FoldX, HHpred, I-TASSER e muito mais.

Referências

Previsão da estrutura proteica de novo. Wikipedia.

Previsão da estrutura proteica. Wikipedia