24 de setembro de 2013

Sobre como o código genético corrobora o darwinismo

Hoje mesmo me peguei dizendo aos alunos que o código genético é simplesmente uma das maiores provas descobertas nos últimos sessenta anos (ele foi descoberto na década de 1960) que corrobora, de maneira nítida e elegante, a evolução darwiniana — principalmente quando operada em seu nível mais fundamental possível, ou seja, o nível molecular.

O DNA e as proteínas

Muitas vezes usamos a expressão código genético como sinônima do "conjunto completo de DNA de uma célula", ou seja, como sinonímia do genoma de um organismo. Tecnicamente falando, entretanto, quando os geneticistas dizem "código genético" eles não estão falando desse conteúdo de DNA presente em cada uma das células dos organismos vivos.

De fato o código genético consiste num código molecular para a passagem da informação contida em moléculas de ácidos nucléicos (DNA/RNA) para a informação contida em moléculas de proteínas. Para simplificar a história, voltemos um pouco na teoria da herança. Sabemos que nossas células conteem 46 moléculas de DNA, que consistem em grandes fitas chamadas cromossomos. Cada uma de nossas células contêm 46 cromossomos, 23 herdados do nosso pai e 23 herdados da nossa mãe. Acontece que o DNA é considerado hoje como um livro guardado na estante (ou como uma receita de bolo), ele contém uma grande quantidade de informação mas ele é considerado quimicamente inerte, ou seja, ele não age efetivamente no ambiente intracelular. As quatro bases químicas que o formam: A, C, G e T têm estrutura química bastante similar e não permitem a realização das complexas interações químicas que regem o metabolismo celular. (Esse argumento, inclusive, foi usado muitas vezes -- antes de Watson e Crick -- para argumentar que o DNA não poderia ser a molécula da hereditariedade. Mostrou-se posteriormente que justamente essa "chatice química" é que faz do DNA uma molécula estável para armazenar a importante informação genética.)

Hoje sabe-se que o DNA, embora quimicamente inerte, contém informação necessária e suficiente para dirigir a síntese de outras moléculas quimicamente ativas, principalmente as proteínas. Assim, para que uma célula tenha metabolismo e seja capaz de transformar elementos químicos quebrando-os e reconstruindo-os através das vias catabólicas e anabólicas, é preciso que a informação contida em seu DNA -- e formada por fitas cromossômicas contendo milhões de pares de base A, C, G e T dispostos em linha -- seja transformada em moléculas de proteínas. O DNA, portanto, tem duas principais funções, a saber: (i) possuir o código da hereditariedade e (ii) conter a informação para a produção de proteínas. A função (i) tem a ver com a evolução e com o fato de que os filhos se parecem com os pais, ela é estudada principalmente pela disciplina de genética. Já a função (ii) está relacionada a como o código presente no DNA orquestra o metabolismo de uma célula, e é academicamente estudada principalmente nas disciplinas de biologia molecular e bioquímica.

Estímulos ambientais estimulam o metabolismo celular a recrutar proteínas que se liguem ao DNA e realizem a transcrição de determinados pedaços de sua molécula. A transcrição consiste no processo em que o DNA forma o que chamamos o RNA mensageiro (para mais informações, clique aqui). Esse RNA mensageiro contém a informação do gene, que agora sai do núcleo (morada segura do DNA) e vai para o citoplasma ser traduzido em proteínas. O fluxo de informação do DNA até as proteínas é conhecido como o dogma central da biologia molecular. Ele foi proposto por Watson e Crick algum tempo depois da descoberta da estrutura do DNA em dupla hélice (1953).

O dogma central da biologia molecular indica como a informação do DNA, que é quimicamente inerte, se transforma em informação protéica. As moléculas de proteínas são as principais responsáveis pelo controle do metabolismo celular e, portanto, da vida, em seu nível mais molecular. [1]

As proteínas são moléculas poliméricas formadas por 20 diferentes tipos de monômeros, chamados de aminoácidos. Um polímero pode ser considerado como um colar de pérolas, onde cada pérola é o monômero do polímero-colar. O DNA é um polímero cujos monômeros (pérolas) são os nucleotídeos A, C, G e T. Um pequeno "colar de DNA" poderia ser formado pelo seguinte conjunto de nucleotídeos: ACTCGGACATTTTACAGACACACGGAC.

Já as proteínas são polímeros cujos monômeros são 20 aminoácidos, a saber: (i) Alanina, (ii) Cisteína, (iii) Ácido Aspártico, (iv) Ácido Glutâmico, (v) Fenilalanina, (vi) Glicina, (vii) Histina, (viii) Isoleucina, (ix) Lisina, (x) Leucina, (xi) Metionina, (xii) Asparagina, (xii) Prolina, (xiv) Glutamina, (xv) Arginina, (xvi) Serina, (xvii) Treonina, (xviii) Valina, (xix) Tirosina, (xx) Triptofano. Assim, podemos considerar que o DNA pode ser descrito em um alfabeto de quatro letras (ACTG), enquanto as proteínas são descritas por alfabetos de 20 letras (ACDEFGHIKLMNPQRSTVYW).

Ao contrário dos nucleotídeos, que são quimicamente inertes, cada aminoácido tem propriedades químicas bem diferentes, sendo que alguns são carregados positivamente, outros são carregados negativamente, outros são hidrofóbicos e outros apolares. A grande diversidade química dos aminoácidos é o que permite que as proteínas tenham diferentes papéis no metabolismo celular, algumas sendo responsáveis por ligar moléculas em meio aquoso, outras funcionando como poros de passagem pela membrana plasmática, outras viajando pelo sangue até outros tecidos e funcionando como hormônios. Enfim, a junção dessas 20 "pérolas" aminoacídicas para formar os colares protéicos permite que as proteínas tenham uma incrível diversidade química e que possam ligar diferentes moléculas que interagem com nosso organismo. E, como se não bastasse a diversidade química, esses colares de proteínas também são capazes de se enrolar no espaço e formar estruturas tridimensionais altamente complexas, que influenciam de sobremaneira a forma de funcionamento de nosso metabolismo celular ao se encaixar em metabólitos e catalisar suas transformações, gerando assim o metabolismo celular.

Fórmulas químicas dos 20 aminoácidos que constituem as proteínas. Divididos em classes químicas, os aminoácidos podem ser carregados positivamente ou negativamente, podem ser ainda polares sem carga ou apolares. Essa diversidade química torna as proteínas (polímeros contendo entre 30-1000 aminoácidos, normalmente) moléculas altamente reativas. Além da diversidade química, as proteínas possuem também diversidade estrutural, dada pela conformação tridimensional dos aminoácidos no espaço. Figura obtida neste site.

Embora moléculas como os ácidos nucléicos, os lipídeos (gorduras) e os açúcares (carboidratos) sejam altamente importantes para o metabolismo celular e para a comunicação entre diferentes tecidos de um organismo, os biólogos moleculares acreditam que as principais moléculas que controlam e comandam o funcionamento de uma célula são mesmo as proteínas. E é o DNA que tem o código para a formação dessas proteínas. 

O código genético

Finalmente o código genético foi talvez a principal descoberta feita após Watson & Crick terem descoberto a estrutura de dupla-hélice do DNA; a compreensão deste código permitiu compreender como um vocabulário químico composto por 4 "letras" (nucleotídeos) de DNA é capaz de se transformar em vocabulário composto de 20 "letras" (aminoácidos) de proteínas. Ou seja, como transformar a informação estável responsável pela hereditariedade em uma informação plástica e quimicamente ativa que forma e dá vida ao metabolismo celular na forma de moléculas de proteínas.

A comparação do DNA e da proteína com letras e palavras não é meramente descrita aqui a título de simplificação ou analogia; DNA e proteínas têm, assim como as linguagens, sintáticas e semânticas que podem ser apreendidos de sua observação e análise cuidadosa. Nisso se baseiam muitos dos trabalhos em genômica atualmente.

Vale notar que a história da descoberta do código genético é um tópico bastante interessante que prometo voltar aqui para contar. O que importa nesse caso é que, quando falamos de código genético, estamos falando no mecanismos de transformação de uma molécula de ácido nucléico em uma molécula de proteína. A origem do mecanismo altamente complexo de tradução ainda é um mistério (é isso mesmo, o processo é chamado de tradução e funciona de forma análoga à tradução entre idiomas), mas experimentalmente os pesquisadores foram capazes de descobrir que para cada três letras contíguas presentes na região codificante de um gene, a célula é capaz de produzir um aminoácido específico. Veja o desenho da tabela do código genético abaixo:

A tabela do código genético. Embora a palavra código genético seja confundida normalmente com o conteúdo genético ou genoma de um organismo ou espécie, para os geneticistas o código genético consiste nesta tabela, ou seja, no código através do qual uma trinca de nucleotídeos de DNA é transformada em um aminoácido que fará parte de uma proteína.

A tabela acima já foi comprovada experimentalmente em uma diversidade de organismos e representa a tradução codificada entre a linguagem química do DNA e a linguagem química das proteínas. A fabricação das proteínas frequentemente se inicia pela trinca (códon) ATG (ou AUG), que codifica o aminoácido Metionina (Met). E assim, as letras do DNA (transformadas no intermediário RNA mensageiro) se seguem permitindo que possamos fazer a tradução de uma informação na linguagem-do-DNA para uma informação na linguagem-das-proteínas. Uma sequência como ATG-CCT-CCA-GGT-CAG-GGA-GTC-TGA no DNA será transformada na célula -- pelo mecanismo conhecido como Tradução -- em uma proteína com os aminoácidos Metionina-Prolina-Prolina-Glicina-Glutamina-Glicina-Valina (que pode ser descrita também como Met-Pro-Pro-Gli-Gln-Gli-Val, ou ainda, mais resumidamente, como MPPGQPV). O último códon TGA (ou UGA) representa o sinal de término da síntese de proteínas, onde o DNA sinaliza à célula que ela não deve continuar traduzindo-o e que o código para aquela proteína está pronta para ser liberada e funcionar no citoplasma.

Como e por que o código genético está de acordo com o darwinismo?

Dada a enorme diversidade de organismos existentes na Terra, seria possível pensar que cada organismo diferente pudesse usar um código genético diferente para produzir suas proteínas. É teoricamente possível pensar em códigos genéticos alternativos, onde a atribuição trinca-aminoácido fosse diferente desta mostrada na figura acima.

Por sinal, o próprio Francis Crick chegou a propor um outro código genético que faria essa atribuição entre nucleotídeos do DNA e aminoácidos nas proteínas. E embora o código não-pontuado de Crick fosse belo e elegante, ele não foi observado em nenhum organismo. E o desenvolvimento da ciência exige sempre a confirmação experimental para provar o que se deseja.

Os biólogos moleculares já investigaram milhares de organismos vivos, desde as mais antigas bactérias, passando por bichos existentes no mar, na água doce, debaixo da terra, do alto das montanhas, investigaram os peixes, os anfíbios, os répteis, as plantas, as algas, os fungos, os primatas, os marsupiais, as cianobactérias, as arqueobactérias e, enfim, todos os organismos conhecidos. Em nenhum desses organismos o código genético se mostrou muito diferente deste que conhecemos e que está representado na tabela/figura acima. Apenas alguns organismos têm um ou outro códon (trinca de nucleotídeos) que faz uma atribuição diferente, e esses consistem justamente na exceção que comprova a regra. [2]

O fato de que todos os organismos vivos possuem o mesmo código genético -- ou pelo menos um código genético bastante parecido -- é considerada pelos cientistas uma evidência clara de dois fatos: (i) todos os organismos viventes são descendentes de poucos organismos que viveram no passado e (ii) o surgimento do código genético e do mecanismo de tradução trouxe uma enorme vantagem evolutiva para os organismos que eram capaz de utilizá-lo.

O fato (i) consiste na principal das sub-teorias de Darwin, que é a chamada ancestralidade comum. Charles Darwin foi o primeiro indivíduo a dizer que todos os organismos da Terra possuem um ancestral comum que viveu no passado e foi se diferenciando nas espécies viventes. Darwin não viveu o suficiente para ver a corroboração molecular de suas ideias, mas certamente teria achado brilhante perceber como toda a vida que conhecemos em nosso planeta apresenta este mesmo código básico para a fabricação de proteínas. Se os organismos não descendessem de um mesmo ancestral, eles poderiam ter códigos completamente diferentes e poderiam fazer suas proteínas de forma totalmente diversa e criativa. Eles poderiam até ter algum tipo de metabolismo que não fosse baseado principalmente na interação de proteínas com metabólitos e entre si. Mas esse tipo de organismo jamais foi visto e acreditamos que não exista, ao menos na Terra. Portanto, o fato de que todos os organismos vivos possuem o mesmo código genético é uma das mais fortes evidências da ancestralidade comum entre eles e foi uma das principais corroborações do darwinismo feita na segunda metade do século XX, pouco mais de um século depois da publicação original da obra "A origem das espécies", em 1859.

Foquemos agora no ponto (ii) apresentado acima, que diz que o primeiro organismo no qual o código genético surgiu (e, por conseguinte, o mecanismo de tradução) teve uma enorme vantagem adaptativa com relação aos outros organismos que viviam em seu tempo. Não quero aqui me estender na discussão de como eram os organismos num mundo onde o código genético não existia. Caso eu fizesse isso, estaria voltando ao tema da origem da vida, tema altamente polêmico que pode gerar uma obra inteira apenas de discussões acaloradas sobre detalhes interessantes. Quero aqui apenas mostrar que à época em que o código genético surgiu, deveriam existir vários tipos de proto-células que eram capazes de produzir proteínas a partir de DNA de uma forma bastante ineficiente. Embora o surgimento do complexo mecanismo de tradução (e do código genético) tenha proporcionado um grande efeito adaptativo ainda hoje inexplicável. Uma vez que esse mecanismo de tradução surgiu, os organismos que eram capazes de usar esse código venceram a guerra evolutiva contra outros organismos que coexistiam consigo na mesma época. E a prova disso é a mesma que usamos em (i): não há nenhum outro organismo que seja capaz de fazer proteínas de forma diferente desta que usa o mecanismo de tradução e onde trincas de DNA são traduzidas em aminoácidos de acordo com o código genético da figura. Se houvesse outra forma eficiente de produzir proteínas por organismos vivos, seríamos capazes de ver algum animal ou planta ou fungo qualquer que utilizasse mecanismo alternativo, o que não acontece. Segundo meu amigo e parceiro intelectual, o prof. Sávio Farias, o mecanismo de tradução foi um dos aglutinadores principais para a origem da vida. Assim, o primeiro indivíduo que foi capaz de fazer proteínas segundo um proto-código parecido com este que temos hoje, subjugou todos os seus concorrentes na corrida evolutiva e o que vemos hoje, em toda a diversidade da vida em nosso planeta, são os descendentes desse organismo antigo que foi capaz de usar sequências-código de três letras químicas de ácidos nucléicos para produzir uma letra química de proteína.

O genoma humano consiste no conjunto de todos os genes que o ser humano possui, e também as regiões não-gênicas. Embora apenas 1% do nosso genoma seja responsável por fazer o que chamamos de genes-codificadores-de-proteínas, essas regiões são hoje consideradas como as mais importantes do nosso genoma. Estimativas recentes falam que o ser humano tem algo em torno de 30 mil genes codificadores de proteínas e são principalmente essas interações entre essas proteínas dentro de nossas células que fazem nosso corpo funcionar coordenadamente de uma forma altamente complexa e maravilhosa. O mesmo vale para grande parte dos outros organismos vivos que, também possuindo dezenas de milhares de genes em seus genomas, são capazes de transformar esses genes em proteínas através do mecanismo de tradução que realiza a leitura do código genético e permite a existência do metabolismo celular. Este incrível e maravilhoso código que, estando presente de forma praticamente inalterada em todos os organismos vivos, consiste em uma das maiores provas de que o darwinismo realmente não é apenas suposição ou teoria: é fato consumado.

==


[1] Outra predisposição necessária e importante da "teoria do dogma central" é que uma vez que a informação do DNA é escrita na forma de proteínas, ela não mais retorna -- nunca -- a ser DNA. Esse fato também foi interpretado como a refutação definitiva da teoria lamarckiana da herança dos caracteres adquiridos. Se o que acontece com as proteínas jamais volta a ser DNA, então não há como nada que aconteça na vida de um organismo causar impressões em seu material genético, material este que será passado para o seu filho. Vale notar que hoje em dia há evidências de que algumas características mais sutis podem ser re-impressas no DNA, na forma de modificações nas bases C, que podem estar metiladas, ou na estrutura das proteínas que envolvem o DNA (cromatina) -- ver postagem sobre epigenética.
[2] Anotações para o próprio autor, quando quiser publicar efetivamente este texto em livro: dar exemplos de códigos genéticos alternativos, como o da mitocôndria, explicando as diferenças. Explicar também sobre como evoluíram as atribuições códons-aminoácidos de acordo com a teoria do Sávio/Romeu.

==

Artigo publicado originalmente em Nov 2010: http://tragodefilosofia.blogspot.com.br/2010/11/sobre-como-o-codigo-genetico-corrobora.html

Aviso

Todo o conteúdo publicado no texto acima é de responsabilidade do seu autor.

Sobre o autor Francisco Prosdocimi

Francisco Prosdocimi Biólogo, Mestre em Genética, Doutor em Bioinformática. Trabalha com montagem e anotação de genomas animais, genômica e transcriptômica comparativa, filogenômica e genética de ...