Prévia do material em texto
a formação tanto do meristema floral como das sépalas e das pétalas em Arabidopsis, assim como de seus parálogos CAULIFLOWER (CAL) e FRUTFULL (FUL). Esse caso exemplifica um dos problemas mais frequentes do uso de GO na classificação de genes: as bases de dados são insuficientes para diferenciar um gene de suas cópias (parálogos), uma vez que elas não diferem nem nos processos biológicos, nem no componente celular, nem na função molecular atribuída a cada um dos parálogos. 4.4 Classificação de sequências do genoma que não são genes Além do RNA mensageiro (mRNA), existem outras sequências curtas que são trans- critas do DNA nuclear, mas não resultam na produção de proteínas. Essas sequências curtas (de aproximadamente 22 nucleótidos) estão presentes em animais e plantas e são conhecidas comomicroRNAs (miRNA) que, recentemente, têm recebido grande atenção devido a que apresentam uma alta semelhança em sequência com alguns mRNA e pare- cem controlar sua expressão e função (LAGOS-QUINTANA et al. 2001; PASQUINELLI; RUVKUN, 2002; REINHART et al. 2002). Critérios relacionados com expressão e biogê- nese permitem diferenciar miRNAs de outras sequências curtas presentes no genoma e permitem reconhecer sequências identificadas experimentalmente como novos miRNAs (LAGOS-QUINTANA et al. 2001; REINHART et al. 2002; AMBROS et al. 2003). Contudo, apesar do esforço por categorizar diferentes tipos de sequências curtas, ainda não existe um consenso na diversidade dessas sequências no genoma e na variação de funções ou precursores que elas possam ter. Esse é, por exemplo, o caso dos siRNAs (small interference RNAs; AMBROS et al. 2003; XUE et al. 2005), sequências que também regulam a expressão de mRNA mas que, diferentemente dos miRNA, variam em seus precursores. Da mesma maneira, Seringhaus & Gerstein (2008) notam que: Pelo fato de a nomenclatura genética estar relacionada a genes discretos, pequenas regiões transcritas localizadas fora dos genes identificados são problemáticas. Elas às vezes acabam listadas em sequência de bancos de dados que exibem identificadores similares àqueles dos genes, o que pode ser fonte de confusão. Para complicar ainda mais as coisas, os experimentos de transcrição de não-genes demonstram que parte dessa atividade ocorre em pseudogenes, regiões do genoma há muito consideradas fósseis de genes passados. Em um sentido transcricional, genes mortos parecem vir à vida, com algumas pistas até indicando que eles podem ajudar a regular outros genes (2008, p. 468). É evidente que a dificuldade de classificar sequências de DNA que não constituem genes aplica-se também aos transposons (elementos transponíveis), regiões do genoma que podem se mover e se auto-replicar. Estas sequências podem ser muito abundantes em alguns genomas, podem replicar-se de forma diferente e produzem mutações no 552 genoma e nos genes, dependendo das regiões em que estão inseridas. Wicker et al. (2007) propuseram um sistema de classificação de transposons baseado nos mecanismos de transposição, na semelhança de sequências e nas relações estruturais entre transposons, que inclui em ordem hierárquica: classes, subclasses, ordens, superfamílias, famílias e subfamílias, com a intenção de torná-lo comparável à classificação de organismos. Segundo este sistema, existem transposons classe I, os quais precisam de um RNA intermediário para seu processo de transposição, e classe II, que podem mover-se em forma de DNA. As subclasses distinguem transposons cuja cópia reintegra-se no genoma daqueles que não se copiam e cuja sequência original é a que se movimenta. As ordens diferem segundo os mecanismos de inserção dos transposons. As superfamílias são diagnosticadas pela mesma estratégia de replicação, mas variam segundo a sequência interna no nível de aminoácidos (devido a que muitas vezes os transposons codificam para proteínas de transposição) e segundo as sequências que cercam o transposon após sua transposição. As famílias compartilham semelhança no nível de sequência de DNA. As subfamílias são definidas com base em relações de ancestralidade — descendência entre transposons dentro de ummesmo genoma—, e podemdistinguir entre populações de transposons que se movem de maneira autônoma e os que não. Na verdade, a designação de um transposon a uma família e a uma subfamília é problemática, como notamWicker et al.: A definição precisa de uma família é problemática porque grupos de ele- mentos transponíveis com características similares formam, às vezes, um continuum de sequências homólogas; elementos de uma extremidade do espectro têm pouca identidade na sequência de DNA em relação a [elementos na] outra extremidade... Definimos uma família como um grupo de elemen- tos transponíveis que têm similaridade com respeito à sequência de DNA nos domínios internos da sua região codificadora (quando presente) ou em sua região de repetição terminal. Por razões práticas, definimos a similaridade forte da sequência como 80%, ou mais, em pelo menos 80% da sequência alinhada (WICKER et al., 2007, p. 977). Wicker et al. reconhecem que o uso de uma porcentagem de semelhança para formar grupos de transposons corre o risco iminente de confundir semelhança com homologia: Uma classificação taxonômica para os elementos transponíveis requer, por- tanto, o prosseguimento das análises evolutivas e funcionais. No momento mesmo que tais análises pudessem ser feitas no interior de superfamílias, elas continuariam difíceis para níveis mais altos de classificação (classes e subclasses). Em outras palavras, a questão de uma origem comum de todas as classes, subclasses e superfamílias permanece aberta (WICKER et al., 2007, p. 981). 553 Traduções A classificação biológica: de espécies a genes Conceitos e classificação de genes Classificação de sequências do genoma que não são genes Difícil de classificar, difícil de nomear