Prévia do material em texto
UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE INSTITUTO METRÓPOLE DIGITAL PROGRAMA DE PÓS-GRADUAÇÃO EM BIOINFORMÁTICA MESTRADO ACADÊMICO EM BIOINFORMÁTICA HELMUT KENNEDY AZEVEDO DO PATROCÍNIO INVESTIGAÇÃO IN SILICO DE PEPTÍDEOS DE PROTEÍNAS DO SISTEMA NERVOSO COMO CANDIDATOS DE MIMETISMO MOLECULAR NA SÍNDROME DE GUILLAIN-BARRÉ E NA ESCLEROSE MÚLTIPLA DESENCADEADAS PELO VÍRUS EPSTEIN-BARR Natal Outubro, 2023 Helmut Kennedy Azevedo do Patrocínio Investigação In silico de peptídeos de proteínas do sistema nervoso como candidatos de mimetismo molecular na síndrome de Guillain-Barré e na esclerose múltipla desencadeadas pelo vírus Epstein-Barr Dissertação de mestrado apresentada ao Programa de Pós-Graduação em Bioinformática da Universidade Federal do Rio Grande do Norte como requisito parcial para a obtenção do grau de Mestre em Bioinformática. Linha de pesquisa: Desenvolvimento de Produtos e Processos Orientador: Prof. Dr. João Paulo Matos Santos Lima Natal Outubro, 2023 Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Central Zila Mamede Patrocínio, Helmut Kennedy Azevedo do. Investigação in silico de peptídeos de proteínas do sistema nervoso como candidatos de mimetismo molecular na síndrome de Guillain-Barré e na esclerose múltipla desencadeadas pelo vírus Epstein-Barr / Helmut Kennedy Azevedo do Patrocínio. - 2023. 71 f.: il. Dissertação (mestrado) - Universidade Federal do Rio Grande do Norte, Instituto Metrópole Digital, Pós-Graduação em Bioinformática. Natal, RN, 2023. Orientação: Prof. Dr. João Paulo Matos Santos Lima. 1. Síndrome de Guillain-Barré - Dissertação. 2. Mimetismo Molecular - Dissertação. 3. Reação Cruzada - Dissertação. 4. Interação pMHC-TCR - Dissertação. 5. Esclerose Múltipla - Dissertação. I. Lima, João Paulo Matos Santos. II. Título. RN/UF/BCZM CDU 616.833-002(043.3) Elaborado por Fernanda de Medeiros Ferreira Aquino - CRB-15/301 Helmut Kennedy Azevedo do Patrocínio Investigação In silico de peptídeos de proteínas do sistema nervoso como candidatos de mimetismo molecular na síndrome de Guillain-Barré e na esclerose múltipla desencadeadas pelo vírus Epstein-Barr Defesa de mestrado apresentada ao Programa de Pós-Graduação em Bioinformática da Universidade Federal do Rio Grande do Norte Área de concentração: Bioinformática Linha de pesquisa: Desenvolvimento de Produtos e Processos Orientador: Prof. Dr. João Paulo Matos Santos Lima Natal, 2023 BANCA EXAMINADORA _________________________________________ Prof. Dr. João Paulo Matos Santos Lima Centro Multiusuário de Bioinformática – IMD/UFRN _________________________________________ Profa. Dra. Ândrea Kelly Ribeiro dos Santos Instituto de Ciências Biológicas - UFPA _________________________________________ Prof. Dr. João Firmino Rodrigues Neto Escola Multicampi de Ciências Médicas do Rio Grande do Norte - UFRN _________________________________________ Dra. Jéssika de Oliveira Viana Pós-doc no Instituto Nacional de Ciências e Tecnologia em Ciências Moleculares (INCT-CiMOL) AGRADECIMENTOS Agradeço primeiramente aos meus pais, Ezivaldo do Patrocínio e Maria Aparecida Azevedo do Patrocínio, por me oferecem todo o amor e cuidado que foram tão importantes para me ajudar a finalizar mais essa importante etapa da minha vida. Também agradeço às minhas irmãs Marianne e Gracianne e aos meus amigos Heriberto (Betinho) e Róbson por estarem me apoiando e torcendo por mim. Agradeço a todos os amigos e pessoas incríveis que conheci desde o início da graduação até o final do mestrado, por me apresentarem a novos conhecimentos, experiências e vivências que moldaram a pessoa que sou hoje. Agradeço aos amigos da EMCM por terem sido companhia e conforto nessa jornada de iniciar uma nova graduação enquanto se finaliza o mestrado. Agradeço ao professor Dr. João Paulo, por ter aceitado me orientar e ajudar no desenvolvimento do pensamento crítico e científico tão necessário para a elaboração deste trabalho e para a vida. Um agradecimento especial à Tayná, por ter me ajudado tanto. Não posso deixar de agradecer a Themístocles (Themi), por ter orientado quando dei os primeiros passos na bioinformática. Agradeço aos membros da banca por dedicarem algum tempo de suas vidas a avaliar este trabalho e me auxiliar nesse processo de final do mestrado. Agradeço a todos os professores e professoras do Programa de Pós- Graduação em Bioinformática por oferecerem um pouco de seus conhecimentos aos alunos. O presente trabalho foi realizado com apoio da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior – Brasil (CAPES) – Código de Financiamento 001. RESUMO A Síndrome de Guillain-Barré (SGB) e a esclerose múltipla são doenças autoimunes associadas a resposta imunológica contra autoantígenos do sistema nervoso periférico (SNP) e central, respectivamente. A maioria dos estudos sobre a imunopatologia da SGB investigam a reação cruzada entre antígenos de gangliosídeos da bainha de mielina e carboidratos da bactéria Campylobacter jejuni. Entretanto, a SGB apresenta um espectro de subtipos e, particularmente, a forma desmielinizante possui poucas evidências de relação com C. jejuni ou de autoimunidade contra gangliosídeos. Já a imunopatologia da esclerose múltipla é mais conhecida e diversos autoantígenos proteicos foram relatados. Como o vírus Epstein- Barr (EBV) pode representar um fator de risco potencial tanto para a esclerose múltipla quanto para a forma desmielinizante da SGB, a presente investigação visa identificar resíduos cruciais entre potenciais epítopos de linfócitos T CD4+ do EBV e proteínas do sistema nervoso como um meio de sugerir como a infecção por este vírus pode contribuir para a patogênese de doenças. Bancos de dados biológicos foram usados para a seleção de proteínas abundantes no sistema nervoso, proteínas imunogênicas do EBV e haplótipos de HLA. Também foram utilizadas ferramentas computacionais para predição de peptídeos ligantes do HLA e de imunogenicidade. Um algoritmo em linguagem Python foi desenvolvido para comparação de identidade entre os resíduos dos nonâmeros. Foram encontradas 10 proteínas do sistema nervoso e 28 do EBV, as quais foram usadas na predição de peptídeos ligantes de 21 HLAs comuns na população mundial. Foram localizados ao todo 1411 haplótipos, os quais se distribuem entre 51 pares de HLAs. Os nonâmeros das proteínas do EBV e proteínas da mielina foram combinados em pares e comparados quanto a identidade em resíduos críticos para a interação com o receptor de células T (TCR). Para tal comparação foram propostos três critérios de seleção de acordo com a relevância de cada contato para interação TCR-peptídeo-MHC. O contato principal deve estar localizado na posição P5, enquanto as posições P2, P3 e P8 são secundárias e P4, P6 e P7 são terciárias. A proteína Periaxina, que nunca foi estudada como fonte de autoantígenos, apresentou a maior quantidade de pares de nonâmeros entre as proteínas do SNP, 35. Quatro pares de nonâmeros de APLP1, dois de CNP e dois da MBP ligam-se a alelos do haplótipo DR-15, conhecido como fator de risco para a esclerose múltipla. A nova abordagem aqui proposta baseada na identidade de sequência em resíduos críticos de contato do TCR revelou que vários peptídeos derivados de proteínas do sistema nervoso e do EBV compartilham identidade nesses resíduos, sugerindo a possibilidade de reatividade cruzada entre eles. Os pares de nonâmeros aqui encontrados podem subsidiar a investigação de autoantígenos em experimentos laboratoriais.Palavras chave: Síndrome de Guillain-Barré. Mimetismo Molecular. Reação Cruzada. Interação pMHC-TCR. Esclerose múltipla. ABSTRACT Guillain-Barré Syndrome (SBG) and multiple sclerosis are autoimmune diseases associated with an immune response against peripheral (PNS) and central nervous system autoantigens, respectively. Most studies on the immunopathology of SBG investigate the cross-reaction between myelin sheath ganglioside antigens and carbohydrates from the bacteria Campylobacter jejuni. However, SBG has a spectrum of subtypes, and, particularly, the demyelinating form has little evidence of a relationship with C. jejuni or of autoimmunity against gangliosides. The immunopathology of multiple sclerosis is better known, and several autoantigens are known. As the Epstein-Barr virus (EBV) may represent a potential risk factor for both multiple sclerosis and the demyelinating form of SBG, the present investigation aims to identify crucial residues among potential EBV CD4+ T lymphocyte epitopes and nervous system proteins as a means of suggesting how infection by this virus may contribute to the pathogenesis of disease. We utilized biological databases to select proteins abundant in the nervous system, EBV immunogenic proteins, and HLA haplotypes. Computational tools were employed for predicting HLA-binding peptides and immunogenicity. Additionally, we developed a Python algorithm to compare residue identity among nonamers. We found 10 proteins from the nervous system and 28 from EBV, which were used to predict the binding peptides of 21 common HLAs in the world population. We located 1411 haplotypes distributed among 51 pairs of HLAs. Simulations were performed to determine whether nonamers from the EBV and nervous system proteins targeted TCR-contact residues. Three selection criteria were proposed according to the relevance of each contact for TCR-peptide-MHC interaction. The main contact must be located in position P5, while positions P2, P3 and P8 are secondary and P4, P6 and P7 are tertiary. Nonamers of EBV proteins and myelin proteins were combined in pairs and compared based on predefined selection criteria. The Periaxin protein, which has never been studied as a source of autoantigens, has the highest number of nonamer clusters among PNS proteins, with 35 pairs. Four clusters of nonamers from APLP1, two from CNP, and two from MBP bind to alleles of the haplotype DR-15, known as a risk factor for multiple sclerosis. The new approach proposed here, based on sequence identity at critical contact residues of the TCR, has revealed that several peptides derived from nervous system and EBV proteins share identical residues at these critical contact points. This suggests the possibility of cross- reactivity between them. The nonamer pairs discovered in this study have the potential to support further investigations into autoantigens through laboratory experiments. Keywords: Guillain-Barré syndrome. Molecular Mimicry. Cross-reactivity. pMHC-TCR interaction. Multiple sclerosis. LISTA DE TABELAS Tabela 1 - Proteínas do sistema nervoso selecionadas para a predição de ligantes de HLA .......................................................................................................................32-33 Tabela 2 – Proteínas imunogênicas do EBV selecionadas para a predição de ligantes de HLA........................................................................................................................35 Tabela 3 - Peptídeos de proteínas do sistema nervoso classificados como imunogênicos.............................................................................................................38 LISTA DE FIGURAS Figura 1 - Representação da interação HLA-peptídeo...............................................21 Figura 2 - Representação do receptor de células T................................................... 22 Figura 3 - Estrutura do complexo MHCII-peptídeo-TCR.............................................23 Figura 4 - Esquema ilustrando o fluxo de trabalho da metodologia para identificar a identidade cruzada entre peptídeos............................................................................26 Figura 5 - Filtros utilizados para a busca de antígenos de EBV no IEDB.....................29 Figura 6 - Haplótipos de HLAs selecionados para a predição de peptídeos..............34 Figura 7 - Quantidade de ligantes preditos pelos servidores NetMHCII e NetMHCIIPan e por ambos, para cada proteína do sistema nervoso e proteínas do EBV..................36 Figura 8 - Gráficos UpSet da análise de identidade entre nonâmeros das proteínas do sistema nervoso e do EBV..........................................................................................37 LISTA DE ABREVIATURAS E SIGLAS SGB - Síndrome de Guillain-Barré SNP - Sistema Nervoso Periférico AIDP - Acute Inflammatory Demyelinating Polyradiculoneuropathy, Polirradiculoneuropatia desmielinizante inflamatória aguda AMAN - Acute Motor Axonal Neuropathy, Neuropatia Axonal Motora Aguda AMSAN - Acute motor and sensory axonal neuropathy, Neuropatia axonal motora e sensorial aguda MFS - Miller Fisher syndrome, Síndrome de Miller Fisher Th - T helper, T auxiliar MHC - Major Histocompatibility Complex, Complexo de Histocompatibilidade Principal TCR - T-Cell Receptor, receptor de células T CDR - Complementary-determinant region, região determinante de complementariedade EBV - Epstein-Barr vírus SNC - Sistema Nervoso Central HLA - Human Leukocyte Antigen, Antígeno Leucocitário Humano IEDB - Immune Epitope Database AFND - Allele Frequency Net Database APC - Antigen Presenting Cells, Células Apresentadoras de antígenos SUMÁRIO 1 INTRODUÇÃO E JUSTIFICATIVA ......................................................................... 13 1.1 Doenças autoimunes ....................................................................................... 13 1.2 Síndrome de Guillain-Barré ............................................................................. 14 1.3 Esclerose múltipla ........................................................................................... 17 1.4 Apresentação de antígenos a linfócitos T auxiliares ....................................... 21 1.5 Justificativa e relevância do trabalho .............................................................. 24 2 OBJETIVOS ........................................................................................................... 26 2.1 Objetivo Geral ................................................................................................. 26 2.2 Objetivos Específicos ...................................................................................... 26 3 MÉTODOS ........................................................................................................... 27 3.1 Seleção de proteínas do SNP e do SNC......................................................... 28 3.2 HLAs mais comuns na população global e busca por haplótipos ................... 29 3.3 Seleção de proteínas imunogênicas do vírus Epstein-Barr ............................. 29 3.4 Predição de peptídeos em proteínas do EBV e do sistema nervoso com potencial de se ligar às moléculas de HLA ........................................................... 30 3.5 Análise de identidade entre os nonâmeros de peptídeos dos vírus EBV e de epítopos das proteínas do sistema nervoso. ......................................................... 30 3.6 Predição de imunogenicidade de células T CD4 ............................................. 32 3.7 Processamento de dados................................................................................ 32 4 RESULTADOS ....................................................................................................... 33 4.1 Busca de proteínas do sistema nervoso .........................................................33 4.2 Busca de haplótipos e seleção de alelos de HLA ........................................... 33 4.3 Busca de proteínas imunogênicas do EBV ..................................................... 34 4.4 Predição de peptídeos ligantes de moléculas de HLA .................................... 36 4.5 Análise de identidade entre nonâmeros do EBV e nonâmeros de proteínas do sistema nervoso e predição de imunogenicidade. ................................................ 38 Amyloid Beta Precursor Like Protein 1 (APLP1) ...................................... 40 2',3'-Cyclic Nucleotide 3' Phosphodiesterase (CNP) ................................ 40 Hepatic And Glial Cell Adhesion Molecule (GlialCam) ............................. 40 Myelin Associated Glycoprotein (MAG) ................................................... 41 Myelin Basic Protein (MBP) ..................................................................... 41 Myelin Associated Oligodendrocyte Basic Protein (MOBP) ..................... 41 Myelin Protein Zero (MPZ) ....................................................................... 41 Myelin P2 protein (PMP2) ........................................................................ 41 Periaxin (PRX) ......................................................................................... 42 Myelin proteolipid protein (PLP1) ........................................................... 42 5 DISCUSSÃO .......................................................................................................... 42 6 CONCLUSÃO ......................................................................................................... 51 REFERÊNCIAS ......................................................................................................... 52 APÊNDICE A – Algoritmo para análise de identidade entre nonâmeros ................... 65 APÊNDICE B – Material suplementar ....................................................................... 72 13 1 INTRODUÇÃO E JUSTIFICATIVA 1.1 Doenças autoimunes Doenças autoimunes são condições crônicas iniciadas com a perda da tolerância imunológica aos antígenos próprios, resultando em resposta imune dirigida a tais antígenos e, consequentemente, aos tecidos e órgãos onde eles são localizados. Assim, as doenças autoimunes podem ser sistêmicas - caracterizadas pela reatividade contra antígenos localizados em vários tecidos - ou tecido-específicas – quando o autoantígeno se localiza em algum tecido específico. As características epidemiológicas variam quanto a incidência e prevalência, faixa etária, sexo biológico, idade de início, hereditariedade, área geográfica e grupo étnico (WANG, L.; WANG; GERSHWIN, 2015). As doenças autoimunes são condições causadas por múltiplos fatores ambientais e genéticos que, combinados, geram uma autoimunidade patológica (WANG, L.; WANG; GERSHWIN, 2015). Quanto aos fatores genéticos, existem múltiplos genes HLA (do inglês human leukocyte antigen) e não-HLA que contribuem para a susceptibilidade à doença (SELDIN, 2015). Os agentes infecciosos são os fatores ambientais mais bem estudados, com várias evidências geoepidemiológicas, sorológicas e moleculares que os associam a doenças autoimunes, o que pode fornecer indícios a respeito dos fatores responsáveis por desencadear a patogênese da autoimunidade (BOGDANOS et al., 2013). Os mecanismos pelos quais os agentes infecciosos podem desencadear respostas autoimunes incluem ativação bystander, espalhamento de epítopos e mimetismo molecular. Ativação bystander é o termo usado para designar a ativação de linfócitos independente de estimulação por antígeno, o que contribui para a produção de mediadores inflamatórios (LEE; CHO; CHOI, 2020). O espalhamento de epítopos é um mecanismo que resulta na geração de múltiplos neoepítopos, epítopos antigênicos que normalmente não são apresentados, devido ao dano tecidual provocado por um processo inflamatório inicial, contribuindo para a perpetuação da resposta imune (VANDERLUGT; MILLER, 2002). O mimetismo molecular é o mecanismo mais comum responsável por ativar células B e T autorreativas. É ocasionado pela similaridade entre antígenos do hospedeiro e de agentes infecciosos, que, se associada a fatores ambientais e genéticos, pode resultar em reação cruzada contra o antígeno próprio (ROJAS et al., 2018). Existem quatro critérios que devem 14 ser cumpridos para considerar que uma doença autoimune seja desencadeada por mimetismo molecular: identificar similaridade entre um antígeno de um agente infeccioso ou de um agente ambiental e antígenos do hospedeiro; detecção de células T ou autoanticorpos que reconhecem ambos os antígeno; associação epidemiológica entre exposição ao agente infeciosos ou ambiental e o desenvolvimento da doença autoimune; reprodução da doença autoimune em um animal modelo após sensibilização com o antígeno apropriado (ROJAS et al., 2018). 1.2 Síndrome de Guillain-Barré A Síndrome de Guillain-Barré (SGB) é uma neuropatia periférica aguda caracterizada por resposta imunológica contra autoantígenos no sistema nervoso periférico (SNP) (KWAN; BILICILER, 2021). A progressão dos sintomas é rápida. Apenas alguns dias após o início, muitos pacientes são incapazes de andar devido a fraqueza, alguns podem até precisar de ventilação mecânica por causa do comprometimento dos músculos auxiliares da respiração (KWAN; BILICILER, 2021). Mesmo após a fase aguda, quando se inicia o período de recuperação, muitos pacientes ainda são incapazes de andar por até 6 meses, enquanto outros permanecem com sintomas como dor e fadiga por meses ou anos. A SGB não é uma única doença, mas sim representa um espectro de neuropatias periféricas caracterizadas por dano aos nervos periféricos, paralisia flácida, fraqueza nos membros, hiporreflexia ou arreflexia e pico de severidade (nadir) geralmente entre duas e quatro semanas após o início dos sintomas, o qual é seguido por um período de recuperação que dura desde algumas semanas até anos (HARDY et al., 2011; HUGHES; CORNBLATH, 2005; SHAHRIZAILA; LEHMANN; KUWABARA, 2021; VAN DEN BERG et al., 2014). Os subtipos mais comuns de SGB são as formas desmielinizante, Acute Inflammatory Demyelinating Polyradiculoneuropathy (AIDP), e axonal, Acute Motor Axonal Neuropathy (AMAN) (KUWABARA, Satoshi, 2011; VAN DEN BERG et al., 2014). Outros subtipos menos comuns são a Miller Fisher syndrome (MFS) e a Acute motor and sensory axonal neuropathy (AMSAN) (MORI; KUWABARA; YUKI, 2012; VAN DEN BERG et al., 2014). Os subtipos da SGB diferem em suas características clínicas, eletrofisiológicas, histológicas e imunopatogênese (KUWABARA, Satoshi; YUKI, 2013; VAN DEN BERG et al., 2014). AIDP é uma forma sensório-motora, na qual ocorre comprometimento dos nervos sensoriais e nervos motores. É caracterizada por polineuropatia 15 desmielinizante ao exame eletrofisiológico (HUGHES; CORNBLATH, 2005; VAN DEN BERG et al., 2014). Por outro lado, a AMAN é uma forma motora pura da SGB, caracterizada por neuropatia axonal ao exame eletrofisiológico. Déficits dos nervos cranianos, disfunção autonômica e dor são mais comuns na AIDP do que na AMAN (KUWABARA, Satoshi; YUKI, 2013). A MFS tem como característica clínica clássica a tríade oftalmoplegia, ataxia e arreflexia e é associada a déficits nos nervos cranianos responsáveis pelo movimento dos olhos (VAN DEN BERG et al., 2014). A AMSAN é uma forma axonal mais severa da SGB em que as fibras sensoriais e motoras são afetadas (KUWABARA, Satoshi; YUKI, 2013; VAN DEN BERG et al., 2014). A SGB é a causa mais comum de paralisia flácida em todo o mundo, com uma prevalência global estimada em 1.9 por 100.000 habitantes (BRAGAZZI et al., 2021). No Brasil, assim como em outros países, houve um aumento na incidência de SGB após a epidemia pelo Zika Vírus em 2015 e 2016 (LEONHARDet al., 2019; MALTA; RAMALHO, 2020; UNCINI; SHAHRIZAILA; KUWABARA, 2017). Entretanto, prevalência dos subtipos de SGB varia entre diferentes regiões (KIESEIER et al., 2018). AIDP é a principal forma na América do Norte, Europa e Austrália, enquanto AMAN ocorre com maior frequência na Ásia, América Central e América do Sul (KIESEIER et al., 2018). Por volta de 60-70% dos casos de SGB manifestam os primeiros sintomas entre 1 e 3 semanas após uma infecção aguda, geralmente uma infecção do trato respiratório superior ou infecção gastrointestinal (JACOBS, B. C. et al., 1998; KIESEIER et al., 2018). O patógeno que mais frequentemente causa uma infecção prévia ao diagnóstico de SBG é a bactéria Campylobacter jejuni. Outros patógenos também associados a uma infecção prévia são as bactérias Haemophilus influenzae e Mycoplasma pneumoniae e os vírus Citomegalovírus, Epstein-Barr vírus (EBV), Zika vírus e influenza A vírus (KIESEIER et al., 2018; VAN DEN BERG et al., 2014). Enquanto várias evidências sustentam que uma infecção prévia por C. jejuni contribui para desencadear o subtipo AMAN - incluindo estudos sorológicos, histórico de diarréia nas últimas três semanas e reação cruzada envolvendo gangliosídeos dos nervos periféricos e lipooligossacarídeos de C. jejuni (KIESEIER et al., 2018; KUWABARA, Satoshi; YUKI, 2013; VAN DEN BERG et al., 2014) -, um patógeno associado ao subtipo AIDP ainda é desconhecido. Alguns estudos sugerem que uma infecção recente por vírus pode contribuir para o desenvolvimento de AIDP. Kuwabara et al. (2004) relataram que 13 de 14 pacientes com infecção recente por 16 citomegalovírus ou EBV eram portadores de AIDP. Resultado similar foi observado por Ogawara et al. (2000), cuja pesquisa demonstrou que 11 de 12 pacientes com infecção recente por citomegalovírus, EBV ou varicella-zoster virus foram diagnosticados com AIDP (OGAWARA et al., 2000). Orlikowski e colegas mostraram que 70% dos pacientes com infecção anterior por citomegalovírus foram classificados como portadores de AIDP, mas apenas 7% receberam diagnóstico de AMAN (ORLIKOWSKI et al., 2011). Por fim, o subtipo AIDP é o mais frequente após uma infecção pelo vírus Zika (LEONHARD et al., 2020; NASCIMENTO; DA SILVA, 2017). Embora esses estudos apontem que a AIDP pode ser desencadeada por uma infecção viral prévia, não se conhece nenhum antígeno que esteja associado a autoimunidade (LAMAN et al., 2022). Após causar o dano, frequentemente grave, aos nervos periféricos, a resposta autoimune é interrompida. Em seguida inicia-se o processo de reparo, cujo tempo de recuperação depende do tipo de célula danificada (HARDY et al., 2011). Se o dano é limitado à bainha de mielina, basta que novas células de Schwann reconstituam a bainha, o que permite uma recuperação clínica em algumas semanas. Mas se ocorre dano aos axônios, a recuperação é mais lenta e pode levar de meses até anos. Particularmente para o subtipo AMAN, o processo patológico pode ser a ligação de autoanticorpos aos canais de sódio, o que causa um bloqueio temporário da condução do estímulo nervoso e permite uma recuperação mais rápida, embora alguns pacientes tenham os axônios degenerados, o que requer um tempo maior de recuperação (HARDY et al., 2011; HUGHES; CORNBLATH, 2005; KUWABARA, Satoshi; YUKI, 2013). No subtipo AIDP também pode ocorrer dano aos axônios em lesões mais severas, provavelmente como uma consequência da resposta inflamatória direta contra a mielina (HUGHES; CORNBLATH, 2005). O provável mecanismo que relaciona a forma AMAN, principalmente, e outros subtipos da SGB a uma infecção prévia por C. jejuni envolve a reatividade cruzada mediada por anticorpos entre lipooligossacarídeos da bactéria e gangliosídeos localizados nos axônios (HARDY et al., 2011; KIESEIER et al., 2018; VAN DEN BERG et al., 2014). Além disso, o desenvolvimento de AMAN após uma infecção por C. jejuni cumpre todos os quatro critérios mencionados anteriormente para que uma doença autoimune seja desencadeada por mimetismo molecular (KUWABARA, Satoshi; YUKI, 2013; ROJAS et al., 2018). Assim como AMAN, a patologia da MFS e da 17 AMSAN também parece envolver a participação de anticorpos antigangliosídeos (HUGHES; CORNBLATH, 2005). Já os mecanismos imunológicos que levam à desmielinização em AIDP são pouco compreendidos, mas possivelmente são mediados por células e anticorpos. Anticorpos contra gangliosídeos foram relatados em alguns pacientes com AIDP, porém qualquer contribuição para a patogênese permanece desconhecida (LIM; DEVAUX; YUKI, 2014; RINALDI et al., 2013; VAN DEN BERG et al., 2014). Também foram observados anticorpos contra proteínas da mielina (P0, P2 e PMP22) em alguns pacientes, mas outros estudos apresentaram resultados conflitantes e qualquer função desses anticorpos é desconhecida (LIM; DEVAUX; YUKI, 2014). Nos últimos anos, têm-se investigado a possibilidade de proteínas do nodo de ranvier (Gliomedina e Neurofascina 186) e paranodo (GJB1, Contactina-1 e Neurofascina 155) serem alvos de autoanticorpos (LIM; DEVAUX; YUKI, 2014). Outra possibilidade é que linfócitos T auxiliares CD4+ (Th, do inglês, T helper) ativados reconheçam antígenos específicos nas células de Schwann ou na própria bainha de mielina (HARDY et al., 2011; KIESEIER et al., 2004) - o que é corroborado pela identificação de células T reativas às proteínas da mielina em pacientes com AIDP (CSURHES et al., 2005), e ativem macrófagos, que causam o dano à mielina (HUGHES; CORNBLATH, 2005). No entanto, autoantígenos de células T CD4+, assim como o mecanismo patogênico promovido por elas, permanecem desconhecidos. Um esclarecimento importante é que a classificação da SBG em seus subtipos principais, AMAN e AIDP, surgiu no início da década de 90 (KUWABARA, Satoshi; YUKI, 2013), logo, nem sempre os estudos que investigaram a reatividade contra proteínas da mielina especificam o subtipo da doença, mas tratam todos os pacientes como portadores de SBG. 1.3 Esclerose múltipla Outra doença autoimune que também afeta o sistema nervoso é a esclerose múltipla. Porém, ao contrário da SGB, a autoimunidade é dirigida contra as células do sistema nervoso central (SNC). A esclerose múltipla é caracterizada pela presença de áreas focais de inflamação crônica e desmielinização na substância branca e na substância cinzenta do cérebro e da medula espinhal (GASPERONI; TURINI; AGOSTINELLI, 2019). Seu diagnóstico requer a ocorrência de pelo menos um episódio clínico compatível com desmielinização do SNC (conhecida como síndrome clinicamente isolada) mais evidência clínica, de ressonância magnética ou laboratorial 18 de lesões no SNC disseminadas no espaço e ao longo do tempo (MAKHANI; TREMLETT, 2021). De acordo com o Atlas da esclerose múltipla havia cerca 2,8 milhões de pessoas vivendo com a doença no mundo em 2020 (MSIF, 2020a). No Brasil, o número de pessoas com esclerose múltipla foi estimado em 40 mil (MSIF, 2020a). A esclerose múltipla atinge principalmente indivíduos de ascendência europeia e é rara em asiáticos, negros, nativos americanos e indivíduos maoris (FILIPPI et al., 2018). A estimativa de incidência média é 2.1 por 100.000 indivíduos, segundo um cálculo levando em consideração 75 países, e a prevalência global é calculada em 36 por 100.000 habitantes (MSIF, 2020b). No Brasil a prevalência foi calculada como 19 por 100.000 habitantes (MSIF, 2020b). O início dos sintomas típicos costuma acontecer entre 20 e 50 anos de idade. Todavia, existem determinados sinais, chamados pródromos, os quais podem surgir até vários anos antes do início dos sintomas típicos (MAKHANI; TREMLETT, 2021). A fase prodrômica da esclerose múltipla ainda é pouco compreendida, mas alguns sinais são conhecidos: indícios clínicos, como maior procura por cuidados médicos e déficits cognitivos; síndrome radiologicamente isolada(sinais radiológicos compatíveis com esclerose múltipla no exame ressonância magnética); e presença de biomarcadores séricos, como o neurofilamento leve de cadeia. O reconhecimento dos pródromos pode auxiliar na identificação antecipada da esclerose múltipla e início prévio do tratamento. As manifestações clínicas da esclerose múltipla dependem da localização das lesões no SNC (DENDROU; FUGGER; FRIESE, 2015; STEINMAN, 2014). Os sintomas podem incluir distúrbios sensoriais e visuais, deficiência motora, espasticidade, fadiga, dor e déficits cognitivos (MURÚA; FAREZ; QUINTANA, 2022). Cerca de 85 a 90% dos pacientes com esclerose múltipla desenvolvem uma forma remitente-recorrente da doença, caracterizada por períodos de exacerbação dos sintomas (recaídas) seguidos de recuperação clínica (remissão) (SOSPEDRA; MARTIN, 2016). À medida que a doença evolui, a recuperação dos sintomas é incompleta, e cerca de 60% dos pacientes eventualmente desenvolvem uma forma da doença conhecida como esclerose múltipla secundária progressiva, caracterizada pelo acúmulo progressivo e irreversível de incapacidade neurológica. Um grupo menor de pacientes (10-15%) segue um curso clínico progressivo desde o início da doença, que é denominada esclerose múltipla progressiva primária. 19 Estudos epidemiológicos mostraram um risco maior de desenvolver a doença em parentes de primeiro grau de pacientes com esclerose múltipla em comparação com a população em geral, o que sugere algum grau de suscetibilidade genética (COMPSTON; COLES, 2008; MURÚA; FAREZ; QUINTANA, 2022; NIELSEN, N. M. et al., 2005). De fato, estudos de associação genômica identificaram mais de 200 variantes genéticas associadas à esclerose múltipla (THOMPSON et al., 2018). Cada variante tem um pequeno efeito no risco de desenvolver a doença, e diferentes combinações dessas variantes provavelmente contribuem para a suscetibilidade genética em diferentes pacientes (BARANZINI; OKSENBERG, 2017; FILIPPI et al., 2018). A ligação mais forte foi encontrada em alelos do complexo de histocompatibilidade, no qual o HLA-DRB1*15:01 conferiu o maior risco, aproximadamente três vezes (SAWCER et al., 2011). É importante ressaltar que o HLA-DRB1*15:01, assim como os outros alelos do haplótipo DR15 (DRB1*1501, DQA1*0102 e DQB1*0602), é considerado um fator de risco para pessoas caucasianas, o grupo étnico com a maior prevalência de esclerose múltipla mas não se pode estabelecer essa mesma relação para pessoas de outras etnias (MARTIN et al., 2021). Acredita-se que a esclerose múltipla seja iniciada por resultado da combinação de fatores genéticos e ambientais. A variação genética é responsável por aproximadamente 30% do risco para a esclerose múltipla (DENDROU; FUGGER; FRIESE, 2015). Ademais, se um gêmeo monozigótico é portador de esclerose múltipla o outro tem apenas 25% de risco de desenvolvê-la (ASCHERIO; MUNGER; LÜNEMANN, 2012). Essas observações sugerem que os fatores ambientais são fundamentais para o desenvolvimento da esclerose múltipla. Fatores ambientais que parecem influenciar a incidência e/ou prevalência da doença são: baixos níveis de vitamina D, perturbação no ciclo circadiano, infecção pelo EBV, obesidade e tabagismo (MURÚA; FAREZ; QUINTANA, 2022). O papel das células T CD4+ para a patogênese da esclerose múltipla é apoiado pela identificação do HLA de classe II DRB1∗15:01 como um importante fator de risco genético (MURÚA; FAREZ; QUINTANA, 2022; WANG, J. et al., 2020). Ainda não está claro qual subconjunto de células T auxiliares CD4+ exerce a influência mais importante na doença, mas os subtipos Th1 e Th17 parecem ser os mais relevantes (RIEDHAMMER; WEISSERT, 2015). Células Th1 são encontradas em maior quantidade na fase de recaída do que na de remissão ou em pessoas saudáveis. 20 Também foi identificada alta produção da citocina interferon-γ (IFN-γ), a qual é produzida por células Th1, em pacientes com esclerose múltipla. A contribuição do subtipo Th17 é corroborada pela identificação de que pacientes com esclerose múltipla apresentaram maior transcrição da citocina IL-17, especialmente em lesões crônicas silenciosas, e mais células Th17 em comparação aos grupos controle. Outros subtipos que podem contribuir para a patologia são os Th9 e Th22 (RIEDHAMMER; WEISSERT, 2015). Até recentemente os linfócitos T CD8+ eram consideradas menos relevantes para a esclerose múltipla mas alguns indícios sugerem que elas podem ser importantes para a patogênese da doença (MURÚA; FAREZ; QUINTANA, 2022). Os clones de linfócitos T CD8+ são frequentemente mais encontrados nas lesões de pacientes com esclerose múltipla do que células T CD4+. Alguns alelos do HLA classe I são conhecidos por serem importantes fatores genéticos na esclerose múltipla: HLA- A∗02:01 e HLA-B∗44, associados à proteção; e HLA-A∗03:01 HLA-B∗07, associados ao aumento de risco (MARTIN et al., 2021). A presença de bandas oligoclonais de classe IgG no líquido cefalorraquidiano e a eficácia de ensaios clínicos bem-sucedidos com anticorpos anti-CD20 que destroem os linfócitos B demonstram a importância dessas células para a patologia da esclerose múltipla (HAUSER et al., 2017; KUERTEN et al., 2020; LINK; HUANG, 2006). O mecanismo exato pelo qual as células B promovem a neuroinflamação não é completamente compreendido, mas provavelmente envolve produção de autoanticorpos, secreção de citocinas proinflamatórias e apresentação de antígenos para linfócitos T CD4+ (MURÚA; FAREZ; QUINTANA, 2022; RIEDHAMMER; WEISSERT, 2015). Estudos anteriores que testaram amostras de soro e plasma de pacientes com esclerose múltipla mostraram reatividade de anticorpos contra um amplo espectro de antígenos de mielina, em relação aos grupos controle (HECKER et al., 2016; KUERTEN et al., 2020). Assim, ao contrário de outras doenças neuroimunológicas, como a miastenia gravis e a neuromielite óptica, nas quais há um autoantígeno dominante bem descrito, a resposta imune na esclerose múltipla é diversa, sem que um único antígeno surja como alvo dominante das células B e T (KUERTEN et al., 2020). Proteínas da mielina que podem ser alvo de autoanticorpos incluem a proteína básica da mielina (MBP), proteína proteolipídica (PLP), cadeia alfa-cristalina B (CRYAB), glicoproteína associada à mielina (MAG), Glicoproteína da Mielina de 21 Oligodendrócitos (MOG), proteína específica de oligodendrócitos (OSP), entre outras (KUERTEN et al., 2020). Além disso, outros possíveis alvos antigênicos são proteína axonais, como a neurofilamento de cadeia leve (NEFL) e o canal de cloreto ANO2. Assim como acontece na SGB, estudos epidemiológicos indicam que uma infecção pelo vírus Epstein-Barr pode estar ligada à esclerose múltipla mas seu papel para a patologia permanece incerto (BAR-OR et al., 2020). O EBV é um herpesvírus humano que persiste de forma latente nos linfócitos B por toda a vida do hospedeiro após a infecção (SORELLE et al., 2022). Os títulos de anticorpos anti-EBNA1 (Epstein–Barr virus nuclear antigen 1) podem ser detectados em aproximadamente 99,5% dos pacientes com esclerose múltipla antes do desenvolvimento de sintomas clínicos, comparado a 94% em indivíduos saudáveis (BJORNEVIK et al., 2022). Além disso, uma infecção prévia pelo EBV aumenta em 32 vezes o risco de desenvolver esclerose múltipla, o que o torna, possivelmente, o principal agente de risco para a doença (BJORNEVIK et. al., 2022). Um potencial mecanismo para explicar como o EBV desencadeia a esclerose múltipla é o mimetismo molecular entre antígenos virais e antígenos do SNC (LANZ et al., 2022; ROBINSON; STEINMAN, 2022). 1.4 Apresentação de antígenos a linfócitos T auxiliares Um epítopo, também chamado determinante antigênico, é um segmento antigênico o qual é reconhecido por um anticorpo ou receptor da célula T (ABBAS; LICHTMAN; PILLAI, 2023). Em relação aos antígenosproteicos reconhecidos por linfócitos T, o epitopo é um segmento de aminoácidos linear que se liga a uma molécula de MHC (Major Histocompatibility Complex). Há duas classes principais de moléculas de MHC responsáveis pela apresentação dos antígenos: MHC de classe I e MHC de classe II (ABBAS; LICHTMAN; PILLAI, 2023). Os linfócitos T auxiliares reconhecem peptídeos apresentados pelo MHC de classe II, enquanto os linfócitos T CD8+ ligam-se a peptídeos exibidos pelo MHC de classe I. As moléculas do MHC são altamente polimórficas, com uma ampla variação de alelos existente em uma população – atualmente há cerca de 23 mil diferentes alelos relatados (GONZALEZ-GALARZA et al., 2020). Essa alta diversidade de HLAs oferece um papel importante na proteção das populações contra patógenos e epidemias (ABBAS; LICHTMAN; PILLAI, 2023). Em humanos, as moléculas do MHC são chamadas HLA. 22 Para a compreensão de como acontece mimetismo molecular entre antígenos, serão explicados conceitos básicos sobre a estrutura do TCR (TCR, do inglês, T-Cell Receptor) e do HLA. As moléculas de HLA de classe II são glicoproteínas localizadas na membrana celular constituídas por duas cadeias: α e β (ABBAS; LICHTMAN; PILLAI, 2023). Todo individuo tem dois genes HLA-DP (DPA1 e DPB1), dois genes HLA-DQα (DQA1, 2), um gene HLA-DQβ (DQB1), um gene HLA-DRα (DRA1) e um gene HLA-DRβ (DRB1) em cada cromossomo (SHIINA et al., 2009). O conjunto de genes de HLA presentes em um genoma constitui o haplótipo de HLA. Figura 1 - Representação da interação HLA-peptídeo. Fonte: (SINGH et al., 2018) Na molécula do HLA de classe II existe um sulco de ligação ao peptídeo, o qual é constituído por quatro bolsas, chamadas P1, P4, P6 e P9 por acomodarem os resíduos 1, 4, 6 e 9 de um segmento de nove aminoácidos do peptídeo (GFELLER; LIU; RACLE, 2023; HOMAN; BREMEL, 2023; JONES et al., 2006) (figura 1). O sulco de ligação é aberto em ambas as extremidades, permitindo a apresentação de peptídeos geralmente de 13 a 25 aminoácidos (WIECZOREK et al., 2017). A sequência de nove aminoácidos ligada ao sulco de ligação é denominada nonâmero ou nonapeptídeo, enquanto as sequências adjacentes não ligadas são os resíduos flanqueadores do peptídeo (peptide flanking residue - PFRs) (BARRA et al., 2018; HOLLAND et al., 2015). O TCR também é uma glicoproteína de membrana formada por duas cadeias, α e β (ALCOVER; ALARCÓN; DI BARTOLO, 2018) (figura 2). Na porção extracelular de cada cadeia do TCR há três alças com elevada variabilidade de aminoácidos, 23 denominadas regiões determinantes de complementaridade (CDR, do inglês, Complementary-determinant regions), que reconhecem o HLA e a superfície antigênica formada pelas cadeias laterais dos resíduos de aminoácidos do epítopo. As alças CDR1 e CDR2 interagem principalmente com o HLA (ALCOVER; ALARCÓN; DI BARTOLO, 2018). As alças hipervariáveis CDR3α e CDR3β são as mais estruturalmente diversas e interagem principalmente com o epítopo. Figura 2 - Representação do receptor de células T Fonte: Adaptada de (WONG; LEEM; DEANE, 2019) Na estrutura molecular do complexo MHC-peptídeo-TCR (pMHC-TCR) (figura 3) as cadeias laterais de alguns resíduos do peptídeo apontam para fora do sulco de ligação e fazem contato com o TCR. Geralmente, no MHC-II os resíduos P2, P3, P5 e P8 fazem contato com receptor de linfócitos T CD4+, enquanto P-1 e P7 podem ou não interagir diretamente, o que depende das particularidades estruturais de cada complexo pMHC-TCR (BIRNBAUM et al., 2014; CIACCHI et al., 2022; GE et al., 2022; HILL et al., 2003; HUSEBY et al., 2005; NELSON et al., 2015; RUDOLPH; WILSON, 2002). Os aminoácidos localizados em P1, P9 e nos flancos parecem ter uma contribuição mínima para o reconhecimento pelo TCR. 24 Figura 3 - Estrutura do complexo MHCII-peptídeo-TCR Fonte: Adaptada de (BIRNBAUM et al., 2014) 1.5 Justificativa e relevância do trabalho Diante das incertezas sobre a patogênese do SBG, particularmente do subtipo AIDP, permanecem desconhecidas questões como: os mecanismos autoimunes associados à patogenia, a natureza dos autoantígenos (proteico ou glicosídico), proteínas que podem servir como autoantígenos, microrganismo importante para desencadear a autoimunidade. A esclerose múltipla, embora seu processo imunopatogênico seja mais conhecido, também apresenta incertezas quanto às proteínas que são alvo de autoimunidade. Além disso, ambas patologias apresentam uma infecção prévia pelo EBV como possível fator desencadeante da autoimunidade. Nesse contexto, elucidar os mecanismos imunopatogênicos relacionados a essas patologias é fundamental para a elaboração de estratégias terapêuticas, como a imunoterapia antígeno-específica (BRONGE et al., 2022). A identificação de possíveis autoantígenos pode ser direcionada a partir do conhecimento da estrutura do complexo TCR-peptídeo-MHC; uma vez que um autoantígeno e um antígeno exógeno podem ser capazes de ativar um mesmo linfócito T CD4+, caso apresentem identidade em resíduos críticos para a interação com o TCR, de modo a gerar linfócitos T autorreativos. 25 Neste trabalho, a sequência de algoritmos utilizados permite a identificação de possíveis autoantígenos associados ao mecanismo de mimetismo molecular com epítopos do EBV. Além disso, a estratégia desenvolvida poderá ser aplicadas em outros projetos uma vez adaptada para os objetivos e finalidades desses outros estudos. 26 2 OBJETIVOS 2.1 Objetivo Geral Identificar possíveis autoantígenos de linfócitos T CD4+ associados ao mecanismo de mimetismo molecular com epítopos do vírus Epstein-Barr em quadros de esclerose múltipla e síndrome de Guillain-Barré. 2.2 Objetivos Específicos 1) Identificar proteínas com expressão enriquecida no Sistema Nervoso. 2) Identificar haplótipos contendo pares de HLAs de classe II mais comuns na população mundial. 3) Selecionar proteínas imunogênicas do vírus EBV. 4) Predizer in silico peptídeos lineares virais e de proteínas do sistema nervoso apresentados por HLAs comuns na população global. 5) Analisar a identidade de resíduos críticos para o reconhecimento pelo TCR entre peptídeos de proteínas do sistema nervoso e de proteínas do EBV preditos para serem apresentados pelos HLAs. 6) Analisar imunogenicidade dos peptídeos preditos. 27 3 MÉTODOS Figura 4 – Esquema ilustrando o fluxo de trabalho da metodologia para identificar a identidade cruzada entre peptídeos. Legenda - A. Etapas de obtenção de dados (azul), dados obtidos e análises subsequentes (cinza). B. Foram selecionados peptídeos de 15 aminoácidos preditos por ambos os métodos e ligantes do mesmo HLA. Depois, como os nonâmeros podem diferir entre os métodos, foram escolhidas as predições do NetMHCIIpan. Os peptídeos de 15 aminoácidos foram analisados usando o CD4 Episcore, e os 28 nonâmeros foram avaliados quanto à identidade de seus resíduos. C. A busca pela identidade cruzada dos peptídeos das proteínas do sistema nervoso humano contra os peptídeos do vírus Epstein-Barr. D. Os nonâmeros devem ligar-se ao mesmo HLA ou HLAs presentes em haplótipos. E. O pipeline usa quatro regras para selecionar nonâmeros com identidades relevantes no contexto da interação com o TCR. Começa com uma identidade mínima de 44% entre os resíduos de dois nonâmeros e resíduos idênticos na posição 5 (P5) como critério de base. As três regras adicionais usadas para selecionar pares de nonâmeros foram: Critério 1: resíduos idênticos em P2, P3 e P8 (P2-P3-P5-P8). Critério 2: dois resíduos idênticos em P2, P3 ou P8, e pelo menos um resíduo idêntico em P4, P6 ou P7 (P5 - 2 x P2/P3/P8 - 1 x P4/P6/P7). Critério 3: resíduos idênticos em P4, P6 e P7 e pelo menos um resíduo idêntico em P2, P3 ou P8 (P5 - 1 x P2/P3/P8 -P4-P6-P7). Os métodos empregados neste trabalho incluíram a busca de informações biológicasem bancos de dados de proteínas, epitopos e HLAs, além da utilização de ferramentas para a predição de ligantes de moléculas de HLA. Programas escritos na linguagem de programação Pyhton foram desenvolvidos para obtenção e tratamento de dados, além de ter sido desenvolvido uma ferramenta voltada à análise de identidade entre resíduos de nonâmeros. A figura 4 apresenta uma visão geral dos métodos usados. 3.1 Seleção de proteínas do SNP e do SNC O banco de dados Protein Atlas (https://www.proteinatlas.org/) (UHLÉN et al., 2015) foi utilizado para buscar proteínas com expressão elevada no SNC e em oligodendrócitos. Foram selecionadas as proteínas com expressão acima de 200 nTPM (do inglês normalized to transcripts per million) no SNC e acima de 100 nTPM em oligodendrócitos (figura 4A). O filtro de busca foi o seguinte: tissue_category_rna:brain;Tissue enriched,Group enriched,Tissue enhanced AND sort_by:tissue specific score AND evidence_summary:Evidence at protein level AND uniprot_evidence:Evidence at protein level AND nextprot_evidence:Evidence at protein level AND hpa_evidence:Evidence at protein level AND cell_type_category_rna:Oligodendrocyte precursor cells, Oligodendrocytes; Cell type enriched, Group enriched, Cell type enhanced, Is highest expressed Foram removidas as proteínas cuja expressão em outros órgãos/tecidos é superior à do SNC ou que são secretadas no sangue ou em outros tecidos. Por fim, a página de cada proteína foi analisada para remover as que também são altamente https://www.proteinatlas.org/ 29 expressas em outros órgãos. Para certificar-se de que todas as proteínas são altamente expressas no SNC, a expressão também foi analisada com a ferramenta Genevestigator (https://genevisible.com/search) (GRENNAN, 2006). O Protein Atlas apenas apresenta filtros para identificação de proteínas presentes em tecido nervoso, sem especificar se são expressas no SNC ou SNP. Assim, foram selecionadas proteínas mais abundantes em proteomas do SNP ou que sejam possíveis fontes de autoantígenos na SBG. O Genevestigator também foi usado para analisar a expressão das proteínas. 3.2 HLAs mais comuns na população global e busca por haplótipos A partir dos 27 alelos mais comuns na população global (GREENBAUM et al., 2011), foram selecionados os 21 HLAs de classe do tipo DR e DQ para a predição de peptídeos os, pois são os principais relacionados a doenças autoimunes (LIU; SHAO; FU, 2021). Entre esses 21 alelos, 17 – onze DRB1 e seis DQ - foram usados para a busca de haplótipos no banco de dados Allele Frequency Net Database (AFND) (http://www.allelefrequencies.net/), visto que não é possível procurar pelos alelos DRB3, DRB4 e DRB5 na ferramenta de busca de haplótipos (GONZALEZ-GALARZA et al., 2020) (figura 4A). Todo indivíduo tem dois genes HLA-DP (DPA1 e DPB1), dois genes HLA-DQα (DQA1, 2), um gene HLA-DQβ (DQB1), um gene HLA-DRα (DRA1), e um gene HLA- DRβ (DRB1) em cada cromossomo (SHIINA et al., 2009). Partindo desse pressuposto, todos os alelos DRB1 e DQB1/DQA1 foram combinados aos pares. Em seguida, a ferramenta Haplotype Frequency Search (http://www.allelefrequencies.net/hla6003a.asp) foi usada para selecionar os haplótipos em que cada par DRB1-DQB1/DQA1 está presente. A biblioteca Beautiful Soup (versão: 4.11.1) do Python foi usada para a coleta de dados por meio de web scraping. Os dados coletados foram processados e tratados. O haplótipo HLA-DR15 - composto pelos genes DRB1*15:01 (DR2b) e DRB5*01:01 (DR2a) - foi adicionado por ser relacionado à esclerose múltipla (SCHOLZ et al., 2017). 3.3 Seleção de proteínas imunogênicas do vírus Epstein-Barr Foi utilizado o banco de dados Immune Epitope Database (IEDB) (www.iedb.org) (VITA et al., 2019) para selecionar proteínas do vírus Epstein-Barr que possuem ensaios positivos para linfócitos T (figura 4A). Foram buscados epítopos de “Human herpesvirus 4 (Epstein Barr virus) (ID:10376, Epstein-Barr virus)”, restritos ao https://genevisible.com/search http://www.allelefrequencies.net/hla6003a.asp http://www.allelefrequencies.net/hla6003a.asp http://www.iedb.org/ 30 MHC de classe II, Homo sapiens como hospedeiro, sem ensaios de linfócitos B e com ensaios de linfócitos T positivos (figura 5). Por fim, buscou-se no banco Uniprot as sequências de aminoácidos das proteínas imunogênicas de todas as cepas do EBV (Raji, GD1, B95-8, Cao, AG876) (UNIPROT CONSORTIUM, 2021). Figura 5 - Filtros utilizados para a busca de antígenos de EBV no IEDB Fonte: (VITA et al., 2019). 3.4 Predição de peptídeos em proteínas do EBV e do sistema nervoso com potencial de se ligar às moléculas de HLA As proteínas imunogênicas do EBV e as proteínas do sistema nervoso foram analisadas quanto a capacidade de seus peptídeos se ligarem aos alelos de HLA selecionados (figura 4A). Foram selecionados 21 alelos de HLA para a predição de peptídeos (quatro HLAs DRB3/4/5, seis DQA1/DQB1 e onze DRB1). As predições foram obtidas usando dois preditores: NetMHCII-2.3 (JENSEN et al., 2018) e NetMHCIIpan-4.1 (REYNISSON et al., 2020). O comprimento do peptídeo foi de 15 aminoácidos. Em ambas as predições foram escolhidos todos os peptídeos classificados como ligantes, sejam fortes ou fracos. Em seguida, as duas predições foram comparadas a fim de identificar os peptídeos de 15 aminoácidos preditos para ligar ao mesmo HLA em ambas ferramentas. As predições também mostram os nonâmeros centrais, que potencialmente se ligam à molécula de HLA e constituam a porção principal do epítopo da célula T (NIELSEN, M. et al., 2010). Os nonâmeros preditos pelos dois métodos podem ser iguais, mas, no caso em que eles diferem, foram selecionados aqueles preditos pelo método NetMHCIIpan-4.1, pelo fato de ser o preditor com melhor performance (REYNISSON et al., 2020) (figura 4B). 3.5 Análise de identidade entre os nonâmeros de peptídeos dos vírus EBV e de epítopos das proteínas do sistema nervoso As sequências de aminoácidos dos nonâmeros foram comparadas com auxílio de um algoritmo escrito em linguagem Python (figuras 4C, D e E). O algoritmo compara os nonâmeros dos vírus EBV contra os das proteínas do sistema nervoso e 31 analisa a identidade de resíduos que estejam localizados na mesma posição (P1 contra P1, P2 contra P2, e assim por diante até a posição P9), o que é uma estratégia ideal para a análise ser relevante no contexto do reconhecimento de linfócitos T CD4+. A quantidade mínima de resíduos idênticos entre os nonâmeros deve ser 4. Tomando como referência o conhecimento de que a reatividade cruzada não necessariamente exige que todos os resíduos do nonâmero sejam iguais, mas basta que haja identidade em alguns contatos críticos para interação com o TCR (BASU et al., 2000; BIRNBAUM et al., 2014; CIACCHI et al., 2022; GE et al., 2022; HUSEBY et al., 2005; LANG et al., 2002; NELSON et al., 2015), foram definidas quatro regras para selecionar os peptídeos com identidade relevante no contexto da interação com o TCR (figura 4E). Como regra geral, todos os nonâmeros devem ter no mínimo quatro resíduos idênticos e um deles deve estar localizado em P5. Os outros resíduos devem estar posicionados de acordo com qualquer dos três critérios mínimos a seguir. 1. Todos os resíduos nas posições P2, P3 e P8 são idênticos. No texto esse critério será identificado peço código (P2-P3-P5-P8). 2. Dois resíduos idênticos nas posições P2, P3 ou P8 e ao menos um em P4, P6 ou P7. No texto esse critério será identificado peço código (P5 - 2 x P2/P3/P8 - 1 x P4/P6/P7). 3. Todos os resíduos nas posições P4, P6 e P7 são idênticos e ao menos um em P2, P3 ou P8. No texto esse critério será identificado peço código (P5 - 1 x P2/P3/P8 - P4- P6-P7). Além disso, a identidade entre dois nonâmeros apenas será considerada válida se ambos tiverem sido preditos para se ligar ao mesmo HLA ou a HLA’sdiferentes, mas que estejam presentes em um mesmo haplótipo (figura 4D). A estratégia empregada também considerou a similaridade entre os nonâmeros, visto que peptídeos similares favorecem a ocorrência de reatividade cruzada de linfócitos T, ainda que a identidade seja baixa (FRANKILD et al., 2008). Foi calculado o score de similaridade BLOSUM62 entre os segmentos P2-P8 dos nonâmeros com o uso do pacote substitution_matrices e do módulo pairwise2, ambos da biblioteca BioPython (https://biopython.org/docs/1.75/api/index.html) (COCK et al., 2009). O algoritmo desenvolvido para a análise de identidade pode ser visualizado no apêndice A. https://biopython.org/docs/1.75/api/index.html 32 3.6 Predição de imunogenicidade de células T CD4 Os peptídeos de 15 aminoácidos foram submetidos ao servidor CD4episcore (http://tools.iedb.org/CD4episcore/) para avaliar a capacidade de estimular a resposta de linfócitos T CD4 (DHANDA et al., 2018; PAUL et al., 2015) (figura 4A). A pontuação limite para classificar os peptídeos foi 50%. Foi usado o método combinado, cuja pontuação inclui o score de imunogenicidade e também o score do método 7-allele (um método otimizado para previsão de respostas HLA). A figura 4B ilustra como ocorreu o processo de seleção de peptídeos desde a seleção dos ligantes de HLA até a escolha dos peptídeos e nonâmeros para a predição de imunogenicidade e análise de identidade entre nonâmeros. 3.7 Processamento de dados Todos os algoritmos desenvolvidos em linguagem Python (v 3.10.4) para obter, limpar e filtrar dados biológicos estão disponíveis em link de acesso no apêndice B. Foram utilizados os pacotes matplotlib (https://matplotlib.org/) (versão 3.5) e seaborn (https://seaborn.pydata.org/) (versão 0.11.2) para construir os gráficos. Para visualizar a análise de identidade dos nonâmeros, utilizou-se o pacote UpSetPlot (https://upsetplot.readthedocs.io/en/stable/) (v. 0.6.1). http://tools.iedb.org/CD4episcore/ 33 4 RESULTADOS 4.1 Busca de proteínas do sistema nervoso Ao final da busca no Protein Atlas foram obtidas treze proteínas. A análise do genevisible mostrou que em todas as proteínas os dez tecidos com maior expressão incluem predominantemente, ou totalmente, estruturas do SNC (tabela 1). Para as análises seguintes foram selecionadas as cinco proteínas com maior expressão no cérebro (MBP, PLP, CNP, APLP1, MOBP). Além dessas, também foram escolhidas as proteínas GlialCam, por ter sido relatado um caso de mimetismo molecular com proteínas do EBV (LANZ et al., 2022), e MAG, porque seus peptídeos foram reconhecidos por linfócitos B e T na esclerose múltipla (ANDERSSON et al., 2002). Foram selecionadas ainda três proteínas abundantes no SNP: Myelin protein P0, Myelin protein P2 e Periaxin (PATZIG et al., 2011; SIEMS et al., 2020). 4.2 Busca de haplótipos e seleção de alelos de HLA Os seis HLAs DQA1/DQB1 e 11 DRB1 foram combinados em 66 pares para a busca de haplótipos. Foram localizados ao todo 1359 haplótipos registrados no AFND, os quais se distribuem entre 51 pares. Quinze pares não apresentam haplótipos registrados (tabela suplementar 1). Considera-se que haplótipos com frequência inferior a 1% são raros (YUNUSBAEV et al., 2019). Assim, o resultado foi filtrado para manter apenas os registros com frequência maior ou igual a 1%. Ao final foram obtidos dezenove haplótipos (Figura 6). No total, foram localizados 1411 haplótipos distribuídos entre 51 pares de HLAs. Tabela 1 - Proteínas do sistema nervoso selecionadas para a predição de ligantes de HLA (Continua) Proteína Abrevia ção Expressão cerebral (nTPM) Protein atlas Genevis ible Myelin basic protein MBP 32454.4 ENSG00000197 971 P02686 Proteolipid protein 1 PLP1 7049.5 ENSG00000123 560 P60201 2',3'-cyclic nucleotide 3' phosphodiesterase CNP 1435.7 ENSG00000173 786 P09543 Amyloid beta precursor like protein 1 APLP1 1182.3 ENSG00000105 290 P51693 http://www.proteinatlas.org/ENSG00000197971/tissue/ http://www.proteinatlas.org/ENSG00000197971/tissue/ https://genevisible.com/tissues/HS/UniProt/P02686 http://www.proteinatlas.org/ENSG00000123560/tissue/ http://www.proteinatlas.org/ENSG00000123560/tissue/ https://genevisible.com/tissues/HS/UniProt/P60201 http://www.proteinatlas.org/ENSG00000173786/tissue/ http://www.proteinatlas.org/ENSG00000173786/tissue/ https://genevisible.com/tissues/HS/UniProt/P09543 http://www.proteinatlas.org/ENSG00000105290/tissue/ http://www.proteinatlas.org/ENSG00000105290/tissue/ https://genevisible.com/tissues/HS/UniProt/P51693 34 Tabela 1 - Proteínas do sistema nervoso selecionadas para a predição de ligantes de HLA (Conclusão) Proteína Abrevia ção Expressão cerebral (nTPM) Protein atlas Genevis ible Myelin associated oligodendrocyte basic protein MOBP 933.7 ENSG00000168 314 Q13875 Excitatory amino acid transporter 1 SLC1A3 783.1 ENSG00000079 215 P43003 Myelin associated glycoprotein MAG 690 ENSG00000105 695 P20916 Ermin ERMN 533.8 ENSG00000136 541 Q8TAM6 Neurotrimin NTM 324.3 ENSG00000182 667 Q9P121 Hyaluronan and proteoglycan link protein 2 HAPLN2 276.4 ENSG00000132 702 Q9GZV7 Serpin family I member 1 SERPIN I1 266.2 ENSG00000163 536 Q99574 Formin like 2 FMNL2 233 ENSG00000157 827 Q96PY5 Hepatic and glial cell adhesion molecule GLIALC AM 229.3 ENSG00000165 478 Q14CZ8 Myelin protein P0 MPZ ENSG00000158 887 P25189 Periaxin PRX ENSG00000105 227 Q9BXM 0 Myelin protein P2 PMP2 ENSG00000147 588 P02689 4.3 Busca de proteínas imunogênicas do EBV As 28 proteínas imunogênicas encontradas no IEDB contêm 208 epitopos validados em 632 ensaios (tabela 2). Glicoproteínas do envelope e antígenos nucleares são as mais comuns no grupo. http://www.proteinatlas.org/ENSG00000168314/tissue/ http://www.proteinatlas.org/ENSG00000168314/tissue/ https://genevisible.com/tissues/HS/UniProt/Q13875 http://www.proteinatlas.org/ENSG00000079215/tissue/ http://www.proteinatlas.org/ENSG00000079215/tissue/ https://genevisible.com/tissues/HS/UniProt/P43003 http://www.proteinatlas.org/ENSG00000105695/tissue/ http://www.proteinatlas.org/ENSG00000105695/tissue/ https://genevisible.com/tissues/HS/UniProt/P20916 http://www.proteinatlas.org/ENSG00000136541/tissue/ http://www.proteinatlas.org/ENSG00000136541/tissue/ https://genevisible.com/tissues/HS/UniProt/Q8TAM6 http://www.proteinatlas.org/ENSG00000182667/tissue/ http://www.proteinatlas.org/ENSG00000182667/tissue/ https://genevisible.com/tissues/HS/UniProt/Q9P121 http://www.proteinatlas.org/ENSG00000132702/tissue/ http://www.proteinatlas.org/ENSG00000132702/tissue/ https://genevisible.com/tissues/HS/UniProt/Q9GZV7 http://www.proteinatlas.org/ENSG00000163536/tissue/ http://www.proteinatlas.org/ENSG00000163536/tissue/ https://genevisible.com/tissues/HS/UniProt/Q99574 http://www.proteinatlas.org/ENSG00000157827/tissue/ http://www.proteinatlas.org/ENSG00000157827/tissue/ https://genevisible.com/tissues/HS/UniProt/Q96PY5 http://www.proteinatlas.org/ENSG00000165478/tissue/ http://www.proteinatlas.org/ENSG00000165478/tissue/ https://genevisible.com/tissues/HS/UniProt/Q14CZ8 https://www.proteinatlas.org/ENSG00000158887-MPZ https://www.proteinatlas.org/ENSG00000158887-MPZ https://genevisible.com/tissues/HS/UniProt/P25189 https://www.proteinatlas.org/ENSG00000105227-PRX https://www.proteinatlas.org/ENSG00000105227-PRX https://genevisible.com/tissues/HS/UniProt/Q9BXM0 https://genevisible.com/tissues/HS/UniProt/Q9BXM0 http://www.proteinatlas.org/ENSG00000147588/ http://www.proteinatlas.org/ENSG00000147588/ https://genevisible.com/tissues/HS/UniProt/P02689 35 Figura 6 - Haplótipos de HLAs selecionados para a predição de peptídeos. Legenda - Azul, haplótipo selecionado; Amarelo, haplótipo não selecionado. 36 Tabela 2 – Proteínas imunogênicas do EBV selecionadas para a predição de ligantes de HLA. Proteína Abreviação EpitoposEnsaios Apoptosis regulator BHRF1 BHRF1 7 12 DNA polymerase catalytic subunit BALF5 1 22 DNA polymerase processivity factor BMRF1 BMRF1 1 4 Envelope glycoprotein B BALF4 9 14 Envelope glycoprotein GP350 BLLF1 3 8 Envelope glycoprotein H BXLF2 1 6 Envelope glycoprotein L BKRF2 1 1 Epstein-Barr nuclear antigen 1 EBNA1 68 230 Epstein-Barr nuclear antigen 2 EBNA2 8 51 Epstein-Barr nuclear antigen 3 EBNA3 3 10 Epstein-Barr nuclear antigen 4 EBNA4 4 4 Epstein-Barr nuclear antigen 6 EBNA6 16 50 Epstein-Barr nuclear antigen leader protein EBNA-LP 1 1 Glycoprotein 42 BZLF2 1 1 Inner tegument protein BOLF1 1 1 Large tegument protein deneddylase BPLF1 2 5 Latent membrane protein 1 LMP1 15 53 Latent membrane protein 2 LMP2 14 70 Major capsid protein MCP 5 15 Major DNA-binding protein BALF2 2 4 Major tegument protein BNRF1 18 20 mRNA export factor ICP27 homolog BMLF1 1 5 Nuclear egress protein 2 NEC2 1 2 Replication and transcription activator BRLF1 1 2 Ribonucleoside reductase small subunit RIR2 1 3 Secreted protein BARF1 BARF1 17 17 Trans-activator protein BZLF1 BZLF1 4 11 Triplex capsid protein 1 TRX1 2 10 4.4 Predição de peptídeos lineares de CD4 ligantes de moléculas de HLA Foram selecionados 21 alelos de HLA para a predição de peptídeos (quatro HLAs DRB3/4/5, seis DQA1/DQB1 e onze DRB1). A predição de ligantes de HLAs das proteínas do sistema nervoso retornou 5904 pelo servidor NetMHCII e 4206 pelo NetMHCIIPan. Já a predição de peptídeos do EBV obteve 86325 peptídeos preditos pelo NetMHCII e 52944 pelo NetMHCIIPan. Após o processo de filtragem e https://docs.google.com/spreadsheets/d/1Sqj7lGP9J3GVDsu1OmkOteLvBTHQM9do/edit?usp=sharing&ouid=117269501484698792157&rtpof=true&sd=true 37 identificação de preditos comuns aos dois servidores, o resultado final possui 1695 peptídeos para as proteínas do sistema nervoso e 24912 para as proteínas do EBV. A figura 7 sumariza o resultado de cada uma das proteínas do sistema nervoso e das proteínas do EBV. Figura 7 - Quantidade de ligantes preditos pelos servidores NetMHCII e NetMHCIIPan e por ambos, para cada proteína do sistema nervoso e proteínas do EBV. Legenda - Azul: Total de ligantes de HLA preditos pelo NetMHCII. Amarelo: Total de ligantes de HLA preditos pelo NetMHCIIPan. 38 4.5 Análise de identidade entre nonâmeros do EBV e nonâmeros de proteínas do sistema nervoso e predição de imunogenicidade. Os resultados da análise de identidade das proteínas APLP1, CNP, GlialCam, MAG, MBP, MOBP, P0, P2, Periaxina e PLP estão mostrados nas tabelas S2–S11, respectivamente. A figura 8 sumariza os resultados de todas as proteínas. Figura 8 - Gráficos UpSet da análise de identidade entre nonâmeros das proteínas do sistema nervoso e do EBV. 39 Legenda - Os peptídeos selecionados foram categorizados de acordo com a regra a qual eles obedecem e agrupados conforme quais foram as posições que apresentaram identidade. O gráfico “Intersection size” mostra o tamanho de cada conjunto. Observou-se diferenças quanto à quantidade de pares selecionados por critério de seleção. Em todas as proteínas há predomínio de pares selecionados de acordo com o critério 2 (P5 - 2 x P2/P3/P8 - 1 x P4/P6/P7), o que pode ser explicado pelo fato de esse conter o maior número de combinações de resíduos idênticos. O critério 3 (P5 - 1 x P2/P3/P8 - P4-P6-P7), por estar restrito a pares com cinco ou mais resíduos idênticos e apresentar poucas combinações possíveis, foi o com menor quantidade de nonâmeros selecionados, estando presente apenas em três proteínas (APLP1, Periaxina e PLP). Apenas as proteínas APLP1, MBP, Periaxina, GlialCam e PLP apresentaram peptídeos com potencial imunogênico (tabela 3). As tabelas suplementares estão em link de acesso externo, disponível no apêndice B. Tabela 3 - Peptídeos de proteínas do sistema nervoso classificados como imunogênicos SN Proteína SN Peptídeo Nonâmero - SN Proteína Nonâmero - EBV Proteína EBV Proteína APLP1 LLLLLLRAQPAIGSL, PLLLLLLRAQPAIGS, LPLLLLLLRAQPAIG LLLLRAQPA LLLMRAGKG EBNA3 APLP1 PLLLLLLRAQPAIGS LLLLRAQPA LLLMRAGKR EBNA3 APLP1 PLLLLLLRAQPAIGS LLLLRAQPA LLLMRAGKG EBNA3 APLP1 LALRRYLRAEQKEQR YLRAEQKEQ YLRAEAEAV BOLF1 MBP VHFFKNIVTPRTPPP FKNIVTPRT YKNRVASRK BZLF1 MBP RPHLIRLFSRDAPGR, PHLIRLFSRDAPGRE IRLFSRDAP WRLCSRPLL BOLF1 MBP VVHFFKNIVTPRTPP, PVVHFFKNIVTPRTP, NPVVHFFKNIVTPRT, ENPVVHFFKNIVTPR, DENPVVHFFKNIVTP, QDENPVVHFFKNIVT VHFFKNIVT YHFVKKHVH BALF5 MBP NPVVHFFKNIVTPRT VHFFKNIVT YHFVKKHVH BALF5 Periaxin NFKYEDALRLLQCAE, ENFKYEDALRLLQCA YEDALRLLQ LEQALMRLA MCP GlialCam RGALSRASRALRLAP, ERGALSRASRALRLA LSRASRALR ASVASARLS BPLF1 PLP FIAAFVGAAATLVSL, LFIAAFVGAAATLVS, IAAFVGAAATLVSLL FVGAAATLV AIGAAATRI EBNA3 40 Amyloid Beta Precursor Like Protein 1 (APLP1) Houve 35 nonâmeros da proteína APLP1 com identidade relevante com nonâmeros do EBV (tabela S2, figura 8B). Destaca-se o HLA- DQA1*05:01/DQB1*03:01, o qual participa de 11 pares de nonâmeros. O par formado pelo nonâmero VEGAEDEEE e AEGAEDEEG da proteína BOLF1 de EBV apresentou o maior score de similaridade (36) e maior identidade (7/9) entre todas as proteínas, além de esse nonâmero da APLP1 também estar presente em cinco pares, três deles selecionados pelo critério 1 (P2-P3-P5-P8). Outro par selecionado pelo critério 1 foi o MLTLEEQQLAPLP1/SLTLEPIQDBMLF1, com 5 resíduos idênticos. Quatro pares (LLLLRAQPAAPLP1/LLLMRAGKGEBV, LLLLRAQPAAPLP1/LLLMRAGKGEBV, YLRAEQKEQAPLP1/YLRAEAEAKEBV e NQSLGLLDQAPLP1/MQSYGLERLEBV) ligam-se a alelos do haplótipo DR15 (DRB1*15:01, DRB5*01:01 e DQA1*01:02-DQB1*06:02), conhecidos como fator de risco na MS (MARTIN et al., 2021). Os nonâmeros LLLLRAQPA e YLRAEQKEQ destacam-se por estarem presentes em peptídeos de 15 aminoácidos preditos como imunogênicos (tabela 3). 2',3'-Cyclic Nucleotide 3' Phosphodiesterase (CNP) A análise de identidade da proteína CNP apresentou oito pares de nonâmeros selecionados, todos pelo critério 2 (P5 - 2 x P2/P3/P8 - 1 x P4/P6/P7) (tabela S3, figura 8C). Os nonâmeros TTGARVELS e VEAVQTGLD formam os dois pares com maior identidade (5/9). Além disso, dois pares (YKITPGARGCNP/LKIHPGVAMEBV, TTGARVELSCNP/AEGLRVLLAEBV) ligam-se a HLAs do haplótipo DR15. Hepatic And Glial Cell Adhesion Molecule (GlialCam) Foram selecionados 20 pares de nonâmeros da proteína GlialCam (tabela S4, figura 8D). Cinco pares, todos com cinco resíduos idênticos, são formados pelos nonâmeros LVASTTVLE da GlialCam e YEASTTYLS da proteína BXLF2 do EBV, porque ambos se ligam a HLAs (DRB1*04:05, DQA1*03:01-DQB1*03:02, DRB1*04:01, DRB1*09:01 e DRB1*13:02) que estão contidos em haplótipos. O nonâmero YSVSPAVPG forma cinco pares, quatro deles selecionados pelo critério 1 (P2-P3-P5-P8). Um nonâmero, LSRASRALR, está contido em peptídeos de 15 aminoácidos preditos como imunogênicos (tabela 3). O par ERGALSRASGlialCam/SEGALALAGEBV) liga-se ao HLA-DQA1*01:02-DQB1*06:02. 41 Myelin Associated Glycoprotein (MAG) Foram encontrados oito pares de nonâmeros da proteína MAG com identidade relevante com nonâmeros do EBV, todos selecionados pelo critério 2 (P5 - 2 x P2/P3/P8 - 1 x P4/P6/P7) (tabela S5, figura 8E). O nonâmero AESLLLELE destaca-se por formar três pares, um deles com o maior score de similaridade (22). Myelin Basic Protein (MBP) A proteína MBP mostrou nove pares de nonâmeros identificados segundo os critérios de seleção (tabela S6, figura 8A). O nonâmero VHFFKNIVT liga-se aos HLAs DRB1*08:02 e DRB1*15:01, formando dois pares selecionados pelo critério 1 (P2-P3- P5-P8), e destaca-se por estar presente em peptídeos de 15 aminoácidos imunogênicos (tabela 3). Outro par selecionado pelo critério 1 foi o FKNIVTPRTMBP/YKNRVASRKEBV, ambos ligantes do HLA-DRB5*01:01. Outros nonâmeros também classificados como possivelmente imunogênicos são o FKNIVTPRT e IRLFSRDAP. MyelinAssociated Oligodendrocyte Basic Protein (MOBP) Apenas foi identificado um par de nonâmeros para a proteína MOBP, o qual possui 4 resíduos idênticos, foi selecionado pelo critério 2 (P5 - 2 x P2/P3/P8 - 1 x P4/P6/P7) e liga-se ao HLA-DRB5*01:01 (tabela S7, figura 8F). Myelin Protein Zero (MPZ) Houve cinco pares de nonâmeros selecionados da proteína P0, todos classificados segundo o critério 2 (P5 - 2 x P2/P3/P8 - 1 x P4/P6/P7) e com quatro resíduos idênticos (tabela S8, figura 8G). Os nonâmeros mais relevantes foram LVLSPAQAI, por formar o par com maior similaridade (21), e VLGAVIGGV, por estar em dois pares. Myelin P2 protein (PMP2) Foram encontrados quatro pares de nonâmeros para a proteína P2, os quais foram selecionados pelo critério 2 (P5 - 2 x P2/P3/P8 - 1 x P4/P6/P7) a apresentam 4 resíduos idênticos (tabela S9, figura 8H). O nonâmero VGLATRKLG se sobressair por estar presente em dois pares. 42 Periaxin (PRX) 35 pares de nonâmeros foram localizados para a proteína (tabela S10, figura 8I). O HLA-DQA1*05:01/DQB1*03:01 é o com a maior quantidade de pares de nonâmeros (22). O nonâmero VGVDLALPG forma três pares, um deles, com o nonâmero FGSDLALPS da proteína BOLF1, apresentou score de similaridade 29 e maior identidade (6/9). Outro par com score de similaridade 29 foi o (SETGAPGPAPeriaxin/ENTGAPAPPEBV) e identidade 5/9. O nonâmero PRPAAPEVV está presente na maior quantidade de pares, 6. Um par formado pelo nonâmero TEAAELVPG foi selecionado pelo critério 1 (P2-P3-P5-P8). O nonâmero YEDALRLLQ destaca-se por participar de peptídeos de 15 aminoácidos preditos como imunogênicos (tabela 3). Quatro pares são formados por nonâmeros que se ligam ao HLA-DQA1*01:02-DQB1*06:02. Myelin proteolipid protein (PLP1) Oito pares de nonâmeros foram localizados para a proteína PLP (tabela S11, figura 8J). Nonâmeros contendo o segmento (F)VGAAATLV(S) estão presentes em cinco pares, todos com participação do HLA-DQA1*05:01/DQB1*03:01 e quatro deles com cinco resíduos idênticos. O nonâmero FYTTGAVRQ liga a três HLAs diferentes, formando três pares. Um nonâmero (FVGAAATLV) está contido em peptídeos de 15 aminoácidos preditos como imunogênicos (tabela 3). 5 DISCUSSÃO Neste estudo foi realizada uma ampla predição de identidade de resíduos importantes para a interação com o TCR entre pares de nonâmeros de proteínas do EBV e do sistema nervoso. Todas as dez proteínas do sistema nervoso, em maior ou menor grau, foram identificadas como possíveis alvos de células T CD4+ autorreativas, haja vista a identidade entre os pares de nonâmeros. Algumas proteínas do sistema nervoso ainda apresentaram peptídeos imunogênicos, o que implica maior potencial de estimular células T CD4+. Várias evidências epidemiológicas e sorológicas sustentam o papel do EBV na etiologia da esclerose múltipla (SOLDAN; LIEBERMAN, 2023). Um grande estudo recente de base populacional demonstrou que a infecção por EBV é um importante fator de risco para o desenvolvimento da esclerose múltipla (BJORNEVIK et al., 2022). Entretanto, a natureza ubíqua do EBV, que infecta cerca de 95% dos adultos – dos 43 quais apenas uma pequena fração desenvolve esclerose múltipla –, indica que outros fatores contribuem para a patogênese (BJORNEVIK et al., 2022; ROBINSON; STEINMAN, 2022). Apesar de haver correlação entre infecção antecedente por EBV e o subtipo AIDP (KUWABARA, S. et al., 2004; OGAWARA et al., 2000; TAHERAGHDAM et al., 2014) e de existir associação de uma infecção prévia pelo vírus com o risco de desenvolver a SGB (independente do subtipo) (TAM et al., 2007), há carência de evidências na literatura que sustentem essa relação e não se conhece como o vírus pode contribuir para o desenvolvimento da doença. Pelo fato de os prováveis mecanismos autoimunes na AIDP serem desconhecidos e de ter sido detectada infecções multivirais simultâneas em indivíduos com essa condição, alguns autores propuseram uma hipótese suplementar de que uma inflamação local associada à imunidade inata contra infecções virais ou bacterianas seria a responsável pelo dano primário aos nervos periféricos, enquanto que a produção de autoanticorpos seria um processo complementar secundário (ZIGANSHIN et al., 2016). As proteínas do sistema nervoso investigadas neste trabalho foram escolhidas independentemente de sua localização celular. Foi demonstrado que peptídeos apresentados por moléculas de MHC II são originados da membrana plasmática e dos compartimentos nuclear, intracelular e extracelular (ABELIN et al., 2019; BOZZACCO et al., 2011). A captura dos antígenos pelas células apresentadoras de antígenos (APC, do inglês Antigen Presenting Cells) pode ocorrer através de uma série de mecanismos, como macropinocitose, endocitose e fagocitose (ROCHE; FURUTA, 2015). Esses três mecanismos de captura de antígenos captam material extracelular e o transportam para o interior da célula. Essa premissa permite inferir que proteínas de qualquer compartimento celular podem ser apresentadas por moléculas de MHC de classe II desde que em algum momento sejam liberadas para o meio extracelular. Em amostras de indivíduos saudáveis, os ligantes de HLA são primariamente proteínas de membrana e extracelulares (MARCU et al., 2021). Entretanto, é preciso levar em conta a apresentação de antígenos pelo MHC II no contexto de processos inflamatórios, como o que acontece em doenças autoimunes. Através do mecanismo conhecido por espalhamento de epítopos, após um dano tecidual inicial, ocorre a liberação do conteúdo celular, expondo autoantígenos os quais podem ser captados por APCs a apresentados aos linfócitos T autorreativos (SUNDARESAN et al., 2023; VANDERLUGT; MILLER, 2002). A ocorrência de espalhamento de epítopos é bem 44 conhecida no modelo animal de esclerose múltipla (MCMAHON et al., 2005; SUNDARESAN et al., 2023; TIAN; SONG; KAUFMAN, 2021). Um provável fator iniciador da esclerose múltipla é um infecção prévia pelo EBV, mas o seu papel para a progressão da doença é pouco compreendido (BJORNEVIK et al., 2023; SOLDAN; LIEBERMAN, 2023). Pode-se questionar que para a produção de autoanticorpos é preciso que os antígenos apresentados aos linfócitos T CD4+ sejam de membrana. Entretanto, mecanismos imunopatológicos envolvem não apenas a produção de autoanticorpos, mas também a participação de células da imunidade inata, como macrófagos, as quais são ativadas com auxílio de citocinas secretadas por linfócitos T auxiliares (ABBAS; LICHTMAN; PILLAI, 2023). De fato, a imunopatologia tanto da esclerose múltipla como da SBG é, em parte, devido a outros mecanismos imunes, como a fagocitose mediada por macrófagos (ATTFIELD et al., 2022; SHAHRIZAILA; LEHMANN; KUWABARA, 2021). A busca de proteínas no SNC está em consonância com análises de proteoma que relataram CNP, MAG, MBP, MOBP e PLP entre as de maior abundância relativa no SNC (JAHN; TENZER; WERNER, 2009). Essas proteínas são candidatos proeminentes na patologia da esclerose múltipla por causa de sua maior quantidade e maior expressão na mielina do SNC em comparação a outros tecidos. Os autoantígenos não são necessariamente expressos exclusiva ou primariamente no órgão afetado (BRONGE et al., 2022). Alguns exemplos são os autoantígenos identificados na esclerose múltipla RAS guanyl-releasing protein 2 (JELCIC et al., 2018), GDP-L-fucose (PLANAS et al., 2018) e o αB-crystalline (VAN NOORT et al., 2010) que não são específicos do SNC. Análises de proteoma descobriram P0 e Periaxina como as proteínas mais abundantes na mielina do SNP de ratos (PATZIG et al., 2011; SIEMS et al., 2020). A proteína MBP apresenta maior abundância absoluta no SNC, porém a abundância relativa é a mesma do SNP (DE MONASTERIO-SCHRADER et al., 2012). As proteínas MAG e CNP também são abundantes em ambas as mielinas. Assim, pode-se questionar porque linfócitos