Buscar

Investigacaoinsilicopeptideos_Patrocinio_2023

Prévia do material em texto

UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE 
INSTITUTO METRÓPOLE DIGITAL 
PROGRAMA DE PÓS-GRADUAÇÃO EM BIOINFORMÁTICA 
MESTRADO ACADÊMICO EM BIOINFORMÁTICA 
 
 
 
 
 
HELMUT KENNEDY AZEVEDO DO PATROCÍNIO 
 
 
 
 
 
 
INVESTIGAÇÃO IN SILICO DE PEPTÍDEOS DE PROTEÍNAS DO SISTEMA 
NERVOSO COMO CANDIDATOS DE MIMETISMO MOLECULAR NA SÍNDROME 
DE GUILLAIN-BARRÉ E NA ESCLEROSE MÚLTIPLA DESENCADEADAS PELO 
VÍRUS EPSTEIN-BARR 
 
 
 
 
 
 
 
 
 
 
 
Natal 
Outubro, 2023 
Helmut Kennedy Azevedo do Patrocínio 
 
 
Investigação In silico de peptídeos de proteínas do sistema nervoso 
como candidatos de mimetismo molecular na síndrome de Guillain-Barré e na 
esclerose múltipla desencadeadas pelo vírus Epstein-Barr 
 
 
 
Dissertação de mestrado apresentada ao 
Programa de Pós-Graduação em 
Bioinformática da Universidade Federal do 
Rio Grande do Norte como requisito parcial 
para a obtenção do grau de Mestre em 
Bioinformática. 
 
Linha de pesquisa: Desenvolvimento de 
Produtos e Processos 
 
 
 
Orientador: 
Prof. Dr. João Paulo Matos Santos Lima 
 
 
 
 
 
 
 
 
 
Natal 
Outubro, 2023 
 
 
 
 
 
 
Universidade Federal do Rio Grande do Norte - UFRN 
Sistema de Bibliotecas - SISBI 
Catalogação de Publicação na Fonte. UFRN - Biblioteca Central Zila Mamede 
 
Patrocínio, Helmut Kennedy Azevedo do. 
 Investigação in silico de peptídeos de proteínas do sistema 
nervoso como candidatos de mimetismo molecular na síndrome de 
Guillain-Barré e na esclerose múltipla desencadeadas pelo vírus 
Epstein-Barr / Helmut Kennedy Azevedo do Patrocínio. - 2023. 
 71 f.: il. 
 
 Dissertação (mestrado) - Universidade Federal do Rio Grande 
do Norte, Instituto Metrópole Digital, Pós-Graduação em 
Bioinformática. Natal, RN, 2023. 
 Orientação: Prof. Dr. João Paulo Matos Santos Lima. 
 
 
 1. Síndrome de Guillain-Barré - Dissertação. 2. Mimetismo 
Molecular - Dissertação. 3. Reação Cruzada - Dissertação. 4. 
Interação pMHC-TCR - Dissertação. 5. Esclerose Múltipla - 
Dissertação. I. Lima, João Paulo Matos Santos. II. Título. 
 
RN/UF/BCZM CDU 616.833-002(043.3) 
 
 
 
 
Elaborado por Fernanda de Medeiros Ferreira Aquino - CRB-15/301 
Helmut Kennedy Azevedo do Patrocínio 
 
Investigação In silico de peptídeos de proteínas do sistema nervoso 
como candidatos de mimetismo molecular na síndrome de Guillain-Barré e na 
esclerose múltipla desencadeadas pelo vírus Epstein-Barr 
 
Defesa de mestrado apresentada ao Programa de Pós-Graduação em Bioinformática 
da Universidade Federal do Rio Grande do Norte 
 
 
Área de concentração: Bioinformática 
Linha de pesquisa: Desenvolvimento de Produtos e Processos 
Orientador: Prof. Dr. João Paulo Matos Santos Lima 
 
Natal, 2023 
 
 
 
 
 BANCA EXAMINADORA 
 
 
_________________________________________ 
Prof. Dr. João Paulo Matos Santos Lima 
Centro Multiusuário de Bioinformática – IMD/UFRN 
 
_________________________________________ 
Profa. Dra. Ândrea Kelly Ribeiro dos Santos 
Instituto de Ciências Biológicas - UFPA 
 
_________________________________________ 
Prof. Dr. João Firmino Rodrigues Neto 
Escola Multicampi de Ciências Médicas do Rio Grande do Norte - UFRN 
 
_________________________________________ 
Dra. Jéssika de Oliveira Viana 
Pós-doc no Instituto Nacional de Ciências e Tecnologia em Ciências Moleculares 
(INCT-CiMOL) 
AGRADECIMENTOS 
Agradeço primeiramente aos meus pais, Ezivaldo do Patrocínio e Maria 
Aparecida Azevedo do Patrocínio, por me oferecem todo o amor e cuidado que foram 
tão importantes para me ajudar a finalizar mais essa importante etapa da minha vida. 
Também agradeço às minhas irmãs Marianne e Gracianne e aos meus amigos 
Heriberto (Betinho) e Róbson por estarem me apoiando e torcendo por mim. 
Agradeço a todos os amigos e pessoas incríveis que conheci desde o início da 
graduação até o final do mestrado, por me apresentarem a novos conhecimentos, 
experiências e vivências que moldaram a pessoa que sou hoje. Agradeço aos amigos 
da EMCM por terem sido companhia e conforto nessa jornada de iniciar uma nova 
graduação enquanto se finaliza o mestrado. 
Agradeço ao professor Dr. João Paulo, por ter aceitado me orientar e ajudar no 
desenvolvimento do pensamento crítico e científico tão necessário para a elaboração 
deste trabalho e para a vida. Um agradecimento especial à Tayná, por ter me ajudado 
tanto. Não posso deixar de agradecer a Themístocles (Themi), por ter orientado 
quando dei os primeiros passos na bioinformática. 
Agradeço aos membros da banca por dedicarem algum tempo de suas vidas a 
avaliar este trabalho e me auxiliar nesse processo de final do mestrado. 
Agradeço a todos os professores e professoras do Programa de Pós-
Graduação em Bioinformática por oferecerem um pouco de seus conhecimentos aos 
alunos. 
O presente trabalho foi realizado com apoio da Coordenação de 
Aperfeiçoamento de Pessoal de Nível Superior – Brasil (CAPES) – Código de 
Financiamento 001. 
 
 
 
RESUMO 
A Síndrome de Guillain-Barré (SGB) e a esclerose múltipla são doenças autoimunes 
associadas a resposta imunológica contra autoantígenos do sistema nervoso 
periférico (SNP) e central, respectivamente. A maioria dos estudos sobre a 
imunopatologia da SGB investigam a reação cruzada entre antígenos de 
gangliosídeos da bainha de mielina e carboidratos da bactéria Campylobacter jejuni. 
Entretanto, a SGB apresenta um espectro de subtipos e, particularmente, a forma 
desmielinizante possui poucas evidências de relação com C. jejuni ou de 
autoimunidade contra gangliosídeos. Já a imunopatologia da esclerose múltipla é mais 
conhecida e diversos autoantígenos proteicos foram relatados. Como o vírus Epstein-
Barr (EBV) pode representar um fator de risco potencial tanto para a esclerose múltipla 
quanto para a forma desmielinizante da SGB, a presente investigação visa identificar 
resíduos cruciais entre potenciais epítopos de linfócitos T CD4+ do EBV e proteínas 
do sistema nervoso como um meio de sugerir como a infecção por este vírus pode 
contribuir para a patogênese de doenças. Bancos de dados biológicos foram usados 
para a seleção de proteínas abundantes no sistema nervoso, proteínas imunogênicas 
do EBV e haplótipos de HLA. Também foram utilizadas ferramentas computacionais 
para predição de peptídeos ligantes do HLA e de imunogenicidade. Um algoritmo em 
linguagem Python foi desenvolvido para comparação de identidade entre os resíduos 
dos nonâmeros. Foram encontradas 10 proteínas do sistema nervoso e 28 do EBV, 
as quais foram usadas na predição de peptídeos ligantes de 21 HLAs comuns na 
população mundial. Foram localizados ao todo 1411 haplótipos, os quais se distribuem 
entre 51 pares de HLAs. Os nonâmeros das proteínas do EBV e proteínas da mielina 
foram combinados em pares e comparados quanto a identidade em resíduos críticos 
para a interação com o receptor de células T (TCR). Para tal comparação foram 
propostos três critérios de seleção de acordo com a relevância de cada contato para 
interação TCR-peptídeo-MHC. O contato principal deve estar localizado na posição 
P5, enquanto as posições P2, P3 e P8 são secundárias e P4, P6 e P7 são terciárias. 
A proteína Periaxina, que nunca foi estudada como fonte de autoantígenos, 
apresentou a maior quantidade de pares de nonâmeros entre as proteínas do SNP, 
35. Quatro pares de nonâmeros de APLP1, dois de CNP e dois da MBP ligam-se a 
alelos do haplótipo DR-15, conhecido como fator de risco para a esclerose múltipla. A 
nova abordagem aqui proposta baseada na identidade de sequência em resíduos 
críticos de contato do TCR revelou que vários peptídeos derivados de proteínas do 
sistema nervoso e do EBV compartilham identidade nesses resíduos, sugerindo a 
possibilidade de reatividade cruzada entre eles. Os pares de nonâmeros aqui 
encontrados podem subsidiar a investigação de autoantígenos em experimentos 
laboratoriais.Palavras chave: Síndrome de Guillain-Barré. Mimetismo Molecular. Reação Cruzada. 
Interação pMHC-TCR. Esclerose múltipla. 
 
ABSTRACT 
Guillain-Barré Syndrome (SBG) and multiple sclerosis are autoimmune diseases 
associated with an immune response against peripheral (PNS) and central nervous 
system autoantigens, respectively. Most studies on the immunopathology of SBG 
investigate the cross-reaction between myelin sheath ganglioside antigens and 
carbohydrates from the bacteria Campylobacter jejuni. However, SBG has a spectrum 
of subtypes, and, particularly, the demyelinating form has little evidence of a 
relationship with C. jejuni or of autoimmunity against gangliosides. The 
immunopathology of multiple sclerosis is better known, and several autoantigens are 
known. As the Epstein-Barr virus (EBV) may represent a potential risk factor for both 
multiple sclerosis and the demyelinating form of SBG, the present investigation aims 
to identify crucial residues among potential EBV CD4+ T lymphocyte epitopes and 
nervous system proteins as a means of suggesting how infection by this virus may 
contribute to the pathogenesis of disease. We utilized biological databases to select 
proteins abundant in the nervous system, EBV immunogenic proteins, and HLA 
haplotypes. Computational tools were employed for predicting HLA-binding peptides 
and immunogenicity. Additionally, we developed a Python algorithm to compare 
residue identity among nonamers. We found 10 proteins from the nervous system and 
28 from EBV, which were used to predict the binding peptides of 21 common HLAs in 
the world population. We located 1411 haplotypes distributed among 51 pairs of HLAs. 
Simulations were performed to determine whether nonamers from the EBV and 
nervous system proteins targeted TCR-contact residues. Three selection criteria were 
proposed according to the relevance of each contact for TCR-peptide-MHC interaction. 
The main contact must be located in position P5, while positions P2, P3 and P8 are 
secondary and P4, P6 and P7 are tertiary. Nonamers of EBV proteins and myelin 
proteins were combined in pairs and compared based on predefined selection criteria. 
The Periaxin protein, which has never been studied as a source of autoantigens, has 
the highest number of nonamer clusters among PNS proteins, with 35 pairs. Four 
clusters of nonamers from APLP1, two from CNP, and two from MBP bind to alleles of 
the haplotype DR-15, known as a risk factor for multiple sclerosis. The new approach 
proposed here, based on sequence identity at critical contact residues of the TCR, has 
revealed that several peptides derived from nervous system and EBV proteins share 
identical residues at these critical contact points. This suggests the possibility of cross-
reactivity between them. The nonamer pairs discovered in this study have the potential 
to support further investigations into autoantigens through laboratory experiments. 
 
Keywords: Guillain-Barré syndrome. Molecular Mimicry. Cross-reactivity. pMHC-TCR 
interaction. Multiple sclerosis. 
LISTA DE TABELAS 
Tabela 1 - Proteínas do sistema nervoso selecionadas para a predição de ligantes de 
HLA .......................................................................................................................32-33 
Tabela 2 – Proteínas imunogênicas do EBV selecionadas para a predição de ligantes 
de HLA........................................................................................................................35 
Tabela 3 - Peptídeos de proteínas do sistema nervoso classificados como 
imunogênicos.............................................................................................................38 
 
 
LISTA DE FIGURAS 
Figura 1 - Representação da interação HLA-peptídeo...............................................21 
Figura 2 - Representação do receptor de células T................................................... 22 
Figura 3 - Estrutura do complexo MHCII-peptídeo-TCR.............................................23 
Figura 4 - Esquema ilustrando o fluxo de trabalho da metodologia para identificar a 
identidade cruzada entre peptídeos............................................................................26 
Figura 5 - Filtros utilizados para a busca de antígenos de EBV no IEDB.....................29 
Figura 6 - Haplótipos de HLAs selecionados para a predição de peptídeos..............34 
Figura 7 - Quantidade de ligantes preditos pelos servidores NetMHCII e NetMHCIIPan 
e por ambos, para cada proteína do sistema nervoso e proteínas do EBV..................36 
Figura 8 - Gráficos UpSet da análise de identidade entre nonâmeros das proteínas do 
sistema nervoso e do EBV..........................................................................................37 
 
 
 
 
LISTA DE ABREVIATURAS E SIGLAS 
SGB - Síndrome de Guillain-Barré 
SNP - Sistema Nervoso Periférico 
AIDP - Acute Inflammatory Demyelinating Polyradiculoneuropathy, 
Polirradiculoneuropatia desmielinizante inflamatória aguda 
AMAN - Acute Motor Axonal Neuropathy, Neuropatia Axonal Motora Aguda 
AMSAN - Acute motor and sensory axonal neuropathy, Neuropatia axonal motora e 
sensorial aguda 
MFS - Miller Fisher syndrome, Síndrome de Miller Fisher 
Th - T helper, T auxiliar 
MHC - Major Histocompatibility Complex, Complexo de Histocompatibilidade Principal 
TCR - T-Cell Receptor, receptor de células T 
CDR - Complementary-determinant region, região determinante de 
complementariedade 
EBV - Epstein-Barr vírus 
SNC - Sistema Nervoso Central 
HLA - Human Leukocyte Antigen, Antígeno Leucocitário Humano 
IEDB - Immune Epitope Database 
AFND - Allele Frequency Net Database 
APC - Antigen Presenting Cells, Células Apresentadoras de antígenos 
 
 
SUMÁRIO 
1 INTRODUÇÃO E JUSTIFICATIVA ......................................................................... 13 
1.1 Doenças autoimunes ....................................................................................... 13 
1.2 Síndrome de Guillain-Barré ............................................................................. 14 
1.3 Esclerose múltipla ........................................................................................... 17 
1.4 Apresentação de antígenos a linfócitos T auxiliares ....................................... 21 
1.5 Justificativa e relevância do trabalho .............................................................. 24 
2 OBJETIVOS ........................................................................................................... 26 
2.1 Objetivo Geral ................................................................................................. 26 
2.2 Objetivos Específicos ...................................................................................... 26 
3 MÉTODOS ........................................................................................................... 27 
3.1 Seleção de proteínas do SNP e do SNC......................................................... 28 
3.2 HLAs mais comuns na população global e busca por haplótipos ................... 29 
3.3 Seleção de proteínas imunogênicas do vírus Epstein-Barr ............................. 29 
3.4 Predição de peptídeos em proteínas do EBV e do sistema nervoso com 
potencial de se ligar às moléculas de HLA ........................................................... 30 
3.5 Análise de identidade entre os nonâmeros de peptídeos dos vírus EBV e de 
epítopos das proteínas do sistema nervoso. ......................................................... 30 
3.6 Predição de imunogenicidade de células T CD4 ............................................. 32 
3.7 Processamento de dados................................................................................ 32 
4 RESULTADOS ....................................................................................................... 33 
4.1 Busca de proteínas do sistema nervoso .........................................................33 
4.2 Busca de haplótipos e seleção de alelos de HLA ........................................... 33 
4.3 Busca de proteínas imunogênicas do EBV ..................................................... 34 
4.4 Predição de peptídeos ligantes de moléculas de HLA .................................... 36 
4.5 Análise de identidade entre nonâmeros do EBV e nonâmeros de proteínas do 
sistema nervoso e predição de imunogenicidade. ................................................ 38 
Amyloid Beta Precursor Like Protein 1 (APLP1) ...................................... 40 
2',3'-Cyclic Nucleotide 3' Phosphodiesterase (CNP) ................................ 40 
Hepatic And Glial Cell Adhesion Molecule (GlialCam) ............................. 40 
Myelin Associated Glycoprotein (MAG) ................................................... 41 
Myelin Basic Protein (MBP) ..................................................................... 41 
Myelin Associated Oligodendrocyte Basic Protein (MOBP) ..................... 41 
 
 
Myelin Protein Zero (MPZ) ....................................................................... 41 
Myelin P2 protein (PMP2) ........................................................................ 41 
Periaxin (PRX) ......................................................................................... 42 
Myelin proteolipid protein (PLP1) ........................................................... 42 
5 DISCUSSÃO .......................................................................................................... 42 
6 CONCLUSÃO ......................................................................................................... 51 
REFERÊNCIAS ......................................................................................................... 52 
APÊNDICE A – Algoritmo para análise de identidade entre nonâmeros ................... 65 
APÊNDICE B – Material suplementar ....................................................................... 72 
 
 
 
13 
 
1 INTRODUÇÃO E JUSTIFICATIVA 
1.1 Doenças autoimunes 
Doenças autoimunes são condições crônicas iniciadas com a perda da 
tolerância imunológica aos antígenos próprios, resultando em resposta imune dirigida 
a tais antígenos e, consequentemente, aos tecidos e órgãos onde eles são 
localizados. Assim, as doenças autoimunes podem ser sistêmicas - caracterizadas 
pela reatividade contra antígenos localizados em vários tecidos - ou tecido-específicas 
– quando o autoantígeno se localiza em algum tecido específico. As características 
epidemiológicas variam quanto a incidência e prevalência, faixa etária, sexo biológico, 
idade de início, hereditariedade, área geográfica e grupo étnico (WANG, L.; WANG; 
GERSHWIN, 2015). 
As doenças autoimunes são condições causadas por múltiplos fatores 
ambientais e genéticos que, combinados, geram uma autoimunidade patológica 
(WANG, L.; WANG; GERSHWIN, 2015). Quanto aos fatores genéticos, existem 
múltiplos genes HLA (do inglês human leukocyte antigen) e não-HLA que contribuem 
para a susceptibilidade à doença (SELDIN, 2015). Os agentes infecciosos são os 
fatores ambientais mais bem estudados, com várias evidências geoepidemiológicas, 
sorológicas e moleculares que os associam a doenças autoimunes, o que pode 
fornecer indícios a respeito dos fatores responsáveis por desencadear a patogênese 
da autoimunidade (BOGDANOS et al., 2013). 
Os mecanismos pelos quais os agentes infecciosos podem desencadear 
respostas autoimunes incluem ativação bystander, espalhamento de epítopos e 
mimetismo molecular. Ativação bystander é o termo usado para designar a ativação 
de linfócitos independente de estimulação por antígeno, o que contribui para a 
produção de mediadores inflamatórios (LEE; CHO; CHOI, 2020). O espalhamento de 
epítopos é um mecanismo que resulta na geração de múltiplos neoepítopos, epítopos 
antigênicos que normalmente não são apresentados, devido ao dano tecidual 
provocado por um processo inflamatório inicial, contribuindo para a perpetuação da 
resposta imune (VANDERLUGT; MILLER, 2002). O mimetismo molecular é o 
mecanismo mais comum responsável por ativar células B e T autorreativas. É 
ocasionado pela similaridade entre antígenos do hospedeiro e de agentes infecciosos, 
que, se associada a fatores ambientais e genéticos, pode resultar em reação cruzada 
contra o antígeno próprio (ROJAS et al., 2018). Existem quatro critérios que devem 
14 
 
ser cumpridos para considerar que uma doença autoimune seja desencadeada por 
mimetismo molecular: identificar similaridade entre um antígeno de um agente 
infeccioso ou de um agente ambiental e antígenos do hospedeiro; detecção de células 
T ou autoanticorpos que reconhecem ambos os antígeno; associação epidemiológica 
entre exposição ao agente infeciosos ou ambiental e o desenvolvimento da doença 
autoimune; reprodução da doença autoimune em um animal modelo após 
sensibilização com o antígeno apropriado (ROJAS et al., 2018). 
1.2 Síndrome de Guillain-Barré 
A Síndrome de Guillain-Barré (SGB) é uma neuropatia periférica aguda 
caracterizada por resposta imunológica contra autoantígenos no sistema nervoso 
periférico (SNP) (KWAN; BILICILER, 2021). A progressão dos sintomas é rápida. 
Apenas alguns dias após o início, muitos pacientes são incapazes de andar devido a 
fraqueza, alguns podem até precisar de ventilação mecânica por causa do 
comprometimento dos músculos auxiliares da respiração (KWAN; BILICILER, 2021). 
Mesmo após a fase aguda, quando se inicia o período de recuperação, muitos 
pacientes ainda são incapazes de andar por até 6 meses, enquanto outros 
permanecem com sintomas como dor e fadiga por meses ou anos. A SGB não é uma 
única doença, mas sim representa um espectro de neuropatias periféricas 
caracterizadas por dano aos nervos periféricos, paralisia flácida, fraqueza nos 
membros, hiporreflexia ou arreflexia e pico de severidade (nadir) geralmente entre 
duas e quatro semanas após o início dos sintomas, o qual é seguido por um período 
de recuperação que dura desde algumas semanas até anos (HARDY et al., 2011; 
HUGHES; CORNBLATH, 2005; SHAHRIZAILA; LEHMANN; KUWABARA, 2021; VAN 
DEN BERG et al., 2014). Os subtipos mais comuns de SGB são as formas 
desmielinizante, Acute Inflammatory Demyelinating Polyradiculoneuropathy (AIDP), e 
axonal, Acute Motor Axonal Neuropathy (AMAN) (KUWABARA, Satoshi, 2011; VAN 
DEN BERG et al., 2014). Outros subtipos menos comuns são a Miller Fisher syndrome 
(MFS) e a Acute motor and sensory axonal neuropathy (AMSAN) (MORI; 
KUWABARA; YUKI, 2012; VAN DEN BERG et al., 2014). 
Os subtipos da SGB diferem em suas características clínicas, eletrofisiológicas, 
histológicas e imunopatogênese (KUWABARA, Satoshi; YUKI, 2013; VAN DEN BERG 
et al., 2014). AIDP é uma forma sensório-motora, na qual ocorre comprometimento 
dos nervos sensoriais e nervos motores. É caracterizada por polineuropatia 
15 
 
desmielinizante ao exame eletrofisiológico (HUGHES; CORNBLATH, 2005; VAN DEN 
BERG et al., 2014). Por outro lado, a AMAN é uma forma motora pura da SGB, 
caracterizada por neuropatia axonal ao exame eletrofisiológico. Déficits dos nervos 
cranianos, disfunção autonômica e dor são mais comuns na AIDP do que na AMAN 
(KUWABARA, Satoshi; YUKI, 2013). A MFS tem como característica clínica clássica 
a tríade oftalmoplegia, ataxia e arreflexia e é associada a déficits nos nervos cranianos 
responsáveis pelo movimento dos olhos (VAN DEN BERG et al., 2014). A AMSAN é 
uma forma axonal mais severa da SGB em que as fibras sensoriais e motoras são 
afetadas (KUWABARA, Satoshi; YUKI, 2013; VAN DEN BERG et al., 2014). 
A SGB é a causa mais comum de paralisia flácida em todo o mundo, com uma 
prevalência global estimada em 1.9 por 100.000 habitantes (BRAGAZZI et al., 2021). 
No Brasil, assim como em outros países, houve um aumento na incidência de SGB 
após a epidemia pelo Zika Vírus em 2015 e 2016 (LEONHARDet al., 2019; MALTA; 
RAMALHO, 2020; UNCINI; SHAHRIZAILA; KUWABARA, 2017). Entretanto, 
prevalência dos subtipos de SGB varia entre diferentes regiões (KIESEIER et al., 
2018). AIDP é a principal forma na América do Norte, Europa e Austrália, enquanto 
AMAN ocorre com maior frequência na Ásia, América Central e América do Sul 
(KIESEIER et al., 2018). 
Por volta de 60-70% dos casos de SGB manifestam os primeiros sintomas entre 
1 e 3 semanas após uma infecção aguda, geralmente uma infecção do trato 
respiratório superior ou infecção gastrointestinal (JACOBS, B. C. et al., 1998; 
KIESEIER et al., 2018). O patógeno que mais frequentemente causa uma infecção 
prévia ao diagnóstico de SBG é a bactéria Campylobacter jejuni. Outros patógenos 
também associados a uma infecção prévia são as bactérias Haemophilus influenzae 
e Mycoplasma pneumoniae e os vírus Citomegalovírus, Epstein-Barr vírus (EBV), Zika 
vírus e influenza A vírus (KIESEIER et al., 2018; VAN DEN BERG et al., 2014). 
Enquanto várias evidências sustentam que uma infecção prévia por C. jejuni 
contribui para desencadear o subtipo AMAN - incluindo estudos sorológicos, histórico 
de diarréia nas últimas três semanas e reação cruzada envolvendo gangliosídeos dos 
nervos periféricos e lipooligossacarídeos de C. jejuni (KIESEIER et al., 2018; 
KUWABARA, Satoshi; YUKI, 2013; VAN DEN BERG et al., 2014) -, um patógeno 
associado ao subtipo AIDP ainda é desconhecido. Alguns estudos sugerem que uma 
infecção recente por vírus pode contribuir para o desenvolvimento de AIDP. 
Kuwabara et al. (2004) relataram que 13 de 14 pacientes com infecção recente por 
16 
 
citomegalovírus ou EBV eram portadores de AIDP. Resultado similar foi observado 
por Ogawara et al. (2000), cuja pesquisa demonstrou que 11 de 12 pacientes com 
infecção recente por citomegalovírus, EBV ou varicella-zoster virus foram 
diagnosticados com AIDP (OGAWARA et al., 2000). Orlikowski e colegas mostraram 
que 70% dos pacientes com infecção anterior por citomegalovírus foram classificados 
como portadores de AIDP, mas apenas 7% receberam diagnóstico de AMAN 
(ORLIKOWSKI et al., 2011). Por fim, o subtipo AIDP é o mais frequente após uma 
infecção pelo vírus Zika (LEONHARD et al., 2020; NASCIMENTO; DA SILVA, 2017). 
Embora esses estudos apontem que a AIDP pode ser desencadeada por uma 
infecção viral prévia, não se conhece nenhum antígeno que esteja associado a 
autoimunidade (LAMAN et al., 2022). 
Após causar o dano, frequentemente grave, aos nervos periféricos, a resposta 
autoimune é interrompida. Em seguida inicia-se o processo de reparo, cujo tempo de 
recuperação depende do tipo de célula danificada (HARDY et al., 2011). Se o dano é 
limitado à bainha de mielina, basta que novas células de Schwann reconstituam a 
bainha, o que permite uma recuperação clínica em algumas semanas. Mas se ocorre 
dano aos axônios, a recuperação é mais lenta e pode levar de meses até anos. 
Particularmente para o subtipo AMAN, o processo patológico pode ser a ligação de 
autoanticorpos aos canais de sódio, o que causa um bloqueio temporário da condução 
do estímulo nervoso e permite uma recuperação mais rápida, embora alguns 
pacientes tenham os axônios degenerados, o que requer um tempo maior de 
recuperação (HARDY et al., 2011; HUGHES; CORNBLATH, 2005; KUWABARA, 
Satoshi; YUKI, 2013). No subtipo AIDP também pode ocorrer dano aos axônios em 
lesões mais severas, provavelmente como uma consequência da resposta 
inflamatória direta contra a mielina (HUGHES; CORNBLATH, 2005). 
O provável mecanismo que relaciona a forma AMAN, principalmente, e outros 
subtipos da SGB a uma infecção prévia por C. jejuni envolve a reatividade cruzada 
mediada por anticorpos entre lipooligossacarídeos da bactéria e gangliosídeos 
localizados nos axônios (HARDY et al., 2011; KIESEIER et al., 2018; VAN DEN BERG 
et al., 2014). Além disso, o desenvolvimento de AMAN após uma infecção por C. jejuni 
cumpre todos os quatro critérios mencionados anteriormente para que uma doença 
autoimune seja desencadeada por mimetismo molecular (KUWABARA, Satoshi; 
YUKI, 2013; ROJAS et al., 2018). Assim como AMAN, a patologia da MFS e da 
17 
 
AMSAN também parece envolver a participação de anticorpos antigangliosídeos 
(HUGHES; CORNBLATH, 2005). 
Já os mecanismos imunológicos que levam à desmielinização em AIDP são 
pouco compreendidos, mas possivelmente são mediados por células e anticorpos. 
Anticorpos contra gangliosídeos foram relatados em alguns pacientes com AIDP, 
porém qualquer contribuição para a patogênese permanece desconhecida (LIM; 
DEVAUX; YUKI, 2014; RINALDI et al., 2013; VAN DEN BERG et al., 2014). Também 
foram observados anticorpos contra proteínas da mielina (P0, P2 e PMP22) em alguns 
pacientes, mas outros estudos apresentaram resultados conflitantes e qualquer 
função desses anticorpos é desconhecida (LIM; DEVAUX; YUKI, 2014). Nos últimos 
anos, têm-se investigado a possibilidade de proteínas do nodo de ranvier (Gliomedina 
e Neurofascina 186) e paranodo (GJB1, Contactina-1 e Neurofascina 155) serem 
alvos de autoanticorpos (LIM; DEVAUX; YUKI, 2014). Outra possibilidade é que 
linfócitos T auxiliares CD4+ (Th, do inglês, T helper) ativados reconheçam antígenos 
específicos nas células de Schwann ou na própria bainha de mielina (HARDY et al., 
2011; KIESEIER et al., 2004) - o que é corroborado pela identificação de células T 
reativas às proteínas da mielina em pacientes com AIDP (CSURHES et al., 2005), e 
ativem macrófagos, que causam o dano à mielina (HUGHES; CORNBLATH, 2005). 
No entanto, autoantígenos de células T CD4+, assim como o mecanismo patogênico 
promovido por elas, permanecem desconhecidos. Um esclarecimento importante é 
que a classificação da SBG em seus subtipos principais, AMAN e AIDP, surgiu no 
início da década de 90 (KUWABARA, Satoshi; YUKI, 2013), logo, nem sempre os 
estudos que investigaram a reatividade contra proteínas da mielina especificam o 
subtipo da doença, mas tratam todos os pacientes como portadores de SBG. 
1.3 Esclerose múltipla 
Outra doença autoimune que também afeta o sistema nervoso é a esclerose 
múltipla. Porém, ao contrário da SGB, a autoimunidade é dirigida contra as células do 
sistema nervoso central (SNC). A esclerose múltipla é caracterizada pela presença de 
áreas focais de inflamação crônica e desmielinização na substância branca e na 
substância cinzenta do cérebro e da medula espinhal (GASPERONI; TURINI; 
AGOSTINELLI, 2019). Seu diagnóstico requer a ocorrência de pelo menos um 
episódio clínico compatível com desmielinização do SNC (conhecida como síndrome 
clinicamente isolada) mais evidência clínica, de ressonância magnética ou laboratorial 
18 
 
de lesões no SNC disseminadas no espaço e ao longo do tempo (MAKHANI; 
TREMLETT, 2021). 
De acordo com o Atlas da esclerose múltipla havia cerca 2,8 milhões de 
pessoas vivendo com a doença no mundo em 2020 (MSIF, 2020a). No Brasil, o 
número de pessoas com esclerose múltipla foi estimado em 40 mil (MSIF, 2020a). A 
esclerose múltipla atinge principalmente indivíduos de ascendência europeia e é rara 
em asiáticos, negros, nativos americanos e indivíduos maoris (FILIPPI et al., 2018). A 
estimativa de incidência média é 2.1 por 100.000 indivíduos, segundo um cálculo 
levando em consideração 75 países, e a prevalência global é calculada em 36 por 
100.000 habitantes (MSIF, 2020b). No Brasil a prevalência foi calculada como 19 por 
100.000 habitantes (MSIF, 2020b). 
O início dos sintomas típicos costuma acontecer entre 20 e 50 anos de idade. 
Todavia, existem determinados sinais, chamados pródromos, os quais podem surgir 
até vários anos antes do início dos sintomas típicos (MAKHANI; TREMLETT, 2021). 
A fase prodrômica da esclerose múltipla ainda é pouco compreendida, mas alguns 
sinais são conhecidos: indícios clínicos, como maior procura por cuidados médicos e 
déficits cognitivos; síndrome radiologicamente isolada(sinais radiológicos 
compatíveis com esclerose múltipla no exame ressonância magnética); e presença de 
biomarcadores séricos, como o neurofilamento leve de cadeia. O reconhecimento dos 
pródromos pode auxiliar na identificação antecipada da esclerose múltipla e início 
prévio do tratamento. 
As manifestações clínicas da esclerose múltipla dependem da localização das 
lesões no SNC (DENDROU; FUGGER; FRIESE, 2015; STEINMAN, 2014). Os 
sintomas podem incluir distúrbios sensoriais e visuais, deficiência motora, 
espasticidade, fadiga, dor e déficits cognitivos (MURÚA; FAREZ; QUINTANA, 2022). 
Cerca de 85 a 90% dos pacientes com esclerose múltipla desenvolvem uma forma 
remitente-recorrente da doença, caracterizada por períodos de exacerbação dos 
sintomas (recaídas) seguidos de recuperação clínica (remissão) (SOSPEDRA; 
MARTIN, 2016). À medida que a doença evolui, a recuperação dos sintomas é 
incompleta, e cerca de 60% dos pacientes eventualmente desenvolvem uma forma da 
doença conhecida como esclerose múltipla secundária progressiva, caracterizada 
pelo acúmulo progressivo e irreversível de incapacidade neurológica. Um grupo menor 
de pacientes (10-15%) segue um curso clínico progressivo desde o início da doença, 
que é denominada esclerose múltipla progressiva primária. 
19 
 
Estudos epidemiológicos mostraram um risco maior de desenvolver a doença 
em parentes de primeiro grau de pacientes com esclerose múltipla em comparação 
com a população em geral, o que sugere algum grau de suscetibilidade genética 
(COMPSTON; COLES, 2008; MURÚA; FAREZ; QUINTANA, 2022; NIELSEN, N. M. 
et al., 2005). De fato, estudos de associação genômica identificaram mais de 200 
variantes genéticas associadas à esclerose múltipla (THOMPSON et al., 2018). Cada 
variante tem um pequeno efeito no risco de desenvolver a doença, e diferentes 
combinações dessas variantes provavelmente contribuem para a suscetibilidade 
genética em diferentes pacientes (BARANZINI; OKSENBERG, 2017; FILIPPI et al., 
2018). A ligação mais forte foi encontrada em alelos do complexo de 
histocompatibilidade, no qual o HLA-DRB1*15:01 conferiu o maior risco, 
aproximadamente três vezes (SAWCER et al., 2011). É importante ressaltar que o 
HLA-DRB1*15:01, assim como os outros alelos do haplótipo DR15 (DRB1*1501, 
DQA1*0102 e DQB1*0602), é considerado um fator de risco para pessoas 
caucasianas, o grupo étnico com a maior prevalência de esclerose múltipla mas não 
se pode estabelecer essa mesma relação para pessoas de outras etnias (MARTIN et 
al., 2021). 
Acredita-se que a esclerose múltipla seja iniciada por resultado da combinação 
de fatores genéticos e ambientais. A variação genética é responsável por 
aproximadamente 30% do risco para a esclerose múltipla (DENDROU; FUGGER; 
FRIESE, 2015). Ademais, se um gêmeo monozigótico é portador de esclerose múltipla 
o outro tem apenas 25% de risco de desenvolvê-la (ASCHERIO; MUNGER; 
LÜNEMANN, 2012). Essas observações sugerem que os fatores ambientais são 
fundamentais para o desenvolvimento da esclerose múltipla. Fatores ambientais que 
parecem influenciar a incidência e/ou prevalência da doença são: baixos níveis de 
vitamina D, perturbação no ciclo circadiano, infecção pelo EBV, obesidade e 
tabagismo (MURÚA; FAREZ; QUINTANA, 2022). 
O papel das células T CD4+ para a patogênese da esclerose múltipla é apoiado 
pela identificação do HLA de classe II DRB1∗15:01 como um importante fator de risco 
genético (MURÚA; FAREZ; QUINTANA, 2022; WANG, J. et al., 2020). Ainda não está 
claro qual subconjunto de células T auxiliares CD4+ exerce a influência mais 
importante na doença, mas os subtipos Th1 e Th17 parecem ser os mais relevantes 
(RIEDHAMMER; WEISSERT, 2015). Células Th1 são encontradas em maior 
quantidade na fase de recaída do que na de remissão ou em pessoas saudáveis. 
20 
 
Também foi identificada alta produção da citocina interferon-γ (IFN-γ), a qual é 
produzida por células Th1, em pacientes com esclerose múltipla. A contribuição do 
subtipo Th17 é corroborada pela identificação de que pacientes com esclerose 
múltipla apresentaram maior transcrição da citocina IL-17, especialmente em lesões 
crônicas silenciosas, e mais células Th17 em comparação aos grupos controle. Outros 
subtipos que podem contribuir para a patologia são os Th9 e Th22 (RIEDHAMMER; 
WEISSERT, 2015). 
Até recentemente os linfócitos T CD8+ eram consideradas menos relevantes 
para a esclerose múltipla mas alguns indícios sugerem que elas podem ser 
importantes para a patogênese da doença (MURÚA; FAREZ; QUINTANA, 2022). Os 
clones de linfócitos T CD8+ são frequentemente mais encontrados nas lesões de 
pacientes com esclerose múltipla do que células T CD4+. Alguns alelos do HLA classe 
I são conhecidos por serem importantes fatores genéticos na esclerose múltipla: HLA-
A∗02:01 e HLA-B∗44, associados à proteção; e HLA-A∗03:01 HLA-B∗07, associados 
ao aumento de risco (MARTIN et al., 2021). 
A presença de bandas oligoclonais de classe IgG no líquido cefalorraquidiano 
e a eficácia de ensaios clínicos bem-sucedidos com anticorpos anti-CD20 que 
destroem os linfócitos B demonstram a importância dessas células para a patologia 
da esclerose múltipla (HAUSER et al., 2017; KUERTEN et al., 2020; LINK; HUANG, 
2006). O mecanismo exato pelo qual as células B promovem a neuroinflamação não 
é completamente compreendido, mas provavelmente envolve produção de 
autoanticorpos, secreção de citocinas proinflamatórias e apresentação de antígenos 
para linfócitos T CD4+ (MURÚA; FAREZ; QUINTANA, 2022; RIEDHAMMER; 
WEISSERT, 2015). 
Estudos anteriores que testaram amostras de soro e plasma de pacientes com 
esclerose múltipla mostraram reatividade de anticorpos contra um amplo espectro de 
antígenos de mielina, em relação aos grupos controle (HECKER et al., 2016; 
KUERTEN et al., 2020). Assim, ao contrário de outras doenças neuroimunológicas, 
como a miastenia gravis e a neuromielite óptica, nas quais há um autoantígeno 
dominante bem descrito, a resposta imune na esclerose múltipla é diversa, sem que 
um único antígeno surja como alvo dominante das células B e T (KUERTEN et al., 
2020). Proteínas da mielina que podem ser alvo de autoanticorpos incluem a proteína 
básica da mielina (MBP), proteína proteolipídica (PLP), cadeia alfa-cristalina B 
(CRYAB), glicoproteína associada à mielina (MAG), Glicoproteína da Mielina de 
21 
 
Oligodendrócitos (MOG), proteína específica de oligodendrócitos (OSP), entre outras 
(KUERTEN et al., 2020). Além disso, outros possíveis alvos antigênicos são proteína 
axonais, como a neurofilamento de cadeia leve (NEFL) e o canal de cloreto ANO2. 
Assim como acontece na SGB, estudos epidemiológicos indicam que uma 
infecção pelo vírus Epstein-Barr pode estar ligada à esclerose múltipla mas seu papel 
para a patologia permanece incerto (BAR-OR et al., 2020). O EBV é um herpesvírus 
humano que persiste de forma latente nos linfócitos B por toda a vida do hospedeiro 
após a infecção (SORELLE et al., 2022). Os títulos de anticorpos anti-EBNA1 
(Epstein–Barr virus nuclear antigen 1) podem ser detectados em aproximadamente 
99,5% dos pacientes com esclerose múltipla antes do desenvolvimento de sintomas 
clínicos, comparado a 94% em indivíduos saudáveis (BJORNEVIK et al., 2022). Além 
disso, uma infecção prévia pelo EBV aumenta em 32 vezes o risco de desenvolver 
esclerose múltipla, o que o torna, possivelmente, o principal agente de risco para a 
doença (BJORNEVIK et. al., 2022). Um potencial mecanismo para explicar como o 
EBV desencadeia a esclerose múltipla é o mimetismo molecular entre antígenos virais 
e antígenos do SNC (LANZ et al., 2022; ROBINSON; STEINMAN, 2022). 
1.4 Apresentação de antígenos a linfócitos T auxiliares 
Um epítopo, também chamado determinante antigênico, é um segmento 
antigênico o qual é reconhecido por um anticorpo ou receptor da célula T (ABBAS; 
LICHTMAN; PILLAI, 2023). Em relação aos antígenosproteicos reconhecidos por 
linfócitos T, o epitopo é um segmento de aminoácidos linear que se liga a uma 
molécula de MHC (Major Histocompatibility Complex). 
Há duas classes principais de moléculas de MHC responsáveis pela 
apresentação dos antígenos: MHC de classe I e MHC de classe II (ABBAS; 
LICHTMAN; PILLAI, 2023). Os linfócitos T auxiliares reconhecem peptídeos 
apresentados pelo MHC de classe II, enquanto os linfócitos T CD8+ ligam-se a 
peptídeos exibidos pelo MHC de classe I. As moléculas do MHC são altamente 
polimórficas, com uma ampla variação de alelos existente em uma população – 
atualmente há cerca de 23 mil diferentes alelos relatados (GONZALEZ-GALARZA et 
al., 2020). Essa alta diversidade de HLAs oferece um papel importante na proteção 
das populações contra patógenos e epidemias (ABBAS; LICHTMAN; PILLAI, 2023). 
Em humanos, as moléculas do MHC são chamadas HLA. 
22 
 
Para a compreensão de como acontece mimetismo molecular entre antígenos, 
serão explicados conceitos básicos sobre a estrutura do TCR (TCR, do inglês, T-Cell 
Receptor) e do HLA. As moléculas de HLA de classe II são glicoproteínas localizadas 
na membrana celular constituídas por duas cadeias: α e β (ABBAS; LICHTMAN; 
PILLAI, 2023). Todo individuo tem dois genes HLA-DP (DPA1 e DPB1), dois genes 
HLA-DQα (DQA1, 2), um gene HLA-DQβ (DQB1), um gene HLA-DRα (DRA1) e um 
gene HLA-DRβ (DRB1) em cada cromossomo (SHIINA et al., 2009). O conjunto de 
genes de HLA presentes em um genoma constitui o haplótipo de HLA. 
Figura 1 - Representação da interação HLA-peptídeo. 
 
Fonte: (SINGH et al., 2018) 
Na molécula do HLA de classe II existe um sulco de ligação ao peptídeo, o qual 
é constituído por quatro bolsas, chamadas P1, P4, P6 e P9 por acomodarem os 
resíduos 1, 4, 6 e 9 de um segmento de nove aminoácidos do peptídeo (GFELLER; 
LIU; RACLE, 2023; HOMAN; BREMEL, 2023; JONES et al., 2006) (figura 1). O sulco 
de ligação é aberto em ambas as extremidades, permitindo a apresentação de 
peptídeos geralmente de 13 a 25 aminoácidos (WIECZOREK et al., 2017). A 
sequência de nove aminoácidos ligada ao sulco de ligação é denominada nonâmero 
ou nonapeptídeo, enquanto as sequências adjacentes não ligadas são os resíduos 
flanqueadores do peptídeo (peptide flanking residue - PFRs) (BARRA et al., 2018; 
HOLLAND et al., 2015). 
O TCR também é uma glicoproteína de membrana formada por duas cadeias, 
α e β (ALCOVER; ALARCÓN; DI BARTOLO, 2018) (figura 2). Na porção extracelular 
de cada cadeia do TCR há três alças com elevada variabilidade de aminoácidos, 
23 
 
denominadas regiões determinantes de complementaridade (CDR, do inglês, 
Complementary-determinant regions), que reconhecem o HLA e a superfície 
antigênica formada pelas cadeias laterais dos resíduos de aminoácidos do epítopo. 
As alças CDR1 e CDR2 interagem principalmente com o HLA (ALCOVER; ALARCÓN; 
DI BARTOLO, 2018). As alças hipervariáveis CDR3α e CDR3β são as mais 
estruturalmente diversas e interagem principalmente com o epítopo. 
Figura 2 - Representação do receptor de células T 
 
Fonte: Adaptada de (WONG; LEEM; DEANE, 2019) 
Na estrutura molecular do complexo MHC-peptídeo-TCR (pMHC-TCR) (figura 
3) as cadeias laterais de alguns resíduos do peptídeo apontam para fora do sulco de 
ligação e fazem contato com o TCR. Geralmente, no MHC-II os resíduos P2, P3, P5 
e P8 fazem contato com receptor de linfócitos T CD4+, enquanto P-1 e P7 podem ou 
não interagir diretamente, o que depende das particularidades estruturais de cada 
complexo pMHC-TCR (BIRNBAUM et al., 2014; CIACCHI et al., 2022; GE et al., 2022; 
HILL et al., 2003; HUSEBY et al., 2005; NELSON et al., 2015; RUDOLPH; WILSON, 
2002). Os aminoácidos localizados em P1, P9 e nos flancos parecem ter uma 
contribuição mínima para o reconhecimento pelo TCR. 
24 
 
Figura 3 - Estrutura do complexo MHCII-peptídeo-TCR 
Fonte: Adaptada de (BIRNBAUM et al., 2014) 
1.5 Justificativa e relevância do trabalho 
Diante das incertezas sobre a patogênese do SBG, particularmente do subtipo 
AIDP, permanecem desconhecidas questões como: os mecanismos autoimunes 
associados à patogenia, a natureza dos autoantígenos (proteico ou glicosídico), 
proteínas que podem servir como autoantígenos, microrganismo importante para 
desencadear a autoimunidade. A esclerose múltipla, embora seu processo 
imunopatogênico seja mais conhecido, também apresenta incertezas quanto às 
proteínas que são alvo de autoimunidade. Além disso, ambas patologias apresentam 
uma infecção prévia pelo EBV como possível fator desencadeante da autoimunidade. 
Nesse contexto, elucidar os mecanismos imunopatogênicos relacionados a essas 
patologias é fundamental para a elaboração de estratégias terapêuticas, como a 
imunoterapia antígeno-específica (BRONGE et al., 2022). 
A identificação de possíveis autoantígenos pode ser direcionada a partir do 
conhecimento da estrutura do complexo TCR-peptídeo-MHC; uma vez que um 
autoantígeno e um antígeno exógeno podem ser capazes de ativar um mesmo 
linfócito T CD4+, caso apresentem identidade em resíduos críticos para a interação 
com o TCR, de modo a gerar linfócitos T autorreativos. 
25 
 
Neste trabalho, a sequência de algoritmos utilizados permite a identificação de 
possíveis autoantígenos associados ao mecanismo de mimetismo molecular com 
epítopos do EBV. Além disso, a estratégia desenvolvida poderá ser aplicadas em 
outros projetos uma vez adaptada para os objetivos e finalidades desses outros 
estudos. 
26 
 
2 OBJETIVOS 
2.1 Objetivo Geral 
Identificar possíveis autoantígenos de linfócitos T CD4+ associados ao 
mecanismo de mimetismo molecular com epítopos do vírus Epstein-Barr em quadros 
de esclerose múltipla e síndrome de Guillain-Barré. 
2.2 Objetivos Específicos 
1) Identificar proteínas com expressão enriquecida no Sistema Nervoso. 
2) Identificar haplótipos contendo pares de HLAs de classe II mais comuns na 
população mundial. 
3) Selecionar proteínas imunogênicas do vírus EBV. 
4) Predizer in silico peptídeos lineares virais e de proteínas do sistema nervoso 
apresentados por HLAs comuns na população global. 
5) Analisar a identidade de resíduos críticos para o reconhecimento pelo TCR entre 
peptídeos de proteínas do sistema nervoso e de proteínas do EBV preditos para 
serem apresentados pelos HLAs. 
6) Analisar imunogenicidade dos peptídeos preditos. 
 
27 
 
3 MÉTODOS 
Figura 4 – Esquema ilustrando o fluxo de trabalho da metodologia para identificar a identidade cruzada 
entre peptídeos. 
Legenda - A. Etapas de obtenção de dados (azul), dados obtidos e análises subsequentes (cinza). B. 
Foram selecionados peptídeos de 15 aminoácidos preditos por ambos os métodos e ligantes do mesmo 
HLA. Depois, como os nonâmeros podem diferir entre os métodos, foram escolhidas as predições do 
NetMHCIIpan. Os peptídeos de 15 aminoácidos foram analisados usando o CD4 Episcore, e os 
28 
 
nonâmeros foram avaliados quanto à identidade de seus resíduos. C. A busca pela identidade cruzada 
dos peptídeos das proteínas do sistema nervoso humano contra os peptídeos do vírus Epstein-Barr. D. 
Os nonâmeros devem ligar-se ao mesmo HLA ou HLAs presentes em haplótipos. E. O pipeline usa 
quatro regras para selecionar nonâmeros com identidades relevantes no contexto da interação com o 
TCR. Começa com uma identidade mínima de 44% entre os resíduos de dois nonâmeros e resíduos 
idênticos na posição 5 (P5) como critério de base. As três regras adicionais usadas para selecionar 
pares de nonâmeros foram: Critério 1: resíduos idênticos em P2, P3 e P8 (P2-P3-P5-P8). Critério 2: 
dois resíduos idênticos em P2, P3 ou P8, e pelo menos um resíduo idêntico em P4, P6 ou P7 (P5 - 2 x 
P2/P3/P8 - 1 x P4/P6/P7). Critério 3: resíduos idênticos em P4, P6 e P7 e pelo menos um resíduo 
idêntico em P2, P3 ou P8 (P5 - 1 x P2/P3/P8 -P4-P6-P7). 
Os métodos empregados neste trabalho incluíram a busca de informações 
biológicasem bancos de dados de proteínas, epitopos e HLAs, além da utilização de 
ferramentas para a predição de ligantes de moléculas de HLA. Programas escritos na 
linguagem de programação Pyhton foram desenvolvidos para obtenção e tratamento 
de dados, além de ter sido desenvolvido uma ferramenta voltada à análise de 
identidade entre resíduos de nonâmeros. A figura 4 apresenta uma visão geral dos 
métodos usados. 
3.1 Seleção de proteínas do SNP e do SNC 
O banco de dados Protein Atlas (https://www.proteinatlas.org/) (UHLÉN et al., 
2015) foi utilizado para buscar proteínas com expressão elevada no SNC e em 
oligodendrócitos. Foram selecionadas as proteínas com expressão acima de 200 
nTPM (do inglês normalized to transcripts per million) no SNC e acima de 100 nTPM 
em oligodendrócitos (figura 4A). O filtro de busca foi o seguinte: 
tissue_category_rna:brain;Tissue enriched,Group enriched,Tissue enhanced AND 
sort_by:tissue specific score AND 
evidence_summary:Evidence at protein level AND 
uniprot_evidence:Evidence at protein level AND 
nextprot_evidence:Evidence at protein level AND 
hpa_evidence:Evidence at protein level AND 
cell_type_category_rna:Oligodendrocyte precursor cells, Oligodendrocytes; Cell type 
enriched, Group enriched, Cell type enhanced, Is highest expressed 
Foram removidas as proteínas cuja expressão em outros órgãos/tecidos é 
superior à do SNC ou que são secretadas no sangue ou em outros tecidos. Por fim, a 
página de cada proteína foi analisada para remover as que também são altamente 
https://www.proteinatlas.org/
29 
 
expressas em outros órgãos. Para certificar-se de que todas as proteínas são 
altamente expressas no SNC, a expressão também foi analisada com a ferramenta 
Genevestigator (https://genevisible.com/search) (GRENNAN, 2006). 
O Protein Atlas apenas apresenta filtros para identificação de proteínas 
presentes em tecido nervoso, sem especificar se são expressas no SNC ou SNP. 
Assim, foram selecionadas proteínas mais abundantes em proteomas do SNP ou que 
sejam possíveis fontes de autoantígenos na SBG. O Genevestigator também foi usado 
para analisar a expressão das proteínas. 
3.2 HLAs mais comuns na população global e busca por haplótipos 
A partir dos 27 alelos mais comuns na população global (GREENBAUM et al., 
2011), foram selecionados os 21 HLAs de classe do tipo DR e DQ para a predição de 
peptídeos os, pois são os principais relacionados a doenças autoimunes (LIU; SHAO; 
FU, 2021). Entre esses 21 alelos, 17 – onze DRB1 e seis DQ - foram usados para a 
busca de haplótipos no banco de dados Allele Frequency Net Database (AFND) 
(http://www.allelefrequencies.net/), visto que não é possível procurar pelos alelos 
DRB3, DRB4 e DRB5 na ferramenta de busca de haplótipos (GONZALEZ-GALARZA 
et al., 2020) (figura 4A). 
Todo indivíduo tem dois genes HLA-DP (DPA1 e DPB1), dois genes HLA-DQα 
(DQA1, 2), um gene HLA-DQβ (DQB1), um gene HLA-DRα (DRA1), e um gene HLA-
DRβ (DRB1) em cada cromossomo (SHIINA et al., 2009). Partindo desse pressuposto, 
todos os alelos DRB1 e DQB1/DQA1 foram combinados aos pares. Em seguida, a 
ferramenta Haplotype Frequency Search 
(http://www.allelefrequencies.net/hla6003a.asp) foi usada para selecionar os 
haplótipos em que cada par DRB1-DQB1/DQA1 está presente. A biblioteca Beautiful 
Soup (versão: 4.11.1) do Python foi usada para a coleta de dados por meio de web 
scraping. Os dados coletados foram processados e tratados. O haplótipo HLA-DR15 
- composto pelos genes DRB1*15:01 (DR2b) e DRB5*01:01 (DR2a) - foi adicionado 
por ser relacionado à esclerose múltipla (SCHOLZ et al., 2017). 
3.3 Seleção de proteínas imunogênicas do vírus Epstein-Barr 
Foi utilizado o banco de dados Immune Epitope Database (IEDB) 
(www.iedb.org) (VITA et al., 2019) para selecionar proteínas do vírus Epstein-Barr que 
possuem ensaios positivos para linfócitos T (figura 4A). Foram buscados epítopos de 
“Human herpesvirus 4 (Epstein Barr virus) (ID:10376, Epstein-Barr virus)”, restritos ao 
https://genevisible.com/search
http://www.allelefrequencies.net/hla6003a.asp
http://www.allelefrequencies.net/hla6003a.asp
http://www.iedb.org/
30 
 
MHC de classe II, Homo sapiens como hospedeiro, sem ensaios de linfócitos B e com 
ensaios de linfócitos T positivos (figura 5). Por fim, buscou-se no banco Uniprot as 
sequências de aminoácidos das proteínas imunogênicas de todas as cepas do EBV 
(Raji, GD1, B95-8, Cao, AG876) (UNIPROT CONSORTIUM, 2021). 
Figura 5 - Filtros utilizados para a busca de antígenos de EBV no IEDB 
 
Fonte: (VITA et al., 2019). 
3.4 Predição de peptídeos em proteínas do EBV e do sistema nervoso com 
potencial de se ligar às moléculas de HLA 
As proteínas imunogênicas do EBV e as proteínas do sistema nervoso foram 
analisadas quanto a capacidade de seus peptídeos se ligarem aos alelos de HLA 
selecionados (figura 4A). Foram selecionados 21 alelos de HLA para a predição de 
peptídeos (quatro HLAs DRB3/4/5, seis DQA1/DQB1 e onze DRB1). As predições 
foram obtidas usando dois preditores: NetMHCII-2.3 (JENSEN et al., 2018) e 
NetMHCIIpan-4.1 (REYNISSON et al., 2020). O comprimento do peptídeo foi de 15 
aminoácidos. Em ambas as predições foram escolhidos todos os peptídeos 
classificados como ligantes, sejam fortes ou fracos. Em seguida, as duas predições 
foram comparadas a fim de identificar os peptídeos de 15 aminoácidos preditos para 
ligar ao mesmo HLA em ambas ferramentas. 
As predições também mostram os nonâmeros centrais, que potencialmente se 
ligam à molécula de HLA e constituam a porção principal do epítopo da célula T 
(NIELSEN, M. et al., 2010). Os nonâmeros preditos pelos dois métodos podem ser 
iguais, mas, no caso em que eles diferem, foram selecionados aqueles preditos pelo 
método NetMHCIIpan-4.1, pelo fato de ser o preditor com melhor performance 
(REYNISSON et al., 2020) (figura 4B). 
3.5 Análise de identidade entre os nonâmeros de peptídeos dos vírus EBV e de 
epítopos das proteínas do sistema nervoso 
As sequências de aminoácidos dos nonâmeros foram comparadas com auxílio 
de um algoritmo escrito em linguagem Python (figuras 4C, D e E). O algoritmo 
compara os nonâmeros dos vírus EBV contra os das proteínas do sistema nervoso e 
31 
 
analisa a identidade de resíduos que estejam localizados na mesma posição (P1 
contra P1, P2 contra P2, e assim por diante até a posição P9), o que é uma estratégia 
ideal para a análise ser relevante no contexto do reconhecimento de linfócitos T CD4+. 
A quantidade mínima de resíduos idênticos entre os nonâmeros deve ser 4. 
Tomando como referência o conhecimento de que a reatividade cruzada não 
necessariamente exige que todos os resíduos do nonâmero sejam iguais, mas basta 
que haja identidade em alguns contatos críticos para interação com o TCR (BASU et 
al., 2000; BIRNBAUM et al., 2014; CIACCHI et al., 2022; GE et al., 2022; HUSEBY et 
al., 2005; LANG et al., 2002; NELSON et al., 2015), foram definidas quatro regras para 
selecionar os peptídeos com identidade relevante no contexto da interação com o TCR 
(figura 4E). Como regra geral, todos os nonâmeros devem ter no mínimo quatro 
resíduos idênticos e um deles deve estar localizado em P5. Os outros resíduos devem 
estar posicionados de acordo com qualquer dos três critérios mínimos a seguir. 
 
1. Todos os resíduos nas posições P2, P3 e P8 são idênticos. No texto esse critério 
será identificado peço código (P2-P3-P5-P8). 
2. Dois resíduos idênticos nas posições P2, P3 ou P8 e ao menos um em P4, P6 ou 
P7. No texto esse critério será identificado peço código (P5 - 2 x P2/P3/P8 - 1 x 
P4/P6/P7). 
3. Todos os resíduos nas posições P4, P6 e P7 são idênticos e ao menos um em P2, 
P3 ou P8. No texto esse critério será identificado peço código (P5 - 1 x P2/P3/P8 - P4-
P6-P7). 
 
Além disso, a identidade entre dois nonâmeros apenas será considerada válida 
se ambos tiverem sido preditos para se ligar ao mesmo HLA ou a HLA’sdiferentes, 
mas que estejam presentes em um mesmo haplótipo (figura 4D). 
A estratégia empregada também considerou a similaridade entre os 
nonâmeros, visto que peptídeos similares favorecem a ocorrência de reatividade 
cruzada de linfócitos T, ainda que a identidade seja baixa (FRANKILD et al., 2008). 
Foi calculado o score de similaridade BLOSUM62 entre os segmentos P2-P8 dos 
nonâmeros com o uso do pacote substitution_matrices e do módulo pairwise2, ambos 
da biblioteca BioPython (https://biopython.org/docs/1.75/api/index.html) (COCK et al., 
2009). O algoritmo desenvolvido para a análise de identidade pode ser visualizado no 
apêndice A. 
https://biopython.org/docs/1.75/api/index.html
32 
 
3.6 Predição de imunogenicidade de células T CD4 
Os peptídeos de 15 aminoácidos foram submetidos ao servidor CD4episcore 
(http://tools.iedb.org/CD4episcore/) para avaliar a capacidade de estimular a resposta 
de linfócitos T CD4 (DHANDA et al., 2018; PAUL et al., 2015) (figura 4A). A pontuação 
limite para classificar os peptídeos foi 50%. Foi usado o método combinado, cuja 
pontuação inclui o score de imunogenicidade e também o score do método 7-allele 
(um método otimizado para previsão de respostas HLA). A figura 4B ilustra como 
ocorreu o processo de seleção de peptídeos desde a seleção dos ligantes de HLA até 
a escolha dos peptídeos e nonâmeros para a predição de imunogenicidade e análise 
de identidade entre nonâmeros. 
3.7 Processamento de dados 
Todos os algoritmos desenvolvidos em linguagem Python (v 3.10.4) para obter, 
limpar e filtrar dados biológicos estão disponíveis em link de acesso no apêndice B. 
Foram utilizados os pacotes matplotlib (https://matplotlib.org/) (versão 3.5) e seaborn 
(https://seaborn.pydata.org/) (versão 0.11.2) para construir os gráficos. Para visualizar 
a análise de identidade dos nonâmeros, utilizou-se o pacote UpSetPlot 
(https://upsetplot.readthedocs.io/en/stable/) (v. 0.6.1). 
http://tools.iedb.org/CD4episcore/
33 
 
4 RESULTADOS 
4.1 Busca de proteínas do sistema nervoso 
Ao final da busca no Protein Atlas foram obtidas treze proteínas. A análise do 
genevisible mostrou que em todas as proteínas os dez tecidos com maior expressão 
incluem predominantemente, ou totalmente, estruturas do SNC (tabela 1). Para as 
análises seguintes foram selecionadas as cinco proteínas com maior expressão no 
cérebro (MBP, PLP, CNP, APLP1, MOBP). Além dessas, também foram escolhidas 
as proteínas GlialCam, por ter sido relatado um caso de mimetismo molecular com 
proteínas do EBV (LANZ et al., 2022), e MAG, porque seus peptídeos foram 
reconhecidos por linfócitos B e T na esclerose múltipla (ANDERSSON et al., 2002). 
Foram selecionadas ainda três proteínas abundantes no SNP: Myelin protein P0, 
Myelin protein P2 e Periaxin (PATZIG et al., 2011; SIEMS et al., 2020). 
4.2 Busca de haplótipos e seleção de alelos de HLA 
Os seis HLAs DQA1/DQB1 e 11 DRB1 foram combinados em 66 pares para a 
busca de haplótipos. Foram localizados ao todo 1359 haplótipos registrados no AFND, 
os quais se distribuem entre 51 pares. Quinze pares não apresentam haplótipos 
registrados (tabela suplementar 1). Considera-se que haplótipos com frequência 
inferior a 1% são raros (YUNUSBAEV et al., 2019). Assim, o resultado foi filtrado para 
manter apenas os registros com frequência maior ou igual a 1%. Ao final foram obtidos 
dezenove haplótipos (Figura 6). No total, foram localizados 1411 haplótipos 
distribuídos entre 51 pares de HLAs. 
Tabela 1 - Proteínas do sistema nervoso selecionadas para a predição de ligantes de HLA (Continua) 
Proteína 
Abrevia
ção 
Expressão 
cerebral (nTPM) 
Protein atlas 
Genevis
ible 
Myelin basic protein MBP 32454.4 
ENSG00000197
971 
P02686 
Proteolipid protein 1 PLP1 7049.5 
ENSG00000123
560 
P60201 
2',3'-cyclic nucleotide 3' 
phosphodiesterase 
CNP 1435.7 
ENSG00000173
786 
P09543 
Amyloid beta precursor 
like protein 1 
APLP1 1182.3 
ENSG00000105
290 
P51693 
http://www.proteinatlas.org/ENSG00000197971/tissue/
http://www.proteinatlas.org/ENSG00000197971/tissue/
https://genevisible.com/tissues/HS/UniProt/P02686
http://www.proteinatlas.org/ENSG00000123560/tissue/
http://www.proteinatlas.org/ENSG00000123560/tissue/
https://genevisible.com/tissues/HS/UniProt/P60201
http://www.proteinatlas.org/ENSG00000173786/tissue/
http://www.proteinatlas.org/ENSG00000173786/tissue/
https://genevisible.com/tissues/HS/UniProt/P09543
http://www.proteinatlas.org/ENSG00000105290/tissue/
http://www.proteinatlas.org/ENSG00000105290/tissue/
https://genevisible.com/tissues/HS/UniProt/P51693
34 
 
Tabela 1 - Proteínas do sistema nervoso selecionadas para a predição de ligantes de HLA 
(Conclusão) 
Proteína 
Abrevia
ção 
Expressão 
cerebral (nTPM) 
Protein atlas 
Genevis
ible 
Myelin associated 
oligodendrocyte 
basic protein 
MOBP 933.7 
ENSG00000168
314 
Q13875 
Excitatory amino acid 
transporter 1 
SLC1A3 783.1 
ENSG00000079
215 
P43003 
Myelin associated 
glycoprotein 
MAG 690 
ENSG00000105
695 
P20916 
Ermin ERMN 533.8 
ENSG00000136
541 
Q8TAM6 
Neurotrimin NTM 324.3 
ENSG00000182
667 
Q9P121 
Hyaluronan and 
proteoglycan 
link protein 2 
HAPLN2 276.4 
ENSG00000132
702 
Q9GZV7 
Serpin family I member 1 
SERPIN
I1 
266.2 
ENSG00000163
536 
Q99574 
Formin like 2 FMNL2 233 
ENSG00000157
827 
Q96PY5 
Hepatic and glial cell 
adhesion molecule 
GLIALC
AM 
229.3 
ENSG00000165
478 
Q14CZ8 
Myelin protein P0 MPZ ENSG00000158
887 
P25189 
Periaxin PRX ENSG00000105
227 
Q9BXM
0 
Myelin protein P2 PMP2 
ENSG00000147
588 
P02689 
4.3 Busca de proteínas imunogênicas do EBV 
As 28 proteínas imunogênicas encontradas no IEDB contêm 208 epitopos 
validados em 632 ensaios (tabela 2). Glicoproteínas do envelope e antígenos 
nucleares são as mais comuns no grupo. 
 
http://www.proteinatlas.org/ENSG00000168314/tissue/
http://www.proteinatlas.org/ENSG00000168314/tissue/
https://genevisible.com/tissues/HS/UniProt/Q13875
http://www.proteinatlas.org/ENSG00000079215/tissue/
http://www.proteinatlas.org/ENSG00000079215/tissue/
https://genevisible.com/tissues/HS/UniProt/P43003
http://www.proteinatlas.org/ENSG00000105695/tissue/
http://www.proteinatlas.org/ENSG00000105695/tissue/
https://genevisible.com/tissues/HS/UniProt/P20916
http://www.proteinatlas.org/ENSG00000136541/tissue/
http://www.proteinatlas.org/ENSG00000136541/tissue/
https://genevisible.com/tissues/HS/UniProt/Q8TAM6
http://www.proteinatlas.org/ENSG00000182667/tissue/
http://www.proteinatlas.org/ENSG00000182667/tissue/
https://genevisible.com/tissues/HS/UniProt/Q9P121
http://www.proteinatlas.org/ENSG00000132702/tissue/
http://www.proteinatlas.org/ENSG00000132702/tissue/
https://genevisible.com/tissues/HS/UniProt/Q9GZV7
http://www.proteinatlas.org/ENSG00000163536/tissue/
http://www.proteinatlas.org/ENSG00000163536/tissue/
https://genevisible.com/tissues/HS/UniProt/Q99574
http://www.proteinatlas.org/ENSG00000157827/tissue/
http://www.proteinatlas.org/ENSG00000157827/tissue/
https://genevisible.com/tissues/HS/UniProt/Q96PY5
http://www.proteinatlas.org/ENSG00000165478/tissue/
http://www.proteinatlas.org/ENSG00000165478/tissue/
https://genevisible.com/tissues/HS/UniProt/Q14CZ8
https://www.proteinatlas.org/ENSG00000158887-MPZ
https://www.proteinatlas.org/ENSG00000158887-MPZ
https://genevisible.com/tissues/HS/UniProt/P25189
https://www.proteinatlas.org/ENSG00000105227-PRX
https://www.proteinatlas.org/ENSG00000105227-PRX
https://genevisible.com/tissues/HS/UniProt/Q9BXM0
https://genevisible.com/tissues/HS/UniProt/Q9BXM0
http://www.proteinatlas.org/ENSG00000147588/
http://www.proteinatlas.org/ENSG00000147588/
https://genevisible.com/tissues/HS/UniProt/P02689
35 
 
Figura 6 - Haplótipos de HLAs selecionados para a predição de peptídeos. 
Legenda - Azul, haplótipo selecionado; Amarelo, haplótipo não selecionado. 
36 
 
Tabela 2 – Proteínas imunogênicas do EBV selecionadas para a predição de ligantes de HLA. 
Proteína Abreviação EpitoposEnsaios 
Apoptosis regulator BHRF1 BHRF1 7 12 
DNA polymerase catalytic subunit BALF5 1 22 
DNA polymerase processivity factor BMRF1 BMRF1 1 4 
Envelope glycoprotein B BALF4 9 14 
Envelope glycoprotein GP350 BLLF1 3 8 
Envelope glycoprotein H BXLF2 1 6 
Envelope glycoprotein L BKRF2 1 1 
Epstein-Barr nuclear antigen 1 EBNA1 68 230 
Epstein-Barr nuclear antigen 2 EBNA2 8 51 
Epstein-Barr nuclear antigen 3 EBNA3 3 10 
Epstein-Barr nuclear antigen 4 EBNA4 4 4 
Epstein-Barr nuclear antigen 6 EBNA6 16 50 
Epstein-Barr nuclear antigen leader protein EBNA-LP 1 1 
Glycoprotein 42 BZLF2 1 1 
Inner tegument protein BOLF1 1 1 
Large tegument protein deneddylase BPLF1 2 5 
Latent membrane protein 1 LMP1 15 53 
Latent membrane protein 2 LMP2 14 70 
Major capsid protein MCP 5 15 
Major DNA-binding protein BALF2 2 4 
Major tegument protein BNRF1 18 20 
mRNA export factor ICP27 homolog BMLF1 1 5 
Nuclear egress protein 2 NEC2 1 2 
Replication and transcription activator BRLF1 1 2 
Ribonucleoside reductase small subunit RIR2 1 3 
Secreted protein BARF1 BARF1 17 17 
Trans-activator protein BZLF1 BZLF1 4 11 
Triplex capsid protein 1 TRX1 2 10 
4.4 Predição de peptídeos lineares de CD4 ligantes de moléculas de HLA 
Foram selecionados 21 alelos de HLA para a predição de peptídeos (quatro 
HLAs DRB3/4/5, seis DQA1/DQB1 e onze DRB1). A predição de ligantes de HLAs das 
proteínas do sistema nervoso retornou 5904 pelo servidor NetMHCII e 4206 pelo 
NetMHCIIPan. Já a predição de peptídeos do EBV obteve 86325 peptídeos preditos 
pelo NetMHCII e 52944 pelo NetMHCIIPan. Após o processo de filtragem e 
https://docs.google.com/spreadsheets/d/1Sqj7lGP9J3GVDsu1OmkOteLvBTHQM9do/edit?usp=sharing&ouid=117269501484698792157&rtpof=true&sd=true
37 
 
identificação de preditos comuns aos dois servidores, o resultado final possui 1695 
peptídeos para as proteínas do sistema nervoso e 24912 para as proteínas do EBV. 
A figura 7 sumariza o resultado de cada uma das proteínas do sistema nervoso e das 
proteínas do EBV. 
Figura 7 - Quantidade de ligantes preditos pelos servidores NetMHCII e NetMHCIIPan e por ambos, 
para cada proteína do sistema nervoso e proteínas do EBV. 
Legenda - Azul: Total de ligantes de HLA preditos pelo NetMHCII. Amarelo: Total de ligantes de HLA 
preditos pelo NetMHCIIPan. 
38 
 
4.5 Análise de identidade entre nonâmeros do EBV e nonâmeros de proteínas 
do sistema nervoso e predição de imunogenicidade. 
Os resultados da análise de identidade das proteínas APLP1, CNP, GlialCam, 
MAG, MBP, MOBP, P0, P2, Periaxina e PLP estão mostrados nas tabelas S2–S11, 
respectivamente. A figura 8 sumariza os resultados de todas as proteínas. 
Figura 8 - Gráficos UpSet da análise de identidade entre nonâmeros das proteínas do sistema nervoso 
e do EBV. 
39 
 
Legenda - Os peptídeos selecionados foram categorizados de acordo com a regra a qual eles 
obedecem e agrupados conforme quais foram as posições que apresentaram identidade. O gráfico 
“Intersection size” mostra o tamanho de cada conjunto. 
Observou-se diferenças quanto à quantidade de pares selecionados por critério 
de seleção. Em todas as proteínas há predomínio de pares selecionados de acordo 
com o critério 2 (P5 - 2 x P2/P3/P8 - 1 x P4/P6/P7), o que pode ser explicado pelo fato 
de esse conter o maior número de combinações de resíduos idênticos. O critério 3 (P5 
- 1 x P2/P3/P8 - P4-P6-P7), por estar restrito a pares com cinco ou mais resíduos 
idênticos e apresentar poucas combinações possíveis, foi o com menor quantidade 
de nonâmeros selecionados, estando presente apenas em três proteínas (APLP1, 
Periaxina e PLP). Apenas as proteínas APLP1, MBP, Periaxina, GlialCam e PLP 
apresentaram peptídeos com potencial imunogênico (tabela 3). As tabelas 
suplementares estão em link de acesso externo, disponível no apêndice B. 
Tabela 3 - Peptídeos de proteínas do sistema nervoso classificados como imunogênicos 
SN 
Proteína 
SN Peptídeo 
Nonâmero - SN 
Proteína 
Nonâmero - EBV 
Proteína 
EBV 
Proteína 
APLP1 
LLLLLLRAQPAIGSL, 
PLLLLLLRAQPAIGS, 
LPLLLLLLRAQPAIG 
LLLLRAQPA LLLMRAGKG EBNA3 
APLP1 PLLLLLLRAQPAIGS LLLLRAQPA LLLMRAGKR EBNA3 
APLP1 PLLLLLLRAQPAIGS LLLLRAQPA LLLMRAGKG EBNA3 
APLP1 LALRRYLRAEQKEQR YLRAEQKEQ YLRAEAEAV BOLF1 
MBP VHFFKNIVTPRTPPP FKNIVTPRT YKNRVASRK BZLF1 
MBP 
RPHLIRLFSRDAPGR, 
PHLIRLFSRDAPGRE 
IRLFSRDAP WRLCSRPLL BOLF1 
MBP 
VVHFFKNIVTPRTPP, 
PVVHFFKNIVTPRTP, 
NPVVHFFKNIVTPRT, 
ENPVVHFFKNIVTPR, 
DENPVVHFFKNIVTP, 
QDENPVVHFFKNIVT 
VHFFKNIVT YHFVKKHVH BALF5 
MBP NPVVHFFKNIVTPRT VHFFKNIVT YHFVKKHVH BALF5 
Periaxin 
NFKYEDALRLLQCAE, 
ENFKYEDALRLLQCA 
YEDALRLLQ LEQALMRLA MCP 
GlialCam 
RGALSRASRALRLAP, 
ERGALSRASRALRLA 
LSRASRALR ASVASARLS BPLF1 
PLP 
FIAAFVGAAATLVSL, 
LFIAAFVGAAATLVS, 
IAAFVGAAATLVSLL 
FVGAAATLV AIGAAATRI EBNA3 
40 
 
 Amyloid Beta Precursor Like Protein 1 (APLP1) 
Houve 35 nonâmeros da proteína APLP1 com identidade relevante com 
nonâmeros do EBV (tabela S2, figura 8B). Destaca-se o HLA-
DQA1*05:01/DQB1*03:01, o qual participa de 11 pares de nonâmeros. O par formado 
pelo nonâmero VEGAEDEEE e AEGAEDEEG da proteína BOLF1 de EBV apresentou 
o maior score de similaridade (36) e maior identidade (7/9) entre todas as proteínas, 
além de esse nonâmero da APLP1 também estar presente em cinco pares, três deles 
selecionados pelo critério 1 (P2-P3-P5-P8). Outro par selecionado pelo critério 1 foi o 
MLTLEEQQLAPLP1/SLTLEPIQDBMLF1, com 5 resíduos idênticos. Quatro pares 
(LLLLRAQPAAPLP1/LLLMRAGKGEBV, LLLLRAQPAAPLP1/LLLMRAGKGEBV, 
YLRAEQKEQAPLP1/YLRAEAEAKEBV e NQSLGLLDQAPLP1/MQSYGLERLEBV) ligam-se 
a alelos do haplótipo DR15 (DRB1*15:01, DRB5*01:01 e DQA1*01:02-DQB1*06:02), 
conhecidos como fator de risco na MS (MARTIN et al., 2021). Os nonâmeros 
LLLLRAQPA e YLRAEQKEQ destacam-se por estarem presentes em peptídeos de 
15 aminoácidos preditos como imunogênicos (tabela 3). 
 2',3'-Cyclic Nucleotide 3' Phosphodiesterase (CNP) 
A análise de identidade da proteína CNP apresentou oito pares de nonâmeros 
selecionados, todos pelo critério 2 (P5 - 2 x P2/P3/P8 - 1 x P4/P6/P7) (tabela S3, figura 
8C). Os nonâmeros TTGARVELS e VEAVQTGLD formam os dois pares com maior 
identidade (5/9). Além disso, dois pares (YKITPGARGCNP/LKIHPGVAMEBV, 
TTGARVELSCNP/AEGLRVLLAEBV) ligam-se a HLAs do haplótipo DR15. 
 Hepatic And Glial Cell Adhesion Molecule (GlialCam) 
Foram selecionados 20 pares de nonâmeros da proteína GlialCam (tabela S4, 
figura 8D). Cinco pares, todos com cinco resíduos idênticos, são formados pelos 
nonâmeros LVASTTVLE da GlialCam e YEASTTYLS da proteína BXLF2 do EBV, 
porque ambos se ligam a HLAs (DRB1*04:05, DQA1*03:01-DQB1*03:02, 
DRB1*04:01, DRB1*09:01 e DRB1*13:02) que estão contidos em haplótipos. O 
nonâmero YSVSPAVPG forma cinco pares, quatro deles selecionados pelo critério 1 
(P2-P3-P5-P8). Um nonâmero, LSRASRALR, está contido em peptídeos de 15 
aminoácidos preditos como imunogênicos (tabela 3). O par 
ERGALSRASGlialCam/SEGALALAGEBV) liga-se ao HLA-DQA1*01:02-DQB1*06:02. 
41 
 
 Myelin Associated Glycoprotein (MAG) 
Foram encontrados oito pares de nonâmeros da proteína MAG com identidade 
relevante com nonâmeros do EBV, todos selecionados pelo critério 2 (P5 - 2 x 
P2/P3/P8 - 1 x P4/P6/P7) (tabela S5, figura 8E). O nonâmero AESLLLELE destaca-se 
por formar três pares, um deles com o maior score de similaridade (22). 
 Myelin Basic Protein (MBP) 
A proteína MBP mostrou nove pares de nonâmeros identificados segundo os 
critérios de seleção (tabela S6, figura 8A). O nonâmero VHFFKNIVT liga-se aos HLAs 
DRB1*08:02 e DRB1*15:01, formando dois pares selecionados pelo critério 1 (P2-P3-
P5-P8), e destaca-se por estar presente em peptídeos de 15 aminoácidos 
imunogênicos (tabela 3). Outro par selecionado pelo critério 1 foi o 
FKNIVTPRTMBP/YKNRVASRKEBV, ambos ligantes do HLA-DRB5*01:01. Outros 
nonâmeros também classificados como possivelmente imunogênicos são o 
FKNIVTPRT e IRLFSRDAP. 
 MyelinAssociated Oligodendrocyte Basic Protein (MOBP) 
Apenas foi identificado um par de nonâmeros para a proteína MOBP, o qual 
possui 4 resíduos idênticos, foi selecionado pelo critério 2 (P5 - 2 x P2/P3/P8 - 1 x 
P4/P6/P7) e liga-se ao HLA-DRB5*01:01 (tabela S7, figura 8F). 
 Myelin Protein Zero (MPZ) 
Houve cinco pares de nonâmeros selecionados da proteína P0, todos 
classificados segundo o critério 2 (P5 - 2 x P2/P3/P8 - 1 x P4/P6/P7) e com quatro 
resíduos idênticos (tabela S8, figura 8G). Os nonâmeros mais relevantes foram 
LVLSPAQAI, por formar o par com maior similaridade (21), e VLGAVIGGV, por estar 
em dois pares. 
 Myelin P2 protein (PMP2) 
Foram encontrados quatro pares de nonâmeros para a proteína P2, os quais 
foram selecionados pelo critério 2 (P5 - 2 x P2/P3/P8 - 1 x P4/P6/P7) a apresentam 4 
resíduos idênticos (tabela S9, figura 8H). O nonâmero VGLATRKLG se sobressair por 
estar presente em dois pares. 
42 
 
 Periaxin (PRX) 
35 pares de nonâmeros foram localizados para a proteína (tabela S10, figura 
8I). O HLA-DQA1*05:01/DQB1*03:01 é o com a maior quantidade de pares de 
nonâmeros (22). O nonâmero VGVDLALPG forma três pares, um deles, com o 
nonâmero FGSDLALPS da proteína BOLF1, apresentou score de similaridade 29 e 
maior identidade (6/9). Outro par com score de similaridade 29 foi o 
(SETGAPGPAPeriaxin/ENTGAPAPPEBV) e identidade 5/9. O nonâmero PRPAAPEVV 
está presente na maior quantidade de pares, 6. Um par formado pelo nonâmero 
TEAAELVPG foi selecionado pelo critério 1 (P2-P3-P5-P8). O nonâmero YEDALRLLQ 
destaca-se por participar de peptídeos de 15 aminoácidos preditos como 
imunogênicos (tabela 3). Quatro pares são formados por nonâmeros que se ligam ao 
HLA-DQA1*01:02-DQB1*06:02. 
 Myelin proteolipid protein (PLP1) 
Oito pares de nonâmeros foram localizados para a proteína PLP (tabela S11, 
figura 8J). Nonâmeros contendo o segmento (F)VGAAATLV(S) estão presentes em 
cinco pares, todos com participação do HLA-DQA1*05:01/DQB1*03:01 e quatro deles 
com cinco resíduos idênticos. O nonâmero FYTTGAVRQ liga a três HLAs diferentes, 
formando três pares. Um nonâmero (FVGAAATLV) está contido em peptídeos de 15 
aminoácidos preditos como imunogênicos (tabela 3). 
5 DISCUSSÃO 
Neste estudo foi realizada uma ampla predição de identidade de resíduos 
importantes para a interação com o TCR entre pares de nonâmeros de proteínas do 
EBV e do sistema nervoso. Todas as dez proteínas do sistema nervoso, em maior ou 
menor grau, foram identificadas como possíveis alvos de células T CD4+ 
autorreativas, haja vista a identidade entre os pares de nonâmeros. Algumas proteínas 
do sistema nervoso ainda apresentaram peptídeos imunogênicos, o que implica maior 
potencial de estimular células T CD4+. 
Várias evidências epidemiológicas e sorológicas sustentam o papel do EBV na 
etiologia da esclerose múltipla (SOLDAN; LIEBERMAN, 2023). Um grande estudo 
recente de base populacional demonstrou que a infecção por EBV é um importante 
fator de risco para o desenvolvimento da esclerose múltipla (BJORNEVIK et al., 2022). 
Entretanto, a natureza ubíqua do EBV, que infecta cerca de 95% dos adultos – dos 
43 
 
quais apenas uma pequena fração desenvolve esclerose múltipla –, indica que outros 
fatores contribuem para a patogênese (BJORNEVIK et al., 2022; ROBINSON; 
STEINMAN, 2022). Apesar de haver correlação entre infecção antecedente por EBV 
e o subtipo AIDP (KUWABARA, S. et al., 2004; OGAWARA et al., 2000; 
TAHERAGHDAM et al., 2014) e de existir associação de uma infecção prévia pelo 
vírus com o risco de desenvolver a SGB (independente do subtipo) (TAM et al., 2007), 
há carência de evidências na literatura que sustentem essa relação e não se conhece 
como o vírus pode contribuir para o desenvolvimento da doença. Pelo fato de os 
prováveis mecanismos autoimunes na AIDP serem desconhecidos e de ter sido 
detectada infecções multivirais simultâneas em indivíduos com essa condição, alguns 
autores propuseram uma hipótese suplementar de que uma inflamação local 
associada à imunidade inata contra infecções virais ou bacterianas seria a 
responsável pelo dano primário aos nervos periféricos, enquanto que a produção de 
autoanticorpos seria um processo complementar secundário (ZIGANSHIN et al., 
2016). 
As proteínas do sistema nervoso investigadas neste trabalho foram escolhidas 
independentemente de sua localização celular. Foi demonstrado que peptídeos 
apresentados por moléculas de MHC II são originados da membrana plasmática e dos 
compartimentos nuclear, intracelular e extracelular (ABELIN et al., 2019; BOZZACCO 
et al., 2011). A captura dos antígenos pelas células apresentadoras de antígenos 
(APC, do inglês Antigen Presenting Cells) pode ocorrer através de uma série de 
mecanismos, como macropinocitose, endocitose e fagocitose (ROCHE; FURUTA, 
2015). Esses três mecanismos de captura de antígenos captam material extracelular 
e o transportam para o interior da célula. Essa premissa permite inferir que proteínas 
de qualquer compartimento celular podem ser apresentadas por moléculas de MHC 
de classe II desde que em algum momento sejam liberadas para o meio extracelular. 
Em amostras de indivíduos saudáveis, os ligantes de HLA são primariamente 
proteínas de membrana e extracelulares (MARCU et al., 2021). Entretanto, é preciso 
levar em conta a apresentação de antígenos pelo MHC II no contexto de processos 
inflamatórios, como o que acontece em doenças autoimunes. Através do mecanismo 
conhecido por espalhamento de epítopos, após um dano tecidual inicial, ocorre a 
liberação do conteúdo celular, expondo autoantígenos os quais podem ser captados 
por APCs a apresentados aos linfócitos T autorreativos (SUNDARESAN et al., 2023; 
VANDERLUGT; MILLER, 2002). A ocorrência de espalhamento de epítopos é bem 
44 
 
conhecida no modelo animal de esclerose múltipla (MCMAHON et al., 2005; 
SUNDARESAN et al., 2023; TIAN; SONG; KAUFMAN, 2021). Um provável fator 
iniciador da esclerose múltipla é um infecção prévia pelo EBV, mas o seu papel para 
a progressão da doença é pouco compreendido (BJORNEVIK et al., 2023; SOLDAN; 
LIEBERMAN, 2023). Pode-se questionar que para a produção de autoanticorpos é 
preciso que os antígenos apresentados aos linfócitos T CD4+ sejam de membrana. 
Entretanto, mecanismos imunopatológicos envolvem não apenas a produção de 
autoanticorpos, mas também a participação de células da imunidade inata, como 
macrófagos, as quais são ativadas com auxílio de citocinas secretadas por linfócitos 
T auxiliares (ABBAS; LICHTMAN; PILLAI, 2023). De fato, a imunopatologia tanto da 
esclerose múltipla como da SBG é, em parte, devido a outros mecanismos imunes, 
como a fagocitose mediada por macrófagos (ATTFIELD et al., 2022; SHAHRIZAILA; 
LEHMANN; KUWABARA, 2021). 
A busca de proteínas no SNC está em consonância com análises de proteoma 
que relataram CNP, MAG, MBP, MOBP e PLP entre as de maior abundância relativa 
no SNC (JAHN; TENZER; WERNER, 2009). Essas proteínas são candidatos 
proeminentes na patologia da esclerose múltipla por causa de sua maior quantidade 
e maior expressão na mielina do SNC em comparação a outros tecidos. Os 
autoantígenos não são necessariamente expressos exclusiva ou primariamente no 
órgão afetado (BRONGE et al., 2022). Alguns exemplos são os autoantígenos 
identificados na esclerose múltipla RAS guanyl-releasing protein 2 (JELCIC et al., 
2018), GDP-L-fucose (PLANAS et al., 2018) e o αB-crystalline (VAN NOORT et al., 
2010) que não são específicos do SNC. Análises de proteoma descobriram P0 e 
Periaxina como as proteínas mais abundantes na mielina do SNP de ratos (PATZIG 
et al., 2011; SIEMS et al., 2020). 
A proteína MBP apresenta maior abundância absoluta no SNC, porém a 
abundância relativa é a mesma do SNP (DE MONASTERIO-SCHRADER et al., 2012). 
As proteínas MAG e CNP também são abundantes em ambas as mielinas. Assim, 
pode-se questionar porque linfócitos

Mais conteúdos dessa disciplina