Por esses dias li em um grupo do Facebook dedicado à Genealogia a mensagem de uma participante que pedia recomendações sobre laboratórios por onde fazer seu teste de DNA (autossômico). Uma das recomendações apresentadas foi de que fizesse pelo Genera por conta da facilidade de aquisição e logística, visto que se trata de uma empresa com uma base de dados majoritariamente composta por brasileiros, o que a favoreceria na busca de parentes. A participante, no entanto, informou que tinha ramos ancestrais italianos, por isso talvez fizesse mais sentido comprar o teste de uma empresa estrangeira, no que foi apoiada por outro participante que sugeriu o Ancestry e o 23&Me, que têm as maiores bases de dados do mercado; e o MyHeritage, cuja base seria majoritariamente composta de clientes europeus. Não participei dessa conversa, mas refleti longamente sobre ela e sobre as limitações que adviriam da testagem em um laboratório estrangeiro para além da questão logística, já que algumas das empresas citadas não vendem (portanto não enviam) kits para o Brasil.
A questão mais importante que me ocorreu tem relação com uma situação de que tratei em texto anterior e que vale a pena retomar aqui. É algo um tanto técnico, mas com implicações muito práticas tanto para quem faz o teste por um desses laboratórios estrangeiros citados quanto para quem já transferiu seus dados brutos entre eles – como, por exemplo, do 23&Me ou do Genera para o MyHeritage até meados de 2025. A situação que venho enfrentando e já descrevi no texto anterior tem a ver com os dados brutos do FTDNA e do Genera que transferi para o MyHeritage e para os quais a plataforma analítica deste laboratório vem fornecendo números crescentes de correspondências de DNA – matches ou primos genéticos – com os quais eu deveria ter um parentesco comum na faixa dos trisavós ou tetravós, portanto algo que eu deveria ser capaz de comprovar com documentos. Ocorre que esses matches informados têm origem espanhola, mexicana ou de outros países da América Latina onde sei que não tenho antepassados.
Como expliquei no texto já citado, tais matches não são válidos no sentido que se costuma esperar. Isso que dizer que eles são, sim, meus primos, mas o parentesco é tão distante que podem inexistir documentos capazes de comprová-lo. Trata-se de um fenômeno chamado IBD Excessivo, que ocorre quando segmentos específicos do DNA autossômico estão super representados em determinada população por conta, por exemplo, de alguma vantagem evolutiva que eles conferiram a essa população na região onde viveram a seus ancestrais mais remotos. Um exemplos disso é a região do cromossomo 2 que garantiu às populações antigas que domesticaram o gado a capacidade para digerir o leite na vida adulta, garantindo assim a elas uma vantagem evolutiva com ganho de longevidade. Essa característica é muito presente, por exemplo, em populações europeias e em descendentes de europeus.
Dessa forma, os tais matches numerosos que o MyHeritage tem informado para mim devem ser primos meus distantes provavelmente porque temos uma ancestralidade europeia-ibérica comum. Tudo isso fica evidente quando analiso em que segmento específico do DNA autossômico ocorre o match e descubro que, invariavelmente, é um trecho específico do cromossomo 15, que é já bem conhecido na literatura científica em estudos de casos de IBD Excessivo. Existem outros segmentos similares que costumam resultar em matches dessa natureza para pessoas de ascendência europeia, como se vê na lista abaixo.

Retomando a discussão do Facebook: se a participante da discussão fizer seu teste por um dos grandes laboratórios, precisará estar ciente de que existe o fenômeno do IBD Excessivo, pois nenhum desses laboratórios faz o serviço de filtrar (detectar e remover) matches que ocorram nos segmentos onde tal fenômeno costuma ocorrer de modo a apresentar apenas aqueles que se possam comparar para uma futura busca documental, afinal a genealogia genética sem a genealogia documental é apenas uma sugestão bem imprecisa de parentesco. A única plataforma que fornece algum recurso para detecção do fenômeno descrito é a GEDmatch, mas ela exige algum conhecimento técnico para que a filtragem seja bem realizada.
Caso a participante da conversa decida fazer seu teste por um dos grandes laboratórios, eis as recomendações que ela deveria seguir durante a análise de seus matches:
- Marcar as regiões de risco conhecidas da tabela acima e “colocar de quarentena” ou ignorar os matches que se encaixarem nelas;
- Dar preferência aos matches que ocorrerem em outras regiões (segmentos) ou que forneçam triangulação ou ao menos um ancestral documentado comum;
- Preferir triangulações que ocorrerem no mesmo segmento (exceto se for de uma das áreas da tabela), na mesma posição e com matches que sugiram ter árvores genealógicas similares;
- Valorizar segmentos compartilhados que possuam extensão superior a 15 cM.
José Araújo é genealogista.