Minha árvore familiar reúne inúmeras anotações e comentários relacionados, entre outras coisas, aos haplogrupos mitocondriais e de DNA-Y de antepassados matri e patrilineares, bem como à quantidade de centimorgans (cM) compartilhada com matches de DNA autossômico associados a ramos específicos da família. Com o passar do tempo, porém, percebi que o próprio volume de informações pode dificultar a localização de detalhes importantes, que acabam se perdendo no emaranhado de registros e observações. Foi justamente diante desse problema que encontrei uma solução com o auxílio da Inteligência Artificial (IA).

A informação que ficou perdida dizia respeito ao haplogrupo de DNA-Y que acrescentei como anotação no campo Título, na árvore do MyHeritage, ao cidadão Felipe Nery de Moura (1717-1802), que integra meu ramo genealógico materno, embora eu ainda não o tenha comprovado por via documental. Pois lá está a anotação de que ele provavelmente pertencia ao haplogrupo R1b, inferência baseada em um descendente patrilinear moderno testado. Estou certo de que, se acrescentei esse detalhe, foi porque encontrei um descendente direto de Felipe, em linha exclusivamente patrilinear, que também pertence ao R1b. Mas quem foi esse descendente?
Nesse ponto eu reconheci a falha: eu me esqueci de acrescentar o mesmo detalhe no campo Título desse descendente específico. E eu não perderia horas buscando todos os descendentes patrilineares de Felipe, pois assim deixaria de investir tempo para realizar outras pesquisas, para ler obras relevantes ou produzir mais um texto aqui para o blogue. Foi quando me ocorreu que eu poderia usar a IA para essa triagem manual e escolhi o ChatGPT, mesmo reconhecendo que ele poderia cometer erros diversos.
Como ainda não é possível pedir a essa ferramenta para varrer uma árvore diretamente no sítio do MyHeritage, optei por lhe fornecer a árvore inteira no formato de arquivo GEDCOM, o qual exportei do sítio e baixei para meu computador. Em seguida, subi esse arquivo para o ChatGPT a fim de proceder a uma extração delimitada dos ramos que estão na descendência direta de Felipe Nery de Moura e de sua esposa Páscoa Maria de Oliveira. Eis o comando que forneci à ferramenta:
Extraia deste arquivo todos os descendentes diretos do casal Felipe Nery de Moura e Páscoa Maria de Oliveira que contenham a indicação ‘Match’ e produza uma árvore de linha vertical para representar a ascendência deles no citado casal.
A ferramenta respondeu em apenas 47 segundos e desenhou a tal árvore, mas observei que ela havia incluído ramos descendentes que são ainda hipotéticos dentro de minha pesquisa, por isso não seria confiável mantê-los – esquecimento meu. Dei novo comando, pedindo que o GPT excluísse os tais matches hipotéticos, entre os quais estariam meus primos maternos, pois, como já declarei, nossa ascendência em Felipe ainda não foi comprovada. Assim obtive uma nova árvore que continha apenas os descendentes diretos documentados do casal título.
Mas a árvore fornecida continha também ramos que eu percebi serem linhas finais remotas por falta de descendência, ou seja, netos e bisnetos de Felipe e Páscoa que faleceram há muitas décadas sem deixar descendência. Percebi que o problema estava parcialmente no modo como formulei o comando, pois eu não havia deixado explícito que desejava apenas matches vivos ou potencialmente vivos, ou seja, pessoas que fizeram um teste de DNA, o que só se tornou possível a partir dos anos 2000.
Pedi, enfim, que a IA removesse esses casos específicos e me apresentasse apenas os matches descendentes que ainda pudessem estar vivos. E, pronto! Restou apenas um match vivo que era descendente direto em linha patrilinear documentada de Felipe Nery de Moura, que é o que se vê abaixo no fragmento da árvore de linha vertical elaborada pela ferramenta.

A estratégia descrita demonstra seu potencial para outras consultas rápidas como a que exemplifico abaixo com maior detalhamento, inclusive do formato de resposta, para garantir que a IA execute o pedido como pretendido.
Extraia deste arquivo GEDCOM todos os descendentes patrilineares (apenas filhos, netos, bisnetos, trinetos etc. do sexo masculino) potencialmente vivos nos séculos XX e XXI, de Tomás Cordeiro de Peralta (1625-1701). A forma de resposta deverá ser a seguinte: Tomás Cordeiro de Peralta > Filho de Tomás > Neto de Tomás > Bisneto de Tomás … > [n-neto de Tomás vivo entre 1900 e 2020]
Outros exemplos para testar:
- Extraia … todas as descendentes diretas … de [genearca Y];
- Extraia … todos os descendentes de [genearca vicentino X] que permaneceram na vila, depois cidade, de São Vicente.
A experiência mostrou que ferramentas de IA podem acelerar enormemente consultas genealógicas complexas em arquivos GEDCOM extensos, sobretudo em tarefas repetitivas de filtragem e organização de linhagens. Mas também evidenciou algo igualmente importante (e talvez óbvio): a qualidade das respostas depende diretamente da precisão dos comandos fornecidos e da consistência das informações previamente registradas pelo próprio pesquisador.
José Araújo é genealogista.