GEDCOM – do inglês Genealogical Data Communication – é o formato padrão de arquivo para troca de informações entre plataformas e aplicativos dedicados à Genealogia. Esse arquivo contém informações codificadas que permitem às plataformas e aos aplicativos interpretar quem era filho de quem e quando cada pessoa nasceu, casou e faleceu de forma que se consegue produzir, por exemplo, uma representação gráfica dessas relações ou uma árvore genealógica. Embora muitas pessoas relatem que não conseguem avançar para além de seus bisavós na pesquisa de seus ascendentes, há quem já tenha produzido uma árvore com milhares de parentes. Minha árvore familiar conta já com mais de 10.400 pessoas, muitas delas pertencentes a ramos que eu gostaria de replicar de forma exclusiva para realizar análises específicas e produzir relatórios e relatos interessantes. Nem todas as plataformas e aplicativos permitem que se faça esse tipo de manipulação, mas descobri que se consegue produzir algo suficientemente bom com a Inteligência Artificial (IA).

Eu tinha interesse em isolar o ramo cujo tronco é o casal João Pinheiro de Souza (1710-1782) e Paula Pereira Monteiro (1725-1815), meus sextos-avós maternos. O casal teve grande prole e enorme descendência, com significativo grau de endogamia, o que me rendeu a descoberta de inúmeros primos genéticos (matches) espalhados por vários estados do Brasil. As informações que já levantei em relação à descendência desse casal a partir dos tais matches e da investigação de outro genealogista me fizeram desejar extrair um ramo desse tronco com algumas centenas de pessoas entre mortas e ainda vivas Como eu não queria instalar um novo aplicativo e desejava avaliar o potencial da IA para realização dessa tarefa, escolhi inicialmente o ChatGPT (Plus, Versão 5.2).

Batismo de João Pinheiro de Souza (“enjeitado João“)

Baixei o GEDCOM matriz da árvore que hospedo na MyHeritage, plataforma onde registro todos os resultados da minha pesquisa genealógica. O arquivo tinha 7,69 MB. Em seguida, abri o ChatGPT, subi o arquivo .GED e inseri o seguinte comando:

A partir deste arquivo extraia todas as linhagens descendentes do casal João Pinheiro de Souza e Paula Pereira Monteiro, incluindo netos, bisnetos, trinetos até a geração mais recente viva no século XXI, adicionando os cônjuges (apenas com seus pais, exceto quando também descendentes do casal-tronco, pelo que se deverá apresentar a ascendência comum) e datas de nascimento, casamento e óbito quando disponíveis e mais as eventuais notas que tenham sido acrescentadas a cada pessoa. O produto final deverá ser um arquivo GEDCOM padrão capaz de ser importado em qualquer plataforma ou software de Genealogia.

O ChatGPT forneceu um link para eu baixar o arquivo gerado, que tinha o diminuto tamanho de 1 KB. Depois de importá-lo na plataforma MyHeritage, descobri que a árvore desejada não fora gerada, pois a IA não havia localizado o casal-tronco por uma questão de formato de acentuação. Informei-a de que o arquivo fornecido estava vazio e, após novo processamento do GEDCOM matriz, a IA localizou o casal e realizou o pedido, gerando um arquivo com o tamanho bem mais realista de 800 KB. Após nova importação na plataforma, recebi a mensagem de que uma “árvore genealógica com 1.243 indivíduos foi importada com sucesso”. O resultado foi bem superior ao que eu havia imaginado. Fica como alerta de que a IA nem sempre tem sucesso nesse tipo de atividade e de que pode ser necessário tentar mais uma vez.

Animado com o resultado, pedi à IA que me informasse de eventual relação entre sobrenomes específicos da descendência de João e Paula e localidades (Municípios/Estados) no Brasil. A análise revelou um “eixo principal no Rio de Janeiro (capital e interior fluminense), com expansão posterior para Espírito Santo, e ramificações menores em Minas Gerais e São Paulo”, pelo menos dentro do que eu havia conseguido documentar em minha árvore em anos de pesquisa. Na relação entre sobrenomes e localidades, foi evidenciado o seguinte padrão, que poderá ser útil na análise de futuros matches de DNA:

  • Gomes de Moraes → Valença/RJ (33), Marapicu/RJ, Paracambi/RJ; Jerônimo Monteiro/ES.
  • Gomes Pereira de Moraes → fortemente ligado a Alegre/ES (7).
  • Pereira Belém → Nova Iguaçu/RJ (19), Bananal de Itaguaí/RJ (18).
  • Pinheiro de Souza → Valença/RJ (6) e Rio de Janeiro (Sé)/RJ (3); Leopoldina/MG.
  • Tavares Pinheiro → Valença/RJ (3) e pequenos focos no RJ e em MG.

Apesar da incerteza quanto ao sucesso em uma tentativa inicial, o uso da IA nesse tipo de tarefa demonstra um potencial bastante interessante e que merece ser explorado.

José Araújo é genealogista.



José Araújo

Genealogista