Atenção:
O eduCAPES é um repositório de objetos educacionais, não sendo responsável por materiais de terceiros submetidos na plataforma. O usuário assume ampla e total responsabilidade quanto à originalidade, à titularidade e ao conteúdo, citações de obras consultadas, referências e outros elementos que fazem parte do material que deseja submeter. Recomendamos que se reporte diretamente ao(s) autor(es), indicando qual parte do material foi considerada imprópria (cite página e parágrafo) e justificando sua denúncia.
Caso seja o autor original de algum material publicado indevidamente ou sem autorização, será necessário que se identifique informando nome completo, CPF e data de nascimento. Caso possua uma decisão judicial para retirada do material, solicitamos que informe o link de acesso ao documento, bem como quaisquer dados necessários ao acesso, no campo abaixo.
Todas as denúncias são sigilosas e sua identidade será preservada. Os campos nome e e-mail são de preenchimento opcional. Porém, ao deixar de informar seu e-mail, um possível retorno será inviabilizado e/ou sua denúncia poderá ser desconsiderada no caso de necessitar de informações complementares.
Metadados | Descrição | Idioma |
---|---|---|
Autor(es): dc.contributor | Rocio, Vitor | - |
Autor(es): dc.creator | Schatz, Jan Paulo Borges | - |
Data de aceite: dc.date.accessioned | 2025-08-22T11:47:27Z | - |
Data de disponibilização: dc.date.available | 2025-08-22T11:47:27Z | - |
Data de envio: dc.date.issued | 2023-05-18 | - |
Data de envio: dc.date.issued | 2023-05-18 | - |
Data de envio: dc.date.issued | 2023-05-16 | - |
Data de envio: dc.date.issued | 2023-05-18 | - |
Fonte completa do material: dc.identifier | http://hdl.handle.net/10400.2/13795 | - |
Fonte: dc.identifier.uri | http://educapes.capes.gov.br/handle/10400.2/13795 | - |
Descrição: dc.description | O presente estudo visa investigar as etapas de um sistema construído para o processo de automatização da recolha de informação genealógica: reconhecimento de caracteres a partir de fontes físicas e extração de dados da World Wide Web, recuperação de informações relevantes, extração de relações familiares, inserção dos dados em ficheiros de formato apropriado e, consequentemente, visualização gráfica num formato claro e com o menor número possível de distorções. Campos da informática que evoluíram do estudo do reconhecimento de padrões e da teoria da aprendizagem computacional em inteligência artificial são atualmente utilizados para resolver a tarefa de extração de relações de entidades, o que ajuda muito o processo de investigação genealógica. Alguns trabalhos já procuraram nos últimos anos medir a capacidade de identificar texto e extrair informação útil, otimizando a relação entre a fonte de informação e a sua exibição em diagramas. Uma aplicação promissora é a conversão de texto em formato livre utilizando técnicas de processamento de linguagem natural, seguida de treino de um modelo de aprendizagem de máquina. Finalmente, as relações escolhidas podem ser convertidas em ficheiros GEDCOM que permitem facilmente a criação de árvores genealógicas. | - |
Descrição: dc.description | The present study aims to investigate the steps of a system built for the process of automating the collection of genealogical information: character recognition from physical sources and extraction of data from the World Wide Web, retrieval of relevant information, extraction of family relationships, insertion of the data into files of appropriate format and, consequently, graphical visualization in a clear format and with as few distortions as possible. Fields of computer science that evolved from the study of pattern recognition and computational learning theory in artificial intelligence are currently used to solve the task of extracting entity relationships, which greatly aids the process of genealogical research. Some works has already sought in recent years to measure the ability to identify text and extract useful information, optimizing the relationship between the source of information and its display in diagrams. A solution that has shown good results is free-form text conversion using natural language processing techniques followed by training of a machine learning model. Finally, the chosen relationships can be converted into GEDCOM files that easily enable the creation of family trees. | - |
Formato: dc.format | application/pdf | - |
Idioma: dc.language | en | - |
Direitos: dc.rights | http://creativecommons.org/licenses/by-nc-nd/4.0/ | - |
Palavras-chave: dc.subject | Reconhecimento de caracteres | - |
Palavras-chave: dc.subject | Extração de informação | - |
Palavras-chave: dc.subject | Reconhecimento de entidade mencionada | - |
Palavras-chave: dc.subject | Aprendizagem de máquina | - |
Palavras-chave: dc.subject | GEDCOM | - |
Palavras-chave: dc.subject | Character recognition | - |
Palavras-chave: dc.subject | Information extraction | - |
Palavras-chave: dc.subject | Named entity recognition | - |
Palavras-chave: dc.subject | Machine learning | - |
Palavras-chave: dc.subject | Genealogical diagram | - |
Título: dc.title | Automation of the genealogical process: information extraction for GEDCOM files | - |
Título: dc.title | Automatização do processo genealógico: extração de informações para ficheiros GEDCOM | - |
Aparece nas coleções: | Repositório Aberto - Universidade Aberta (Portugal) |
O Portal eduCAPES é oferecido ao usuário, condicionado à aceitação dos termos, condições e avisos contidos aqui e sem modificações. A CAPES poderá modificar o conteúdo ou formato deste site ou acabar com a sua operação ou suas ferramentas a seu critério único e sem aviso prévio. Ao acessar este portal, você, usuário pessoa física ou jurídica, se declara compreender e aceitar as condições aqui estabelecidas, da seguinte forma: