Identificacão de modelos de arquivos PDF através de texto e metadados

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorWojciechowski, Jaime, 1965--
Autor(es): dc.contributorUniversidade Federal do Paraná-
Autor(es): dc.creatorHasse, Mozart-
Data de aceite: dc.date.accessioned2025-09-01T12:04:45Z-
Data de disponibilização: dc.date.available2025-09-01T12:04:45Z-
Data de envio: dc.date.issued2022-06-14-
Data de envio: dc.date.issued2022-06-14-
Data de envio: dc.date.issued2020-
Fonte completa do material: dc.identifierhttps://hdl.handle.net/1884/76441-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/1884/76441-
Descrição: dc.descriptionOrientador: Prof. Dr. Jaime Wojciechowski-
Descrição: dc.descriptionMonografia (especialização) - Universidade Federal do Paraná, Setor de Educação Profissional e Tecnológica, Curso de Especialização em Inteligência Artificial Aplicada.-
Descrição: dc.descriptionInclui referências: p. 24-25-
Descrição: dc.descriptionResumo: O grande volume de documentos PDF gerados por aplicações comerciais exige o uso de algoritmos de classificação eficientes para organizar estes arquivos de maneira automática. Este trabalho apresenta uma solução para o caso específico em que seja necessário diferenciar modelos de documentos sujeitos a alterações constantes na organização dos dados a fim de viabilizar um tratamento posterior bastante específico para cada classe. O algoritmo escolhido é o KNN com similaridade de documentos usando o texto junto com os metadados e medida via shingling. Algumas opções de algoritmos são analisadas e comparadas com a implementação proposta. Os resultados são comparados numa base de referência e então conclui-se que a abordagem escolhida atende aos requisitos propostos e é satisfatória para esta aplicação.-
Formato: dc.format1 recurso online : PDF.-
Formato: dc.formatapplication/pdf-
Formato: dc.formatapplication/pdf-
Palavras-chave: dc.subjectInteligência artificial-
Palavras-chave: dc.subjectAlgorítmos de computador-
Palavras-chave: dc.subjectSoftware - Desenvolvimento-
Título: dc.titleIdentificacão de modelos de arquivos PDF através de texto e metadados-
Aparece nas coleções:Repositório Institucional - Rede Paraná Acervo

Não existem arquivos associados a este item.