Análise e reconhecimento de documentos utilizando machine learning

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorZahn, Jean de Oliveira-
Autor(es): dc.contributorMantuan, Altobelli de Brito-
Autor(es): dc.creatorBarros, Jônatas Campos-
Data de aceite: dc.date.accessioned2024-07-11T18:16:39Z-
Data de disponibilização: dc.date.available2024-07-11T18:16:39Z-
Data de envio: dc.date.issued2023-09-29-
Data de envio: dc.date.issued2023-09-29-
Fonte completa do material: dc.identifierhttp://app.uff.br/riuff/handle/1/30679-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/767277-
Descrição: dc.descriptionMuita informação é produzida em forma de texto, disponibilizado como imagens digitalizada, textos criados em formatos digitais, um misto entre esses. A Análise e Reconhecimento de Documentos (DAR) visa a extração automática das informações contidas nos documentos, destinados a compreensão humana. A saída desejada dos sistemas DAR seria uma representação simbólica adequada que poderia ser processada por computadores. Um sistema de DAR pode conter a junção de várias competências como, processamento de imagem, reconhecimento de padrões, processamento de linguagem natural, inteligência artificial, e banco de dados. A utilização de aprendizado de máquina retira a necessidade do tratamento dos dados para que sejam entendidos por um sistema, sendo isso automatizado após o treinamento. Nesse trabalho é apresentada uma introdução sobre o Aprendizado de Máquina falando sobre seus tipos e suas técnicas de aprendizagem, e suas características. Uma descrição e definição de Perceptrons, as Redes Neurais Artificiais, é feita, com suas etapas e componentes, abrangendo o modelo com camada única e o de multicamada. Também é apresentado um estudo sobre DAR, através de técnicas de aprendizado de máquina. Mostrando algumas aplicações, nos passos do processo que se beneficiam com algoritmos de aprendizado de máquina. Seja no reconhecimento de caracteres, palavras, pré-processamento, análise de layout, segmentação de caracteres, verificação de assinatura. Boas práticas de aprendizado de máquina utilizadas em DAR são descritas e algumas tarefas mais adequadas a essas técnicas e como as técnicas de aprendizado de máquina são usadas DAR. As abordagens escolhidas utilizam as Redes Neurais de Convolução, assim como muitos outros trabalhos na atualidade. São descritos no trabalho, um modelo para fazer segmentação e transcrição em um único passo, no segundo trabalho é feita a codificação semântica de imagens que serão alimentadas a uma CNN para serem classificadas, no último trabalho a abordagem usa um modelo de CNNs, uma Faster CNN, na detecção de símbolos musicais, com uso de conjunto de dados anotados sinteticamente, usando data augmentation-
Descrição: dc.description119 p.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Direitos: dc.rightsOpen Access-
Direitos: dc.rightsCC-BY-SA-
Palavras-chave: dc.subjectMachine learning-
Palavras-chave: dc.subjectDocument analysis and recognition-
Palavras-chave: dc.subjectRedes neurais-
Palavras-chave: dc.subjectPerceptron-
Palavras-chave: dc.subjectRedes neurais de convolução-
Palavras-chave: dc.subjectAnálise e reconhecimento de documentos-
Palavras-chave: dc.subjectAprendizado de máquina-
Palavras-chave: dc.subjectRede neural artificial-
Palavras-chave: dc.subjectCodificação semântica de imagens-
Título: dc.titleAnálise e reconhecimento de documentos utilizando machine learning-
Tipo de arquivo: dc.typeTrabalho de conclusão de curso-
Aparece nas coleções:Repositório Institucional da Universidade Federal Fluminense - RiUFF

Não existem arquivos associados a este item.