Transcrição automática de textos em português escritos à mão usando Deep Learning

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorCarvalho, Aline Marins Paes-
Autor(es): dc.contributorMontenegro, Anselmo Antunes-
Autor(es): dc.contributorAraújo, Leandro Santiago de-
Autor(es): dc.creatorSilva, Gabriel Henrique Coelho da-
Data de aceite: dc.date.accessioned2024-07-11T18:24:45Z-
Data de disponibilização: dc.date.available2024-07-11T18:24:45Z-
Data de envio: dc.date.issued2022-07-19-
Data de envio: dc.date.issued2022-07-19-
Data de envio: dc.date.issued2020-
Fonte completa do material: dc.identifierhttp://app.uff.br/riuff/handle/1/25743-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/770038-
Descrição: dc.descriptionA escrita manual é uma parte importante no processo de formação do ser humano. Seja para realizar pequenas anotações ou redigir documentos formais, tem-se a escrita manual como uma ferramenta facilitadora para efetuar registros, especialmente em momentos que recursos tecnológicos podem não estar disponíveis. Diversos setores ainda empregam a escrita manual para a realização de tarefas, principalmente na área da educação, mas também em setores como saúde e segurança. Entretanto, o conteúdo pode ter que ser usado em processos automatizados, requerendo que ele esteja em formato processável por máquina. Nesse sentido, todo conteúdo necessário de interpretação da escrita manual para a conclusão das tarefas, se torna inviável de ser processado em grande quantidade e em tempo hábil utilizando-se apenas da capacidade humana. Diversas técnicas computacionais tem sido empregadas como forma de automatizar o processo de conversão da escrita manual para um formato processável por máquina. Entretanto, os avanços no âmbito da língua portuguesa seguem comedidos em comparação ao que se é registrado em outras línguas, como inglês e chinês. Como contribuição a esse processo, objetiva-se a criação de um protótipo para transcrição automática de textos em português escritos à mão, através de uma vertente do Aprendizado de Máquina conhecida como Deep Learning, onde são explorados métodos e ferramentas consolidadas para extração e reconhecimento de informação textual em imagens. Resultados preliminares demonstram que mesmo sem o treinamento dos modelos embutidos nessas ferramentas para a língua portuguesa, parte do vocabulário foi reconhecido corretamente. A análise também apontou incongruências, se concentrando em aspectos principalmente relacionados ao estilo de escrita empregado e às particularidades da língua portuguesa, como o uso de símbolos, para acentuação e combinação de palavras. Por fim, é proposta uma nova versão do protótipo, tratando alguns casos observados acerca desses problemas e propiciando que mais respostas corretas fossem geradas. Portanto, concluiu-se que a estrutura proposta funciona bem para casos gerais da língua, servindo como base para criação de outras ferramentas que contemplem as especificidades inerentes à língua portuguesa não tratadas nesse trabalho.-
Descrição: dc.descriptionHandwriting is an integral part of the human formation process. Handwriting is a facilitating tool to make records, especially when technological resources may not be available, whether to make small notes or write formal documents. Several sectors still employ handwriting to carry out tasks, mainly in education, and in sectors such as healthcare and safety. However, content may have to be used in automated processes, requiring it to be in a machine-processable format. In this sense, all the necessary content for handwriting interpretation becomes unfeasible to be processed in large quantities and on time, using only human capacity. Several computing techniques are applied as a way to automate the process of converting handwriting to a machine-processable format. Nevertheless, advances in the scope of Portuguese language remain moderate compared to what is done in other languages, such as English and Chinese. This work contributes to this scenario by proposing and analysing a prototype for automatic transcription of handwritten texts in Portuguese, through a Machine Learning strand known as Deep Learning. It includes consolidate methods and tools for extracting and recognition of textual information contained in images. Preliminary results point out that even without training the models embedded in these tools for the Portuguese language, part of the vocabulary was correctly recognized. The analysis also pointed out some failures, concerning mainly the writing style and particularities of Portuguese language, such as the use of symbols for accentuation and combination of words. Finally, a new version of the prototype is proposed to deal with some cases based on the problems reported, generating more correct answers. Therefore, we can conclude that the tool work well for part of Portuguese vocabulary and it can serve as a basis for the development of other tools to address the particularities of the Portuguese languages that this work does not tackle.-
Descrição: dc.description69 p.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Direitos: dc.rightsOpen Access-
Direitos: dc.rightsCC-BY-SA-
Palavras-chave: dc.subjectInteligência artificial-
Palavras-chave: dc.subjectAprendizado de Máquina-
Palavras-chave: dc.subjectRedes Neurais-
Palavras-chave: dc.subjectReconhecimento de texto-
Palavras-chave: dc.subjectEscrita em português-
Palavras-chave: dc.subjectInteligência artificial-
Palavras-chave: dc.subjectProcessamento de imagem-
Palavras-chave: dc.subjectAprendizado de máquina-
Palavras-chave: dc.subjectArtificial intelligence-
Palavras-chave: dc.subjectMachine Learning-
Palavras-chave: dc.subjectNeural Networks-
Palavras-chave: dc.subjectDeep Learning-
Palavras-chave: dc.subjectHandwritten-
Palavras-chave: dc.subjectPortuguese text recognition-
Título: dc.titleTranscrição automática de textos em português escritos à mão usando Deep Learning-
Tipo de arquivo: dc.typeTrabalho de conclusão de curso-
Aparece nas coleções:Repositório Institucional da Universidade Federal Fluminense - RiUFF

Não existem arquivos associados a este item.