Extração de relações semânticas e grafos contextuais a partir de imagens de cardápios digitalizados de restaurantes usando redes neurais profundas: criação de ferramentas de processamento de cardápios envolvendo detecção, OCR, e aprendizagem supervisionada.

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorPapa, João Paulo-
Autor(es): dc.contributorFaculdade de Ciências, Departamento de Computação-
Autor(es): dc.contributorUniversidade Estadual Paulista (UNESP)-
Autor(es): dc.creatorSantana, Marcos Cleison Silva-
Data de aceite: dc.date.accessioned2025-08-21T19:17:08Z-
Data de disponibilização: dc.date.available2025-08-21T19:17:08Z-
Data de envio: dc.date.issued2025-08-11-
Data de envio: dc.date.issued2025-01-30-
Fonte completa do material: dc.identifierhttps://hdl.handle.net/11449/312794-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/11449/312794-
Descrição: dc.descriptionEste relatório apresenta o desenvolvimento de um sistema para extração de informações hierárquicas de cardápios digitalizados, abrangendo desde a detecção de texto via OCR, até a classificação de grupos e itens de menu, utilizando técnicas de aprendizado supervisionado e não supervisionado, redes convolucionais e recorrentes, além de redes convolucionais em grafos (GCNs) para análise semântica. O estudo explorou também a detecção de regiões de texto através de imagens mascaradas, a clusterização por tamanho de fonte e diversas técnicas de redução de dimensionalidade (PCA, t-SNE e Isomap) para visualização dos dados. Um sistema de rotulação foi desenvolvido como produto mínimo viável, demonstrando o potencial da combinação das abordagens para uma extração de informações precisa e o auxílio na geração de dados rotulados para futuros aprimoramentos.-
Descrição: dc.descriptionThis report presents the development of a system for hierarchical information extraction from digitized menus, covering everything from text detection via OCR to the classification of menu groups and items, utilizing supervised and unsupervised learning techniques, convolutional and recurrent networks, as well as graph convolutional networks (GCNs) for semantic analysis. The study also explored text region detection through masked images, font size-based clustering, and various dimensionality reduction techniques (PCA, t-SNE, and Isomap) for data visualization. A labeling system was developed as a minimum viable product, demonstrating the potential of combining the approaches for accurate information extraction and assisting in the generation of labeled data for future improvements.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Publicador: dc.publisherUniversidade Estadual Paulista (UNESP)-
Direitos: dc.rightsinfo:eu-repo/semantics/openAccess-
Palavras-chave: dc.subjectDeep learning-
Palavras-chave: dc.subjectText detection-
Palavras-chave: dc.subjectGraph projections-
Palavras-chave: dc.subjectMenu-
Palavras-chave: dc.subjectAprendizagem profunda-
Palavras-chave: dc.subjectDetecção de texto-
Palavras-chave: dc.subjectProjeção de grafos-
Título: dc.titleExtração de relações semânticas e grafos contextuais a partir de imagens de cardápios digitalizados de restaurantes usando redes neurais profundas: criação de ferramentas de processamento de cardápios envolvendo detecção, OCR, e aprendizagem supervisionada.-
Título: dc.titleSemantic relationship extraction and contextual graphs from digitized restaurant menu images using deep neural networks: creating menu processing tools involving detection, ocr, and supervised learning.rocessing Tools Involving Detection, OCR, and Supervised Learning.-
Tipo de arquivo: dc.typeplanilha-
Aparece nas coleções:Repositório Institucional - Unesp

Não existem arquivos associados a este item.