Desenvolvimento de extensão para geração de conjuntos de dados sintéticos

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorAndrade, Mauren Louise Sguario Coelho de-
Autor(es): dc.contributorAndrade, Mauren Louise Sguario Coelho de-
Autor(es): dc.contributorIliuk, Itamar-
Autor(es): dc.contributorAires, Simone Bello Kaminski-
Autor(es): dc.creatorRibeiro, Vinícius Cerqueira-
Data de aceite: dc.date.accessioned2025-08-29T12:27:14Z-
Data de disponibilização: dc.date.available2025-08-29T12:27:14Z-
Data de envio: dc.date.issued2025-07-02-
Data de envio: dc.date.issued2025-07-02-
Data de envio: dc.date.issued2025-02-04-
Fonte completa do material: dc.identifierhttp://repositorio.utfpr.edu.br/jspui/handle/1/37321-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/1095621-
Descrição: dc.descriptionOne of the main challenges in developing artificial intelligence models based on deep neural networks is obtaining high-quality data for training datasets. As tasks become more complex, the costs of annotation and the difficulty of acquiring data increase, making the process more time-consuming and expensive. As an alternative, researchers have explored the use of virtual environments to automate the annotation of low-cost, error-free datasets. In this context, this work presents the development of an extensible Python plugin for the open-source software Blender, which uses the graphics engine to generate photorealistic synthetic datasets aimed at computer vision challenges such as segmentation and bounding box detection. In the end, the tool was used to create a dataset with retail product images, with the goal of evaluating the quality of the generated annotations and the impact of synthetic data on training. The Faster R-CNN model with ResNet50 backbone, pre-trained on the COCO dataset, was trained on a set of 10,000 images containing 5 product classes, achieving a mAP@0.5:0.95 of 48,1% on the synthetic validation set and a mAP@0.5:0.95 of 24,8% on the real validation set.-
Descrição: dc.descriptionUma das principais dificuldades no desenvolvimento de modelos de inteligência artificial baseados em redes neurais profundas é a obtenção de dados de alta qualidade para a criação de conjuntos de treinamento. À medida que as tarefas se tornam mais complexas, os custos de anotação e a dificuldade de obtenção dos dados aumentam, tornando o processo mais demorado e oneroso. Como alternativa, pesquisadores têm explorado o uso de ambientes virtuais para automatizar a anotação de conjuntos de dados de baixo custo e livres de erros. Neste contexto, este trabalho apresenta o desenvolvimento de um plugin extensível em Python para o software open-source Blender, que utiliza o motor gráfico para a geração de conjuntos de dados sintéticos fotorrealistas, voltados para desafios de Visão Computacional, como segmentação e detecção por caixas delimitadoras. Ao final, a ferramenta foi utilizada para criar um conjunto de dados com imagens de produtos de varejo, com o objetivo de avaliar a qualidade das anotações geradas e o impacto dos dados sintéticos no treinamento. O modelo Faster R-CNN com backbone ResNet50, pré-treinado no conjunto COCO, foi treinado no conjunto de 10 mil imagens, contendo 5 classes de produtos, alcançando um mAP@0.5:0.95 de 48,1% no conjunto de validação sintético e mAP@0.5:0.95 24,8% no conjunto real.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Publicador: dc.publisherUniversidade Tecnológica Federal do Paraná-
Publicador: dc.publisherPonta Grossa-
Publicador: dc.publisherBrasil-
Publicador: dc.publisherDepartamento Acadêmico de Informática-
Publicador: dc.publisherCiência da Computação-
Publicador: dc.publisherUTFPR-
Direitos: dc.rightsopenAccess-
Direitos: dc.rightshttp://creativecommons.org/licenses/by/4.0/-
Palavras-chave: dc.subjectVisão por computador-
Palavras-chave: dc.subjectProcessamento de imagens-
Palavras-chave: dc.subjectAprendizado do computador-
Palavras-chave: dc.subjectAmbientes virtuais compartilhados-
Palavras-chave: dc.subjectComputer vision-
Palavras-chave: dc.subjectImage processing-
Palavras-chave: dc.subjectMachine learning-
Palavras-chave: dc.subjectShared virtual environments-
Palavras-chave: dc.subjectCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO-
Título: dc.titleDesenvolvimento de extensão para geração de conjuntos de dados sintéticos-
Título: dc.titleExtension development for generating synthetic datasets-
Tipo de arquivo: dc.typelivro digital-
Aparece nas coleções:Repositorio Institucional da UTFPR - RIUT

Não existem arquivos associados a este item.