Reconhecimento de objetos em imagens RGB-D visando estimativa da pose em tempo real

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorMarcon, Marlon-
Autor(es): dc.contributorOrtoncelli, André Roberto-
Autor(es): dc.contributorWill, Newton Carlos-
Autor(es): dc.contributorMarcon, Marlon-
Autor(es): dc.creatorPissaia, Guilherme Luiz-
Data de aceite: dc.date.accessioned2025-08-29T12:27:05Z-
Data de disponibilização: dc.date.available2025-08-29T12:27:05Z-
Data de envio: dc.date.issued2025-03-21-
Data de envio: dc.date.issued2025-03-21-
Data de envio: dc.date.issued2024-09-09-
Fonte completa do material: dc.identifierhttp://repositorio.utfpr.edu.br/jspui/handle/1/36191-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/1095571-
Descrição: dc.descriptionComputer Vision is a field of study in Artificial Intelligence that seeks to employ Machine Learning algorithms to provide applications with the ability to detect visual patterns, classify, and reconstruct objects in multiple dimensions. In this context, this work proposes a substantial improvement based on the conclusions of another study, previously developed. This improvement consists of adding a stage to the execution flow implemented in the original work, which will focus on the detection and classification of objects in two-dimensional scenes, thus seeking to improve the overall result and performance. For this purpose, YOLO, an object detection model, was used in its YOLOv4, YOLOv4-tiny, YOLOv7, and YOLOv7-tiny versions. Thus, it was possible to apply the proposed methodology and perform training and testing of the models using the RGB Scenes dataset. The results proved the effectiveness of YOLO with a mAP value of 99.84% in the best scenario. Furthermore, the processing speed achieved in frames per second was more than ten times higher than that originally achieved, reaching 330 FPS. This demonstrated that the initial hypothesis was correct, given the significant improvement in the performance of the detection task.-
Descrição: dc.descriptionA Visão Computacional é um campo de estudo da Inteligência Artificial que busca empregar algoritmos de Aprendizado de Máquina para proporcionar a aplicações a capacidade de detectar padrões visuais, classificar e reconstruir objetos em múltiplas dimensões. Nesse contexto, o presente trabalho propõe uma melhoria substancial com base nas conclusões de outro estudo, previamente desenvolvido. Essa melhoria consiste na adição de um estágio no fluxo de execução implementado no trabalho original, cujo foco estará na detecção e classificação de objetos em cenas bidimensionais, buscando, dessa forma, um aprimoramento no resultado e desempenho globais. Para tanto, foi utilizado o YOLO, um modelo de detecção de objetos, nas suas versões YOLOv4, YOLOv4-tiny, YOLOv7 e YOLOv7-tiny. Assim, foi possível aplicar a metodologia proposta e realizar os treinamentos e testes dos modelos utilizando o dataset RGB Scenes. Os resultados comprovaram a eficácia do YOLO com um valor de mAP de 99,84% no melhor cenário. Além disso, a velocidade de processamento atingida em quadros por segundo foi mais de dez vezes maior do que a alcançada originalmente, chegando a 330 FPS. Isso evidenciou que a hipótese inicial estava correta, diante da melhoria significativa no desempenho da tarefa de detecção.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Publicador: dc.publisherUniversidade Tecnológica Federal do Paraná-
Publicador: dc.publisherDois Vizinhos-
Publicador: dc.publisherBrasil-
Publicador: dc.publisherEngenharia de Software-
Publicador: dc.publisherUTFPR-
Direitos: dc.rightsopenAccess-
Direitos: dc.rightshttp://creativecommons.org/licenses/by/4.0/-
Palavras-chave: dc.subjectVisão por computador-
Palavras-chave: dc.subjectSistemas de reconhecimento de padrões-
Palavras-chave: dc.subjectAprendizado do computador-
Palavras-chave: dc.subjectComputer vision-
Palavras-chave: dc.subjectPattern recognition systems-
Palavras-chave: dc.subjectMachine learning-
Palavras-chave: dc.subjectCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::ENGENHARIA DE SOFTWARE-
Título: dc.titleReconhecimento de objetos em imagens RGB-D visando estimativa da pose em tempo real-
Título: dc.titleObject recognition in RGB-D images aiming at real-time pose estimation-
Tipo de arquivo: dc.typelivro digital-
Aparece nas coleções:Repositorio Institucional da UTFPR - RIUT

Não existem arquivos associados a este item.