Margin-based learning to enhance open-set semantic segmentation

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorLazzaretti, André Eugênio-
Autor(es): dc.contributorhttps://orcid.org/0000-0003-1861-3369-
Autor(es): dc.contributorhttp://lattes.cnpq.br/7649611874688878-
Autor(es): dc.contributorLopes, Heitor Silvério-
Autor(es): dc.contributorhttps://orcid.org/0000-0003-3984-1432-
Autor(es): dc.contributorhttp://lattes.cnpq.br/4045818083957064-
Autor(es): dc.contributorLazzaretti, André Eugênio-
Autor(es): dc.contributorhttps://orcid.org/0000-0003-1861-3369-
Autor(es): dc.contributorhttp://lattes.cnpq.br/7649611874688878-
Autor(es): dc.contributorGomes, David Menotti-
Autor(es): dc.contributorhttps://orcid.org/0000-0003-2430-2030-
Autor(es): dc.contributorhttp://lattes.cnpq.br/6692968437800167-
Autor(es): dc.contributorLopes, Fabrício Martins-
Autor(es): dc.contributorhttp://orcid.org/0000-0002-8786-3313-
Autor(es): dc.contributorhttp://lattes.cnpq.br/1660070580824436-
Autor(es): dc.contributorPedrini, Hélio-
Autor(es): dc.contributorhttps://orcid.org/0000-0003-0125-630X-
Autor(es): dc.contributorhttp://lattes.cnpq.br/9600140904712115-
Autor(es): dc.contributorBugatti, Pedro Henrique-
Autor(es): dc.contributorhttps://orcid.org/0000-0001-9421-9254-
Autor(es): dc.contributorhttp://lattes.cnpq.br/2177467029991118-
Autor(es): dc.creatorBrilhador, Anderson-
Data de aceite: dc.date.accessioned2025-08-29T13:20:14Z-
Data de disponibilização: dc.date.available2025-08-29T13:20:14Z-
Data de envio: dc.date.issued2025-03-13-
Data de envio: dc.date.issued2025-03-13-
Data de envio: dc.date.issued2025-02-11-
Fonte completa do material: dc.identifierhttp://repositorio.utfpr.edu.br/jspui/handle/1/36088-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/1111449-
Descrição: dc.descriptionSemantic segmentation has received wide attention as a feasible solution for effectively interpreting information in digital images. Solutions are typically built with a static closed-set perception, where all labels are known a priori. However, in real-world applications, one has to handle objects from unknown classes. Open-set semantic segmentation (OSSS) is an approach that incorporates open-set perception into semantic segmentation, allowing the recognition of unknown classes of objects. While various studies have explored OSSS, its performance remains limited due to low feature representation quality and challenges like imbalanced data, uncertain boundary regions, and semantic shifts. These challenges result in closed-set semantic segmentation models that build embedding spaces with overlapping decision boundaries and insufficient open space to accommodate unknown classes, thereby negatively impacting open-set recognition performance. This thesis presents two novel loss functions based on margin-based learning and hard sample attention to enhance open-set recognition. Two novel open-set classifiers are proposed: one that employs Principal Components and the other that uses Prototypical Distance. Both are designed to benefit from the features generated by the proposed loss functions. Experiments were conducted on six datasets, of which three were originally proposed in this work, and the results demonstrate that the proposed methods outperform state-of-the-art learning strategies in OSSS. These findings underscore the significance of such learning approaches, paving the way for their application in real-world systems requiring robust open-set recognition.-
Descrição: dc.descriptionA segmentação semântica recebeu grande atenção como uma solução viável para interpretar efetivamente informações em imagens digitais. As soluções são normalmente construídas com uma percepção estática de conjunto fechado, onde todos os rótulos são conhecidos a priori. No entanto, em aplicações do mundo real, é preciso lidar com objetos de classes desconhecidas. A segmentação semântica de conjunto aberto (OSSS) é uma abordagem que incorpora a percepção de conjunto aberto na segmentação semântica, permitindo o reconhecimento de classes desconhecidas de objetos. Embora vários estudos tenham explorado o OSSS, seu desempenho permanece limitado devido à baixa qualidade de representação de características e desafios como dados desbalanceados, regiões de limites incertas e mudanças semânticas. Esses desafios resultam em modelos de segmentação semântica de conjunto fechado que constroem espaços de incorporação com limites de decisão sobrepostos e espaço aberto insuficiente para acomodar classes desconhecidas, impactando negativamente o desempenho do reconhecimento de conjunto aberto. Esta tese apresenta duas novas funções de perda baseadas em aprendizado baseado em margem e atenção a amostras difíceis para aprimorar o reconhecimento de conjunto aberto. Dois novos classificadores de conjunto aberto são propostos: um que emprega Componentes Principais e o outro que usa Distância Prototípica. Ambos são projetados para se beneficiar dos recursos gerados pelas funções de perda propostas. Experimentos foram conduzidos em seis conjuntos de dados, dos quais três foram originalmente propostos neste trabalho, e os resultados demonstram que os métodos propostos superam estratégias de aprendizado de última geração em OSSS. Essas descobertas ressaltam a importância de tais abordagens de aprendizagem, abrindo caminho para sua aplicação em sistemas do mundo real que exigem reconhecimento robusto de conjuntos abertos.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languageen-
Publicador: dc.publisherUniversidade Tecnológica Federal do Paraná-
Publicador: dc.publisherCuritiba-
Publicador: dc.publisherBrasil-
Publicador: dc.publisherPrograma de Pós-Graduação em Engenharia Elétrica e Informática Industrial-
Publicador: dc.publisherUTFPR-
Direitos: dc.rightsopenAccess-
Direitos: dc.rightshttp://creativecommons.org/licenses/by/4.0/-
Palavras-chave: dc.subjectImagens digitais-
Palavras-chave: dc.subjectAprendizado profundo (Aprendizado do computador)-
Palavras-chave: dc.subjectComputação semântica-
Palavras-chave: dc.subjectSegmentação de imagem-
Palavras-chave: dc.subjectSistemas de reconhecimento de padrões-
Palavras-chave: dc.subjectVisão por computador-
Palavras-chave: dc.subjectRedes neurais (Computação)-
Palavras-chave: dc.subjectDigital images-
Palavras-chave: dc.subjectDeep learning (Machine learning)-
Palavras-chave: dc.subjectSemantic computing-
Palavras-chave: dc.subjectImage segmentation-
Palavras-chave: dc.subjectPattern recognition systems-
Palavras-chave: dc.subjectComputer vision-
Palavras-chave: dc.subjectNeural networks (Computer science)-
Palavras-chave: dc.subjectCNPQ::ENGENHARIAS::ENGENHARIA ELETRICA-
Palavras-chave: dc.subjectEngenharia Elétrica-
Título: dc.titleMargin-based learning to enhance open-set semantic segmentation-
Título: dc.titleAprendizagem baseada em margem para aprimorar a segmentação semântica de conjunto aberto-
Tipo de arquivo: dc.typelivro digital-
Aparece nas coleções:Repositorio Institucional da UTFPR - RIUT

Não existem arquivos associados a este item.