Masking salient object detection, a mask region-based convolutional neural network analysis for segmentation of salient objects

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorTodt, Eduardo, 1963--
Autor(es): dc.contributorUniversidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em Informática-
Autor(es): dc.creatorKrinski, Bruno Alexandre, 1994--
Data de aceite: dc.date.accessioned2020-01-31T12:57:59Z-
Data de disponibilização: dc.date.available2020-01-31T12:57:59Z-
Data de envio: dc.date.issued2019-10-31-
Data de envio: dc.date.issued2019-10-31-
Data de envio: dc.date.issued2019-
Fonte completa do material: dc.identifierhttps://hdl.handle.net/1884/64186-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/1884/64186-
Descrição: dc.descriptionOrientador: Eduardo Todt-
Descrição: dc.descriptionDissertação (mestrado) - Universidade Federal do Paraná, Setor de Ciências Exatas, Programa de Pós-Graduação em Informática. Defesa : Curitiba, 23/08/2019-
Descrição: dc.descriptionInclui referências: p. 94-102-
Descrição: dc.descriptionÁrea de concentração: Ciência da Computação-
Descrição: dc.descriptionResumo: Saliências Visuais são regiões ou objetos dentro de uma imagem que chamam a atenção do nosso sistema visual, sendo processados primeiro na compreensão de uma cena. Na computação, encontrar regiões salientes em imagens pode ser usado como pré-processamento em áreas como reconhecimento, detecção e rastreamento de objetos. Pode ser usado para recortar e redimensionar imagens, comprimir e resumir vídeos ou imagens. Na robótica, algoritmos de localização e mapeamento de ambientes também utilizam conceitos de Saliências Visuais. Este trabalho se concentra na área de detecção de objetos salientes, que visa encontrar os objetos salientes de uma imagem e segmentar toda a sua extensão. O resultado desta segmentação é uma imagem binária, representando um Mapa de Saliência, com as regiões de saliência em branco e as regiões de não-saliência em preto. Os primeiros métodos aplicados para resolver este problema foram baseados em características extraídas manualmente. Com o advento da Convolutional Neural Network (CNN), melhores resultados foram obtidos porque ela aprende as características apropriadas para o problema. Atualmente, a Fullly Convolutional Network (FCN) é o elemento chave das técnicas de ponta no problema da segmentação de objetos salientes. Entretanto, apesar dos resultados promisores alcançados na literatura com redes baseadas em FCNs, a FCN mostrou problemas em algum cenários desafiadores. Muito recentemente, estudos propuseram o uso de uma abordagem baseada na Mask Region-based Convolutional Neural Network (Mask-RCNN) para superar tais problemas. Entretanto, não há nenhuma comparação extensiva entre as duas redes na literatura de Salient Object Detection (SOD) endorsando a eficácia da Mask R-CNN sobre a FCN para segmentar objetos salientes. Com o objetivo de mostrar a superioridade da Mask R-CNN sobre FCN no contexto de SOD, este trabalho propõe duas arquiteturas Mask R-CNN e realiza uma ampla comparação entre a Mask R-CNN e a FCN no contexto de SOD. Neste trabalho, variações da Mask R-CNN são comparadas com variações da FCN em oito conjuntos de dados amplamente utilizados na literatura. Os resultados deste trabalho mostram melhorias de até 47% no F-measure com a Mask R-CNN em comparação com a FCN. Embora os resultados alcançados neste trabalho não superem os resultados mais recentes da literatura, este trabalho mostra a Mask R-CNN como uma alternativa promissora para o problema de SOD. Palavras-chave: Saliência, FCN, Mask R-CNN .-
Descrição: dc.descriptionAbstract: Visual Saliences are regions or objects within an image that draw the attention of our visual system, being processed first in the understanding of a scene. In computing, finding salient regions in images can be used as pre-processing in areas such as object recognition, detection, and tracking. It can be used to crop and resize images, compress and summarize videos or images. In robotics, algorithms of location and mapping of environments also utilize Visual Salience concepts. This work focuses on the area of salient object detection, that aims to find the salient objects of an image and to segment their entire extension. The result of this segmentation is a binary image, representing a Salience Map, with the salience regions in white and the non-salience regions in black. The first methods applied to solve this problem were based on hand-crafted features. With the advent of the Convolutional Neural Network (CNN), better results were obtained because it learns appropriate characteristics for the problem. Nowadays, the Fully Convolutional Network (FCN) is the key element of the state of the art techniques in the problem of segmentation of salient objects. However, besides the promising results achieved in the literature with networks based on FCNs, the FCN showed issues in some challenging scenarios. Fairly recently, studies proposed the use of a Mask Region-based Convolutional Neural Network (Mask R-CNN) based approach to overcome such issues. However, there is no extensive comparison between the two networks in the Salient Object Detection (SOD) literature endorsing the effectiveness of Mask R-CNNs over FCN when segmenting salient objects. Aiming to show the superiority of Mask R-CNNs over FCNs in the SOD context, this work proposes two Mask R-CNN architectures and performs a broad evaluation between the two early mentioned segmentation approaches. In this work, variations of Mask R-CNNs are compared with variations of FCNs in eight datasets widely used in the literature and the findings of this work show improvement from up to 47% in the F-measure with the Mask R-CNN. Although the results achieved in this work do not exceed the most recent results in the literature, this work shows the Mask R-CNN as an promising alternative to the SOD problem. Keywords: Salience, FCN, Mask R-CNN.-
Formato: dc.format102 p. : il. (algumas color.).-
Formato: dc.formatapplication/pdf-
Formato: dc.formatapplication/pdf-
Palavras-chave: dc.subjectRedes neurais (Computação)-
Palavras-chave: dc.subjectImagens-
Palavras-chave: dc.subjectAlgorítmos de computador-
Palavras-chave: dc.subjectCiência da Computação-
Título: dc.titleMasking salient object detection, a mask region-based convolutional neural network analysis for segmentation of salient objects-
Aparece nas coleções:Repositório Institucional - Rede Paraná Acervo

Não existem arquivos associados a este item.