Identificação de escritores usando dissimilaridade em bases multi-script

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorGonçalves, Diego Bertolini-
Autor(es): dc.contributorGonçalves, Rogério Aparecido-
Autor(es): dc.contributorKawamoto, André Luiz Satoshi-
Autor(es): dc.contributorGonçalves, Diego Bertolini-
Autor(es): dc.creatorNoya, Guilherme Pereira-
Data de aceite: dc.date.accessioned2022-02-21T21:25:04Z-
Data de disponibilização: dc.date.available2022-02-21T21:25:04Z-
Data de envio: dc.date.issued2020-11-08-
Data de envio: dc.date.issued2020-11-08-
Data de envio: dc.date.issued2017-06-21-
Fonte completa do material: dc.identifierhttp://repositorio.utfpr.edu.br/jspui/handle/1/6035-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/652186-
Descrição: dc.descriptionContext: In Pattern Recognition, single-scripts situations were vastly studied. Recently, researchers are trying to evaluate multi-script problems. As of new studies are published, this branch is revealing to be more complex and challenging than single-script scenarios. There are some variations to writer-dependent and writer-independent approaches, but a recent study using dissimilarity (a writer-independent approach) applied in a multi-script problem showed promising results. Objective: The objective is to evaluate the performance of the dissimilarity approach in multi-script and single-script scenarios, and also to evaluate the identification rate in cases where the train set and the test set belong to different datasets. Method: Four multi-script datasets are used. The textures are generated from these datasets’ documents and divided in blocks, then the features are extracted with the LBP, RLBP and LPQ texture descriptors. The dissimilarity vectors are calculated from the feature vectors and then the different experiments are executed, in the desired configurations. Finally, the results are combined, in order to obtain a final decision about the classification of the writers. Results: For the writer-dependent approach, the single-script experiments had a better performance than when using multi-script, specially with LPQ. The dissimilarity improved the results in every case, reaching an accuracy of 100% in identification in some of them. The use of LPQ also presented excellent results in transfer learning. Conclusions: The experiments showed variations within the approaches used. The identification rates show that a multi-script configuration is more complex, and the use of dissimilarity provided a huge gain in performance in most of the datasets. It was also showed that when training on one dataset and testing on another, the performance remains satisfactory. Some questions were raised that can originate new studies.-
Descrição: dc.descriptionContexto: Na área de reconhecimento de padrões, cenários com apenas um estilo de escrita já foram vastamente estudados. Atualmente, pesquisadores tem avaliado o problema com a utilização de vários estilos de escrita (multi-script). Nesses estudos, a área vem se provando mais complexa e desafiadora que cenários single-script. Existem diversas abordagens, mas um estudo recente utilizando dissimilaridade (abordagem escritor-independente) aplicado em um cenário multi-script apresentou resultados promissores. Objetivo: O objetivo é avaliar o desempenho da utilização de dissimilaridade em cenários multi-script e single-script, assim como avaliar as taxas de acerto em casos que o treino e classificação são executados em bases diferentes (transferência de conhecimento). Método: Quatro bases de dados multi-script são utilizadas. Gera-se texturas a partir dos documentos (cartas) de cada escritor, que são então divididas em blocos. Em seguida, são extraídas as características com os descritores de texturas LBP, RLBP e LPQ. A partir destes vetores de características, os vetores de dissimilaridade são calculados e então são realizados os experimentos nos cenários desejados. Por fim, é realizada uma combinação dos resultados a fim de se obter uma decisão final quanto a classificação dos escritores. Resultados: Para escritor-dependente, os experimentos no cenário single-script tiveram um melhor desempenho que no cenário multi-script, com destaque para o LPQ. Já a dissimilaridade melhorou os resultados em todos os casos, chegando a 100% de acerto em diversos deles. O uso do LPQ também apresentou excelentes resultados na transferência de conhecimentos. Conclusões: Os experimentos mostraram grandes variações entre as abordagens usadas. As taxas de reconhecimento comprovam que um cenário multi-script é mais complexo, e o uso da dissimilaridade proveu um grande salto de desempenho na maioria das bases. Mostrou-se também que treinando em uma base e testando em outra, o desempenho mantém-se satisfatório. Levantou-se ainda questões que podem originar outros estudos.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Publicador: dc.publisherUniversidade Tecnológica Federal do Paraná-
Publicador: dc.publisherCampo Mourao-
Publicador: dc.publisherBrasil-
Publicador: dc.publisherDepartamento Acadêmico de Computação-
Publicador: dc.publisherCiência da Computação-
Publicador: dc.publisherUTFPR-
Direitos: dc.rightsopenAccess-
Palavras-chave: dc.subjectSistemas de reconhecimento de padrões-
Palavras-chave: dc.subjectEscrita - Identificação-
Palavras-chave: dc.subjectComputação-
Palavras-chave: dc.subjectPattern recognition systems-
Palavras-chave: dc.subjectWriting - Identification-
Palavras-chave: dc.subjectComputer science-
Palavras-chave: dc.subjectCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO-
Título: dc.titleIdentificação de escritores usando dissimilaridade em bases multi-script-
Tipo de arquivo: dc.typelivro digital-
Aparece nas coleções:Repositorio Institucional da UTFPR - RIUT

Não existem arquivos associados a este item.