Identificação automática de espécies de caramujos aplicando o algoritmo dos vizinhos mais próximos

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorSemaan, Gustavo Silva-
Autor(es): dc.creatorLage, Raphael Magno de Souza-
Data de aceite: dc.date.accessioned2024-07-11T17:37:44Z-
Data de disponibilização: dc.date.available2024-07-11T17:37:44Z-
Data de envio: dc.date.issued2024-02-19-
Data de envio: dc.date.issued2024-02-19-
Fonte completa do material: dc.identifierhttp://app.uff.br/riuff/handle/1/32283-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/754158-
Descrição: dc.descriptionOs sistemas de apoio à decisão beneficiam-se de padrões ocultos (semi-)extraídos automaticamente de grandes bases de dados. No domínio específico da caracterização de gastrópodes, dados e medidas morfológicas podem apoiar os biólogos na identificação de caramujos terrestres. Para isso, os esses dados devem ser submetidos ao processo de Descoberta de Conhecimento em Bases de Dados, que contempla conceitos e técnicas de diversas disciplinas como estatística e aprendizado de máquina. Embora lesmas e caramujos possam ser facilmente identificados por seus sistemas excretório e reprodutivo, o corpo do molusco é comumente inacessível por causa da deterioração do material macio ou da fossilização da concha. Este estudo tem como objetivo investigar o comportamento de um algoritmo classificador baseado em distância sobre um conjunto de dados com características morfológicas de conchas de caracóis terrestres. Dois aspectos do algoritmo são abordados e discutidos neste trabalho (i) ajuste do tipo de função de distância e o número de vizinhos mais próximos, e (ii) seleção de características baseada em distância. Avaliações experimentais indicam que um classificador baseado em distâncias alcançou uma taxa de acerto superior a 99% na tarefa de identificação de caramujos. Tal resultado ilustra a eficiência de uma estratégia orientada por dados para a identificação de caramujos sempre que o corpo do molusco inteiro estiver indisponível, como nos casos recorrentes de conchas perdidas na natureza, ou em coleções pessoais e de museus.-
Descrição: dc.descriptionDecision-support systems benefit from hidden patterns (semi-) automatically extracted from massive digital data. Such a pattern extraction is usually carried out as a Knowledge Discovery in Databases pipeline and may include several statistical and machine learning concepts. In the specific domain of gastropod characterization, morphological data and measurements can support biologists in the identification of land snails by patterns. Although slugs and snails can be easily identified by their excretory and reproductive systems, the mollusk body is commonly inaccessible because of either soft material deterioration or shell fossilization. This study aims at investigating the behavior of a distance-based classifier algorithm over a handcrafted dataset of morphological features of land snail shells. Two aspects of the algorithm are addressed and discussed in this work (i) tuning of the distance function type and the number of nearest neighbors, and (ii) distance-based feature selection. Experimental evaluations indicate a finetuned distance-based classifier achieved a hit ratio higher than 99% in the task of snail identification. Such a result illustrate the efficiency of a data-driven strategy for snail identification whenever the entire mollusk body is unavailable, as in the recurrent cases of shells lost in the nature, or personal and museum shell-only collections.-
Descrição: dc.description41 f.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Direitos: dc.rightsOpen Access-
Direitos: dc.rightsCC-BY-SA-
Palavras-chave: dc.subjectclassificação-
Palavras-chave: dc.subjectvizinhança mais próxima-
Palavras-chave: dc.subjectk-NN-
Palavras-chave: dc.subjectmineração de dados-
Palavras-chave: dc.subjectcaramujos-
Palavras-chave: dc.subjectclassification-
Palavras-chave: dc.subjectnearest neighborhood-
Palavras-chave: dc.subjectk-NN-
Palavras-chave: dc.subjectdata mining-
Palavras-chave: dc.subjectsnails-
Título: dc.titleIdentificação automática de espécies de caramujos aplicando o algoritmo dos vizinhos mais próximos-
Tipo de arquivo: dc.typeTrabalho de conclusão de curso-
Aparece nas coleções:Repositório Institucional da Universidade Federal Fluminense - RiUFF

Não existem arquivos associados a este item.