Aplicação de algoritmos de aprendizagem de máquina na identificação de registros espúrios no Cadastro Ambiental Rural

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorFerreira, Danton Diego-
Autor(es): dc.contributorFerreira, Danton Diego-
Autor(es): dc.contributorEvsukoff, Alexandre Gonçalves-
Autor(es): dc.contributorLacerda, Wilian Soares-
Autor(es): dc.creatorBorges, Fernando Elias de Melo-
Data de aceite: dc.date.accessioned2026-02-09T12:48:05Z-
Data de disponibilização: dc.date.available2026-02-09T12:48:05Z-
Data de envio: dc.date.issued2022-09-09-
Data de envio: dc.date.issued2022-09-09-
Data de envio: dc.date.issued2022-09-09-
Data de envio: dc.date.issued2022-07-29-
Fonte completa do material: dc.identifierhttps://repositorio.ufla.br/handle/1/55058-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/1168543-
Descrição: dc.descriptionThe Rural Environmental Registry (CAR) is a mandatory electronic public registry for all rural properties in the Brazilian territory, integrating environmental information from the properties, helping with the environmental monitoring and contributing to actions to combat deforestation. However, a large number of registrations are made erroneously, generating inconsistent data, leading these to be cancelled and/or to request rectifications for the correct completion of the registration. Performing these analyses, identifying the incorrectly completed registries (spurious) manually, has a great cost, given the need for specialized labor, requiring a large amount of time, due to the immense amount of rural properties in Brazil. In this context, this work aims to provide a smart machine learning-based system that allows to check and classify CAR records into spurious and non- spurious (or cancelled and approved) registries in a fast and effective way. To do this, methodologies involving the entire pipeline of an application involving data science and machine learning have been applied. From pre-processing, with attribute cleaning and selection, followed by training and validation of the classifiers, and finally the use of interpretable machine learning algorithms with the goal of evaluating how each attribute impacted the decision making by the classifiers. Six classification models were applied and their results evaluated according to each preprocessing format, and a classifier interpretation model was used to compare the internal interpretations of models that have interpretability. The predictive results show classification performance rates above 90% for all evaluation measures used in the validation set, and the interpretations listed the variables that most influence automatic classification. Thus, the method proved to be viable for application in a real scenario applied to the Rural Environmental Registry.-
Descrição: dc.descriptionAgência Zetta-
Descrição: dc.descriptionO Cadastro Ambiental Rural (CAR) consiste em um registro público eletrônico obrigatório para todos os imóveis rurais do território brasileiro, integra informações ambientais das propriedades, auxiliando no monitoramento ambiental e contribui em ações de combate ao desmatamento. Entretanto, um grande número de cadastros é realizado de maneira errônea gerando dados inconsistentes, levando estes a serem cancelados e/ou a serem pedidas retificações para o devido preenchimento do cadastro. Realizar estas análises, identificando os cadastros preenchidos de maneira incorreta (espúrios) manualmente, possui um grande custo, dada a necessidade de mão de obra especializada, necessitando de um grande período de tempo, devido à imensa quantidade de imóveis rurais no Brasil. Neste contexto, este trabalho tem como objetivo fornecer um sistema inteligente baseado em aprendizagem de máquina que permita verificar e classificar os registros do CAR em registros espúrios e não espúrios (ou cancelados e aprovados) de maneira rápida e eficaz. Para isto, foram aplicadas metodologias que envolvem todo o pipeline de uma aplicação envolvendo ciência de dados e aprendizagem de máquina. Desde o pré-processamento, com a limpeza e seleção de atributos, seguido pelo treinamento e validação dos classificadores e, por fim, o uso de algoritmos de aprendizagem de máquina interpretável com o objetivo de avaliar como cada atributo impactou na tomada de decisão pelos classificadores. Foram aplicados 6 modelos de classificação e avaliados seus resultados de acordo com cada formato de pré-processamento, além disto, um modelo de interpretação de classificadores foi utilizado em comparativo com as interpretações internas de modelos que possuem interpretabilidade. Os resultados preditivos mostram índices de desempenho em classificação acima de 90% para todas as medidas de avaliação utilizadas no conjunto de validação e as interpretações elencaram as variáveis que mais influenciam na classificação automática. Assim, o método mostrou-se viável para uma aplicação em um cenário real aplicado ao Cadastro Ambiental Rural.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Publicador: dc.publisherUniversidade Federal de Lavras-
Publicador: dc.publisherPrograma de Pós-Graduação em Engenharia de Sistemas e Automação-
Publicador: dc.publisherUFLA-
Publicador: dc.publisherbrasil-
Publicador: dc.publisherDepartamento de Engenharia-
Direitos: dc.rightsacesso aberto-
Palavras-chave: dc.subjectCadastro Ambiental Rural-
Palavras-chave: dc.subjectClassificação de dados-
Palavras-chave: dc.subjectDados desbalanceado-
Palavras-chave: dc.subjectAprendizagem de Máquina Interpretável-
Palavras-chave: dc.subjectCiência de dados-
Palavras-chave: dc.subjectRural Environmental Registry-
Palavras-chave: dc.subjectData classification-
Palavras-chave: dc.subjectImbalanced data-
Palavras-chave: dc.subjectInterpretable Machine Learning-
Palavras-chave: dc.subjectData science-
Palavras-chave: dc.subjectCiência da Computação-
Título: dc.titleAplicação de algoritmos de aprendizagem de máquina na identificação de registros espúrios no Cadastro Ambiental Rural-
Título: dc.titleApplication of machine learning algorithms to identify spurious records in the Rural Environmental Registry-
Tipo de arquivo: dc.typedissertação-
Aparece nas coleções:Repositório Institucional da Universidade Federal de Lavras (RIUFLA)

Não existem arquivos associados a este item.