Métodos para detecção de Outliers multivariados: Via uso dos estimadores robustos

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorFerreira, Daniel Furtado-
Autor(es): dc.contributorFerreira, Daniel Furtado-
Autor(es): dc.contributorNogueira, Denismar Alves-
Autor(es): dc.contributorBeijo, Luiz Alberto-
Autor(es): dc.contributorBatista, Ben Deivide de Oliveira-
Autor(es): dc.creatorMartins, Humberto Marcílio-
Data de aceite: dc.date.accessioned2026-02-09T11:10:01Z-
Data de disponibilização: dc.date.available2026-02-09T11:10:01Z-
Data de envio: dc.date.issued2022-06-10-
Data de envio: dc.date.issued2022-06-10-
Data de envio: dc.date.issued2022-06-10-
Data de envio: dc.date.issued2022-03-14-
Fonte completa do material: dc.identifierhttps://repositorio.ufla.br/handle/1/50190-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/1135151-
Descrição: dc.descriptionIn the application of the multivariate analysis, it is necessary to follow some procedures in order not to obtain an erroneous relationship between the phenomenon of interest and the other varia- bles, that is, the model needs to be well adjusted to the characteristics of the phenomenon under study. The detection of outliers is an important method to be applied in statistical analyses, because a single outlier can cause changes in parameter estimates, also interfere with norma- lity and correlation tests between variables, in addition to alter the results of any other inference procedure. Therefore, the objective of this work is to present and compare some methods for de- tecting outliers in multivariate data. The minimum volume ellipsoid (MVE), minimum volume covariance (MCD), orthogonalized Gnanadesikan and Kettenring (OGK) methods, principal components for detection of outliers (PCOut) and Comedian were compared. To perform the comparisons, a series of simulations was used, predicting different situations using the conta- minated normal distribution. Comparisons were evaluated through the success rate (TS), which indicates the percentage of outliers that the methods correctly identified, and the false detec- tion rate (TFD), which indicates the percentage of observations that are not outliers, but were identified as outliers. It is concluded that the ideal is to use at least two methods to detect ou- tliers, since pointing out the only method as the best is a difficult task. However, the PCOut and Comedian methods obtained the best TS in most of the simulated scenarios. The comedian method obtained the best TFD.-
Descrição: dc.descriptionCoordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)-
Descrição: dc.descriptionNa aplicação da análise multivariada é necessário seguir alguns procedimentos para não obter uma relação equivocada do fenômeno de interesse com as demais variáveis, ou seja, o modelo precisa ser bem ajustado às características do fenômeno sob estudo. A detecção de outliers é um importante método a ser aplicado nas análises estatísticas, pois um único outlier pode cau- sar mudanças nas estimativas dos parâmetros, interferir também nos testes de normalidade e de correlação entre as variáveis, além de alterar os resultados de qualquer outro procedimento de inferência. Portanto, o objetivo desse trabalho é apresentar e comparar alguns métodos de de- tecção de outliers em dados multivariados. Foram comparados os métodos elipsóide de volume mínimo (MVE), Covariância de volume mínimo (MCD), Ortogonalizado de Gnanadesikan e Kettenring (OGK), componentes principais para detecção de outliers (PCOut) e o Comedian. Para realizar as comparações foi utilizado uma série de simulações prevendo diversas situações utilizando a distribuição normal contaminada. As comparações foram avaliadas atráves da taxa de sucesso (TS), que aponta a porcentagem de outliers que os métodos identificaram correta- mente e da taxa de falsa detecção (TFD), que aponta a porcentagem de observações que não são outliers, mas foram identificadas como outliers. Conclui-se que o ideal é utlizar ao menos dois métodos de detecção de outliers, visto que apontar o único método como melhor é uma tarefa díficil. No entanto, os métodos PCOut e Comedian obtiveram as TS melhores na maioria dos cenários simulados. O método comedian obteve as melhores TFD.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Publicador: dc.publisherUniversidade Federal de Lavras-
Publicador: dc.publisherPrograma de Pós-Graduação em Estatística e Experimentação Agropecuária-
Publicador: dc.publisherUFLA-
Publicador: dc.publisherbrasil-
Publicador: dc.publisherDepartamento de Estatística-
Direitos: dc.rightsacesso aberto-
Palavras-chave: dc.subjectEstimador robusto comedian-
Palavras-chave: dc.subjectComedian robust estimator-
Palavras-chave: dc.subjectPrincipal components for detection of outliers (PCOut)-
Palavras-chave: dc.subjectEstimador Ortogonalizado de Gnanadesikan-Kettenring (OGK)-
Palavras-chave: dc.subjectEstatística-
Título: dc.titleMétodos para detecção de Outliers multivariados: Via uso dos estimadores robustos-
Título: dc.titleMethods for detection of multivariate outliers: via the use of robust estimators-
Tipo de arquivo: dc.typedissertação-
Aparece nas coleções:Repositório Institucional da Universidade Federal de Lavras (RIUFLA)

Não existem arquivos associados a este item.