Modelo de regressão quase-beta multivariado

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorScarpin, Cassius Tadeu, 1980--
Autor(es): dc.contributorBonat, Wagner Hugo-
Autor(es): dc.contributorUniversidade Federal do Paraná. Setor de Tecnologia. Programa de Pós-Graduação em Engenharia de Produção-
Autor(es): dc.creatorPetterle, Ricardo Rasmussen, 1972--
Data de aceite: dc.date.accessioned2019-08-21T23:02:37Z-
Data de disponibilização: dc.date.available2019-08-21T23:02:37Z-
Data de envio: dc.date.issued2019-02-13-
Data de envio: dc.date.issued2019-02-13-
Data de envio: dc.date.issued2018-
Fonte completa do material: dc.identifierhttps://hdl.handle.net/1884/58641-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/1884/58641-
Descrição: dc.descriptionOrientador: Prof. Dr. Cassius Tadeu Scarpin-
Descrição: dc.descriptionCoorientador: Prof. Dr. Wagner Hugo Bonat-
Descrição: dc.descriptionDissertação (mestrado) - Universidade Federal do Paraná, Setor de Tecnologia, Programa de Pós-Graduação em Engenharia de Produção. Defesa : Curitiba, 12/12/2018-
Descrição: dc.descriptionInclui referências: p.84-89-
Descrição: dc.descriptionResumo: Em diversas 'areas de pesquisa 'e frequente a an'alise de dados com vari'aveis respostas limitadas ao intervalo unit'ario. Tais vari'aveis geralmente se apresentam na forma de taxas, proporc¸ ˜ oes, ind'?ces e porcentagens, sendo portanto limitadas ao intervalo (0,1). Para o caso de m' ultiplas respostas 'e comum analisar cada vari'avel resposta separadamente, o que n˜ao permite investigar poss'?veis correlac¸ ˜oes entre elas. Nesse sentido, o presente trabalho prop˜oe um novo modelo de regress˜ao para an'alise de vari'aveis respostas limitadas multivariada. O modelo 'e especificado usando apenas suposic¸ ˜oes de primeiro e segundo momentos. A abordagem usada para estimac¸ ˜ao dos parˆametros combina as func¸ ˜oes de estimac¸ ˜ao quase-escore e Pearson para estimac¸ ˜ao dos parˆametros de regress˜ao e dispers˜ao, respectivamente. A principal vantagem da abordagem proposta 'e n˜ao precisar assumir uma distribuic¸ ˜ao de probabilidade multivariada para o vetor de vari'aveis respostas. O algoritmo de estimac¸ ˜ao 'e de f'acil implementac¸ ˜ao, podendo ser resumido a um simples e eficiente algoritmo do tipo Newton-score. Al'em disso, o modelo proposto permite acomodar facilmente dados no intervalo [0,1], incluindo excesso de zeros e uns. No decorrer do trabalho foram delineados trˆes estudos de simulac¸ ˜ao. O primeiro foi conduzido para investigar o comportamento do algoritmo NORTA (NORmal To Anything) na simulac¸ ˜ao de vari'aveis aleat 'orias beta correlacionadas. O segundo visou explorar a flexibilidade dos estimadores para lidar com dados limitados em estudos longitudinais. E o terceiro foi delineado para checar propriedades dos estimadores como vi'es, consistˆencia e taxa de cobertura em estudos com m' ultiplas respostas correlacionadas. O modelo foi motivado por dois conjuntos de dados que n˜ao s˜ao facilmente manipulados pelos m'etodos estat'?sticos convencionais. O primeiro se refere ao '?ndice de qualidade da 'agua de reservat'orios de usinas hidrel'etricas operadas pela COPEL no Estado do Paran'a. E o segundo corresponde ao percentual de gordura corporal, que foi medido em cinco regi˜oes do corpo e representam as vari'aveis respostas. Al'em disso, foram adaptadas t'ecnicas de diagn' ostico para o modelo proposto, tais como DFFITS, DFBETAS, distˆancia de Cook e o gr'afico de probabilidade meio-normal com envelope simulado, para detecc¸ ˜ao de pontos influentes e outliers. Portanto, as principais contribuic¸ ˜oes do modelo de regress˜ao proposto nesta dissertac¸ ˜ao est˜ao na an'alise de dados limitados em estudos longitudinais, al'em da an'alise de dados limitados em estudos com m' ultiplas respostas correlacionadas. Palavras-chave: M' ultiplas vari'aveis respostas limitadas. Dados correlacionados. Intervalo unit'ario. Dados longitudinais. Estudo de simulac¸ ˜ao. Algoritmo NORTA.-
Descrição: dc.descriptionAbstract: In several areas of research it is common to analyze data with response variables limited to the unit interval. These variables usually appear in the form of rates, proportions, index and percentages, being therefore limited to the interval (0,1). When the response variable is multivariate, in general, each response variable is analyzed separately, which does not allow investigating possible correlations between them. Thus, we propose a multivariate regression model to deal with multiple continuous bounded data. The model is specified using only first and second moment assumptions and the method for estimation and inference combines the quasi-score and Pearson estimating functions for the estimation of the regression and dispersion parameters, respectively. The main advantage of the proposed approach is that it does not need to assume a multivariate probability distribution for the response vector. The fitting procedure is easily implemented using a simple and efficient Newton scoring algorithm. Furthermore, the proposed model can easily handle data in the unit interval, including exact zeros and ones. During the work, we conducted three simulation studies. The first one evaluated the behavior of the NORTA algorithm (NORmal To Anything) in the simulation of correlated beta random variables. The second aimed to explore the flexibility of estimators to deal with continuous bounded data in longitudinal studies. And the third was designed to check properties of the estimators, such as bias, consistency, and coverage rate in studies with multiple correlated response variables. The model was motivated by two data sets that are not easily manipulated by existing statistical methods. The first refers to the water quality index measured on power plant reservoirs operated by COPEL in the State of Paran'a, Brazil. The second corresponds to the percentage of body fat, which was measured at five regions of the body and represent the response variables.We adapted diagnostic techniques for the proposed model, such as DFFITS, DFBETAS, Cook's distance and half-normal plot with simulated envelope, to check influential points and outliers. Therefore, the proposed model in this work allows the analysis of continuous bounded data in longitudinal studies, in addition to the analysis of continuous bounded data in studies with multiple correlated response variables. Keywords: Multiple bounded response variables. Correlated data. Unit interval. Longitudinal data. Simulation study. NORTA algorithm.-
Formato: dc.format107 p. : il.-
Formato: dc.formatapplication/pdf-
Formato: dc.formatapplication/pdf-
Palavras-chave: dc.subjectAnalise de regressão-
Palavras-chave: dc.subjectEngenharia de Produção-
Palavras-chave: dc.subjectMétodos de simulação-
Palavras-chave: dc.subjectProbabilidades-
Palavras-chave: dc.subjectTeses-
Palavras-chave: dc.subjectAlgoritmos-
Título: dc.titleModelo de regressão quase-beta multivariado-
Aparece nas coleções:Repositório Institucional - Rede Paraná Acervo

Não existem arquivos associados a este item.