Estimativa do Redshift Fotométrico de Galáxias via modelos de machine learning: um estudo comparativo

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorOliveira, Lucas Ferrari de, 1976--
Autor(es): dc.contributorUniversidade Federal do Paraná. Setor de Ciências Exatas. Curso de Especialização em Data Science & Big Data-
Autor(es): dc.creatorSantana, Tiago Vinícius Santos de-
Data de aceite: dc.date.accessioned2025-09-01T12:04:08Z-
Data de disponibilização: dc.date.available2025-09-01T12:04:08Z-
Data de envio: dc.date.issued2024-10-21-
Data de envio: dc.date.issued2024-10-21-
Data de envio: dc.date.issued2023-
Fonte completa do material: dc.identifierhttps://hdl.handle.net/1884/90364-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/1884/90364-
Descrição: dc.descriptionOrientador: Prof. Lucas Ferrari de Oliveira-
Descrição: dc.descriptionMonografia (especialização) - Universidade Federal do Paraná, Setor de Ciências Exatas, Curso de Especialização em Data Science e Big Data-
Descrição: dc.descriptionInclui referências-
Descrição: dc.descriptionResumo: Este trabalho teve como objetivo avaliar o desempenho de alguns modelos clássicos de regressão emum conjunto de dados simulados(altamente idealizados) de fotometria para umproblema de estimativa de redshift de galáxias. Os modelos de regressão linear, regressão polinomial, árvore de decisão, random forest, e support vector machine foram treinados e validados utilizando o método Stratified K-Fold, inicialmente em uma amostra de treinamento correspondente a 5% dos dados da base original. Em seguida, estes mesmos modelos foram avaliados na amostra de teste, correspondente aos 95% restantes da base, permitindo assim a avaliação da generalização dos modelos ajustados. Além disso, devido alto nível de correlação entre as variáveis, foi utilizado também a técnica da análise de componentes principais (PCA) para reduzir a dimensionalidade do sistema.-
Descrição: dc.descriptionAbstract: This study aimed to evaluate the performance of some classical regression models in a highly idealized photometry dataset for a galaxy redshift estimation problem. The linear regression, polynomial regression, decision tree, random forest, and support vector machine models were trained and validated using the Stratified K-Fold method, initially in a training sample corresponding to 5% of the original database. Then, these same models were evaluated in the test sample, corresponding to the remaining 95% of the database, thus allowing the generalization evaluation of the adjusted models. In addition, due to the high level of correlation between the variables, the principal component analysis (PCA) technique was also used to reduce the dimensionality of the system.-
Formato: dc.format1 recurso online : PDF.-
Formato: dc.formatapplication/pdf-
Formato: dc.formatapplication/pdf-
Palavras-chave: dc.subjectGaláxias-
Palavras-chave: dc.subjectFotometria astronomica-
Palavras-chave: dc.subjectCosmologia-
Palavras-chave: dc.subjectAprendizado do computador-
Palavras-chave: dc.subjectAnálise de regressão (Matemática)-
Título: dc.titleEstimativa do Redshift Fotométrico de Galáxias via modelos de machine learning: um estudo comparativo-
Aparece nas coleções:Repositório Institucional - Rede Paraná Acervo

Não existem arquivos associados a este item.