Atenção:
O eduCAPES é um repositório de objetos educacionais, não sendo responsável por materiais de terceiros submetidos na plataforma. O usuário assume ampla e total responsabilidade quanto à originalidade, à titularidade e ao conteúdo, citações de obras consultadas, referências e outros elementos que fazem parte do material que deseja submeter. Recomendamos que se reporte diretamente ao(s) autor(es), indicando qual parte do material foi considerada imprópria (cite página e parágrafo) e justificando sua denúncia.
Caso seja o autor original de algum material publicado indevidamente ou sem autorização, será necessário que se identifique informando nome completo, CPF e data de nascimento. Caso possua uma decisão judicial para retirada do material, solicitamos que informe o link de acesso ao documento, bem como quaisquer dados necessários ao acesso, no campo abaixo.
Todas as denúncias são sigilosas e sua identidade será preservada. Os campos nome e e-mail são de preenchimento opcional. Porém, ao deixar de informar seu e-mail, um possível retorno será inviabilizado e/ou sua denúncia poderá ser desconsiderada no caso de necessitar de informações complementares.
Metadados | Descrição | Idioma |
---|---|---|
Autor(es): dc.contributor | Bressan, Glaucia Maria | - |
Autor(es): dc.contributor | https://orcid.org/0000-0001-6996-3129 | - |
Autor(es): dc.contributor | http://lattes.cnpq.br/2648513655629475 | - |
Autor(es): dc.contributor | Lizzi, Elisangela Aparecida da Silva | - |
Autor(es): dc.contributor | http://lattes.cnpq.br/8487600124864253 | - |
Autor(es): dc.contributor | Lizzi, Elisangela Aparecida da Silva | - |
Autor(es): dc.contributor | http://lattes.cnpq.br/8487600124864253 | - |
Autor(es): dc.contributor | Bressan, Glaucia Maria | - |
Autor(es): dc.contributor | http://lattes.cnpq.br/2648513655629475 | - |
Autor(es): dc.contributor | Martins, Marcella Scoczynski Ribeiro | - |
Autor(es): dc.contributor | http://lattes.cnpq.br/5212122361603572 | - |
Autor(es): dc.contributor | Castro, Mauro Antonio Alves | - |
Autor(es): dc.creator | Valentin, Ana Beatriz Miranda | - |
Data de aceite: dc.date.accessioned | 2025-08-29T12:31:38Z | - |
Data de disponibilização: dc.date.available | 2025-08-29T12:31:38Z | - |
Data de envio: dc.date.issued | 2025-04-07 | - |
Data de envio: dc.date.issued | 2025-04-07 | - |
Data de envio: dc.date.issued | 2025-02-21 | - |
Fonte completa do material: dc.identifier | http://repositorio.utfpr.edu.br/jspui/handle/1/36417 | - |
Fonte: dc.identifier.uri | http://educapes.capes.gov.br/handle/capes/1097015 | - |
Descrição: dc.description | Understanding the characteristics of tumors and subtypes of breast cancer based on gene expression data is crucial for assisting in the identification of cancer types, obtaining a more accurate diagnosis, and quickly directing appropriate treatment. In this context, the aim of this study is to apply machine learning and deep learning methods for the multiclass classification of genes associated with breast cancer, using gene expression datasets, and to evaluate the predictive performance of these methods. The datasets used are obtained from repositories such as TCGA and GEO, and undergo preprocessing for data treatment and the application of dimensionality reduction techniques due to the high number of variables. Initially, principal component analysis is used to reduce the dimensionality of the data. Then, different traditional machine learning methods are applied, such as Logistic Regression, Support Vector Machine, and Random Forest, as well as deep learning models such as Multilayer Perceptron and Convolutional Neural Network. To enhance the performance of these models, the Optuna library is used for hyperparameter optimization, evaluating the performance of the algorithms both with and without this optimization. The performance comparison between the algorithms showed that Logistic Regression and Support Vector Machine achieved high accuracy on the GEO and TCGA databases, respectively. However, the MLP and CNN models, especially when optimized with Optuna, also delivered competitive results. The optimization adjusted parameters such as learning rate and number of layers, leading to significant improvements in performance. While Random Forest was less impacted by optimization, MLP and CNN showed substantial gains. Additionally, the SHAP library was applied to analyze the importance of variables and the influence of each dimension for each classifier. The analysis highlighted that hyperparameter optimization can be crucial in improving classifier accuracy | - |
Descrição: dc.description | A compreensão das características dos tumores e dos subtipos de câncer de mama a partir de dados de expressão gênica é fundamental para auxiliar na identificação dos tipos de câncer, obter um diagnóstico mais preciso e direcionar rapidamente o tratamento adequado. Neste contexto, o objetivo deste trabalho é aplicar métodos de machine learning e deep learning para a classificação multiclasse de genes associados ao câncer de mama, considerando bases de dados de expressão gênica, e avaliar a performance preditiva desses métodos. Os conjuntos de dados utilizados são obtidos de repositórios como o The Cancer Genome Atlas (TCGA) e o Gene Expression Omnibus (GEO), e passam por um pré-processamento para o tratamento dos dados e aplicação de técnicas de redução de dimensionalidade devido ao alto número de variáveis. Inicialmente, utiliza-se a técnica de análise de componentes principais para reduzir a dimensionalidade dos dados. Em seguida, são aplicados diferentes métodos de machine learning tradicionais, como Regressão Logística, Support Vector Machine e Random Forest, além de modelos de deep learning como o Multilayer Perceptron e Convulutional Neural Network. Para aprimorar a performance desses modelos, utiliza-se a biblioteca Optuna para otimização de hiperparâmetros, avaliando o desempenho dos algoritmos tanto com quanto sem essa otimização. A comparação de desempenho entre os algoritmos mostrou que a Regressão Logística e o Support Vector Machine tiveram alta acurácia nos bancos de dados GEO e TCGA, respectivamente. No entanto, os modelos Multilayer Perceptron (MLP) e Convolutional Neural Network (CNN), especialmente quando otimizados com Optuna, também apresentaram resultados competitivos. A otimização ajustou parâmetros como taxa de aprendizado e número de camadas, o que resultou em melhorias significativas no desempenho. Enquanto o Random Forest foi menos impactado pela otimização, MLP e CNN mostraram ganhos expressivos. Além disso, a biblioteca SHAP foi aplicada para analisar a importância das variáveis e a influência de cada dimensão para cada classificador. A análise evidenciou que a otimização de hiperparâmetros pode ser fundamental para melhorar a precisão dos classificadores. | - |
Formato: dc.format | application/pdf | - |
Idioma: dc.language | pt_BR | - |
Publicador: dc.publisher | Universidade Tecnológica Federal do Paraná | - |
Publicador: dc.publisher | Cornelio Procopio | - |
Publicador: dc.publisher | Brasil | - |
Publicador: dc.publisher | Programa de Pós-Graduação em Bioinformática | - |
Publicador: dc.publisher | UTFPR | - |
Direitos: dc.rights | openAccess | - |
Palavras-chave: dc.subject | Mamas - Câncer | - |
Palavras-chave: dc.subject | Genética - Pesquisa | - |
Palavras-chave: dc.subject | Bioinformática | - |
Palavras-chave: dc.subject | Breast - Cancer | - |
Palavras-chave: dc.subject | Genetics - Research | - |
Palavras-chave: dc.subject | Bioinformatics | - |
Palavras-chave: dc.subject | CNPQ::ENGENHARIAS | - |
Palavras-chave: dc.subject | Engenharia/Tecnologia/Gestão | - |
Título: dc.title | Classificação de genes associados ao câncer de mama utilizando dados de expressão | - |
Título: dc.title | Classification of breast cancer-associated genes using expression data | - |
Tipo de arquivo: dc.type | livro digital | - |
Aparece nas coleções: | Repositorio Institucional da UTFPR - RIUT |
O Portal eduCAPES é oferecido ao usuário, condicionado à aceitação dos termos, condições e avisos contidos aqui e sem modificações. A CAPES poderá modificar o conteúdo ou formato deste site ou acabar com a sua operação ou suas ferramentas a seu critério único e sem aviso prévio. Ao acessar este portal, você, usuário pessoa física ou jurídica, se declara compreender e aceitar as condições aqui estabelecidas, da seguinte forma: