Análise de padrões transcriptômicos em pacientes comcâncer de mama: uma abordagem de aprendizado de máquina

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorMartins, Marcella Scoczynski Ribeiro-
Autor(es): dc.contributorhttps://orcid.org/0000-0002-5716-4968-
Autor(es): dc.contributorhttps://lattes.cnpq.br/5212122361603572-
Autor(es): dc.contributorSanches, Danilo Sipoli-
Autor(es): dc.contributorhttps://lattes.cnpq.br/6377657274398145-
Autor(es): dc.contributorSanches, Danilo Sipoli-
Autor(es): dc.contributorhttps://lattes.cnpq.br/6377657274398145-
Autor(es): dc.contributorCorrea, Fernanda Cristina-
Autor(es): dc.contributorhttps://lattes.cnpq.br/1495216809511536-
Autor(es): dc.contributorBressan, Glaucia Maria-
Autor(es): dc.contributorhttps://lattes.cnpq.br/2648513655629475-
Autor(es): dc.contributorMartins, Marcella Scoczynski Ribeiro-
Autor(es): dc.contributorhttps://lattes.cnpq.br/5212122361603572-
Autor(es): dc.contributorSantos, Paulo Victor dos-
Autor(es): dc.creatorPadre, Natalia Santos-
Data de aceite: dc.date.accessioned2025-08-29T13:23:59Z-
Data de disponibilização: dc.date.available2025-08-29T13:23:59Z-
Data de envio: dc.date.issued2025-08-27-
Data de envio: dc.date.issued2025-08-27-
Data de envio: dc.date.issued2025-02-27-
Fonte completa do material: dc.identifierhttp://repositorio.utfpr.edu.br/jspui/handle/1/38023-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/1112602-
Descrição: dc.descriptionBreast cancer is one of the leading causes of death among women and is among the most prevalent worldwide. Thus, the search for more accurate diagnoses, treatments, and cancer prevention has increased, requiring a better understanding of the genetic alterations of tumors. By combining genomic and transcriptomic data, researchers can better understand the underlying mechanisms of the disease. Transcriptomic profiling involves sequencing transcribed RNAs to understand gene expression, which can lead to the identification of biomarkers for disease progression and aid in the discovery of treatment pathways. Studies analyzing transcriptomes, which encompass transcripts from both cancerous and non-cancerous cells, can be conducted through data analysis. In this work, we propose a pipeline for the transcriptomic analysis of gene expression data obtained from The Cancer Genome Atlas (TCGA) and use machine learning algorithms to classify the data into solid primary tissue, early-stage tumor, and metastasis. The data is pre-processed and normalized using the TCGAbiolinks package, which integrates TCGA data into a unified Bioconductor library, running on R software. TCGAbiolinks prepares the data using pre-processing strategies, allowing users to download a specific version of the data. For the analysis, it was necessary to transpose the datasets so that genes were represented by columns and individuals by rows. We executed seven classification models, with Random Forest and Radial Basis Function Support Vector Machine (RBF SVM) standing out, demonstrating superior performance with accuracy above 98%. To validate the classification models, cross-validation was used. At the end of this analysis, performance metrics (accuracy, precision, recall, and F1-score) were calculated for each iteration, and the average of these values was used to assess the overall performance of the models. Additionally, we applied a feature selector to the best-performing models to identify the most relevant variables in the dataset.-
Descrição: dc.descriptionO câncer de mama é uma das principais causas de morte entre as mulheres e está entre os mais prevalentes em todo o mundo. Assim, a busca por diagnósticos mais precisos, tratamentos e prevenção do câncer aumentou, exigindo uma melhor compreensão das alterações genéticas dos tumores. Ao combinar dados genômicos e transcriptômicos, os pesquisadores podem compreender melhor os mecanismos subjacentes da doença. O perfil transcriptômico envolve o sequenciamento de RNAs transcritos para entender a expressão gênica, o que pode levar à identificação de biomarcadores para a progressão da doença e auxiliar na descoberta de caminhos de tratamento. Estudos que analisam transcriptomas, que abrangem transcrições de células cancerosas e não cancerosas, podem ser conduzidos por meio de análise de dados. Neste trabalho, propomos um pipeline para análise transcriptômica de dados obtidos do The Cancer Genome Atlas (TCGA) sobre expressão gênica, e utilizar algoritmos de aprendizado de máquina para classificar os dados entre tecido primário sólido, tumor em estágio inicial e metástase. Os dados são pré-processados e normalizados usando o pacote TCGAbiolinks, que integra dados do TCGA em uma biblioteca unificada do Bioconductor, executada no software R. O TCGAbiolinks prepara os dados usando estratégias de pré-processamento, permitindo que o usuário baixe uma versão específica dos dados. Para a análise, foi necessário transpor os conjuntos de dados para que os genes fossem representados por colunas e os indivíduos por linhas. Executamos sete modelos de classificação, tendo destaque os modelos de Floresta Aleatória e Máquina de vetores de suporte de função de base radial (RBF SVM) que demonstraram um desempenho superior, com acurácia acima de 98%. Para validar os modelos de classificação, foi utilizada a técnica de validação cruzada, ao final dessa análise as métricas de desempenho (acurácia, precisão, recall e F1-score) são calculadas para cada iteração e a média desses valores é usada para avaliar o desempenho geral dos modelos. Além disso, aplicamos um seletor de características nos modelos com melhor desempenho para identificar as variáveis mais relevantes na base de dados, bem como uma ferramenta que relaciona os genes identificados com suas respectivas descrições e classificações.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Publicador: dc.publisherUniversidade Tecnológica Federal do Paraná-
Publicador: dc.publisherCornelio Procopio-
Publicador: dc.publisherBrasil-
Publicador: dc.publisherPrograma de Pós-Graduação em Bioinformática-
Publicador: dc.publisherUTFPR-
Direitos: dc.rightsopenAccess-
Palavras-chave: dc.subjectMamas - Câncer-
Palavras-chave: dc.subjectAprendizado do computador-
Palavras-chave: dc.subjectBioinformática-
Palavras-chave: dc.subjectBreast - Cancer-
Palavras-chave: dc.subjectMachine learning-
Palavras-chave: dc.subjectBioinformatics-
Palavras-chave: dc.subjectCNPQ::CIENCIAS SOCIAIS APLICADAS-
Palavras-chave: dc.subjectEngenharia/Tecnologia/Gestão-
Título: dc.titleAnálise de padrões transcriptômicos em pacientes comcâncer de mama: uma abordagem de aprendizado de máquina-
Título: dc.titleTranscriptomic pattern analysis in breast cancer patients: a machinelearning approach-
Tipo de arquivo: dc.typelivro digital-
Aparece nas coleções:Repositorio Institucional da UTFPR - RIUT

Não existem arquivos associados a este item.