Atenção:
O eduCAPES é um repositório de objetos educacionais, não sendo responsável por materiais de terceiros submetidos na plataforma. O usuário assume ampla e total responsabilidade quanto à originalidade, à titularidade e ao conteúdo, citações de obras consultadas, referências e outros elementos que fazem parte do material que deseja submeter. Recomendamos que se reporte diretamente ao(s) autor(es), indicando qual parte do material foi considerada imprópria (cite página e parágrafo) e justificando sua denúncia.
Caso seja o autor original de algum material publicado indevidamente ou sem autorização, será necessário que se identifique informando nome completo, CPF e data de nascimento. Caso possua uma decisão judicial para retirada do material, solicitamos que informe o link de acesso ao documento, bem como quaisquer dados necessários ao acesso, no campo abaixo.
Todas as denúncias são sigilosas e sua identidade será preservada. Os campos nome e e-mail são de preenchimento opcional. Porém, ao deixar de informar seu e-mail, um possível retorno será inviabilizado e/ou sua denúncia poderá ser desconsiderada no caso de necessitar de informações complementares.
Metadados | Descrição | Idioma |
---|---|---|
Autor(es): dc.contributor | Martins, Marcella Scoczynski Ribeiro | - |
Autor(es): dc.contributor | https://orcid.org/0000-0002-5716-4968 | - |
Autor(es): dc.contributor | https://lattes.cnpq.br/5212122361603572 | - |
Autor(es): dc.contributor | Sanches, Danilo Sipoli | - |
Autor(es): dc.contributor | https://lattes.cnpq.br/6377657274398145 | - |
Autor(es): dc.contributor | Sanches, Danilo Sipoli | - |
Autor(es): dc.contributor | https://lattes.cnpq.br/6377657274398145 | - |
Autor(es): dc.contributor | Correa, Fernanda Cristina | - |
Autor(es): dc.contributor | https://lattes.cnpq.br/1495216809511536 | - |
Autor(es): dc.contributor | Bressan, Glaucia Maria | - |
Autor(es): dc.contributor | https://lattes.cnpq.br/2648513655629475 | - |
Autor(es): dc.contributor | Martins, Marcella Scoczynski Ribeiro | - |
Autor(es): dc.contributor | https://lattes.cnpq.br/5212122361603572 | - |
Autor(es): dc.contributor | Santos, Paulo Victor dos | - |
Autor(es): dc.creator | Padre, Natalia Santos | - |
Data de aceite: dc.date.accessioned | 2025-08-29T13:23:59Z | - |
Data de disponibilização: dc.date.available | 2025-08-29T13:23:59Z | - |
Data de envio: dc.date.issued | 2025-08-27 | - |
Data de envio: dc.date.issued | 2025-08-27 | - |
Data de envio: dc.date.issued | 2025-02-27 | - |
Fonte completa do material: dc.identifier | http://repositorio.utfpr.edu.br/jspui/handle/1/38023 | - |
Fonte: dc.identifier.uri | http://educapes.capes.gov.br/handle/capes/1112602 | - |
Descrição: dc.description | Breast cancer is one of the leading causes of death among women and is among the most prevalent worldwide. Thus, the search for more accurate diagnoses, treatments, and cancer prevention has increased, requiring a better understanding of the genetic alterations of tumors. By combining genomic and transcriptomic data, researchers can better understand the underlying mechanisms of the disease. Transcriptomic profiling involves sequencing transcribed RNAs to understand gene expression, which can lead to the identification of biomarkers for disease progression and aid in the discovery of treatment pathways. Studies analyzing transcriptomes, which encompass transcripts from both cancerous and non-cancerous cells, can be conducted through data analysis. In this work, we propose a pipeline for the transcriptomic analysis of gene expression data obtained from The Cancer Genome Atlas (TCGA) and use machine learning algorithms to classify the data into solid primary tissue, early-stage tumor, and metastasis. The data is pre-processed and normalized using the TCGAbiolinks package, which integrates TCGA data into a unified Bioconductor library, running on R software. TCGAbiolinks prepares the data using pre-processing strategies, allowing users to download a specific version of the data. For the analysis, it was necessary to transpose the datasets so that genes were represented by columns and individuals by rows. We executed seven classification models, with Random Forest and Radial Basis Function Support Vector Machine (RBF SVM) standing out, demonstrating superior performance with accuracy above 98%. To validate the classification models, cross-validation was used. At the end of this analysis, performance metrics (accuracy, precision, recall, and F1-score) were calculated for each iteration, and the average of these values was used to assess the overall performance of the models. Additionally, we applied a feature selector to the best-performing models to identify the most relevant variables in the dataset. | - |
Descrição: dc.description | O câncer de mama é uma das principais causas de morte entre as mulheres e está entre os mais prevalentes em todo o mundo. Assim, a busca por diagnósticos mais precisos, tratamentos e prevenção do câncer aumentou, exigindo uma melhor compreensão das alterações genéticas dos tumores. Ao combinar dados genômicos e transcriptômicos, os pesquisadores podem compreender melhor os mecanismos subjacentes da doença. O perfil transcriptômico envolve o sequenciamento de RNAs transcritos para entender a expressão gênica, o que pode levar à identificação de biomarcadores para a progressão da doença e auxiliar na descoberta de caminhos de tratamento. Estudos que analisam transcriptomas, que abrangem transcrições de células cancerosas e não cancerosas, podem ser conduzidos por meio de análise de dados. Neste trabalho, propomos um pipeline para análise transcriptômica de dados obtidos do The Cancer Genome Atlas (TCGA) sobre expressão gênica, e utilizar algoritmos de aprendizado de máquina para classificar os dados entre tecido primário sólido, tumor em estágio inicial e metástase. Os dados são pré-processados e normalizados usando o pacote TCGAbiolinks, que integra dados do TCGA em uma biblioteca unificada do Bioconductor, executada no software R. O TCGAbiolinks prepara os dados usando estratégias de pré-processamento, permitindo que o usuário baixe uma versão específica dos dados. Para a análise, foi necessário transpor os conjuntos de dados para que os genes fossem representados por colunas e os indivíduos por linhas. Executamos sete modelos de classificação, tendo destaque os modelos de Floresta Aleatória e Máquina de vetores de suporte de função de base radial (RBF SVM) que demonstraram um desempenho superior, com acurácia acima de 98%. Para validar os modelos de classificação, foi utilizada a técnica de validação cruzada, ao final dessa análise as métricas de desempenho (acurácia, precisão, recall e F1-score) são calculadas para cada iteração e a média desses valores é usada para avaliar o desempenho geral dos modelos. Além disso, aplicamos um seletor de características nos modelos com melhor desempenho para identificar as variáveis mais relevantes na base de dados, bem como uma ferramenta que relaciona os genes identificados com suas respectivas descrições e classificações. | - |
Formato: dc.format | application/pdf | - |
Idioma: dc.language | pt_BR | - |
Publicador: dc.publisher | Universidade Tecnológica Federal do Paraná | - |
Publicador: dc.publisher | Cornelio Procopio | - |
Publicador: dc.publisher | Brasil | - |
Publicador: dc.publisher | Programa de Pós-Graduação em Bioinformática | - |
Publicador: dc.publisher | UTFPR | - |
Direitos: dc.rights | openAccess | - |
Palavras-chave: dc.subject | Mamas - Câncer | - |
Palavras-chave: dc.subject | Aprendizado do computador | - |
Palavras-chave: dc.subject | Bioinformática | - |
Palavras-chave: dc.subject | Breast - Cancer | - |
Palavras-chave: dc.subject | Machine learning | - |
Palavras-chave: dc.subject | Bioinformatics | - |
Palavras-chave: dc.subject | CNPQ::CIENCIAS SOCIAIS APLICADAS | - |
Palavras-chave: dc.subject | Engenharia/Tecnologia/Gestão | - |
Título: dc.title | Análise de padrões transcriptômicos em pacientes comcâncer de mama: uma abordagem de aprendizado de máquina | - |
Título: dc.title | Transcriptomic pattern analysis in breast cancer patients: a machinelearning approach | - |
Tipo de arquivo: dc.type | livro digital | - |
Aparece nas coleções: | Repositorio Institucional da UTFPR - RIUT |
O Portal eduCAPES é oferecido ao usuário, condicionado à aceitação dos termos, condições e avisos contidos aqui e sem modificações. A CAPES poderá modificar o conteúdo ou formato deste site ou acabar com a sua operação ou suas ferramentas a seu critério único e sem aviso prévio. Ao acessar este portal, você, usuário pessoa física ou jurídica, se declara compreender e aceitar as condições aqui estabelecidas, da seguinte forma: