Métodos computacionais aplicados a bioinformática : análise de expressão de genes e inferência de redes de regulação gênica

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorMenotti, David, 1978--
Autor(es): dc.contributorLopes, Fabrício Martins-
Autor(es): dc.contributorUniversidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em Informática-
Autor(es): dc.creatorCosta-Silva, Juliana-
Data de aceite: dc.date.accessioned2025-09-01T10:45:56Z-
Data de disponibilização: dc.date.available2025-09-01T10:45:56Z-
Data de envio: dc.date.issued2025-08-14-
Data de envio: dc.date.issued2025-08-14-
Data de envio: dc.date.issued2024-
Fonte completa do material: dc.identifierhttps://hdl.handle.net/1884/97933-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/1884/97933-
Descrição: dc.descriptionOrientador: Profº. Drº. David Menotti-
Descrição: dc.descriptionCoorientador: Profº. Drº. Fabricio M. Lopes-
Descrição: dc.descriptionTese (doutorado) - Universidade Federal do Paraná, Setor de Ciências Exatas, Programa de Pós-Graduação em Informática. Defesa : Curitiba, 30/05/2025-
Descrição: dc.descriptionInclui referências-
Descrição: dc.descriptionÁrea de concentração: Ciência da Computação-
Descrição: dc.descriptionResumo: Compreender a complexa rede de interações que forma e mantém um organismo é uma tarefa desafiadora, composta por múltiplos passos, muitos dos quais envolvem análises computacionais. A identificação de genes envolvidos em um processo biológico representa um desses passos essenciais para o entendimento dessa rede de interações, podendo incluir o sequenciamento de nova geração (RNA-Seq), a identificação de genes diferencialmente expressos e a inferência de redes de regulação gênica. Contudo, a vasta quantidade de metodologias computacionais existentes comumente gera dúvidas quanto à definição de um pipeline e à seleção do método mais adequado para cada tipo de análise no contexto biológico. Além da análise de genes diferencialmente expressos, pode ser necessário identificar a rede de regulação desses genes, a qual indica quais genes são possíveis agentes de aumento da expressão ou de silenciamento de outros. Esta indicação é feita utilizando grafos, nos quais as arestas indicam a possível influência da expressão de um gene sobre a expressão de outro. Para esta tarefa, igualmente computacional, existe uma ampla gama de métodos disponíveis. Considerando as ferramentas computacionais desenvolvidas para a análise de expressão diferencial de genes, mesmo que apenas as especificamente desenvolvidas para dados de RNA-Seq, identifica-se um grande volume de metodologias, porém não é trivial encontrar uma categorização e/ou detalhamento das estratégias utilizadas em cada uma delas. Ainda neste contexto, a identificação da rede de relações entre genes é geralmente responsável por definir características ou respostas em diferentes organismos, entretanto a inferência de redes de regulação gênica ainda é uma atividade desafiadora, uma vez que as metodologias atuais apresentam baixas taxas de recuperação dessas relações. A identificação de lacunas das metodologias atualmente disponíveis para inferência de redes de regulação gênica pode indicar caminhos de melhorias para novos métodos. Esta tese selecionou e classificou as metodologias computacionais para análise de expressão gênica com dados de RNA-Seq mais relevantes desde a popularização do RNA-Seq até os dias atuais. Como resultado desta classificação, foi observado que, dentre as metodologias para análise de expressão, mais de 30% são desenvolvidas com dependência, total ou parcial de outras metodologias. Além disso, foi desenvolvido um pacote R para a análise de expressão que indica genes diferencialmente expressos com base no consenso entre várias metodologias. Considerando a análise das metodologias para a inferência de redes de regulação gênica, foram avaliadas 10 metodologias, sendo identificado que algumas das interações entre fatores de transcrição e genes não são detectadas, mesmo quando várias metodologias são empregadas conjuntamente para essa finalidade. Esta tese também caracterizou as relações encontradas, as não encontradas e as exclusivamente identificadas pelas metodologias utilizadas, para tanto utilizamos a entropia do sinal de expressão de cada gene da relação. Além disso foi possível definir um intervalo de valores de entropia para as arestas não detectadas, o que pode apoiar trabalhos futuros-
Descrição: dc.descriptionAbstract: Understanding the complex network of interactions that form and sustain an organism is a challenging task involving multiple steps, many of which rely on computational analyses. Identifying genes involved in a specific biological process is one of these essential steps, often requiring next-generation sequencing (RNA-Seq), differential gene expression analysis, and the inference of gene regulatory networks (GRNs). However, the wide array of available computational methodologies frequently raises questions regarding the construction of an appropriate analysis pipeline and the selection of the most suitable tools for a given biological context. Besides identifying differentially expressed genes (DEGs), it may be necessary to infer the regulatory network underlying their expression—i.e., to determine which genes may upregulate or suppress others. This inference is commonly represented as a graph, where edges suggest potential regulatory influence between genes. Similar to DEG analysis, diverse methods have been proposed to handle the computationally intensive task of GRNs inference. Despite the abundance of tools developed specifically for RNA-Seq-based differential expression analysis, categorizing and understanding the methodological strategies behind them remains non-trivial. Furthermore, the reconstruction of gene regulatory networks is critical for elucidating the mechanisms driving phenotypic traits or responses across different organisms, yet it remains a challenging endeavor. Current GRN inference approaches often yield low recall rates, failing to recover many true regulatory interactions. Identifying the limitations of these existing methods mayhelp guide the development of more effective approaches. This thesis systematically selected and categorized the most relevant computational methods for RNA-Seq-based gene expression analysis since the widespread adoption of RNA-Seq technology. The analysis revealed that over 30%ofDEGanalysis tools rely, either partially or entirely, on pre-existing methods. Additionally, an R package was developed to identify differentially expressed genes based on consensus across multiple methodologies. For the GRN inference component, ten methods were evaluated, and the results showed that certain transcription factor–gene interactions were not recovered, even when combining multiple inference strategies. This thesis also characterized the recovered, not recovered, and uniquely inferred regulatory interactions using the entropy of gene expression signals. Furthermore, this study identified a specific entropy range for undetected edges, which may support future investigations into the properties of missing regulatory links-
Formato: dc.format1 recurso online : PDF.-
Formato: dc.formatapplication/pdf-
Formato: dc.formatapplication/pdf-
Palavras-chave: dc.subjectGenes-
Palavras-chave: dc.subjectBiologia computacional - Métodos-
Palavras-chave: dc.subjectCiência da Computação-
Título: dc.titleMétodos computacionais aplicados a bioinformática : análise de expressão de genes e inferência de redes de regulação gênica-
Aparece nas coleções:Repositório Institucional - Rede Paraná Acervo

Não existem arquivos associados a este item.