Predição de regiões codificadoras de proteínas em rna circulares e transcriptoma em montagem de novo

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorKashiwabara, Andre Yoshiaki-
Autor(es): dc.contributorhttps://orcid.org/0000-0003-3280-2035-
Autor(es): dc.contributorhttps://lattes.cnpq.br/3194328548975437-
Autor(es): dc.contributorDurham, Alan Mitchell-
Autor(es): dc.contributorhttps://lattes.cnpq.br/1927611801056285-
Autor(es): dc.contributorPaschoal, Alexandre Rossi-
Autor(es): dc.contributorhttps://lattes.cnpq.br/5834088144837137-
Autor(es): dc.contributorKashiwabara, Andre Yoshiaki-
Autor(es): dc.contributorhttps://lattes.cnpq.br/3194328548975437-
Autor(es): dc.contributorLopes, Fabricio Martins-
Autor(es): dc.contributorhttps://lattes.cnpq.br/1660070580824436-
Autor(es): dc.contributorBoas, Laurival Antonio Vilas-
Autor(es): dc.contributorhttps://lattes.cnpq.br/6053806923630324-
Autor(es): dc.creatorBarbosa, Denilson Fagundes-
Data de aceite: dc.date.accessioned2025-08-29T13:38:12Z-
Data de disponibilização: dc.date.available2025-08-29T13:38:12Z-
Data de envio: dc.date.issued2025-08-19-
Data de envio: dc.date.issued2025-08-19-
Data de envio: dc.date.issued2025-04-29-
Fonte completa do material: dc.identifierhttp://repositorio.utfpr.edu.br/jspui/handle/1/37936-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/1116702-
Descrição: dc.descriptionThe prediction of protein-coding regions (CDSs) in circular RNAs (circRNAs) and de novo assembled transcriptomes represents significant open challenges in bioinformatics due to the non-canonical nature of translation in circRNAs and the heterogeneity of transcripts generated in assemblies. This thesis proposes computational methods that integrate complementary approaches of kernel methods and probabilistic models to overcome these limitations. We developed four main contributions: (i) circTIS, a tool based on a Support Vector Machine (SVM) with the weighted degree kernel (WDK) for predicting translation initiation sites (TIS) in circRNAs, achieving a precision of 93.12% and sensitivity of 86.03%, outperforming established tools; (ii) cirCodAn, an annotator employing generalized hidden Markov models (GHMMs) adapted to molecular cyclicity, achieving F1-scores of up to 77.06% in identifying CDSs in H. sapiens circRNAs; (iii) strkernels, a high-performance Python package with efficient implementations of string kernels, validated in tasks such as antimicrobial peptide classification (AUC-ROC of 0.99); and (iv) CodAnSVM, a hybrid method combining GHMMs and SVMs for annotating de novo assembled transcriptomes, demonstrating a 5 percentual points F1-score improvement over traditional methods for complete transcripts and satisfactory results for partial transcripts. The results show that integrating generative (GHMMs) and discriminative (SVMs) models enables precise analyses in challenging biological scenarios, such as predicting non-canonical initiation codons and annotating partial transcripts. The developed tools, available as open-source software, address methodological gaps in the study of coding circRNAs and the functional analysis of transcriptomes.-
Descrição: dc.descriptionConselho Nacional do Desenvolvimento Científico e Tecnológico (CNPq)-
Descrição: dc.descriptionA predição de regiões codificadoras de proteína (CDSs) em RNAs circulares (circRNAs) e transcriptomas montados de novo representam problemas relevantes em aberto na bioinformática, devido à natureza não canônica da tradução em circRNAs e à heterogeneidade de transcritos gerados em montagens. Esta tese propõe métodos computacionais que integram abordagens complementares de métodos de kernel e modelos probabilísticos para superar essas limitações. Desenvolvemos quatro contribuições principais: (i) circTIS, uma ferramenta baseada em uma máquina de vetores de suporte (SVM) com o string kernel de grau ponderado (WDK) para predição de sítios de iniciação de tradução (TIS) em circRNAs, que alcançou precisão de 93,12% e sensibilidade de 86,03%, superando ferramentas consolidadas; (ii)cirCodAn, um anotador que emprega modelos de Markov ocultos generalizados (GHMMs) adaptados à ciclicidade molecular, obtendo F1-scores de até 77,06% na identificação de CDSs em circRNAs de H. sapiens; (iii) strkernels, um pacote Python de alta performance com implementações eficientes de string kernels, validado em tarefas como classificação de peptídeos antimicrobianos (AUC-ROC de 0,99); e (iv) CodAnSVM, um método híbrido que combina GHMMs e SVMs para anotação de transcriptomas de montagens de novo, com ganho de 5 pontos percentuais em F1-score sobre métodos tradicionais em transcritos completos e resultados satisfatórios para transcritos parciais. Os resultados mostram que a integração de modelos generativos (GHMMs) e discriminativos (SVMs) possibilita análises precisas em cenários biológicos desafiadores, como a predição de códons de iniciação não canônicos e a anotação de transcritos parciais. As ferramentas desenvolvidas, disponíveis como software aberto, preenchem lacunas metodológicas no estudo de circRNAs codificantes e na análise funcional de transcriptomas.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Publicador: dc.publisherUniversidade Tecnológica Federal do Paraná-
Publicador: dc.publisherCornelio Procopio-
Publicador: dc.publisherBrasil-
Publicador: dc.publisherPrograma de Pós-Graduação Associado em Bioinformática (Ufpr/Utfpr)-
Publicador: dc.publisherUTFPR-
Direitos: dc.rightsopenAccess-
Palavras-chave: dc.subjectBioinformática-
Palavras-chave: dc.subjectProteínas-
Palavras-chave: dc.subjectBiologia molecular-
Palavras-chave: dc.subjectBioinformatics-
Palavras-chave: dc.subjectProteins-
Palavras-chave: dc.subjectMolecular biology-
Palavras-chave: dc.subjectCNPQ::CIENCIAS SOCIAIS APLICADAS-
Palavras-chave: dc.subjectCiência da Computação-
Título: dc.titlePredição de regiões codificadoras de proteínas em rna circulares e transcriptoma em montagem de novo-
Título: dc.titlePrediction of protein-coding regions in circular rna and de novo assembled transcriptomes-
Tipo de arquivo: dc.typelivro digital-
Aparece nas coleções:Repositorio Institucional da UTFPR - RIUT

Não existem arquivos associados a este item.