
Atenção:
O eduCAPES é um repositório de objetos educacionais, não sendo responsável por materiais de terceiros submetidos na plataforma. O usuário assume ampla e total responsabilidade quanto à originalidade, à titularidade e ao conteúdo, citações de obras consultadas, referências e outros elementos que fazem parte do material que deseja submeter. Recomendamos que se reporte diretamente ao(s) autor(es), indicando qual parte do material foi considerada imprópria (cite página e parágrafo) e justificando sua denúncia.
Caso seja o autor original de algum material publicado indevidamente ou sem autorização, será necessário que se identifique informando nome completo, CPF e data de nascimento. Caso possua uma decisão judicial para retirada do material, solicitamos que informe o link de acesso ao documento, bem como quaisquer dados necessários ao acesso, no campo abaixo.
Todas as denúncias são sigilosas e sua identidade será preservada. Os campos nome e e-mail são de preenchimento opcional. Porém, ao deixar de informar seu e-mail, um possível retorno será inviabilizado e/ou sua denúncia poderá ser desconsiderada no caso de necessitar de informações complementares.
| Metadados | Descrição | Idioma |
|---|---|---|
| Autor(es): dc.contributor | Vale, Helson Mário Martins do | - |
| Autor(es): dc.creator | Elias, Samuel Galvão | - |
| Data de aceite: dc.date.accessioned | 2025-03-17T23:21:11Z | - |
| Data de disponibilização: dc.date.available | 2025-03-17T23:21:11Z | - |
| Data de envio: dc.date.issued | 2025-03-12 | - |
| Data de envio: dc.date.issued | 2025-03-12 | - |
| Data de envio: dc.date.issued | 2025-03-12 | - |
| Data de envio: dc.date.issued | 2024-08-14 | - |
| Fonte completa do material: dc.identifier | http://repositorio.unb.br/handle/10482/51833 | - |
| Fonte: dc.identifier.uri | http://educapes.capes.gov.br/handle/capes/923401 | - |
| Descrição: dc.description | A presente tese aborda dois desafios cruciais na análise de dados genômicos: a agregação e complementação de metadados e a classificação filogenética de sequências biológicas. Para resolver o primeiro desafio, desenvolvemos o GeneConnector, uma ferramenta que agrega e complementa metadados de registros do GenBank, explorando informações compartilhadas entre diferentes sequências de um mesmo espécime. A aplicação do GeneConnector ao banco de dados GOPHY demonstrou sua eficácia na recuperação de informações valiosas sobre a origem, coleta e processamento das amostras, com ganhos de informação de até 60%. Adicionalmente, introduzimos os scores Observed Completeness Score - OCS e Reachable Completeness Score - RCS para avaliar a completude dos metadados e o potencial de enriquecimento de informações. Para o segundo desafio, desenvolvemos o Classeq, uma ferramenta de classificação de sequências biológicas baseada em posicionamento filogenético, rápida, precisa, independente de alinhamentos múltiplos de sequências e capaz de classificar sequências de genes inteiros. Nossos testes com o Bacillus subtilis group demonstraram a alta sensibilidade e especificidade da ferramenta, classificando corretamente quase todas as sequências do grupo em seus respectivos clados. Adicionalmente, o Classeq oferece uma interface de usuário amigável e uma API para facilitar sua integração em fluxos de trabalho existentes. Em suma, o GeneConnector e o Classeq representam avanços significativos na análise de dados genômicos, com potencial para impulsionar pesquisas em diversas áreas. Ao abordar os desafios de agregação de metadados e classificação filogenética, essas ferramentas oferecem novas perspectivas para a interpretação e utilização de dados genômicos, abrindo caminho para descobertas e aplicações inovadoras. | - |
| Descrição: dc.description | This thesis addresses two crucial challenges in genomic data analysis: metadata aggregation and complementation, and phylogenetic classification of biological sequences. To address the first challenge, we developed GeneConnector, a tool that aggregates and complements metadata from GenBank records by exploiting shared information among different sequences from the same specimen. The application of GeneConnector to the GOPHY database demonstrated its effectiveness in retrieving valuable information about the origin, collection, and processing of samples, with information gains of up to 60%. Additionally, we introduced the OCS (Observed Completeness Score) and RCS (Reachable Completeness Score) to assess metadata completeness and potential for information enrichment. For the second challenge, we developed Classeq, a tool for classifying biological sequences based on phylogenetic placement, which is fast, accurate, independent of multiple sequence alignments, and capable of classifying whole gene sequences. Our tests with the Bacillus subtilis group demonstrated the high sensitivity and specificity of the tool, correctly classifying almost all sequences of the group into their respective clades. Additionally, Classeq offers a user-friendly interface and an API to facilitate its integration into existing workflows. In summary, GeneConnector and Classeq represent significant advances in genomic data analysis, with the potential to drive research in various fields. By addressing the challenges of metadata aggregation and phylogenetic classification, these tools offer new perspectives for interpreting and utilizing genomic data, paving the way for innovative discoveries and applications. | - |
| Descrição: dc.description | Instituto de Ciências Biológicas (IB) | - |
| Descrição: dc.description | Departamento de Biologia Celular (IB CEL) | - |
| Descrição: dc.description | Programa de Pós-Graduação em Biologia Microbiana | - |
| Formato: dc.format | application/pdf | - |
| Idioma: dc.language | pt_BR | - |
| Direitos: dc.rights | Acesso Aberto | - |
| Direitos: dc.rights | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.unb.br, www.ibict.br, www.ndltd.org sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra supracitada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data. | - |
| Palavras-chave: dc.subject | Micologia | - |
| Palavras-chave: dc.subject | Fitopatologia | - |
| Palavras-chave: dc.subject | Filogenia | - |
| Palavras-chave: dc.subject | Bacillus subtilis | - |
| Palavras-chave: dc.subject | GenBank | - |
| Palavras-chave: dc.subject | Posicionamento filogenético | - |
| Título: dc.title | Ampliando o potencial dos dados genômicos : um estudo sobre o enriquecimento de metadados e a classificação filogenética de sequências microbianas | - |
| Tipo de arquivo: dc.type | livro digital | - |
| Aparece nas coleções: | Repositório Institucional – UNB | |
O Portal eduCAPES é oferecido ao usuário, condicionado à aceitação dos termos, condições e avisos contidos aqui e sem modificações. A CAPES poderá modificar o conteúdo ou formato deste site ou acabar com a sua operação ou suas ferramentas a seu critério único e sem aviso prévio. Ao acessar este portal, você, usuário pessoa física ou jurídica, se declara compreender e aceitar as condições aqui estabelecidas, da seguinte forma: