Atenção:
O eduCAPES é um repositório de objetos educacionais, não sendo responsável por materiais de terceiros submetidos na plataforma. O usuário assume ampla e total responsabilidade quanto à originalidade, à titularidade e ao conteúdo, citações de obras consultadas, referências e outros elementos que fazem parte do material que deseja submeter. Recomendamos que se reporte diretamente ao(s) autor(es), indicando qual parte do material foi considerada imprópria (cite página e parágrafo) e justificando sua denúncia.
Caso seja o autor original de algum material publicado indevidamente ou sem autorização, será necessário que se identifique informando nome completo, CPF e data de nascimento. Caso possua uma decisão judicial para retirada do material, solicitamos que informe o link de acesso ao documento, bem como quaisquer dados necessários ao acesso, no campo abaixo.
Todas as denúncias são sigilosas e sua identidade será preservada. Os campos nome e e-mail são de preenchimento opcional. Porém, ao deixar de informar seu e-mail, um possível retorno será inviabilizado e/ou sua denúncia poderá ser desconsiderada no caso de necessitar de informações complementares.
Metadados | Descrição | Idioma |
---|---|---|
Autor(es): dc.contributor | Marcon, Marlon | - |
Autor(es): dc.contributor | Gabiatti, Naiana Cristine | - |
Autor(es): dc.contributor | Rocha, Tatianne Costa Negri | - |
Autor(es): dc.contributor | Maruyama, Teruo Matos | - |
Autor(es): dc.contributor | Marcon, Marlon | - |
Autor(es): dc.creator | Pereira, Israel Yago | - |
Data de aceite: dc.date.accessioned | 2025-08-29T12:28:29Z | - |
Data de disponibilização: dc.date.available | 2025-08-29T12:28:29Z | - |
Data de envio: dc.date.issued | 2025-04-30 | - |
Data de envio: dc.date.issued | 2025-04-30 | - |
Data de envio: dc.date.issued | 2024-12-10 | - |
Fonte completa do material: dc.identifier | http://repositorio.utfpr.edu.br/jspui/handle/1/36716 | - |
Fonte: dc.identifier.uri | http://educapes.capes.gov.br/handle/capes/1095996 | - |
Descrição: dc.description | Genomic annotation, a pivotal step in genomics, entails uncovering functional elements such as genes and regulatory components within DNA sequences. This process is crucial for comprehending biological processes and pinpointing disease-related mutations. Integrating highthroughput DNA sequencing and computational tools has revolutionized genetic annotation, ensuring heightened accuracy through data integration. Manual genetic annotation, involving the identification and annotation of diverse genomic elements, is labor-intensive, making traditional methods challenging due to the intricate nature of genomic data, species diversity, and the continual influx of new genomic information with different annotation practices among research groups also makes the problem harder. In this work, we created a dataset of amino acid sequences with the binary class of enzymes and non-enzymes and a model for classifying enzymes and non-enzymes sequences, eliminating some of these current problems of the genomic annotation pipeline. The dataset was compiled from The UniProt Consortium, encompassing both enzyme and non-enzyme amino acid sequences represented in standard FASTA format. The core of the model architecture adapted the Transformer’s encoder segment, renowned for its ability to capture intricate dependencies within sequential data. We treated each amino acid in the sequence as an analogous token, and the adapted architecture excludes the decoder component as it is unnecessary for the problem formulation. Model size considerations are based on both computing budget and token quantity | - |
Descrição: dc.description | A anotação genômica, um passo pivotal na gênomica, implica descobrir elementos funcionais, tais como genes e componentes regulatórios, dentro das sequências de DNA. Esse processo é crucial para compreender processos biológicos e apontar mutações relacionadas às doenças. A integração de ferramentas de alto desempenho de sequenciamento de DNA e ferramentas computacionais tem revolucionado a anotação gênica, garantindo elevada acurácia através da integração de dados. A anotação genética manual, envolvendo a identificação e anotação de diversos elementos genômicos, é muito trabalhosa, tornando metódos tradicionais desafiadores devido à intríseca natureza dos dados genômicos e diversidade de espécies, além do contínuo influxo de novas informações gênicas com diferentes práticas de anotação entre grupos de pesquisadores, o que dificulta ainda mais faz o problema. Neste trabalho, propôs a criação um dataset de sequências de amino ácidos com a classe binária de enzima e não-enzima e um modelo para classificar as sequências em enzimas e não-enzimas, eliminando alguns dos problemas atuais do processo de anotação gênica. O dataset foi compilado a partir do UnitProt Consortium, contendo tanto sequências de amino ácidos de enzimas e não-enzimas representadas no formato padrão FASTA. O núcleo da arquitetura foi adaptado do segmento codificador do Transformador, reconhecido por sua capacidade de capturar dependências intrínsecas dentre os dados sequenciais. Cada amino ácido na sequência foi tratado analogamente como um token e a arquitetura adaptada excluiu a componente decodificadora por ser desnecessária na formulação do problema. As considerações do tamanho do modelo foram baseadas tanto no orçamento computacional quanto na quantidade de tokens. | - |
Formato: dc.format | application/pdf | - |
Idioma: dc.language | en | - |
Publicador: dc.publisher | Universidade Tecnológica Federal do Paraná | - |
Publicador: dc.publisher | Dois Vizinhos | - |
Publicador: dc.publisher | Brasil | - |
Publicador: dc.publisher | Engenharia de Bioprocessos e Biotecnologia | - |
Publicador: dc.publisher | UTFPR | - |
Direitos: dc.rights | openAccess | - |
Direitos: dc.rights | Attribution 4.0 International | - |
Direitos: dc.rights | http://creativecommons.org/licenses/by/4.0/ | - |
Palavras-chave: dc.subject | Genômica | - |
Palavras-chave: dc.subject | Inteligência artificial | - |
Palavras-chave: dc.subject | Aminoácidos | - |
Palavras-chave: dc.subject | Genomics | - |
Palavras-chave: dc.subject | Artificial intelligence | - |
Palavras-chave: dc.subject | Amino acids | - |
Palavras-chave: dc.subject | CNPQ::ENGENHARIAS::ENGENHARIA QUIMICA | - |
Título: dc.title | Automatic gene annotation with artificial intelligence: binary classification between enzymes and non-enzymes | - |
Título: dc.title | Anotação gênica automática com inteligência artificial: classificação binária entre enzimas e não-enzimas | - |
Tipo de arquivo: dc.type | livro digital | - |
Aparece nas coleções: | Repositorio Institucional da UTFPR - RIUT |
O Portal eduCAPES é oferecido ao usuário, condicionado à aceitação dos termos, condições e avisos contidos aqui e sem modificações. A CAPES poderá modificar o conteúdo ou formato deste site ou acabar com a sua operação ou suas ferramentas a seu critério único e sem aviso prévio. Ao acessar este portal, você, usuário pessoa física ou jurídica, se declara compreender e aceitar as condições aqui estabelecidas, da seguinte forma: