Atenção: Todas as denúncias são sigilosas e sua identidade será preservada.
Os campos nome e e-mail são de preenchimento opcional
Metadados | Descrição | Idioma |
---|---|---|
Autor(es): dc.contributor | Bugatti, Pedro Henrique | - |
Autor(es): dc.contributor | http://lattes.cnpq.br/2177467029991118 | - |
Autor(es): dc.contributor | Paschoal, Alexandre Rossi | - |
Autor(es): dc.contributor | 0000-0002-8887-0582 | - |
Autor(es): dc.contributor | http://lattes.cnpq.br/5834088144837137 | - |
Autor(es): dc.contributor | Fujita, André | - |
Autor(es): dc.contributor | http://lattes.cnpq.br/0247990329725342 | - |
Autor(es): dc.contributor | Kashiwabara, Andre Yoshiaki | - |
Autor(es): dc.contributor | http://lattes.cnpq.br/3194328548975437 | - |
Autor(es): dc.contributor | Lopes, Fabricio Martins | - |
Autor(es): dc.contributor | http://lattes.cnpq.br/1660070580824436 | - |
Autor(es): dc.contributor | Bugatti, Pedro Henrique | - |
Autor(es): dc.contributor | http://lattes.cnpq.br/2177467029991118 | - |
Autor(es): dc.creator | Cruz, Murilo Horacio Pereira da | - |
Data de aceite: dc.date.accessioned | 2022-02-21T21:34:38Z | - |
Data de disponibilização: dc.date.available | 2022-02-21T21:34:38Z | - |
Data de envio: dc.date.issued | 2020-10-26 | - |
Data de envio: dc.date.issued | 2020-10-26 | - |
Data de envio: dc.date.issued | 2020-03-13 | - |
Fonte completa do material: dc.identifier | http://repositorio.utfpr.edu.br/jspui/handle/1/5309 | - |
Fonte: dc.identifier.uri | http://educapes.capes.gov.br/handle/capes/655761 | - |
Descrição: dc.description | Transposable elements are the most represented sequences in eukaryotic genomes. They are capable to transpose and produce multiple copies throughout the host genome. By doing so, these sequences can produce a variety of effects on organisms, such as the regulation of gene expression. There are several kinds of these elements, which are classified in a hierarchic way into classes, orders and superfamílies. Few methods of the literature classify these sequences into the deeper levels of the classification hierarchy, such as superfamily. Moreover, most methods use handcrafted features, such as: k-mers; presence of ORF; presence of protein domains; and homology based search. These features could be inneficient for generalization to non homologous sequences and time-consuming. In this work, we introduce an approach, called Transposabel Element Representation Learner (TERL), which is capable to represent 1D sequences into 2D sequence images. Our approach is generic and can be used to classify any type of biological sequence in any level of the classification system, also it is flexible to the type of architecture to use for the classification. In this work we use seven databases to create nine data sets. These data sets were used in a series of 21 experiments designed to assess the performance of the methods TEclass, PASTEC and the proposed approach. TERL obtained an accuracy and F1-score of 0.95 and 0.71 respectively on the classification of 11 superfamilies. Considering accuracy and specificity our approach obtained 0.89 and 0.93 respectively on the classification of order sequences from a data set created with sequences from different organisms and from different databases. These results surpass the metrics obtained by TEclass and PASTEC. Our approach showed great advantage regarding the classification time, which is on average 76 times more efficient than TEclass and four orders of magnitude more efficient than PASTEC. | - |
Descrição: dc.description | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) | - |
Descrição: dc.description | Elementos transponíveis são o tipo de sequência mais presente nos genomas eucarióticos. Estes são capazes de se transpor e produzir múltiplas cópias ao longo do genoma hospedeiro. Devido a estas ações, estas sequências produzem uma variedade de efeitos nos organismos, como por exemplo podem atuar na regulação da expressão gênica. Existem diversos tipos destes elementos, os quais são classificados de maneira hierárquica em classes, ordens e superfamílias. Poucos métodos da literatura abordam a classificação nos níveis mais profundos da hierarquia, como o nível de superfamílias. Além disso, a maioria dos métodos da literatura utilizam características manualmente definidas como: k-mers; presença de ORF; presença de domínios proteicos; e busca por similaridade. Tais características podem ser ineficientes para atingir a generalização dos métodos e computacionalmente custosas. Neste trabalho é apresentada uma abordagem, denominada Transposabel Element Representation Learner (TERL), a qual é capaz de representar sequências 1D em uma imagem 2D da sequência. A abordagem proposta é genérica e pode ser utilizada para classificar qualquer tipo de sequência biológica em qualquer nível do sistema de classificação da mesma, além de ser flexível quanto ao tipo de arquitetura que pode ser utilizada. No presente trabalho sete bases de dados da literatura foram utilizadas para criar nove conjuntos de treinamento e teste. Estes conjuntos foram utilizados em uma série de 21 experimentos conduzidos para avaliar o desempenho da abordagem proposta e dos métodos TEclass e PASTEC da literatura. O TERL foi capaz de obter acurácia e F1-score de 0,95 e 0,71 respectivamente na classificação de 11 superfamílias e acurácia e especificidade de 0,89 e 0,93 respectivamente na classificação a nível de ordem de um conjunto com sequências de diversos organismos e bases de dados. Estes resultados superam os obtidos pelo TEclass e PASTEC. Outra grande vantagem apresentada pela abordagem proposta diz respeito ao tempo de classificação das sequências, sendo que o TERL é em média 76 vezes mais eficiente que o TEclass e quatro ordens de grandeza mais eficiente que o PASTEC. | - |
Formato: dc.format | application/pdf | - |
Idioma: dc.language | pt_BR | - |
Publicador: dc.publisher | Universidade Tecnológica Federal do Paraná | - |
Publicador: dc.publisher | Cornelio Procopio | - |
Publicador: dc.publisher | Brasil | - |
Publicador: dc.publisher | Programa de Pós-Graduação em Bioinformática | - |
Publicador: dc.publisher | UTFPR | - |
Direitos: dc.rights | openAccess | - |
Palavras-chave: dc.subject | Genoma | - |
Palavras-chave: dc.subject | Redes neurais (Neurobiologia) | - |
Palavras-chave: dc.subject | Classificação | - |
Palavras-chave: dc.subject | Genomes | - |
Palavras-chave: dc.subject | Neural networks (Neurobiology) | - |
Palavras-chave: dc.subject | Classification | - |
Palavras-chave: dc.subject | CNPQ::CIENCIAS EXATAS E DA TERRA | - |
Palavras-chave: dc.subject | Engenharia/Tecnologia/Gestão | - |
Título: dc.title | Classificação de elementos transponíveis por redes neurais convolucionais | - |
Tipo de arquivo: dc.type | livro digital | - |
Aparece nas coleções: | Repositorio Institucional da UTFPR - RIUT |
O Portal eduCAPES é oferecido ao usuário, condicionado à aceitação dos termos, condições e avisos contidos aqui e sem modificações. A CAPES poderá modificar o conteúdo ou formato deste site ou acabar com a sua operação ou suas ferramentas a seu critério único e sem aviso prévio. Ao acessar este portal, você, usuário pessoa física ou jurídica, se declara compreender e aceitar as condições aqui estabelecidas, da seguinte forma: