Representações vetoriais de proteomas : um estudo de caso com sequências mitocondriais

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorRaittz, Roberto Tadeu-
Autor(es): dc.contributorCastro, Mauro Antônio Alves-
Autor(es): dc.contributorUniversidade Federal do Paraná. Setor de Educação Profissional e Tecnológica. Programa de Pós-Graduação em Bioinformática-
Autor(es): dc.creatorPierri, Camilla Reginatto de-
Data de aceite: dc.date.accessioned2019-08-21T22:59:18Z-
Data de disponibilização: dc.date.available2019-08-21T22:59:18Z-
Data de envio: dc.date.issued2018-07-16-
Data de envio: dc.date.issued2018-07-16-
Data de envio: dc.date.issued2017-
Fonte completa do material: dc.identifierhttps://hdl.handle.net/1884/48567-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/1884/48567-
Descrição: dc.descriptionOrientador : Prof. Dr. Roberto Tadeu Raittz-
Descrição: dc.descriptionCoorientador : Prof. Dr. Mauro Antônio Alves Castro-
Descrição: dc.descriptionDissertação (mestrado) - Universidade Federal do Paraná, Setor de Educação Profissional e Tecnológica, Programa de Pós-Graduação em Bioinformática. Defesa: Curitiba, 15/05/2017-
Descrição: dc.descriptionInclui referências : f. 67-77-
Descrição: dc.descriptionResumo: Grande parte dos estudos evolutivos para inferir ancestralidade são conduzidos utilizando apenas alguns genes mitocondriais. Filogenias baseadas em um único gene podem não conter informações suficientes para construir história evolutiva de determinados organismos. Utilizar genomas mitocondriais completos para análises evolutivas fornecem mais informações que a utilização de proteínas individuais, porém, dependendo do número de organismos, gera alto custo computacional. Não existem propostas até o momento referentes a filogenias derivadas de projeções em espaços vetoriais com redução de dimensão que representem o proteoma de organismos. A abordagem proposta neste trabalho, desenvolvida em ambiente MatLab® é inovadora e resolve problemas associados ao custo computacional na execução de filogenias. Utilizando os dados de 6.811 organismos depositados no RefSeq, realizamos inicialmente a clusterização dos dados, utilizando a ferramenta RAFTS3groups. Após tratamento dos dados, propomos uma estratégia de representação vetorial baseada em k-mers espaçados, utilizando janela deslizante com tamanho de 5 aminoácidos com 1 descontinuado. A partir disso, foi gerada uma matriz de co-ocorrência de 400x400 para cada organismo, representando o proteoma mitocondrial. Esta matriz foi disposta em um vetor de 160.000 atributos, o qual é utilizado para gerar representações vetoriais com redução de dimensão de 100, 400 e 800 coordenadas. Essas vetorizações são representadas em árvores filogenéticas e comparada com filogenia de alinhamento. Elaboramos um algoritmo baseado em UPGMA para realizar árvores filogenéticas e analisamos o proteoma mitocondrial dos Jakobidas e dos Homínidios. A estratégia de extração de atributos e representação vetorial do proteoma se mostrou eficiente para evidenciar relações de parentesco, sendo as filogenias vetorizadas correlacionadas com a filogenia de alinhamento. Palavras-chave: Proteoma Mitocondrial, Filogenia, Bioinformática.-
Descrição: dc.descriptionAbstract: Much of the evolutionary studies to infer ancestry are conducted using only a few mitochondrial genes. Phylogenies based on a single gene may not contain enough information to construct evolutionary history of certain organisms. Using complete mitochondrial genomes for evolutionary analysis provides more information than the use of individual proteins, however, depending on the number of organisms, it generates a high computational cost. There are no proposals to date regarding phylogenies derived from projections in vector spaces with size reduction that represent the proteome of organisms. The approach proposed in this work, developed in MatLab® environment, is innovative and solves problems associated with computational cost in the execution of phylogenies. Using data from 6,811 organisms deposited in the RefSeq, we initially performed data clustering using the RAFTS3groups tool. After data processing, we propose a vector representation strategy based on spaced k-mers, using sliding window with size of 5 amino acids with 1 discontinued. From this, a co-occurrence matrix of 400x400 was generated for each organism, representing the mitochondrial proteome. This matrix was arranged in a vector of 160,000 attributes, which is used to generate vector representations with size reduction of 100, 400 and 800 coordinates. These vectorizations are represented in phylogenetic trees and compared with phylogeny of alignment. We developed an algorithm based on UPGMA to perform phylogenetic trees and analyzed the mitochondrial proteome of Jakobids and Hominids. The strategy of attribute extraction and vector representation of the proteome proved to be efficient to evidence kinship relations, with the phylogenies vectored correlated with the phylogeny of alignment. Keywords: Mitochondrial Proteome, Phylogeny, Bioinformatics.-
Formato: dc.format88 f. : il. algumas color.;grafs., tabs.-
Formato: dc.formatapplication/pdf-
Formato: dc.formatapplication/pdf-
Relação: dc.relationDisponível em formato digital-
Palavras-chave: dc.subjectFilogenia-
Palavras-chave: dc.subjectDNA mitocondrial-
Palavras-chave: dc.subjectBioinformática-
Título: dc.titleRepresentações vetoriais de proteomas : um estudo de caso com sequências mitocondriais-
Tipo de arquivo: dc.typelivro digital-
Aparece nas coleções:Repositório Institucional - Rede Paraná Acervo

Não existem arquivos associados a este item.