Metodologia de busca de similaridade de genes por matriz de co-ocorrência

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorRaittz, Roberto Tadeu-
Autor(es): dc.contributorSteffens, Maria Berenice Reynaud-
Autor(es): dc.contributorMarchaukoski, Jeroniza Nunes-
Autor(es): dc.contributorUniversidade Federal do Paraná. Setor de Educação Profissional e Tecnológica. Programa de Pós-Graduação em Bioinformática-
Autor(es): dc.creatorRamos, Danhylo Almeida-
Data de aceite: dc.date.accessioned2019-08-22T00:26:41Z-
Data de disponibilização: dc.date.available2019-08-22T00:26:41Z-
Data de envio: dc.date.issued2013-05-16-
Data de envio: dc.date.issued2013-05-16-
Data de envio: dc.date.issued2013-05-16-
Fonte completa do material: dc.identifierhttp://hdl.handle.net/1884/29846-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/1884/29846-
Descrição: dc.descriptionResumo: O barateamento das tecnologias de sequencimento de DNA têm resultado em um aumento expressivo de novos organismos sequenciados. No estudo destes dados cientistas utilizam o alinhamento de sequência de nucleotídeos para promover a anotação de genes ou de proteínas nos organismos recém sequenciados, comparando com banco de dados públicos de sequências. Alinhamento de sequências é um problema quando se observa o grande volume de organismos sequenciados e sequências depositadas em banco de dados mundiais, fazendo-se necessária uma otimização do processo. Esta pesquisa propõe uma Metodologia de Busca de Similaridade de Genes por Matriz de Co-ocorrência de modo a oferecer um meio que contribua na tarefa de anotação de um novo gene, fornecendo respostas rápidas e precisas. Uma base de dados contendo todos os genes dos genomas completos foi obtida do NCBI em setembro de 2010. As sequências de nucleotídeos foram processadas, avaliando-se a co-ocorrências entre as bases, extraindo valores estatísticos que sejam capazes de representar estas sequências em dados numéricos, permitindo a comparação de sequências através dessas medidas. Um banco de dados relacional é utilizado para armazenar os dados obtidos. Através de consulta SQL as sequências são pesquisadas na base de dados. Os resultados obtidos pela aplicação da metodologia foram validados comparando com as respostas do BLAST referente à mesma base de dados. Dez mil sequências de nucleotídeos foram testadas, e quando aplicada uma linha de corte de 50% de score relativo ao self-score a metodologia proposta encontra mais de 97% de respostas idênticas ao BLAST, este percentual é maior, quase totalizando 100% quando aplicada uma linha de corte de 70% a 90% de score relativo ao self-score nas respostas.-
Formato: dc.formatapplication/pdf-
Formato: dc.formatapplication/pdf-
Palavras-chave: dc.subjectTeses-
Palavras-chave: dc.subjectSeqüencia de nucleotidios-
Palavras-chave: dc.subjectMontagem genômica-
Palavras-chave: dc.subjectBioinformática-
Título: dc.titleMetodologia de busca de similaridade de genes por matriz de co-ocorrência-
Tipo de arquivo: dc.typelivro digital-
Aparece nas coleções:Repositório Institucional - Rede Paraná Acervo

Não existem arquivos associados a este item.