Comparação paralela exata de seqüências biológicas longas com uso limitado de memória

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorMelo, Alba Cristina Magalhães Alves de-
Autor(es): dc.creatorBatista, Rodolfo Bezerra-
Data de aceite: dc.date.accessioned2024-10-23T15:05:00Z-
Data de disponibilização: dc.date.available2024-10-23T15:05:00Z-
Data de envio: dc.date.issued2009-11-16-
Data de envio: dc.date.issued2009-11-16-
Data de envio: dc.date.issued2009-11-16-
Data de envio: dc.date.issued2006-03-20-
Fonte completa do material: dc.identifierhttp://repositorio.unb.br/handle/10482/2183-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/873828-
Descrição: dc.descriptionDissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2006.-
Descrição: dc.descriptionO alinhamento de seqüências biológicas é um método muito importante usado pela biologia computacional para relacionar organismos e compreender os processos evolutivos envolvidos entre eles. O algoritmo de Smith-Waterman, método exato para obtenção de alinhamentos locais ótimos entre seqüências de DNA (ácido desoxirribonucleico), possui complexidade O(n2) tanto de espaço quanto de tempo. Esta complexidade é um obstáculo à comparação de seqüências muito longas. O BLAST é uma ferramenta capaz de produzir alinhamentos locais em curto espaço de tempo e baixo custo de memória. No entanto, a sensibilidade dos resultados produzidos é baixa em comparação aos métodos exatos, devido às heurísticas utilizadas no BLAST. A programação paralela é utilizada para lidar com problemas computacionais que demandam muito tempo de processamento. Clusters de computadores provêm alto poder computacional a baixo custo. Entretanto, para se ter benefícios com o uso de clusters, os problemas precisam ser adaptados antes de serem resolvidos sobre tal plataforma computacional. A presente dissertação propõe uma estratégia paralela exata para a comparação de seqüências longas de DNA em um espaço limitado de memória. A estratégia proposta foi implementada em um cluster de estações de trabalho, atingindo speedups muito bons para seqüências maiores que 50Kbp e sendo capaz de produzir alinhamentos locais ótimos para seqüências de mais de 3 milhões de pares de bases. ____________________________________________________________________________________________ ABSTRACT-
Descrição: dc.descriptionBiological sequence alignment is a very important method used by computational biology to relate organisms and understand the evolutionary processes involved between them. The Smith-Waterman algorithm, an exact method used to obtain optimal local alignments between DNA (deoxyribonucleic acid) sequences, has O(n2) space and time complexity. This complexity is an obstacle to the comparison of very long sequences. BLAST is a tool capable of producing local alignments in short time at a low memory cost. However, the results produced have a low sensibility when compared to exact methods, due to the heuristics used in BLAST. Parallel programming is used to deal with high processing time demanding computational problems. Clusters of computers provide high computational power at low cost. However, in order to have benefits with the use of clusters, the problems must be adapted before being solved on such computational platform. The present dissertation proposes an exact parallel strategy to the comparison of long DNA sequences in limited memory space. The proposed strategy was implemented in a cluster of workstations, reaching very good speedups for sequences longer than 50Kbp and being able to produce optimal local alignments for sequences with over 3 million base pairs.-
Descrição: dc.descriptionInstituto de Ciências Exatas (IE)-
Descrição: dc.descriptionDepartamento de Ciência da Computação (IE CIC)-
Descrição: dc.descriptionPrograma de Pós-Graduação em Informática-
Formato: dc.formatapplication/pdf-
Direitos: dc.rightsAcesso Aberto-
Palavras-chave: dc.subjectBioinformática-
Palavras-chave: dc.subjectBiologia computacional-
Palavras-chave: dc.subjectProgramação paralela (Computação)-
Palavras-chave: dc.subjectSequências biológicas-
Título: dc.titleComparação paralela exata de seqüências biológicas longas com uso limitado de memória-
Tipo de arquivo: dc.typelivro digital-
Aparece nas coleções:Repositório Institucional – UNB

Não existem arquivos associados a este item.