Banco de dados biológico no modelo relacional para mineração de dados em genomas completos de procariotos disponibilizados pelo NCBI GenBank

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorRaittz, Roberto Tadeu-
Autor(es): dc.contributorPedrosa, Fábio de Oliveira, 1947--
Autor(es): dc.contributorUniversidade Federal do Paraná. Setor de Educação Profissional e Tecnológica. Programa de Pós-Graduação em Bioinformática-
Autor(es): dc.creatorGuizelini, Dieval-
Data de aceite: dc.date.accessioned2019-08-22T00:28:02Z-
Data de disponibilização: dc.date.available2019-08-22T00:28:02Z-
Data de envio: dc.date.issued2012-04-09-
Data de envio: dc.date.issued2012-04-09-
Data de envio: dc.date.issued2012-04-09-
Fonte completa do material: dc.identifierhttp://hdl.handle.net/1884/25297-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/1884/25297-
Descrição: dc.descriptionResumo: O NCBI GenBank, um dos três principais bancos de dados primários, tem centralizado as informações obtidas pelos processos de sequenciamento de DNA e/ou RNA e as tem distribuído no formato de arquivos textos. Nos servidores de arquivos do GenBank, para o Domínio Bactéria e Domínio Archea, existe um arquivo em formato específico para cada organismo, cromossomo ou plasmídeo completamente sequenciado, com seus genomas e respectivas anotações. Detectou-se a ausência de um modelo de banco de dados para armazenar todas as informações, bem como se observou a necessidade de redistribuir essas informações no formato de banco de dados relacional. Este trabalho propõe um modelo de banco de dados relacional e um conjunto de ferramentas para análise, transposição dos dados no formato texto para o modelo de banco de dados relacional desenvolvido e estratégias de atualização. O modelo foi desenvolvido a partir da análise da especificação do GenBank e da observação das informações de organismos espalhados em mais de 2000 arquivos. Para o desenvolvimento das ferramentas, adotou-se a metodologia da prototipação, padrões de projetos, testes e análises de desempenho. Os resultados obtidos demonstram a possibilidade de armazenar todos os dados nos principais SGBD, com redução significativa da redundância nos dados e obtenção de alto desempenho nas quatro etapas do processo: 1) sincronização dos arquivos de texto em um repositório local a partir do servidor de arquivos do NCBI; 2) análise dos arquivos e interpretação dos campos; 3) carga dos dados analisados no banco de dados e; 4) aderência do modelo desenvolvido com a especificação e desempenho observado nas consultas feitas. Esta dissertação contribui para um novo modelo de organização, acesso e distribuição das informações do NCBI GenBank.-
Formato: dc.formatapplication/pdf-
Formato: dc.formatapplication/pdf-
Palavras-chave: dc.subjectTeses-
Palavras-chave: dc.subjectBanco de dados relacionais-
Palavras-chave: dc.subjectGenomas-
Palavras-chave: dc.subjectBioinformática-
Palavras-chave: dc.subjectGenetica - Processamento de dados-
Título: dc.titleBanco de dados biológico no modelo relacional para mineração de dados em genomas completos de procariotos disponibilizados pelo NCBI GenBank-
Tipo de arquivo: dc.typelivro digital-
Aparece nas coleções:Repositório Institucional - Rede Paraná Acervo

Não existem arquivos associados a este item.