Identificação estatística de regiões codificadoras de proteínas em seqüências de DNA

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorLeitão, Helena Cristina da Gama-
Autor(es): dc.contributorCPF:01123245322-
Autor(es): dc.contributorhttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4785003Z6-
Autor(es): dc.contributorStolfi, Jorge-
Autor(es): dc.contributorCPF:38560908972-
Autor(es): dc.contributorhttp://lattes.cnpq.br/6824400602221355-
Autor(es): dc.contributorFigueiredo, Celina Miraglia Herrera de-
Autor(es): dc.contributorCPF:41320908122-
Autor(es): dc.contributorhttp://lattes.cnpq.br/3957046121364560-
Autor(es): dc.contributorMeidanis, Joao-
Autor(es): dc.contributorCPF:41538729022-
Autor(es): dc.contributorhttp://lattes.cnpq.br/1313385414995585-
Autor(es): dc.contributorCarvalho, Alexandre Plastino de-
Autor(es): dc.contributorCPF:30090875322-
Autor(es): dc.contributorhttp://lattes.cnpq.br/4985266524417261-
Autor(es): dc.creatorCapua, Renatha Oliva-
Data de aceite: dc.date.accessioned2024-07-11T18:32:17Z-
Data de disponibilização: dc.date.available2024-07-11T18:32:17Z-
Data de envio: dc.date.issued2021-03-10-
Data de envio: dc.date.issued2008-06-16-
Data de envio: dc.date.issued2021-03-10-
Data de envio: dc.date.issued2005-11-21-
Fonte completa do material: dc.identifierhttps://app.uff.br/riuff/handle/1/17899-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/772449-
Descrição: dc.descriptionThe large number of genome sequencing projects in progress and the resulting increase in the volume of uncharacterized data has motivated the search for more precise and efficient computacional methods for identifying the structures that compose the DNA of living beings. In particular, due to its great importance, the search for protein coding regions has been the focus of research for at least twenty years. Coding regions carry in its nucleotides the information necessary to the cellular structures to produce proteins, fundamental component of most living organisms. The identification of coding regions in DNA sequences is still a difficult problem since the complex cellular mechanisms involved in the process of protein production are not completely known. In this dissertation, we have developed a statistical method for the identification of protein coding regions. The method is based on Bayes s theorem applied to strings of k consecutive DNA bases, where k is a parameter specified by the user. To compute the conditional and a priori probabilities needed by Bayes s theorem, we use certain hypotheses on the independence of codons and bases, and on the minimum size of coding and non-coding regions, that reduce the computational cost and the size of probability tables. In performed tests the proposed method has presented promising results.-
Descrição: dc.descriptionO elevado número de projetos de seqüenciamento de genomas em andamento e a conseqüente geração de grandes quantidades de dados descaracterizados tem motivado a busca por métodoscomputacionais mais precisos e eficientes para a identificação das estruturas que compõem o DNA dos seres vivos. Em especial, devido a sua grande importância, destaca-se a busca por regiões codificadoras de proteínas, que vem sendo o foco de pesquisas há pelo menos vinte anos. Estas regiões armazenam em seus nucleotídeos a informação necessária às estruturas celulares para a fabricação das proteínas, componente fundamental da maioria dos organismos vivos. A identificação das regiões codificadoras nas seqüências de DNA ainda é um problema de difícil solução, uma vez que os complexos mecanismos celulares envolvidos no processo de fabricação das proteínas não são completamente conhecidos. Neste trabalho, desenvolvemos um método estatístico para a identificação das regiões codificadoras de proteínas. O método é baseado no teorema de Bayes aplicado a trechos de k bases consecutivas do DNA, onde k é um parâmetro especificado pelo usuário. Para o cálculo das probabilidades condicionais e a priori necessárias para o teorema de Bayes, usamos certas hipóteses sobre independência de bases e códons, e sobre o tamanho mínimo de regiões codificadoras e não-codificadoras, que reduzem o custo computacional e o tamanho das tabelas de probabilidade. Em testes realizados, o método proposto apresentou resultados promissores.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Publicador: dc.publisherPrograma de Pós-Graduação em Computação-
Publicador: dc.publisherComputação-
Direitos: dc.rightsAcesso Aberto-
Direitos: dc.rightsCC-BY-SA-
Palavras-chave: dc.subjectCiência da computação-
Palavras-chave: dc.subjectInteligência artificial-
Palavras-chave: dc.subjectBiologia computacional-
Palavras-chave: dc.subjectDNA-
Palavras-chave: dc.subjectAnálise de seqüências-
Palavras-chave: dc.subjectTeorema de Bayes-
Palavras-chave: dc.subjectRegiões codificadoras-
Palavras-chave: dc.subjectSeqüências codificadoras de proteínas-
Palavras-chave: dc.subjectReconhecimento de padrões-
Palavras-chave: dc.subjectBioinformática-
Palavras-chave: dc.subjectProtein coding sequences-
Palavras-chave: dc.subjectBayes s theorem-
Palavras-chave: dc.subjectPattern recognition-
Palavras-chave: dc.subjectBioinformatics-
Palavras-chave: dc.subjectCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO::COMPUTABILIDADE E MODELOS DE COMPUTACAO-
Título: dc.titleIdentificação estatística de regiões codificadoras de proteínas em seqüências de DNA-
Tipo de arquivo: dc.typeDissertação-
Aparece nas coleções:Repositório Institucional da Universidade Federal Fluminense - RiUFF

Não existem arquivos associados a este item.