Using protein-protein interactions data to improve predictions of the effect of aging-related genes on the longevity of model organisms

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorCarvalho, Alexandre Plastino de-
Autor(es): dc.contributorCarvalho, Aline Marins Paes-
Autor(es): dc.contributorCarvalho, Jonathan dos Santos-
Autor(es): dc.contributorSilva, Pablo Nascimento da-
Autor(es): dc.creatorMiranda, Igor Martire de-
Data de aceite: dc.date.accessioned2024-07-11T18:27:59Z-
Data de disponibilização: dc.date.available2024-07-11T18:27:59Z-
Data de envio: dc.date.issued2018-02-07-
Data de envio: dc.date.issued2018-02-07-
Data de envio: dc.date.issued2018-
Fonte completa do material: dc.identifierhttps://app.uff.br/riuff/handle/1/5741-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/771115-
Descrição: dc.descriptionThis work focuses on improving the predictive performance on the task of classifying the e↵ect of aging-related genes on the longevity of model organisms. Usually, datasets for this problem are built using gene ontology features. We show that, by introducing a new set of features based on protein-protein interactions, we can improve the classification in a statistically significant way. Although beneficial, the introduction of these features brings a new problem for this task: performing classification based on uncertain information. This happens because the values of the new features only represent how certain we can be that an interaction exists between two proteins. To cope with this problem, we propose a novel similarity coe cient, based on the Jaccard index, and show that, by using it, we can benefit from the introduced uncertain data without adding too much complexity to the classification solution. Finally, we demonstrate how to achieve even better results on this task by performing a feature selection procedure-
Descrição: dc.descriptionEste trabalho foca em melhorar a performance preditiva na tarefa de classificação do efeito de genes relacionados ao envelhecimento na longevidade de organismos-modelo. Normalmente, bases de dados construídas para este problema usam atributos da ontologia de genes. Nós demonstramos que ao introduzirmos um novo conjunto de atributos baseados em interações proteína-proteína, conseguimos melhorar a classificação de forma estatisticamente significativa. Embora benéfica, a introdução desses atributos gera um novo problema: realizar a tarefa de classificação usando dados incertos. Isso ocorre porque os valores desses novos atributos representam apenas um grau de certeza da existência de uma interação entre duas proteínas. Para lidar com esse problema, propomos um novo coeficiente de similaridade, baseado no coeficiente de Jaccard, e mostramos que ao usá-lo, podemos nos beneficiar desses dados incertos introduzidos nas bases, sem aumentar demasiadamente a complexidade da solução de classificação. Por fim, nós demonstramos como obter resultados ainda melhores através da aplicação de uma técnica de seleção de atributos-
Formato: dc.formatapplication/pdf-
Idioma: dc.languageen-
Direitos: dc.rightsopenAccess-
Direitos: dc.rightshttp://creativecommons.org/licenses/by-nc-nd/3.0/br/-
Direitos: dc.rightsCC-BY-SA-
Palavras-chave: dc.subjectAging-
Palavras-chave: dc.subjectClassification-
Palavras-chave: dc.subjectFeature selection-
Palavras-chave: dc.subjectJaccard similarity-
Palavras-chave: dc.subjectLongevity-
Palavras-chave: dc.subjectRityprotein protein-interaction-
Palavras-chave: dc.subjectMineração de dados (Computação)-
Palavras-chave: dc.subjectSeleção de atributos-
Palavras-chave: dc.subjectOntologia-
Palavras-chave: dc.subjectEnvelhecimento-
Palavras-chave: dc.subjectLongevidade-
Palavras-chave: dc.subjectEnvelhecimento-
Palavras-chave: dc.subjectClassificação-
Palavras-chave: dc.subjectSeleção de atributos-
Palavras-chave: dc.subjectSimilaridade de Jaccard-
Palavras-chave: dc.subjectLongevidade-
Palavras-chave: dc.subjectInteração proteína-proteína-
Título: dc.titleUsing protein-protein interactions data to improve predictions of the effect of aging-related genes on the longevity of model organisms-
Tipo de arquivo: dc.typeTrabalho de conclusão de curso-
Aparece nas coleções:Repositório Institucional da Universidade Federal Fluminense - RiUFF

Não existem arquivos associados a este item.