Avaliação de critérios de otimalidade em um método de seleção de atributos em GWAS

Souza, Juliara de Lima

Portal eduCapes
Seta
Nossos Parceiros
Seta
Repositório Institucional da Universidade Federal Fluminense - RiUFF
Seta

Avaliação de critérios de otimalidade em um método de seleção de atributos em GWAS

Use este link compartilhar ou citar este material: http://educapes.capes.gov.br/handle/capes/752142

Registro completo de metadados

Metadados	Descrição	Idioma
Autor(es): dc.contributor	Oliveira, Fabrízzio Condé de	-
Autor(es): dc.contributor	Telles, Wagner Rambaldi	-
Autor(es): dc.contributor	Gorges, Carlos Cristiano Hasenclever	-
Autor(es): dc.creator	Souza, Juliara de Lima	-
Data de aceite: dc.date.accessioned	2024-07-11T17:31:44Z	-
Data de disponibilização: dc.date.available	2024-07-11T17:31:44Z	-
Data de envio: dc.date.issued	2023-09-19	-
Data de envio: dc.date.issued	2023-09-19	-
Fonte completa do material: dc.identifier	http://app.uff.br/riuff/handle/1/30447	-
Fonte: dc.identifier.uri	http://educapes.capes.gov.br/handle/capes/752142	-
Descrição: dc.description	Estudos de Associação em Escala Genômica (do inglês, Genome Wide Association Studies - GWAS) procuram identificar variações no genoma que estão associados a certos fenótipos. Esses estudos utilizam os marcadores do tipo SNP (Polimorfismo de Nucleotídeo único), onde os mesmos podem ser associados com o fenótipo ou podem estar correlacionados com outras mutações associadas à característica fenotípica. A partir desses estudos, buscam-se métodos que são capazes de selecionar os SNPs mais informativos, aqueles que realmente estão associados ao fenótipo proposto. Os métodos mais utilizados são aqueles baseados no valor-p de cada SNP em testes estatísticos. Contudo, esses métodos capturam apenas SNPs com somente efeitos aditivos mas existirão problemas onde a associação presente pode ser não-linear, com duplas ou trios de SNPs interagindo. Em vista disso, este trabalho propõe um método já existente de seleção de SNPs baseado em técnicas de Aprendizado de Máquina denominado SNP Markers Selector (SMS) com novas medidas de otimalidade denominadas R2 ajustado e Erro Quadrático Médio (Mean Squared Error - MSE) com o intuito de comparar com o método já existente do SMS com sua medida baseada na correlação de Pearson, objetivando uma contribuição positiva em relação a busca de SNPs verdadeiros-positivos e a redução dos SNPs falsos-positivos. O método SMS conta com três etapas, a primeira referente à relevância dos marcadores, a segunda referente ao corte responsável pela definição de conjuntos de SNPs relevantes mas ainda com algum nível de ruído e a terceira, referente ao refinamento do corte feito na etapa anterior, buscando diminuir os SNPs não informativos. As três etapas do SMS foram implementadas utilizando Florestas Aleatórias, Máquina de Vetores Suporte com Regressão e Algoritmos Genéticos, respectivamente. O SMS pode ser aplicado em dois tipos de problemas, os de regressão (fenótipos contínuos), que serão alvos de estudo neste trabalho, e os de classificação (fenótipos discretos). O método SMS foi aplicado em seis conjuntos de bases de dados simulados. O método proposto baseado nas medidas de otimalidade R2 ajustado e MSE obtiveram melhores resultados em algumas simulações, tendo o número de SNPs falsos-positivos bem reduzido e capturaram SNPs que a correlação não foi capaz, contudo, em outras simulações a correlação de Pearson mostrou-se superior encontrando um número maior de SNPs informativos. Diante disso, o método demonstrou ser eficiente, mas não superou em todos os cenários o método SMS baseado na correlação de Pearson.	-
Descrição: dc.description	Genomic Wide Association Studies (from english, Genome Wide Association Studies - GWAS) seek to identify variations in the genome that are associated with certain phenotypes. These studies use SNP (Single Nucleotide Polymorphism) markers, where they may be associated with the phenotype or may be correlated with other mutations associated with the phenotypic trait. From these studies, methods are sought that are able to select the most informative SNPs, those that are really associated with the proposed phenotype. The most used methods are those based on the p-value of each SNP in statistical tests. However, these methods capture only SNPs with only additive effects but there will be problems where the association present may be non-linear, with pairs or trios of SNPs interacting. In view of this, this work proposes an existing method of SNP selection based on Machine Learning techniques called SNP Markers Selector - (SMS) with new optimality measures called adjusted R2 and Mean Square Error (Mean Squared Error - MSE) in order to compare with the existing method of SMS with its measure based on Pearson’s correlation, aiming at a positive contribution in relation to the search for true-positive SNPs and the reduction of false-positive SNPs. The SMS method has three steps, the first referring to the relevance of the markers, the second referring to the cut responsible for defining sets of relevant SNPs but still with some level of noise and the third referring to the refinement of the cut made in the previous step, seeking to reduce non-informative SNPs. The three steps of SMS were implemented using Random Forests, Support Vector Machine with Regression and Genetic Algorithms, respectively. The SMS can be applied to two types of problems, those of regression (continuous phenotypes), which will be studied in this work, and those of classification (discrete phenotypes). The SMS method was applied to six sets of simulated databases. The proposed method based on the adjusted optimality measures R2 and MSE obtained better results in some simulations, having the number of false-positive SNPs well reduced and capturing SNPs that the correlation was not able to, however, in In other simulations, Pearson’s correlation proved to be superior, finding a greater number of informative SNPs. Therefore, the method proved to be efficient, but it did not surpass the SMS method based on Pearson’s correlation in all scenarios.	-
Descrição: dc.description	105 f.	-
Formato: dc.format	application/pdf	-
Idioma: dc.language	pt_BR	-
Direitos: dc.rights	Open Access	-
Direitos: dc.rights	CC-BY-SA	-
Palavras-chave: dc.subject	Estudos de Associação em Escala Genômica	-
Palavras-chave: dc.subject	Polimorfismo de Nucleotídeo Único	-
Palavras-chave: dc.subject	Correlação de Pearson	-
Palavras-chave: dc.subject	R2 ajustado	-
Palavras-chave: dc.subject	Erro Quadrático Médio	-
Palavras-chave: dc.subject	SNP Markers Selector	-
Palavras-chave: dc.subject	Florestas Aleatórias	-
Palavras-chave: dc.subject	Máquina de Vetores Suporte	-
Palavras-chave: dc.subject	Algorítmos Genéticos	-
Palavras-chave: dc.subject	Polimorfismo de nucleotídeo único	-
Palavras-chave: dc.subject	Genome Wide Association Studies	-
Palavras-chave: dc.subject	Simple Nucleotide Polymorphism	-
Palavras-chave: dc.subject	Pearson’s Correlation	-
Palavras-chave: dc.subject	R2 adjusted	-
Palavras-chave: dc.subject	Mean Square Error	-
Palavras-chave: dc.subject	SNP Markers Selector	-
Palavras-chave: dc.subject	Random Forest	-
Palavras-chave: dc.subject	Support Vector Regression	-
Palavras-chave: dc.subject	Genetic Algorithm	-
Título: dc.title	Avaliação de critérios de otimalidade em um método de seleção de atributos em GWAS	-
Tipo de arquivo: dc.type	Trabalho de conclusão de curso	-
Aparece nas coleções:	Repositório Institucional da Universidade Federal Fluminense - RiUFF

Não existem arquivos associados a este item.

O Portal eduCAPES é oferecido ao usuário, condicionado à aceitação dos termos, condições e avisos contidos aqui e sem modificações. A CAPES poderá modificar o conteúdo ou formato deste site ou acabar com a sua operação ou suas ferramentas a seu critério único e sem aviso prévio. Ao acessar este portal, você, usuário pessoa física ou jurídica, se declara compreender e aceitar as condições aqui estabelecidas, da seguinte forma:

O Termo de Uso pode ser modificado pela CAPES a qualquer tempo, sem necessidade de notificação prévia, sendo que tais modificações serão válidas a partir da data de sua veiculação neste portal;
Para aprovação de cadastro do usuário ao sistema, a CAPES pode requisitar o fornecimento de informações, haja vista a política de segurança adotada, objetivando resguardar a segurança dos usuários nesse ambiente virtual;
O usuário aceita e declara compreender que, em razão do peculiar ambiente da Internet, a CAPES não poderá garantir que o acesso ao site seja livre de erros ou problemas decorrentes de casos fortuitos, internos ou externos, casos de força maior ou ainda de outros casos não inteiramente sujeitos a controle direto dos administradores do site e, portanto o usuário se obriga a isentar a CAPES de quaisquer reclamações ou indenizações. A CAPES também não se responsabiliza por interrupções, interceptações, invasões, disseminação de vírus ou outros atos ilícitos, típicos e atípicos de ambiente virtual, e de web, dos quais a CAPES não tenha tido intenção deliberada de participar ou praticar;
O usuário aceita e declara compreender que qualquer texto, marca, áudio, imagem, ou conteúdo veiculados no site são protegidos por direitos de propriedade intelectual o qual deve ser respeitado de acordo com a licença concedida pelo respectivo detentor dos referidos direitos, sob pena de apuração das responsabilidades cabíveis;
Desta forma a CAPES se exime de toda e qualquer responsabilidade por eventuais perdas, danos e prejuízos de qualquer natureza decorrentes:
- Do descumprimento da lei, da moral e dos bons costumes, como consequência da transmissão, difusão, armazenamento, disponibilização, recepção, obtenção ou acesso aos conteúdos;
- Da infração aos direitos de propriedade intelectual e industrial, segredos empresariais, compromissos contratuais de qualquer tipo, direitos à honra, à intimidade pessoal e familiar, à imagem das pessoas, direitos de propriedade e de toda e qualquer natureza pertencentes a um terceiro por consequência da transmissão, difusão, armazenamento, disponibilização, recepção, obtenção ou acesso aos conteúdos;
- Da falta de veracidade, precisão, exatidão, pertinência e/ou atualidade dos conteúdos;
- Da inadequação para qual seja o propósito, ou da frustração, das expectativas geradas pelos conteúdos;
Exceto quando mencionado explicitamente, ou quando se tratar de citação de material alheio ou ilustração, nos limites estabelecidos pela Lei 9.610/98, todo o Conteúdo textual original do Portal eduCAPES está disponível livremente para leitura, entre outros direitos, conforme definido na licença Creative Commons;
A CAPES não se responsabiliza pelos comentários, opiniões, informações, depoimentos, mensagens, vídeos, textos, imagens, áudios ou qualquer outro tipo de conteúdo que sejam, postados, publicados e disponibilizados através do Portal eduCAPES pelos usuários, sendo a responsabilidade civil e criminal atribuída única e exclusivamente ao autor dos comentários, opiniões, informações, ou mensagens. Todo o conteúdo publicado por usuários são de responsabilidade exclusiva dos mesmos e de caráter completamente independente, sendo que todo e qualquer tipo de opinião, ideal e/ou posição expressados não refletem necessariamente o ponto de vista e a posição do Portal eduCAPES e/ou da CAPES. A CAPES se reserva o direito de armazenar as informações destes autores e/ou Usuários, a fim de viabilizar sua identificação;
O usuário aceita e declara compreender que a CAPES poderá disponibilizar no Portal eduCAPES, links de acesso para outros sites e endereços virtuais administrados, controlados ou operados por terceiros. Qualquer site conectado a partir do eduCAPES não está sob o controle da CAPES;
A CAPES não assume nenhuma responsabilidade ou obrigação por qualquer informação, comunicação ou material encontrado em tais sites, ou em qualquer site conectado a tais sites. A CAPES não assume qualquer responsabilidade pelos serviços ou funcionalidades ali dispostos, sendo a decisão de utilização e a forma de relacionamento com os mesmos de exclusiva responsabilidade do usuário, que inclusive isenta a CAPES de fiscalizar o conteúdo ou zelar pela integridade de tais sites ou endereços virtuais.
O usuário aceita e declara compreender que o acesso a determinadas áreas do site será restrito. Para acessá-las, o usuário deverá fazer o login e cadastrar uma senha de acesso. A senha é individual, sigilosa e intransferível, sendo o usuário o único responsável pela guarda da mesma. O usuário assume toda e qualquer responsabilidade pelo mau uso ou pela utilização da senha por terceiros;
A CAPES reserva o direito de excluir o cadastro, de excluir o material submetido ou proibir o acesso do usuário ao portal eduCAPES no caso de qualquer abuso ou indício de prática ilícita no uso do site ou de qualquer uso não autorizado ou proibido pelo usuário, nos termos da legislação brasileira;
As condições estabelecidas no Termo de Aceite e Uso do Site são regidas pela lei brasileira. Sob nenhuma circunstância o usuário deverá violar qualquer lei usando o portal eduCAPES para propósitos que incluam, mas não limitados a isso, difamação ou perturbação de outros, violação de direitos de propriedade intelectual ou de terceiros, envio de material obsceno ou ofensivo, vírus, arquivos corrompidos, ou outros programas que poderiam danificar ou alterar este site ou os computadores de empresa ou de terceiros;
A CAPES reserva o direito de retirar qualquer conteúdo que infrinja a lei, a moral e os bons costumes nos termos da legislação vigente e também na hipótese de o conteúdo não se coadunar com as finalidades educativas do Portal. A CAPES garante o direito de defesa e contraditório dos usuários. O usuário reconhece que o material enviado por terceiros, que não a CAPES, não é endossado pela mesma.

Concordo e desejo baixar o arquivo
Não concordo e não irei baixar o arquivo

Mostrar registro simples do item Visualizar estatísticas

Denunciar conteúdo impróprio

Você é humano?

Avaliação de critérios de otimalidade em um método de seleção de atributos em GWAS