Validação de técnicas de data augmentation em corpus textuais sobre diabetes

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorFávero, Eliane Maria De Bortoli-
Autor(es): dc.contributorFávero, Eliane Maria De Bortoli-
Autor(es): dc.contributorAscari, Rúbia Elizade Oliveira Schultz-
Autor(es): dc.contributorCasanova, Dalcimar-
Autor(es): dc.creatorMuniz Filho, Eduardo Santiago-
Data de aceite: dc.date.accessioned2025-08-29T11:57:34Z-
Data de disponibilização: dc.date.available2025-08-29T11:57:34Z-
Data de envio: dc.date.issued2024-02-04-
Data de envio: dc.date.issued2024-02-04-
Data de envio: dc.date.issued2023-11-28-
Fonte completa do material: dc.identifierhttp://repositorio.utfpr.edu.br/jspui/handle/1/33271-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/1086410-
Descrição: dc.descriptionDiabetes is a chronic disease that affects millions of people worldwide. With the assistance of computational models, it is possible to aid in the control and even prevention of diabetes. These models can be based on machine learning methods that aim to recognize patterns of behavior, for example, in textual datasets from social networks, such as Twitter. However, the efficiency of these intelligent models is linked to the volume and quality of available data. In this context, the study proposes to validate data augmentation techniques in a corpus related to diabetes derived from Twitter, with the aim of establishing a reliable and high-quality source for future research in natural language processing applied to this specific area of health. The results demonstrate that in some samples of the corpus, the meaning of sentences was altered after data augmentation; however, this change was not significant enough to affect efficiency, ensuring that the augmented corpus performs better in text classification models.-
Descrição: dc.descriptionA diabetes é uma doença crônica que afeta milhões de pessoas no mundo. Com o auxílio de modelos computacionais é possível auxilíar no controle e até prevenção da diabetes. Esses modelos podem ser baseados em métodos de aprendizado de máquina, que objetivem o reconhecimento de padrões de comportamento, por exemplo, em conjuntos de dados textuais de redes sociais, como o Twitter. Entretanto, a eficiência desses modelos inteligentes, está relacionada com o volume de dados disponíveis, bem como sua qualidade. Nesse contexto, o presente estudo propõe a validação das técnicas de aumento de dados em um corpus sobre diabetes proveniente do Twitter, com o objetivo de estabelecer uma fonte confiável e de qualidade para futuras pesquisas envolvendo processamento de linguagem natural aplicada à essa área específica da saúde. Os resultados demonstram que em algumas amostras do corpus o significado das sentenças foi alterado após o aumento dos dados, porém essa alteração não foi significativa para afetar a eficiência, garantindo ao corpus aumentado um desempenho melhor em modelos de classificação de texto.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Publicador: dc.publisherUniversidade Tecnológica Federal do Paraná-
Publicador: dc.publisherPato Branco-
Publicador: dc.publisherBrasil-
Publicador: dc.publisherDepartamento Acadêmico de Informática-
Publicador: dc.publisherEngenharia de Computação-
Publicador: dc.publisherUTFPR-
Direitos: dc.rightsopenAccess-
Direitos: dc.rightshttp://creativecommons.org/licenses/by/4.0/-
Palavras-chave: dc.subjectDiabetes mellitus-
Palavras-chave: dc.subjectAprendizado do computador-
Palavras-chave: dc.subjectInteligência artificial-
Palavras-chave: dc.subjectDiabetes mellitus-
Palavras-chave: dc.subjectMachine learning-
Palavras-chave: dc.subjectArtificial intelligence-
Palavras-chave: dc.subjectCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO-
Título: dc.titleValidação de técnicas de data augmentation em corpus textuais sobre diabetes-
Título: dc.titleValidation of data augmentation techniques in corpus textuals on diabetes-
Tipo de arquivo: dc.typelivro digital-
Aparece nas coleções:Repositorio Institucional da UTFPR - RIUT

Não existem arquivos associados a este item.