Yours Ever, Virginia Woolf : Processamento de linguagem natural para descoberta de tópicos em cartas

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorCarvalho, Aline Marins Paes-
Autor(es): dc.contributorCarvalho, Alexandre Plastino de-
Autor(es): dc.contributorMarques Junior, Roberto Mann-
Autor(es): dc.creatorFalcão, Júlia Figueiredo Simão-
Data de aceite: dc.date.accessioned2024-07-11T17:36:23Z-
Data de disponibilização: dc.date.available2024-07-11T17:36:23Z-
Data de envio: dc.date.issued2022-07-25-
Data de envio: dc.date.issued2022-07-25-
Data de envio: dc.date.issued2019-
Fonte completa do material: dc.identifierhttp://app.uff.br/riuff/handle/1/25813-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/753710-
Descrição: dc.descriptionNa interseção entre computação e linguística, textos literários propõem dificuldades particulares para técnicas conhecidas de compreensão de linguagem natural. Essas peculiaridades são a motivação deste trabalho, centrado ao redor de 46 anos de correspondência de uma das figuras literárias mais proeminentes do modernismo, Virginia Woolf. Nas cartas, a prolífica escritora mostrava um pouco de si mesma para cada um dos amigos e familiares a quem escrevia, muitas vezes borrando a barreira entre ficção e realidade em textos hoje reconhecidos por muitos como obras de literatura em si. Como uma primeira e essencial etapa para a análise computacional do corpus, o objetivo desse trabalho é a descoberta de tópicos (ou assuntos) tratados em cada carta, utilizando Latent Dirichlet Allocation, um método baseado na ideia de que cada documento é uma distribuição de tópicos. Foi feito um estudo de seus hiperparâmetros com base em duas métricas de avaliação, coerência e silhueta, e detalhado o pré-processamento necessário para o bom funcionamento do método. Os resultados obtidos se mostraram satisfatórios, com modelos capazes de extrair tópicos que agrupam palavras relacionadas a sua profissão ou relacionadas à natureza e à beleza das paisagens que admirava, possibilitando conclusões interessantes a respeito da escritora que foi uma grande observadora da vida e das pessoas ao seu redor.-
Descrição: dc.descriptionIn the intersection between computing and linguistics, literary texts present unique difficulties for known natural language understanding techniques. These traits are the motivation for this work, centered around 46 years of letters written by one of the most notable figures of modernism, Virginia Woolf. In her correspondence, the prolific writer showed a small part of herself to each of the friends and relatives to whom she wrote, often blurring the boundaries between fiction and reality, creating texts now recognized by many as art in itself. As a first, essential step in the computational analysis of the corpus, the goal of this work is the discovery of topics (or themes) present in each letter, using Latent Dirichlet Allocation, a method based on the idea that each document is a distribution over topics. A study of its hyperparameters was conducted based on two evaluation metrics, topic coherence and silhouette, and the necessary pre-processing steps were detailed. The results were satisfactory; generated models were capable of extracting topics that brought together words related to her career or those related to nature and the beauty of the landscapes she admired, leading to interesting conclusions about the writer that was a great observer of life and the people around her.-
Descrição: dc.description67 p.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Direitos: dc.rightsOpen Access-
Direitos: dc.rightsCC-BY-SA-
Palavras-chave: dc.subjectInteligência artificial-
Palavras-chave: dc.subjectAprendizado de máquina-
Palavras-chave: dc.subjectProcessamento de linguagem natural-
Palavras-chave: dc.subjectModelagem de tópicos-
Palavras-chave: dc.subjectCorrespondência-
Palavras-chave: dc.subjectLiteratura epistolar-
Palavras-chave: dc.subjectLinguística computacional-
Palavras-chave: dc.subjectInteligência artificial-
Palavras-chave: dc.subjectAprendizado de máquina-
Palavras-chave: dc.subjectProcessamento de linguagem natural (Computação)-
Palavras-chave: dc.subjectArtificial Intelligence-
Palavras-chave: dc.subjectMachine learning-
Palavras-chave: dc.subjectNatural language processing-
Palavras-chave: dc.subjectTopic modeling-
Palavras-chave: dc.subjectCorrespondence-
Palavras-chave: dc.subjectEpistolary literature-
Palavras-chave: dc.subjectComputational linguistics-
Título: dc.titleYours Ever, Virginia Woolf : Processamento de linguagem natural para descoberta de tópicos em cartas-
Tipo de arquivo: dc.typeTrabalho de conclusão de curso-
Aparece nas coleções:Repositório Institucional da Universidade Federal Fluminense - RiUFF

Não existem arquivos associados a este item.