Processamento de linguagem natural aplicado a relatos de acidentes em minas de carvão

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorPereira, Valdecy-
Autor(es): dc.contributorNeves, Julio César Bispo-
Autor(es): dc.contributorRoboredo, Marcos Costa-
Autor(es): dc.contributorPereira, Valdecy-
Autor(es): dc.contributorNeves , Júlio César Bispo-
Autor(es): dc.contributorRoboredo, Marcos Costa-
Autor(es): dc.creatorPereira, João Gabriel do Amaral-
Data de aceite: dc.date.accessioned2024-07-11T18:09:47Z-
Data de disponibilização: dc.date.available2024-07-11T18:09:47Z-
Data de envio: dc.date.issued2022-03-09-
Data de envio: dc.date.issued2022-03-09-
Data de envio: dc.date.issued2022-01-
Fonte completa do material: dc.identifierhttp://app.uff.br/riuff/handle/1/24710-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/764855-
Descrição: dc.descriptionRelatos de acidentes são importante ferramenta para compreensão da causa dos mesmos e como auxílio em sua futura prevenção. A grande quantidade, porém, destes relatos em forma textual e não estruturada impossibilita que de forma simples seja feita uma síntese destes relatos para que os mesmos sejam acompanhados. Utilizando técnicas de processamento de linguagem natural o presente trabalho tem como objetivo construir um framework que possibilite a síntese de dados textuais não estruturados. A metodologia desenvolvida utiliza o algoritmo Word2Vec para capturar as informações presentes no texto de maneira quantitativa na forma de vetores. Aliado a este foi utilizado o algoritmo UMAP que possibilitou a visualização destes vetores em forma de clusteres. A metodologia foi aplicada a base de dados da MSHA (Mine Safety and Health Administration), órgão do Departamento de Trabalho dos Estados Unidos encarregada de armazenar relatos de acidentes em minas de carvão ocorridos no país. Nesta base estão presentes 247.035 relatórios coletados de 1983 à 2019 o que possibilitou observar as diferenças ocorridas ao decorrer das décadas nestes acidentes.-
Descrição: dc.descriptionFatality reports are an important tool for understanding their cause and as an aid in their future prevention. The large number however of these reports in textual and unstructured form makes it impossible to simply summarize these reports so that they can be followed up. Using natural language processing techniques, the present work aims to build a framework that enables the synthesis of unstructured textual data. The methodology developed uses the Word2Vec algorithm to capture the information present in the text quantitatively in the form of vectors. Allied to this, the UMAP algorithm was used, which allowed the visualization of these vectors in the form of clusters. The methodology was applied to the MSHA (Mine Safety and Health Administration) database, an agency of the United States Department of Labor responsible for storing reports of accidents in coal mines that occurred in the country. On this basis, there are 247,035 reports collected from 1983 to 2019, which made it possible to observe the differences that occurred over the decades in these accidents.-
Descrição: dc.description51 p.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Publicador: dc.publisherNiterói-
Direitos: dc.rightsOpen Access-
Direitos: dc.rightsCC-BY-SA-
Palavras-chave: dc.subjectProcessamento de Linguagem Natural-
Palavras-chave: dc.subjectRelatos de Acidentes-
Palavras-chave: dc.subjectWord2Vec-
Palavras-chave: dc.subjectUMAP-
Palavras-chave: dc.subjectAprendizado de máquina-
Palavras-chave: dc.subjectAcidente de trabalho-
Palavras-chave: dc.subjectProcessamento de linguagem natural (Computação)-
Palavras-chave: dc.subjectNatural Language Processing-
Palavras-chave: dc.subjectFataliy Reports-
Palavras-chave: dc.subjectWord2Vec-
Palavras-chave: dc.subjectUMAP-
Título: dc.titleProcessamento de linguagem natural aplicado a relatos de acidentes em minas de carvão-
Tipo de arquivo: dc.typeTrabalho de conclusão de curso-
Aparece nas coleções:Repositório Institucional da Universidade Federal Fluminense - RiUFF

Não existem arquivos associados a este item.