Atenção: Todas as denúncias são sigilosas e sua identidade será preservada.
Os campos nome e e-mail são de preenchimento opcional
Metadados | Descrição | Idioma |
---|---|---|
Autor(es): dc.contributor | Pereira, Valdecy | - |
Autor(es): dc.contributor | Neves, Julio César Bispo | - |
Autor(es): dc.contributor | Roboredo, Marcos Costa | - |
Autor(es): dc.contributor | Pereira, Valdecy | - |
Autor(es): dc.contributor | Neves , Júlio César Bispo | - |
Autor(es): dc.contributor | Roboredo, Marcos Costa | - |
Autor(es): dc.creator | Pereira, João Gabriel do Amaral | - |
Data de aceite: dc.date.accessioned | 2024-07-11T18:09:47Z | - |
Data de disponibilização: dc.date.available | 2024-07-11T18:09:47Z | - |
Data de envio: dc.date.issued | 2022-03-09 | - |
Data de envio: dc.date.issued | 2022-03-09 | - |
Data de envio: dc.date.issued | 2022-01 | - |
Fonte completa do material: dc.identifier | http://app.uff.br/riuff/handle/1/24710 | - |
Fonte: dc.identifier.uri | http://educapes.capes.gov.br/handle/capes/764855 | - |
Descrição: dc.description | Relatos de acidentes são importante ferramenta para compreensão da causa dos mesmos e como auxílio em sua futura prevenção. A grande quantidade, porém, destes relatos em forma textual e não estruturada impossibilita que de forma simples seja feita uma síntese destes relatos para que os mesmos sejam acompanhados. Utilizando técnicas de processamento de linguagem natural o presente trabalho tem como objetivo construir um framework que possibilite a síntese de dados textuais não estruturados. A metodologia desenvolvida utiliza o algoritmo Word2Vec para capturar as informações presentes no texto de maneira quantitativa na forma de vetores. Aliado a este foi utilizado o algoritmo UMAP que possibilitou a visualização destes vetores em forma de clusteres. A metodologia foi aplicada a base de dados da MSHA (Mine Safety and Health Administration), órgão do Departamento de Trabalho dos Estados Unidos encarregada de armazenar relatos de acidentes em minas de carvão ocorridos no país. Nesta base estão presentes 247.035 relatórios coletados de 1983 à 2019 o que possibilitou observar as diferenças ocorridas ao decorrer das décadas nestes acidentes. | - |
Descrição: dc.description | Fatality reports are an important tool for understanding their cause and as an aid in their future prevention. The large number however of these reports in textual and unstructured form makes it impossible to simply summarize these reports so that they can be followed up. Using natural language processing techniques, the present work aims to build a framework that enables the synthesis of unstructured textual data. The methodology developed uses the Word2Vec algorithm to capture the information present in the text quantitatively in the form of vectors. Allied to this, the UMAP algorithm was used, which allowed the visualization of these vectors in the form of clusters. The methodology was applied to the MSHA (Mine Safety and Health Administration) database, an agency of the United States Department of Labor responsible for storing reports of accidents in coal mines that occurred in the country. On this basis, there are 247,035 reports collected from 1983 to 2019, which made it possible to observe the differences that occurred over the decades in these accidents. | - |
Descrição: dc.description | 51 p. | - |
Formato: dc.format | application/pdf | - |
Idioma: dc.language | pt_BR | - |
Publicador: dc.publisher | Niterói | - |
Direitos: dc.rights | Open Access | - |
Direitos: dc.rights | CC-BY-SA | - |
Palavras-chave: dc.subject | Processamento de Linguagem Natural | - |
Palavras-chave: dc.subject | Relatos de Acidentes | - |
Palavras-chave: dc.subject | Word2Vec | - |
Palavras-chave: dc.subject | UMAP | - |
Palavras-chave: dc.subject | Aprendizado de máquina | - |
Palavras-chave: dc.subject | Acidente de trabalho | - |
Palavras-chave: dc.subject | Processamento de linguagem natural (Computação) | - |
Palavras-chave: dc.subject | Natural Language Processing | - |
Palavras-chave: dc.subject | Fataliy Reports | - |
Palavras-chave: dc.subject | Word2Vec | - |
Palavras-chave: dc.subject | UMAP | - |
Título: dc.title | Processamento de linguagem natural aplicado a relatos de acidentes em minas de carvão | - |
Tipo de arquivo: dc.type | Trabalho de conclusão de curso | - |
Aparece nas coleções: | Repositório Institucional da Universidade Federal Fluminense - RiUFF |
O Portal eduCAPES é oferecido ao usuário, condicionado à aceitação dos termos, condições e avisos contidos aqui e sem modificações. A CAPES poderá modificar o conteúdo ou formato deste site ou acabar com a sua operação ou suas ferramentas a seu critério único e sem aviso prévio. Ao acessar este portal, você, usuário pessoa física ou jurídica, se declara compreender e aceitar as condições aqui estabelecidas, da seguinte forma: