Categorização automática de conjuntos de dados de portais de dados abertos utilizando aprendizado de máquina supervisionado

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorMonteiro, Rodrigo Salvador-
Autor(es): dc.contributorBernardini, Flavia Cristina-
Autor(es): dc.contributorRangel, Elaine Seixas-
Autor(es): dc.creatorRangel, Mateus de Moraes-
Data de aceite: dc.date.accessioned2024-07-11T18:33:25Z-
Data de disponibilização: dc.date.available2024-07-11T18:33:25Z-
Data de envio: dc.date.issued2020-03-12-
Data de envio: dc.date.issued2020-03-12-
Data de envio: dc.date.issued2019-
Fonte completa do material: dc.identifierhttps://app.uff.br/riuff/handle/1/13072-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/772837-
Descrição: dc.descriptionPara disponibilizar seus dados para a sociedade, governos de cidades ao redor do mundo estão usando portais de dados abertos. Na maioria dos portais, os conjuntos de dados estão distribuídos por categorias que representam os tópicos abordados pelo portal. Nesse contexto, oferecer mecanismos para auxiliar a categorização dos conjuntos de dados se torna importante, para facilitar o trabalho de um administrador de portais de dados abertos. Neste trabalho, apresentamos uma metodologia para a categorização automática de conjuntos de dados de portais de dados abertos. Em nossa metodologia, utilizamos o nome do conjunto de dados e os seus atributos de arquivos anexados para a inferência de sua categoria, fazendo uso de técnicas de processamento de linguagem natural e aprendizado de máquina supervisionado-
Descrição: dc.descriptionTo make their data available to society, city governments around the world are using open data portals. In most portals, datasets are broken down into categories that represent the topics covered by the portal. In this context, providing mechanisms to help categorize datasets becomes important to facilitate the work of an open data portal administrator. In this paper, we present a methodology for the automatic categorization of data sets from open data portals. In our methodology, we use the dataset name and its attached file attributes to infer its category, making use of natural language processing techniques and supervised machine learning-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Direitos: dc.rightsopenAccess-
Direitos: dc.rightsCC-BY-SA-
Palavras-chave: dc.subjectProcessamento de linguagem natural-
Palavras-chave: dc.subjectDados abertos-
Palavras-chave: dc.subjectAprendizado de máquina supervisionado-
Palavras-chave: dc.subjectAprendizado de máquina-
Palavras-chave: dc.subjectBase de dados-
Palavras-chave: dc.subjectProcessamento de linguagem natural (Computação)-
Palavras-chave: dc.subjectNatural language processing-
Palavras-chave: dc.subjectOpen Data-
Palavras-chave: dc.subjectSupervised machine learning-
Título: dc.titleCategorização automática de conjuntos de dados de portais de dados abertos utilizando aprendizado de máquina supervisionado-
Tipo de arquivo: dc.typeTrabalho de conclusão de curso-
Aparece nas coleções:Repositório Institucional da Universidade Federal Fluminense - RiUFF

Não existem arquivos associados a este item.