Atenção:
O eduCAPES é um repositório de objetos educacionais, não sendo responsável por materiais de terceiros submetidos na plataforma. O usuário assume ampla e total responsabilidade quanto à originalidade, à titularidade e ao conteúdo, citações de obras consultadas, referências e outros elementos que fazem parte do material que deseja submeter. Recomendamos que se reporte diretamente ao(s) autor(es), indicando qual parte do material foi considerada imprópria (cite página e parágrafo) e justificando sua denúncia.
Caso seja o autor original de algum material publicado indevidamente ou sem autorização, será necessário que se identifique informando nome completo, CPF e data de nascimento. Caso possua uma decisão judicial para retirada do material, solicitamos que informe o link de acesso ao documento, bem como quaisquer dados necessários ao acesso, no campo abaixo.
Todas as denúncias são sigilosas e sua identidade será preservada. Os campos nome e e-mail são de preenchimento opcional. Porém, ao deixar de informar seu e-mail, um possível retorno será inviabilizado e/ou sua denúncia poderá ser desconsiderada no caso de necessitar de informações complementares.
Metadados | Descrição | Idioma |
---|---|---|
Autor(es): dc.contributor | Universidade Estadual Paulista (UNESP) | - |
Autor(es): dc.contributor | Universidade Estadual de Londrina (UEL) | - |
Autor(es): dc.creator | Jesus, Ananda Fernanda de | - |
Autor(es): dc.creator | Triques, Maria Ligia | - |
Autor(es): dc.creator | Segundo, Jose Eduardo Santarem | - |
Autor(es): dc.creator | Albuquerque, Ana Cristina de | - |
Data de aceite: dc.date.accessioned | 2025-08-21T23:02:01Z | - |
Data de disponibilização: dc.date.available | 2025-08-21T23:02:01Z | - |
Data de envio: dc.date.issued | 2023-07-29 | - |
Data de envio: dc.date.issued | 2023-07-29 | - |
Data de envio: dc.date.issued | 2022-12-31 | - |
Fonte completa do material: dc.identifier | http://dx.doi.org/10.26512/rici.v16.n1.2023.47537 | - |
Fonte completa do material: dc.identifier | http://hdl.handle.net/11449/245641 | - |
Fonte: dc.identifier.uri | http://educapes.capes.gov.br/handle/11449/245641 | - |
Descrição: dc.description | Aims to verify the potential of applying Natural Language Processing (NLP) and Machine Learning (ML) techniques in the thematic categorization of scientific articles on the theme cultural heritage from two situations in which categories are established a priori and later. Applied research is developed, with quantitative and qualitative results, where the first corpus consisting of scientific articles in Portuguese, on a thematic basis of Information Science, manually selected and categorized; and the second corpus, composed of scientific articles in English retrieved from the Web of Science, automatically categorized by search strategies and application of Booleans. Both were submitted to two categorization test procedures (supervised and unsupervised algorithm). The results show that in both, the participation of the researcher is essential in defining the representativeness of the chosen sample, and this has an impact on the precision and accuracy of the applied algorithms. The importance of detailing and rigor in the pre-processing of data and sample size is highlighted, however, it is emphasized that, in the case of this study, only a larger volume of data did not guarantee that the results were representative from the point of view of the domain studied, which warns that there are always multidisciplinary discussions and analyzes that allow verifying and readjusting the sample parameters. | - |
Descrição: dc.description | Univ Estadual Paulista, Programa Posgrad Ciencia Informacao, Marilia, SP, Brazil | - |
Descrição: dc.description | Univ Estadual Londrina, Programa Posgrad Ciencia Informacao, Londrina, PR, Brazil | - |
Descrição: dc.description | Univ Estadual Paulista, Programa Posgrad Ciencia Informacao, Marilia, SP, Brazil | - |
Formato: dc.format | 167-184 | - |
Idioma: dc.language | en | - |
Publicador: dc.publisher | Univ Brasilia, Dept Ciencia Informacao | - |
Relação: dc.relation | Revista Ibero-americana De Ciencia Da Informacao | - |
???dc.source???: dc.source | Web of Science | - |
Palavras-chave: dc.subject | Machine learning | - |
Palavras-chave: dc.subject | Natural language processing | - |
Palavras-chave: dc.subject | Neural network algorithm | - |
Palavras-chave: dc.subject | Cultural heritage | - |
Palavras-chave: dc.subject | Hierarchical clustering algorithm | - |
Título: dc.title | Natural language processing and machine learning in the categorization of scientific papers: a study around ?cultural heritage? | - |
Tipo de arquivo: dc.type | livro digital | - |
Aparece nas coleções: | Repositório Institucional - Unesp |
O Portal eduCAPES é oferecido ao usuário, condicionado à aceitação dos termos, condições e avisos contidos aqui e sem modificações. A CAPES poderá modificar o conteúdo ou formato deste site ou acabar com a sua operação ou suas ferramentas a seu critério único e sem aviso prévio. Ao acessar este portal, você, usuário pessoa física ou jurídica, se declara compreender e aceitar as condições aqui estabelecidas, da seguinte forma: