
Atenção:
O eduCAPES é um repositório de objetos educacionais, não sendo responsável por materiais de terceiros submetidos na plataforma. O usuário assume ampla e total responsabilidade quanto à originalidade, à titularidade e ao conteúdo, citações de obras consultadas, referências e outros elementos que fazem parte do material que deseja submeter. Recomendamos que se reporte diretamente ao(s) autor(es), indicando qual parte do material foi considerada imprópria (cite página e parágrafo) e justificando sua denúncia.
Caso seja o autor original de algum material publicado indevidamente ou sem autorização, será necessário que se identifique informando nome completo, CPF e data de nascimento. Caso possua uma decisão judicial para retirada do material, solicitamos que informe o link de acesso ao documento, bem como quaisquer dados necessários ao acesso, no campo abaixo.
Todas as denúncias são sigilosas e sua identidade será preservada. Os campos nome e e-mail são de preenchimento opcional. Porém, ao deixar de informar seu e-mail, um possível retorno será inviabilizado e/ou sua denúncia poderá ser desconsiderada no caso de necessitar de informações complementares.
| Metadados | Descrição | Idioma |
|---|---|---|
| Autor(es): dc.contributor | Oliveira, Luiz Eduardo Soares de, 1971- | - |
| Autor(es): dc.contributor | Universidade Federal do Paraná. Setor de Ciências Exatas. Curso de Especialização em Data Science & Big Data | - |
| Autor(es): dc.creator | Noguti, Mariana Yukari, 1987- | - |
| Data de aceite: dc.date.accessioned | 2025-09-01T13:29:37Z | - |
| Data de disponibilização: dc.date.available | 2025-09-01T13:29:37Z | - |
| Data de envio: dc.date.issued | 2022-04-28 | - |
| Data de envio: dc.date.issued | 2022-04-28 | - |
| Data de envio: dc.date.issued | 2019 | - |
| Fonte completa do material: dc.identifier | https://hdl.handle.net/1884/75335 | - |
| Fonte: dc.identifier.uri | http://educapes.capes.gov.br/handle/1884/75335 | - |
| Descrição: dc.description | Orientador: Prof. Luiz Eduardo Soares Oliveira | - |
| Descrição: dc.description | Monografia (especialização) - Universidade Federal do Paraná, Setor de Ciências Exatas, Curso de Especialização em Data Science & Big Data. | - |
| Descrição: dc.description | Inclui referências | - |
| Descrição: dc.description | Resumo: Observa-se nos últimos anos um crescimento no volume de pesquisas relativas a Processamento de Linguagem Natural (PLN). A utilização de redes neurais convolucionais e recorrentes em conjunto com técnicas de vetorização de palavras vem apresentando resultados promissores quando aplicadas a problemas de classificação textual, como análise de sentimentos e segmentação de documentos em tópicos. Neste artigo propõe-se o uso de técnicas de PLN na categorização de textos curtos, com o objetivo de classificar as descrições dos atendimentos realizados pelo Ministério Público do Paraná à população em uma das áreas de atuação da instituição. Buscou-se elaborar um modelo capaz de automatizar a rotulação dos atendimentos, reduzindo o tempo gasto com a seleção do atributo e a validação do cadastro, possibilitando a alocação de funcionários em demandas mais complexas. Foram utilizados métodos de extração de características textuais a partir de matrizes termo-documento e representações vetoriais. Na etapa classificatória foram apresentadas as performances obtidas por diferentes classificadores, dentre eles modelos lineares e ensembles, bem como algumas arquiteturas de redes neurais. Ao final, observou-se que o melhor resultado foi obtido através da representação vetorial de palavras com Wang2Vec associada à rede neural recorrente GRU, atingindo uma acurácia de 93% e F1-Score de 87,4% na classificação de doze categorias | - |
| Descrição: dc.description | Abstract: In recent years, there has been an increase in the volume of research related to Natural Language Processing (NLP). The use of convolutional and recurrent neural networks together with word embedding techniques has presented promising results when applied to textual classification problems, such as sentiment analysis and topic segmentation of documents. This paper proposes the use of NLP techniques for categorization of short texts, with the purpose of classifying the descriptions of the services performed by the Public Prosecutor of Paraná to the population in one of the institution’s areas of activity. It was intended to elaborate a model capable of automating the labeling of the attendances, reducing the time spent selecting the attribute and validating the register, allowing the allocation of employees in more complex demands. Methods of feature extraction from texts were compared by using document-term matrices and vector representations. In the classificatory stage were presented the performances obtained by different classifiers, among them linear models and ensembles, as well as some neural networks architectures. At the end, it was observed that the best result was obtained through vector representation of words with Wang2Vec associated with the GRU recurrent neural network, reaching an accuracy of 93% and F1-Score of 87.4% in the classification of twelve categories. | - |
| Formato: dc.format | 1 recurso online : PDF. | - |
| Formato: dc.format | application/pdf | - |
| Formato: dc.format | application/pdf | - |
| Palavras-chave: dc.subject | Processamento da linguagem natural (Computação) | - |
| Palavras-chave: dc.subject | Redes neurais (Computação) | - |
| Título: dc.title | Aplicação de técnicas de classificação textual na predição de áreas de atuação do Ministério Público | - |
| Aparece nas coleções: | Repositório Institucional - Rede Paraná Acervo | |
O Portal eduCAPES é oferecido ao usuário, condicionado à aceitação dos termos, condições e avisos contidos aqui e sem modificações. A CAPES poderá modificar o conteúdo ou formato deste site ou acabar com a sua operação ou suas ferramentas a seu critério único e sem aviso prévio. Ao acessar este portal, você, usuário pessoa física ou jurídica, se declara compreender e aceitar as condições aqui estabelecidas, da seguinte forma: