Controle de espessadores contínuos convencionais via otimização por política proximal.

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorBraga, Marcio Feliciano-
Autor(es): dc.contributorEuzebio, Thiago Antonio Melo-
Autor(es): dc.contributorBraga, Marcio Feliciano-
Autor(es): dc.contributorEuzebio, Thiago Antonio Melo-
Autor(es): dc.contributorEras Herrera, Wendy Yadira-
Autor(es): dc.contributorLacerda, Márcio Júnior-
Autor(es): dc.creatorSilva, Jonathan Ribeiro-
Data de aceite: dc.date.accessioned2025-08-21T15:09:40Z-
Data de disponibilização: dc.date.available2025-08-21T15:09:40Z-
Data de envio: dc.date.issued2025-02-24-
Data de envio: dc.date.issued2022-
Fonte completa do material: dc.identifierhttps://www.repositorio.ufop.br/handle/123456789/19781-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/1003911-
Descrição: dc.descriptionPrograma de Pós-Graduação em Instrumentação, Controle e Automação de Processos de Mineração. Departamento de Engenharia de Controle e Automação, Escola de Minas, Universidade Federal de Ouro Preto.-
Descrição: dc.descriptionA aprendizagem por reforço e uma técnica de aprendizagem de máquina que vem sendo aplicada com grande sucesso, principalmente no contexto de jogos eletrónicos e robótica, sendo capaz de superar a capacidade humana. Apesar de seu grande potencial de aplicação nas mais diversas áreas, ainda é escasso o estudo voltado para o controle de processos. O objetivo deste trabalho é aplicar a aprendizagem por reforço, por meio do algoritmo de otimização de política proximal (PPO) em um modelo simulado de um espessador convencional, responsável pela separação sólido-líquido na mineração. O algoritmo desenvolvido atuará no controle da concentração de sólidos na saída e da altura da interface de sedimentos a partir da vazão de saída e da dosagem de floculantes. Foi possível controlar o processo por meio do PPO, porém, seu desempenho se mostrou inferior ao de técnicas de controle convencionais, a não ser no uso mais eficiente de floculante e na imunidade a distúrbios. Conclui-se que há uma necessidade de maior estudo da parametrização dos algoritmos de aprendizagem por reforço de forma a facilitar os ajustes e fazer melhor proveito de sua capacidade de abstração e generalização.-
Descrição: dc.descriptionReinforcement learning is a machine learning technique that has been applied with great suc- cess, mainly in the context of electronic games and robotics, where it has been able to surpass human capacity and the performance of conventional techniques. Despite its great potential for application in the most diverse areas, studies focused on process control are still scarce. The ob- jective of this work is to apply reinforcement learning, through the proximal policy optimization algorithm (PPO), in a simulated model of a conventional thickener, responsible for solid-liquid separation in mining. The algorithm developed will control the underflow solid volume fraction and the sediment level based on the underflow and the flocculant dosage. The simulations show that it is possible to use reinforcement learning to control the thickener process. However, the performance of PPO does not surpass conventional control techniques, except for more effi- cient use of flocculant and immunity to disturbances. It is concluded that there is a need for further study of the parameterization of reinforcement learning algorithms in order to facilitate adjustments and make better use of their abstraction and generalization capacity.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Direitos: dc.rightsaberto-
Direitos: dc.rightsAttribution 3.0 United States-
Direitos: dc.rightshttp://creativecommons.org/licenses/by/3.0/us/-
Direitos: dc.rightsAutorização concedida ao Repositório Institucional da UFOP pelo(a) autor(a) em 21/12/2023 com as seguintes condições: disponível sob Licença Creative Commons 4.0 que permite copiar, distribuir e transmitir o trabalho, desde que sejam citados o autor e o licenciante.-
Palavras-chave: dc.subjectAprendizado do computador - aprendizado por reforço-
Palavras-chave: dc.subjectSistemas de controle - espessadores-
Título: dc.titleControle de espessadores contínuos convencionais via otimização por política proximal.-
Tipo de arquivo: dc.typelivro digital-
Aparece nas coleções:Repositório Institucional - UFOP

Não existem arquivos associados a este item.