Atenção: Todas as denúncias são sigilosas e sua identidade será preservada.
Os campos nome e e-mail são de preenchimento opcional
Metadados | Descrição | Idioma |
---|---|---|
Autor(es): dc.contributor | Assef, Amauri Amorin | - |
Autor(es): dc.contributor | Assef, Amauri Amorin | - |
Autor(es): dc.contributor | Brante, Glauber Gomes de Oliveira | - |
Autor(es): dc.contributor | Frencl, Victor Baptista | - |
Autor(es): dc.creator | Acuña, Daniel Grimm | - |
Autor(es): dc.creator | Luz, Henrique Santos da | - |
Autor(es): dc.creator | Klein, Lucas Jurgen | - |
Data de aceite: dc.date.accessioned | 2022-02-21T22:26:17Z | - |
Data de disponibilização: dc.date.available | 2022-02-21T22:26:17Z | - |
Data de envio: dc.date.issued | 2020-11-10 | - |
Data de envio: dc.date.issued | 2020-11-10 | - |
Data de envio: dc.date.issued | 2019-07-09 | - |
Fonte completa do material: dc.identifier | http://repositorio.utfpr.edu.br/jspui/handle/1/8198 | - |
Fonte: dc.identifier.uri | http://educapes.capes.gov.br/handle/capes/675104 | - |
Descrição: dc.description | This work addresses an exploratory research on the applicability of reinforcement learning algorithms (RLA) in an inverted pendulum system, a classic problem of an unstable open loop system. The research carried out, addressed the study and application of some specific algorithms such as Q-Learning and Deep-Q-Networks. The work presents a theoretical research of the algorithms until the software implementation of the same ones. In a second step, a physical prototype of the pendulum system was built, in which stochastic filters were used in order to enhance the sensor reading quality, leaving open a possibility of continuity of the development for future works. | - |
Descrição: dc.description | Este trabalho aborda uma pesquisa exploratória sobre a aplicabilidade de algoritmos de aprendizado por reforço (APR) em um sistema de pêndulo invertido, sendo este um problema clássico de um sistema instável em malha aberta. A pesquisa realizada abordou o estudo e aplicação de algoritmos especificos: Q-Learning e Deep-Q-Network. O trabalho apresenta desde a pesquisa teórica dos algoritmos até a implementação em software dos mesmos. Em uma segunda etapa, desenvolveu-se um protótipo físico do sistema de pêndulo, no qual se empregou o uso de filtros estocásticos para a melhora na qualidade de leitura dos sensores, deixando em aberto a possibilidade de continuidade do desenvolvimento do protótipo em trabalhos futuros. | - |
Formato: dc.format | application/pdf | - |
Idioma: dc.language | pt_BR | - |
Publicador: dc.publisher | Universidade Tecnológica Federal do Paraná | - |
Publicador: dc.publisher | Curitiba | - |
Publicador: dc.publisher | Brasil | - |
Publicador: dc.publisher | Engenharia de Controle e Automação | - |
Publicador: dc.publisher | UTFPR | - |
Direitos: dc.rights | openAccess | - |
Palavras-chave: dc.subject | Algoritmos | - |
Palavras-chave: dc.subject | Controle automático | - |
Palavras-chave: dc.subject | Kalman, Filtragem de | - |
Palavras-chave: dc.subject | Markov, Processos de | - |
Palavras-chave: dc.subject | Aprendizado por reforço | - |
Palavras-chave: dc.subject | Algorithms | - |
Palavras-chave: dc.subject | Automatic control | - |
Palavras-chave: dc.subject | Kalman filtering | - |
Palavras-chave: dc.subject | Markov processes | - |
Palavras-chave: dc.subject | Reinforcement learning | - |
Palavras-chave: dc.subject | CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::MEDIDAS ELETRICAS, MAGNETICAS E ELETRONICAS INSTRUMENTACAO::SISTEMAS ELETRONICOS DE MEDIDA E DE CONTROLE | - |
Título: dc.title | Estudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido | - |
Título: dc.title | Reinforcement learning algorithms applicability study on an inverted pendulum | - |
Tipo de arquivo: dc.type | livro digital | - |
Aparece nas coleções: | Repositorio Institucional da UTFPR - RIUT |
O Portal eduCAPES é oferecido ao usuário, condicionado à aceitação dos termos, condições e avisos contidos aqui e sem modificações. A CAPES poderá modificar o conteúdo ou formato deste site ou acabar com a sua operação ou suas ferramentas a seu critério único e sem aviso prévio. Ao acessar este portal, você, usuário pessoa física ou jurídica, se declara compreender e aceitar as condições aqui estabelecidas, da seguinte forma: