Estudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorAssef, Amauri Amorin-
Autor(es): dc.contributorAssef, Amauri Amorin-
Autor(es): dc.contributorBrante, Glauber Gomes de Oliveira-
Autor(es): dc.contributorFrencl, Victor Baptista-
Autor(es): dc.creatorAcuña, Daniel Grimm-
Autor(es): dc.creatorLuz, Henrique Santos da-
Autor(es): dc.creatorKlein, Lucas Jurgen-
Data de aceite: dc.date.accessioned2022-02-21T22:26:17Z-
Data de disponibilização: dc.date.available2022-02-21T22:26:17Z-
Data de envio: dc.date.issued2020-11-10-
Data de envio: dc.date.issued2020-11-10-
Data de envio: dc.date.issued2019-07-09-
Fonte completa do material: dc.identifierhttp://repositorio.utfpr.edu.br/jspui/handle/1/8198-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/675104-
Descrição: dc.descriptionThis work addresses an exploratory research on the applicability of reinforcement learning algorithms (RLA) in an inverted pendulum system, a classic problem of an unstable open loop system. The research carried out, addressed the study and application of some specific algorithms such as Q-Learning and Deep-Q-Networks. The work presents a theoretical research of the algorithms until the software implementation of the same ones. In a second step, a physical prototype of the pendulum system was built, in which stochastic filters were used in order to enhance the sensor reading quality, leaving open a possibility of continuity of the development for future works.-
Descrição: dc.descriptionEste trabalho aborda uma pesquisa exploratória sobre a aplicabilidade de algoritmos de aprendizado por reforço (APR) em um sistema de pêndulo invertido, sendo este um problema clássico de um sistema instável em malha aberta. A pesquisa realizada abordou o estudo e aplicação de algoritmos especificos: Q-Learning e Deep-Q-Network. O trabalho apresenta desde a pesquisa teórica dos algoritmos até a implementação em software dos mesmos. Em uma segunda etapa, desenvolveu-se um protótipo físico do sistema de pêndulo, no qual se empregou o uso de filtros estocásticos para a melhora na qualidade de leitura dos sensores, deixando em aberto a possibilidade de continuidade do desenvolvimento do protótipo em trabalhos futuros.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Publicador: dc.publisherUniversidade Tecnológica Federal do Paraná-
Publicador: dc.publisherCuritiba-
Publicador: dc.publisherBrasil-
Publicador: dc.publisherEngenharia de Controle e Automação-
Publicador: dc.publisherUTFPR-
Direitos: dc.rightsopenAccess-
Palavras-chave: dc.subjectAlgoritmos-
Palavras-chave: dc.subjectControle automático-
Palavras-chave: dc.subjectKalman, Filtragem de-
Palavras-chave: dc.subjectMarkov, Processos de-
Palavras-chave: dc.subjectAprendizado por reforço-
Palavras-chave: dc.subjectAlgorithms-
Palavras-chave: dc.subjectAutomatic control-
Palavras-chave: dc.subjectKalman filtering-
Palavras-chave: dc.subjectMarkov processes-
Palavras-chave: dc.subjectReinforcement learning-
Palavras-chave: dc.subjectCNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::MEDIDAS ELETRICAS, MAGNETICAS E ELETRONICAS INSTRUMENTACAO::SISTEMAS ELETRONICOS DE MEDIDA E DE CONTROLE-
Título: dc.titleEstudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido-
Título: dc.titleReinforcement learning algorithms applicability study on an inverted pendulum-
Tipo de arquivo: dc.typelivro digital-
Aparece nas coleções:Repositorio Institucional da UTFPR - RIUT

Não existem arquivos associados a este item.