Atenção: Todas as denúncias são sigilosas e sua identidade será preservada.
Os campos nome e e-mail são de preenchimento opcional
Metadados | Descrição | Idioma |
---|---|---|
Autor(es): dc.contributor | Leta, Fabiana Rodrigues | - |
Autor(es): dc.contributor | Pardal, Juan Manuel | - |
Autor(es): dc.contributor | Dias, Daniel Henrique Nogueira | - |
Autor(es): dc.contributor | Clua, Esteban Walter Gonzalez | - |
Autor(es): dc.creator | Méxas, Rodrigo Picinini | - |
Data de aceite: dc.date.accessioned | 2024-07-11T18:15:17Z | - |
Data de disponibilização: dc.date.available | 2024-07-11T18:15:17Z | - |
Data de envio: dc.date.issued | 2021-09-27 | - |
Data de envio: dc.date.issued | 2021-09-27 | - |
Data de envio: dc.date.issued | 2020 | - |
Fonte completa do material: dc.identifier | https://app.uff.br/riuff/handle/1/23361 | - |
Fonte: dc.identifier.uri | http://educapes.capes.gov.br/handle/capes/766783 | - |
Descrição: dc.description | Este projeto visa ao estudo de desempenho de dois algoritmos de aprendizado de máquina por reforço, denominados Proximal Policy Optimization e Soft Actor Critic, na simulação de veleiros autônomos e sua resposta às diferentes direções do vento enquanto desviam de obstáculos detectados por análise de imagens. Também, estuda-se o efeito dos algoritmos de aprendizado por imitação Behavioral Cloning e Generative Adversarial Imitation Learning junto aos primeiros algoritmos citados. Utilizam-se para o desenvolvimento a plataforma Unity® e o toolkit de aprendizado de máquina ML-Agents. A metodologia que guia o projeto pode ser aplicada de forma similar para outros problemas de aprendizado por reforço. Por meio do treinamento do agente é possível comparar os resultados e observar que o Proximal Policy Optimization obtém melhor desempenho dentro dos cenários propostos, tanto com e sem o apoio dos algoritmos de aprendizado de imitação | - |
Descrição: dc.description | This project aims to study the performance of two reinforcement machine learning algorithms, namely the Proximal Policy Optimization and Soft Actor Critic, in the simulation of autonomous sailboats and their response to different wind directions while avoiding obstacles detected by image analysis. Also, the effect of imitation learning algorithms Behavioral Cloning and Generative Adversarial Imitation Learning with the first mentioned algorithms is studied. The Unity® platform and ML-Agents machine learning toolkit are used for development. The methodology that guides the project can be similarly applied to other reinforcement learning problems. Through agent training, it is possible to compare the results and observe that Proximal Policy Optimization obtains better performance within the proposed scenarios, both with and without the support of imitation learning algorithms | - |
Formato: dc.format | application/pdf | - |
Idioma: dc.language | pt_BR | - |
Direitos: dc.rights | Open Access | - |
Direitos: dc.rights | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | - |
Direitos: dc.rights | CC-BY-SA | - |
Palavras-chave: dc.subject | Aprendizado de máquina | - |
Palavras-chave: dc.subject | Aprendizado por reforço | - |
Palavras-chave: dc.subject | Unity | - |
Palavras-chave: dc.subject | ML-Agents | - |
Palavras-chave: dc.subject | PPO | - |
Palavras-chave: dc.subject | SAC | - |
Palavras-chave: dc.subject | BC | - |
Palavras-chave: dc.subject | GAIL | - |
Palavras-chave: dc.subject | Aprendizado por imitação | - |
Palavras-chave: dc.subject | Veleiro autônomo | - |
Palavras-chave: dc.subject | Veículo de superfície não-tripulado | - |
Palavras-chave: dc.subject | Aprendizado de máquina | - |
Palavras-chave: dc.subject | Inteligência artificial | - |
Palavras-chave: dc.subject | Barco à vela | - |
Palavras-chave: dc.subject | Machine learning | - |
Palavras-chave: dc.subject | Reinforcement learning | - |
Palavras-chave: dc.subject | Autonomous sailboat | - |
Palavras-chave: dc.subject | Unmanned surface vehicle | - |
Título: dc.title | Comparação do desempenho de algoritmos de aprendizado de máquina por reforço e por imitação na simulação de veleiros autônomos | - |
Tipo de arquivo: dc.type | Trabalho de conclusão de curso | - |
Aparece nas coleções: | Repositório Institucional da Universidade Federal Fluminense - RiUFF |
O Portal eduCAPES é oferecido ao usuário, condicionado à aceitação dos termos, condições e avisos contidos aqui e sem modificações. A CAPES poderá modificar o conteúdo ou formato deste site ou acabar com a sua operação ou suas ferramentas a seu critério único e sem aviso prévio. Ao acessar este portal, você, usuário pessoa física ou jurídica, se declara compreender e aceitar as condições aqui estabelecidas, da seguinte forma: