Atenção:
O eduCAPES é um repositório de objetos educacionais, não sendo responsável por materiais de terceiros submetidos na plataforma. O usuário assume ampla e total responsabilidade quanto à originalidade, à titularidade e ao conteúdo, citações de obras consultadas, referências e outros elementos que fazem parte do material que deseja submeter. Recomendamos que se reporte diretamente ao(s) autor(es), indicando qual parte do material foi considerada imprópria (cite página e parágrafo) e justificando sua denúncia.
Caso seja o autor original de algum material publicado indevidamente ou sem autorização, será necessário que se identifique informando nome completo, CPF e data de nascimento. Caso possua uma decisão judicial para retirada do material, solicitamos que informe o link de acesso ao documento, bem como quaisquer dados necessários ao acesso, no campo abaixo.
Todas as denúncias são sigilosas e sua identidade será preservada. Os campos nome e e-mail são de preenchimento opcional. Porém, ao deixar de informar seu e-mail, um possível retorno será inviabilizado e/ou sua denúncia poderá ser desconsiderada no caso de necessitar de informações complementares.
Metadados | Descrição | Idioma |
---|---|---|
Autor(es): dc.contributor | Leta, Fabiana Rodrigues | - |
Autor(es): dc.contributor | Pardal, Juan Manuel | - |
Autor(es): dc.contributor | Dias, Daniel Henrique Nogueira | - |
Autor(es): dc.contributor | Clua, Esteban Walter Gonzalez | - |
Autor(es): dc.creator | Méxas, Rodrigo Picinini | - |
Data de aceite: dc.date.accessioned | 2024-07-11T18:15:17Z | - |
Data de disponibilização: dc.date.available | 2024-07-11T18:15:17Z | - |
Data de envio: dc.date.issued | 2021-09-27 | - |
Data de envio: dc.date.issued | 2021-09-27 | - |
Data de envio: dc.date.issued | 2020 | - |
Fonte completa do material: dc.identifier | https://app.uff.br/riuff/handle/1/23361 | - |
Fonte: dc.identifier.uri | http://educapes.capes.gov.br/handle/capes/766783 | - |
Descrição: dc.description | Este projeto visa ao estudo de desempenho de dois algoritmos de aprendizado de máquina por reforço, denominados Proximal Policy Optimization e Soft Actor Critic, na simulação de veleiros autônomos e sua resposta às diferentes direções do vento enquanto desviam de obstáculos detectados por análise de imagens. Também, estuda-se o efeito dos algoritmos de aprendizado por imitação Behavioral Cloning e Generative Adversarial Imitation Learning junto aos primeiros algoritmos citados. Utilizam-se para o desenvolvimento a plataforma Unity® e o toolkit de aprendizado de máquina ML-Agents. A metodologia que guia o projeto pode ser aplicada de forma similar para outros problemas de aprendizado por reforço. Por meio do treinamento do agente é possível comparar os resultados e observar que o Proximal Policy Optimization obtém melhor desempenho dentro dos cenários propostos, tanto com e sem o apoio dos algoritmos de aprendizado de imitação | - |
Descrição: dc.description | This project aims to study the performance of two reinforcement machine learning algorithms, namely the Proximal Policy Optimization and Soft Actor Critic, in the simulation of autonomous sailboats and their response to different wind directions while avoiding obstacles detected by image analysis. Also, the effect of imitation learning algorithms Behavioral Cloning and Generative Adversarial Imitation Learning with the first mentioned algorithms is studied. The Unity® platform and ML-Agents machine learning toolkit are used for development. The methodology that guides the project can be similarly applied to other reinforcement learning problems. Through agent training, it is possible to compare the results and observe that Proximal Policy Optimization obtains better performance within the proposed scenarios, both with and without the support of imitation learning algorithms | - |
Formato: dc.format | application/pdf | - |
Idioma: dc.language | pt_BR | - |
Direitos: dc.rights | Open Access | - |
Direitos: dc.rights | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | - |
Direitos: dc.rights | CC-BY-SA | - |
Palavras-chave: dc.subject | Aprendizado de máquina | - |
Palavras-chave: dc.subject | Aprendizado por reforço | - |
Palavras-chave: dc.subject | Unity | - |
Palavras-chave: dc.subject | ML-Agents | - |
Palavras-chave: dc.subject | PPO | - |
Palavras-chave: dc.subject | SAC | - |
Palavras-chave: dc.subject | BC | - |
Palavras-chave: dc.subject | GAIL | - |
Palavras-chave: dc.subject | Aprendizado por imitação | - |
Palavras-chave: dc.subject | Veleiro autônomo | - |
Palavras-chave: dc.subject | Veículo de superfície não-tripulado | - |
Palavras-chave: dc.subject | Aprendizado de máquina | - |
Palavras-chave: dc.subject | Inteligência artificial | - |
Palavras-chave: dc.subject | Barco à vela | - |
Palavras-chave: dc.subject | Machine learning | - |
Palavras-chave: dc.subject | Reinforcement learning | - |
Palavras-chave: dc.subject | Autonomous sailboat | - |
Palavras-chave: dc.subject | Unmanned surface vehicle | - |
Título: dc.title | Comparação do desempenho de algoritmos de aprendizado de máquina por reforço e por imitação na simulação de veleiros autônomos | - |
Tipo de arquivo: dc.type | Trabalho de conclusão de curso | - |
Aparece nas coleções: | Repositório Institucional da Universidade Federal Fluminense - RiUFF |
O Portal eduCAPES é oferecido ao usuário, condicionado à aceitação dos termos, condições e avisos contidos aqui e sem modificações. A CAPES poderá modificar o conteúdo ou formato deste site ou acabar com a sua operação ou suas ferramentas a seu critério único e sem aviso prévio. Ao acessar este portal, você, usuário pessoa física ou jurídica, se declara compreender e aceitar as condições aqui estabelecidas, da seguinte forma: