O aprendizado por reforço no alphazero: uma forma para alcançar algoritmos tabula rasa

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorMoratori, Patrick-
Autor(es): dc.contributorKohwalter, Troy Costa-
Autor(es): dc.contributorClua, Esteban Walter Gonzalez-
Autor(es): dc.creatorKomaki, Eduardo Takeo-
Data de aceite: dc.date.accessioned2024-07-11T17:26:55Z-
Data de disponibilização: dc.date.available2024-07-11T17:26:55Z-
Data de envio: dc.date.issued2023-09-29-
Data de envio: dc.date.issued2023-09-29-
Fonte completa do material: dc.identifierhttp://app.uff.br/riuff/handle/1/30671-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/750495-
Descrição: dc.descriptionEm 2018 foram publicados os resultados de um novo programa chamado AlphaZero que apresentou resultados surpreendentes em 3 diferentes jogos e adquiriu esta competência como tabula rasa, ou seja, foram capazes de aprender de forma autônoma, sem orientação prévia de especialistas. Este estudo objetivou compreender o funcionamento da nova abordagem de aprendizado por reforço (reinforcement learning – RL) empregada neste artefato, com vistas a identificar formas de auxiliar no aperfeiçoamento do aprendizado de máquina (machine learning - ML) e seus algoritmos tabula rasa. Para consecução deste desígnio foram descritas a evolução do aprendizado profundo (deep learning – DL) e do aprendizado por reforço (reinforcement learning – RL) dentro do contexto do aprendizado de máquina (machine learning - ML). Ademais, foi também descrito o funcionamento do AlphaZero dentro da conjuntura de sua própria evolução e de algoritmos congêneres. Além disso, foram apontados os aspectos que permitiram que este artefato obtivesse sua performance quase sem concurso de ajuda humana. Para tanto, foi utilizado como método para angariar subsídios a pesquisa bibliográfica e de artigos científicos contemporâneos àquele dispositivo. De modo geral, neste estudo, foi exequível constatar aspectos que permitiram a estratégia de aprendizagem do AlphaZero fosse efetiva na obtenção de resultados auspiciosos nos desafios propostos e realizou isto sem ajuda humana. Outrossim, é importante dizer que as mesmas abordagens identificadas podem ser replicáveis a outros contextos e domínios. Destaque-se ainda que esta monografia pretende ser um auxílio na compreensão dos mecanismos que permitiram os promissores desfechos do mencionado dispositivo. Ao longo do presente manuscrito e através da compreensão da estratégia de aprendizado por reforço (reinforcement learning – RL) daquele artefato, foi possível apontar os aspectos que permitiram a alta performance e a aquisição da expertise como tabula rasa. Espera-se que o presente esforço sirva de incentivo para outras iniciativas de aclarar melhor tão instigante área do conhecimento-
Descrição: dc.description85 p.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Direitos: dc.rightsOpen Access-
Direitos: dc.rightsCC-BY-SA-
Palavras-chave: dc.subjectAlphaZero-
Palavras-chave: dc.subjectAprendizado por reforço-
Palavras-chave: dc.subjectTabula rasa-
Palavras-chave: dc.subjectAprendizado de máquina-
Palavras-chave: dc.subjectAlgoritmos tabula rasa-
Palavras-chave: dc.subjectInteligência artificial-
Título: dc.titleO aprendizado por reforço no alphazero: uma forma para alcançar algoritmos tabula rasa-
Tipo de arquivo: dc.typeTrabalho de conclusão de curso-
Aparece nas coleções:Repositório Institucional da Universidade Federal Fluminense - RiUFF

Não existem arquivos associados a este item.