Atenção:
O eduCAPES é um repositório de objetos educacionais, não sendo responsável por materiais de terceiros submetidos na plataforma. O usuário assume ampla e total responsabilidade quanto à originalidade, à titularidade e ao conteúdo, citações de obras consultadas, referências e outros elementos que fazem parte do material que deseja submeter. Recomendamos que se reporte diretamente ao(s) autor(es), indicando qual parte do material foi considerada imprópria (cite página e parágrafo) e justificando sua denúncia.
Caso seja o autor original de algum material publicado indevidamente ou sem autorização, será necessário que se identifique informando nome completo, CPF e data de nascimento. Caso possua uma decisão judicial para retirada do material, solicitamos que informe o link de acesso ao documento, bem como quaisquer dados necessários ao acesso, no campo abaixo.
Todas as denúncias são sigilosas e sua identidade será preservada. Os campos nome e e-mail são de preenchimento opcional. Porém, ao deixar de informar seu e-mail, um possível retorno será inviabilizado e/ou sua denúncia poderá ser desconsiderada no caso de necessitar de informações complementares.
Metadados | Descrição | Idioma |
---|---|---|
Autor(es): dc.contributor | Moratori, Patrick | - |
Autor(es): dc.contributor | Kohwalter, Troy Costa | - |
Autor(es): dc.contributor | Clua, Esteban Walter Gonzalez | - |
Autor(es): dc.creator | Komaki, Eduardo Takeo | - |
Data de aceite: dc.date.accessioned | 2024-07-11T17:26:55Z | - |
Data de disponibilização: dc.date.available | 2024-07-11T17:26:55Z | - |
Data de envio: dc.date.issued | 2023-09-29 | - |
Data de envio: dc.date.issued | 2023-09-29 | - |
Fonte completa do material: dc.identifier | http://app.uff.br/riuff/handle/1/30671 | - |
Fonte: dc.identifier.uri | http://educapes.capes.gov.br/handle/capes/750495 | - |
Descrição: dc.description | Em 2018 foram publicados os resultados de um novo programa chamado AlphaZero que apresentou resultados surpreendentes em 3 diferentes jogos e adquiriu esta competência como tabula rasa, ou seja, foram capazes de aprender de forma autônoma, sem orientação prévia de especialistas. Este estudo objetivou compreender o funcionamento da nova abordagem de aprendizado por reforço (reinforcement learning – RL) empregada neste artefato, com vistas a identificar formas de auxiliar no aperfeiçoamento do aprendizado de máquina (machine learning - ML) e seus algoritmos tabula rasa. Para consecução deste desígnio foram descritas a evolução do aprendizado profundo (deep learning – DL) e do aprendizado por reforço (reinforcement learning – RL) dentro do contexto do aprendizado de máquina (machine learning - ML). Ademais, foi também descrito o funcionamento do AlphaZero dentro da conjuntura de sua própria evolução e de algoritmos congêneres. Além disso, foram apontados os aspectos que permitiram que este artefato obtivesse sua performance quase sem concurso de ajuda humana. Para tanto, foi utilizado como método para angariar subsídios a pesquisa bibliográfica e de artigos científicos contemporâneos àquele dispositivo. De modo geral, neste estudo, foi exequível constatar aspectos que permitiram a estratégia de aprendizagem do AlphaZero fosse efetiva na obtenção de resultados auspiciosos nos desafios propostos e realizou isto sem ajuda humana. Outrossim, é importante dizer que as mesmas abordagens identificadas podem ser replicáveis a outros contextos e domínios. Destaque-se ainda que esta monografia pretende ser um auxílio na compreensão dos mecanismos que permitiram os promissores desfechos do mencionado dispositivo. Ao longo do presente manuscrito e através da compreensão da estratégia de aprendizado por reforço (reinforcement learning – RL) daquele artefato, foi possível apontar os aspectos que permitiram a alta performance e a aquisição da expertise como tabula rasa. Espera-se que o presente esforço sirva de incentivo para outras iniciativas de aclarar melhor tão instigante área do conhecimento | - |
Descrição: dc.description | 85 p. | - |
Formato: dc.format | application/pdf | - |
Idioma: dc.language | pt_BR | - |
Direitos: dc.rights | Open Access | - |
Direitos: dc.rights | CC-BY-SA | - |
Palavras-chave: dc.subject | AlphaZero | - |
Palavras-chave: dc.subject | Aprendizado por reforço | - |
Palavras-chave: dc.subject | Tabula rasa | - |
Palavras-chave: dc.subject | Aprendizado de máquina | - |
Palavras-chave: dc.subject | Algoritmos tabula rasa | - |
Palavras-chave: dc.subject | Inteligência artificial | - |
Título: dc.title | O aprendizado por reforço no alphazero: uma forma para alcançar algoritmos tabula rasa | - |
Tipo de arquivo: dc.type | Trabalho de conclusão de curso | - |
Aparece nas coleções: | Repositório Institucional da Universidade Federal Fluminense - RiUFF |
O Portal eduCAPES é oferecido ao usuário, condicionado à aceitação dos termos, condições e avisos contidos aqui e sem modificações. A CAPES poderá modificar o conteúdo ou formato deste site ou acabar com a sua operação ou suas ferramentas a seu critério único e sem aviso prévio. Ao acessar este portal, você, usuário pessoa física ou jurídica, se declara compreender e aceitar as condições aqui estabelecidas, da seguinte forma: