AlphaZero

AlphaZero

Tipusprograma informàtic Modifica el valor a Wikidata
Versió inicial2017 Modifica el valor a Wikidata
Equip
Desenvolupador(s)Google DeepMind Modifica el valor a Wikidata
Més informació
Stack ExchangeEtiqueta Modifica el valor a Wikidata

AlphaZero és un programa informàtic desenvolupat per DeepMind, que utilitza un enfocament generalitzat d'AlphaGo Zero. El 5 de desembre de 2017, l'equip de DeepMind va llançar una preimpressió presentant AlphaZero, que va aconseguir en 24 hores un nivell de joc sobrehumà en escacs, shogi i Go en derrotar els campions del món, Stockfish, Elmo i la versió de 3 dies d'AlphaGo Zero en cada cas. AlphaZero va dominar Stockfish després de només 4 hores d'autoaprenentatge, sense accés a llibres d'obertura o base de dades de taules de finals.[1][2][3]

  1. ; Hubert, Thomas; Schrittwieser, Julian «Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm» (en anglès). , 05-12-2017, p. 4-5 [Consulta: 7 desembre 2017].
  2. «Entire human chess knowledge learned and surpassed by DeepMind's AlphaZero in four hours» (en anglès). , 06-12-2017 [Consulta: 6 desembre 2017].
  3. «DeepMind’s AI became a superhuman chess player in a few hours, just for fun». , 06-12-2017 [Consulta: 6 desembre 2017].