AlphaZero

AlphaZero
Tipus	programa informàtic
Versió inicial	2017
Equip
Desenvolupador(s)	Google DeepMind
Més informació
Stack Exchange	Etiqueta

AlphaZero és un programa informàtic desenvolupat per DeepMind, que utilitza un enfocament generalitzat d'AlphaGo Zero. El 5 de desembre de 2017, l'equip de DeepMind va llançar una preimpressió presentant AlphaZero, que va aconseguir en 24 hores un nivell de joc sobrehumà en escacs, shogi i Go en derrotar els campions del món, Stockfish, Elmo i la versió de 3 dies d'AlphaGo Zero en cada cas. AlphaZero va dominar Stockfish després de només 4 hores d'autoaprenentatge, sense accés a llibres d'obertura o base de dades de taules de finals.^[1]^[2]^[3]

↑ ; Hubert, Thomas; Schrittwieser, Julian «Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm» (en anglès). , 05-12-2017, p. 4-5 [Consulta: 7 desembre 2017].
↑ «Entire human chess knowledge learned and surpassed by DeepMind's AlphaZero in four hours» (en anglès). , 06-12-2017 [Consulta: 6 desembre 2017].
↑ «DeepMind’s AI became a superhuman chess player in a few hours, just for fun». , 06-12-2017 [Consulta: 6 desembre 2017].

[Silver_et_al-1] ; Hubert, Thomas; Schrittwieser, Julian «Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm» (en anglès). , 05-12-2017, p. 4-5 [Consulta: 7 desembre 2017].

[telegraph-2] «Entire human chess knowledge learned and surpassed by DeepMind's AlphaZero in four hours» (en anglès). , 06-12-2017 [Consulta: 6 desembre 2017].

[3] «DeepMind’s AI became a superhuman chess player in a few hours, just for fun». , 06-12-2017 [Consulta: 6 desembre 2017].

[1]

[2]

[3]