AlphaZero

AlphaZero — це комп'ютерна програма, розроблена компанією DeepMind, яка використовує узагальнений підхід AlphaGo Zero^[en]. 5 грудня 2017 року колектив DeepMind випустив препринтне введення AlphaZero, яке впродовж 24 годин досягнуло надлюдського рівня гри в шахи, Сьоґі, і ґо, перемігши чемпіонів світу серед програм, Stockfish, Elmo і 3-денний варіант AlphaGo Zero в кожному випадку, використовуючи краще комп'ютерне обладнання відносно своїх опонентів.^[1]^[2] AlphaZero переміг Stockfish 8 (рушій грав без доступу до дебютних баз та ендшпільних таблиць) граючи з кращим комп'ютерним обладнанням виділеним для AlphaZero.^[3]^[4]

↑ https://arxiv.org/pdf/1712.01815.pdf [Архівовано 8 грудня 2017 у Wayback Machine.] Mastering Chess and Shogi by Sef-Play with a General Reinforcment Learning Algorithm.
↑ David Silver, Thomas Hubert, Julian Schrittwieser, Ioannis Antonoglou, Matthew Lai, Arthur Guez, Marc Lanctot, Laurent Sifre, Dharshan Kumaran, Thore Graepel, Timothy Lillicrap, Karen Simonyan, Demis Hassabis (5 грудня 2017). Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm. arXiv:1712.01815 [cs.AI]. {{cite arXiv}}: Cite використовує застарілий параметр |authors= (довідка)
↑ Knapton, Sarah; Watson, Leon (6 грудня 2017). Entire human chess knowledge learned and surpassed by DeepMind's AlphaZero in four hours (брит.). Telegraph.co.uk. Архів оригіналу за 7 грудня 2017. Процитовано 6 грудня 2017.
↑ Vincent, James (6 грудня 2017). DeepMind’s AI became a superhuman chess player in a few hours, just for fun. The Verge. Архів оригіналу за 2 грудня 2020. Процитовано 6 грудня 2017.

[alpha-1] ttps://arxiv.org/pdf/1712.01815.pdf [Архівовано 8 грудня 2017 у Wayback Machine.] Mastering Chess and Shogi by Sef-Play with a General Reinforcment Learning Algorithm.

[preprint-2] David Silver, Thomas Hubert, Julian Schrittwieser, Ioannis Antonoglou, Matthew Lai, Arthur Guez, Marc Lanctot, Laurent Sifre, Dharshan Kumaran, Thore Graepel, Timothy Lillicrap, Karen Simonyan, Demis Hassabis (5 грудня 2017). Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm. arXiv:1712.01815 [cs.AI]. {{cite arXiv}}: Cite використовує застарілий параметр |authors= (довідка)

[telegraph-3] Knapton, Sarah; Watson, Leon (6 грудня 2017). Entire human chess knowledge learned and surpassed by DeepMind's AlphaZero in four hours (брит.). Telegraph.co.uk. Архів оригіналу за 7 грудня 2017. Процитовано 6 грудня 2017.

[4] Vincent, James (6 грудня 2017). DeepMind’s AI became a superhuman chess player in a few hours, just for fun. The Verge. Архів оригіналу за 2 грудня 2020. Процитовано 6 грудня 2017.

[1]

[2]

[3]

[4]

AlphaZero

From Wikipedia, the free encyclopedia · View on Wikipedia