302cc9b4780f8cbef6f70c3a8417913050b6aafb ([info]mindbound) rakstīja,
@ 2017-12-09 11:38:00

Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Garastāvoklis:impressed
Mūzika:Unter Null - Moving On: The Mercy Seat
Entry tags:computers:games, computers:ml, games, science:papers

Īsa un ilustratīva AlphaGo vēsture:

  1. 10.2015. — AlphaGo uzvar 2 danu Eiropas čempionu ar 5:0;
  2. 03.2016. — AlphaGo uzvar 9 danu pasaules čempionu un vienu no labākajiem go spēlētājiem pasaulē ar 4:1;
  3. 01.2017. — AlphaGo uzvar 60 online spēlēs pret dažāda stipruma profesionāliem go spēlētājiem;
  4. 05.2017. — AlphaGo uzvar 9 danu pasaules čempionu ar 3:0 un liek padoties piecu pasaules čempionu komandai;
  5. 10.2017. — AlphaGo Zero (kas, atšķirībā no iepriekšējām versijām, apmācībā neizmanto gatavus datus), ar 100:0 uzvar savu 03.2016. versiju;
  6. 12.2017. — AlphaZero, izmantojot vispārinātu AlphaGo Zero algoritmu, uzvar pasaules vadošās go, šaha un šogi programmas, ieskaitot pēdējo AlphaGo Zero versiju.



(Ierakstīt jaunu komentāru)


[info]shrdlu
2017-12-09 12:31 (saite)
Jā, iespaidīgi! Ir kādas idejas, kurās jomās šo pieeju varētu izmantot ārpus galda spēlēm?

(Atbildēt uz šo) (Diskusija)


[info]mindbound
2017-12-09 12:38 (saite)
Viens megapiemērs, kas nāk prātā, skatoties uz šo, ir programmu korektuma automātiska pierādīšana. Tur ir sastopama tieši tā pati "viennozīmīgi dati ar ne pārāk augstu dimensionalitāti un precīzi zināmi noteikumi" situācija. No tā, savukārt, izriet tas, ka šo pieeju varētu izmantot arī patvaļīgi plašiem matemātikas apgabaliem.

(Atbildēt uz šo) (Iepriekšējais) (Diskusija)


[info]shrdlu
2017-12-09 12:48 (saite)
Ahh, nu tas jau ir ārpus manas saprašanas līmeņa. Drīzāk domāju, kur vēl ir tādas praktiskas divu vai n-spēlētāju problēmas, kur varētu pielietot šādu self-play bāzētu metodi. Kā piemēri nāk prātā pokers (drīzāk jā) un akciju tirgus (drīzāk nē).

(Atbildēt uz šo) (Iepriekšējais) (Diskusija)


[info]mindbound
2017-12-09 12:52 (saite)
Pokers (vai vismaz noteikti tā varianti; faktiski neko nezinu par pokera spēli) ir noiets etaps, savukārt akciju tirgus jau labu laiku ir lielā mērā automatizēts (saprotamu iemeslu dēļ tur izmantoto kodu specifika nav publiski zināma, bet es būtu visai pārsteigts, ja šīs tehnoloģijas tur netiktu izmantotas).

(Atbildēt uz šo) (Iepriekšējais)


Neesi iežurnalējies. Iežurnalēties?