Sviesta Ciba |

302cc9b4780f8cbef6f70c3a8417913050b6aafb (

mindbound) rakstīja,
@ 2016-03-09 11:47:00

Garastāvoklis:	working
Mūzika:	Alcest - Les Voyages De L'Âme: Summer's Glory
Entry tags:	computers, games, news

Citās ziņās – AlphaGo uzvar pirmo maču no pieciem pret Lī Sedolu.

Update: un otro, un trešo.

AlphaGo doesn’t actually play kami no itte, but human professionals can’t detect AlphaGo’s departures from it.

Update: Lī uzvar ceturtajā mačā.

(Lasīt komentārus) - (Ierakstīt jaunu komentāru)

mindbound
2016-03-13 13:13 (saite)

Aha. Taisnību sakot, esmu zināmā mērā pārsteigts (no otras puses, AlphaGo sistēma nav pašpilnveidojoša, kas varētu novest pie šīs "superhuman but with bugs" ainas). Problēma varētu būt arī ar to, ka AlphaGo padodas, ja uzvaras varbūtība (kas ir vienīgais parametrs, ko tā maksimizē) sarūk mazāka par 0.1 (vismaz tā tas bija oktobra versijā).

(Atbildēt uz šo) (Iepriekšējais) (Diskusija)

no otras puses, AlphaGo sistēma nav pašpilnveidojoša

dunduks
2016-03-15 12:33 (saite)

No lasītā "Daily Telegraph" un klausītā BBC, es atkal tieši sapratu, ka lielālais lēciens ir tieši tajā, ka sistēma ir pašpilnveidojuša - nu tur ielādētas dafiga partijas, pēc tam vēl pati ar sevi izspēlējusi miljonus utt. Rezultātā Google šo tehnoloģiju liks maksimāli apakšā visiem saviem servisiem un jau šobrīd, piemēram, pie meklēšanas rezultātu ranžēšanas pēc milzīgā noslēpumā turētiem diviem parametriem, trešais esot AI vērtējums.

(Atbildēt uz šo) (Iepriekšējais) (Diskusija)

Re: no otras puses, AlphaGo sistēma nav pašpilnveidojoša

gedymin
2016-03-15 13:05 (saite)

"lielālais lēciens ir tieši tajā, ka sistēma ir pašpilnveidojuša" - nē, tā ir standarta tehnika, raksturīga gandrīz visām AI / mašīmācīšanās metodēm. Industrijā (tai skaitā un it īpaši spēļu botiem) plaši izmantota jau vismaz gadus divdesmit, pētniecībā parādījusies pirms vēl daudz senāka laika.

"Google šo tehnoloģiju liks maksimāli apakšā visiem saviem servisiem" - ko tad, Go botu? :) Tā bota kods tomēr pamatā ir problēmspecifisks: monte carlo tree search, droši vien daudziem fine tuning parametriem adaptēts konkrētajai spēlei.
Ja domā par dziļajiem neironu tīkliem, tad teksta meklēšana Google strādā pietiekoši labi ar klasiskiem datorzinātnes algoritmiem, tāpēc AI lietot tur nav lielas vajadzības. Tā drīzāk ir Google vīzija kā izveidot jaunus servisus, nevis vienkārši uzlabot jau esošos.

(Atbildēt uz šo) (Iepriekšējais) (Diskusija)

Re: no otras puses, AlphaGo sistēma nav pašpilnveidojoša

dunduks
2016-03-15 13:23 (saite)

Resp., http://www.telegraph.co.uk/technology/2016/03/10/what-googles-grand-go-victory-means-technology-is-about-to-get-a/ ir pilnīga huiņa? To, ka tur ir huiņa attiecībā uz šahu un brute force uuber alles es zinu, jo tā tomēr ir mana spēle :-)

Vienkārši bija jocīgi esot tur redzēt to haipu, kas lielajos un (pietiekoši) nopietnajos masu mēdijos sacēlās par šo jautājumu.

(Atbildēt uz šo) (Iepriekšējais) (Diskusija)

Re: no otras puses, AlphaGo sistēma nav pašpilnveidojoša

gedymin
2016-03-15 13:42 (saite)

Nu, es iekomentēju pamatā par to, ka reinforcement learning (rakstā pieminēts) jau nu nav nekas jauns. Nezinu, ko tieši Arets domāja ar "nav pašmodificējošs".
"It learns from its own mistakes by playing against itself millions of times. This is very similar to how the human brain develops" - nu, tas gan ir BS.

"Type an ambiguous or complicated search query, and it is interpreted in the same way that a human would approximate a conversation in a noisy bar." - tas jau man arī izklausās pēc jauna servisa, kad meklēts tiks nevis tas, ko cilvēks ir prasījis, bet tas, ko viņš ar to varētu būt domājis. Es varu iedomāties daudz gadījumu, kad tādu fīču gribētu atslēgt.

Šaham parasti lieto deterministisks tree search (pārskata visus iespējamos variantus), Go, cik saprotu, pēc nejaušības principa izvēlās apskatīt daļu no iespējamajiem variantiem (Monte Carlo Tree Search). Plus, šahā ir vieglāk novērtēt pozīciju. Tieši novērtēšanai, nevis meklēšanai AlphaGo bija vajadzīgs deep learning.

(Atbildēt uz šo) (Iepriekšējais)

Re: no otras puses, AlphaGo sistēma nav pašpilnveidojoša

mindbound
2016-03-15 19:49 (saite)

Ar "nav pašpilnveidojoša" biju domājis, pirmkārt, to, ka attiecīgā sistēmas versija uz spēles laiku tiek "iesaldēta", tā nemācās no iepriekšējos turnīra mačos novērotā pie sevis vai pretinieka (protams, ja mācību korpusā tika izmantotas arī anonimizētas Lī spēļu partijas, tad tehniski viņa spēles stils ir daļa no AlphaGo sastādītās mikstūras); un, otrkārt, to, ka AlphaGo nav metalearning aspekta, it can get better at Go but it can't get better at getting better at Go.

Sk. arī

gedymin kritiku The Telegraph rakstam, it īpaši par salīdzinājumu ar smadzenēm.

(Atbildēt uz šo) (Iepriekšējais)

(Lasīt komentārus) -

Navigate: