extranjero ([info]extranjero) rakstīja,
@ 2022-12-20 09:18:00

Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Kāpēc es neesmu pārāk lielā sajūsmā par mašīnmācīšanās sistēmām
Būtībā šīs tā saucamās mākslīgā intelekta jeb mašīnmācīšanās sistēmas nav nekas vairāk kā ļoti advancēts google meklētājs. Arī tas ir ļoti iespaidīgi, jo ir pilnībā mainījis pieeju tam, kā mēs atrodam informāciju. Ja man kaut ko vajag uzzināt, piemēram, Nacionālās Bibliotēkas darba laiku, tad loģiski, ka pirmā vieta būs to ierakstīt Google vai Bing un visbiežāk dabūšu precīzu atbildi.

Google meklētājs jau no paša sākuma cilvēkiem bija ļoti noderīgs, tomēr tas arī tika īpaši kontrolēts, lai nedotu pārāk lielu ietekmi spameriem vai SEO aktivitātēm. Ar laiku tas kļuva tik labs, ka cilvēkiem jau dabūja vēlamo rezultātu pirmajā meklējuma lapā. Ar statistiku var paredzēt, ko tieši cilvēki grib atrast, un attiecīgi pārvietot šo rezultātu uz pašu pirmo vietu.

Nākošais solis jau būtu analizēt pilnus teikumus. Tā vietā, lai ierakstītu meklētājā “Nacionālā bibliotēka, darba laiks”, es varētu ierakstīt: “Kāds ir Nacionālās bibliotēkas darba laiks pirmdienā?” Cilvēkiem šādi uzdot jautājumus ir daudz dabiskāk, un tas ir diezgan liels sasniegums dot pareizu atbildi par visām vēlamajām iestādēm, nevis teiksim kā pirmo iedot kāda tirgotāja rezultātu ar reklāmu nopirkt kādu retu grāmatu no Nacionālās Bibliotēkas.

Taču galā galā mašīnmācīšana vairs nestrādā, kad ir kāds specifiskāks jautājums, kurā ir nepieciešama dziļa domāšana, nevis tikai statistiska analīze par tūkstošiem cilvēku uzdoto jautājumu. Piemēram, google meklējumā jautājums par to, “Vai kovida vakcīna pasargā no inficēšanās?” drīzāk aizvedīs uz oficiāliem avotiem ar neprecīzu informāciju. Nu kā lai mašīnas algoritmi, kurus mēs pat paši nesaprotam, izdomātu šo lietu labāk par cilvēkiem, kuri ir rūpīgi sekojoši līdzi visam notiekošajam šajā jomā?

Ja kas, šis nav vienkārši mans izdomājums. Līdzīgi raksti ir jau publicēti daudz niansētāki izskaidrojumi, kādas problēmas ir ar ChatGPT.


(Ierakstīt jaunu komentāru)


[info]mindbound
2022-12-20 13:07 (saite)
Nenoliedzu, ka ar šīm tehnoloģijām ir tehniskas, drošības u.c. problēmas, bet ar Google meklētāju gan tām nav nekādas līdzības, atskaitot to daļu, kur lietotājs teksta laukā ievada pieprasījumu un kaut kur uz ekrāna saņem atbildi.

(Atbildēt uz šo) (Diskusija)


[info]extranjero
2022-12-20 23:18 (saite)
Kādā ziņā nav?

(Atbildēt uz šo) (Iepriekšējais) (Diskusija)


[info]mindbound
2022-12-21 04:37 (saite)
Praktiski jebkādā. Tas neko nemeklē interneta resursos, tas prognozē augstākās varbūtības "tokenu" (tipiski vārdu, bet ne obligāti), par pamatu ņemot iepriekšējos ievadītos tokenus, par varbūtību sadalījumu izmantojot iemācītos datus.

https://arxiv.org/abs/2212.03551

(Atbildēt uz šo) (Iepriekšējais) (Diskusija)


[info]extranjero
2022-12-21 09:54 (saite)
Indeksēt vietnes ir triviālā daļa. Tas, kā google izlemj, kura vietne ir vislabākā atbilde uz uzdoto jautājumu, manuprāt, ir īstā problēma, un esmu pārliecināts, ka google tur tagad izmanto mašīnmācīšanās tehnoloģiju tieši tādā pašā veidā ar augstākās varbūtības tokenu.

Kādreiz google bija page ranks un citas fīčas, bet spameri un SEO tās varēja viegli apiet. Šķiet, ka tagad ir kardināli kaut kas mainījies. Arī viņu failure modes ir ļoti līdzīgas.

(Atbildēt uz šo) (Iepriekšējais) (Diskusija)


[info]mindbound
2022-12-21 10:42 (saite)
To, ka Google izmanto ML, ir pilnīgi skaidrs un pašsaprotams. Stipri šaubos, ka Google meklētājā izmanto šī specifiskā veida tehnoloģiju.

(Atbildēt uz šo) (Iepriekšējais) (Diskusija)


[info]gnidrologs
2022-12-21 19:11 (saite)
Ja meklē to, kas ir cilvēka ievadīts, tad kur tur "pašmācība"? Pašmācība būtu, ja pats sāktu izgudrot jaunus "tokenus" un pielietot tos veidos, kādi nebija iepriekš paredzami.

(Atbildēt uz šo) (Iepriekšējais) (Diskusija)


[info]mindbound
2022-12-21 19:38 (saite)
Eksistē arī tādi modeļi, bet konkrēti Google gadījumā tur, domājams, nav nekādas pašmācības. Tulkojamajā rīkā pilnīgi noteikti ir iepriekš apmācīti valodas modeļi, vai pašā meklētājā ir kaut kas tamlīdzīgs — neesmu pārliecināts, bet pilnīgi iespējams.

(Atbildēt uz šo) (Iepriekšējais) (Diskusija)


[info]gnidrologs
2022-12-21 21:57 (saite)
"Eksistē arī tādi modeļi"

Ja? Piemēram viņš var sākt zīmēt kā juzers 'misene' ar visiem komentāriem (ļoti vienkāŗši darbiņi peintā), jo 'iemācījies'?

(Atbildēt uz šo) (Iepriekšējais) (Diskusija)


[info]mindbound
2022-12-21 22:31 (saite)
Ne tikai tas — šādam modelim darba sarežģītība vispār nav kritērijs, vienalga, peinta vai Rembranta līmenis.

Ieskats ML zīmētā mākslā: https://www.deviantart.com/tag/midjourney

Nezinu, vai kāds ir nopublicējis gatavu modeļu ansambli, kas ģenerē reizē zīmējumus un komentārus, bet atsevišķi tie eksistē (pameklē pēc atslēgas vārdiem "stable diffusion", "ML transformers", "large language models") un apmēram šobrīd sāk sasniegt cilvēka līmeņa rezultātus tādos uzdevumos, kā teksta izpratne, tulkošana, attēlu izveide pēc vārdiska apraksta u.c.

Linku uz pētījumiem ir simtiem un jauni nāk klāt katru dienu, šobrīd šī joma burtiski eksplodē.

(Atbildēt uz šo) (Iepriekšējais)


Neesi iežurnalējies. Iežurnalēties?