barvins
barvins 2009-04-08 02:06

Palindromi

"Silē putu pēlis", "raka viņi vakar" - viltīgais algoritms nostrādāja - tagad palindromu meklēšana notiek fiksi. http://www.creativity.lv/palindromi.html. Četrvārdīgo sanāca baigi daudz - 313MB fails, tālāk labāk nemaz nemēģināšu.
barvins
barvins 2009-04-08 17:21

Virsraksts nolaizīts

Var mēģināt ar statistiko analīzi, kā kemune iesaka. Principā vajadzētu varēt vismaz tik daudz, kā izanalizēt lielus tekstus, lai noteiktu, kādas vārdu galotnes ir bieži sastopamas blakus esošiem vārdiem. Tad varētu mēģināt atmest tos gadījumus, kad blakus ir vārdi nepareizos locījumos, vai nepareizā secībā (like Yoda I'm talking).
honeybee
honeybee 2009-04-08 18:59

Virsraksts nolaizīts

IMO, latviešu valoda pieļauj ļoti dažādas teikumu kombinācijas.
Ļoti dažādas valoda latviešu teikuma kombinācijas pieļauj.

T.i., tā kā, atšķirībā no angļu valodas vai citām valodām, kurās neizmanto locījumus, nav noteiktas teikuma locekļu vietas teikumā, teikuma "jēga" pastāv tad, ja pastāv semantiska saistība starp vārdiem un salāgojas locījumi lietvārdiem, īpašības vārdiem, darbības vārdiem utt.. - jēgpilnu teikumu drīzāk var atrast, pārbaudot, vai vārdu (ja tie ir saistīti, tipa lietv.+īpašības vārds, vietniekvārds+darbības vārds) galotnes ir pareizas.
kemune
kemune 2009-04-09 19:18

Virsraksts nolaizīts

tā ir lingvistiski motivētā atbilde. realitāte bieži vien ir tāda, ka paņemot "korpusu kā gūglim", plika statistika sit pušu visas advancētās metodes, kuras taču ir pareizākas un valodnieciskākas, tātad tām būtu jāstrādā labi. bet tā visbiežāk nav.
kombinācijas pieļauj arī pietiekami liels korpuss. es nerunāju par tur dzejas analīzi, bet tur arī likumi, locījumu saskaņojumi un gramatika nelīdzēs, izņēmumu var atrast jebkuram likumam. pirmie 90% valodas padodas viegli :)