barvins
barvins 2009-04-08 02:06

Palindromi

"Silē putu pēlis", "raka viņi vakar" - viltīgais algoritms nostrādāja - tagad palindromu meklēšana notiek fiksi. http://www.creativity.lv/palindromi.html. Četrvārdīgo sanāca baigi daudz - 313MB fails, tālāk labāk nemaz nemēģināšu.
kemune
kemune 2009-04-08 09:49

Virsraksts nolaizīts

tagad tikai šim pāri valodas modeli, lai atlasa sakarīgākos
radars 2009-04-08 10:47

Virsraksts nolaizīts

Baigi daudz to variantu, taču var mēģināt arī vārdus pārī pa diviem meklēt googlā, vai šāds vārdu salikums ir kautkur redzēts, vai nē, un tādā veidā tikt vaļā no dīvainajiem savienojumiem ;)
kemune
kemune 2009-04-08 10:51

Virsraksts nolaizīts

nu gan ar labo kāju kreiso ausi kasīt. tak ņemam valodas korpusu un trenējam statistisko modeli, ar SRILM rīkiem piemēram.
radars 2009-04-08 10:56

Virsraksts nolaizīts

Tas ir tīiiiiik sarežģīti, es piedāvāju vienkāršu zemnieku metodi, ko es pats izmantoju kad UPWORDsos jāpārbauda vārdi ;)
kemune
kemune 2009-04-08 11:22

Virsraksts nolaizīts

nu gan, (aptuveni)

ngram-count -text korpuss -lm modelis
echo "tiri piri" >teksts
ngram -lm modelis -ppl teksts
barvins
barvins 2009-04-08 11:41

Virsraksts nolaizīts

radars ar kemune uz sacensībām, kuram labāk sanāks atfiltrēt džanku?
kemune
kemune 2009-04-09 19:19

Virsraksts nolaizīts

vot izlaidu cauri vienam modelim un sapratu, ka tas sucks completely, jāpēta, kāpēc
barvins
barvins 2009-04-10 01:32

Virsraksts nolaizīts

Ja tev kaut kas sanāk, pastāsti.
madars
madars 2009-04-08 20:16

Virsraksts nolaizīts

bet vai Tev ir lielāks korpuss nekā Googlei? :)