"Silē putu pēlis", "raka viņi vakar" - viltīgais algoritms nostrādāja - tagad palindromu meklēšana notiek fiksi. http://www.creativity.lv/palindromi.html. Četrvārdīgo sanāca baigi daudz - 313MB fails, tālāk labāk nemaz nemēģināšu.
Teikuma modelī iestrādes jau ir - letonika.lv ir verķis, kur var noteikt, kāda veida vārds kurš ir - lietvārds, darbības vārds, kādā locījumā. Būs gan zināmas problēmas tikt pie viņu koda, par cik tas nav gluži opensource pasākums, jo aiz viņiem stāv Tilde. Var mēģināt ar viņiem parunāt. Pats raustos to darīt, jo savulaik biju uztaisījis skriptu, kas iziet cauri visai vārdnīcai un no viņu lapas novelk vārdu locījumu sarakstu, kā rezultātā manu ip nobanoja un viņu mājaslapā parādījās uzraksts, ka lietot viņu mājaslapu ar automātiskiem skriptiem nedrīkst.
Man šķiet, ka ailab.lv ir zināmas iestrādes teikuma uzbūves modeļos, t.i., noteikumos, kāda veida vārdi kādā secībā drīkst būt, bet, man šķiet, diez ko tālu viņi netika, jo toreiz nebija labi strādājošs verķis, kurš spēja identificēt, kāda veida vārds kurš ir.
Man šķiet, ka ailab.lv ir zināmas iestrādes teikuma uzbūves modeļos, t.i., noteikumos, kāda veida vārdi kādā secībā drīkst būt, bet, man šķiet, diez ko tālu viņi netika, jo toreiz nebija labi strādājošs verķis, kurš spēja identificēt, kāda veida vārds kurš ir.
Cik daudzi vārdi no tiem kas ir Tavā kopējā vārdu sarakstā vispār parādās 4 vārdīgajos palindromos? Varbūt to tur nav tik daudz, lai nevarētu tos sašķirot pēc saknes un ar roku sadalīt vismaz lietvārdos, darbības, īpašības u.t.t? tad varētu vismaz atmest tos kur pēc kārtas ir divi darbības vārdi, vai kuriem dzimtes nav pareizas... Nu atkarīgs protams, vai tie ir pāris simti vai pāris tūkstoši.
Novilku kaut kādu macro, kas Wordā saskaita unikālos vārdus un palaidu, lai analizē trīsvārdīgos palindromus - pie 9000 unikāliem vārdiem tas skripts aizrijās, paziņoja, ka esot par daudz.
nu, letonika.lv ir morfoloģiskā analīze, tas nozīmē - ņemam pliku vārdu un pasakām visu, ko par to var pateikt. "roku" var būt darb.v., lietv. tādā un tādā formā u.t.t. tas ir stipri vienkāršs uzdevums - vajag tikai nelielu datubāzi ar to, kādām saknēm kādas galotnes var kabināt klāt, ko šīs galotnes nozīmē morfoloģiski un tad tikai analizējam. ailab.lv ir tāds analizators, to nu gandrīz katrs sevi cienošs comp.ling students mēģina uzrakstīt :)
pavisam cita lieta ir sintaktiskā analīze, kad vārdus jau apskata kontekstā - principā visa teikuma robežās. tad 1) "roku" iegūst konkrētu morf. analīzi, 2) "roku" iegūst arī sintaktisko analīzi, piemēram "papildinātājs" un norādi, ar kuru vārdu tas saistās, piemēram, verbu "sniegt". šitā štelle galīgi nav vienkārša, nerunājot par to, ka tādu gramatiku uzrakstīt jau nav triviāli, jebkurā gadījumā nākas ierobežot valodu. welcome to comp.ling hell
pavisam cita lieta ir sintaktiskā analīze, kad vārdus jau apskata kontekstā - principā visa teikuma robežās. tad 1) "roku" iegūst konkrētu morf. analīzi, 2) "roku" iegūst arī sintaktisko analīzi, piemēram "papildinātājs" un norādi, ar kuru vārdu tas saistās, piemēram, verbu "sniegt". šitā štelle galīgi nav vienkārša, nerunājot par to, ka tādu gramatiku uzrakstīt jau nav triviāli, jebkurā gadījumā nākas ierobežot valodu. welcome to comp.ling hell