barvins
barvins 2005-04-29 19:40

Atskaņu vārdnīca

Darbības vārdi un īpašibas vārdi izlocīti, kā arī pievienotas visādas citādas derīgas lietiņas, kā, piemēram, pilno atskaņu meklēšana. Pusmiljons salocītu vārdu formu:P
Pačolēt var te
Pačolēt var te
Ikvienam ir pienākums sūdzēties par nekorekti izlocītiem vārdiem (un man ir tiesības sūdzības ignorēt).

gods (s.)
grods (adj.)
jods (s.)
kods (s.)
mods (s.)
ods (s.)
pods (s.)
sods (s.)
zods (s.)

dipināja (v.)
lipināja (v.)
ripināja (v.)
tipināja (v.)

P.S.
Būs jāatstāj pa nakti darboties kāds skriptiņš, kas izmet vārdus, kas (nezināmu iemeslu pēc) atkārtojas vairāk kā vienu reizi.

P.P.S
Ā, pieleca - "pupa" ir ģenitīvs no "pups" un nominatīvs no "pupa", so viss, īstenībā, ir okei.

P.P.P.S
Kā ir iespējams darbības vārds "suns"?
Elementāri, citējam no http://www.letonika.lv/morphology/
"sunīt - lietvārds; pamatforma: suns; vīriešu dzimte; vienskaitlis; vokatīvs;"
"Vokatīvs, vienskaitlis: sunīti; sunīt" "Vokatīvs, daudzskaitlis: sunīši" "Nominatīvs, vienskaitlis: suns"
honeybee
honeybee 2005-04-29 20:09

Virsraksts nolaizīts

lai ko tu domātu ar "pilnās atskaņas", tu šo vārdu izmanto neprecīzi. pilnās atskaņas tu meklē vienmēr (nepilnā atskaņa nozīmētu tikai daļēju skaņu sakritību vārda beigās, un to šis daikts vēl nedara un varbūt arī nemaz nevajag, boļna daudz rezultātu būtu).
tas, ko tu sauc par "pilno atskaņu", nozīmē "vienādu zilbju skaitu"?

pirmais uzlabojums, kas būtu nepieciešams - panākt, ka divskanis tiek uztverts kā viens burts, citādi "kuģis" tiek atskaņots ar "skauģis", "zils" ar "kails" un tamlīdz - kas, protams, nav tas, kas mums vajadzīgs.

bet vispār - wow :)))
barvins
barvins 2005-04-29 20:18

Virsraksts nolaizīts

Divskaņu problēma ir atrisināta, pārbaudi kuģis->bruģis, ja ir ielikts ķeksis pie "pilnās atskaņas".
barvins
barvins 2005-04-29 20:27

Virsraksts nolaizīts

Ja vajag daļēju sakritību vārda beigās, tad ir jāizvāc ķeksis no "pilnās atskaņas", jāizvāc ķeksis no "atmest pirmos līdzskaņus" un lodziņā jāieraksta meklējamā vārda daži beigu burti, kuriem ir jāsakrīt. Tiesa, tad meklēšana ilgst vismaz 15 sekundes.
honeybee
honeybee 2005-04-29 20:47

Virsraksts nolaizīts

tās tik un tā nav "nepilnās atskaņas", jo vārdam "saule" nepilnā atskaņa būtu "Auce" (nesakrīt līdzskanis), bet tas, protams, netiek atrasts. vai zīds-līdz-slīd, krīts-krīt, spīd-tīt, krauts-sauc, kas skan labi un funkcionē kā nepilnā atskaņa, bet arī netiek atrasts.
iekļaut nepilno atskaņu meklēšanu, kad tiek meklēti arī līdzīgi skanoši vārdi, kas faktiski beidzas citādi, lai arī tiek izrunāti gandrīz vienādi, būtu baigi kruta, bet droši vien baigi sarežģīti (tip uztvert balsīgo un nebalsīgo līdzskani kā atbilstošus vai "ts" kā "c").

/ceru, ka saprotami izskaidroju
barvins
barvins 2005-04-29 21:19

Virsraksts nolaizīts

Hmm. Ok, ar terminoloģiju tagad viss skaidrs.
Ja varētu dabūt vārdnīcu ar fonētiskajiem pierakstiem (tildes vārdnīcai, šķiet, ir) (un varētu dabūt fonētiskos pierakstus arī vārdu locījumiem, kas diez vai ir iespējams), tad varētu eleganti meklēt vārdus, kas līdzīgi skan.
Mja, varētu, paeksperimentēt ar līdzīgi skanošu burtu savienojumu aizvietošanu: c=ts, d=t; b=p un tamlīdzīgi. Tas gan, protams, krietni paildzinātu meklēšanas laiku.
honeybee
honeybee 2005-04-29 21:33

Virsraksts nolaizīts

vismaz līdzskaņus pamainīt patiesībā nav nereāli. līdzskaņu pāri būtu ts-c, ds-c, b-p, c-dz, č-dž, d-t, g-k, ģ-ķ, s-z, š-ž, kā arī, protams, otrādi, un dažādos savienojumos (bet tas jau droši vien būtu automātiski). tāpat ir jēga atmest pēdējo "s" vai "š" lietvārdiem, t.i., lai "krīts" atskaņotos ar "krīt" un "vējš" ar "spēj". un šīs atskaņas ir visnotaļ pieklājīgas.
barvins
barvins 2005-04-29 22:17

Virsraksts nolaizīts

Sounds like a plan:)

P.S. Man ir ideja, kā uzlabot meklēšanas ātrumu. Bet, ššš, pateikšu tikai tad, ja tas nostrādās.
honeybee
honeybee 2005-04-29 22:22

Virsraksts nolaizīts

pievērsīsies islāmam un iekļausi programmā komentāru "Allah akbar" pirms katra procesa? :)

/esi jau mājās?
barvins
barvins 2005-04-29 22:29

Virsraksts nolaizīts

;) Tad jau labāk iemācīties formatēt disketes ar domu spēku. Hmm, nu labi, mūsdienās tas drīzāk būtu: noņemt draiveru neatrašanas lāstu no USB spraudņiem;)

//Jā
honeybee
honeybee 2005-04-29 22:33

Virsraksts nolaizīts

nu, ņemot vērā to, ka es jau esmu iemācījusies ar domu koncentrēšanos vien aizvērt wordu, tas nav nereāli. tehnoloģija šāda: iztulko izteikti sarežģītu un piņķerīgu teikumu, uzkrātais domu spēks izlādējas un aizver programmu, protams, nepiedāvājot noseivoties. advancētās situācijās winodozis arī nokaras.

atvaino, spamoju.
barvins
barvins 2005-04-29 22:38

Virsraksts nolaizīts

Tā, laikam, ir melnā maģija;)
honeybee
honeybee 2005-04-29 20:19

Virsraksts nolaizīts

es arī līdzīgi aplauzos - ilgi domāju, wtf ir darbības vārds "kaita", tad beidzot pazemojos, ielīdu letonikā, lai konstatētu, ka tā ir 3.personas pagātnes forma vārdam "kaist". galējā versijā droši vien vajadzēs kaut kādu linku uz vārdu skaidrojumu :)
barvins
barvins 2005-04-29 20:23

Virsraksts nolaizīts

Hmm, jā, varētu uztaisīt tā, lai uzspiežot uz vārda redirektē uz letoniku.
honeybee
honeybee 2005-04-29 20:26

Virsraksts nolaizīts

jā, es vēlreiz aplauzos pie verba "spriegs", kas izrādās vārda "spriegt" nākotnes forma. riktīgi smieklīgs vārds :)))

bet vispār pie "nepilnajām atskaņām" (grrr) iebremzē. optimizēji, ja? ;)
barvins
barvins 2005-04-29 20:32

Virsraksts nolaizīts

Tur ir pusmiljons vārdu, loģiski, ka iebremzē. Vienīgais veids, kas man nāk prātā, kā varētu uzlabot ātrumu, ir vārdu dalīšana pa zilbēm un, blabla, indeksācija, bla, bla, relācijas, blabla, lielākā daļa meklēšanas tad notiks ar "=", nevis "LIKE", bla, bla, karoče baigi sarežģīti.
honeybee
honeybee 2005-04-29 20:41

Virsraksts nolaizīts

karoče, nafig vajag.
noformulē precīzāk to "meklēt tikai pilnās atskaņas" (tipa "meklēt tikai vārdus ar identisku zilbju skaitu" vai kā tamlīdzīgi) un iemet info iekš [info]teksti, lai ļaudis patestē. man liekas, ka funkcionalitāte ir pietiekama, lai varētu to daiktu izmantot :)
barvins
barvins 2005-04-29 20:48

Virsraksts nolaizīts

Mhmm, kaut kad vēlāk to noorganizēšu. Vispirms paniekošos ar divdabjiem.
honeybee
honeybee 2005-04-29 22:35

Virsraksts nolaizīts

vārdam "kapi" nez kāpēc atrod 3 lietvārdus "kapi". viens ir no vārda "kaps", otrs no vārda "kape", bet no kurienes trešais?

/bet verbs "suns", protams, ir nepārspējams :)
barvins
barvins 2005-04-29 22:45

Virsraksts nolaizīts

Velns viņu zina. Ir bijuši gadījumi, kad oriģinālajā vārdnīcā viens vārds atkārtojas vairākas reizes. Mja, pačolēju - oriģinālajā vārdnīcā bija "kape", "kaps" un "kapi".
Nez, kaut kā slinkums šitādas lietas meklēt un labot - nav jau nemaz tik daudz to kļūdu, un, normāls cilvēks taču tāpat atšķirs, kas ir vārds, kas gļuks.
honeybee
honeybee 2005-04-29 22:37

Virsraksts nolaizīts

jā, un vai ir iespējams darīt kaut ko ar o - patskani un o - divskani? jo būtībā jau "gods" un "kods" vai "mods" neatskaņojas vis. bet tev datu bāzē jau nav norādīts, kā izrunā to o?
barvins
barvins 2005-04-29 22:39

Virsraksts nolaizīts

Sorry, man nav nekādu iespēju tos atšķirt.
honeybee
honeybee 2005-04-30 12:17

Virsraksts nolaizīts

tik un tā vārdam "sunīt" nav formas "suns"!
barvins
barvins 2005-04-30 17:12

Virsraksts nolaizīts

Nav jau nav, vienkārši letonika padomāja, ka sunīt ir lietvārds locījumā, nevis darbības vārds, t.i., ka vārdam suns ir forma sunīt.
slikts 2010-10-27 19:11

Virsraksts nolaizīts

vai šis vēl kaut kur ir pieejams, un vai var sarunāt dabūt jēlu datubāzi? es domāju par kaut kādiem eksperimentiem
barvins
barvins 2010-11-21 15:21

Virsraksts nolaizīts

Ui, sen nebiju epastus čekojis.
Atskaņu vārdnīca joprojām eksistē iekš www.creativity.lv/rhyme.
Jēlu datubāzi var dabūt, tiesa, tā ir specifiska, t.i., man vārdi visdažādākajos iespējamajos locījumos, lai varētu sameklēt atskaņas, bet ne vienmēr ir savilkts kopā, kurš locijums atbilst kurai vārda pamatformai, so, vai tas derēs taviem eksperimentiem ir atkarīgs no tā, ko gribi darīt.
slikts 2010-11-22 19:20

Virsraksts nolaizīts

es gribu ģenerēt vārdu spēles, un tam man nevajag kārtīgus datus, un būtu okei, ja tu varētu kaut kur uzlikt saspiestus db dumpus. tas nekas, ja tev nav laika, jo man nav pārliecības, vai manas idejas izdotos
barvins
barvins 2010-11-22 22:50

Virsraksts nolaizīts

Paskaties:
http://www.creativity.lv/share/words.csv.tar.gz

Csv, lai mazāk vietas aizņem.

Vārdi, kuriem word_source_id ir "0" ir diezgan uzticami / vārdnīcā eksistējoši - pārējie var būt jocīgi.

Man ir arī dati, kā katrs vārds dalās (pseido) zilbēs - ja tev tik smalki vajag, piesakies.

P.S. Vispār, ja gribi nopietnus datus dabūt, ir jēga painteresēties ailab.lv - viņi uz to specializējas.
slikts 2010-11-22 23:25

Virsraksts nolaizīts

paldies, ar šo varētu pietikt
slikts 2010-11-22 19:20

Virsraksts nolaizīts

to creative.lv versiju es beigās jau atradu, bet man interesē taisīt jaunus vārdus, nevis tikai atskaņas