Kodējums UTF-8 un citāds
« previous entry | next entry »
Jun. 11., 2012 | 04:32 pm
posted by: zebra in pajautaa
Help.. nepieciešams kaudzi word un pdf dokumentu apstrādāt savādākā veidā, kas saistās arī ar kodējuma maiņu. Smuks un godīgs word dokumentiņš, atverot ar Notepad++ izskatās nebaudāms:
šādi
Kā varu uzzināt, kas tas par kodējumu un kā to dabūt uz, piemēram, UTF-8?
Kā varu uzzināt, kas tas par kodējumu un kā to dabūt uz, piemēram, UTF-8?
from: begemots
date: Jun. 11., 2012 - 04:51 pm
#
Es atvainojos, bet Word un PDF dokumenti nav domāti tam, lai tos apstrādātu ar plika teksta redaktoru.
Tas nav nekāds UTF/codepage kodējums, tas ir binārs fails, ko tu mēģini atvērt ar plikteksta redaktoru, kas tev vienkārši nestrādās.
Ja gribi Wordus apstrādāt notepadā(notepad++ vai citā), vispirms tie jānoseivo bez formatējuma: txt formātā
Atbildēt | Diskusija
from: zebra
date: Jun. 11., 2012 - 05:02 pm
#
Man vienk. nepieciešams (automatizēti) saskaitīt vārdu biežumus dokumentos, tāpēc arī formatējums nav svarīgs.
Atbildēt | Iepriekšējais | Diskusija
from: begemots
date: Jun. 11., 2012 - 05:04 pm
#
Man gan šķiet, ka Wordam arī bija kaut kādas opcijas skaitīt vārdus dokumentos, bet neesmu drošs, jo pats nekad neesmu izmantojis, varbūt bija tikai kopējais vārdu skaits doķī.
Atbildēt | Iepriekšējais | Diskusija
from: begemots
date: Jun. 11., 2012 - 05:05 pm
#
https://www.google.lv/search?aq=0&oq=word+frequency+&sugexp=chrome,mod=12&sourceid=chrome&ie=UTF-8&q=word+frequency+counter
Atbildēt | Iepriekšējais | Diskusija
from: zebra
date: Jun. 11., 2012 - 05:41 pm
#
Atbildēt | Iepriekšējais
from: zebra
date: Jun. 11., 2012 - 05:41 pm
#
Atbildēt | Iepriekšējais | Diskusija
from: begemots
date: Jun. 11., 2012 - 05:52 pm
#
Atbildēt | Iepriekšējais | Diskusija
from: zebra
date: Jun. 12., 2012 - 09:23 am
#
Atbildēt | Iepriekšējais