pajautaa

Kodējums UTF-8 un citāds

« previous entry | next entry »
Jun. 11., 2012 | 04:32 pm
posted by: zebra in pajautaa

Help.. nepieciešams kaudzi word un pdf dokumentu apstrādāt savādākā veidā, kas saistās arī ar kodējuma maiņu. Smuks un godīgs word dokumentiņš, atverot ar Notepad++ izskatās nebaudāms: šādi
Kā varu uzzināt, kas tas par kodējumu un kā to dabūt uz, piemēram, UTF-8?


# | jā, ir doma! | Add to Memories


Comments {8}

Skabičevskis

from: [info]begemots
date: Jun. 11., 2012 - 04:51 pm
#


Es atvainojos, bet Word un PDF dokumenti nav domāti tam, lai tos apstrādātu ar plika teksta redaktoru.

Tas nav nekāds UTF/codepage kodējums, tas ir binārs fails, ko tu mēģini atvērt ar plikteksta redaktoru, kas tev vienkārši nestrādās.

Ja gribi Wordus apstrādāt notepadā(notepad++ vai citā), vispirms tie jānoseivo bez formatējuma: txt formātā

Atbildēt | Diskusija


Zebra

from: [info]zebra
date: Jun. 11., 2012 - 05:02 pm
#

Muļķīgi, ka pašai neienāca prātā - paldies :) Vismaz daļēji tas ārstē.
Man vienk. nepieciešams (automatizēti) saskaitīt vārdu biežumus dokumentos, tāpēc arī formatējums nav svarīgs.

Atbildēt | Iepriekšējais | Diskusija


Skabičevskis

from: [info]begemots
date: Jun. 11., 2012 - 05:04 pm
#

Nujā, tad noseivo txt only, un ieliec pareizo kodējumu jau Wordā (UTF-8, pieņemu).

Man gan šķiet, ka Wordam arī bija kaut kādas opcijas skaitīt vārdus dokumentos, bet neesmu drošs, jo pats nekad neesmu izmantojis, varbūt bija tikai kopējais vārdu skaits doķī.

Atbildēt | Iepriekšējais | Diskusija


Skabičevskis

from: [info]begemots
date: Jun. 11., 2012 - 05:05 pm
#

stp citu,ja nav pārāk lieli teksti pārāk daudzos doķos varbūt noder arī kādi automātiskie online ccounteri, kuros tikai copy/paste jāizdara:

https://www.google.lv/search?aq=0&oq=word+frequency+&sugexp=chrome,mod=12&sourceid=chrome&ie=UTF-8&q=word+frequency+counter

Atbildēt | Iepriekšējais | Diskusija


Zebra

from: [info]zebra
date: Jun. 11., 2012 - 05:41 pm
#

Šitais nederēs, jo apjoms ir mazliet par lielu un rezultāti ir jānoformē specifiskā formātā tālākai apstrādei.

Atbildēt | Iepriekšējais


Zebra

from: [info]zebra
date: Jun. 11., 2012 - 05:41 pm
#

Kā ielikt pareizo kodējumu jau Wordā?

Atbildēt | Iepriekšējais | Diskusija


Skabičevskis

from: [info]begemots
date: Jun. 11., 2012 - 05:52 pm
#

pie save as , kad izvēlāss txt, vajadzētu būt papildizvēlei encoding.

Atbildēt | Iepriekšējais | Diskusija


Zebra

from: [info]zebra
date: Jun. 12., 2012 - 09:23 am
#

Muchas gracias! :)

Atbildēt | Iepriekšējais