Ģ ([info]smejmoon) rakstīja [info]koderi kopienā,
@ 2006-09-10 13:46:00

Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Nez', Windows Vistā failu sistēmas enkodings būs unicode vai vēl joprojām mbcs?

varbūt es neuzdodu pareizos jautājumus :) lūdzu padalieties ar linkiem.


(Lasīt komentārus) - (Ierakstīt jaunu komentāru)


[info]bubu
2006-09-11 14:39 (saite)
Cik es palasījos, tad Windows iekšēji lieto UTF-16, kas nebūt neatrisina visu. Jo unikodiskās API fjas sagaida fiksēto 2-baitu UCS-2 kodējuma tekstu, kas ir UTF-16 apakškopa.

Anonīmais: UCS-2 nevar attēlot simbolus, kuri aprakstīti šeit: http://en.wikipedia.org/wiki/Basic_Multilingual_Plane#Supplementary_Multilingual_Plane

(Atbildēt uz šo) (Iepriekšējais) (Diskusija)


[info]wasted
2006-09-11 17:37 (saite)

Par tiem diviem baitiem Tev taisnība (16 biti, ja precīzi), taču, cik noprotu, tas ir UTF-16, nevis UCS-2. UTF-16 viena rakstzīme tiek kodēta 16 bitos tad, ja tā ir no BMP, rakstzīmes ārpus tās tiek kodētas izmantojot aizvietotājpārus (vārds, kuru tikko izdomāju; angliski "surrogate pairs"). MSDN ir raksts arī par tiem: Surrogates and Supplementary Characters.

Protams, ņemot vērā, ka vēl vakar par to nezināju pilnīgi neko, iespējams, ka diezgan pamatīgi kļūdos. :)

(Atbildēt uz šo) (Iepriekšējais) (Diskusija)


[info]bubu
2006-09-11 18:48 (saite)
Hm, man bij licies, ka visas šitās xxxW fjas (pirm CreateFileW) sagaida wchar, kas ir 2-baitīgs charakters, tātad UCS-2. A izrādās ir vēl slimāk nekā varētu būt..

(Atbildēt uz šo) (Iepriekšējais)


(Lasīt komentārus) -

Neesi iežurnalējies. Iežurnalēties?