Sviesta Ciba |

Ģ (

smejmoon) rakstīja

koderi kopienā,
@ 2006-09-10 13:46:00

Nez', Windows Vistā failu sistēmas enkodings būs unicode vai vēl joprojām mbcs?

varbūt es neuzdodu pareizos jautājumus :) lūdzu padalieties ar linkiem.

(Ierakstīt jaunu komentāru)

	neons 2006-09-10 13:50 (saite)
	Pats saprati, ko pajautāji? (Atbildēt uz šo) (Diskusija)

	smejmoon 2006-09-10 13:57 (saite)
	"failu vārdu enkodings". nav tā, ka saprastu, tapēc jau prasu :) kur var palasīties, kā windows taisās glabāt failu vārdus vistiņā? (Atbildēt uz šo) (Iepriekšējais) (Diskusija)

	neons 2006-09-10 14:08 (saite)
	"enkodings būs unicode vai vēl joprojām mbcs" un kas, tavuprāt, ir utf7 un utf8? Unikoda reprezentācijas vai MBCS? Gribu vērst uzmanību uz to, ka unicode un MBCS nav savstarpēji nesavienojamas lietas. (Atbildēt uz šo) (Iepriekšējais) (Diskusija)

	smejmoon 2006-09-10 14:22 (saite)
	windows mbcs nevar reprezentēt visus unicodes simbolus (neesmu pārskaitījis). utf-7,8 var. un man kautkā ir apnicis tas čakars ar lokālajiem enkodingiem. (Atbildēt uz šo) (Iepriekšējais) (Diskusija)

	neons 2006-09-10 15:00 (saite)
	Bet nu jebkurā gadījumā jautājums ir uzdots nekorekti, jo par MBCS sauc jebkuru kodējumu, kur baitu skaits simbola reprezentēšanai ir atšķirīgs un atkarīgs no lietotā simbola. Tik smalki nezinu, bet vai Windows gadienā nelietoja DBCS, tb, vienkārši kaut ko līdzīgu utf-16? (Atbildēt uz šo) (Iepriekšējais) (Diskusija)

	smejmoon 2006-09-10 15:10 (saite)
	jā, tu nezini. ir vairākas windows versijas un tagadējās ir daudz drazas ar enkodingiem, lai saglabātu atpakaļsavietojamību ar senām failu sistēmām un dažādi iekodētiem dokumentiem. mans jautājums ir par to, kāda sistēma tiks lietota failu vārdu kodēšanai nākamajā windows versijā. (Atbildēt uz šo) (Iepriekšējais)

	tidliibums 2006-09-10 17:43 (saite)
	Nekorekts jautājums - ābolus ar apelsīniem nevar salīdzināt. Unicode ir tikai simbolu kopa, nevis tās attēlojums baitos. (Atbildēt uz šo) (Diskusija)

	tidliibums 2006-09-10 17:46 (saite)
	(un mbcs vispār ir mistisks zvērs) (Atbildēt uz šo) (Iepriekšējais)

	(Anonīms) 2006-09-11 10:55 (saite)
	Kurus unicode simbolus tad windows nevar attēlot? (vienkārši līdz šim ar tādiem nebija sanācis saskarties)(windowā xp ar NTFS vienā direktorijā var būt faili ar nosaukumiem, kuri satur latviešu, krievu un japāņu burtus (ir izmēģināts)) (Atbildēt uz šo) (Diskusija)

	smejmoon 2006-09-11 11:39 (saite)
	no lielajām tautām korejiešiem ir problēmas. es gan vairāk gribētu, lai tie win-12xx kodējumi mirst; (Atbildēt uz šo) (Iepriekšējais) (Diskusija)

	(Anonīms) 2006-09-11 13:04 (saite)
	tie nevar mirt un nemirs, kamēr būs pilna pasaule ar tikai SBCS saprotošām programmām ko tieši gribēji noskaidrot, sākotnējo jautājumu uzdodot? un kā Tev traucē tie win-12xx? (Atbildēt uz šo) (Iepriekšējais) (Diskusija)

	smejmoon 2006-09-11 13:40 (saite)
	Gribēju noskaidrot, kāda būs Windows enkodingu politika nākošajā versija. Traucē dažādi: visbiežāk e-pasti atnāk nejēgā iekodēti un pārkodēti. (Atbildēt uz šo) (Iepriekšējais)

wasted
2006-09-11 13:38 (saite)

Pēc visa spriežot, Windows NT jau kopš Windows 2000 iekšēji izmanto UTF-16. Tavs jautājums varbūt ir "nepareizs", taču, ņemot vērā to, kā visi šie termini tiek mētāti apkārt pa tīmekli, tā uzdošana nepārsteidz.

Ieteicamā literatūra:

par Unicode un rakstzīmju kopām MSDN bibliotēkā (atbaidoša navigācija: daudz staigāšanas šurp un turp, lai gūtu vairāk vai mazāk skaidru priekšstatu);
par Unicode (oficiālā lapa, vērts sākt ar FAQ);
un raksts Vikipēdijā par mainīga platuma kodējumiem, no kura veltīt uzmanību vērts piezīmei par Microsoft un MBCS.

(Atbildēt uz šo) (Diskusija)

	bubu 2006-09-11 14:39 (saite)
	Cik es palasījos, tad Windows iekšēji lieto UTF-16, kas nebūt neatrisina visu. Jo unikodiskās API fjas sagaida fiksēto 2-baitu UCS-2 kodējuma tekstu, kas ir UTF-16 apakškopa. Anonīmais: UCS-2 nevar attēlot simbolus, kuri aprakstīti šeit: http://en.wikipedia.org/wiki/Basic_Multilingual_Plane#Supplementary_Multilingual_Plane (Atbildēt uz šo) (Iepriekšējais) (Diskusija)

wasted
2006-09-11 17:37 (saite)

Par tiem diviem baitiem Tev taisnība (16 biti, ja precīzi), taču, cik noprotu, tas ir UTF-16, nevis UCS-2. UTF-16 viena rakstzīme tiek kodēta 16 bitos tad, ja tā ir no BMP, rakstzīmes ārpus tās tiek kodētas izmantojot aizvietotājpārus (vārds, kuru tikko izdomāju; angliski "surrogate pairs"). MSDN ir raksts arī par tiem: Surrogates and Supplementary Characters.

Protams, ņemot vērā, ka vēl vakar par to nezināju pilnīgi neko, iespējams, ka diezgan pamatīgi kļūdos. :)

(Atbildēt uz šo) (Iepriekšējais) (Diskusija)

	bubu 2006-09-11 18:48 (saite)
	Hm, man bij licies, ka visas šitās xxxW fjas (pirm CreateFileW) sagaida wchar, kas ir 2-baitīgs charakters, tātad UCS-2. A izrādās ir vēl slimāk nekā varētu būt.. (Atbildēt uz šo) (Iepriekšējais)

Navigate: