- 14.10.08 00:35
- Datorpuikām.
Uzminiet nu cik UTF8 ne latīņu simbolu skaitu Mysql 3.23 glabā kolonā varchar(50). Pareizi, visticamāk ap 25 vai mazāk. Ko Mysql 3.23 dara ar pēdējo burtu, kurš aizņem vairāk kā 1 baitu? Pareizi, sagriež uz pusēm tā, ka jaunākā versijā sakarīgi ieimportēt nevar.
Jautājums: ir kāds tūlītis vai koda rindiņas, kas ātri palīdzēt likvidēt pussimbolus teksta failā?
Tas saucās gribēju ārpus darba laika izdarīt kaut ko labu.
Pēdējā cerība uz šī gada skaistā projektiņa daļu ātru scrapošanu priekš došanas Eiropai.
Update
Smejmoon palīdzēja dikti. Pilnai laimei vēl db dati izrādās saglabāti ar php magic_quote ķeskām. - 3 rakstair doma
- 13.10.08 22:06
-
imho bez stringa parseeshanas to nevar.
vareetu uzlaist softu, kas nesaprotamo simbolu vietaa ieliek \0 - Atbildēt
- 13.10.08 22:10
-
http://www.python.org/doc/2.5.2/lib/str
ing-methods.html
string.decode("utf-8", "ignore").encode("utf-8")
neesmu testeejis; mosh ignore vietaa tev vajag "replace". :) - Atbildēt
- 13.10.08 22:14
-
>>> "asdadass\xFEdarka darka".decode('utf-8', 'ignore').encode('utf-8')
'asdadassdarka darka' - Atbildēt