|
[Nov. 19th, 2018|09:23 am] |
Kundzīte nogalē lasīja žurnalus intervebza arhīvā. Smuki novelc PDF, lasi, nepisies. Sāku domāt, vai mums ar maz ir kas tāds, kur varētu palasīt Mazputniņu onlainā. Izrādās, ir un var. periodika.lv, kuriē LNB. Jauki. Tikai gandrīz viss, kam mēģinu piekļūt, ir pieejams tikai lasīšanai uzvietas. Pamēģināsim izvilkt status.
Tātad, kalendārīts pirmajā lapā piedāvā rakstus no až 1748. gada. Foršiņi, foršiņi. Cik ir kopā pieejami - statistikas nav. Labi, mēs paši savus status taisīsim. Izvērstajā meklēšanā ievadam laika posmu 01.01.1500 - 19.11.2018. Tobiš visu, lūdzu!
Atrasti: 11347063 rezultāti. Tas ir nedaudz virs 11 miljōniem. OHO Publiski pieejams: 871068 jeb 7.6%
Ok, pieņemsim, ka viena liela daļa no pēdējos 30-50 gados sarakstītā ir aizsargāta ar autortiesībām. https://likumi.lv/doc.php?id=5138 saka, ka autortiesības saglabājamas līdz pat 70 gadiem pēc autora nāves. Ok, meklējam tad līdz 1948. gadam sarakstīto: Atrasti: 6570445 rezultāti jeb 6.5 miljōni Publiski pieejams: 27339 jeb mazāk kā 0.5%
Aptuveni trešā daļa ir vācu valodā.
Pat, ja izslēdzam visus bārņdarbus (legālā pelēkā zōna), 6478836, mums atliek 91 609 darbi, no kuriem joprojām ir pieejami knapi 30%.
Tātad, jautājums studijā: HUĻI MĒS NEVARAM LASĪT VISU TO ČERNI INTERNETĀ? |
|
|
Comments: |
From: | santech |
Date: | November 19th, 2018 - 10:40 am |
---|
| | | (Link) |
|
Atsevišķu personu algot skenēšanai par minimālo algu neviens negrib vai neviens negrib tā iet un darīt. Kā papildus darbu neviens negrib darīt, jo ir augstākas prioritātes. Nu tas tā, ja tie darbi vēl jāieskenē. Bet nu principā ideja kā tāda.
10 gadus atpakaļ tika izgāzti miljōni esošo skanu OCRam. Mūsdienās viss tiek drukāts no jau digitalizētiem resursiem, no kuriem uzģenerēt PDFus ir kā apmīzt 2 pirkstus.
Par to, kas ir pieejams, vai nav pieejams, var spriest no viņu apraksta par sistēmu: "Latvijas Nacionālās Digitālās bibliotēkas (LNDB) mērķis ir nodrošināt Latvijas Nacionālās bibliotēkas un tās sadarbības partneru digitalizētā kultūras mantojuma pieejamību internetā."
ERGO - viss, kas ir minēts datubāzē, jau IR digitalizēts. Tā nav visu materiālu datubāze, bet gan visa DIGITALIZĒTĀ materiāla datubāze.
From: | unpy |
Date: | November 19th, 2018 - 11:23 am |
---|
| | | (Link) |
|
Labdabīgi domāju, ka nav automātiskā algoritma, kas, pienākot attiecīgajam gadam, pārmet ar autortiesībām aizsargātos darbus uz tādiem, kuri aizsargāti nav. Ikdienā lasu periodika.lv un ļoti reti ir sarežģījumi ar darbiem, kuri ir ieskenēti un vecāki par 1945. gadu.
Piedāvāju vienu skaidrojuma variantu (bez nojausmas, vai tas ir īstais):
ja grib stingri ievērot principu "70 gadi pēc autora nāves", un attiecina to uz jebkuru raksta galu avīzē, un pieņem, ka autors var nodzīvot 100 gadus pēc teksta uzrakstīšanas, tad puslīdz droši varētu rīkoties ar periodiku līdz 1848. gadam (2018 - 70 - 100). Tā kā konkrēta teksta autoru nereti ir grūti identificēt, tad ierobežo visa izdevuma/numura pieejamību.
Nezinu kā ar neidentificējamiem autoriem, bet, ja attiecīgajā lappusē kaut viens darbs ir aizsargāts ar autortiesībām, tad nav pieejama visa lappuse. Vecajās avīzēs ar lielizmēra loksnēm un daudziem maziem rakstiņiem tā ir milzu problēma. | |