Jak umírají data

Patrick Zandl · 12. prosinec 2005

"Takový důl, to je díra v zemi. Ten vám nikdo nevezme," říkal klasik. S daty je to stejné. Jsou bezpečně uložená na pevném disku, disketě, cédéčku. Opravdu bezpečně, stejně jako ten důl v zemi…

Jak umírají data? Proklatě snadno. S počítači pracuji dvacet let, jen o deset let méně, než žiju, prakticky celý svůj tvůrčí život. Kromě první žádosti o patent na hyperprostorový pohon (kterou jsem sesmolil v devíti letech, napsal na stroji a vyvedl mikrotužkou za 19,90 Kčs a patent mi bohužel nebyl uznán) mám prakticky veškeré své „životní dílo“ někde v počítačových datech. Zatraceně dobře vím, jak ta data umírají.

Kupříkladu třídní časopis Opozist Bulletin. Vydával jsem jej na Commodore 64 v nějakém programu, jemuž jsem hrdě říkal DTP a který jsem si za tím účelem i počeštil. Nedávno jsem našel pětačtvrtkové diskety s nápisem Opozist Bulletin archiv v bedně. Chvíli jsem s nimi postával před svým Mini Macem a když jsem žádnou floppynu nevykoukal, hodil jsem je do odpaďáku. I kdybych ji vykoukal, není mi vůbec jasné, jak bych formát Commodore 64 na Macu nebo na PC vůbec přečetl a i kdybych ho přečetl, netuším, jakým programem bych ho otevřel. Vždyť i to kódování bylo ještě z doby před Kamenickými … a to neberu v potaz, že to DTPko ukládalo data binárně. Inu, Opozist Bulletin se propadl peklu a v digitální formě příštím generacím zachován nezůstane.

Ačkoliv se nedá říci, že by to byla dramatická ztráta pro lidstvo a dost možná ani pro naše gymnázium, přesto je to dobrý příznak toho, jak umírají data. V prvé řadě změnou nosiče a v řadě druhé změnou formátu. Od roku 1992 jsem už pracoval na PC a mám řadu svých textů a článků ve formátu PC. Jenže už dnes je trochu problém pracovat s formátem Text602, nejjistější cestou je ručně opravit špatně rozpoznané znaky a pracovat s tímto formátem jako plain ascii nebo doinstalovat prastarý importní filtr pro Word. A to jsem kdysi měl dost rozumu na to, abych z 5,25 palcových disket přetahal všechno na disk a dodneška mám všechno na disku. Co bych dělal s těmi floppy dneska?

I změna formátu mne dojímá. Například moje prastaré články na Mobil serveru prošly velikým technickým vývojem, kdy se z Genesis 1 stěhovaly do Genesis 2 a pak na Oris. Z těch nejstarších zbyl už jen rozsypaný čaj, který těžko rekonstruovat a to je necelých deset let od jejich vzniku. Co s tím bude za sto let?

Dumali jste někdy nad tím, proč má na sobě sonda Voyager destičku s vyrytými obrázky místo toho, aby nesla o dost lehčí a datově výtěžnější štůsek CDček nebo rovnou pevný disk s encyklopedií Britanikou (a DRM, protože co by si to nějaký zelený tlamy měly warezit, jedna kopie a dost!)? Inu, důvod je jednoduchý. U technicky vyspělých civilizací bychom se mohli dost ztrapnit, ty méně vyspělé by zase nepochopily, co je to za stříbrné kotoučky. Nehledě na to, že plastový kotouček asi vydrží méně, než deska ze slitiny potažená zlatem, alespoň v případě, že není připevněná na baráku v Karlíně.

Podobný problém máme my s výzkumy starých civilizací i výzkumy vesmíru. Pokud připustíme hypotetickou možnost Atlantidy nebo nějaké jiné zničené civilizace a začneme se jí zabývat, dostáváme se ke stejným problémům, jako při honu na ufony. A totiž, jak jsme schopni interpretovat jejich data? Pokud Platón nekecal, mohla na tom být Atlantida mentálně o něco dále, než my. Mohla tedy i data uchovávat poněkud sofistikovaněji, než předpokládáme. Takových mylných předpokladů už jsme pár v archeologii zažili. Například ty zlaté kuličky, o nichž jsme původně předpokládali, že jsou kuličkovou hrou bohatých spratků ranného středověku, se ukázaly ve skutečnosti být platidlem, což se zjistilo až v momentě, když se někdo v Evropě obtěžoval přečíst si zápisky arabáckého cestovatele z doby pár set let před americkou invazí do Iráku. A takový omyl je mrcha, protože jako šperk nebo hru můžeme odsoudit v podstatě cokoliv. Například ty naše CDčka – jsou všude, jsou oblíbená, ukládáme je pečlivě do krabiček. Když odmyslíte, co o nich víte a necháte shnít booklety tisíc let v zemi, najednou zjistíte, že jsou to fakt spíše šperky populární v dávnověku druhého tisíciletí – ale patrně byste o nich nepředpokládali, že jsou to nosiče informací. Jenže stejně jsme u kosmických signálů - je to ještě šumění vesmíru, nebo už je to sofistikovaný signál?

Archeologie a historie pracuje s tezí, že vývoj jde stále kupředu, tedy všechno, co najdeme, jde vysvětlit z hlediska toho, co známe dnes. Že nemůže existovat něco, co bychom dnes nedovedli zrekonstruovat, vysvětlit. Něco, co bychom dneska nevěděli. Historik je pak strašně nakvašený, když se poukazuje na výjimky. Pyramidy jsou omleté téma – spíše předpokládáme, než víme. Vezměme jiný příklad, šperk nalezený v bagdádských vykopávkách. Zlatá náušnice posetá maličkými kuličkami zlata. Rozkošná. Drobný problém byl v tom, že současná věda takovéto kuličky uměla vytvořit s velkými obtížemi a to pouze ve stavu beztíže, o němž se předpokládalo, že byl bagdádským zlatníkům za doby perské říše nedostupný. Skvělá příležitost pro knihu o stycích Bagdádu s ufony, taky záhy vyšla.

Pak se ukázalo, že bagdádští zlatníci znali dost dobrý trik, kdy se zlato lilo do prášku z uhlíku a ještě něčeho, čímž se ty kuličky vytvořily a dalším trikem, jehož podstatu si nepamatuju, se uchytily na té náušnici. Trik se odhalil náhodou (našel se popis té metody z pozdější doby pro jiný případ a někdo bystrý si to spojil) a dost pozdě na to, aby z knihy nebyl slušný trhák. Znali podobný trik na slitiny, které se podle moderní vědy dají připravit rovněž jen ve stavu beztíže, nebo v tomto případě už muselo jít o ufony?

U starších civilizací narážíme na předpoklad, že musely být pitomější, než my a tedy ty kovové kostičky mayských civilizací jistě jsou na hraní a nemohou obsahovat informace zapsané gravitační indukcí, holografickým záznamem nebo ještě něčím jiným, čemu jsme ani nedali jméno, natož abychom věděli, jak to funguje. U civilizací mimozemských narážíme na to, že ani my sami nutně nemusíme uvažovat stejně (a to myslím diametrálně), jako oni a navíc nemusíme být ani na stejné technické úrovni. Přitom jde o maličké rozdíly – například vysílání GSM by vědci v roce 1940 velmi pravděpodobně nebyli schopni rekonstruovat ani v případě, že by nebylo šifrované, ačkoliv technicky jej byli schopni zachytit i zpracovat. O půl století později jde o běžně používanou technologii. Ještě horší je to s CDMA a dalšími moderními technikami.

Přemýšleli jste, jaký je rozdíl mezi analogovým a digitálním zařízením? Definic je spousta, ale nejjednodušším rozlišením zřejmě zůstane to, že zatímco analogovou informaci jsme schopni bezprostředně vnímat, digitální už člověk není schopen přímo zpracovat a musí ji vědomě rozšifrovávat offline. Dá se to nacvičit a z toho pohledu je morseovka někde mezi, protože ji dobrý radista je schopen okamžitě vnímat a vysílat jí, aniž by použil mezistupeň dešifrace, ale ačkoliv by technicky zřejmě bylo výhodnější v běžném hovoru používat CDMA, stále používáme klasický analog. Prý proto, že lidský mozek nemá dostatečnou kapacitu na to, aby CDMA mohl používat, zato má dost abstrakce na to, aby mohl výhody CDMA vytěžit i bez CDMA.

Ve výsledku znamená jakákoliv digitalizace dat značné ohrožení, protože jakmile dojde ke změně média či formátu, jsou data ohrožena plíživou pochybností, zda je vůbec má smysl převádět. Na druhou stranu je ale také pravděpodobné, že v budoucnosti nebudeme schopni efektivně (nebo alespoň trochu efektivně) pracovat s jinými, nežli digitálními daty. Budeme za tisíc let schopni vystopovat události před rokem 1995, kdy se začaly informace objevovat na internetu, nebo tuto dobu budou naši potomci považovat za dobu temna stejně tak, jako my dnes považujeme starověk? Umírání dat nebo absence jejich převodu do moderních digitálních forem přitom představuje vážnou hrozbu tomu, co budou o naší době vědět naši potomci.

Ve výsledku, pokud se chceme vyvarovat umírání dat, musíme buďto vypracovat důsledný přechodový postup z formátů a médií, nebo – a to spíše či navíc – důležitá data zálohovat i v analogové formě, například vytištěné. Takhle totiž přechovávám svá starší dílka já – hezky na papíře a když je potřebuju, tak OCR…

Takže pokud jde o data, nikdy nespoléhejte na moderní formy jejich ukládání – nebudou tu provždy. A pokud jde o věci, nikdy nevěřte tomu, na co vypadají na první pohled – třeba je to nosič dat a ne pivní tácek z doby kolem přelomu digitálního věku…

Chcete tyto články emailem?

Twitter, Facebook, Opravit 📃