Tuesday, August 22, 2017

עושים היסטוריה 127 - להציל את פרוייקט דומסדיי - על שימור מידע דיגיטלי (Hebrew, English, 2013)



mp3 (Hebrew)
mp3 (English)

בשנת 1986 יזמה רשות השידור הבריטית, ה-BBC, פרוייקט שאפתני במיוחד: תיעוד גורף, בעזרת מאות אלפי מאמרים ותמונות, של החיים בבריטניה המודרנית. הפרוייקט הושלם בהצלחה- אך 15 מאוחר יותר עמד בפני מוות משונה ואכזרי במיוחד: הוא נשמר על דיסקים שאיש לא יכל עוד לקרוא…האם נוכל להציל את פרוייקט דומסדיי, ואת אינספור פיסות המידע שאנחנו מייצרים מדי שניה, מתהומות הנשייה?


In the 1980’s, the British BBC invested millions of pounds on what should have been a technological marvel: a modern version of the famous medieval Domesday Book. Less then 15 years later, it’s system was unusable. Compare that expensive failure to the longevity of the Domesday Book: a record written on paper in Latin in the 11th century and is still readable today. What can these two case studies tell us about the challenges and potential solutions to Digital Preservation?
http://www.ranlevi.com/2013/04/30/ep127_digital_preservation/
http://www.cmpod.net/digital-information-preservation/

Ниже есть продолжение.

DC היא חברת מחקר אמריקנית שמתמחה בתחום התקשורת וטכנולוגית מידע. בכל שנה עורכת IDC סקר מקיף ובו היא מנסה להעריך כמה מידע – ספרים, תמונות, קבצי קול, סרטים וכו'- הפיקו כל בני האדם יחד, עד כה. קשה לדעת עד כמה אמינים הנתונים המתקבלים ממחקר כה שאפתני, ו-IDC כבר ספגה ביקורת בעבר על מחקרים לא מדויקים – אבל לכל הפחות, מחקריה של IDC מספקים לנו הערכה גסה לגבי נפח המידע שמייצרת האנושות כל שנה.

למשל, בשנת 2005 העריכה IDC כי נפח סך כל המידע האנושי הוא 130 אקסה-בייט. 'בייט' (Byte) היא יחידת מידע דיגיטלית בסיסית, שוות ערך לאות בודדת. 'אקסה-בייט' הם עשר בחזקת שמונה עשר בתים. כמה גדול הוא אקסה-בייט? אם נניח, לשם הדוגמא,, שנפחו של פרק ממוצע של עושים היסטוריה הוא חמישים מגה בייט – אזי אקסה בייט אחד הוא עשרים ושלושה מיליון שנה של האזנה רצופה לתכנית…

ב-2012, שבע שנים מאוחר יותר, היה נפח המידע שברשות האנושות 2800 אקסה-בייט, או במילים אחרות – פי עשרים מנפח המידע ב-2005. המשמעות היא שסך כל נפח המידע האנושי יותר מאשר מכפיל את עצמו בכל שנה. בעידן המצלמות הדיגיטליות, עיבודד התמלילים הממוחשב ובלוג לכל גולש, קל יותר מאי פעם ליצור מידע חדש. ב-2020, מעריכים ב-IDC, נפח המידע יגיע ל-40 זטה-בייט,, או 40 אלף אקס-בייט.

הארכיאולוגים של ימינו נאלצים לעבוד קשה בחפירות, שחזורים ואיחוי שברים של כדי חימר כדי לנסות וליצור תמונה אמינה של איך נראו החיים בימי קדם: כמות המידע שזמינה עבורם היא זעומה. על פניו, שפע המידע שאנחנו מייצרים היום אמור להוות ברכה לארכיאולוגים ולהיסטוריונים של העתיד: לא צריכה להיות להם שום בעיה להבין מי היינו ומה חשבנו. אחרי הכל, אנחנו מתעדים את חיינו באינספור דרכים – מסרטים ועד בלוגים.

אבל שום דבר אינו פשוט כמו שהוא נראה. כפי שמייד ניווכח, שפע המידע הדיגיטלי שאנחנו מייצרים מביא עימו בעיות חדשות ומסובכות שיציבו בפני הארכיאולוגים אתגרים חדשים ואולי אף ישנו כליל את פניו של מקצוע הארכיאולוגיה.
ספר דומסדיי

בשנת 1066 ניצח הדוכס וויליאם מנורמנדי את המלך הרולד השני, והוכתר למלכה של אנגליה. להיות מלך, גילה וויליאם, זה לא עניין זול: צריך לשלם לחיילים, לבנות מבצרים ועוד הוצאות מעיקות שכאלה. מקור ההכנסה העיקרי של הממלכה היה, אז כמו היום, המיסים ששילמו האזרחים – אך בבלגן המלחמות והסכסוכים כבר לא היו אנשי האוצר בטוחים מי צריך לשלם כמה.

מכיוון ש'קו הצדק' עדיין לא היה זמין באותה העת, החליט וויליאם ב-1086 לצאת למבצע אדיר וחסר תקדים: באופן מפתיע, זה לא היה מבצע צבאי, אלא מבצע סטטיסטי. הוא שלח את נציגיו לתור את כל אנגליה לאורכה ולרוחבה, ולתעד באופן מדויק ככל האפשר מי בעליה של כל חלקת אדמה, כמה כסף יש לכל אזרח ובמה הוא עוסק למחייתו. כל הנתונים אוגדו לשני כרכים, אשר יחד זכו לכינוי "ספר דומסדיי" (Domesday), שם שלקוח מה- Doomsday הנוצרי (נשמע זהה, אך באיות אחר), הוא 'יום הדין'. ביום הדין, על פי המסורת, יישפט כל אדם על מעשיו הטובים והרעים, משפט שלא ניתן לערער עליו. באותו האופן, המידע שמופע אודותיך בספר דומסדיי קובע כמה כסף אתה חייב למלך, וגם עליו לא ניתן לערער.

ספר דומסדיי שרד עד ימינו. אם יש לכם קשרים בארכיון הלאומי הבריטי וידע מוצק בלטינית מדוברת, אתם יכולים לדפדף בו ולקרוא את תוכנו. עבור ההיסטוריונים, ספר דומסדיי הוא מתנה משמיים: אין מסמך היסטורי שמתאר באופן שלם ושיטתי כל כך רגע בחייה של מדינה שלמה.

פרוייקט דומסדיי

בשנת 1986 החליט שירות השידור הבריטי, ה-BBC, לציין 900 שנים לספר המיוחד הזה, ולצאת במבצע שאפתני משלו. "פרוייקט דומסדיי" של ה-BBC היה המקבילה המודרנית של ספר דומסדיי העתיק: ניסיון ללכוד באופן מקיף רגע בחייה של האומה הבריטית. מיליון איש, ברובם ילדי בית ספר מכל רחבי בריטניה, כתבו על חיי היומיום שלהם, על העיר בה הם חיים והקהילה לה הם שייכים. ב-BBC אספו כמאה וחמישים אלף דפי טקסט, עשרים אלף תמונות ומאות מפות, נתונים סטטיסטיים וסרטונים. את כל המידע הזה התכוונו ב-BBC לשמור באופן דיגיטלי על גבי מחשבים אישיים זולים יחסית, להנאתם והשכלתם של ילדי בית הספר.

אחרי סקירה מקיפה של האפשרויות הקיימות, בחרו ראשי הפרוייקט בטכנולוגיית אחסון חדשנית ומבטיחה בשם 'לייזר דיסק'. הם דחסו את המאמרים, המפות והסרטונים לתוך שני דיסקים: הראשון כונה 'דיסק הקהילה' והכיל בעיקר את המאמרים והתמונות שתרמו האזרחים מרחבי בריטניה, והשני היה 'הדיסק הלאומי' שהכיל מידע מקצועי ו'ממוסד' יותר כגון תמונות מקצועיות, גרפים וטבלאות סטטיסטיות, סרטונים ועוד. אחת ממטרות הפרוייקט הייתה לאפשר למשתמשים גישה נוחה וקלה למידע שעל הדיסקים, ולצורך העניין פותחה תוכנה מיוחדת שבאמצעותה ניתן היה לאתר מאמר או תמונה מסוימת לפי מילות חיפוש, תפריט, מיקום על מפה ועוד. מכיוון שהמחשבים האישיים היו אז רק בחיתוליהם, ב-BBC פיתחו נגן לייזר דיסק ייעודי שהיה מסוגל לקרוא את שני הדיסקים ולהציג את תוכנם על גבי מסך טלוויזיה רגיל.

הפרוייקט השאפתני הסתיים בזמן ועמד במסגרת התקציב שהקוצתה לו, אך לרוע המזל לא זכה לפופולאריות רבה. הערכה שהכילה את נגן הלייזר ושני הדיסקים נמכרה בכ-5000 פאונד, סכום גבוה שמעט מאד בתי ספר וארגונים ציבוריים היו יכולים להרשות אותו לעצמם. כתוצאה מכך, עותקים ספורים בלבד של פרויקט דומסדיי הופצו בקרב הציבור, והמזם לא הצליח להחזיר את ההשקעה בו. אף על פי כן, כל מי שהיה מעורב בו היה גאה לקחת בו חלק: בסופו של דבר מדובר במעין 'קפסולת זמן' איכותית ומושקעת, שללא ספק תהיה חשובה ומועילה להיסטוריונים של העתיד כפי שספר דומסדיי, זה העשוי נייר, מועיל להיסטוריונים של ימינו.

אך כתבה שהתפרסמה בעיתון הבריטי The Observer בשנת 2002 חשפה מציאות שונה ועגומה: חמש עשרה שנים בלבד לאחר שנוצר, המידע האצור בתוך הלייזר-דיסקים היה כעת כמעט בלתי נגיש. שני מיליון וחצי הפאונד שהושקעו בפרוייקט דומסדיי הדיגיטלי ירדו לטימיון: אף תלמיד בית ספר או אזרח סקרן אינו יכול לקרוא את המאמרים או לצפות בתמונות.

הסיבה, כפי שאולי כבר ניחשתם, הייתה שטכנולוגיית הלייזר דיסק לא תפסה אחיזה בקרב הציבור הרחב ולא החזיקה מעמד זמן רב. הקומפקט-דיסק, שנכנס לשימוש כמה שנים בלבד לאחר שנסתיים פרוייקט דומסדיי, דחק את רגלי הלייזר דיסק. היצרנים הפסיקו לייצר את הרכיבים האלקטרוניים המתאימים, וב-2002 היו רק כמה ערכות דומסדיי בודדות שנותרו פעילות, רובן במוזיאונים וארכיונים. ההשוואה המתבקשת לספר דומסדיי, שניתן לעלעל בו גם כמעט אלף שנה לאחר שנכתב, לא הייתה מחמיאה במיוחד- או כפי שהגדיר זאת מומחה מחשבים שהתראיין לכתבה: 'יש לנו מזל ששייקספיר לא כתב את המחזות שלו על PC.."
בעיית השימור הדיגיטלי

סיפורו של פרוייקט דומסדיי הוא דוגמא מייצגת לאתגר שבפניו אנו ניצבים כשאנו מבקשים לשמר מידע דיגיטלי. אקדים ואומר שחלק גדול מהדברים שנדון בהם תקף גם לגבי שימור מידע שאינו דיגיטלי, כמו מוזיקה על גבי תקליטי ויניל או קלטות אודיו.

בחלוקה גסה ניתן להפריד את בעיית השימור לשלושה מרכיבים עיקריים. הראשון הוא שימור המדיה שעליה מאוחסן המידע- למשל, דיסקים, קסטות וכו'. השני הוא שימור המערכות שקוראות את המידע מהמדיה- למשל, נגן DVD ופטיפון. המרכיב השלישי הוא שימור התוכנה שבעזרתה מפוענח המידע הדיגיטלי הגולמי ומומר לתמונות, אותיות, קול וכו'.

נפתח תחילה דווקא ברכיב השני: שימור המערכות שקוראות את המידע הדיגיטלי, האפסים והאחדות, מתוך המדיה עליה הם מאוחסנים.

ספר נייר יכול להכיל רק כמות מועטה של מידע: עשרות עד כמה מאות אלפי מילים, בדרך כלל, ועוד כמה תמונות או תרשימים. דיסקים, שבבים ואמצעי איחסון מודרניים דומים יכולים להכיל נפח אדיר של מידע: אנציקלופדיות שלמות, סרטים, קטעי קול ועוד. אך היכולת לדחוס כמויות גדולות של מידע דיגיטלי לתוך אמצעי איחסון אלה כרוכה תמיד בשימוש במערכת שתתווך בינינו ובין המדיה עליה שמור המידע. כדי לקרוא טקסט שנכתב על דף נייר צריך רק זוג עיניים, אך כדי לקרוא טקסט ששמור על דיסק-און-קי או CD, צריך מחשב שמסוגל לקרוא מהם את המידע הדיגיטלי ותוכנה שתפענח את האפסים והאחדות ותמיר אותם בחזרה לאותיות, מספרים, תמונות שאנו מסוגלים להבין.

ב-BBC נפלו קורבן לבחירה חסרת מזל בטכנולוגיית אחסון שלא החזיקה מעמד הרבה זמן, אבל קשה להאשים אותם. טכנולוגיות רבות נעלמו בשלושים השנים האחרונות: לרבים מאיתנו יש בבית היום תקליטי ויניל ישנים, סרטי פילם, דיסקטים עתיקים, קסטות וידיאו ועוד התקני אחסון שמתיישנים לאיטם במגירות חשוכות- כולם קורבנות של התיישנות טכנולוגית מואצת.

סביר להניח שהעלמותם של כונני ה-DVD, הפטיפונים ודומיהם תקשה על הארכיאולוגים העתידיים לחלץ את המידע מהדיסקים והתקליטים שברשותם- אבל לא יותר מדי. ברגע שמבינים איך בדיוק מיוצגים אפס ואחד על פניו של DVD, למשל, קל יחסית לבנות מכונה שתחליף את כונן ה-DVD ותקרא את תוכן הדיסק. הבעיה המשמעותית יותר היא שבלעדי הכוננים והנגנים, יכול להיות שרק חלק קטן מהמידע הקיים בימינו יצליח לשרוד מאות שנים. מדוע?
הצורך בגיבוי

כל מדיית אחסון מידע פגיעה לבלייה טבעית. דיסקים קשיחים, למשל, רגישים במיוחד לבלאי מכני: דיסק קשיח טיפוסי מחזיק מעמד שלוש עד חמש שנים בממוצע לפני שתקלה במנוע או באלקטרוניקה הרגישה מוציאה אותו מכלל פעולה. קומפקט דיסקים ו-DVD, במיוחד כאלה שנצרבו בבית ולא במפעל, מחזיקים מעמד עשר עד חמש עשרה שנה. אם יש לנו בבית דיסק שמכיל מידע חשוב ויקר ערך במיוחד אפשר, למשל, להגן עליו ולהאריך את חייו באופן משמעותי על ידי אחסון בתנאים אופטימליים של לחות נמוכה וכו'- אבל מי מבטיח לנו שילדנו או נכדינו ישמרו על הדיסק באותם התנאים? מי מבטיח ששריפה או הצפה לא יהרסו אותו? וגם אם הדיסק ישרוד, בטווח הארוך תהליכי בלייה איטיים יותר כמו חמצון או התפוגגות הדרגתית של שדה מגנטי יעשו את פעולתם והמידע יימחק.

זו, כמובן, לא בעיה חדשה: גם הנייר האיכותי ביותר מתפורר, בסופו של דבר. הפתרון מאז ומתמיד היה לגבות את המידע על ידי יצירת עותקים חדשים שלו. למשל, חלק ניכר מהספרים ששרדו מימי קדם אל תקופתנו הם ספרים שהועתקו באופן ידני, מילה במילה, על ידי נזירים מסורים.

אך היכולת שלנו לגבות את המידע הדיגיטלי תלויה במידה רבה בזמינותן של המערכות המתווכות. אם אין לנו בבית נגן וידיאו, למשל, אזי כדי לגבות את הקלטות הישנות צריך ללכת למעבדה מיוחדת ולשלם כסף כדי להמיר אותם ל-DVDים. חלק גדול מהאנשים לא יטרחו לעשות זאת, או שייזכרו בקלטות הישנות שלהם רק אחרי שיהיה זה מאוחר מדי והסרטים המגנטיים נרקבו ונמחקו. במילים אחרות, כדי שהמידע יגיע בשלמותו אל העתיד עלינו לדאוג לגבות אותו כאן ועכשיו- ובלעדי הקוראים, הנגנים ושאר המערכות המתווכות, קשה מאד לדאוג לגיבוי מסודר.
גיבוי בענן

ראוי לציין שגם בתנאים אופימליים, גיבוי כמויות גדולות של מידע הוא אתגר לא פשוט. רבים משתמשים בשירותי גיבוי דרך האינטרנט- מה שמכונה 'גיבוי בענן'- אבל גם הפתרון הזה אינו מושלם.

חברות המציעות שירותי גיבוי בענן, כמו 'גוגל' ו'אמזון' למשל, מבינות שאמינות היא שם המשחק ומשקיעות מיליארדי דולרים בהקמת מרכזי מידע ענקיים בכל רחבי העולם, שמצויידים במערכות מיזוג אוויר מתקדמות, גנרטורים לאספקת חשמל חלופית וכדומה. ובכל זאת, תקלות קורות. למשל, אחד התהליכים הרגישים בתחזוקת מרכז מידע שכזה היא שדרוג תכנה, שכמעט תמיד חייב להתבצע תוך כדי עבודה שגרתית, מבלי להפסיק את השירות ללקוחות. תהליך השדרוג הוא כה עדין ומורכב, עד שאחד ממהנדסיה של 'גוגל' השווה אותו להחלפת הצמיגים במכונית תוך כדי שהיא נוסעת במאה קמ"ש בכביש המהיר.

ואכן, בשנת 2009 ארעו בגוגל שתי תקלות שבמהלכן נמחקו כמה אלפי תיבות דואר אלקטרוני ב-Gmail. הסיבה הייתה עדכון תוכנה שהשתבש. למרבה המזל, ב'גוגל' היו מוכנים לאפשרות הזו: כל המידע של המשתמשים היה מגובה מבעוד מועד על קלטות מגנטיות, ושוחזר בתוך מספר שעות. לכמה מלקוחותיה של 'אמזון' לא היה כזה מזל: ב-2011 הודיעה החברה שבעקבות תקלה טכנית אבדו 0.07 אחוזים מהמידע שאוחסן באחד ממרכזי המידע שלה. 0.07 אחוז לא נשמע כמו מספר גדול, אבל עשוי להיות מתורגם בפועל למאות ואלפי ג'יגהבייט של מידע. במילים אחרות, גיבוי לענן הוא פתרון טוב- אבל הוא אינו פתרון קסם.
אחסון מידע בדנ"א

בכל זאת, קיימת 'טכנולוגיה' עתיקה-חדשה שכנראה תהיה לנו לעזר בעתיד: הדנ"א. המולקולה הלוליינית שנמצאת בתוך כל תא חי היא המדיה המושלמת לאחסון מידע, פטנט שהטבע שכלל עד שלמות במשך מיליארדי שנות אבולוציה. גרם אחד של מולקולות דנ"א מסוגל להכיל 2 טרה-בתים של מידע, או פי שניים מדיסק קשיח, ובתנאים מתאימים לשמור עליו במשך עשרות אלפי שנים. עדות טובה לכך היא המידע הגנטי שאנחנו מחלצים כיום משרידיהן של ממותות שהלכו לעולמן בעידן הקרח. היכולת העקרונית להשתמש בדנ"א כמדיה לאחסון מידע דיגיטלי כבר קיימת: לפני כשנתיים הצליחו קבוצה של מדענים אירופאים לשמור כמה עשרות תמונות, קטעי שמע וסונטות של שייקספיר בתוך מולקולת דנ"א, ולשחזר אותם מאוחר יותר בהצלחה.

העובדה שדנ"א הוא המדיה שעליה שומרים כל בעלי החיים בטבע את המידע הגנטי שלהם משחקת לטובתנו באופן נוסף: דנ"א הוא כל כך אוניברסלי, עד שאין כמעט ספק שכל חברה אנושית עתידית בעלת ידע טכנולוגי סביר תהיה מסוגלת לקרוא אותו. התחום נמצא עדיין בחיתוליו, אבל אין כמעט ספק שבתוך כמה עשרות שנים אחסון מידע בדנ"א יהיה נפוץ ויומיומי.
פרוייקט דומסדיי: מאמצי שימור

בחזרה לדומסדיי. לאחר שהתפרסמה הכתבה ב'אובזרבר' והציבור הרחב התוודע למצבו העגום של הפרוייקט, החלו מספר קבוצות ובודדים במאמצי שימור והצלה של המידע שבשני הדיסקים. המשמרים, שחלקם היו חובבים וחלקם באו מרקע אקדמי או מקצועי, פעלו במקביל וברוב הזמן ללא קשר ישיר אלו עם אלו. כזכור, בנוסף לשני הדיסקים הכילה ערכת דומסדיי גם נגן לייזר-דיסק ייעודי. למרבה המזל, כמה מהנגנים פעלו כשורה ובאמצעותם ניתן היה לקרוא את המידע האצור על הדיסק בקלות יחסית. אך כאן נתקלו כל המשמרים במרכיב השלישי ואולי המורכב ביותר של בעיית השימור הדיגיטלי: בעיית התוכנה.

כפי שציינתי קודם, כדי להקל על המשתמשים את הניווט בסבך המאמרים, התמונות והסרטונים שנשמרו על הדיסקים יצרו מהנדסי דומסדיי מערכת של תפריטים וחלונות שבאמצעותה ניתן היה לאתר את המידע הרצוי ולצפות בו. מערכת זו נכתבה בשפת תכנות בשם BCPL. BCPL הייתה שפה מתקדמת לזמנה, וחלק מתכונותיה שולבו מאוחר יותר בשפת C הפופולרית- אבל גם היא, כמו הלייזר-דיסק, יצאה משימוש ומחשבים מודרניים סטנדרטיים אינם מבינים אותה עוד. מכאן שלמרות שבידי המשמרים היה את המידע הגולמי- האפסים והאחדות שאוחסנו על הדיסקים- לא הייתה בידיהם היכולת לפענח אותו ולהמיר אותו בחזרה לטקסט או תמונות. הדבר דומה לתרגיל חשבון שמחקנו ממנו את כל סימני החיבור, חיסור, שוויון וכולי: המספרים עדיין שם, אבל קשה מאד להבין מה הייתה המשמעות המקורית שלהם.
החייאת הפרוייקט

מתכנת חובב בשם אדריאן פירס (Pearce) הצליח בשנת 2004, אחרי מאמצים רבים, לשחזר חלק מאלגוריתם הפענוח ולחלץ חלק גדול מהטקסים והתמונות שהיו בדיסקים. הוא העלה את המידע לאתר אינטרנט שהקים כדי שיהיה זמין לקהל הרחב, כפי שהתכוונו הוגי הפרוייקט במקור. עם זאת, פירס לא הצליח לשחזר את מערכת התפריטים והחלונות, כך שלמרות כל הכוונות הטובות הגולשים באתר עדיין לא זכו לאותה חוויית משתמש מקורית שחווה מי שהשתמש בנגן הלייזר-דיסק המקורי.

יש מי שיראו בחלק זה של המידע, ממשק המשתמש, שולי ולא-חשוב: אחרי הכל, המאמרים והתמונות הם לב ליבו של הפרוייקט, לא? יש בזה משהו, אבל אסור לזלזל בחשיבותו של ממשק המשתמש. דמיינו לעצמם את הארכיאולוג הדיגיטלי העתידי שלנו, בעוד אלף שנה מהיום, מגלה אייפון מהדגם הראשון- ללא ספק תגלית חשובה ששופכת אור על מהפכת הטלפונים החכמים של דורנו. אבל מה יקרה אם הארכיאולוג יצליח לפענח רק את המידע שעל האייפון- תמונות, סמסים וכו'- אבל לא את ממשק המשתמש? סביר להניח שהוא ישבור את הראש בניסיון להבין מדוע כולם התלהבו כל כך מהאייפון כשיצא לשוק, ומדוע המתפללים בכנסיית המק שמול הבית שלו מעלים זבחים לסטיב הקדוש מזה מאות שנים.

אחת הדרכים העקרוניות להתגבר על בעיית התיישנות התוכנה היא להמיר את המידע באופן תקופתי מפורמט לפורמט כדי שניתן יהיה לפתוח אותו בתוכנות מודרניות. למשל, אם יש ברשותנו תקליט ישן ופטיפון תקין אפשר להעתיק את המוזיקה שעליו למחשב ולשמור אותה כקבצי mp3 שכל תוכנה עכשווית יודעת לנגן. כשפורמט ה-mp3 יוחלף בפורמט אחר, נמיר את הקבצים לפורמט החדש- וכך הלאה וכך הלאה, עד אין קץ. זו נראית כמו אסטרטגיית שימור טובה, אבל גם לה יש חסרונות.

במסגרת שימור פרוייקט דומסדיי, למשל, שני מתכנתים נוספים, אריק פרימן (Freeman) וסיימון גווררו (Guerrero), ניסו לחלץ את התמונות שהיו מאוחסנות על הדיסקים. הטכניקה בה השתמשו כדי להמיר את התמונות לפורמט מודרני פגעה באיכותן, והתמונות המומרות לא היו מוצלחות במיוחד. זו דוגמא לבעייה נפוצה בהמרת פורמטים: אין כל בטחון שבזמן ההמרה חלק מהמידע המקורי לא יילך לאיבוד. כמו תמונה שמשכפלים אותה, ואז משכפלים את השכפול, ואת השכפול של השכפול של השכפול וכולי- יש סכנה שאחרי כמה וכמה המרות, התוצאה הסופית תהיה איבוד חלק משמעותי מהמידע המקורי.

במקרה של אריק וסיימון, היה להם מזל: מהנדס בשם אנדי פיני (Finney), שהיה חלק מצוות הפיתוח של פרוייקט דומסדיי בשנות השמונים, איתר בארכיון נידח סרטים מגנטיים ועליהם העתקים באיכות גבוהה של התמונות. מתוך הסרטים המגנטיים (שגם הם החלו להתבלות באופן מורגש) ניתן היה לשחזר את התמונות בהצלחה רבה יותר. אריק וסיימון שיתפו פעולה עם ה-BBC, וב-2011 העלו אתר אינטרנט בשם Domesday Reloaded, שגם בו יכלו הגולשים לעיין במידע ואף לשפר ולהוסיף לו. לרוע המזל האתר אינו פעיל נכון לעכשיו, אם כי הוא אמור לשוב לפעולה בעתיד הקרוב.
אמולציה

קבוצה שלישית שניסתה להציל את הפרוייקט הייתה קבוצה בשם CAMiLEON: צוות של אנשי אקדמיה מאוניברסיטאות אמריקניות ובריטיות. אנשי CAMiLEON נקטו בגישה שונה לגמרי של שימור: אמולציה.

'אמולציה' היא חיקוי. נניח, לשם ההסבר, שאתם מאד רוצים לנסוע לחופשה בתאילנד- אבל אין לכם זמן או כסף. מה עושים? הנה פתרון. קחו חול ושפכו על רצפת החדר. הפעילו תנור לוהט. השמיעו ברמקולים מוזיקה תאילנדית מרגיעה ורחש גלי ים. בקשו מחבר להטריד אתכם בכל כמה דקות בהצעות לקנות אננס, קוקוס, בננה לוטי או חרגולים מטוגנים. עכשיו שכבו על החול ועיצמו עיניים…ואתם בתאילנד.

זו, על רגל אחת, אמולציה: טכנולוגיה שיוצרת 'מחשב וירטואלי' בתוך המחשב האמיתי, כך שתוכנה שרצה בתוך אותו מחשב וירטואלי לא תדע להרגיש בהבדל. זה בדיוק מה שעשו אנשי קבוצת CAMiLEON: הם יצרו סביבה וירטואלית שחיקתה את החומרה העתיקה שכבר לא הייתה קיימת במציאות, ובאמצעותה הפעילו את התוכנה המקורית של פרוייקט דומסדיי- התוכנה שנכתבה בשפת BCPL המיושנת. באופן זה הצליחו אנשי הקבוצה לשחזר את חוויית השימוש המקורית של ערכת דומסדיי באופן כמעט מושלם, כולל תפריט הניווט, התמונות, הסרטונים וכו'.

אמולציה היא גישה שנחשבת בעיני רבים כבעלת הפוטנציאל הטוב ביותר לשימור ארוך טווח של מידע דיגיטלי. חסרונה הגדול הוא שהקמת הסביבה הוירטואלית היא עניין מורכב הדורש מיומנות גדולה, ולכן דורשת גם השקעה גדולה יחסית של זמן וכסף. מאידך, הניסיון מוכיח שאמולציה עובדת: אם תבקשו לשחק כיום במשחקי מחשב שנכתבו בשנות השמונים למחשבים כמו אטארי, קומודור ו-Zx Spectrum, תוכלו לעשות כן למרות שהמחשבים עצמם כבר מזמן לא נמצאים בסביבה: ניתן להשיג היום באינטרנט אמולטורים שיוצרים 'קומודור' ו'ספקטרום' וירטואליים בתוך המחשב הביתי, ומאפשרים לנו לשקוע בנוסטלגיה.
אתגר משפטי

הבעיה האחרונה שעימה התמודדו משמרי פרוייקט דומסדיי היא בעיה שלמרבה ההפתעה אינה טכנולוגית כלל, כי אם משפטית. כמעט כל מאמצי השימור התמקדו בדיסק אחד בלבד מתוך השניים: דיסק 'הקהילה', הדיסק שהכיל תמונות ומאמרים ששלח הציבור הרחב. הדיסק השני, 'הדיסק הלאומי', הוא אתגר מסוג אחר: הוא מכיל מפות, סטטיסטיקות ותכנים נוספים שהופקו באופן מקצועי. תכנים אלה מוגנים על ידי זכויות יוצרים, ותמיד קיים החשש שמא מישהו מבעלי זכויות היוצרים יטען שאקט שימור המידע הוא למעשה סוג של העתקה ללא רשות, ויתבע את המשמרים! זו, כמובן, בעיה שהארכיאולוגים העתידיים שלנו לא יצטרכו לחשוש ממנה- אחרי הכל, זכויות היוצרים יפוגו בעוד תשעים שנה בערך- אבל מצד שני, אם אי אפשר לשכפל תוכן שמוגן בזכויות יוצרים, הרי שגם אי אפשר לגבות אותו- ומכאן שאולי לא ישרוד כלל…

שימור דיגיטלי, אם כן, הוא עניין לא פשוט, וללא ספק מקצוע הארכיאולוגיה עומד לשנות את פניו מקצה לקצה במאות השנים הבאות. אמולטורים ומחשבים מתוחכמים יחליפו את המברשת והמכושונים, וכנראה שהארכיאולוגים יבלו במעבדה ממוזגת יותר מאשר בחפירות מאובקות…
לסיכום

ומה לגבינו, האנשים הפשוטים? רבים מאיתנו נהנים לדפדף באלבומים הישנים ולראות תמונות של סבא וסבתא כשהיו צעירים ויפים. בהנחה שלנכדינו וניננו לא תהיה גישה לכלי שימור ושחזור מתוחכמים, כנראה שאם חשוב לנו שיראו אותנו מחייכים בחליפת החתונה שלנו- כדאי למצוא חנות צילום טובה שמדפיסה תמונות על נייר איכותי. ויפה שעה אחת קודם.


How do you quantify all of the information that everyone on earth produces in a year?

IDC is an American research firm that specializes in telecommunications and information technology. And each year, it conducts a comprehensive survey to assess just that — they try to quantify all the books, pictures, sound files, videos, articles — all the information produced on earth in one year. It’s difficult to know how reliable their numbers are – and IDC has been criticized in the past for inaccuracies – but at the very least, IDC’s research gives us a rough estimate for the volume of information that all of the humanity produces each year.

For example: in 2005, IDC estimated that the total volume of human information was 130 exabytes. And just to put that into perspective, one byte, the basic unit of digital information, is equivalent to a single letter. And an Exabyte is ten to the power of eighteen bytes. So, if, for example, an average episode of CMPOD is about fifty megabytes of information – then one exabyte is twenty-three million years of continuous listening to the show…

In 2012, the total volume of information was 2,800 exabytes. That’s twenty times the volume of information in 2005. This means that the total volume of human information is more than doubling each year. In the age of digital cameras, computerized word processing and personal blogs, it’s easier than ever to create vast amounts of new information. In 2020, IDC estimates, data volume will reach 40 Zettabytes or 40 thousand exabytes.
Future Archaeology

Today’s archaeologists are excavating the ground, trying to reconstruct a reliable picture of what life was like in ancient times. It is not an easy job: the amount of information available to archaeologists is minimal. At first glance, the wealth of information we create today should be a boon to archaeologists and historians of the future: they should have no problem to understand who we were and what we thought. After all, we document our lives in countless ways – from movies to blogs to podcasts like this one.

But nothing is as simple as it seems. As we shall soon see, the wealth of digital information we produce – thousands upon thousands of exabytes – will create new and unique challenges to these future archaeologists.
The Domesday Book

In 1066 Duke William of Normandy invaded the British Islands, defeated the Anglo-Saxon King Harold Godwinson, and became William The Conqueror, King of England. But after taking the throne, King William now had to deal with the financial fallout of the invasion: he had soldiers to pay and forts to build, and these all costs money. The kingdom’s main source of income was then, as it is now, taxes paid by the citizens – but the post-war chaos meant that the Treasury officials were no longer sure how much should each citizen pay.

..............................................................................................

So in 1086 William decided to launch an ambitious operation of unprecedented scale. Surprisingly, it was not a military operation but rather a statistical one. He sent officials to roam the length and breadth of England and document as accurately as possible the land that each citizen owned, their income and their profession. All that data was bound into two volumes, which together were known as “The Domesday Book”. The name ‘Domesday’ is a derived from the Christian Doomsday or Judgment Day. On Judgment Day, according to tradition, each person shall be judged by his good and bad deeds, and this judgment will be final and unchallengeable. Similarly, information recorded in the Domesday Book, which determines the taxes you owe, would be final and could not be challenged.

Amazingly, The Domesday Book has survived to this day: If you have contacts in the British National Archives and a solid knowledge of Latin, you can scroll through it and read the contents. For historians, the Domesday Book is a godsend: no other historical document of that time so systematically describes a moment in the life of an entire country.
The BBC’s Domesday Project

In 1986, the BBC decided to celebrate the 900th anniversary of this unique book and embarked on an ambitious operation of its own. The BBC’s “Domesday Project” was to be the modern equivalent of the ancient Domesday Book: a comprehensive attempt to capture a moment in the life of the British nation. A million people, mostly school children from across the UK, wrote about their daily lives, their communities, and their cities. All in all, The BBC collected 150,000 pages of text, 20,000 photos and hundreds of maps, statistics, and videos. All this information was saved in digital form to be browsed with relatively inexpensive Personal Computers, for the enjoyment and education of future school children.

After a comprehensive review of the available storage technology, the project leaders decided to use the LaserDisc to store the information. Back then, it was cutting edge technology: a golden disc, the size of a vinyl record. They stuffed all the articles, maps and videos onto two such discs: the first was called the “Community Disc” and it consisted mainly of articles and photos from around the UK. The second was the “National Disc” which contained things like maps, graphs, statistical data and photos taken by professional photographers.

A major goal of the project was to allow users to have easy access to the information stored in the discs, and for this purpose, the BBC developed a special user interface software which enabled the user to locate a particular article or photo using keywords, a menu, the location on a map and more. Since PC were only in their infancy, the BBC also developed a dedicated LaserDisc player that was able to read the two disks and display their content on a screen.
A different Reality

The ambitious project was completed on time and within budget…but was ultimately a failure. The kit containing the LaserDisc player and the two discs sold for approximately 5000 pounds – a hefty sum that only very few schools and public organizations could afford to pay. As a result, only a few copies of the Domesday Project Kit were ever distributed to the public, and the project failed to recoup its investment.
Nevertheless, everyone who took part in the BBC’s Domesday Project was proud of it. They all felt that the data collected for the project would be as important and useful for future historians as the original Domesday Book is useful for historians of our time.

But an article published in 2002 in the British newspaper The Observer revealed a very different reality. Only Fifteen years after the project was concluded – the information stored on the discs was practically inaccessible. Despite the two and a half million pound investment in the digital Domesday Project, no high school student or curious citizen can browse the articles or view the pictures.

The reason, as you may have guessed, is that the LaserDisc technology did not survive very long. It lost out to the smaller Compact Disc, and it didn’t catch on with the general public. Manufacturers stopped producing LaserDisc readers, and by 2002 only a handful of the BBC’s Domesday Project kits were usable, preserved mostly in museums and archives. The irony of the situation was perfectly captured in the Observer’s article:

“By contrast, the original Domesday Book – an inventory of eleventh-century England compiled in 1086 by Norman monks – is in fine condition in the Public Record Office […], and can be accessed by anyone who can read and has the right credentials. ‘It is ironic, but the 15-year-old version is unreadable, while the ancient one is still perfectly usable,’ said computer expert Paul Wheatley. ‘We’re lucky Shakespeare didn’t write on an old PC.’”
The Challenges of Information Preservation

The story of the Domesday Project represents the challenges we face as we try to preserve digital information. These challenges can be divided into three broad categories.

The first is the preservation of the digital storage device, like the LaserDiscs themselves. The second is the preservation of the systems that read the information — this is the LaserDisc reader in the Domesday Project Kit. The third challenge is the preservation of the software that reads the stored binary information and translates it into photographs, letters or sounds that we humans can understand.

Of course, these challenges are applicable to almost all existing information storage methods. In DVDs, for example, the preservation might include the DVD discs, the DVD players and the software used to decode the stored data. It’s also worth mentioning that most of those same challenges apply to the preservation of analog information – like music on vinyl or cassettes.
Preserving The Players And Readers

So, let’s begin with the challenge of preserving the player and readers that allow us to access the digital data. Paper books can only contain a small amount of information: dozens to several hundreds of thousands of words, and some pictures or diagrams. Discs, chips, and other modern storage devices can hold a lot more information: Complete encyclopedias, movies, albums. But the ability to store such large amounts of digital information in such small spaces comes at a cost: you’ll always need a machine to read that information and translate the binary code. To read the text written on a piece of paper, all you need is eyes – but to read text stored on a USB drive, for example, you need a silicon chip to access the memory cells and read the information they hold.

........................................................................................

These chips and devices can be quite complex, but surprisingly, this potentially complicated technical issue is probably the easiest challenge we’re facing. Once you understand how zeros and ones are represented inside a USB drive, for instance – it’s relatively easy to build a machine to able to access the content. Yes, it might take some hard work and serious expertise – but future archaeologists should be able to solve these kinds of technical problems. BUT, the rapid obsolescence of readers and players still poses a threat to the actual preservation of the data itself. Why is that?
Natural Decay

Well, every storage media we have is ultimately vulnerable to natural decay. Hard disks, for example, are extremely sensitive to mechanical wear: A typical hard disk lasts three to five years on average before it’s motor fails. CDs and DVDs, especially those burned at home and not in a factory, can hold onto their data for ten or fifteen years. We can extend the life of a disc by storing it in optimal conditions — low humidity, low temperature – but can we be certain that our children and grandchildren will do the same? Can we be sure that a fire or flood wouldn’t destroy it? And even if the disc somehow survives all these potential dangers – still, long-term processes like slow oxidation or the gradual dissipation of magnetic fields would eventually destroy the information on it.

This, of course, is not a new problem: even the best quality paper disintegrates eventually. The solution has always been to Replicate the data – backing it up by creating new copies of it. A lot of the books that survived from antiquity were copied by hand by dedicated monks. But our ability to copy and backup the digital information depends largely on the availability of the devices that mediate between us and the storage media. The BBC fell victim to an unfortunate choice of storage technology: the LaserDisc, which didn’t last very long. But it’s hard to blame the BBC’s engineers: many technologies have emerged and then disappeared in the last thirty years. Many of us still have old cassettes, floppy disks, VHS tapes and other obsolete storage devices that are slowly decaying in the back of a drawer.

And if, for example, you don’t have a VHS player at home, backing up old tapes means you have to go to a special lab and pay to convert them to DVD. The sad truth is that many of us don’t bother to do that, and then the tapes just rot away. In other words, to make sure all this stuff survives, we need to replicate it – but without those readers and players, the backups will probably never be created in the first place.
Solving The Problem of Media Decay

So, How can we solve the problem of media decay?
One possible strategy is a better replication solution: backing up the information in a way that would make it less prone to accidental destruction or decay. An interesting backup solution which emerged in the early 2000’s is the cloud. Companies that offer those cloud backup services – like Google and Amazon – understand the importance of reliability, and invest billions in setting up huge data centers around the world, equipped with advanced air conditioning systems, generators for alternative power supply and so on. These companies are better equipped to deal with replicating and storing massive amounts of data like images and videos, than the average computer user at home.

Still, Cloud Storage is not a magic bullet. For example, one of the dangerous and error prone processes is a software upgrade in the data center. Such an upgrade is almost always performed during routine operations and without any downtime for the customers. A Google engineer once compared this delicate and complex process to replacing the tires of a car traveling on a highway at 90 mph…

And indeed, Googe saw two such failures in 2009, when a few thousand Gmail mailboxes were accidently deleted during a software upgrade. Fortunately, Google was prepared for such a possibility: all the users’ information was backed up on magnetic tapes, and was restored within a few hours. Some of Amazon’s customers, however, weren’t so lucky: in 2011, the company announced that a technical glitch caused the loss of 0.07 percent of all the information stored in one of its data centers. 0.07 percent does not sound like such a big number, but it’s actually hundreds of thousands of gigabytes. In other words, cloud backup is probably a good solution for data replication – but it’s not bullet-proof.

A different strategy for handling media decay is creating a more durable storage method. One such new and promising technology is actually quite an ancient one: DNA. This double helix molecule which exists in every living cell is the perfect medium for information storage, a patent perfected by nature over billions of years. One gram of DNA molecules can hold two terabytes of information – twice the capacity of an average hard disk – and it can do so for tens of thousands of years, under the right storage conditions. For example, scientists have been able to extract intact genetic information from remains of wooly mammoths that died during the last ice age. The fundamental technology for using DNA as the storage medium already exists: in 2011, a group of scientists demonstrated the successful storage, and later extraction, of several dozen text documents, images and audio files in a DNA molecule.
The fact that DNA is the media on which all life forms keep their genetic information plays in our favor in another way: DNA is so universal, that there is little doubt that any future human society with reasonable technological ability will have the means to read it.
The Software Problem of Information Preservation

So, let’s get back to the BBC’s Domesday project. When the general public became aware of the dismal state of the project several volunteers and academic researchers embarked on various preservation and rescue efforts.
As you might recall, in addition to the two LaserDiscs, the Domesday Project Kit also contained a LaserDisc reader. Some of these readers were still functional, and the information stored on the discs could be read with relative ease. But it was here that the restorers encountered the third, and maybe the most complicated challenge of digital preservation: the software problem. What is the software problem?

Let’s say I’ve got some tomatoes and an onion. I have all these ingredients here on the table – but no recipe book. There are many possible ways to use these ingredients and many possible dishes. How do I know which is the right one?

This is exactly the same problem we are facing with software preservation. When you read the binary data from a DVD or Hard Drive, for example, you end up with a long long list of binary bits – ones and zeros. These bits have no inherent meaning by themselves: it is up to us, humans, to give them this meaning. We need to agree on the proper way to decode these bits: for example, we could agree that 1001 in binary is the decimal number ‘9’. Without this pre-agreed interpretation – 1001 might mean the letter A, or a pixel on the screen – or maybe something else entirely.

In many cases, this pre-agreed interpretation is standardized and well known. For example, an MP3 file has a defined structure, so any software which implements the MP3 standard can read and decode the bits in the files as sounds. But what happens if the encoding and decoding schemes are not standardized? Well, in that case, all we can hope for is that someone, somewhere, has kept a record of decoding scheme.
Saving The Domesday Project

In the case of the Domesday Project, there were still a few working LaserDisc readers that could run the software and decode the data stored in discs. The problem was that there were only very few such readers, mostly in museums, and this meant that the general public had no practical way to access the collected data. Running the same software on a regular, modern computer, was not a viable option either. This software was written in a programming language called BCPL, which was an advanced programming language for its time – but it went the way of the LaserDisc, and today’s computers can’t read it.

A few volunteers took it upon themselves to try and retrieve the data stored on the two LaserDiscs. In 2004, an amateur programmer, Adrienne Pearce, succeeded after much effort, to reconstruct some of the decoding algorithms. He extracted a large part of the texts and images from the discs and uploaded the information to a website he created. Two other programmers, Eric Freeman and Simon Guerrero, with the help of the engineer Andy Finney who was part of the Project’s original development team in the 80’s – located the original magnetic tapes used to store the Domesday data. These tapes held higher-quality versions of the data. Freeman and Guerrero collaborated with the BBC to create a website called “Domesday Reloaded”, which allows visitors to browse the project’s data.

However, Pearce, Freeman, and Guerrero were not able to fully restore the original software’s navigation system of menus and windows, so the website’s visitors still could not enjoy the same user experience they would have had with the original Domesday Project Kit.
The Importance of the User Interface

Now, There are those who will see the user interface as unimportant. After all, the articles, images, and graphs are the heart of the project, aren’t they?
They certainly are – but we shouldn’t underestimate the importance of the user interface as well. Imagine our future digital archaeologist, a thousand years from now, discovering the ancient remains of a first generation iPhone. This would be, without a doubt, an important discovery that would shed light on the “smartphone revolution” of our generation. But what if the archaeologist manages to extract only the data on the iPhone, like the photos and messages, but not the phone’s user interface software? Most likely, he’d scratch his head, trying to figure out what the big deal was.

So, how can we solve the problem of software obsolescence? Well, there are two basic strategies we can employ.
Software Preservation

The first is Migration: periodically convert the information from the “old” and outdated format to a newer format, so that modern software tools can handle it. For example, an audio file can be converted from the now-obscure 3GP format to the more modern MP3 format. When the times comes for the mp3 to be replaced, we’ll convert the files to the new format – And so on, ad infinitum. In essence, migration ‘bypasses’ the problem of software preservation by allowing us to use existing software instead of an old and problem-ridden one.

On the surface, migration looks like a good conservation strategy – but it also has its disadvantages. The most obvious one is that migration deals with data – but not with user interfaces, or it sometimes omits what is called the ‘Metadata’. Metadata is ‘external’ data which describes the main data we are trying to preserve. An MP3 file, for example, also contains metadata such as the name of the song, artist, and album. Depending on the migration method used, this metadata may or may not survive – and without it, the data can lose much of its original meaning.

A second, less obvious disadvantage is the danger that some of the original data will be lost during the migration process. MP3, for example, is a ‘lossy’ format – that is, it discards some of the sounds found in the original recording, sounds that the human ear can’t detect anyway. This means that some of the original recording data will be lost during the conversion from 3GP to MP3. After several migrations from one format to another, we might discover that a significant portion of the original data was lost forever – much like how a copy of a copy of a copy of a photo does not look as good as the original photo did.
Software Emulation

A second, and possibly better alternative is Emulation: a technology that creates a ‘virtual environment’ inside a real computer. A software running in the virtual environment will not be able to tell the difference: if your virtual environment fully mimics the original environment the software is supposed to run in – the software will function as it should. In the Domesday Project’s case, this means creating a virtual LaserDisc reader, so that when the software wants to read new data from a disc, it receives this data from the virtual reader.

This approach works especially well with old computer games. for example, you can easily find emulators on the web that will allow you to play very old games which were created for the Spectrum, Commodore, and other ancient computers – on your personal machine.

A third group of volunteers tried to save the Domesday Project. It was called CAMiLEON: they were a team of academics from the U.S. and the UK. The CAMiLEON group took the emulation approach: they created a virtual environment mimicking the old hardware that no longer exists in the real world. This way, the group managed to recreate the original experience of the Domesday Project, including using the navigation menus, browsing for photos, videos, and so forth.

Unfortunately, funding problems didn’t allow the CAMiLEON project to reach maturity, and it was aborted in 2004. Still, the emulation approach may have the best potential for long-term preservation of digital information. The big disadvantage of emulation is that the creation of a virtual environment is a complicated matter that requires a good measure of programming skills and intimate knowledge of the original device that you’re trying to emulate, so it also requires a relatively large investment of time and money. However, experience shows that emulation does work: all it takes is a few dedicated developers to create an emulation environment so that millions of users can enjoy it all over the world.
Digital Dark Ages

You might be surprised to learn that final problem facing the Domesday Project is not a technical one – but a legal one. Almost all of the preservation efforts focused on only a single disc – the ‘Community Disc’, which holds the photos and articles sent by the general public. The second disc, the ‘National Disc’, contains maps, graphs, and photos taken by professionals. This content is protected by copyright laws, and there’s always the fear that someday someone will sue the conservationists for copying the contents without proper permission…This problem won’t bother our future historians: after all, the copyright will expire in ninety years or so. But if replication, migration, and emulation are not possible today due to the legal limitations – there’s a very real chance that the information won’t survive into the future at all…

So, Digital preservation is not a simple matter. There are multiple challenges facing those who are trying to preserve the data we create for the sake of future generations: some are technical – such as the preservation of the storage media and software – and some are legal or financial. If we fail to face these preservation challenges, there is a risk that our current period will be regarded by future historians as the “Digital Dark Ages”, since there will be relatively few surviving texts, images, and videos from our time.

It’s also likely that future archaeologists will use tools that are very different from the ones used by today’s Emulators and sophisticated computers will replace brushes and pickaxes. These future archaeologists might find themselves missing the good old days of working on a real excavation site, instead of sitting in front of a computer all day…

And what about us, the common people? Many of us enjoy browsing old photo albums, looking at old black and white pictures of grandpa and grandma when they were young and beautiful. So if you want your grandchildren and great-grandchildren to see how good you looked when you were younger – your best bet? Find a good printer, and some quality photo paper….the sooner the better.

http://www.ranlevi.com/2013/04/30/ep127_digital_preservation/
http://www.cmpod.net/all-transcripts/a-domesday-failure-digital-info-preservation-text/
http://www.ranlevi.com/texts/ep127_digital_preservation_text/


No comments:

Post a Comment