עושים הסטוריה 312, 314: האם ניתן לדחוס סרט שלם לתוך 8 ק"ב? (Hebrew)

Sunday, May 31, 2020

עושים הסטוריה 312, 314: האם ניתן לדחוס סרט שלם לתוך 8 ק"ב? (Hebrew)

יאן סלוּט, טכנאי טלוויזיה הולנדי, טען ב-1999 כי פיתח טכנולוגיית דחיסה מהפכנית – טובה פי *מאה מיליון* מאלגוריתמי הדחיסה הטובים ביותר כיום. האם דחיסה כה דרמטית היא בכלל אפשרית? כיצד פועלים אלגוריתמי הדחיסה שבזכותם אנחנו יכולים להנות מסרטוני יוטיוב, סדרות בנטפליקס ומוזיקה בספוטיפיי?
בנוסף, פינה מיוחדת בשיתוף רשות הטבע והגנים על תופעת 'זיהום האור' – והשפעתה על בעלי החיים והצמחים שסביבנו.
***
את הפרק הקודם סיימנו עם טוויסט מפתיע בעלילה: למרות הספקות שהפגינו מהנדסיה של פיליפס כלפי טכנולוגיית דחיסת הנתונים המהפכנית שהמציא יאן סלוט, סגן-הנשיא של החברה החליט לעזוב את משרתו ולהצטרף אליו. בפרק זה נשמע על סיומה המפתיע של הפרשה, נגלה את העקרונות האמיתיים מאחורי הטכנולוגיה – ונשמע על הקשר האפשרי בין בינה מלאכותית ודחיסת מידע.

יש המשך למטה.
Ниже есть продолжение.

הספר הראשון שלי, 'פרפטום מובילה', עסק במכונות מסוג מיוחד במינו: 'מכונות של תנועה מתמדת,' מכונות שלא זקוקות לאנרגיה כדי לעבוד. המכונות האלה הן, כמובן, בלתי אפשריות: חוקי הפיזיקה קובעים כי כל מנוע זקוק למקור אנרגיה כדי לפעול. אבל העובדה הזו לא מנעה מאלפי ממציאים לנסות ולבנות מכונות שכאלה לכל אורך אלפיים השנים האחרונות.

במהלך התחקיר לספר ההוא, שמתי לב לעובדה מעניינת: לכל דור, או לכל תקופה היסטורית – היו מכונות של תנועה מתמדת אופייניות לאותה התקופה. למשל, ממציאים שחיו בימי הביניים ניסו להמציא משאבות מים שלא זקוקות לשור שיסובב אותן – מן הסתם כיוון ששאיבת מים מהבאר הייתה צורך חשוב ובסיסי באותם הימים. ממציאים מודרניים יותר ניסו לפתח מכוניות שלא זקוקות לדלק כדי לנסוע, או גנרטורים לייצור חשמל שעובדים ללא פחם או גז – כיוון שאלה היו הצרכים הבוערים במאה העשרים.

כשערכתי את התחקיר לפרק הזה, נזכרתי במאפיין המעניין הזה של מכונות של תנועה מתמדת. מדוע? מכיוון שגם ההמצאה שתעמוד במרכז הסיפור שלנו היום מסמלת את אחד הצרכים הבוערים ביותר של תקופתנו. הצורך הזה הוא דחיסת מידע. דחיסת מידע (Compression, בלעז) היא הטכנולוגיה שמאפשרת לנו לקחת קובץ בגודל עשרה מגהבייט, למשל, לכווץ אותו – לעשות לו Zip באמצעות תוכנה מתאימה – ולהפוך אותו לקובץ של אחד מגהבייט. היא מאפשרת לנו להפוך שיר שבפורמט המקורי שלו תופס חמישים מגהבייט של מידע – לקובץ mp3 ששוקל חמישה מגהבייט בלבד. במילים אחרות, הטכנולוגיה שמאפשרת לנו להקטין את מספר הביטים שתופס קובץ מסוים – מבלי לפגוע בתכולת המידע של הקובץ.

יכול להיות שאתם מרימים גבה. נו, באמת – ממתי דחיסת מידע היא צורך חיוני כמו דלק למכוניות או גז לייצור חשמל? אז אתם יודעים מה – לכו לסלון ותפתחו את נטפליקס. או תפתחו את הטלפון שלכם ותכנסו ליו-טיוב. או תפעילו את ספוטיפיי או Apple Music. הסדרה שעשיתם עליה בינג' בסוף השבוע? הסרט ההוא שראיתם אתמול? האלבום החדש ששמעתם? כל אלה היו בלתי אפשריים אלמלא טכנולוגיות דחיסת מידע.

רק כדי לסבר את האוזן: שניה אחת של וידיאו באיכות HD, אם מעבירים אותה כמו שהיא – ללא שום דחיסה של המידע הגולמי – שווה בערך לאחד וחצי ג'יגהבייט. שניה אחת! הסיבה היחידה שאנחנו יכולים לראות ולשמוע את כל הוידיאו והאודיו שאנחנו צורכים בכמויות הולכות וגדלות בעשרים השנים האחרונות היא שהמהנדסים של גוגל, נטפליקס וכל שאר חברות הטכנולוגיה הצליחו לדחוס את כמויות המידע האדירות שמכילים הסרטים, הסדרות והשירים – לתוך קווי התקשורת הצרים יחסית שמובילים את המידע הזה לבתים ולמכשירים הניידים שלנו.

ולא מדובר רק בסרטים ובשירים. דחיסת מידע היא חלק בלתי נפרד מכל פעולה שאנחנו עושים ברשת: בכל פעם שאנחנו מבקרים באתר כלשהו, כל תמונה שאנחנו שולחים בוואטסאפ, כל פוסט שאנחנו מעלים לפייסבוק – כל המידע נדחס ומכווץ לפני שהוא נשלח ליעדו. אלמלא דחיסת מידע, האינטרנט שלנו היה נראה אחרת לגמרי! בלעדי הדחיסה, לתשתיות התקשורת שלנו לא היה שום סיכוי להתמודד עם טריליוני הביטים שעוברים דרכן בכל רגע.

עכשיו תשאלו את עצמכם כמה כסף תהיינה חברות הטכנולוגיה המובילות מוכנות לשלם תמורת טכנולוגיה שמסוגלת לדחוס סרט שלם – תשעים דקות של וידיאו באיכות מעולה – לתוך… אתם יושבים?… שמונָה קילובייט. כן, שמונה קילובייט. שמונה קילובייט זה בערך מאית מגודלה של תמונה שאתם מצלמים בטלפון, אולי אפילו פחות. ואני לא מדבר על שמונה קילובייט לשניה של וידיאו: אני מתכוון לשמונה קילובייט לסרט שלם!

אם אתם המנכ"ל של גוגל או נטפליקס או פייסבוק, כמה כסף הייתם משלמים תמורת טכנולוגיה שתאפשר לכם לאחסן יותר מעשרה מיליון סרטים באורך מלא, בנפח אחסון של דיסק-און-קי סטנדרטי? אני אגיד לכם: כמעט כל סכום שיידרש, פשוטו כמשמעו. החברות האלה מוציאות מיליארדי דולרים בכל שנה על שרתים מהירים, סיבים אופטיים וכו' וכו'. טכנולוגיה מהפכנית שכזו תחזיר את ההשקעה בקלות, ללא צל של ספק. זאת ועוד, היא תפתח להם הזדמנויות חדשות למכביר: MP3, הטכנולוגיה שאיפשרה לדחוס קובץ אודיו בסך הכל פי עשר – מחמישים מגהבייט לחמש מגהבייט, פחות או יותר – השיקה מהפכה דרמטית שבתוך פחות מעשרים שנה הפכה את כל תעשיית המוזיקה על ראשה. תחשבו איזו מהפכה תחולל טכנולוגיה שדוחסת מידע פי כמה מיליונים!…

מי הוא, אם כן, אותו ממציא מהפכן?

רומקה יאן ברנהארד סלוּט (Romke Jan Bernhard Sloot) נולד ב-1945 בכפר קטן בשם ניו-וחֵן (Nieuwegein) שבהולנד. כבר בגיל צעיר הפגין סלוט כישרון טכני מרשים, ואהבה בוערת לכל מה שקשור באלקטרוניקה. הוא אמנם לא סיים את לימודי התיכון, אבל בזכות כישוריו הבולטים התקבל לעבודה בפיליפס, ענקית הטכנולוגיה ההולנדית. אחרי שנה וחצי עזב סלוט את פיליפס. ב-1978 פתח בניו-וחן חנות אלקטרוניקה קטנה, ובהמשך עבד כטכנאי לתיקוני טלוויזיה.

סלוט היה טכנאי מעולה וצבר המון ידע לגבי תיקוני טלוויזיות. החלום שלו היה לשתף טכנאים אחרים בהולנד בידע שצבר. הימים היו ראשית עידן המחשב האישי, ולמרות שהאינטרנט הייתה עדיין חלום רחוק – סלוט הבין שמחשבים הם המפתח לשיתוף ידע שכזה.

הבעיה הייתה שכמות המידע שניתן היה לאחסן בדיסקטים הקטנים הייתה זעומה מאוד, ובטח ובטח שלא הספיקה כדי להחזיק את כל המידע הטכני הרב שסלוט רצה לשתף – ועל כן החל סלוט לחפש דרכים לאחסן מידע ביעילות רבה יותר. המשימה הזו הפכה, במרוצת הזמן, לפרוייקט חייו. הוא הקדיש כמעט עשרים שנה לניסיונות ולפיתוחים שונים – עד שבאמצע שנות התשעים מצא, סוף סוף, את מה שביקש: טכנולוגיית דחיסת מידע חדשה ומהפכנית.

שני אנשי עסקים מקומיים שמעו על ההמצאה, וביקשו מסלוט שידגים אותה עבורם. סלוט לקח טלוויזיה רגילה וחיבר אותה לקופסת אלקטרוניקה בגודל של, נאמר, ספר עב כרס. לאחר מכן שלף סלוט מכיסו כרטיס זיכרון קטן, בסדר גודל של כרטיס אשראי. קופסת האלקטרוניקה, הסביר סלוט, מכילה תוכנה שמפענחת את תוכן כרטיס הזיכרון. והכרטיס עצמו מכיל שבב בנפח של שישים וארבעה קילובייט, ועליו לא פחות משישה עשר סרטים באורך מלא. רק לשם השוואה, קומפקט-דיסק (CD) בנפח של יותר משבע מאות מגה בייט – פסגת טכנולוגיית אחסון המידע באותם הימים – היה מסוגל להכיל רק שבעים ושתיים דקות של וידיאו בלבד.

סלוט נטל את כרטיס הזיכרון והכניס אותו לתוך חריץ בקופסת האלקטרוניקה. הטלוויזיה התעוררה לחיים – ועל המסך הופיעו שישה עשר סרטים שניגנו זה לצד זה, בו זמנית! אנחנו מדברים על סוף שנות התשעים של המאה העשרים, תקופה שאני אישית זוכר מצוין: לא היה אף מחשב ביתי, באותה התקופה, שהיה מסוגל להריץ שישה עשר סרטים באיכות גבוהה על המסך בבת אחת. הטכנולוגיה שהדגים סלוט הייתה, פחות או יותר, מדע בדיוני.

אנשי העסקים עמדו פעורי פה. היה להם ברור שאם מה שהם רואים באמת נכון – ולא איזו רמאות מתוחכמת – מדובר בהמצאה שעתידה לשנות את העולם. אבל שני אנשי העסקים לא הבינו דבר וחצי דבר באלקטרוניקה ומחשבים: אחד היה קבלן בניה, והשני בעל חנות רהיטים. גם אילו היו בטוחים לחלוטין שמדובר בהמצאה אותנטית, לא היו להם המשאבים כדי לעזור לסלוט להוציא אותה לפועל. כדי לפתח טכנולוגיה כזו ולהפוך אותה למוצר בפרישה גלובלית, צריך מימון של עשרות מיליוני דולרים לכל הפחות וגב טכנולוגי ותפעולי של חברת טכנולוגיה בינלאומית כדוגמת אינטל, מיקרוסופט או אורקל. אבל מאיפה להתחיל? איך משכנעים חברת ענק שכזו להתעניין בהמצאה של סלוט?

למזלם של סלוט ומשקיעיו, הולנד – אולי קצת כמו ישראל – היא מדינה קטנה יחסית שבה כולם מכירים את כולם. חבר של חבר חיבר את הקבוצה עם סגן-הנשיא של פיליפס, אדם בשם רוּל פּיפֵר (Roel Pieper), שהסכים להפגש עימם.

הפגישה נערכה בארבעה במרץ 1999, והייתה הצלחה גדולה. סלוט הציג בפני פיפר את אותה הדגמה כמקודם – שישה עשר סרטים על כרטיס זיכרון קטנטן – וסגן הנשיא התרשם מאוד. הפגישה, שהייתה אמורה להימשך עשרים דקות – התארכה ללמעלה משעה. בסופה, פיפר אמר למשקיעים שהוא ישקול את העניין ויהיה עימם בקשר בעוד מספר שבועות – אבל עוד באותו היום התקשר אליהם והציע פגישה נוספת.

כאן המקום לומר כמה מילים על רול פיפר. מבחינה פיזית, פיפר – כדורסלן לשעבר – היה אדם מרשים מאוד, גבוה ונאה. אבל הרזומה שלו היה אפילו מרשים עוד יותר. הוא היה ד"ר למדעי המחשב, כיהן כ CTO (Chief Tech. Officer) בחברה אמריקנית בינלאומית ואז כמנכ"ל של חברת טכנולוגיה גדולה אחרת. את החברה הזו הוא מכר לענקית הטכנולוגיה Compaq בעסקה שהפכה אותו לאחד האנשים העשירים ביותר בהולנד. שנה לפני הפגישה עם יאן סלוט חזר פיפר מארצות הברית להולנד, ומיד הוזמן להצטרף לדירקטוריון של פיליפס. השמועות בחברה גרסו שפיפר עתיד לרשת את המנכ"ל הנוכחי של החברה בעוד זמן לא רב. אתם יכולים לשער לעצמכם איזו התרגשות אחזה בקבוצת המשקיעים כשפיפר גילה עניין רב כל כך בהמצאה.

אבל יאן סלוט לא הסכים להגיע שוב למשרדו של פיפר. כל מי שפגש את הממציא מתאר אותו באותו האופן: פרנואיד. סלוט חשש שמהנדסיה של פיליפס ינצלו את הביקור שלו כדי לגנוב את קופסת האלקטרוניקה, לנתח את תוכנת הפענוח – ולהעתיק את הטכנולוגיה שלו. הוא היה כל כך פרנואיד, שהוא אפילו לא סיפר לבן שלו, שליווה אותו לרוב הפגישות, איך בדיוק עובדת ההמצאה כי חשש שהבן יפלוט משהו בתמימות. חששותיו של סלוט הביאו לכך שהפגישה השניה התקיימה במקום נייטרלי – בית חרושת שהיה בבעלותו של אחד מאנשי העסקים. רול פיפר הביא עמו שלושה מהנדסים מפיליפס כדי לבחון את ההמצאה לעומקה. שלושת המהנדסים צפו בהדגמה ובמשך שעה ארוכה חקרו את סלוט לגבי הפרטים הטכניים של המצאתו. בתום ההדגמה, עזבו פיפר ומהנדסיו את המקום.

אנחנו לא יודעים על מה בדיוק שוחחו יאן סלוט ומהנדסים של פיליפס – אבל בעקבות הפגישה הזו, פיליפס החליטה לרדת מהעניין ולדחות את סלוט והמצאתו. לא צריך להיות מומחה לעסקי הטכנולוגיה כדי לנחש את הסיבה: סביר להניח שהם חשדו בסלוט שהוא נוכל. כך, לדוגמה, הגיב פרופ' הולנדי – מומחה למדעי המחשב שגם עבד בעבר בשירותה של פיליפס – כששמע על המצאתו של סלוט:

"אנחנו, המומחים, שמחים מאוד אם אנחנו מצליחים לשפר את הדחיסה של מידע דיגיטלי באחוז אחד בודד. שיפור של פי שניים בדחיסה הוא אולי אפשרי – אבל דחיסה פי מיליון היא בלתי אפשרית."

ההמצאה של סלוט לא הייתה טובה פי מיליון מטכנולוגיות הדחיסה המתקדמות ביותר באותה התקופה: היא הייתה טובה מהן פי מאה מיליון, אם לא יותר. השאלה המתבקשת היא – האם בכלל ניתן לשפר את טכנולוגיית הדחיסה פי מאה מיליון, או אפילו פי מיליון? במילים אחרות, האם הספקנות שהפגינו מהנדסיה של פיליפס ואותו פרופסור – מוצדקת?

בואו ניקח צעד אחורה ונכיר את הרעיונות הבסיסיים מאחורי טכנולוגית דחיסת הנתונים.

את שורשי הרעיון שבבסיס הטכנולוגיה הזו אפשר למצוא כבר במחצית הראשונה של המאה התשע עשרה. הטלגרף איפשר בפעם הראשונה תקשורת ארוכת טווח, וההודעות שעברו דרכו יוצגו על ידי 'קוד מורס' המפורסם: לכל אות ולכל ספרה היה ייצוג ספציפי של קווים ונקודות. עכשיו, היו המון המון אנשים שרצו לשלוח הודעות, אבל רק מעט יחסית קווי טלגרף – על כן, חשוב היה לוודא שההודעות ייוצגו על ידי כמה שפחות קווים ונקודות. לדוגמה, אם אפשר לייצג את המילה "שלום" על ידי שמונָה קווים ונקודות במקום עשרה – זה עדיף, שכן אז ייקח פחות זמן להעביר אותה דרך הטלגרף.

הפתרון לבעיה הזו הוא די ברור: ככל שהשכיחות של אות מסוימת בשפה גבוהה יותר, כדאי לתת לה את הייצוג הקצר ביותר בקוד מורס. למשל, האותיות E ו – T הן האותיות השכיחות ביותר בשפה האנגלית, ולכן קיבלו את הייצוגים הקצרים ביותר האפשריים בקוד מורס: נקודה וקו, בהתאמה. אותיות נדירות יותר, כמו Q למשל, קיבלו ייצוגים ארוכים יותר: קו קו נקודה קו.

מאה שנים לאחר מכן לקח מתמטיקאי ומהנדס חשמל מבריק בשם קלוד שאנון (Shannon) את הרעיון העקרוני הזה של ייצוג מידע לפי השכיחות הסטטיסטית שלו, ויחד עם חוקר אחר בשם רוברט פאנו (Fano) פיתח אותו לכדי אלגוריתם דחיסת מידע חכם ופורץ דרץ הקרוי על שמם של השניים – 'קידוד שאנון-פאנו'. האלגוריתם הזה מאפשר לנתח את המידע שאנחנו רוצים לדחוס – לא רק אותיות ומספרים, אלא כל סוג מידע – לזהות אילו פריטי מידע חוזרים על עצמם בשכיחות הגבוהה ביותר, ולמצוא לכל אחד מהם ייצוג בינארי של אפסים ואחדות – 'קידוד', בעגה המקצועית – כך שאחרי ההמרה מתקבל אותו המידע בדיוק – אבל בצורה רזה וקומפקטית יותר.

לשם ההסבר, נניח שבספר שלי 'פרפטום מובילה' יש מיליון אותיות. ישנו תקן תקשורת בינלאומי מוכר בשם 'יוניקוד', והוא קובע שלכל אות יש ייצוג סטנדרטי של שישה עשר ביטים. דהיינו, אם הייתי לוקח את הספר וממיר אותו לקוד בינארי, הוא היה תופס שישה עשר מיליון ביטים. אבל אנחנו יודעים שהאותיות י', ו' ו-ה', למשל, הן האותיות השכיחות ביותר בעברית – לעומת האותיות ץ' ו-ף' שהן האותיות הנדירות ביותר. אלגוריתם שאנון-פאנו מאפשר לי להחליף את הקידוד הסטנדרטי של יוניקוד בקידוד חדש, 'תפור' לספר הספציפי שלי – שבו האות י' מיוצגת על ידי ארבעה ביטים בלבד, למשל, בזמן שהאות ץ' נשארת מיוצגת על ידי שישה עשר ביטים. אם אמיר את כל הספר לקידוד החדש, אקבל קובץ הרבה יותר קטן וקומפקטי – נאמר, שמונה מיליון ביטים במקום שישה עשר מיליון. במילים אחרות, דחסתי או כיווצתי את הספר המקורי.

שימו לב שלא אמרתי 'הקובץ הקטן והקומפקטי ביותר'. יש אינסוף דרכים שונות לייצג את אותו המידע באמצעות אוסף של אפסים ואחדות: השיטה של שאנון ופאנו הייתה מוצלחת, אבל רחוקה מלהיות הכי מוצלחת. שנים ספורות לאחר מכן הצליח חוקר אחר, דיוויד הופמן (Huffman) שמו, לשפר את הקידוד של שאנון ופאנו: הקידוד שלו היה מסוגל לדחוס מידע קצת יותר טוב ויותר קומפקטי מהקידוד המקורי. אחרי הופמן היו חוקרים נוספים שכל אחד מהם הצליח לשכלל ולשפר את אלגוריתם הדחיסה בדרכים שונות.

אחד השיפורים המשמעותיים ביותר לטכנולוגיית הדחיסה היה אלגוריתם בשם LZ77, שפרסמו בשנת 1977 שני חוקרים ישראליים – אברהם למפל ויעקב זיו. LZ77 – ושני אלגוריתמים נוספים שפורסמו בהמשך בשם LZ78 ו- LZW, נעזרים בחזרתיות שלפעמים מופיע במידע כדי לכווץ אותו עוד יותר. למשל, נניח שבקובץ שקיבלנו ישנה סדרה של עשרה אפסים ברצף. את עשרת האפסים אני יכול להחליף בסימון בסגנון '0 עשר' – דהיינו, עשר פעמים 0 – שהוא ייצוג קצר יותר של המידע מאשר עשרה אפסים רצופים, ובאופן הזה אפשר להגיע לכיווץ עוד יותר משמעותי של המידע. הרעיון העקרוני של ניצול החזרתיות היה אמנם מוכר עוד טרם עבודתם של למפל וזיו, אבל המימוש שלהם היה כל כך מוצלח ויעיל עד שלמעשה כמעט כל תוכנות הדחיסה שאנחנו מכירים היום – מ WinZip ועד 7z – מבוססות על הרעיונות שפיתחו השניים האלה, והם זכו בפרסים רבים וכבוד רב על עבודתם.

הטכניקות שתיארתי עד עכשיו – משאנון-פאנו ועד למפל-זיו – נכנסות תחת הקטגוריה של דחיסה 'משמרת מידע' (Lossless Compression)': דהיינו, כשאנחנו דוחסים את הקובץ, המידע עצמו לא הולך לאיבוד ואפשר לשחזר אותו במלואו כשפותחים את הקובץ הדחוס. במקרים רבים, התכונה הזו היא קריטית: אף אחד לא היה רוצה לדחוס קובץ וורד, למשל, ולגלות שכשהוא פותח אותו מחדש – מילים ומשפטים נעלמו מהמסמך המקורי. זה נקרא "עריכה" וכל הסופרים שונאים את זה.

מההסבר שנתתי כרגע, אפשר להבין שדחיסה משמרת-מידע עובדת טוב כשמדובר בסוגי מידע שיש בהם הרבה חזרתיות – כמו טקסטים, למשל, שבהן אותן האותיות חוזרות ומופיעות שוב ושוב ושוב. למעשה, כשמדובר במידע שיש בו הרבה חזרתיות, אפשר להגיע לשיעורי דחיסה פנטסטיים. למשל, אם תחפשו בגוגל – ואל תחפשו את זה, אני מזהיר אתכם – אבל אם תחפשו – ואל תחפשו – אבל אם תחפשו את המילים 42 zip, כנראה שתגיעו מהר מאוד לקובץ בגודל של 42 קילובייט בלבד. הקובץ התמים הזה הוא למעשה מה שמכונה 'פצצת זיפ' (Zip Bomb). אם תורידו את הקובץ הדחוס הזה למחשב ותנסו לפתוח אותו – ואל תעשו את זה – הוא יתנפח לגודל של ארבעה וחצי פטה בייט – שזה שווה ערך לפחות או יותר מאה מיליון פרקים של עושים היסטוריה, וכמובן הרבה הרבה יותר מכמות הזכרון שיש למחשב ממוצע, ולכן המחשב ייתקע ויקרוס. איך אפשר לדחוס ארבעה וחצי פטה בייט לתוך ארבעים ושניים קילובייט? בקלות, אם המידע הנדחס הוא בסך הכל שורה ארוכה ארוכה ארוכה של אפסים. מכיוון שמדובר במידע שכל כולו חוזר על עצמו שוב ושוב – תוכנות דחיסה מסוגלות לצמצם אותו בצורה דרמטית. למעשה, אם תחשבו על זה, המשפט 'ארבע וחצי פטה בייט של אפסים בלבד' הוא בעצמו ייצוג דחוס וקומפקטי מאוד של המידע הזה.

אבל יש סוגי מידע שבהם יש רק מעט מאד חזרתיות, באופן יחסי – כמו למשל תמונות, אודיו ווידיאו. שלא כמו טקסטים שבהם אותיות ומילים מסוימות חוזרות על עצמן שוב ושוב לאורך הטקסט – בקבצי מדיה, קשה למצוא חזרתיות שכזו. פה ושם אפשר למצוא אזור בתמונה שמכיל אך ורק פיקסלים בצבע שחור, למשל – אבל ברוב המקרים, אפילו בין הפיקסלים הכהים יש כאלה שהם כהים יותר ואחרים שכהים קצת פחות. ואם אין הרבה חזרתיות במידע, דחיסה משמרת-מידע לא יכולה לעשות עבודה טובה. אם תנסו לקחת קובץ טיפוסי של אודיו או וידיאו ולדחוס אותו בעזרת אלגוריתמים כמו LZ77 ודומיו, תגלו שבמקרה הטוב תגיעו לדחיסה של חמישים או ארבעים אחוזים בלבד – וזה ממש ממש לא מספיק. כפי שסיפרתי לכם בפתיח, שניה אחת של וידיאו באיכות HD שוקלת קרוב לג'יגה וחצי, ואפילו שיר טיפוסי של ארבע דקות שוקל בסביבות חמישים מגהבייט. אם היינו נעזרים בדחיסה משמרת-מידע בלבד, רוחב הפס של האינטרנט הביתי לא היה מספיק כדי שנוכל לצפות בנטפליקס או להאזין למוזיקה בספוטיפיי.

הפתרון, במקרה הזה, הוא להעזר בשיטה שונה של דחיסת מידע: דחיסה 'מאבדת-מידע' (Lossy Compression). בדחיסה מאבדת-מידע, האלגוריתם מנסה לאתר בתוך המידע שמזינים לו את אותן פיסות מידע שהן 'לא חשובות' מסיבה כלשהי ומעיף אותן מהקובץ המקורי. בפרק 100 של עושים היסטוריה סיפרתי על אלגוריתם הדחיסה של mp3 – דוגמה קלאסית של דחיסה מאבדת מידע – אבל הפעם בואו נתמקד בוידיאו, שהוא לב הסיפור בפרק הזה.

סרטון וידיאו מורכב מפריימים, שהן תמונות שמתחלפות זו אחרי זו כשלושים פעם בכל שניה. השלב הראשון בדחיסה הוא לנתח כל פריים בודד בפני עצמו, ולאתר בו פרטים שהעין האנושית לא מסוגלת להבחין בהם: למשל, אם יש שני פיקסלים צמודים שאחד מהם הוא בצבע שחור והשני הוא אפור מאוד-מאוד כהה – עבורנו, זה אותו הדבר, ולכן האלגוריתם ימיר את שני הפיקסלים לאותו הצבע. בנוסף, אם יש שלושה פיקסלים – לבן, שחור, לבן – שוב, העין האנושית לא מסוגלת להבחין בשינוי בהירות מהירים וצפופים כל כך, ולכן האלגוריתם יהפוך את הפיקסל השחור ללבן. בשני המקרים, נקבל סדרה של פיקסלים שחוזרים על עצמם: שחור ושחור, או שלושה פיקסלים לבנים ברציפות. עכשיו, כשהמידע בתמונה מכיל יותר חזרתיות – אפשר להפעיל עליו דחיסה משמרת-מידע שתהיה יעילה יותר, ופריים ששוקל במקור כמה מגה בייט מומר לקובץ של כמה עשרות או מאות קילובייטים בלבד. לאלגוריתם הזה יש שם: JPEG, והוא אותו אלגוריתם שאנחנו משתמשים בו גם לתמונות הסטילס שאנחנו מצלמים בטלפונים, למשל.

השלב הבא בדחיסת הוידיאו הוא לזהות את השינויים בין כל פריים בסרט, לפריים שבא אחריו. בכל סרטון וידיאו יש אזורים בתמונה שלא משתנים יותר מדי. למשל, נניח שאנחנו מצלמים את הילד משחק בגן השעשועים. הילד נמצא במרכז התמונה והוא זז כל הזמן – כי זה מה שילדים עושים: הם לא. מפסיקים. לזוז. ראבאק! תרגעו קצת!… אההם. כן. בכל אופן, הילד זז – אבל ברוב המקרים, הרקע של הסרטון כמעט ולא משתנה: השמיים והרצפה, למשל, נשארים כמעט ללא שינוי בין פריים לפריים. אם אין שינוי, משמע יש חזרתיות – ולכן אנחנו יכולים להתעלם מאותם פיקסלים בפריים החדש שנותרו ללא שינוי מהפריים הקודם. בנוסף, במקרים רבים יהיו אזורים בסרטון הוידיאו שישתנו בין פריים לפריים כגוש אחד: זאת אומרת, אם הילד בתמונה זז בפיקסל אחד ימינה בין שני פריימים – אנחנו יכולים להניח שכל הפיקסלים שמתארים את הילד יזוזו ביחד פיקסל אחד ימינה – אחרת כדאי שנזמין אמבולנס. אלגוריתם הדחיסה מחלק את הפריים לבלוקים, ומזיז את הבלוקים האלה כגוש אחד בין פריים לפריים – במקום לתאר את התזוזה של כל פיקסל בנפרד. התיאור המתקבל, אם כן, הוא תיאור הרבה יותר קומפקטי. זה קצת דומה למצב שבו יש לך כיתה של ילדים שיושבת ביציע כדורסל: במקום לומר 'שחר, כסא אחד ימינה, נווה, כסא אחד ימינה, נועם, כסא אחד ימינה' וכן הלאה וכן הלאה, אפשר לומר 'כל כיתה ה' אבישג, נא לזוז כסא אחד ימינה', שזה הרבה קומפקטי וקצר, למרות שמהיכרות אישית עם הנפשות הפועלות, אף אחד מהילדים לא יקשיב לא ככה ולא ככה.

מכיוון שאנחנו משמיטים המון פיסות מידע מהקובץ המקורי – מחליפים ערכים של פיקסלים ומתעלמים מאזורים שלא משתנים בסרטון – דחיסה מאבדת-מידע היא הרבה יותר יעילה מדחיסה משמרת מידע: עד כדי אחד חלקי מאתיים מגודלו המקורי של המידע. אבל לדחיסה המרשימה הזו יש מחיר: ככל שאנחנו משמיטים יותר ויותר מידע מהקובץ המקורי, כך הקובץ הדחוס שמתקבל נראה יותר ויותר גרוע. הרקע מתחיל להיות מטושטש, הצבעים הופכים למעוותים וכדומה.

כעת אפשר להבין את פשר הספקנות שהפגינו מהנדסיה של פיליפס כלפי טענותיו של יאן סלוט. הניסיון שלהם אמר להם שכדי לדחוס סרט וידיאו שלם לתוך שמונה קילובייט – יחס דחיסה של יותר מאחד למאה מיליון – יהיה צריך להשמיט כל כך הרבה מידע מהסרט המקורי, עד שלא ישאר ממנו כמעט כלום. אפילו סרטון GIF של עשרים שניות, באיכות הכי מזעזעת שאתם יכולים להעלות על הדעת, תופס יותר משמונה קילובייט של מידע. במילים אחרות, הם היו משוכנעים שיאן סלוט הוא נוכל.

ואכן, כבר היו בעבר נוכלויות שכאלה. למשל, תוכנה בשם WIC שמסתירה את המידע המקורי בתוך קובץ חבוי אי שם בתוך הדיסק הקשיח של המחשב – ומציגה למשתמש מצג שווא כאילו הצליחה לדחוס אותו בצורה פנומנלית… במקרה אחד לפחות הצליחו הנוכלים שפיתחו תוכנה כזו לגנוב מיליוני דולרים ממשקיעים תמימים.

כעת, בחזרה אל הסיפור של יאן סלוט – ואל טוויסט מפתיע בעלילה: טוויסט שאם לא הייתי יודע בוודאות שהוא נכון – אני בטוח שלא הייתם מאמינים לי. רול פיפר, סגן-הנשיא הבכיר של פיליפס, לא היה שותף לדעתם של המהנדסים שלו. למעשה, הוא כל כך האמין בהמצאה של סלוט ובפוטנציאל שלה לשנות את העולם – עד שהחליט להתפטר מתפקידו, ולהצטרף לקבוצת המשקיעים של סלוט.

התפנית הזו בעלילה היא לא פחות מפנטסטית. זכרו שרול פיפר לא היה איזה איש עסקים שולי – מדובר באחד מאנשי הטכנולוגיה המוכרים ביותר בהולנד: יש מי שכינו אותו 'ביל גייטס ההולנדי'. אדם שהיה אז בשיא הקריירה המקצועית שלו ואחד האנשים העשירים ביותר בהולנד. שתבינו – אם אני, רן מעתלית, מספר לכם שיש לי המצאה שתשנה את העולם – אני יכול להבין אם תפקפקו בי, אבל אם אמנון שעשוע – המייסד של מובילאיי וסגן נשיא באינטל היה אומר את אותו דבר – כנראה שהייתם לוקחים אותו הרבה יותר ברצינות.

זו בדיוק הייתה המשמעות של הצטרפותו של רול פיפר לצוות של סלוט. אם זה היה משחק קלפים, סלוט כרגע שלף ג'וקר מהחפיסה. הם הקימו חברה חדשה בשם Fifth Force ('הכוח החמישי'), שפיפר מונה כמובן לעמוד בראשה. השם Fifth Force מרמז על התקוות שתלו המשקיעים בהמצאתו של סלוט: יש את ארבעת הכוחות הבסיסיים בטבע – גרביטציה, אלקטרומגנטיות, הכוח החזק והכוח החלש – והכוח החמישי הוא כח המידע. בשיחות פנימיות העריך פיפר כי שוויה של המצאתו של סלוט הוא לפחות מאה מיליארד דולר, אם לא יותר. הוא והממציא יצאו לסבב פגישות בעמק הסיליקון בארצות הברית, שם פתח שמו של פיפר את כל הדלתות בפניהם: הם נפגשו עם מנכ"לים של חברות גדולות, כמו צ'ארלס וונג (Wang), מנכ"ל Computer Associates, והדגימו בפניהם את ההמצאה החדשה.

זו הנקודה שבה נסיים את הפרק הזה, חלקו הראשון של הסיפור שלנו. בפרק הבא, החלק השני והאחרון, נשמע כיצד הצליח רול פיפר לגייס ל Fifth Force עוד שני משקיעים רציניים, אחד מהם הבנק השלישי בגודלו בהולנד. נשמע על הרעיון האמיתי מאחורי ההמצאתו של סלוט. רמז: זה ממש לא מה שחשבו המהנדסים של פיליפס כשדחו את הרעיון. ולבסוף – כיצד יכולה מהפכת הבינה המלאכותית לחולל מהפכה דרמטית גם בתחום דחיסת המידע. כל זאת ועוד, בפרק הבא של עושים היסטוריה.

***

בפרק הקודם הכרנו את יאן סלוט: טכנאי טלוויזיה הולנדי, אדם בעל כשרון טכני יוצא מן הכלל, שבשנות התשעים של המאה הקודמת טען כי פיתח שיטה חדשה לדחיסת מידע – טכנולוגיה המאפשרת לו לדחוס סרט שלם, תשעים דקות של וידיאו באיכות טובה, לתוך כרטיס זיכרון בנפח של שמונה קילובייט בלבד – נפח קטן אפילו מזה של תמונה בודדת שאתם מצלמים במכשיר הטלפון שלכם.

מהנדסים של חברת פיליפס, ענקית הטכנולוגיה ההולנדית הבינלאומית, בחנו את המצאתו של יאן סלוט – אך לא השתכנעו. טכנולוגיות הדחיסה המודרניות מצמצות את נפחם של קבצי הוידיאו על ידי השמטה של מידע מיותר: מה שמכונה 'דחיסה מאבדת מידע', Lossy Compression. אך כדי לדחוס סרט שלם לתוך נפח כה זעום, כפי שטען יאן סלוט, יש להשמיט כל כך הרבה מידע מתוך הקובץ המקורי עד שהסרט יהיה, הלכה למעשה, בלתי ניתן לצפיה.

אך למרבה ההפתעה ולמרות הספקנות הזו – סלוט זכה לתמיכה מכיוון מאוד בלתי צפוי: רול פיפר, סגן-נשיא בפיליפס ומי שכונה 'ביל גייטס ההולנדי', החליט לעזוב את תפקידו הבכיר בפיליפס ולחבור ליאן סלוט ולחבר משקיעיו.

במבט ראשון, המהלך של פיפר נראה חסר הגיון לחלוטין: מי יעזוב תפקיד כה בכיר – תפקיד שהציב את פיפר בנקודה מצויינת להתמנות למנכ"ל פיליפס בעתיד הלא רחוק – לטובת סטארט-אפ שמבוסס על המצאה של טכנאי טלוויזיה מניו-ואחן, עיירה הולנדית קטנה ומנומנמת?

אבל רול פיפר היה רחוק מלהיות טיפש. הניסיון העשיר שלו בעולם הטכנולוגיה לימד אותו ששיפור כה דרמטי ביכולת דחיסת מידע – פי מאה מיליון ביחס לטכנולוגיות הקיימות – יחולל מהפכה טכנולוגית בקנה מידה שקשה אפילו לדמיין. חלק גדול מאד מטכנולוגיית האינטרנט המודרנית סובב סביב האתגר של שינוע כמויות אדירות של מידע בכמה שפחות זמן: סרטים, סדרות, שירים, ספרים, דפי אינטרנט ועוד ועוד. ההמצאה של סלוט תייתר את כל הסיפור המורכב הזה, ותחסוך לחברות הטכנולוגיה מאות מיליארדי דולרים בכל שנה. פיפר העריך, בהערכה זהירה ושמרנית יחסית, ששווייה הראשוני של המצאתו של סלוט הוא לפחות עשרים וארבעה מיליארד דולר – וזו באמת הערכה שמרנית מאוד.

כעת קל יותר להבין את פשר עזיבתו הדרמטית של פיפר את פיליפס. הקבוצה הקימה חברה בשם 'הכוח החמישי', Fifth Force, ופיפר ניצל את קשריו הענפים בעולם הטכנולוגיה כדי לפתוח לסלוט דלתות שלטכנאי הטלוויזיה לא היה סיכוי לפתוח בכוחות עצמו. השניים המריאו לארצות הברית – הטיסה הביניבשתית הראשונה בחייו של סלוט – ונפגשו עם מספר מנכ"לים ושותפים בכירים בקרנות הון סיכון, שגילו עניין רב בהמצאה.

שבועות מספר לאחר מכן הזמין פיפר את סלוט להצטרף אליו שוב למסע פגישות בארצות הברית, אבל סלוט סירב: הנסיעה הקודמת התישה אותו לגמרי. אחרי מאמצי שכנוע כבירים, סלוט הסכים למסור לידיו של פיפר ומשקיע נוסף את קופסת האלקטרוניקה כדי שיוכלו להדגים אותה למשקיעים פוטנציאלים גם בלעדי הממציא – אבל נעל את הקופסא מבחוץ כדי שאיש לא יוכל לפתוח אותה ולהעתיק את המעגלים האלקטרוניים. כשחזר פיפר להולנד מארצות הברית, בחן סלוט את הקופסא – ומצא סימנים שהעידו על כך שמישהו ניסה לפרוץ את המנעול. הוא רתח מזעם. מכאן ואילך, הוא לא נתן לאיש להתקרב להמצאתו ללא השגחה צמודה.

אבל מסע גיוס הכספים הוכתר בהצלחה אדירה. בתוך שבועות ספורים הודיע פיפר למשקיעים כי ABN AMRO, הבנק השלישי בגודלו בהולנד – מוכן להשקיע כחמישים מיליון דולר בחברה החדשה תמורת ארבעה אחוזים מהמניות. הפגישה המכרעת עם נציגי הבנק שבה תיתקל ההחלטה הסופית לגבי ההשקעה נקבעה ליום שישי, התשעה ביולי, 1999.

אל הפגישה הזו החליט פיפר להזמין גם מכר ותיק שלו: איש עסקים אמריקני בשם תומאס פרקינס (Perkins). פרקניס היה אחד ממשקיעי ההיי-טק הגדולים בעמק הסיליקון: קרן ההשקעות שייסד, Kleiner Perkins, הייתה אחת המשקיעות הראשונות באמזון, גוגל, טוויטר ועוד חברות מצליחות רבות אחרות, ושווי ההון האישי שלו הוערך בכמה מיליארדי דולרים.

כש סיפר פיפר לפרקינס על ההמצאה של סלוט, פרקינס היה משוכנע שמדובר בתרמית. כך כתב פרקינס על השיחה שלו עם פיפר בביוגרפיה שכתב מספר שנים לאחר מכן:

"[אמרתי לו] 'רוּל, ההמצאה הזו מפרה את התיאוריה של שאנון, ואני חושב שגם את של פורייה וגם את של גרין. זה בלתי אפשרי.' אם הייתי יכול לחשוב על עוד שמות של תיאוריות, בטח הייתי זורק גם את השמות שלהן. זה היה נראה כמו רעיון הזוי."

אבל פיפר התעקש.

"תום, זה מהפכני! עם הטכנולוגיה הזו, אפשר יהיה להעביר שידורי טלוויזיה על כבלים דקיקים – לא נצטרך סיבים אופטיים. אפשר יהיה לשים ספריות וידיאו שלמות בכיסו של הצרכן!"

פרקינס נותר ספקן – אבל פיפר לא היה סתם מישהו: לא רק שהוא היה איש עסקים רציני ומכובד, הוא גם היה דוק' למדעי המחשב, ואם הוא חושב שהדבר אפשרי…וכך, למרות הספקנות – תומאס פרקינס הסכים להצטרף לפגישה של התשעה ביולי.

פרקינס היה באותו הזמן באנגליה. הוא ופיפר נכנסו למכונית של פרקניס ונסעו יחד לאחוזתו של פיפר בפאתי אמסטרדם. בדרך הסביר פיפר לפרקינס איך בדיוק עובדת המצאתו של סלוט. המהנדסים שבחנו אותה, אמר פיפר, לא הבינו אותה כמו שצריך. לא מדובר כאן על דחיסת מידע סטנדרטית – אלא ברעיון אחר לגמרי.

נניח שאני רוצה להראות לכם את 'המונה ליזה', הציור המפורסם. אני יכול לקחת תמונה של הציור, לדחוס אותה, לשלוח אותה אליכם במייל או בוואטסאפ – ואז תוכלו לראות אותה. אבל אני גם יכול לעשות משהו אחר: אני יכול לשלוח לכם קישור לערך של המונה ליזה בוויקיפדיה. כשתלחצו על הקישור תוכלו לראות את הציור – וזאת למרות שלא שלחתי לכם אפילו פיקסל אחד של התמונה המקורית. הקישור ששלחתי לכם הוא בסך הכל מצביע, 'פוינטר', אל מידע קיים שלכם כבר יש גישה אליו. היתרון הגדול של השיטה הזו הוא בעובדה שקישור, במקרה הזה, מכיל הרבה פחות מידע ממה שמכילה התמונה עצמה, ולכן שליחת קישור היא הרבה יותר מהירה ויעילה משליחת כל אותם מיליוני פיסקלים שמרכיבים את המונה הליזה. כל זה בהנחה, כמובן, שלצד המקבל כבר יש את המידע הזה זמין לרשותו וכל מה שהוא צריך זה פוינטר שיפנה אותו אל המיקום המדויק של המידע.

אותו עקרון נמצא בבסיס המצאתו של סלוט. בקופסת האלקטרוניקה, הסביר פיפר לפרקינס, נמצאת ספריה מוכנה מראש של כל הפריימים האפשריים בסרט: כל הקומבינציות האפשריות של כל פיקסלים שאפשר לצייר על המסך – למשל, פריים אחד שכולו מסך שחור, פריים שבו כל הפיקסלים שחורים פרט לפיקסל אחד לבן בפינה הימנית התחתונה, פריים ובו שני פיקסלים לבנים בפינה הימנית התחתונה – וכן הלאה וכן הלאה, המוני צירופים שונים ומשונים של פיקסלים. לכל פריים מוכן-מראש בספרייה הזו, יש שם: לצורך הדוגמה – פריים א', פריים ב', פריים ג' וכדומה. בכרטיס הזיכרון של סלוט יש רשימה של שמות: למשל, א'ב'ג'. קופסת האלקטרוניקה קוראת את הרשימה הזו מהכרטיס, מפענחת אותה – ומציגה על המסך את הפריימים המתאימים בזה אחר זה: פריים א', ואז פריים ב', אחר כך פריים ג' וכדומה. במילים אחרות, במקום לאחסן על כרטיס הזיכרון שלושה פריימים מלאים – שלוש תמונות עם עשרות אלפי פיקסלים כל אחת – אנחנו מאחסנים רק שלושה פוינטרים, שלושה מצביעים קטנטנים ורזים, אל פריימים שכבר נמצאים בזיכרון המכשיר.

תודו שיש משהו מקסים בפשטות של הרעיון הזה. הרי כל פריים של כל סרט שאי פעם הוקרן, מוקרן או יוקרן על המסך – הוא בסך צירוף של פיקסלים בתוך מרובע תחום ומוגדר מראש. לא משנה אם זה סרט של שפילברג או סרטון מיינקראפט שצילם הבן שלי, מרום – שניהם מוכרחים, בסופו של דבר, לבחור את הפריימים שלהם מתוך מאגר סופי שמכיל את כל הפריימים שאפשר, באופן עקרוני, להקרין על מסך. אם כל הפריימים שאפשר לצלם כבר נמצאים מראש בטלוויזיה של הצופה, כל מה שצריך לעשות זה לשלוח לטלוויזיה רשימה שאומרת לה אלו פריימים אנחנו רוצים להציג על המסך ובאיזה סדר – והטלוויזיה כבר תשלוף את הפריימים המתאימים מהזיכרון שלה. אין כאן 'דחיסה' במובן שבו תיארתי אותה עד כה, אלא בסך הכל מנגנון העברת מידע שמנצל את העובדה שהמידע הרצוי כבר נמצא אצל הצופה במעין ספרייה ענקית של פריימים, ורק צריך לומר למכשיר איזה פריים לשלוף מהספרייה הזו ומתי.

סלוט הוא לא היחיד שחשב על הרעיון הזה כפתרון אפשרי לצורך ההולך וגובר שלנו בהעברת כמויות גדולות של מידע. גוגל, למשל, הציעה ב-2008 תקן תקשורת חדש בשם SDCH, שמבוסס על אותו הקונספט. בכל פעם שאנחנו מבקשים משרת אינטרנט שישלח לנו מידע מסוים – למשל, קובץ GIF של איזה מים מצחיק – המידע הזה מגיע עם מידע אקסטרה המכונה Header. לצורך העניין לא חשוב בדיוק מה מכיל ה Header הזה, אלא חשובה העובדה שלפעמים, המידע 'אקסטרה' הזה יכול להיות די גדול ביחס למידע שאנחנו באמת רוצים לקבל. לא נדיר לראות קובץ של 500 בתים מגיע עם Header של אלף בתים, שזה קצת כמו לשלוח דף נייר אחד בתוך ארגז קרטון ענקי. גוגל הציעה לצמצם את הבזבוז המיותר הזה באמצעות שמירה מראש של חלק מסוים מה- Header-ים בדפדפן של המשתמש, כך שבמקום לשלוח את ה Header כולו, אפשר לשלוח רק פוינטר אל המידע שכבר שמור במחשב. היוזמה הזו נגנזה, בסופו של דבר, משיקולים טכנולוגיים כאלה ואחרים, אבל הרעיון העקרוני שריר ותקף.

ההסבר הזה של רול פיפר הניח מעט את דעתו של תום פרקינס, אבל הוא עדיין לא היה משוכנע שסלוט הוא לא נוכל. על כן, הוא הציב תנאי ברור: הוא יצטרף לפגישה, בתנאי שיקבל גישה חופשית אל קופסת האלקטרוניקה כדי לבחון אותה בדקדקנות ולוודא שלא מדובר ברמאות. פיפר הסכים.

בביתו של פיפר הם פגשו את הממציא, בנו ושאר המשקיעים. סלוט כבר הדגים את ההמצאה שלו לנציגי הבנק ההולנדי, בהצלחה רבה, וכעת נתבקש להדגים אותה שוב בפני פרנקינס. פרקינס מספר.

"עם מינימום דיבורים, התנפלתי מיד על הציוד של סלוט. היו שם שתי קופסאות אלקטרוניות: אחת להקלטה, ואחת לניגון. […] בחנתי אותן מבפנים. על הלוחות האלקטרוניים היו רכיבים סטנדרטיים, שום דבר מיוחד, ולא ראיתי שום דבר חשוד – לא דיסק חבוי, לא אנטנה סמויה. הכל נראה היה שגרתי.

הפעלנו את הטלוויזיה, ובחרתי תוכנית בישול אקראית ששודרה באותו הרגע. [סלוט] הוציא מכיסו את כרטיס הזיכרון, הכניס אותו לקופסת ההקלטה ולחץ על כפתור ההקלטה. לגמנו קפה בזמן שתוכנית הבישול המשעממת רצה ברקע. אחרי עשרים דקות אמרתי שמספיק זמן חלף: אם ההקלטה נעשתה בטכנולוגיה רגילה, כרטיס הזיכרון כבר היה מתמלא אלפי פעמים עד עכשיו.

הממציא הוציא את הכרטיס ודחף אותו לקופסה השניה. הוא לחץ על כפתור – והכל היה שם! הוא הריץ קדימה במהירות, הוא הריץ את ההקלטה אחורה. הוא הקפיא את הפריימים והאט אותם. איכות התמונה על המסך הייתה כמעט זהה למקור, ואפילו קצת יותר טובה מאיכות שידור אמריקנית טיפוסית."

תום פרקינס היה בהלם. הוא מעולם לא ראה דבר שכזה. על המקום הוא החליט להצטרף לצוות המשקיעים.

"לא היה לי ספק קל שבקלים שאנחנו עומדים להיות בעליה של טכנולוגיה שתהיה שווה מיליארדים רבים של דולרים. […] בחנתי את פניו של יאן סלוט. הוא היה במצב של…ובכן.. אושר עילאי. זו המילה היחידה שאני יכול למצוא כדי לתאר את ההבעה על פניו באותו הרגע. הוא עבד במחשכים במשך חמש עשרה שנה, וזה היה הרגע שבו כל החלומות והתוכניות שלו התגשמו. הוא היה, מילולית, האדם המאושר ביותר שאי פעם ראיתי.

[…] באותו הלילה לא הצלחתי לישון. מוחי קדח במחשבות על ההזדמנויות שהטכנולוגיה הזו תפתח עבורנו: סרטים שלמים על שבבים זעירים, טלפונים יוכלו לשדר וידיאו בזמן אמת, לווינים יוכלו לשדר תוכניות תפורות לכל אדם. תכננתי להכניס את רופרט מרדוק [ענק העיתונות הידוע – ר.ל] בסוד העניינים. […] כמה נוכל לדרוש תמורת רשיון שימוש לטכנולוגיה? כמה נוכל לייצר בכוחות עצמנו? מחשבותי הנלהבות רצו קדימה עוד ועוד."

כשעלה הבוקר, התקשר פרקינס לפיפר.

"'רול! חשבתי על זה, אנחנו צריכים לייצר כמה קופסאות הדגמה לחברות הטלפוניה, ואני רוצה לדבר עם רופרט מרדוק כמה שיותר מהר, ו..'

'תום, הוא מת.'

' – ואחרי שנצליח לעניין את רופרט, אנחנו צריכים להכניס שחקנים נוספים לתמונה. אני חושב שסוני צריכה להיות ראשונה בגלל ש…'

'אחרי שהלכת, הוא מת.'

'מה?'

'יאן סלוט מת.'

'מה זאת אומרת, הוא מת??'

'תום, לא הרבה אחרי שהלכת, הוא התמוטט על הרצפה. עשינו לו החייאה והטסנו אותו לבית החולים, אבל הוא כבר היה מת. הוא חטף התקפת לב מאסיבית.'"

יומיים בלבד לפני ש Fifth Force הייתה אמורה לקבל מהבנק ההולנדי חמישים מיליון דולר – וסלוט עצמו היה אמור לשלשל עשרים מיליון דולר לכיסו – הלך הממציא לעולמו במפתיע, והשאיר את כל המשקיעים המומים. הבעיה הגדולה ביותר הייתה שסלוט הפרנואיד לא שיתף אף אחד בסוד ההמצאה שלו. הוא הסביר לרול פייפר את הרעיון העקרוני – וגם תיאר אותו בקווים כלליים בשני פטנטים שהגיש בהולנד – אבל איך בדיוק פועלת התוכנה שממירה את סרטי הוידיאו לרשימה המקוצררת שבכרטיס הזיכרון – את זה הוא הבטיח לגלות רק אחרי שהכסף מההשקעה ייכנס לכיסו.

היכן נמצא קוד המקור של התוכנה? זו הייתה השאלה שהטריפה את דעתם של כל המשקיעים – אך לאיש לא הייתה תשובה. כצעד ראשוני, הציבה החברה שומרים סביב ביתו של סלוט, עשרים וארבע שעות ביממה, כדי למנוע כל אפשרות לגניבה. והייתה עוד סיבה לשמירה. אשתו של סלוט וילדיו טענו שאין להם מושג היכן נמצאת התוכנה הסודית – אבל חלק מהמשקיעים לא בטחו בהם. הם חשדו בבני משפחתו של סלוט שהם ינסו למכור את הקוד למישהו אחר שיציע להם יותר כסף. השמירה, אם כן, נועדה גם כדי למנוע מבני המשפחה להוציא את הקוד מהבית – אם הוא אכן שם. אבל למרות השמירה, הסתבר להם שאחת מבנותיו של סלוט הצליחה להגניב החוצה מהבית שתי קופסאות קרטון מלאות בציוד שמצאה בחדר העבודה של הממציא המנוח. השומרים עקבו אחר רכבה של הבת – אבל היא הצליחה לחמוק מהם.

בסופו של דבר הצליחו המשקיעים להגיע להסכמה עם בני המשפחה, ואלה מסרו לידיהם את קופסת האלקטרוניקה תמורת הבטחה לכמה מיליוני דולרים בעתיד. חברת הכוח החמישי שכרה את שירותיו של מומחה שפתח את הקופסא. הוא לא מצא בתוכה את הקוד הסודי – אבל כן מצא בתוכה דיסק קשיח. סלוט, נזכור, טען בתוקף לכל אורך הדרך שאין שום התקן אחסון בתוך קופסת האלקטרוניקה, ושכל החוכמה של ההמצאה שלו היא בקוד התוכנה המיוחד… בנו של סלוט הסביר כי אביו התקין את הדיסק הקשיח בתוך הקופסא רק יום לפני מותו, כפתרון זמני לתקלה שנתגלעה במתקן: שבב זכרון כלשהו כשל, ולסלוט לא היה שבב חליפי.

בתוך חברת הכוח החמישי פרצו סכסוכים קשים. חלק מהמשקיעים האשימו את רול פיפר שהוא מנסה להשתלט על החברה, וחשדו בו שהוא עצמו מסתיר את הקוד הסודי. אפשר להקדיש עוד פרק שלם נוסף לתככים ולסכסוכים שפרצו בתוך Fifth Force בעקבות מותו של הממציא – אבל אין בכך טעם. סלוט לקח עימו את סודו אל הקבר, וההמצאה המהפכנית – אם אכן הייתה כזו – אבדה, ככל הנראה לנצח.

בשנים שחלפו מאז הפך סיפורו של יאן סלוט לעוד אחד מתוך אלפי סיפורים מיתולוגיים שמרחפים בתרבות שלנו, לצד האגדות של ביגפוט, אזור 51 ומשולש ברמודה. אם תחפשו ביו-טיוב, תמצאו לא מעט סרטונים שבהם מועלות תיאוריות קונספירציה שונות ומשונות, כמו למשל שחברות הקולנוע הן שהתנקשו בחייו של סלוט כיוון שאיים על העסקים שלהן באופן כלשהו. בהולנד, ספציפית, נעשו כמה תוכניות דוקומנטריות על חייו של סלוט, ואפילו נכתבו תסריטים לשני סרטים שנכון לעכשיו, עדיין לא יצאו אל הפועל.

אם כן, מה פסק הדין הסופי לגבי יאן סלוט? האם הוא היה ממציא אותנטי של טכנולוגיה מהפכנית, או נוכל מתוחכם שהיתל במשקיעיו?

כמובן שבלעדי עדויות מוחשיות, לא נוכל לקבל תשובה נחרצת – אבל על פניו עושה רושם שלמרות שהרעיון העקרוני של סלוט ישים ברמה התיאורטית, הוא לא יכול היה לעבוד במציאות. מדוע? כמו תמיד, השטן נמצא בפרטים הקטנים.

פריים של סרט וידיאו צבעוני ברזולוציה של 480 על 640 פיקסלים, למשל, מכיל 921 אלף ביטים של מידע – 921 קילובייט. זה אומר שהספרייה בזיכרון של המכשיר צריכה להכיל פריימים שהם כל הצירופים האפשריים של 921 אלף ביטים – שזה בערך שתיים בחזקת שבעה מיליון פריימים. לומר שזה לא מעשי עם הטכנולוגיה שיש לנו היום, זה אנדרסטייטמנט, ומעבר לכך – סלוט גם טען שבקופסת האלקטרוניקה אין כלל התקן זיכרון שמאחסן פריימים כאלה. אם כן, איפה נמצאת הספרייה ההיפוטתית הזו? אנחנו לא יודעים.

אבל אתם יודעים מה – בואו ניתן ליאן סלוט להנות מהספק. אולי הוא מצא שיטה שלוקחת את הפויינטרים השמורים בכרטיס הזכרון והופכת אותם, באמצעות אלגוריתם תוכנה כלשהו, לפריים מלא שאפשר להציג על המסך. אני לא יודע איך אפשר לעשות דבר כזה, אבל בואו נניח לרגע שזה אפשרי. גם תחת ההנחה הזו – ההמצאה של סלוט היא עדיין בלתי אפשרית. מדוע?

בואו נניח, לשם ההסבר, שבכל פריים של הוידיאו יש בסך הכל ארבעה פיקסלים. לצורך הדוגמה, כל פיקסל בפריים שלנו יכול להיות דלוק או כבוי. אם נרשום על דף את כל הצירופים האפשריים של פיקסלים כבויים ודלוקים, נמצא שיש לנו שישה עשר צירופים אפשריים – או במילים אחרות, שישה עשר פריימים שונים שאפשר ליצור בעזרת אותם ארבעה פיקסלים.

כעת אנחנו צריכים ליצור פוינטר שיאמר לטלוויזיה שלנו 'בחרי את הפריים הספציפי הזה מתוך שישה עשר הפריימים ששמורים אצלך בזיכרון.' אתם יודעים כמה ביטים אנחנו צריכים כדי לייצג שש עשרה אפשרויות שונות? ארבעה ביטים. כן, בדיוק אותו המספר כמו מספר הפיקסלים שעל המסך. אפשר להוכיח את הטענה שטענתי כרגע באמצעים מתמטיים, אבל אפשר גם להבין אותה בעזרת השכל הישר. נניח לרגע שיש לנו רק שלושה ביטים בכל פוינטר. שלושה ביטים שכל אחד מהם יכול להיות 0 או 1, יוצרים שמונה צירופים אפשריים. אבל כרגע אמרנו שבספרייה שלנו ישנם שישה עשר פריימים. זה אומר שכל פוינטר בכרטיס הזיכרון מצביע על שני פריימים בו זמנית. איך תדע הטלוויזיה לבחור מי מבין שני הפריימים האלה צריך להופיע על המסך? היא לא תדע – ולכן אין לנו ברירה, אנחנו חייבים שכל פוינטר יהיה מורכב ממספר ביטים זהה למספר הפיקסלים על המסך. ואם מספר הביטים בפוינטר זהה למספר הפיקסלים שעל המסך – לא עשינו כלום! לא דחסנו את המידע! אם בכל פריים יש 921 אלף ביטים של מידע, ופוינטר אליו הוא בגודל של 921 אלף ביטים של מידע – זה אותו הדבר, לא?

רגע, אתם שואלים – אז מה לגבי הדוגמה של המונה ליזה שנתתי קודם? איך שם זה עובד, ופה לא? התשובה היא שמונה ליזה – או תמונות בוויקיפדיה בכלל – יש מעט מאוד באופן יחסי. בדקתי: יש בערך 62 מיליון תמונות וסרטונים בוויקיפדיה. כדי לבחור תמונה אחת מתוך 62 מליון אפשרויות – אנחנו צריכים בסך הכל עשרים ושישה ביטים. בפריים של וידיאו, כפי שכבר ציינתי קודם, יש 2 בחזקת שבעה מיליון אפשרויות, שזה מספר בקנה מידה אחר לגמרי.

אז בשורה התחתונה, הרעיון של סלוט יכול היה לעבוד רק במקרים מסויימים מאוד שבהם מגוון הפריימים שצריך לבחור מתוכם הוא מצומצם יחסית. ברור לגמרי שכשמדובר בסרט וידיאו אמיתי, שבו כל פריים הוא עולם ומלואו, עם צבע ותנועה ומה לא – זה לא יכול לעבוד, ולכן קשה להאמין שסלוט אכן הצליח להמציא את מה שטען שפיתח.

דחיסת מידע ממשיכה להיות אחד האתגרים הטכנולוגיים הכבירים ביותר שניצבים בפנינו במאה העשרים ואחת. בכל שנה או שנתיים אנחנו שומעים על אלגוריתמים חדשים לדחיסת מידע שמפותחים במעבדות מחקר ואוניברסיטאות שונות – אבל השיפור בדחיסה נמדד כמעט תמיד בשברירי אחוז. בשנת 2016, למשל, הציגה פייסבוק אלגוריתם דחיסה חדש בשם Zstandard שפיתחו מהנדסיה. Zstandard עושה שימוש בטכניקות מתקדמות ומעבדים רבי עוצמה שלא עמדו לרשותם של אברהם למפל, יעקב זיו ועמיתיהם בדורות הקודמים – ולמרות כל היתרונות האלה, Zstandard מצליח להגיע לשיפור של 0.03 אחוזים בלבד ביחס לאלגורתמי דחיסה מקבילים – אם כי למען ההגינות יש לציין כי הוא מבצע את הדחיסה הזו במהירות כפולה מהם – שיקול חשוב כשבאים לבחור באיזה אלגוריתם דחיסה כדאי להשתמש. ובכל זאת, לא האלגוריתם של פייסבוק הוא זה שיאפשר לנו להתמודד עם כמויות המידע האדירות שאנחנו צריכים להעביר דרך האינטרנט בכל שניה ושניה.

אבל אולי יש תקווה מסויימת, שמגיעה מכיוון מעט מפתיע.

בואו נחזור אחורה לקוד מורס. במורס, נזכיר, האותיות E ו-T זוכות לייצוגים הקצרים ביותר בקוד כיוון שאלו הן האותיות השכיחות ביותר באלפבית האנגלי. השאלה הזו, איזה ייצוג לתת לאיזו פיסת מידע – היא האתגר הגדול ביותר בתחום דחיסת המידע, כיוון שלכל סוג של מידע יש מאפיינים ייחודיים משלו. כבר לפני כמעט מאה שנה הוכיח קלוד שאנון, מי שייסד את התחום במדע המכונה 'תורת האינפורמציה', שאי אפשר ליצור אלגוריתם דחיסה אחד שיצליח לדחוס בצורה אופטימלית את כל סוגי המידע הקיימים. זאת אומרת, אלגוריתם שעושה עבודה מצוינת עם סוג אחד של מידע – בהכרח לא יעשה עבודה טובה בסוגי מידע אחרים. ואכן, כפי שכבר ראינו במהלך הפרק, אלגוריתם דחיסה משמר-מידע שיעבוד מצוין על קובץ טקסט, יהיה הרבה פחות מוצלח על קובץ וידיאו. לכן, חוקרים שמפתחים אלגוריתמי דחיסה צריכים לחשוב טוב טוב על סוג המידע שהם רוצים לדחוס והמאפיינים הייחודיים לו.

אבל גם בתוך כל סוג מידע ישנה חלוקה לעוד תתי-סוגים של מידע. למשל, נניח שאנחנו צופים בקרב איגרוף. מטבע הדברים המבט שלנו מרוכז בשני המתמודדים בתוך הזירה, ואנחנו כמעט ולא שמים לב למה שמתרחש מחוץ לזירה. זה אומר שעקרונית, אפשר היה לדחוס את המידע לגבי מה שקורה מחוץ לזירה עוד קצת, גם במחיר של טשטוש ועיוות נוספים, כיוון שרוב הצופים בלאו הכי לא שמים לב לאזור הזה של המסך. הבעיה היא, כמובן, שהמחשבים שלנו לא יודעים לזהות איזה מידע בתוך התמונה הוא מידע 'חשוב' שאסור לקלקל אותו בזמן הדחיסה, ואיזה מידע הוא פחות חשוב ולכן אפשר לדחוס אותו עוד יותר גם במחיר של קלקול נוסף. מבחינת האלגוריתמים הקיימים, פיקסל הוא פיקסל הוא פיקסל.

אבל בשנים האחרונות הופיעה טכנולוגיה חדשה – הבינה המלאכותית – שאחד הדברים שהיא מצטיינת בו הוא בדיוק אותו 'שיקול דעת' שתארתי לגבי מה חשוב בתוכן ומה לא. למשל, אחת המשימות הקלאסיות של בינה מלאכותית היא זיהוי תוכן של תמונה: למשל, לזהות שבתמונה מסוימת נמצא כלב. האתגר במשימה הזו הוא שכמעט תמיד יהיו בתמונה פרטים נוספים פרט לכלב – למשל, שיח מרוחק ברקע או משהו דומה – ועל המחשב להבין שהכלב הוא הפרט החשוב בתמונה, וכל השאר פחות חשוב. טכניקות מודרניות של בינה מלאכותית מסוגלות לעשות את ההבחנה הזו, וזה סוד כוחן. אפשר בהחלט לדמיין מצב שבו הבינה המלאכותית עוברת על המידע בזמן שהוא עובר דחיסה, ואומרת – 'זו זירת האיגרוף, החלק החשוב בסרטון – ואלו המושבים של הקהל, והם לא חשובים.' מצוידת בתובנה הזו, הבינה המלאכותית תוכל להפעיל דחיסה אגרסיבית יותר על מידע פחות חשוב, וכך בשאיפה להקטין עוד יותר את גודל הקובץ המתקבל. ואכן, מחקרים ראשוניים שנעשו בשנים האחרונות מראים שלכיוון הזה יש פוטנציאל מבטיח מאוד – עד כדי שיפור של עשרות אחוזים ביחס לטכניקות הקיימות. בשנים האחרונות יזמו גוגל, נטפליקס, טוויטר ועוד מספר חברות טכנולוגיה תחרויות נושאות פרסים לחוקרים בתחום הבינה המלאכותית שיצליחו לפתח טכניקות דחיסה פורצות דרך.

האם זה המפתח לפתרון אתגר דחיסת המידע שאנחנו עומדים מולו? אולי. אבל מה שבטוח הוא שזה עוד מקום שבו אנחנו נותנים לבינה המלאכותית פתח להחליט עבורנו מה חשוב בתוכן שאנחנו מקבלים, ומה לא – וגם כאן, נצטרך לשקול היטב האם הטרייד אוף הזה משתלם לנו.

ועוד מילה אחרונה לסיום, על יאן סלוט וההמצאה שלו. אם אתם זוכרים, סיפרתי לכם בפתיחת הפרק שהסיפור של סלוט מזכיר לי מאוד את הסיפורים שעליהם כתבתי בספר 'פרפטום מובילה'. יש עוד סיבה שהסיפור של סלוט הזכיר את הספר ההוא: ב'פרפטום מובילה' חקרתי סיפורים של עשרות רבות של ממציאים של מכונות של תנועה מתמדת, שהתבררו בסוף כנוכלים שניסו לעבוד על משקיעים תמימים. כל האלמנטים הקלאסיים של הנוכלויות האלה נמצאים, כמעט אחד לאחד, גם בסיפור של יאן סלוט: הפרנויה והסירוב לחשוף את ההמצאה, הדגמות פנטסטיות שלא עולות בקנה אחד עם המציאות, הדיסק הקשיח שנתגלה בתוך קופסת האלקטרוניקה לאחר מותו – כל אלה טכניקות מוכרות וידועות של רמאויות טכנולוגיות לכל אורך ההיסטוריה. אני לא יכול לומר לכם בוודאות גמורה שסלוט היה נוכל – אבל אם הייתי צריך להמר על זה, אני יודע איפה הייתי שם את הכסף שלי.