Tuesday, October 17, 2017

עושים היסטרויה: 186, 189: ההיסטוריה של שיתוף הקבצים (Hebrew)

mp3 part1
mp3 part2

חלק א' – עלייתה ונפילתה של נאפסטר

נאפסטר (Napster) הייתה תוכנה פורצת דרך שנכתבה במרתון בודד של 60 שעות תכנות – ומהרגע שהגיחה לאוויר העולם עמדה במרכזה של מתקפה משפטית אכזרית וחסרת תקדים. נפילתה של נאפסטר היתה הזרז לעלייתה של טכנולוגיית שיתוף קבצים חדשה ומשופרת: FastTrack. תוכנות כדוגמת Kazaa, Grokster, eMule ודומיהן הציפו את עולם שיתוף הקבצים. חברות התקליטים והסרטים המשיכו להלחם בהן בבית המשפט, ומשכשלו – פנו לטקטיקות מלוכלכות יותר…ואז הגיעה Bittorent, וטרפה את כל הקלפים.

חלק ב' – קאזה, גרוקסטר וביטטורנט

נפילתה של נאפסטר, עליה הרחבנו בחלקו הקודם של הפרק, היתה הזרז לעלייתה של טכנולוגיית שיתוף קבצים חדשה ומשופרת: FastTrack. תוכנות כדוגמת Kazaa, Grokster, eMule ודומיהן הציפו את עולם שיתוף הקבצים. חברות התקליטים והסרטים המשיכו להלחם בהן בבית המשפט, ומשכשלו – פנו לטקטיקות מלוכלכות יותר…ואז הגיעה Bittorent, וטרפה את כל הקלפים.

https://www.ranlevi.com/2016/04/11/ep186_file_sharing_history_pt_a/
https://www.ranlevi.com/2016/05/12/ep188_file_sharing_part_2/

Ниже есть продолжение.

חלק א' – עלייתה ונפילתה של נאפסטר

שיתוף קבצים מוגנים בזכויות יוצרים היא תופעה הנוכחת ברשת האינטרנט כמעט מראשיתה. ב'שיתוף קבצים', הכוונה להעברה של קבצים כגון שירים, סרטים, תמונות ומסמכים ממחשב למחשב. עוד בשנות השמונים של המאה העשרים, כשתקשורת בין מחשבים הייתה אך בחיתוליה ורק מעטים הבינו בטכנולוגיה המתקדמת הזו – כבר אז היה שיתוף קבצים תופעה נפוצה. למשל, ב-1993 פשטו סוכני FBI על ביתם של אדי ואדווינה הארדנבורו (Hardenburgh) בקליפורניה. אדי ואשתו הפעילו מחדר השינה שלהם שירות שיתוף קבצים באמצעות מודמים, למי מאיתנו שזוכר את הטכנולוגיה העתיקה הזו. מודם הוא מכשיר המאפשר לשני מחשבים לתקשר ביניהם באמצעות קווי הטלפון – ולאדי ולאשתו היו בביתם לא פחות מ-124 קווי טלפון, עדות לאימפריית שיתוף הקבצים שהקימו. אלפי משתמשים החליפו ביניהם בכל יום ג'יגות רבות של משחקים, תכנות פרוצות ותמונות פורנוגרפיות. סוכני הבולשת החרימו מאות רבות של מחשבים מביתם של בני הזוג.

כמות המשחקים, התמונות והסרטונים שאדם ממוצע יכל לשמור על המחשב הביתי שלו גדלה בהתמדה,.שכן בכל שנה שחלפה המחשבים השתכללו, מחירם של אמצעי האחסון הדיגיטליים צנח ונפחם נסק – בדומה לרוחב הפס של התקשורת לאינטרנט. מאות אלפי משתמשים נעזרו בטכנולוגיות כדוגמת IRC, FTP, קבוצות newsgroups ו-BBSים כדי לשתף ביניהם קבצים. אם לא הבנתם מילה מהמשפט האחרון שאמרתי – אל דאגה: כולן טכנולוגיות עתיקות שהן היום נחלת גיקים מדופלמים בלבד, ובחלק מהמקרים אף נעלמו לחלוטין מהעולם הדיגיטלי

העובדה שטכנולוגיות אלה פותחו בשנות השבעים של המאה העשרים, כשלרשת האינטרנט הצעירה היו רק מספר משתמשים זעום, באה לידי ביטוי בחולשתם הגדולה ביותר: הקושי שבגילוי קבצים חדשים לשיתוף. כדי להסביר את חולשה זו, הבה הבה נלך צעד אחד אחורנית ונדבר על הדרך 'המסורתית' או ה'שגרתית' שבה עוברים קבצים ברשת.

כדי לסייע לי להעשיר את ההסבר הטכני, החלטתי לנקוט בגישה…בלתי שגרתית. נכנסתי לפייסבוק וביקשתי מהמאזינים לפגוש אותי ,באופן ספונטני למדי, בתחנת הרכבת שליד אוניברסיטת תל-אביב. לא ממש כתבתי להם מה אני מתכנן לעשות, אבל הבטחתי שיהיה כיף. על בסיס הבטחה קלושה זו הצלחתי לפתות שמונה מאזינים להתלוות אלי בשעות בין ערביים אל ליבו של פארק הירקון – ושם, כשהם כבר לא יכולים לברוח, הסברתי להם מה אני רוצה לעשות. את מה שעשינו שם תשמעו מיד וגם בפרק הבא, אבל בוא נאמר רק שלכמה רגעים היינו אטרקציה גדולה יותר בפארק הירקון מהצאפארי.

בהכללה גסה, אפשר לומר כי באינטרנט יש שני סוגי מחשבים: שרתים ו-לקוחות. הלקוחות הם המחשבים הביתיים, המחשבים שלנו, המשתמשים הפשוטים – ומחשבי השרת, כפי שמרמז שמם, מעניקים להם שירות: למשל, הם מאחסנים את אתרי האינטרנט שאנחנו גולשים אליהם. השרתים יכולים גם לאחסן קבצים, כגון קבצי מוזיקה. במקרה כזה, אם המשתמש זקוק לקובץ מסוים, הוא לוחץ על הקישור המתאים והמחשב שלו פונה אל השרת ומבקש ממנו את הקובץ. אם השרת מחזיק בקובץ הוא שולח אותו אל מחשב הלקוח. זו, כאמור, השיטה הרגילה – והיא גם זו שהייתה בבסיס אימפריית שיתוף הקבצים של אדי ואדווינה הארדבורו בקליפורניה. המחשבים שהחזיקו בני הזוג בביתם היו שרתים, והמשתמשים שחייגו אליהם היו הלקוחות.

אך מה קורה אם הקובץ המבוקש אינו קיים אצל השרת – אבל קיים אצל לקוח אחר? לשם ההסבר, נניח שיש ברשותי קובץ ממש… אתם יודעים… חם. מה זה חם – 'לוהט'. 'Hardcore'. הקלטה נדירה של התוכנית 'באופן מילולי', פינתו של הדוק' אבשלום קור. ברור לגמרי שכל שאר הגולשים 'מתים' לקבל לידיהם את הקובץ – אבל אני בסך הכל אחד מתוך מיליוני גולשים אנונימיים באינטרנט. כיצד יוכלו לדעת שהקובץ ברשותי? זו 'בעיית הגילוי' – והיא זו שהגבילה את יכולתם של משתמשי האינטרנט לשתף קבצים זה עם זה. מי שאחראית למהפכה שהסירה את המכשול הגדול הזה, והשיקה את עידן שיתוף הקבצים המודרני הייתה אחת התוכנות המפורסמות ביותר בהיסטוריה – נאפסטר.
הקמתה של נאפסטר

נאפסטר הייתה פרי מוחם של שני צעירים אמריקנים: שון פאנינג (Fanning) ושון פרקר (Parker) . פאנינג ופרקר, שני חובבי מחשב נלהבים, הכירו בפורומים טכנולוגיים מקוונים כשהיו בני חמש עשרה. ב-1999 החל שון פאנינג ללמוד בקולג' בבוסטון: הוא היה ידוע בקרב חבריו כמי שאוהב לישון עד מאוחר, וזכה בכינוי 'נאפסטר' – 'נמנמן', בתרגום חופשי. ערב אחד שתה פאנינג בירה עם כמה מחבריו ללימודים והקשיב להם מקטרים על הקושי במציאת קבצי mp3 של שירים. פרט לאפשרויות שתיארתי קודם, ב-99' היו כמה אתרי אינטרנט שאפשרו למשתמשים להוריד שירים – למשל, Audio-Galaxy ו HotLine – אך רבים מהקישורים לקבצים היו 'מתים': דהיינו, קישורים אל קבצים שכבר נמחקו מהשרת מסיבה כלשהי. על פי רוב, המחפש נאלץ לנסות עשרות קישורים מתים שכאלה לפני שהצליח למצוא סוף סוף קישור שהוביל לשיר המבוקש.

השיחה עם החברים הובילה את פאנינג להארה. הוא הבין שפרט ליכולת הטכנית להעביר קובץ ממחשב למחשב, תכנת שיתוף קבצים מוצלחת חייבת להיות בעלת שני מאפיינים נוספים: לאפשר למשתמשים לשוחח ביניהם בצ'אט או בכל צורת תקשורת אחרת, ולאפשר להם לגלות בקלות יחסית קבצים הקיימים על מחשביהם של משתמשים אחרים. פאנינג גם ידע שכל אבני הבניין הללו כבר קיימות בצורות שונות ויושמו בתכנות נפרדות זו מזו – ועל כן כל מה שעליו לעשות הוא לשלב את שלוש התכונות במסגרת תכנה אחת ויחידה. הוא תיאר את הרעיון לחברו, שון פארקר, שגם הוא גילה התלהבות. אבל לפני שהחלו לממש את הרעיון בפועל, הייתה בעיה נוספת שעמדה בפניהם: בעיית החוקיות – או ליתר דיוק, אי-החוקיות – של שיתוף קבצים המוגנים בזכויות יוצרים.

שיתוף קבצים, כפי שציינתי קודם, לא היה דבר חדש, וגם תביעות משפטיות על רקע הפרת זכויות יוצרים היו דבר שבשגרה כבר מאות שנים לפני המצאת המחשב. 'זכות יוצרים' היא ההגנה שנותן החוק לבעליה של יצירה כלשהי מפני שימוש בלתי מורשה בה. החוקים והכללים החלים על זכויות היוצרים שונים בין מדינה למדינה – אך ככלל, אם מצליח התובע להוכיח כי הנתבע עשה ביצירה שלו שימוש בלתי חוקי, הוא זכאי לדרוש ממנו פיצוי כספי. פאנינג ופרקר היו מודעים מאוד לסיכון שהם לוקחים על עצמם לכשיישמו את הרעיון שעלה במוחו של פאנינג. אם יוכלו חברות התקליטים – בעלות הזכויות על שירים – להוכיח שלשניים יש אחריות משפטית על הפרת זכויות היוצרים בגלל התוכנה שיצרו, הן תוכלנה לתבוע אותם ולדרוש מהם פיצוי על ההפרה. לשני החברים היה, אם כן, צורך בוער למצוא בראש ובראשונה פיתרון לבעיה המשפטית, לפני שיוכלו ליישם את הפיתרון הטכנולוגי.
הגנת בטאמקס

הפיתרון שמצאו, בסופו של דבר, נשען על אחד מפסקי הדין המפורסמים והחשובים בתחום דיני זכויות היוצרים בארה"ב: חברת סוני נגד אולפני יוניברסל, משנת 1984. סוני, חברת הטכנולוגיה המפורסמת, הוציאה לשוק קלטת וידאו המבוססת על טכנולוגיה בשם 'בטאמקס'. חלק ממשתמשי הקלטות נעזרו בהן כדי להקליט תוכניות וסרטים ששודרו בטלוויזיה – ולהעביר אותם לחבריהם. חברת אולפני יוניברסל, שהחזיקה בבעלותה את זכויות היוצרים לסרטים רבים, הגישה נגד סוני תביעה בטענה כי שיתוף סרטים מוקלטים היא הפרה של זכויות יוצרים וכי סוני, יצרנית קלטות הבטאמקס ומפתחת הטכנולוגיה החדשה, היא האחראית להפרה זו – שהרי בלעדי הקלטות, אי אפשר היה להעתיק את הסרטים.

תביעתה של אולפני יוניברסל נדחתה: בפסיקתו התקדימית קבע בית המשפט העליון בארה"ב שהעובדה שהטכנולוגיה החדשה מאפשרת למשתמשים להפר זכויות יוצרים – אינה סיבה מספקת לחסום את השימוש בה. אם לטכנולוגיית הבטאמקס יש גם שימושים אחרים, שאינם מפירים את זכויות היוצרים – למשל, המשתמש יכול להקליט תכנית ולצפות בה בעצמו מאוחר יותר – אזי זכותו של הממציא לחדש עולה על זכותו של בעל זכויות היוצרים להגנה מפני הפרת הזכויות.

סוני ניצחה במערכה – אבל הפסידה במלחמה: בסופו של דבר, צרכני הוידאו העדיפו את קלטות ה-VHS ובטאמקס לא הצליחה בשוק. אבל לפסיקתו התקדימית של בית המשפט העליון הייתה גם הייתה השפעה אדירה על עולם הטכנולוגיה, שכן היא הבטיחה שיצרניות הטכנולוגיה יכולות להמשיך ולחדש מבלי לחשוש שמא פעילות בלתי חוקית שעושים משתמשים בעזרת הטכנולוגיה שלהם (למשל – העתקת סרטים והפצתם) תסכן אותן. אלמלא "הגנת הבטאמקס" לא היינו נהנים מנגני mp3 דיגיטליים, ממכשירי DVD וממוצרי צריכה דומים.

פאנינג ופרקר החליטו לנצל את המטריה שהעניקה להם הגנת בטאמקס. חלוקת העבודה ביניהם הייתה ששון פאנינג יהיה המתכנת, ושון פרקר יהיה האחראי על הטיפול בכל מה שקשור בזכויות יוצרים. שון פרקר סיפר מאוחר יותר את הדברים הבאים:

"קראתי את כל מה שאפשר לקרוא על פסיקות בית המשפט בענייני זכויות יוצרים, והרגשתי שהגנת בטאמקס מעניקה לנו הגנות מסוימות […] אמרתי לשון [פאנינג] שאנחנו חייבים לתכנן את הרשת כך שקבצי ה-mp3 עצמם לעולם לא 'ייגעו' במערכת שלנו. אם הקבצים עוברים ישירות בין המשתמשים לבין עצמם – אנחנו יכולים להגן על עצמנו באופן לגיטימי."

במילים אחרות, כל עוד המשתמשים יהיו אלו שיבצעו פעולות בלתי חוקיות של שיתוף קבצים מוגנים בזכויות יוצרים, ושני ה"שונים" יהיו אלה שרק יספקו את התשתית הטכנולוגית אבל לא יהיו מעורבים בעצמם באקט השיתוף – הם יהיו מוגנים באותו האופן שבו סוני מוגנת מתביעה, מכיוון שמשתמשיה הם אלה שמחליפים ביניהם קלטות, ולא החברה עצמה.

מצויידים בתובנה זו פנו פאנינג ופרקר אל ג'ון פאנינג, דודו של שון פאנינג. ג'ון היה יזם ומשקיע בחברות סטארט-אפ, ועשה את הונו בפיתוח תכנות בתחום משחקי השח הממוחשבים. במאי 1999 הוקמה באופן רשמי חברת 'נאפסטר', וג'ון סיפק לה את ההון הראשוני. שון פאנינג חש שעליו למהר ולממש את רעיונותיו לפני שמישהו אחר יעשה זאת לפניו, ועל כן הסתגר במשרדו של הדוד ג'ון למרתון ארוך של שישים שעות תיכנות. כאשר לבסוף יצא מהמשרד נשא באמתחתו את הגרסה הראשונה של תכנת נאפסטר.

התגובות הראשונות למיזם היו פושרות, בלשון המעטה. מתכנת מנוסה שעמו התייעץ שון פאנינג המליץ לו לשכוח מהעניין ולהתרכז בלימודים. הוא טען שאין סיכוי שמשתמשי המחשב יהיו מוכנים לאפשר למשתמשים אקראיים אחרים לראות מה נמצא על מחשביהם, ושגם אם יסכימו – רוב האנשים אנוכיים מדי מכדי לחלוק קבצים שלהם עם אחרים. גם הוריו של פאנינג היו מאוכזבים מאוד מרצונו לעזוב את הלימודים ולהתרכז בנאפסטר. אבל לשון פאנינג לא הייתה כל התלבטות: הרעיון אחז בו בלפיתה כה חזקה, עד שיום אחד פשוט קם ועזב את החדר שלו במעונות – ולא חזר אליו. הוא השאיר מאחוריו את הבגדים, את הספרים ואפילו את המצעים.

כיצד פעלה נאפסטר במישור הטכני, וכיצד פתרה את 'בעיית הגילוי' – דהיינו, כיצד אפשרה למשתמש אינטרנט אחד לגלות אלו קבצים מחזיק ברשותו משתמש אחר, ולהעביר את הקובץ מאחד לשני? ובכן, נאפסטר, כאמור, היא תוכנה. כשהמשתמש מתקין את התוכנה על המחשב הביתי שלו, היא סורקת את התיקיות שלו ומגלה אלו קבצי mp3 נמצאים ברשותו. לאחר מכן יוצרת התוכנה קשר אל מחשב שרת ששייך לחברת נאפסטר, ושולחת אליו את רשימת הקבצים הללו. שימו לב לנקודה הבאה: התוכנה שולחת לשרת של נאפסטר אך ורק רשימה המכילה את שמות הקבצים – ולא את הקבצים עצמם. לעובדה זו תהיה חשיבות גדולה בהמשך.

כעת, נניח שאני, המשתמש, מחפש את פינתו של הדוק' אבשלום קור. היחידה שמחזיקה ברשותה את הקובץ היא דינה, העורכת הלשונית שלנו – שגם היא משתמשת בנאפסטר. vמחשב שלי, הלקוח, פונה אל השרת של נאפסטר ושואל אותו היכן נמצא הקובץ AvshalomKor.mp3. השרת של נאפסטר מחזיק אצלו את כל רשימות הקבצים של כל משתמשי התוכנה, וחיש מהר מגלה שהקובץ המדובר נמצא אצל דינה. כעת שולח אלי השרת את כתובת האינטרנט של המחשב של דינה – כתובת ה-IP שלה. באמצעות תוכנת נפאסטר, מחשב הלקוח שלי פונה אל מחשבה של דינה ששולח אל המחשב שלי את הקובץ.

המאפיין הבולט והחשוב ביותר בשיטה זו היא העובדה שהעברת הקובץ לא נעשית בין מחשב הלקוח ומחשב השרת – אלא בין שני מחשבי לקוח. זו שיטת קבצים המכונה Peer To Peer, בתרגום חופשי – 'מעמית לעמית', לציון העובדה ששני המחשבים, שני העמיתים, חברים באותה רשת גדולה של משתמשי תוכנת נאפסטר.

המאפיין החשוב השני הוא העובדה שמחשב השרת – זה שבבעלותה של נאפסטר – לא מחזיק ברשותו קבצי mp3 באי אלו משלבי התהליך. אפשר לדמות את תפקיד השרת לזה של מתווך דירות: הוא מחזיק ברשותו את רשימת הדירות המוצעות למכירה – אבל אין לו בעלות עליהן. המתווך הוא בסך הכל זה שמחבר בין המוכרים והקונים, ומקל על ביצוע העסקה. העובדה שהשרת לא החזיק ברשותו קבצי mp3 היא זו שהעניקה לחברה את הגנת בטאמקס. לפחות בתיאוריה.

לגישה זו היו שתי יתרונות נוספים. הראשון הוא העובדה שהחברה לא הייתה צריכה לאחסן במחשביה מיליוני קבצים של שירים, על כל המשמעויות הלוגיסטיות הנגזרות מאחסון מידע בנפח אדיר כל כך. השני, חיסכון ברוחב פס. אם המחשב המרכזי היה צריך לשלוח קבצי mp3 לאלפי משתמשים בו זמנית, הדבר היה דורש תשתית תקשורת משמעותית – כמו צינור עבה שצריך לספק מים לאלפי בתים בו זמנית. אך כיוון שהקבצים עברו בין המשתמשים לבין עצמם, ללא מעורבתו של המחשב המרכזי, עול התקשורת עבר אליהם.

לומר שנאפסטר הייתה הצלחה יהיה אנדר-סטייטמנט. אני מרשה לעצמי לשער שמי מהמאזינים שלנו שהיה בן עשרים פלוס בתחילת שנות האלפיים כנראה הכיר את נאפסטר…איך נאמר זאת…היכרות אינטימית. התכנה הפשוטה והלא מתוחכמת שנוצרה על ידי נער בן 18 במרתון של פיצות וקולה, נתקבלה בהתלהבות אדירה. מספר המשתמשים שבה הכפיל את עצמו מדי כמה שבועות, ובשיאה – בפברואר 2001 – היו לנאפסטר כשמונים מיליון משתמשים פעילים מדי חודש. לשם השוואה, לאתר האינטרנט Yahoo!, שנחשב אז לאתר החשוב והגדול ביותר באינטרנט – היו רק חמישים וארבעה מיליון משתמשים. נאפסטר הצליחה במיוחד בקרב תלמידי הקולג'ים בארה"ב – עד כדי כך, שתעבורת שיתוף הקבצים איימה להכריע את רשתות המחשבים של האוניברסיטות והיו מוסדות שנאלצו לחסום את השימוש בה כדי שלא לפגוע בעבודה האקדמית.

מה היו הגורמים שהפכו את נאפסטר להצלחה מטאורית כל כך, ביחס לתכנות ולאתרי שיתוף הקבצים שקדמו לה? גורם ראשון הוא ההתמקדות בקבצי mp3: נאפסטר אפשרה אך ורק החלפה של קבצי מוזיקה בפורמט mp3 ולא, למשל, קבצי סרטים, תוכנות או משחקים. קבצי mp3 הם קטנים יחסית והעברתם אינה דורשת חיבור רחב פס לאינטרנט, למרות שהם שומרים על איכות אודיופונית גבוהה של המוזיקה האצורה בתוכם. גורם נוסף הוא כמה ברירות מחדל חכמות שהכניסו פרקר ופאנינג בתוכנה שלהם: למשל, משתמש שרוצה להוריד קובץ חייב לאפשר למשתמשים אחרים להוריד ממנו קבצים – דהיינו, אי אפשר להיות 'עלוקה' שרק לוקחת ואינו מחזירה בחזרה.

הגורם השלישי, ואולי המשמעותי יותר, הוא הקלות שבה ניתן היה למצוא ולגלות שירים ברשת. אם בעבר המשתמש נאלץ לכתת את מקלדתו בין כמה וכמה קבוצות דיון ואתרי אינטרנט עד שמצא את השיר שחיפש – כעת ניתן היה בלחיצת כפתור לסרוק מחשבים של עשרות מיליוני משתמשים ולאתר בהם שירים שבאופן מסורתי היה קשה מאוד למצוא, כגון תקליטים ישנים, גרסאות בוטלג של הופעות נדירות וכדומה. גילוי מוזיקה חדשה הפך להיות קל כמו חימום אוכל במיקרוגל: פתח את התכנה, לחץ על כפתור והאזן. זה הכול: כבר לא צריך ללכת לחנות ולקנות תקליטור.
האיום המשפטי

ההצלחה האדירה הזו לא נעלמה מעיני חברות התקליטים, ולא קשה להבין מדוע ראו בנאפסטר איום ברור ומהותי לקיומן. תופעת שיתוף הקבצים דרך האינטרנט הטרידה אותן עוד קודם לכן, אך כעת היה מדובר על שיתוף קבצים בקנה מידה תעשייתי – וכמעט כל השירים שהחליפו ביניהם משתמשיה של נאפסטר היו יצירות מוגנות בזכויות יוצרים, בבעלותן של חברות התקליטים. בדצמבר 1999, רק שישה חודשים לאחר הקמת נאפסטר, תבעו אותה כמעט כל חברות התקליטים הגדולות: קבוצת יוניברסל, סוני, EMI ועוד. קשה לומר שתביעה זו לא הייתה צפויה מראש שהרי פאנינג ופרקר בנו את התוכנה שלהם בידיעה שחברות התקליטים ינסו להכות בהם בבית המשפט. הייתה זו דווקא התביעה השנייה שהוגשה נגדם שהייתה מפתיעה יותר.

בתחילת שנת אלפיים הקליטה להקת מטאליקה – אחת מלהקות הרוק הכבד הוותיקות והמפורסמות בעולם – שיר חדש עבור סרט בסדרה 'משימה בלתי אפשרית'. שמו של השיר היה I Disappear. באחד הימים שמע לארס אולריך, המתופף של מטאליקה, את השיר מתנגן באחת מתחנות הרדיו המקומיות בארה"ב. אולריך נדהם: השיר עדיין לא יצא לאור ולא הופץ באופן רשמי. כיצד השיגה אותו תחנת הרדיו? הוא בירר את העניין לעומק, וגילה שיד נעלמה הפיצה את I Disappear בנאפסטר. ולא רק אותו: כל תקליטיה של מטאליקה היו זמינים להורדה חופשית ברשת שיתוף הקבצים. אולריך המזועזע שיתף את שאר חברי הלהקה בתגליתו, וזעמם של המוזיקאים בער בהם. לא רק שנמנעה הזכות לבחור מתי ואיך תשוחרר יצירה כלשהי לאוויר העולם – אלא שברור כי הם לא ירוויחו ולו סנט על האלבומים שמועתקים באופן כה חופשי. ואם יש משהו אחד שאפשר לומר על להקות רוק כבד, זה שהן אינן נוטות לשמור תחושות זעם וכעס בבטן לאורך זמן.

באפריל 2000 החליטה להקת מטאליקה, בצעד מפתיע ולא אופייני כלל בעולם המוזיקה, לתבוע מנאפסטר עשרה מיליוני דולרים על אחריותה להפרת זכויות היוצרים על ידי משתמשי התוכנה. נאפסטר כבר הייתה, כאמור, בהליכים משפטיים מול חברות התקליטים – אבל זה היה צפוי וידוע מראש. העובדה שדווקא מטאליקה, שייצגה זרם חתרני ואנטי-ממסדי בעולם המוסיקה, בחרה לצדד בחברות התקליטים נגד מעריציה שלה שהחליפו ביניהם אלבומים – זה כבר היה מקרה קלאסי של 'אדם נשך כלב', או נכון יותר לומר במקרה הזה – 'גיטרה שוברת נגן'. לארס אולריך העיד בפני ועדה מיוחדת של הסנאט האמריקני שעסקה בעניין, ומטאליקה אף הגישה לנאפסטר מסמך בן שישים אלף עמודים – מודפס – ובו כתובות ה-IP של שלוש מאות אלף משתמשים בתוכנה שהפיצו שירים של הלהקה. נאפסטר הסכימה לחסום את חשבונותיהם של אותם שלוש מאות אלף משתמשים, והצלחה זו דירבנה אמן מפורסם נוסף, הראפר דוק' דרה – אין להתבלבל עם הדוק' אבשלום קור – להגיש תביעה דומה נגד נאפסטר. גם מדונה לא אהבה לגלות, בלשון המעטה, סינגל חדש שלה מופץ ברשת. הפרשה המרתקת זכתה לאינספור כותרות בכל העולם, והתקשורת עקבה אחרי האירועים בנשימה עצורה.

מטאליקה, מדונה ודוק' דרה זעמו על נאפסטר, אבל אמנים רבים אחרים דווקא הביעו תמיכה בחברה הצעירה. דייב גרוהל, המתופף של להקת נירוואנה, אמר בראיון טלוויזיוני:

"אני חושב שמוזיקה צריכה להיות זמינה לכל מי שרוצה להאזין לה. לא צריך להיות תג מחיר על מוזיקה. אולי צריך לשים תג מחיר על האריזה – אתה משלם שלושים דולר ומקבל את הספרון של התקליטור, את התמונות, את הסטיקרים – אבל אני לא רוצה לפתוח את הרדיו ולהכניס כסף כדי לשמוע את מטאליקה. […] אני יכול להבין מדוע יש אנשים שאומרים – 'נאפסטר גוזלת ממני כסף.' […] אבל אתה יודע מה? כשזה מישהו שמכר חמישים מיליון אלבומים ויש לו חמישים מיליון דולרים מזו*** והוא מקטר על אגורות…לך תזד***, בן אדם."

ברוב המקרים החלוקה הייתה ברורה: אמנים ותיקים ומצליחים התנגדו לשיתוף קבצים, בעוד אמנים צעירים ולא מוכרים – או במילים אחרות, אלה שאין להם מה להפסיד – תמכו בשיתוף. דייב גרוהל, שמגיע מרקע דומה לזה של מטאליקה – דהיינו, אמן מצליח ועשיר – הוא במקרה הזה היוצא מן הכלל שמעיד על הכלל. האמנים הצעירים ראו בנפאסטר כלי פנטסטי לקידום המוזיקה שלהם. לדוגמה, אלבום חדש של להקת Radiohead דלף לרשת שלושה חודשים לפני יציאתו הרשמית לאור. רדיוהד הייתה אז להקה מוכרת, אבל לא ממש מצליחה: אפילו שיר אחד שלה לא זכה להתברג בעשרים המקומות הראשונים במצעדי הפזמונים, וגם אלבומיה לא היו רבי-מכר. גם לאלבום החדש, Kid A, לא היה צפוי עתיד מזהיר: זה היה אלבום אקפרימנטלי מאוד, ואיש לא האמין שימכור עותקים רבים. אך כשמצא האלבום החדש את דרכו לנאפסטר – הוא הפך ללהיט בקרב משתפי הקבצים. כשבסוף יצא האלבום לחנויות, שלושה חודשים מאוחר יותר, הוא "תפס" מייד – כבר בשבוע הראשון – את המקום הראשון במצעד המכירות, וזאת מבלי שהושמע כלל בתחנות הרדיו. גם אמנים אחרים, למשל הלהקות Limp Bizkei ו-Offspring השתמשו בנפאסטר כדי לקדם סיבובי הופעות שלהן.

למרות הדברים הקשים שהטיחו חלק מהאמנים בנאפסטר, ולמרות התביעות כנגדה בבית המשפט – תהיה זו טעות לחשוב שחברות התקליטים לא הבינו את הפוטנציאל החיובי שטמון בטכנולוגיה החדשה. ריצ'ארד מנטה (Menta), עיתונאי מוזיקה ותיק כתב באחד מטוריו את הדברים הבאים:

"חברות המוזיקה הגדולות אינן טפשות. רבים מהמנהלים רואים בברור את היתרונות של נאפסטר לגבי קידום אמנים. לכל הפחות, העלייה במכירות התקליטורים הדגימה בפניהם שנאפסטר אינה פוגעת בהם. אבל מה שהם אינם אוהבים היא העובדה שישנה ישות בעלת עצמה כה אדירה – שאין להם שליטה עליה. ישות שכזו, הם חוששים, תוכל בסופו של דבר לערער את המונופול שיש לחברות האלה, ואת הרווחים הנובעים ממנו."

עדות מעניינת לכך שלפחות חלק מחברות התקליטים דווקא הבינו לאן נושבת הרוח היא הניסיון של קונגלומרט המדיה הגרמני Bertelsmann AG לרכוש את נאפסטר – עוד בטרם הסתיים המשפט. ענקית המדיה הגרמנית, אחת התובעות במשפט כנגד נאפסטר, הפתיעה את כולם כשהודיעה באוקטובר 2000 שהיא נמצאת במגעים לרכישת החברה. בנאפסר, אגב, לא הופתעו: מנכ"ל נאפסטר – לחברה הקטנה כבר היו כארבעים עובדים בשלב זה – היה בכיר לשעבר ב Bertelsmann AG והוא זה ש'תפר' את העסקה. על פי תחקיר עיתונאי אחר, נאפסטר ניהלה מגעים עם חברות תקליטים אחרות, אך שיחות אלה נכשלו בגלל חילוקי דיעות על סכום הרכישה.
התבוסה המשפטית

בד בבד נמשכו ההליכים המשפטיים בתביעות כנגד נאפסטר, וביולי 2000 נחתה על החברה מכה קשה. השופט שדן בתביעת חברות התקליטים בערכאה הנמוכה הורה לנאפסטר להסיר את כל השירים המוגנים בזכויות יוצרים מהרשת שלה בתוך 72 שעות – אחרת יורה על סגירת החברה. נאפסטר טענה שאין לה אפשרות טכנית לעמוד בצו שהוציא השופט, והגישה ערעור דחוף לבית המשפט העליון. כחצי שנה לאחר מכן, בפברואר 2001, נדחה הערעור – ונאפסטר מצאה את עצמה מול שוקת שבורה: או שתמצא דרך לסנן שירים המוגנים בזכויות יוצרים ולמנוע מהמשתמשים לשתף אותם ברשת שלה – או שתיסגר.

מדוע נדחתה ערעורה של נאפסטר? הרי על פי הגנת בטאמקס, זכותו של ממציא לפתח טכנולוגיה חדשה גוברת על זכותו של בעל זכויות היוצרים להגנה. אך בית המשפט מצא הבדל מהותי בין הסיטואציה שבה הייתה נתונה סוני, ממציאת קלטת הבטאמקס, ונאפסטר. הטכנולוגיה של סוני אמנם אפשרה להפר זכויות יוצרים – אבל לסוני לא הייתה כל שליטה על כך: מהרגע שעזבה קלטת בטאמקס את החנות, לסוני לא הייתה כל דרך לדעת מי מלקוחותיה מפר זכויות יוצרים ומי לא. נאפסטר, לעומת זאת, יודעת היטב! השרת שלה אמנם אינו מאחסן את קבצי השירים, אבל הוא מחזיק ברשותו את רשימות כל הקבצים שבידי המשתמשים. נאפסטר יכולה, לפחות באופן תיאורטי, לסנן מתוך הרשימות הללו שירים המוגנים בזכויות יוצרים ולמנוע מהמשתמשים לשתף אותם זה עם זה. כיוון שכך, קבע בית המשפט, נאפסטר אינה זכאית לאותה הגנה שלה זכתה סוני עשרים שנה קודם לכן. לנאפסטר לא נותרה כל ברירה: ביולי 2001 הורידה החברה את השאלטר והפסיקה כל הפעילות ברשת שיתוף הקבצים שלה כדי לעמוד בהחלטת בית המשפט.

קברניטיה של נאפסטר חיפשו פתרון שיאפשר לחברה להמשיך ולשרוד. היה להם ברור שחסימת שיתוף קבצים המוגנים בזכויות יוצרים תגרום למשתמשים לנטוש את רשת החברה בהמוניהם, ותשמוט את הקרקע למודל העסקי של החברה. הפיתרון האפשרי היחיד היה לנסות ולהשיק שירות בתשלום, שיאפשר למשתמשים גישה למוזיקה באופן חוקי. לשם כך, פיתחו מהנדסי נאפסטר כך גרסא חדשה של התוכנה, נאפסטר נקודה 3. אך פעם נוספת דווקא בעיות לא טכנולוגיות חסמו את דרכה: נאפסטר לא הצליחה לסגור עסקות מול חברות התקליטים על רכישת הזכויות לשירים.

הכדור האחרון במחסנית של נפאסטר היה המיזוג עם Bertlesmann AG, עסקה שתזרים כסף לקופת החברה מחד ותאפשר לה למכור שירים באופן חוקי מאידך. במאי 2002 הודיעה נאפסטר כי הגיעה להסכם עם ענקית המדיה הגרמנית על רכישתה בסכום של שמונים וחמישה מיליוני דולרים – אך מספר חברות תקליטים הגישו עתירה לבית המשפט גם לגבי עסקה זו. שלושה חודשים לאחר מכן ביטל בית המשפט בארה"ב את העסקה, בטענה כי העובדה שמנכ"ל נאפסטר היה בכיר ב Bertlesmann מהווה ניגוד אינטרסים חמור.

ביטול העסקה עם Bertlesmann היה סוף הסיפור. נאפסטר מעולם לא הייתה חברה רווחית, ושום מקור הכנסה חדש לא נראה באופק. ימים ספורים לאחר החלטת השופט פוטרו כל ארבעים ושניים עובדי החברה, ובאתר הבית שלה הוחלף הלוגו המפורסם של החתול חובש האזוניות בציור של קבר טרי, ונכתב – Napster Was Here. נכסי החברה כולל הלוגו שלה נמכרו לחברה אחרת, וכיום היא עדיין קיימת באינטרנט בגלגול מסחרי כזה או אחר – אבל רחוק מאוד מדמותה המקורית. נאפסטר האמיתית מתה.

שלושת מייסדי נאפסטר המשיכו כל אחד לדרכו. ג'ון פאנינג, הדוד, חזר להשקיע את מרצו במשחקי שחמט ממוחשבים. שון פאנינג המשיך להיות יזם והקים מספר חברות סטארט-אפ נוספות: הונו האישי מוערך בכמה מיליוני דולרים. שון פרקר מספר שהשנים הראשונות לאחר עידן נאפסטר היו קשות לו במיוחד: הוא היה בחובות אישיים כבדים, וישן על ספות של חברים. הוא חשש שאם אי פעם ירוויח כסף – חברות התקליטים ינסו לתבוע אותו שוב. כיוון שכך הקפיד להסתיר את פרטי חייו האישיים מהתקשורת. בסופו של דבר, עם זאת, שיחק לו המזל: פארקר היה אחד מהמשקיעים הראשונים בחברה קטנה ובלתי מוכרת בשם "פייסבוק". כיום מוערך הונו האישי של שון פרקר בלמעלה ממיליארד דולר.

לסיפורה של נאפסטר היה סוף עגום – אך זהו אינו סופו של הסיפור כולו. ההפך הוא הנכון: התבוסה שנחלה נאפסטר הייתה הזרז לדור חדש ומתוחכם יותר של רשתות שיתוף קבצים שקמו על חורבותיה: תוכנות כגון Kazza, Gnutella, eDonkey, eMule. גם טכנולוגיית שיתוף הקבצים עברה מהפכה דרמטית – מהפכה שנועדה ברובה להגן מפני תביעות משפטיות דומות לאלו שהכניעו את נאפסטר, ואיפשרה למשתפי הקבצים להעביר ביניהם לא רק קבצי מוזיקה, אלא גם סרטים ותוכנות פרוצות. חברות התקליטים לא ישבו בחיבוק ידיים, ופרט למערכה המשפטית פתחו גם בקרב טכנולוגי שבמרכזו הניסיון 'להרעיל' את רשתות שיתוף הקבצים בקבצים מזוייפים. ואז…ואז הגיעה ביטטורנט, וטרפה את כל הקלפים.
חלק ב' – קאזה, גרוקסטר וביטטורנט

בפרק הקודם סיפרתי לכם על לידתה של טכנולוגיית שיתוף קבצים בין עמיתים – או Peer To Peer, כפי שהיא מכונה בעגה מקצועית. שון פאנינג ושון פרקר היו שני היזמים הצעירים שייסדו את חברת נפסטר, והראשונים שאיפשרו לעשרות מיליוני משתמשים ברשת האינטרנט לשתף קבצי מוזיקה בצורה נוחה ומיידית. נאפסטר הייתה הצלחה אדירה – אך להצלחה היה מחיר. בפחות משנתיים נכנעה החברה הצעירה לשורת התקפות משפטיות בעניין הפרת זכויות יוצרים מצד חברות התקליטים ואמנים כגון להקת מטאליקה – וכתוצאה נאלצה לסגור את שעריה.

היעלמות נאפסטר יצרה ואקום בעולם שיתוף הקבצים, ובפרפרזה על אחד מקביעותיו המפורסמות של אריסטו – האינטרנט אינו סובל ואקום. עשרות מפתחים צעירים שההצלחה המטאורית של נפסטר דרבנה אותם, עמלו על פיתוחים טכנולוגיים במטרה למלא את החלל שהשאירה נפסטר אחריה.
Gnutella

שניים מאותם המפתחים היו ג'סטין פרנקל (Frankel) ותום פפר (Pepper), שני מתכנתים שכמו שון פארקר ושון פנינג של נפאסטר, בקושי הספיקו להחליף קידומת ל'עשרים ו-' לפני שהצליחו לעשות היסטוריה ברשת. במקרה שלהם, מדובר היה בנגן מדיה מצליח מאד בשם Winamp שצבר מיליוני משתמשים ונחשב לאחת התכנות המצליחות ברשת האינטרנט הצעירה. הצלחתה של Winamp העניקה לפרנקל ופפר מעמד של סלבריטי בעולם המפתחים, ואפשרה להם לייסד חברה בשם NullSoft שנרכשה חיש מהר על ידי AOL, תאגיד מדיה אמריקני ענק.

שני המפתחים חזו בהצלחתה המטאורית של נאפסטר ובביקוש העצום של המשתמשים לטכנולוגיה שתאפשר להם לשתף קבצים זה עם זה – ובשלהי 1999 החליטו לפתח גם הם תכנת שיתוף קבצים חדשה. את התכנה החדשה תכננו להפיץ ברשת כ'קוד פתוח' – דהיינו, ללא תשלום -והשם שנתנו לה היה 'נוטלה' (Gnutella), עם האות G בהתחלה, שם הוא משחק מילים על שמו ממרח השוקולד המפורסם ו- GNU, שמה של תנועת הקוד החופשי.

אך פרנקל ופפר עשו טעות משמעותית אחת. הם היו מתכנתים מוכשרים, ללא ספק, אבל אולי מפאת גילם הצעיר וחוסר ניסיונם בהתנהלות בתוך ארגונים בירוקרטיים גדולים – או אולי מתוך יצר מרדנות טבעי – הם החליטו שלא לשתף את המנהלים החדשים שלהם בחברת-האם AOL, בדבר הפרויקט החדש. למעשה, הפעם הראשונה שהבוסים ב-AOL שמעו על נוטלה הייתה בארבע עשרה במרץ, שנת 2000, כשהגרסה הראשונה של תכנת שיתוף הקבצים עלתה לאוויר באתר האינטרנט של NullSoft.

כדי להבין מה עבר במוחם של המנהלים ב-AOL, יש לזכור כי ממש באותו הזמן התנהלו שורה של משפטים מתוקשרים מאד כנגד נאפסטר, עליהם סיפרנו בפרק הקודם. כמעט כל חברות התקליטים הגדולות תבעו את נאפסטר על הפרות זכויות היוצרים בידי המשתמשים שלה, שהעתיקו ביניהם מיליוני שירים בכל יום. גם להקת מטאליקה והראפר דוק' דרה הצטרפו לחגיגה, והגישו תביעות משלהם כנגד החברה. הדיווחים אודות המשפטים מילאו את דפי העיתונים יום אחרי יום. קל להבין מדוע הדבר האחרון שרצתה AOL הוא להכניס את הראש התאגידי הבריא שלה למיטה המאד מאד חולה של שיתוף הקבצים, שאיש עדיין לא יכל לומר בודאות מהם החוקים החלים עליו. בנוסף, ל-AOL היו המון עסקים עם חברות התקליטים, ואין הגיון בהחלטה לערער את קשריה עימן לטובת הפצה של תוכנת קוד פתוח שבלאו הכי לא תכניס לה כסף. שעות ספורות לאחר שעלתה נוטלה לאוויר, כבר צלצל הטלפון במשרדם של ג'סטין פרנקל ותום פפר. ההנחיה הייתה חד-משמעית: תורידו את נוטלה מהאתר, ועכשיו.

אבל AOL איחרה את הרכבת. למרות שנוטלה הוסרה מאתרה של Nullsoft בתוך פחות מיממה – כמה אלפי גולשים כבר הספיקו להוריד את התכנה. בתוך חודשים ספורים היו מי שפרצו אותה ו'הינדסו אותה לאחור' כדי להבין כיצד היא פועלת. שיבוטי התכנה המקורית נפוצו ברחבי האינטרנט, ורשת שיתוף הקבצים של נוטלה הלכה וצברה משתמשים חדשים. השמועות על התוכנה הגיעו לאוזניהם של העיתונאים, שהחלו צובאים על דלתותיה של NullSoft. אך פרנקל ופפר קיבלו מתאגיד-האם שלהם הוראה חד משמעית שלא להתראיין לכלי התקשורת ושלא לדבר על פרשת נוטלה עם אף אחד. האיסור היה כה חריף וגורף, עד שבעמק הסיליקון נפוצו שמועות ש-AOL מחזיקה את פרנקל בסוג של 'מעצר בית' כפוי כדי למנוע ממנו להתראיין. זה לא היה נכון: עובדים ב-NullSoft העידו שראו את ג'סטין פרנקל ממשיך להגיע לעבודה כרגיל, כבכל יום, אך השמועות וצו ההשתקה הגורף של AOL מדגימות בפנינו היטב עד כמה היה שיתוף הקבצים בראשית שנות האלפיים נושא רגיש ומורכב: אינטראקציה נפיצה מאד בין טכנולוגיה מתקדמת, קרקע משפטית תובענית ובלתי ברורה וכסף – המון, המון כסף.
FastTrack

הפיתוי הכספי הוא זה שמשך שני יזמים נוספים: ניקולאס זנסטרום (Zennstrom) השוודי ויאנוס פריס (Friis) הדני, חזו אף הם בהצלחתה של נפסטר והאמינו בפוטנציאל המסחרי של רשתות שיתוף קבצים; מכיוון שלא היו מפתחים בעצמם, הם שכרו את שירותיה של חברת תכנה אסטונית בשם BlueMoon, שפיתחה עבורם פרוטוקול שיתוף קבצים חדש בשם FastTrack ותכנה בשם Kazaa. זנסטרום ופריס תכננו למכור את הטכנולוגיה לגופי תקשורת אירופים כדרך נוחה ומהירה להעביר קבצים בין אירופה וארה"ב. כדי לבחון את ביצועי הרשת החדשה וללמוד אילו שימושים פוטנציאליים יש לה, שחררו זנטסרום ופריס את Kazaa לקהל הרחב – ובחינם.

ניקלאס זנסטרום

Kazaa יצאה לאור במרץ 2001. ארבעה חודשים לאחר מכן, ביולי 2001, נסגרה נאפסטר – ועשרות מיליוני הגולשים המתוסכלים מצאו ב-Kazaa את האלטרנטיבה שחיפשו. אם ביוני 2001, זמן קצר לפני סגירת נפסטר, היו לקאזה 225 אלף משתמשים פעילים בכל רגע נתון – שלושה חודשים לאחר מכן כבר היו לה מיליון ושלוש מאות אלף משתמשים פעילים: פי חמישה.

כאן המקום לומר כמה מילים על ההבחנה בין 'פרוטוקול' ו'תכנה', שעשויה להיות מעט מבלבלת. לא הרחבתי עליה בפרק הקודם מכיוון שבנפאסטר, בה התמקדנו, לא היה הבדל מעשי בין השניים. במקרה של FastTrack ו-Kazaa, לעומת זאת, לאבחנה זו הייתה משמעות חשובה לענייננו.

אפשר להסביר את ההבדל בין פרוטוקול ותכנה באמצעות הדוגמה של קוד מורס. בקוד מורס, לכל אות ישנו רצף מוגדר של קווים ונקודות. האות A היא "נקודה קו", האות B היא "קו נקודה נקודה נקודה" וכולי. הגדרת הרצפים היא ה'פרוטוקול', שהוא ההסכם הרשמי שכל מי שמשתמש בקוד מורס מקבל אותו. אסור לי להמציא רצפים חדשים של קווים ונקודות, שהרי אז משתמשים אחרים בקוד מורס לא יצליחו להבין אותי. אבל את האותות עצמם, לעומת זאת – את הקווים והנקודות – אפשר לשדר באינספור צורות שונות. אני יכול לבנות פנס שמשדר קוד מורס על ידי הבהובי אור, או טלגרף שמעביר אותן כפולסים של זרם חשמלי, או אפילו ענני עשן גדולים וקטנים מעל המדורה….במילים אחרות, ניתן ליישם את הפרוטוקול באינספור דרכים שונות. FastTrack הייתה הפרוטוקול שמגדיר את ה'שפה' בה ישוחחו שני מחשבים המעוניינים להעביר ביניהם קבצים, ו-Kazza הייתה התכנה שמיישמת את השפה המוגדרת הזו בפועל, באותו האופן שבו טלגרף מיישם את קוד מורס.

ובאותו האופן שבו ניתן להחליף, עקרונית, את הטלגרף בפנס מהבהב או מדורה מעשנת – ניתן היה להחליף את Kazza בתוכנות אחרות שמיישמות את פרוטוקול FastTrack, כל אחת בדרכה היא, וזה מה שקרה בפועל. פרט ל-Kazza הופיעו עשרות תוכנות שיתוף קבצים נוספות כגון 'מורפיאוס', iMesh, KLite, BearShare, Limewire, eDonkey ועוד ועוד, אשר כולן היו מבוססות על אותו הפרוטוקול – FastTrack. עושר התוכנות, שאיפשר לכל משתמש למצוא את התכנה המתאימה והנוחה לו, היווה יתרון בולט של FastTrack על פני נאפסטר – והיה לה יתרון משמעותי נוסף על הדור הקודם של טכנולוגיית שיתוף הקבצים: FastTrack הייתה מסוגלת להעביר לא רק קבצי mp3 למוזיקה – אלא את כל סוגי הקבצים, כולל סרטים ותוכנות.
חברות המדיה נגד גרוקסטר

לכולם היה ברור שעם ההצלחה יבוא התאבון, והייתה זו רק שאלה של זמן עד שחברות התקליטים יגררו גם Fasttrack לבית המשפט וינסו להפיל את הטכנולוגיה הזו כפי שמוטטו את הקודמת, נפאסטר. ואכן, זה בדיוק מה שהתרחש: ב-2005 הגישו עשרים ושמונה חברות תקליטים תביעה כנגד מפיציה של תכנה בשם 'גרוקסטר' (Grokster), שהייתה אחת מאותן עשרות תכנות שנשענו ויישמו את פרוטוקול FastTrack. גרוקסטר הייתה, כאמור, רק אחת מני תכנות רבות – אבל התביעה נגדה הייתה חשובה ומעניינת מכיוון שהעמידה למבחן משפטי את שאלת חוקיותו של פרוטוקול FastTrack כולו. אם יצליחו חברות התקליטים להוכיח כי גרוקסטר אחראית להפרות זכויות היוצרים שמבצעים משתמשיה – גורלה יהיה זהה לזה של נאפסטר, ארבע שנים קודם לכן. ואם גרוקסטר תיפול, הדבר ייצור תקדים משפטי שיאפשר לחברות התקליטים לרדוף בהצלחה אחר שאר מפיצי התכנות ברשת FastTrack. השאלה המתבקשת היא: כיצד קיוו זנסטרום ופריס לחמוק מאותו גורל אכזר שפקד את נאפסטר? התשובה לשאלה זו היא דוגמא מאלפת לאופן שבו שיקולים משפטיים משפיעים על התפתחות הטכנולוגיה לא פחות מאשר שיקולים הנדסיים.

הבה נזכר בפרוטוקול של נאפסטר. בפרוטוקול של נאפסטר ישנם שני בעלי תפקידים: המשתמשים, שהם המחשבים האישיים של האנשים בבית והמחשב המרכזי, שהיה בבעלותה של נאפסטר. המחשב המרכזי מחזיק ברשותו רשימה של כל השירים שנמצאים אצל המשתמשים השונים. משתמש א' שמעוניין בשיר מסויים שולח אל המחשב המרכזי שאילתה עם שם השיר ואם המחשב המרכזי מאתר את השיר המבוקש ברשימת השירים שלו. הוא שולח למשתמש א' את פרטיו של משתמש ב', שמחזיק את השיר ברשותו. כעת פונה משתמש א' ישירות אל משתמש ב', והשניים מעבירים ביניהם את הקובץ.

אך העובדה שהמחשב המרכזי החזיק ברשותו את רשימות השירים ותיווך בין המשתמשים השונים הייתה בעוכריה של נאפסטר, שכן בית המשפט פסק שיש ברשותה את היכולת התיאורטית והמעשית למנוע הפרת זכויות יוצרים של המשתמשים. זנסטרום ופריס, כמו כל מי שעקב אחר התביעות כנגד נפאסטר, זיהו את החולשה המשפטית הזו וביקשו להמנע ממנה. זו הסיבה שבפרוטוקול FastTrack אין מחשב שרת מרכזי כלל: אם מפעיליה של גרוקסטר, Kazaa וכל שאר תוכנות שיתוף הקבצים המבוססות על פרוטוקול FastTrack לא מחזיקים ברשותם את רשימת כל הקבצים ברשת, אי אפשר להאשים אותם – לפחות על הנייר – באחריות להפרות זכויות היוצרים של המשתמשים.

אך כאן צצה בעיה חדשה: אם אף גורם ברשת שיתוף הקבצים אינו מחזיק ברשותו את רשימת הקבצים המלאה, איך יוכלו החברים ברשת לדעת אלו קבצים קיימים אצל חברי הרשת האחרים? בנפסטר, היה זה תפקידו של המחשב המרכזי. כמו מתווך דירות שמחבר בין קונים ומוכרים, השרת המרכזי של נפסטר חיבר בין מי שחיפש קובץ מסוים לבין מי שהקובץ היה בידו. אך בהיעדר שרת שכזה, כיצד יכולים כעת הקונים והמוכרים – דהיינו, מחפשי הקבצים ובעליהם – למצוא זה את זה?

הפתרון של FastTrack היה להחליף את המחשב המרכזי ברשת של אלפי מחשבי-ביניים המכונים Supernodes, או 'צמתי על'. איך זה עובד? ובכן, בפרוטוקול של נפאסטר היו שני בעלי תפקידים: המשתמש הרגיל, והמחשב הראשי. גם ב-FastTrack יש שני תפקידים: משתמשים רגילים ומשתמשים שעברו 'שדרוג' והפכו להיות Supernodes. ה-Supernodes זכו למעמד המיוחס שלהם מכיוון שהם בעלי חיבור מהיר יחסית לאינטרנט. דמיינו לעצמכם קהל באצטדיון כדורגל, שבו חלק מהצופים שהם במקרה גבוהים וחסונים יותר מכל השאר קיבלו וסטים צהובים וכובעים ועכשיו הם גם צופים – וגם סדרנים. ה-Supernodes הם הסדרנים. גם הם משתפים ביניהם קבצים כמו כל המשתמשים הרגילים, ובנוסף הם גם מקבלים עצמם את משימת התיווך בין שאר המשתמשים.

למשל. נניח שמשתמש א', שהוא משתמש רגיל, מחפש קובץ מסוים. הוא פונה ל-Supernodes הקרוב אליו ביותר ברשת ושולח אליו שאילתה ובה שם השיר. ה-Supernode מחזיק ברשותו את רשימת קבצים – אבל רק את הקבצים שנמצאים ברשותם של המשתמשים שנמצאים בסביבה הקרובה אליו. במילים אחרות, הוא יודע מה מתרחש ביציע שלו, אבל אין לו מושג מה קורה בצד השני של האצטדיון. הוא בודק את הרשימה שברשותו ומחפש שם את שם השיר, אבל אם הוא אינו מוצא את השיר ברשימה – הוא מפנה את השאילתה אל Supernode אחר. אולי הוא יודע איפה נמצא הקובץ? ה-Supernode השני בודק את הרשימה שלו, ואם הקובץ לא נמצא גם שם – הוא מעביר את השאילתה ל-Supernode הבא בתור, וכן הלאה וכן הלאה – כמו במשחק 'טלפון שבור'. בסופו של דבר יהיה Supernode שברשימה שלו יופיע הקובץ. ה-Supernode שמצא את הקובץ המבוקש לא מכיר כמובן את משתמש א', שנמצא בכלל בצידו השני של האיצטדיון. את התשובה שלו הוא מחזיר ל-Supernode שהעביר אליו את השאילתה: 'הקובץ המבוקש נמצא אצל משתמש ב', שכתובתו כך וכך'. ה-Supernode הזה מעביר את התשובה לזה ששאל אותו, שמעביר אותה למי ששאל אותו וכן הלאה וכן הלאה עד שהתשובה מוצאת את דרכה בחזרה ל-Supernode הראשון, שמחזיר אותה למשתמש א'. כעת, כשהוא יודע את הכתובת הרצויה, משתמש א' פונה ישירות למשתמש ב' והם מעבירים ביניהם את הקובץ.

זהו פתרון אלגנטי שמסיר את האחריות על הפרת זכויות היוצרים ממפתחיהן של Kazaa, גרוקסטר ושאר התוכנות מכיוון שאין להם שום שליטה על ה-Supernodes. ה-Supernodes ממלאים את תפקידם כסדרנים ברשת שיתוף הקבצים באופן עצמאי לחלוטין ומדברים רק אחד עם השני ועם שאר המשתמשים. אין מחשב מרכזי אחד שיודע מה קורה ברשת בכל רגע נתון: המשתמשים יכולים להעביר ביניהם עותק בלתי חוקי של I Disappear של מטאליקה, או עותק חוקי למהדרין של התנ"ך – ואף אחד לא יידע, באותו האופן שבו אדם בצד אחד של האצטדיון לא יודע מה בדיוק מתרחש בצדו השני.

זו גם הייתה טענתם של פרקליטיה של גרוקסטר, כנגד תביעתן של חברות התקליטים. מכיוון שב-FastTrack אין מחשב מרכזי אלא רק רשת אמורפית ועצמאית של Supernodes אף אחד – וגם לא עובדיה של חברת גרוקסטר – אינו יכול לדעת אלו קבצים מועברים ברשת שיתוף הקבצים בכל רגע נתון. חשבו על כביש מהיר שסללה מע"צ: האם יודעים מנהלי מע"צ אלו רכבים נוסעים בכביש בכל רגע? ברור שלא. האם יש למע"צ אחריות על התנהגות הנהגים בכביש – למשל, אם מישהו מהם נהג תחת השפעת אלכוהול? שוב, ברור שלא. עורכי דינה של גרוקסטר טענו שאותה האנלוגיה תקפה גם לגבי רשת שיתוף הקבצים: כיוון שהחברה אינה יודעת אלו קבצים עוברים ברשת ואין לה שליטה עליהם – היא אינה יכולה להיות אחראית להפרת זכויות יוצרים מצד משתמשיה. במילים אחרות, זו הגנת בטאמקס שהכרנו בפרק הקודם: גרוקסטר רק מספקת את הטכנולוגיה, אבל אין לה שליטה על מעשיה של המשתמשים. השופט שדן בתביעה בערכאה הראשונה הסכים לגישה ופסק לזכותה של גרוקסטר. חברות התקליטים ערערו – והפסידו גם בערעור הזה.

אבל אז עלה התיק לבית המשפט העליון לדיון אחרון ומכריע – ושם, למרבה ההפתעה, הפסידה גרוקסטר. בית המשפט העליון קבע כי לחברה דווקא יש אחריות על הפרות זכויות היוצרים מצד משתמשיה, כיוון שהרוויחה בעקיפין וביודעין מהפרות אלה, ואף עודדה אותן בפרסומיה השונים. שיתוף קבצים בלתי חוקיים הועיל לגרוקסטר: הוא דירבן משתמשים נוספים להצטרף לרשת שלה, וכך יכולה גרוקסטר להרוויח יותר כסף ממכירת פרסומות בתכנה שלה, למשל. רבים בתקשורת ביקרו את ההחלטה הזו וכינו אותה 'בעייתית', בעיקר כיוון שלגרוקסטר לא הייתה כל אפשרות מעשית למנוע שיתוף קבצים מוגנים בזכויות יוצרים, גם לו הייתה מבקשת להילחם בתופעה. אך פסיקה היא פסיקה וגם גרוקסטר הלכה בדרכה של נפסטר ונסגרה בשנת 2005.
מלחמה מלוכלכת

בניגוד למקרה של נאסטר, לסגירתה של גרוקסטר כמעט ולא הייתה כל השפעה על עולם שיתוף הקבצים כולו. ב-2001, כשנסגרה נפסטר, המשתמשים המתוסכלים נאלצו לחפש פתרונות אחרים וטכנולוגיות אחרות – אך ב-2005 גרוקסטר הייתה רק אחת מבין עשרות תכנות לשיתוף קבצים שפעלו באותו הזמן ובהצלחה גדולה, כך שמשתמשיה של גרוקסטר עברו לרשת אחרת בקלות ובמהירות. זה כמו ההבדל שבין לצוד פיל ולהשמיד נחיל נמלים: פיל הוא חיה גדולה, אבל ניתן להרוג אותו באמצעות כדורי רובה. הרבה יותר קשה להשמיד נחיל של נמלים קטנות שמפוזרות על פני שטח גדול… באותו האופן, את נאפסטר אפשר היה להרוג בכדור אחד, תביעה משפטית אחת – אבל להרוג את FastTrack על שלל התוכנות שלו יהיה הרבה יותר קשה. אצל רבים בתעשיית המוזיקה שררה התחושה שתביעות מסוג זה הופכות יותר ויותר להיות לא רלוונטיות. למרות ניסיונתיהן של חברות התקליטים לחסום את תכנות שיתוף הקבצים בבית המשפט, מספר משתפי הקבצים הלך וגדל בכל שנה. בצר להן, החליטו חלק מחברות התקליטים להוריד את הכפפות – ולאמץ אסטרגיית לחימה מלוכלכת הרבה יותר, אסטרטגיה שניצלה חולשת אבטחה קריטית ב – FastTrack.

דמיינו לעצמכם שאתם קונים מוצר כלשהו בחנות, חוזרים הביתה, פותחים את האריזה ו… המוצר אינו בפנים. במקום הטוסטר או הטלוויזיה שרכשתם יש בתוך האריזה משקולת סתמית. סביר להניח שהייתם מתעצבנים, וכנראה לא הייתם קונים שוב באותה החנות. חברות התקליטים ביקשו לעשות אותו הדבר למשתמשיה של FastTrack.

בשנת 2002 שכרו חברות התקליטים את שירותיה של חברה בשם OverPeer, שפיתחה טכנולוגיה שאיפשרה לה לזייף קבצים ברשתות שיתוף הקבצים. לדוגמה, משתמש הוריד סרט בשם 'משימה בלתי אפשרית' – וכשפתח אותו גילה שמדובר למעשה בעותק של 'שלגיה ושבעת הגמדים', או גרסא של הסרט שבה…איך נאמר זאת בעדינות…שלגיה לא כזו תמימה והגמדים לא ממש קטנים. קבצי שירים נתגלו כאוסף של רעשים סטטיים, או קטעי מוזיקה שחוזרים על עצמם בלופ כל שלושים שניות. היקף הזיופים של OverPeer וחברות דומות אחרות שפעלו בשליחות חברות התקליטים היה אדיר. על פי דיווחים עיתונאיים, OverPeer הציפה את רשתות שיתוף הקבצים במאות מיליוני קבצים מזויפים שכאלה, עד שבשלב מסויים כמחצית (!) מכל הקבצים ב-FastTrack היו מזויפים. אם נזכור שגם ללא קשר למאמציהן של חברות התקליטים, חלק לא מבוטל מהקבצים ברשתות הכילו וירוסים ומרעין בישין דומים – קל לדמיין שחווית שיתוף קבצים ב-FastTrack לא הייתה נעימה או נוחה במיוחד למשתמשים.

האם צלח 'נסיון החיסול' מצד חברות התקליטים? אתם תשפטו. ב-2002, כשהוקמה OverPeer, היו כשלושה מיליון משתמשים פעילים ב-FastTrack. ב-2005, שלוש לאחר מכן, כבר היו כעשרה מיליון משתמשים. אין פלא, אם כן, שב-2005 החליטו חברות התקליטים לנטוש גם את דרך הפעולה הזו, ו-OverPeer סגרה את שעריה.

ובכל הזמן הזה, מאז סגירתה של נפסטר ב-2001, עולם המדיה והטכנולוגיה הלך ושינה את פניו. בכל שנה הצטרפו מיליוני גולשים חדשים לאינטרנט, מהירות הגלישה הממוצעת הלכה והשתפרה ונפחי האחסון של דיסקים קשיחים גדלו בסדרי גודל. שיפורים טכנולוגיים אלה הפכו את תהליך העברת קבצים גדולים דרך האינטרנט למהירה ויעילה יותר – ואת מאבקן של חברות התקליטים ברשתות שיתוף הקבצים לאבוד יותר… עולם טכנולוגי חדש זה היה הרקע לעלייתה לזירה של טכנולוגיה שהזניקה את שיתוף הקבצים לגבהים חדשים: ביטטורנט (BitTorrent).
ביטטורנט

ממציאה של ביטטורנט היה מתכנת צעיר בשם ברם כהן, שב-2001 עבד בחברה בשם Mojo Nation.

Mojo Nation עסקה בפיתוח טכנולוגיית שיתוף קבצים חדשה עבור לקוחות הדורשים אבטחה גבוהה. כהן שאב השראה מעבודתו והגה פרוטוקול שיתוף קבצים חדש שאמנם היה מאובטח פחות מזה של Mojo Nation – אבל איפשר להוריד קבצים ולהעלותם במהירות גבוהה יותר. לכהן כבר היה ניסיון כאוב עם הפכפכותו של עולם ההיי-טק: בתחילת שנות האלפיים הוא עבד במספר חברות סטארט-אפ אמריקניות קטנות שכולן קרסו ונסגרו בזו אחר זו מבלי שהמוצר שלהן ראה אור יום. למתכנת הצעיר נמאס לראות את העבודה שלו יורדת לטימיון פעם אחר פעם. הפעם הוא החליט לקחת סיכון: הוא התפטר מ-Mojo Nation כדי לפתח את הרעיון שלו באופן עצמאי. ביולי 2001 שחרר את הגרסה הראשונה של ביטטורנט.

שני רעיונות חדשניים מאפיינים את ביטטורנט ביחס לנפסטר ו-FastTrack, רעיונות שבזכותן נחשבת טכנולוגיה זו ל'דור השלישי' של רשתות שיתוף הקבצים.
המאפיין הראשון הוא הפרדה מובנית בין מכניזם גילוי הקבצים – לאופן העברתם. ברשתות שיתוף הקבצים הקודמות שתיארתי לא הייתה הפרדה עקרונית בין האופן שבו מחפשים המשתמשים את הקבצים שהם מעוניינים בהם או מגלים אותם – ובין האופן שבו הקבצים מועברים ממחשב למחשב. הכל נעשה על אותה הרשת. דמיינו לעצמכם רשת של כבישים מהירים, שנוסעים בה גם כלי רכב איטיים כמו כרכרות, קטנועים וכדומה: כלי הרכב האיטיים מפריעים למכוניות המהירות ומונעים מהן לנצל את הכביש המהיר באופן מיטבי. באותו האופן, שאילתות חיפוש וכל מיני שדרים אחרים שאינם קשורים ישירות להעברה של סרט או שיר ממחשב למחשב מאיטות את התעבורה ברשת שיתוף הקבצים ו'מבזבזות' חלק מרוחב הפס העומד לרשות המשתמשים. בביטטורנט, גילוי קבצים והעברתם הם שני מנגנונים שונים לחלוטין שאינם קשורים זה בזה. חיפוש אחר קבצים נעשה באתרי אינטרנט רגילים – ולא כחלק מרשת שיתוף הקבצים – המספקים למשתמשים קבצים בעלי סיומת .Torrent, שמכילים את המידע הדרוש כדי לאתר קבצים מבוקשים. רשת שיתוף הקבצים עצמה משתמשת ברוחב הפס אך ורק להעברת הקבצים עצמם – כמו כביש מהיר שנוסעות בו אך ורק מכוניות מהירות, בזמן שכל המשאיות האיטיות נוסעות ברשת כבישים אחרת ונפרדת לגמרי.

המאפיין החשוב השני הוא אופן העברת הקבצים. בכל הרשתות האחרות שהכרנו, העברת הקבצים נעשתה בין לקוח אחד ללקוח אחר. דהיינו, משתמש א' העביר למשתמש ב' את הקובץ שברשותו. אבל מה קורה אם החיבור של משתמש א' לאינטרנט אטי יחסית? במקרה שכזה, הקובץ יעבור ביניהם באטיות שמוכתבת על ידי מהירות החיבור האטית מבין השניים. זה כמו שאני אבקש מהשכן שלי למלא לי דלי של מים – אבל אם לשכן יש צינור מים דקיק, שנינו נעמוד ליד הברז דקות ארוכות ונמתין עד שהדלי יתמלא באיטיות.

בביטורנט, לעומת זאת, הקובץ מתקבל מכמה וכמה מקורות שונים באותו הזמן. אם אותו הקובץ קיים אצל מאה משתמשים שונים – פרוטוקול ביטטורנט דואג 'לשבור' את הקובץ לפיסות קטנות רבות, כך שמחשב שיש ברשותו פיסה מהקובץ המבוקש שולח אותו אל המחשב שביקש את הקובץ, בדיוק באותו הרגע שמחשב אחר שולח פיסה נוספת. ההשפעה על מהירות ההורדה דרמטית! במקום צינור אחד שמשפריץ מים בזרם קבוע לתוך דלי – יש לנו כעת כמה וכמה צינורות מים הנכנסים לפעולה יחד. ועם כל הזרמים פתוחים, הדלי מתמלא מהר הרבה יותר – או במילים אחרות, הקובץ יורד מהר יותר. הורדה מקבילה זו היא הסיבה לכך ששיתוף קבצים בביטטורנט מהיר הרבה יותר מבכל השיטות הקודמות שתיארנו, ובמיוחד במקרים שבהם מדובר בקובץ מבוקש מאד שעותקים שלו קיימים אצל משתמשים רבים, כמו סרט פופולארי או הפרק האחרון של סדרה מבוקשת.

ברם כהן ניצל כל טריק שהיה ברשותו כדי לשכנע את המשתמשים באינטרנט לנסות את הטכנולוגיה החדשה שלו, כולל הפצה מסיבית של אוסף פורנו גדול שצבר. היה זה תהליך אטי שארך מספר שנים, אך בסופו של דבר הצליחה ביטטורנט להדיח את FastTrack ממעמדה כרשת שיתוף הקבצים המובילה, בעיקר בזכות השיפור המשמעותי במהירות הורדת הקבצים. ב-2013, לדוגמא, כבר היו לביטטורנט כרבע מיליארד משתמשים וקיימים אלפי – אם לא עשרות אלפי – אתרים המפיצים קבצי torrent.

אך כאן יש לשים לב לנקודה חשובה: ביטטורנט אינה חסינה לחלוטין מפני התקפות בבית המשפט. כמו נאפסטר ו-FastTrack גם לפרוטוקול זה יש נקודת תורפה, והיא השימוש באתרי אינטרנט כמנועי חיפוש לקבצים ברשת שיתוף הקבצים, ושימוש בשרתים המכונים טרקרים (Trackers) שתפקידם לסייע באיתור כל חלקי הקובץ השונים המפוזרים בין החברים השונים ברשת. לאורך השנים הגישו חברות תקליטים וסרטים תביעות משפטיות כנגד בעלי אתרים וטרקרים, ואף הצליחו להשבית רבים מהם.
העתיד של שיתוף הקבצים

ובכל זאת, גורלה של ביטטורנט שונה לחלוטין מזה של FastTrack ונאפסטר. לא רק שהיא ממשיכה לשגשג ולמשוך מאות מיליוני משתמשים בכל רחבי העולם, גם אופיין של ההתקפות המשפטיות כנגד הרשת שונה. למשל, בשנת 2004 הקים ברם כהן את חברת ביטטורנט בע"מ, חברה שמפתחת תכנות ומציעה שירותים בתשלום שקשורים ברשת שיתוף הקבצים שהמציא. שלא כמו במקרה של נפסטר, ביטטורנט בע"מ לא נתבעה מעולם על ידי חברות המוזיקה והסרטים. התחושה המתקבלת היא שהאופן שבו מתייחסת תעשיית המדיה אל ביטטורנט שונה מהאופן שבו התייחסה לקודמותיה. מדוע? מה השתנה?

חלק מהסיבה היא, ללא ספק, טכנולוגית. כפי שיודע כל משטר המנסה להטיל צנזורה על תכנים באינטרנט – פוליטיים, פורנוגרפיים או אחרים – קשה מאד להשבית או לחסום אתרי אינטרנט. האתר The Pirate Bay הוא אולי הדוגמה המפורסמת ביותר לאתגר שכזה: זהו אתר שמאחסן מיליוני קבצי Torrent של סרטים, סדרות ושירים המוגנים בזכויות יוצרים ורשויות החוק בשוודיה מנסות להשבית אותו מזה שנים. מפעיליו של The Pirate Bay מנהלים עם השוטרים משחקי חתול ועכבר. ב-2012 הכריזו מנהלי Pirate Bay כי בכוונתם להעלות את שרתי האינטרנט של האתר אל האוויר על גבי רחפנים – כך שהדרך היחידה להפיל את האתר תהיה להפיל אותו, מילולית…

חלק אחר מהסיבה, ואולי לא פחות משמעותי, הוא שהאקלים החברתי והטכנולוגי שבו פועלת ביטטורנט כיום שונה מאד מזה ששרר בשנת 2001, בימי נפסטר. חברות רבות גילו את השימושים המועילים שיש לטכנולוגיית שיתוף הקבצים מעבר להפצת תכנים בלתי חוקיים פירטית – למשל, הפצה של עדכוני תוכנה לקהל לקוחותיהן, או הפצה זולה של תכנים חוקיים כמו תכניות טלוויזיה חינמיות. טוויטר ופייסבוק משתמשות בביטטורנט כחלק מתשתית התקשורת הפנימית של שרתים בתוך החברות. טכנולוגיית שיתוף הקבצים עדיין מזוהה בימינו עם שיתוף קבצים בלתי חוקיים, אבל פחות מבימיה של נפסטר. במקביל, גם חברות המוזיקה והסרטים השתחררו אט אט מהתפיסה המיושנת של הפצת תכנים אך ורק על תקליטורים או DVDים: הצלחת יזמות מסחריות כדוגמת החנות המקוונת iTunes הראתה את הדרך למודלים עסקיים חלופיים.

גם היוצרים עצמם למדו להכיר ביתרונות מסוימים של הפצת תכנים ברשתות שיתוף הקבצים – גם אם מדובר בתכנים בלתי חוקיים. למשל, וינס גיליגאן (Gilligan), יוצרה של הסדרה המצליחה 'שובר שורות' הודה בריאיון עיתונאי שלרשתות שיתוף הקבצים חלק לא מבוטל מהצלחת הסדרה שלו: הן אפשרו לצופים רבים ליהנות מהסדרה, למרות שלא הייתה להם גישה אליה במסגרת שידורי הטלוויזיה הרגילים. בכיר בחברת המדיה Warner Bros. סיפר בריאיון אחר שהחברה משתמשת בנתוני ההורדות הפירטיות כדי לזהות אלו סדרות הקהל אוהב ולקבל החלטות בהתאם.

אבל למרות הדברים הנ"ל, חשוב להדגיש שהויכוח אודות הנזק שגורמות רשתות שיתוף הקבצים לתעשיית המדיה רחוק מלהיות מוכרע. בפרק הזה בחרתי להתמקד בטכנולוגיה של שיתוף הקבצים, אבל אי אפשר להתעלם מהויכוח סביב הפיראטיות באינטרנט. יש רבים בתעשייה שטוענים שהורדה פירטית של קבצים גורמת לנזקים אדירים ליוצרים ולחברות שמייצגות אותם – מיליארדי דולרים של הכנסות ממכירות שירדו לטימיון. יש מי שטוען ששיתוף הקבצים הפיראטי מוליך את תעשיית המוזיקה לאבדון, ושהוא עתיד להוביל אותנו למצב שבו יוצרים לא יוכלו עוד להתפרנס בכבוד מהאמנות שלהם. אחרים טוענים שההפך הוא הנכון: ששיתוף הקבצים דווקא מגדיל את מספר החשיפה של קהל חדש למוזיקה ולספרים, ושמי שמוריד אלבום פיראטי היום יהיה זה שירכוש כרטיסים להופעה של הלהקה בעוד חודש. הויכוח בדבר התועלת והנזק שגורמת הפיראטיות הוא ויכוח מורכב, וראוי לפרק משלו.

מה שבטוח הוא שחברות המדיה לא ויתרו על השימוש בתביעות ככלי נשק במלחמה כנגד שיתוף קבצים פירטי. הן אולי אינן תוקפות ישירות את חברת ביטטורנט בע"מ, אבל הן בהחלט ממשיכות לתקוף את המשתמשים המשתפים ביניהם קבצים המוגנים בזכויות יוצרים. אחת החולשות הבולטות בפרוטוקול ביטטורנט היא שקל לגלות את כתובות ה-IP של המשתמשים ברשת – ואם אתה יודע את כתובת ה-IP של מישהו, אפשר גם לגלות היכן הוא גר. על פי ויקיפדיה, מאז שנת 2010 הוגשו כ-200,000 תביעות כנגד משתמשי ביטטורנט שהורידו קבצים בלתי חוקיים. זו כמובן רק טיפה קטנה בים של מאות המיליונים המשתמשים בביטטורנט בכל רחבי העולם, אבל היא מספיקה כדי לשמר מעין 'מאזן אימה' מסוים שהופך את שיתוף הקבצים הבלתי חוקיים לפעילות שבכל זאת טומנת בחובה סיכון כלשהו.

לסיכום, ראינו כיצד שכלול טכנולוגי זעום יחסית שפותח על ידי ילד בן 18 בסוף שבוע אחד, השיק עולם שלם של שיתוף קבצים וחולל רעידת אדמה בעולם המדיה. חברות התקליטים, שהיו הראשונות להרגיש את השפעותיה של הטכנולוגיה החדשה והבינו שהיא חוטפת מידיהם את השליטה על עולם המוזיקה, ניסו בתחילה להילחם בה בדרך היחידה שהכירו: בבית המשפט. למרות כמה הצלחות ראשוניות, בהן סגירת נפסטר וגרוקסטר, התחוור להן שתופעת שיתוף הקבצים אינה נעלמת ואפילו הולכת ומתגברת – ובצר להן פנו לטקטיקות אחרות, אפלות יותר, של זיוף ומירמה. גם אלה לא צלחו – ואפילו להפך: ביטטורנט, הדור השלישי והמצליח ביותר של רשתות שיתוף הקבצים, אומצה בחום גם על ידי חברות טכנולוגיה מובילות כפיתרון טכנולוגי לגיטימי לאתגרים מסוימים.

מה צופן העתיד לעולם שיתוף הקבצים? האם תימשך המגמה והדורות הבאים של טכנולוגיית שיתוף הקבצים יהיו מתוחכמים ומוצלחים יותר, ויאיימו עוד יותר על האמנים וחברות המדיה? אין לדעת, כמובן, אבל מעניין לראות את ההשפעה שיש דווקא לשירותים בתשלום על עולם שיתוף הקבצים. בשנים האחרונות צצו אתרים ושירותים שמספקים למשתמשים שבוחרים לשלם על המדיה שהם צורכים חוויה נעימה ואיכותית יותר, במחיר שנתפס כהוגן: למשל, Steam בעולם משחקי המחשב ו- Spotify בעולם המוזיקה. כל חבריי שלי מסכימים ביניהם שהם מעדיפים את הנוחות והזמינות של שירותי ה-VOD השונים, בתשלום, על פני הטרחה והסרבול שכרוך בהורדה פיראטית של סרט או סדרה – אם הם זמינים ב-VOD, כמובן. אם תמשיך מגמה זו, אולי נגלה שוב שהכוחות השולטים בעולם רשתות שיתוף הקבצים אינם בהכרח טכנולוגיים או הנדסיים – כי אם כוחות שונים לחלוטין: משפטיים וכלכליים. ימים יגידו.

https://www.ranlevi.com/texts/history_of_file_sharing/

Криптовалюта — что это

Форматирование не сохранено.

Сегодня практически каждый экономист или публицист считает необходимым высказаться на тему криптовалют. Ну или походя (как сказал один из участников данного форума - для перчику) совершенно не к месту пройтись по этому понятию.

А все ли при этом понимают, что это собственно за зверь такой – криптовалюта? Чем она отличается от валюты обычной? Попытаемся разобраться, поскольку никаких общепринятых определений этому понятию не существует.

Само составное слово криптовалюта означает, что мы здесь имеем дело с разновидностью валюты, точнее разновидностью денег, причем с такой их разновидностью, которая как-то связана с криптографическими алгоритмами.

Но конечно если остановиться только на этом – суть понятия криптовалюты останется от нас скрытой. И если посмотреть на определения криптовалюты из большинства статей в Интернете, то 90% (если не больше) определений ограничивается именно такой простой констатацией наличия чего то криптографического. И все.

Не менее интересен и такой вопрос – а почему собственно криптовалюта смогла появиться, какие ее свойства смогли сделать информационные записи в электронных хранилищах (называемые сейчас токены) именно разновидностью денег, а не только абстрактным новым продуктом ИТ технологий.

Самый простой, но не полный и не точный ответ будет заключаться в том, чтобы заявить, что криптовалюта это определенные записи в распределенном реестре данных, организованном по технологии блокчейн, участвующие в экономических операциях в качестве денег (выполняющие основные функции денег хотя бы где-то в экономике).

Ниже есть продолжение.

Однако это будет не совсем верно, поскольку важна не технология, а те свойства, которые делают цифровые записи пригодными для использования в качестве денег.

Первая группа свойств касается самой возможности цифровым записям быть в принципе деньгами (стать или не стать неким цифровым записям деньгами решает конечно экономика, а вот возможность чему то стать деньгами создают определенные свойства цифровых объектов).

Минимально необходимый набор свойств цифрового актива, который должен иметься в наличии, чтобы данный актив потенциально мог выполнять функции денег, следующий:
1. Определенность количества или суммы цифрового актива. Под такой определенностью понимается прежде всего, что пока нет транзакций – зафиксированное в токене количество цифрового актива (реального или виртуального) не должно меняться. Важное производное качество от требования определенности суммы – это защищенность от несанкционированных изменений любого рода. Любое изменение количества актива должно происходить только через легальные транзакции.

2. Существенна сама возможность проведения транзакций и однозначность их результата.

3. Отдельно выделим невозможность двойной траты (что очевидно для бумажных денег или монет), но не очевидно для цифровых монет.

Далее этот цифровой актив, эти токены становятся деньгами как только (и если) уже в экономических отношениях они получают свойство достаточной ликвидности вследствие чего начинают выполнять (пусть даже в ограниченных случаях) отдельные функции денег. Прежде всего функции: меры стоимости, средства обмена и средства платежа.

Но всеми вышеописанными свойствами обладают и обычные безналичные деньги, представленные записями в базах данных банков.

Поэтому вводя новое понятие криптовалюта, необходимо для разграничения этой сущности от всем привычных денег ввести некие разграничивающие условия. Иначе просто нет никакого смысла оперировать отдельным понятием криптовалюта.

Такими принципиально новыми качествами, делающими криптовалюту именно новой сущностью, отличающей ее от безналичных, электронных и прочих традиционных денег является следующее:

1. Независимость записей, формирующих токен, от несанкционированных изменений любого рода, прежде всего от воли одного лица, одной организации.

2. Распределенность, множественность мест хранения.

3. Невозможность изменить прошлое. На практике это оказывается в принципе возможным, но сопряжено либо с чрезмерными усилиями, делающими деятельность по «изменению прошлого» в транзакциях просто невыгодной, либо такие изменения невозможно скрыть и сделать тайными.

4. Замена гарантий банка/государства (что характеризует фиатные деньги) на гарантии, предоставляемые безличным публичным протоколом. Чтобы не было недопонимания сразу поясню – под гарантиями здесь понимаются в самом широком смысле любые явные и неявные обещания сделать так, а не иначе.

5. Отсутствие обязательной необходимости участия специализированных организаций (банков и центральных банков) в осуществлении транзакций и даже в самой эмиссии криптовалюты.

Именно эти качества (независимость от воли ограниченного числа лиц, распределенное хранение, невозможность изменить прошлые транзакции, опора на протокол и отсутствие обязательности участия банков) и делают существующую сейчас криптовалюту новой технологической и экономической сущностью.

Полагаю даже допустимо под криптовалютой понимать любые токены, являющиеся цифровым активом и имеющие по крайней мере одно из указанных выше свойств (1 - 5), отличающих токены криптовалюты от обычных фиатных денег, в случае выполнения ими основных функций денег (быть мерой стоимости, средством для расчетов и платежей).

Справочно приведу несколько определений для понятий, использованных выше, плюс некоторые иллюстрации частных понятий на примере уже конкретной технологии блокчейн.

Ликвидность – способность одних активов к обмену на другие активы. Упрощенно, ликвидность – это способность активов превращаться в деньги. Но и к самим деньгам также применимо понятие ликвидности. Ликвидность денег это их способность обмениваться на другие ценности.

Блокчейн - одноранговая распределенная база данных, состоящая из связанных друг с другом блоков информации, содержащих в себе записи о транзакциях и в которых каждый последующий блок содержит в себе в зашифрованном виде информацию о содержании предыдущего блока

Транзакция - минимальная логически осмысленная операция по изменению какой-либо информации, которая применительно к изменяемой информации имеет смысл и может быть совершена только полностью

Токен (криптоактив) - записи о цифровом активе, с которым возможны транзакции.

Майнинг - процесс создания и фиксации в блокчейне новых блоков информации. Происходит, как правило, на конкурентной основе в процессе конкуренции майнеров за право зафиксировать в блокчейне новый блок.

Майнеры - субъекты -участники процесса майнинга, которые получают, как правило, вознаграждение во встроенных токенах данного блокчейна за включение новых блоков в блокчейн.

Хэш-код (хэш) – число, являющееся результатом криптографической обработки входящей информации. При любом изменении входящей информации меняется ее хэш код. В блокчейне каждый последующий блок содержит хэш код предыдущего блока

Базовые токены (термин произвольный) - записи в блоках блокчейна о цифровом активе данного блокчейна, играющие роль внутренней валюты данного блокчейна, которой оплачивается майнинг. По своему характеру базовые токены являются игровой валютой внутренней конкурентной игры по увеличению длины блокчейна. Базовые токены могут также выполнять и иные функции помимо функции быть внутренней игровой валютой.

Токены, обеспеченные реальными активами - это аналог базовых токенов блокчейна, эмитент которых дополнительно установил некий базовый актив (имущество или имущественные права), связанный с выпущенными токенами.
Примеры «обеспеченных» токенов:

Токены-акции - данный вид криптоактива удостоверяет право владельца на долю в компании.

Токены-сертификаты - данный вид токена удостоверяет право владельца на материальный актив, которым обеспечен цифровой токен.

Кредитные токены - удостоверяет выданный эмитенту займ: эмитент, принимая средства от клиента выпускает токен, фиксирующий право требования владельца на возмещение в будущем.

Иные токены, связанные с активами – такие токены также могут удостоверять право на получение доли продукции эмитента токенов, а при участии государства – подтверждать права собственности, дипломы об образовании и т.п.

В заключение одно замечание частного характера. Про золото. В свете нарастающих спекуляций на тему новых криптовалют, обеспеченных золотом или иными ценностями, хочу отметить, что принципиально все токены, как ничем не обеспеченные, так и связанные с какими то активами – технологически ничем с точки зрения применимости в качестве денег друг от друга не отличаются.
У них нет друг перед другом именно технологических отличий. И только экономика или социальная психология может делать разные типы токенов более или менее востребованными для использования в качестве денег...


...Последние два-три года наблюдается резкий рост объема инвестиций, привлекаемых на самые разные коммерческие и некоммерческие цели в различные стартапы с помощью современных Интернет и криптотехнологий.
Эти процессы получили специальное наименование «краудфандинг», а привлечение инвестиций не на благотворительность и прочие некоммерческие цели, а на бизнес проекты иногда еще называют «краудинвестинг».

Объемы таких привлечений на бизнес проекты варьируются от сотен тысяч до сотен миллионов долларов, а время, за которые они привлекаются (после соответствующей подготовки разумеется) составляет от нескольких месяцев до … десятков секунд.
При этом инвесторами выступают обычные люди, не банки или инвест фонды.
Самым новым и наиболее перспективным направлением краудинвестинга является привлечение инвестиций с использованием криптотокенов (или просто «токенов»), являющихся по технологии своего создания и функционирования разновидностью криптовалют. Или что точнее: криптовалюты являются частным случаем криптотокенов.

Этот процесс получил специальное название – ICO (Initial Coin Offering) или его же также иногда называют «краудсейлинг»...

Наиболее интересный проект такого типа это ICO для строительства завода по обогащению диоксида циркония (проект ZrCoin). Инициаторы этого проекта, вложив (по их словам) в предварительную разработку технологии получения обогащенного диоксида циркония около 1 млн. долларов, планировали в мае 2017 года собрать с помощью ICO 3.5 млн. долларов для строительства первой очереди завода мощностью 400 тонн диоксида циркония в месяц. Фактически они сумели привлечь более 7 млн долларов от 4 тысяч частных инвесторов. Инвестиции были преимущественно сделаны в биткоинах, а также в валюте платформы Waves и немного в долларах США. При этом криптотокен проекта (это токен или криптомонета с тем же наименованием ZrCoin) по будущей стоимости приравнивался к стоимости 1 кг диоксида циркония, а на ICO токен продавался с существенным дисконтом (до 50% от предполагаемой рыночной цены диоксида циркония). С правовой точки зрения криптотокен ZrCoin инициаторами считался опционом на право либо получить в натуре базисный актив (диоксид циркония), либо получить при обратном выкупе текущую рыночную стоимость диоксида циркония.

По расчетам инициаторов владельцы токенов могли рассчитывать вернуть более 200% от вложенных средств (это если владельцы токенов не будут торопиться с обратным выкупом). Проект ICO ZrCoin был реализован на технологической площадке (или платформе) Waves, что позволяет в дальнейшем передавать токены и торговать ими на криптовалютной бирже (еще одна привлекательная черта ICO). Для привлечение криптовалюты и инвестиций в иностранной валюте была использована иностранная фирма (зарегистрированная на Кипре), которая потом предоставляла займы российскому предприятию.

...
Как инвестор может себя обезопасить?
Мы выдаем инвесторам цифровой токен, это некий цифровой актив, который мы приравниваем к стоимости одного килограмма синтетического концентрата диоксида циркония. Это обеспеченный товаром актив. По сути это опцион, который продается с дисконтом. …При этом … деньги заводятся как займ российскому предприятию от иностранного фонда, и он становится акционером российской компании. Этот займ является основанием для возврата вложенных инвестиций и получения инвестиционного дохода. По этому займу обременены все активы – оборудование и т.д. …
...
http://aurora.network/forum/topic/53712-kriptovaljuta-chto-eto
http://aurora.network/forum/topic/55303-kriptovaljuty-i-ico-vzgljad-sverhu-i-snizu

The Hidden Forces Behind Toutiao: China’s Content King (English)



Sources: Snapchat – S-1 filing. Instagram – Recode. Facebook – Q1 2016 earnings report.



Using Machine and Deep Learning to Create and Serve Content, China’s Toutiao Created a Product with Engagement Similar to that of Social Networks – All without a Social Graph

Toutiao, one of the flagship products of Bytedance*, may be the largest app you’ve never heard of–it’s like every news feed you read, YouTube, and TechMeme in one.

*About Bytedance

Founded in March 2012 in Beijing, Bytedance is at the global forefront of innovating artificial intelligence technologies. Bytedance is dedicated to optimizing the connection of people with information, as well as promoting content creation and communications. Its flagship product, Toutiao, is the largest AI-powered content discovery platform in China, it delivers personalized content recommendations to every user based on their interests. Bytedance owns a series of products celebrated by the users around the world, including Topbuzz, Flipagram and a series of UGC short video apps.

Bytedance established an AI Lab in 2016, leveraging extensive and complex datasets to conduct state-of-the-art research in artificial intelligence.

Ниже есть продолжение.

Over 120M people in China use it each day. Yet what’s most interesting about Toutiao isn’t that people consume such varied content all in one place… it’s how Toutiao serves it up. Without any explicit user inputs, social graph, or product purchase history to rely on, Toutiao offers a personalized, high quality-content feed for each user that is powered by machine and deep learning algorithms.

Going a step further than merely serving up content, Toutiao’s algorithms also create content: During the 2016 Olympics, a Toutiao bot wrote original news coverage, publishing stories on major events more quickly than traditional media outlets. The bot-written articles enjoyed read rates (# of reads and # of impressions) in line with those produced at a slower speed and higher cost by human writers on average.

The average user spends more than 74 minutes each day in Toutiao — that’s more than the average user spends on Facebook1, and more than twice what they spend on Snapchat2. More than half that time is spent watching short-form videos; this coupled with over 10 billion video views per day makes Toutiao the YouTube of China (along with, of course, everything else it offers).

How did Toutiao do this? Especially without massive consumer platforms at scale like those orchestrated by Chinese conglomerates Alibaba, Baidu, and Tencent? In this post I’ll explore how Toutiao got to 120M daily active users. Toutiao doesn’t attribute its growth to any one factor, but rather to the interplay between many tactical and strategic decisions it made starting at launch; specifically, five key advantages, all of which I have outlined below. And while “super apps” aren’t as common in the U.S., I believe there are specific lessons in this case that can inspire others in building their own products and platforms.

But first, a bit of background

Toutiao launched in 2012. The app uses machine and deep learning algorithms to source and surface content that users will find most interesting. Toutiao’s underlying technology learns about readers through their usage – taps, swipes, time spent on each article, time of the day the user reads, pauses, comments, interactions with the content and location – but doesn’t require any explicit input from the user and is not built on their social graph. Today, each user is measured across millions of dimensions and the result is a personalized, extensive, and high-quality content feed for every user, each time they open the app.

The Five Hidden Forces Behind Toutiao

1: Mind the gap, seize the opportunity

While timing is everything for a startup, it takes deliberate effort to build an addictive app. Toutiao’s timing was fortuitous, but its exploitation of this unique moment was deliberate. Toutiao launched as smartphone use was taking off in China: mobile penetration increased from nearly nothing in 2010 to 65% by 20143. Moreover, many of the largest content providers had not yet developed mobile apps or mobile-friendly sites, meaning that true mobile-optimized information and entertainment was rare. By mid-2012, there were only six significant news apps on the Chinese Android platform. Four of them were direct extensions of existing news portals with limited mobile optimization, and the other two were aggregators that relied exclusively on slow and impersonal editor input to determine what stories to show. Further, the Chinese audience’s demand for content (both articles and videos) was underserved by Chinese social networks such as WeChat and Weibo. WeChat launched as a messenger and to this day has a closed social network (i.e. sharing/moments are private to friends only).

Toutiao stepped into this gap with an easy-to-use, personalized, informative, and addictive mobile-first app. From the outset, Toutiao was extremely easy to start using – all it took was a download. There was no need to create an account and password, to link it to social media (unless the user so desired), or to provide information on interests or preferences. The app’s simple design also made it intuitive to use with no prior knowledge or tutorials. For any app, driving initial engagement – moving from downloads to DAUs – is notoriously difficult. It’s typical to lose users at every step of the process due to discouragement, confusion, or annoyance.

The name of the app Jinri Toutiao (meaning “today’s headlines” in Chinese) and the icon of the app were catchy for users, resulting in excellent user growth. It was also the first time various news articles were aggregated in one place. From the very early days, Toutiao tracked information about each user – their taps, swipes, time spent per article and location to power the recommendation engine which we will discuss later in the post. One month after launch, Toutiao became a personalized news aggregator for several of its users. The product, the only one of its kind and delicately designed at that time, led to a rapid growth. They hit 1M DAUs only four months after launch. Toutiao gave new internet users something to “do” when their mobile time was still up for grabs. Toutiao updated the app almost weekly throughout its first year, as it consistently innovated, iterated, and improved its features and algorithms, and this resulted in improved retention over time.

In the years that followed, competition for user share of attention on mobile would drastically increase – the number of mobile apps available in China more than tripled in the three years from 2012 to 20154. But Toutiao’s early lead meant that, by the time competitors arrived, it already had an important and valuable foothold...

2: A data network effect deliberately built across the entire system

You can have all the algorithms in the world, but without an addictive product there is no data, and without data, no algorithm can make the system better. Matt Turck has written about the power of the data network here. Simply put, the more users use your product, the more data they contribute. The more data they contribute, the smarter your product becomes. The smarter your product is (e.g., better personalization, recommendations), the better it serves your users and they are more likely to come back often and contribute more data — thus creating a virtuous cycle.

By building an addictive product, Toutiao generates engagement data from their users. That data is fed into Toutiao’s algorithms, which in turn further refines the products’ quality. Ultimately, the company plans to use this virtuous cycle to optimize every stage of what they call the “content lifecycle”: Creation, Curation, Recommendation and Interaction...

Creation

Ever since the invention of written language, content creation has been the exclusive domain of humans. Toutiao looks to change that. It’s begun with Xiaomingbot, an artificial intelligence that has already published more than 8,000 stories on the platform to-date. It debuted during the Olympics in 2016, where it published stories on major events more quickly (approximately 2 seconds after the event ended) than traditional media outlets. Indeed, the bot-authored articles enjoyed read rates (# of reads and # of impressions) in-line with those produced at a slower speed and higher cost by human writers on average...

To achieve this, Toutiao had to overcome a couple of significant technical challenges:

First, writing stories on Olympic game results required data, and Toutiao pulled it from three sources: [a] real time score updates from the Olympics organization, [b] images from an image-gathering-company it had recently acquired to find relevant visual media, and [c] monitoring live text commentary about the game. It also started with four sports — Table Tennis, Tennis, Badminton and Women’s Soccer — that were easier to recap from a technical standpoint (Table Tennis, Tennis and Badminton are “turn-based” games and the rules of the games are simpler vs. other sports. Unique access to a high-quality data source for Women’s Soccer made that the fourth game covered.)

Second, Toutiao had to figure out how to combine data from these three sources to ensure an internally consistent and relevant story. This was a much larger challenge than even accessing and interpreting the data in the first place. Any selected image needed to be relevant to the results of the event, and also appropriate for the takeaways from the commentary. This, in turn, required Toutiao’s AI team to integrate natural language processing capabilities with contextual image recognition. They ended up with a combination of a grammar-based representation for generating story templates, a ranking algorithm to select relevant sentences from live text commentary, and an image-text matching algorithm to tie it all together. The system also employs convolutional neural networks to analyze content in candidate images. By training on historical data, the model is able to pick the most relevant and visually appealing image for the story. They also use sequence-to-sequence deep learning algorithms to summarize existing stories into daily highlights and suggest better titles for articles. The system employs recurrent neural networks to compute vector representation for sentences and these sentence vectors are further fed into a ranking model to pick concise summaries for each article.

The products of these efforts – 450 published stories with 500-1,000 words during the Rio Olympics – that were hugely successful. They enjoyed read rates (# of reads divided by # of impressions) on par with those produced at a slower speed and higher cost by human writers. Toutiao has extended this capability beyond sports to over 8,000 stories to-date, and is working hard to close some of the remaining technical loopholes that make human writers recognizable.

Curation

A major engagement driver for Toutiao in its early days was “soft news”– areas like celebrity gossip, pop culture and lifestyle articles. This was no accident. Contrary to official news, which was distributed by well-known state-owned news sources, soft content was distributed across the internet on a plethora of individual sites. In short, there was no central place to access the content: users who were looking for it would have to invest meaningful time in visiting different sites, and had no assurance they were getting the most interesting information. Toutiao changed that. In owning, centralizing, and optimizing the distribution, it reduced the time a user needed to find content to nearly zero, and it increased their confidence that they were reading the most interesting stories. This created real value for users.

At its core, content curation is a two-sided problem: the curator must find content, in addition to serving it to its users. The first requires visiting websites, identifying stories, and collecting relevant metadata. The second requires continuously updating a central repository of stories, and creating as many personalized versions as possible. Both are process-intensive tasks where algorithms have a distinct advantage over humans. Toutiao’s only meaningful competition in this space when it launched were web portals where human editors handled this work, and Toutiao’s use of algorithms gave it a major advantage over the manual competition.

The speed with which the system could do what took human editors much longer translated directly into value for Toutiao’s users. Toutiao could gather more content more quickly and at a lower cost, creating a major advantage in a business were customer value is directly tied to content quality, relevance and refresh rate. The use of algorithms also meant that each user could have their own, interest based and continuously updated profile – something that no human editor would ever have the time to do.

Toutiao also uses algorithms to identify and filter out low-quality content. A content distribution platform is only as good as the content it distributes. The days of mass-distributed cookie-cutter content (e.g., newspapers, magazines) are over. In Toutiao’s world, the distribution platform only serves what is interesting to its users. False reporting and spam are major issues in the media industry. Toutiao’s underlying technology uses a text classification algorithm to determine if an article is fake news, uses clickbait titles, or doesn’t meet Toutiao’s quality standards. Here, Toutiao also leans on user moderators to flag fake articles and employs human moderators to arbitrate on disputed reporting.

Recommendation

Content recommendation is the feature for which Toutiao is best-known, and to which it owes much of its success and reputation. The use of machine and deep learning algorithms at this stage of the content lifecycle is what has sets Toutiao apart from its peers, and is key to driving continued user growth and retention.

The question that the recommendation engine is trying to solve is simple: what are the one hundred articles the platform can recommend to each user that are most likely to result in continued engagement? This is a question with major consequences – the AI team has recognized that 100 headlines is a retention “threshold” (users that do not retain long-term tend to drop off dramatically after seeing ~100 headlines, similar to Facebook’s “10 friends” rule). It is also a question that humans are unsuited to answer: no human editor could ever regularly and quickly identify the optimal set of headlines for every one of the app’s new users.

As simple as the question may be, the solution is complex. For every new user, Toutiao blends signals from three key areas to create a feed that it hopes is engaging and will push users over the 100-headline threshold:

* User profiles: are initially built based on the app’s understanding of the user’s demographics (their age, location, gender, and socio-economic status)
* Content: to understand the content of articles, Toutiao turns to natural language processing to determine if the article is trending, whether it is long or short, and the timeliness of the article (some articles are evergreen while others have a very short half-life)
* Context: pertain to location-related data (localities like geography, weather, local news, etc.)


The underlying algorithms must then identify the strongest statistical match between the user’s profile, its own content profile, and context, and it must do this on a continual basis. This matching is meant to optimize the percent of articles a user reads (clicks on) and the percent of articles that a user finishes (measured by the time spent on the page). When a user first opens the app, the system uses the basic data in the profile for the matching: a user in Silicon Valley, for example, may be more likely to click on articles about tech. The system also makes sure to show a variety of articles to assess interest/disinterest– in doing so, can help users discover previously unknown content and test their potential interests. Over time, as the app collects user information, these recommendations get further and further refined. The engine learns quickly – for most users, it takes less than one day to successfully learn their interests (indicated by 80% read rates). The result is the case of strong user retention (>45%) that is similar to social networks and one of the largest time spent per user apps in the world.

Interaction

As Toutiao has grown, interaction on the platform has become more and more central to its user value proposition. Rather than leaving it to the users to find each other, Toutiao uses underlying algorithms to help enable meaningful connections. Nowhere is this more relevant than in its recently developed question-and-answer feature, where the AI team was tasked with developing a matching engine that links a question-asker with someone who can answer them. Toutiao recently published a paper for the ACL conference touting these results. Their proposed “Conditional Focused Neural Question Answering with Large-Scale Knowledge Bases approach” achieves an accuracy of 75.7% on a data set of 108K questions, and outperforms the current state of the art (better than the Memory Network and LTG-CNN methods on the benchmark dataset) by an 11.8% margin.

Toutiao’s underlying technology not only creates a better user experience, but also serves to strengthen the company’s competitive moat. More compelling content and interactions meant users would spend more time on the platform, and the more time they spent on the platform the better the use of algorithms became. The smarter the system is, the better it can distribute content – and the more content creators it attracts. This, in turn, drives more users to the platform. And thus is born a strong data network effect – the power of the system grows exponentially with the scale of the system. There are competitors who have launched since then (especially after seeing Toutiao’s success), however it has been difficult to match the accuracy and efficacy of the Toutiao recommendation engine leading to continued rapid growth for Toutiao.
3. From content aggregation to content destination

It is not uncommon to see apps strive to move from content aggregation to content destination. However it is extremely challenging from a brand and creative strategy to make that happen. Here is how Toutiao did it. Toutiao offered two significant benefits to content contributors over the platforms.

Strong incentives via revenue sharing that enabled writers to make money from very early on. In 2014, Toutiao rolled out incentive programs to attract more content creators to the platform. These ranged from offering office space, tools, minimum guarantees per month if they hit certain key milestones (e.g., # of articles, read rates) to sharing revenue via monetization. Toutiao began monetizing via ads since 2014 and this enabled revenue sharing opportunities with their content contributors.

This was the function that launched Toutiao, but as it has grown, Toutiao has transitioned into a deeper platform for content generation, consumption, and connections. Today, it hosts more than 800,000 Toutiaohao accounts – professional media outlets, bloggers, and influencers who use the platform to share articles, images, and videos with Toutiao users . It hosts many more users sharing short posts through Wei Toutiao. The result is the wide variety of content that Toutiao hosts today ranging from news to stocks to science to relationships. Top 20 categories account for only 60% of the content supply and no single category contributes over 10% of the content...

Larger and more relevant audience than other platforms that directly translated to increasing brand presence for content contributors. Almost all contributors create and distribute content on all platforms. But for many contributors, they have the ability to attract more traffic from Toutiao due to the strong recommendation engine. One example is ” 欢子tv“ ( Huanzi TV). This creator creates short videos about folks’ lives and customs in the countryside of China. Each of his videos has an average of 700,000 views, while the views in his Wechat official account is less than 1/40 of that on Toutiao. Toutiao has enabled the long tail of contributors to reach their most relevant audience more seamlessly than any other platform in China.

4. Unencumbered by formats

Instead of being stubborn about their core format (e.g., listicles, long form content and news), Toutiao was quick to expand to other formats when the data suggested they should. In 2015, at the time where most video platforms in China are focusing on long-form videos, Toutiao added video capability and started to support PGC short video content (typically 1-5 mins) on its platform. Toutiao had observed an increase in supply of video content in 2014 as connectivity and infrastructure had improved significantly by 2014. Additionally, Toutiao rolled out several incentive programs to promote video content creation on its platform. The transition from text to image to video was similar to what most US platforms have seen to date.

Later in March 2016, Toutiao launched Toutiao Video (which is now renamed to Watermelon Video), a separate PGC short video app powered by the same algorithm engine as Toutiao. Similar to written content, the underlying algorithms recommend the most relevant videos to users based on their interest graph. Toutiao is now the “go-to platform” for PGC short video content. More than half of its 74 mins daily usage for each user is spent watching short-form videos and Toutiao is close to exceeding 10 billion video views every day.

5. Early monetization and alignment with product

Toutiao has reached unprecedented scale in revenue in a short time frame (5 years since launch and 3 years since they began monetizing) and it is remarkable that they are doing it without leveraging any social graph or product purchase history. Toutiao is on target to hit more than 15B RMB (>$$$2.2B USD) in revenue this year – one of the fastest growing apps in terms of revenue in the history of the internet...

Of the many things that Toutiao does, one element that is core to its model more than any other: it is good at identifying what its users want to see. It is fitting, then, that its business model maps perfectly to that strength. Toutiao generates revenue by matching relevant ads to users, using the same proprietary technology behind their content targeting. This has three important benefits:

First, it reduced the impact of monetization on the user experience – and may have actually improved the experience! Users typically consider ads as intrusive and degrading to their experience, but ads aligned with user preferences are less so. In serving ads that are highly relevant to a user’s interests, Toutiao in many ways acts as a product discovery mechanism.

The second is that it increased the rates that Toutiao could charge advertisers. One of the key problems in advertising is identifying how to selectively place your ads in front of the highest potential customers, and advertisers spend countless hours and enormous sums of money trying to target effectively. Toutiao’s technology, which solves this targeting problem natively, represented a solution and saves advertisers from paying a big premium for it.

Third, since the primary use case is to read and view content, users are more receptive to seeing relevant targeted ads and therefore there is more inventory available to advertisers.

The combination of all these three factors results in much better CTRs (Click Through Rates) on Toutiao vs. competitors. Third party survey data estimates Toutiao’s CTRs to be 200% better than its peers.

Impact on the Future of Content Discovery

Toutiao is chipping away at their end goal, which is essentially to wipe away the concept of search and just serve up aggregated, hyper-relevant content. We’ve seen “content aggregators” come and go in the U.S. but it is possible that they are an idea whose time is yet to come – and that better algorithms will be the catalyst for success. Facebook and Twitter are both critical sources for consumption of news in the U.S. today. The other giant in the room here is Google, which in July announced that the feed in its mobile app would be increasing its use of machine learning to better show their users the information they will find most relevant and interesting – a feed that incorporates all types of news.

Notes
1. Source: Facebook Q1 2016 Earnings Call.
2. Source: http://time.com/4272935/snapchat-users-usage-time-app-advertising/.
3. Source: http://www.businessinsider.com/china-has-more-smartphone-users-than-us-brazil-and-indonesia-combined-2015-7.
4. Source: https://www.statista.com/statistics/315485/china-number-of-mobile-apps-available/.





http://blog.ycombinator.com/the-hidden-forces-behind-toutiao-chinas-content-king/

עושים היסטוריה 183, 184: השפה האינדו-אירופאית הקדומה (Hebrew)

mp3 part1
mp3 part2

חלק א' – אינדיאנה ג'ונס של השפות

תגלית מפתיעה של שופט בריטי בהודו הקולוניאלית חשפה את דבר קיומה של שפה עתיקה אשר היא מקורן של מגוון אדיר של שפות: מסנסקריט ופרסית במזרח, ועד אנגלית, צרפתית וספרדית במערב. אך דוברי שפה זו, בעידן שלפני המצאת הכתב, לא השאירו מאחוריהם מסמכים או עדויות כתובות אחרות. כיצד הצליחו בכל זאת חוקרי השפות לשחזר למעלה מאלף מילים בשפה עתיקה זו?

חלק ב' – על גנטיקה ובלשנות
כיצד קרה ששפתם של שבט נוודים נידח בערבות העשב של יורו-אסיה הפכה להיות השפה-האם של כמחצית מאוכלוסיית העולם כיום? התשובה המפתיעה קשורה ל'מירוץ חימוש' טכנולוגי בעידן הברונזה, ולמוטציה גנטית אקראית שטרפה את כל הקלפים.

https://www.ranlevi.com/2016/03/15/ep183_indo_european_lang_pt1/
https://www.ranlevi.com/2016/03/29/184_indo_european_lange_pt2/

Ниже есть продолжение.

דמיינו לעצמכם שאתם בלשי משטרה, ועליכם לפענח פשע: רצח, למשל. הבעיה היא שמהפשע עצמו לא נותרה שום עדות: לא גופה, לא נשק, לא תמונה, סרטון או עד ראיה. שום דבר. פענוח הפשע, במצב כזה, הוא אתגר שנדמה כמעט בלתי אפשרי – מסוג האתגרים שבלשים הוליוודיים אולי יכולים להתמודד איתם, אבל בלשים בעולם האמיתי כנראה שהיו מרימים ידיים.
כעת, שימו את עצמכם בנעליהם של בלשנים, חוקרי שפות, המבקשים לחשוף את צפונותיה של שפה שהתקיימה לפני כששת אלפי שנים, ואינה מדוברת עוד מזה לפחות ארבעת אלפים וחמש מאות שנים. שפה מהימים שלפני המצאת הכתב, ולכן גם לא נותרה ממנה ולו אות כתובה אחת. לו אני הייתי בלשן, כנראה שהייתי מרים ידיים: אם אין שרידים מוחשיים ללמוד מהם, מה יש כאן לחקור? על פניו, זו נראית כמו משימה אבודה, פשע נטול ראיות.

אך הסיפור שלפנינו ידגים שלפעמים בלשנים יכולים להיות גם בלשים – ובמקרה של שפות, העדויות עשויות להסתתר במקום הכי לא צפוי, שהוא כמובן – ממש מתחת לאפנו.
וויליאם ג'ונס וגילוייה של השפה הפרוטו-אינדו-אירופאית

בשנת 1783 הגיע להודו עורך דין אנגלי בשם וויליאם ג'ונס. על אף שלבריטניה כבר היו לא מעט אנשי ממשל ונציגים רשמיים בתת-היבשת, זכה ג'ונס לקבלת פנים מכובדת במיוחד מצד המושל הבריטי המקומי, שכן הוא היה עורך דין יוצא דופן.

אביו של ג'ונס הלך לעולמו כשזה היה רק כבן שלוש. האב, מתמטיקאי מפורסם, אמנם השאיר אחריו ירושה צנועה, אך היא הספיקה כדי לממן לג'ונס חינוך נאות. שנים ספורות לאחר מכן הסתבר שהילד ניחן בכישרון ייחודי בתחום השפות: ככבר בגיל עשר ידע לדבר על בוריין עברית, ערבית, צרפתית ואיטלקית. בבגרותו, היה מסוגל לשוחח בעשרים ושמונה שפות. ג'ונס נמשך במיוחד לתרבויות המזרחיות – מסופטמיה ודרום מזרח אסיה – שנחשבו אז בעיני רוב האנשים כאקזוטיות וכמשונות. מומחיותו והכרותו עם תרבויות אלו זיכתה אותו בכינוי 'ג'ונס האוריינטלי' וכישורי השפה שלו נודעו בכל אירופה: כשהיה רק בן 22, פנה אליו מלך דנמרק וביקש שיתרגם ספר בפרסית לצרפתית. ספרים נוספים שכתב על שפות מזרחיות נחשבים לקלאסיקות פורצות דרך בתחום הבלשנות.

וויליאם ג'ונס היה כוכב בשמי האקדמיה של המאה ה-18: הוא התקבל לחברה המלכותית הבריטית – אחד המוסדות האקדמים היוקרתיים בעולם – ואף זכה בתואר אבירות. אבל יוקרה היא דבר אחד וכסף דבר אחר: כדי לפרנס את עצמו, נאלץ ג'ונס ללמוד משפטים ולעבוד כעורך דין. הכסף הוא גם זה שהביא אותו, בסוף של דבר, להודו. ב-1783 שמע ג'ונס על משרה שהתפנתה: שופט בבית המשפט העליון של כלכותה, בבנגל שבמזרח הודו. בבריטניה, הודו הייתה ידועה כמכרה זהב כיוון שמסחר באופיום, בתבלינים וביהלומים הפך בריטים רבים מאוד לעשירים כקורח. ג'ונס הפעיל כמה קשרים וזכה בתפקיד.

המצב החברתי-פוליטי בהודו לא היה פשוט. הבריטים שלטו על אוכלוסיה עצומה, וברקע עמד חשש תמידי מפני מרידות ואי-שקט. באותה העת, למושל הבריטי של בנגל הייתה גישה שנחשבה לליברלית מאוד: הוא האמין שכדי לזכות באהדת האוכלוסיה המקומית, על השלטון הבריטי להתבסס על חוקים ומסורות מקומיים – ולא לכפות על ההודים חוקים אירופים הזרים להם. וויליאם ג'ונס הזדהה מאוד עם גישה שכזו: בחוגים הפוליטיים הוא היה ידוע כליברל – ואפילו ליברל רדיקלי – בזכות תמיכתו במאבקן של המושבות הבריטיות באמריקה כנגד השלטון המרכזי בלונדון. כבוד והערכה למסורות ולתרבויות אחרות היו נטועים עמוק באישיותו.

אך כשהתיישב ג'ונס על הכסא בבית המשפט העליון של כלכותה, גילה חסרון בגישה הליברלית. החוקים והמסורות ההינדים היו מבוססים על ספרים עתיקים שנכתבו בסנסקריט – שפה הודית עתיקה. הסנסקריט הייתה מוכרת, אך אפשר להשוות אותה לשפה הלטינית: יש מי שלמדו אותה ויודעים לדבר בה, אבל איש לא למד אותה כשפת אם. בפרט, גם השופטים הבריטים בהודו לא ידעו סנסקריט, ולכן נאלצו להסתמך באופן כמעט עיוור על מלומדים מקומיים שנודעו בשם 'פאנדיטים', שתרגמו עבורם את הכתבים העתיקים. ג'ונס חשש מפני התלות העיוורת בפאנדיטים: היא יצרה הזדמנות לשוחד ולשחיתות שקשה היה להילחם בהם. על כן החליט ג'ונס להרים את הכפפה: הוא ילמד סנסקריט ויתרגם את הכתבים העתיקים לאנגלית.

אך הפאנדיטים המקומיים לא ששו לוותר על המונופול הטבעי על החוק, או במילים אחרות – מקור כוחם, וללמד את השופט הבריטי את רזי השפה העתיקה. רק במאמץ רב הצליח ג'ונס למצוא פאנדיט שהסכים ללמד אותו סנסקריט. על פי אחת הגרסות של הסיפור, גם הפאנדיט הזה לא התלהב לחשוף בפני הזר הטמא ואוכל-הבשר את המסורות הקדושות, והציב בפני ג'ונס דרישות מחמירות: עליו ללמוד אך ורק בחדר שעבר טקסי טיהור מיוחדים, ועל בטן ריקה בלבד – פרט לכוס תה פה ושם. ג'ונס הסכים לכל הדרישות. קשה לדעת אם סיפור זה התרחש באמת או שמא מדובר בהגזמה, אך לכל הפחות הוא מדגים בפנינו את נחישותו של וויליאם ג'ונס ללמוד סנסקריט. ממש..אינדיאנה ג'ונס. כך או כך, בשנה אחת צבר ג'ונס ידע ושליטה נאותה בסנסקריט, עד שחש ביטחון עצמי ביכולותיו כדי לפסוק במקרה נדיר שבו שני פאנדיטים לא הסכימו ביניהם על פרשנות לספר כלשהו. ג'ונס פנה אל המקור בסנסקריט, תרגם אותו לאנגלית ופסק פסיקה שנחשבה לתקדים.

בזכות הכרותו החדשה את השפה ההודית העתיקה, הבחין ג'ונס בתופעה מפתיעה ובלתי צפויה. מילים לא מעטות בסנסקריט הזכירו מאוד מילים מקבילות בלטינית, בפרסית, ביוונית ובאנגלית. למשל, המילה 'אימא' בסנסרקיט היא matar, והיא דומה מאד ל- madar הפרסית, mater הלטינית ו-mother האנגלית. הביטוי 'מלך האלים' בסנסקריט הוא dyaus pitar, והוא מתרגם מילולית ל-'אב השמיים': pitar הוא 'אבא'. ביוונית העתיקה, מלך האלים כונה Zeu-pater, ביטוי שקוצר מאוחר יותר ל'זאוס': גם כאן, pater הוא 'אבא'. מלך האלים הלטיני הוא Iu-peter, או בגרסא המודרנית יותר 'יופיטר', ו-peter הוא אבא. הדימיון בין pitar הסנסקריטי, pater היווני ו-peter הלטיני, הבין ג'ונס, לא יכול להיות מקרי – מסקנה שהתחזקה אצלו כשגילה עוד ועוד מילים דומות נוספות בשפות השונות.

דימיון שכזה אפשר למצוא, כמובן, גם בין השפות השונות באירופה לבין עצמן, והאירופאים היו מודעים לו מזה שנים רבות. למשל, הצרפתית, האיטלקלית והספרדית דומות מאוד זו לזו, גם במבנה התחבירי וגם מבחינת אוצר המילים: לדוגמא – המילה 'אישה' בספרדית היא mujer, באיטלקית moglie ובצרפתית עתיקה moillier. ההסבר לדימיון, במקרה זה, הוא ששלושת השפות הן צאצאיות של הלטינית, שפתה הרשמית של האימפריה הרומית. זו הסיבה שהן מכונות 'השפות הרומנסיות'. במרוצת השנים שלאחר התפוררות האימפריה בסביבות המאה החמישית לספירה, אמנם הפכו הדיאלקטים הלטיניים המקומיים לשפות שונות, אך דימיון עקרוני ביניהן נשאר לאורך הדורות.

מקרה אחר הוא הדימיון רב שאפשר למצוא גם בין השפות הגרמניות – אנגלית וגרמנית, למשל – לשפות הרומנסיות, וזאת למרות שהשפות הגרמניות התפתחו בנפרד מהלטינית. ההסבר המקובל לדימיון במקרה הזה היה החיכוך הבלתי פוסק בין התרבויות השונות ביבשת: השבטים הגרמניים הקדומים סחרו, לחמו, כבשו את שכניהם ונכבשו על ידם – וכך חדרו לא מעט מילים זרות לשפתם.

אבל את הדימיון שחשף ג'ונס בין הסנסקריט והלטינית אי אפשר היה להסביר בחיכוך שכזה. שתי התרבויות הללו היו רחוקות כל כך ומנותקות זו מזו, עד שהמגע ביניהן היה כמעט אפסי. ההסבר האפשרי השני לדימיון שכזה היה, אם כן, מקור משותף – וזו ההשערה שהעלה וויליאם ג'ונס במאמר שפרסם ב-1788:

"הסנסקריט, למרות עתיקותה, היא בעלת מבנה נפלא: מושלמת יותר מהיוונית, עשירה יותר מהלטינית ומעודנת יותר משתיהן. אך היא דומה להן, גם בפעליה וגם בתחביר שלה, במידה שאי אפשר להסביר כיד המקרה. הדימיון ביניהן כה חזק, עד שכל פילולוג [חוקר שפות] שייבחן את שלושתן יסיק מיד שיש להן מקור משותף."

במילים אחרות, באותו האופן שבו הלטינית הייתה שפה אחת שבשלב כלשהו התפצלה לכמה וכמה שפות שונות – כך אולי הייתה שפה ראשונית שממנה התפצלו הסנסקריט, הפרסית, היוונית והלטינית. השם שניתן לשפה ההיפותטית שחשף וויליאם ג'ונס היה 'פרוטו-אינדו-אירופית', או בקיצור 'אינדו-אירופית', לציון הקשר שבין השפה הסנסקריט לשפות האירופיות.

ג'ונס לא היה המלומד הראשון שזיהה את הדימיון בין הסנסקריט ללטינית – היו חוקרים שהעלו השערות דומות כמה עשרות שנים לפניו – אך המוניטין שהיה ל"גו'נס האורינטלי" העניק להשערה זו משקל, ודרבן אחרים להמשיך את עבודתו אחריו. השערתו הסעירה את דימיונם של הבלשנים האירופים. אם ג'ונס צודק ושפה ראשונית שכזו אכן התקיימה בעבר – אזי המשמעות היא שהיא חייבת להיות שפה עתיקה מאוד, שהרי תרבויותם של האירופים, הפרסים וההודים נפרדות זו מזו אלפי שנים.
אבל איך ניתן לגלות משהו על השפה האינדו-אירופאית? אם היא כה עתיקה, אזי היא התקיימה בימים שלפני הכתב – ומכאן שאין לנו כל דרך ללמוד או ולחקור אותה. אין סיפורים, אין שירים, אין כתבי ירושה או מתכונים…שפה שהייתה, ונעלמה. לנצח.

האמנם?
יעקב גרים

הכירו את קווין שטראוד (Straud). אפשר למצוא קווי דימיון רבים בין שטראוד לוויליאם ג'ונס: בדומה לחוקר הבריטי, גם שטראוד הוא עורך דין בעל תשוקה אדירה לבלשנות ולשפות. את קווין שטראוד הכרתי בזכות הפודקאסט שלו, The History of The English Language, שעוסק בהתפתחותה של האנגלית משורשיה המוקדמים ביותר ועד ימינו. לחובבי שפות כמותי, הפודקאסט של שטראוד הוא תענוג אדיר: שילוב של בלשנות והיסטוריה, שני תחומים שמחזקים ומשלימים זה את זה. לראיה, דינה בר-מנחם, העורכת הלשונית שלנו – הפכה להיות מאזינה מושבעת שלו אחרי שערכה את הפרק הזה…

“My name is Kevin Starud, I’m the host of the History of the English Language podcast, which I started back in 2012. So many history podcasts focus on military histories or social histories – but very few, none that I knew of, focus on linguistics history. So I always thought it would be interesting to tell the story of the English language, but tell it in the context of the over-arching history of the english-speaking people, and combine the linguistic history with the social and military and put it all together. That’s the concept of the podcast.”

כפי שיספר לנו שטראוד מייד, פריצת הדרך הראשונה במחקר השפה האינדו-אירופאית העתיקה התחולל דווקא בעקבות סדרה של אירועים שאינם קשורים כלל למדע או לבלשנות בפרט, אירועים שמי שאחראי להם הוא – מכל האנשים – נפוליאון.

ראשית, קצת רקע היסטורי. האימפריה הרומית הקדושה הייתה "יצור" משונה במפה הפוליטית האירופאית. היא נוסדה עוד במאה התשיעית לספירה, שלטה על רוב השטח שהוא היום גרמניה ואוסטריה ואיגדה תחתיה את רוב דוברי הגרמנית באירופה – אבל האימפריה הרומית הקדושה לא הייתה מדינת לאום במובן שאנחנו מבינים כיום. לקיסר שעמד בראשה היו סמכויות מוגבלות יחסית, והאימפריה היה מחולקת הלכה למעשה לכ-300 נסיכויות וממלכות קטנות, שבראש כל אחת מהן עמד מלך, נסיך או רוזן.

בתחילת המאה ה-19 כבש נפוליאון שטחים נרחבים בגרמניה, וסיפח אל צרפת את אזור חבל הריין. הכיבוש הצרפתי עורר בקרב הגרמנים תחושות לאומיות, וההבנה שכדי להפוך למעצמה אזורית אמיתית – על הגרמנים להתאחד ולשלב כוחות. כל עוד לא מפוצלים הגרמנים בין מאות הממלכות הקטנות, לא תוכל גרמניה לעמוד כנגד שאר המעצמות שסביבה.

“William Jones did his work in the late 1700’s, but then you get into the 1800’s, and within Germany, there’s this awaking sense of nationalism. Germany has just come of a period where it was occupied by France in the Napoleonic period, and now France has been pushed out and we’re beginning [to see] a process where city-states and principalities are starting to unite. That had not happened yet – but the process was beginning. Amongst all of the various peoples within the area we now know as Germany, one thing they had in common was a language. They all shared the same Germanic language.
There started to be […] a strong interest in the Germanic language family, that thing that united them together. There started to be an intense study in the history of the Germanic languages. One of the most important figures in that process is a name that many people will recognize: it was Jacob Grimm, one of the famous Brothers Grimm.”

יעקוב לודוויג קארל גרים (Grimm) נולד בשנת 1785 ברוזנות Hesse-Kassel, אחת מאותן מאות נסיכויות קטנות באימפריה הרומית הקדושה. הוא ואחיו הצעיר וילהלם הושפעו עמוקות מאותו זרם לאומני שהתחזק באותם הימים, וכשגדלו השניים והפכו לאנשי אקדמיה – ביקשו לחקור ולזהות את אותם האלמנטים בתרבות ובהיסטוריה הגרמנית שמדגישים את ההיסטוריה המשותפת לכל הגרמנים, היסטוריה שתטשטש את החלוקה לממלכות ונסיכויות. שירה וסיפורת גרמנית מוקדמת היו אלמנטים משותפים שכאלה. יחדיו, יעקוב ו-וילהלם קיבצו ועיבדו שירים ואגדות עם עתיקות, ביניהם 'הנסיכה והצפרדע', 'היפייפיה הנרדמת', 'לכלוכית' ו'עמי תמי' – מה שמוכיח שלא כל פרץ לאומנות גרמני חייב בהכרח להסתיים באנשים שנשרפים בתוך תנור לוהט. במחשבה שנייה, אולי 'עמי ותמי' היא לא דוגמה מוצלחת כל כך. בכל מקרה, ספרם 'מעשיות האחים גרים' משנת 1814 זכה להצלחה אדירה, והפך את האחים למפורסמים בכל רחבי אירופה.

כפי שציין קווין שטארוד, גם העניין שגילה יעקוב גרים בשפות הושפע מנטיותיו הלאומניות. במסגרת עבודתו האקדמית חקר גרים את שורשי השפות הגרמניות השונות – גרמנית, אנגלית, שוודית, איסלנדית ושאר השפות הסקנדינביות – שוב, כדי לזהות ולהדגיש את המאפיינים המאחדים אותן. כחלק מהמחקר, השווה גרים את השפות הגרמניות לשפות אחרות.

אגב, אם כבר בלאומנות גרמנית עסקינן, כאן המקום לציין שוויליאם ג'ונס, מגלה השפה הפרוטו-אינדו-אירופאית, כינה את בני התרבות האינדו-אירופאית 'ארים' (Aryans). 'ארי' הוא מונח השאול מהשפה ההינדית, ומתאר את בני האימפריה הפרסית הקדומה, שכאמור היו דוברי שפה אינדו-אירופאית. המונח 'ארים' היה בשימוש כדי לתאר את דוברי השפה האינדו-אירופאית במשך רוב המאה ה-19, אבל בתחילת המאה העשרים החל לקבל קונוטציה רחבה יותר, של בני גזע עליון וטהור יותר, כביכול, רעיון שהפך לנכס צאן ברזל של האידיאולוגיה הנאצית. באופן לא מפתיע, אחרי מלחמת העולם השניה דעך זוהרו של מונח זה והוא יצא משימוש. כיום אנחנו מכנים את דוברי השפה הקדומה הזו 'פרוטו-אינדו-אירופאים'.
חוק גרים ומעתקי הגאים

בחזרה ליעקב גרים. בבסיס מחקריו של גרים עמדה השאלה כיצד ניתן להבין מהו הקשר בין מילים בשפות שונות? לשם ההסבר, נניח שאני חוזר הביתה אחרי יום עבודה מפרך, ורואה שקיר המסדרון מקושקש כולו בטוש שהדרך היחידה להסיר אותו היא עם שופל. נניח גם שאני רואה את הבן הקטן שלי יושב על הספה, וכל הידיים שלו גם הן צבועות באותו צבע בדיוק. הייתי רוצה לספר לכם שמדובר בדוגמה בדיונית, אבל אני לא עד כדי כך יצירתי. השאלה הנשאלת היא: מה הקשר בין הקיר לילד? איך אוכל להיות בטוח שהילד הוא זה שמוקדם יותר קישקש על הקיר ועכשיו יושב לו בתמימות על הספה, ושהצבעים על כפות ידיו אינם תוצאה של עבודת יצירה שעשה בגן?
באנלוגיה לשפות ולמילים, דימיון בין שתי מילים בשפות שונות – למשל, Father באנגלית ו-Pater ביוונית – יכול לנבוע מכמה מקורות שונים. למשל, ייתכן והאנגלים שאלו את המילה מהיוונית, כפי שאנחנו שאלנו את הביטויים 'טלפון' ו-'פקס' מהאנגלית, או שלשתי המילים מקור משותף בשפה שלישית, מוקדמת יותר. ייתכן גם שמדובר בצרוף מקרים אקראי בלבד. כיצד נוכל לזהות את מהות הקשר?

במקרה של הבן שלי, התשובה ברורה למדי כיוון שאני מכיר את הנפשות הפועלות. במקרה של מילים, לעומת זאת, זה לא פשוט כל כך.

“Jacob Grimm, what he did was he took not just dozens or hundreds – but thousands of words within the Germanic languages, and then he compared them to words meaning the same thing in other languages like Latin and Greek. He concluded that there were certain patterns emerging here.”

יעקוב גרים ניתח מילים אינספור בכמה וכמה שפות, וחיפש בהן דפוסים: תבניות שחוזרות על עצמן בדימיון בין המילים. מהם אותם דפוסים שזיהה יעקוב גרים בשפות שבחן?

ובכן, ניקח לדוגמה את האותיות p ו-f. גרים הבחין שבשפות הגרמניות הצליל p הוחלף באופן שיטתי במרוצת השנים בצליל f. החלפה שכזו מכונה בעברית 'מעתק'. למשל, המילה הלטינית penna פירושה 'נוצה' והיא חדרה אל השפה האנגלית דרך הצרפתית – שהיא, כזכור, שפה-בת של הלטינית .מ-Penna הפכה המילה ל-pen, ומכיוון שבעבר היו טובלים נוצות בדיו כדי לכתוב, היא קיבלה את המשמעות של 'כלי כתיבה'. אך אותה המילה – penna – התגלגלה גם לגרמנית, עברה העתקה של p ל-f, וגם משם חדרה אל האנגלית: הפעם כ-feather. דהיינו, אותה המילה הלטינית המקורית חדרה אל האנגלית משתי מקורות או מסלולים שונים, אך במסלול הגרמני התרחשה העתקה של ה-p ל-f. את אותו מעתק אפשר למצוא במילים רבות אחרות שמקורן בלטינית ועברו דרך הגרמנית:

Father (English) – Pater (Latin)
Foot – Ped (as in Pedometer)
Fire – Pyre (as in Pyromanic), פירומן

פרט למעתק של p ו- f, זיהה יעקוב גרים עוד שמונה מעתקים נוספים. כשמבינים את המעתקים האלה, אפשר גם להתחיל להבין מדוע השפה האנגלית, למשל, עשירה כל כך במילים שונות מאוד בעלות משמעות כמעט זהה.
למשל, ישנו מעתק מהאות d לאות ל-t. המילה הלטינית ל-'שן', כמו שן בינה, היא dentis – וממנה אנו מקבלים מילים כמו dentist, רופא שיניים. לאחר המעתק הגרמני מ-d ל-t, מתקבלת המילה tooth, שיש לה את אותה המשמעות ממש. אגב, אפשר לזהות את אותו מעתק מתרחש גם בימינו, באנגלית האמריקנית המודרנית: לדוגמא, מילה כמו Bitter (מריר) מבוטאת באנגלית האמריקנית כ-Bidder.

עוד דוגמא. בלטינית, המילה cord פירושה 'לב', וממנה התפתחה המילה הספרדית ללב – corazon – והמונחים באנגלית cardiac arrest (התקף לב) ו-cardiology. גרים זיהה מעתק של האות c לאות h, וממנו קיבלנו את המילה heart, בעלת אותה המשמעות – לב. ועוד דוגמא אחרונה: המילה הלטינית ל'ראש' היא caput, וממנה נתקבלו המילים captain (ראש לחיילים) וגם המילה הצרפתית chef (ראש המטבח). בעקבות המעתק מ-c ל-h קיבלנו את המילה head. קפיש?

תופעה זו של העתקת הגאים זוהתה טרם ימיו של יעקוב גרים – אך גרים היה הראשון שזיהה שמדובר בדפוס של ממש, ולא באוסף דוגמות מבודדות ומקריות. תופעת העתקת ההגאים השיטתית שזיהה גרים קרויה כיום על שמו: 'חוק גרים'. מעתק זה לא התרחש בכל המקרים, אלא היה תלוי בגורמים נוספים כגון מיקומה של האות p בתוך המילה – אבל החוקרים מבינים גורמים אלה, ומסוגלים לזהות באופן מהימן מתי ובאלו תנאים הוא מתרחש.

גם בעברית, אגב, התרחשו מעתקי הגאים שכאלה. קחו, למשל, את המילה 'תלת-אופן', אותו מכשיר בעל שלושה גלגלים שהומצא כדי למרר את חייהם של הורים. מה הקשר בין 'תלת' ל-'שלוש'? ובכן, מילים שחדרו לעברית מהארמית עברו מעתק: האות ת"ו הפכה לשי"ן, וכך תלת הפך לשלש.

מדוע מתרחשים מעתקים שכאלה? למשל, החליפה ה-f את ה-p בשפות הגרמניות? קשה לדעת בוודאות, כמובן: מדובר בתהליכים שהתרחשו בעבר הרחוק במסגרת התפתחותן הטבעית של השפות לאורך השנים. סביר להניח שמקורו של השינוי בדימיון העקרוני שבין הצלילים. כשהוגים בקול את שמות האותיות – "P", "F" – הן נשמעות שונות למדי זו מזו, אך אם הוגים בקול את הצלילים שאותן אותיות מייצגות – p, f – אפשר להבחין בקלות בדימיון ביניהם. בצליל p האוויר נחסם בשפתיים, וב-f הוא חופשי לעבור דרכן – אך הצליל העקרוני זהה.

זיהוי המעתקים הוביל את גרים למסקנה חשובה.

“And what he realized is that these words all came from the same source, but the sound had shifted. He put two and two together, and said – at some point in the distant past, the early Germanic speakers, back when it was one common language, they had a sound shift.”

במילים אחרות, גרים הבין שמעתקי ההגאים הם האחראים להבדלים בין מילים קיימות בסנסקריט, פרסית, לטינית, יוונית וכל שאר השפות שהן צאצאיות של השפה האינדו-אירופית שחשף וויליאם ג'ונס. הוא הגיע למסקנה שבשלב מסוים, אי שם בערפילי הזמן, התפצלו דוברי השפה האינדו-אירופית למספר קבוצות שהתיישבו באזורים גיאוגרפים שונים. אחת מאותן קבוצות, למשל, החלה להגות את הצליל p כ-f, והיא הקבוצה שממנה התפתחו בסופו של דבר השפות הגרמניות. קבוצה אחרת, שממנה צמחה השפה הלטינית, שמרה על הצליל p המקורי.
שחזור השפה האינדו-אירופאית

מהי חשיבותו של חוק גרים? ובכן, הבה נחזור לאנלוגיה המשטרתית. דמיינו לעצמכם שאתם בלשים המנסים לפענח פשע של גניבת מכונית. המכונית המקורית, הגנובה, פורקה זה מכבר ואיננה עוד. לפניכם עומדות שלוש מכוניות שונות, ואתם חושדים שהפושעים פירקו חלקים מהמכונית הגנובה והתקינו אותם במכוניות האלה. איך תוכלו לדעת כיצד נראתה המכונית המקורית? ובכן, אם אתם אפשר לזהות אילו חלקים הוחלפו במכוניות הקיימות, ניתן לשחזר מהם את המכונית המקורית. למשל, אם אתם יודעים שבמכונית אחת הוחלפו הדלתות, במכונית השניה הוחלפו הפנסים ובשלישית הצמיגים – אזי אתם יודעים איך נראו הדלתות, הפנסים והצמיגים במכונית המקורית….

"This is where other linguists took Grimm’s work, and applied it in reverse.”

דהיינו, חוק גרים, שמגדיר במדויק את השינויים שהתרחשו במילים לאורך השנים, מאפשר לנו לבצע תהליך של הנדסה-לאחור גם על מילים.

החוכמה היא לקחת כמה שיותר מילים קיימות בשפות שונות, צאצאיות ידועות של מילה משותפת אחת ויחידה בשפה האינדו-אירופאית, ולבצע בהן את ההנדסה לאחור שמגדיר חוק גרים: דהיינו, להחזיר את ה-f ל-p, את ה-t ל-d, את ה-h ל-c, וכך לקבל את המילה המקורית.

“Of course, there’s no way to know if that’s how the words sounded like, but – beyond the work that Grimm did, other linguists did the same work within the other language families. So, within Latin, they were able to identify specific sound changes there as well.
So what they were able to do was to take words within Latin and Greek and other language families and they were able to reverse engineer those words as well, applying the sound change rules in reverse. And if you take the sound changes within the Germanic languages, and do the same thing in Latin and Greek – what they discovered was that in many instances they ended up with the same word. The word was virtually identical in all those different languages.”

כיוון שהשפה האינדו-אירופית התפתחה לשפות שונות ומרובות – מפרסית וסנסקריט ועד ללטינית ולגרמנית – החוקרים ביצעו אותה הנדסה לאחור על מספר רב של מילים בעלות משמעות זהה. ואם לאחר ההנדסה-לאחור של מעתקים במילים בשפות השונות התקבלה שוב ושוב אותה המילה – סימן שזו המילה המקורית בשפה האינדו-אירופית. למשל, אם לוקחים המילה האנגלית Sister, את המילה הלטינית Soror, את המילה הסנסקריט svasar ואת האירנית xanhar – שלכולן אותה המשמעות, 'אחות', ומפעילים עליהן במהופך את חוקי ההעתקה המתאימים לכל שפה, מקבלים בסיכומו של דבר את אותה המילה: swesor, וזו המילה ל'אחות' בשפה האינדואירופאית.

באופן זה הצליחו החוקרים לעשות משהו שממבט ראשון נשמע כמעט בלתי אפשרי: הם הצליחו לשחזר מילים בשפה שנעלמה לפני יותר מארבעת אלפים שנים, ומעולם לא הועלתה על הכתב.
למשל:

oxen (שור) – uks-en
mother – mater
apple – abel
seven – septm
one – oinos

ובאופן זה שוחזרו במידה כזו או אחרת של ודאות יותר מאלף מילים בשפה האינדו-אירופאית. ההישג הכביר הזה – שחזור שפה עתיקה ממילים קיימות – הוא לכשעצמו מדהים ומעורר השתאות, אבל הוא הופך להיות מרשים אף יותר כשמתבררות ההשלכות לתגלית זו. השלכות אלה יעמדו במרכז הפרק הבא. אנחנו נדבר על האופן שבו הצליחו החוקרים לשלב רמזים ועדויות משלוש דיסיפלינות מדעיות שונות מאד זו מזו – הבלשנות, הארכיאולוגיה והגנטיקה – כדי לשרטט תמונה מפורטת ומרתקת על תרבותם ואורחות חייהם של דוברי השפה האינדו-אירופאית. בנוסף, נענה על מספר שאלות מסקרנות אחרות: למשל, כיצד תרמה מוטציה גנטית אקראית לעובדה שמחצית מאוכלוסיית העולם מדברת כיום בשפות מהמשפחה האינדו-אירופאית, והאם יש קשר בין השפות השמיות – עברית וערבית, למשל – לשפות האינדו-אירופאיות?… כל זאת ועוד, בחלק הבא.
חלק ב' – על גנטיקה ובלשנות

פעם, לפני שנים רבות, טיילתי ביוון. אינני מבין מילה ביוונית ורוב המקומיים שפגשתי לא דיברו אנגלית. מחסום השפה העצים את תחושות הניכור והזרות שתיירים רבים חווים במקומות חדשים, למרות שהיוונים עצמם היו לבביים למדי. אבל אז, כשהתיישבתי במסעדה קטנה והזמנתי סופלקי, ראיתי משהו שהסיר חלק מהתחושות הללו. על הקיר, מאחורי הקופה, היה שלט ועליו רשום ביוונית תפריט המסעדה. אינני קורא יוונית – אבל אותיות יווניות אני מכיר מצוין, בזכות לימודי המתמטיקה בתואר הראשון. מראה סדרת האותיות היווניות המסתיימות במספר החזיר אותי בבת אחת אל המשוואות והתרגילים של ימי הטכניון. וכיוון שגם אז ובטח לא כעת לא הבנתי שום דבר ממה שראיתי, חזרה אלי אותה תחושה נעימה ומוכרת של בורות, ושוב הרגשתי קצת בבית.

מדוע אני מספר לכם זאת? כיוון שבעקבות הדברים שעליהם שוחחנו בפרק הקודם – חשיפת הקשרים שבין שפות שקודם לכן נראו שונות מאד זו מזו – האופן שבו אני, באופן אישי, תופס שפות זרות, השתנה. פרסית, לטינית וסנסקריט תמיד נראו לי זרות ומשונות מאוד ביחס לאנגלית, לצרפתית ולספרדית שאנו נחשפים אליהן בתדירות כמעט יומית. אבל כעת, כשאנו יודעים שמקור כל השפות האלה היא שפה עתיקה יחידה, קל יותר לזהות את המשותף והדומה ביניהן.

בפרק הקודם הכרנו את קווין שטראוד, מגיש הפודקאסט The History of The English Language. אני מאזין מושבע של הפודקאסט, בעיקר בזכות הדרך היצירתית והמקורית שבה קווין נעזר בבלשנות כדי לעורר את ההיסטוריה של השפה האנגלית (ובדרך, גם של שפות נוספות) לחיים.

“It’s a wonderful way to tell history, and it’s amazing that’s it’s done so rarely. You can discuss ancient events – but when you bring language into it, people become connected to the history. When I tell the story of the Anglo-Saxon tribes – it all sounds tribal and ancient, until you start talking about their language. You start to realize that these are the words that I use every day. I’m using the same words they use and now I know where they came from. So it provides that personal connection that you don’t always get when reading or studying history.”

חזרה קצרה על מה שסיפרתי בפרק הקודם. וויליאם ג'ונס, שופט בריטי בהודו הקולוניאלית במאה ה-18 וחוקר בעל שם בשדה השפות והתרבויות המזרחיות, הבחין בדימיון מפתיע בין הסנסקריט העתיקה והלטינית האירופאית. דימיון זה הוביל אותו למסקנה שמקורן של הפרסית, הסנסקריט, האנגלית, הצרפתית וכמעט כל שאר השפות האירופיות השונות הוא בשפה קדומה משותפת בשם 'פרוטו-אינדו-אירופאית', או 'אינדו-אירופאית' בקיצור. למעשה, כמחצית מאוכלוסיית העולם מדברת בשפות שמקורן בשפה האינדו-אירופאית.

“Just about every European language. It’s easier to say which European languages are not part of that family. From Russian to French to English and Dutch, it’s all part of that family. There are a few exceptions: The Basque language of northern Spain, the language of Hungary is not considered to be Indo-European, and a few languages in northern Europe. Also the many languages of northern and central India. The languages of Iran, Afghanistan – those are descended from ancient Persian. … All of those languages came from the same source.”

גילוי זה התרחש בד בבד עם תחושות לאומניות סוחפות שגאו בגרמנים בשלהי המאה ה-18, תחת הכיבוש הצרפתי. גם יעקוב גרים, חצי מהאחים גרים מתהילת אגדות הילדים, הושפע מתחושות לאומניות שכאלה, והקדיש את עצמו לחקירת שורשיהם המשותפים של בני העם הגרמנים. הגרמנים היו אז מפורדים ומחולקים לממלכות קטנות ועצמאיות, והשפה הגרמנית הייתה הגורם הברור ביותר שאיחד את השבטים.

גרים בחן מילים בעלות משמעות זהה בשפות שונות. למשל: Pater הלטינית ו-Father האנגלית. הוא זיהה דפוסים קבועים וחוזרים על עצמם בהבדלים בין המילים. בדוגמא שלנו, שתי המילים Pater/Father דומות מאד זו לזו – פרט לצליל P, שהוחלף באנגלית בצליל F. אותה החלפה, או 'מעתק הגאים', התרחשה במילים נוספות רבות – וגרים זיהה מעתקי הגאים נוספים, כמו החלפה של הצליל T ב-D ועוד. דפוסים קבועים אלה זכו לכינוי 'חוק גרים', על שמו, ובלשנים מאוחרים זיהו מעתקים נוספים גם בשפות אחרות.

זיהוי דפוסים אלה אפשר לחוקרים לעשות את הבלתי-יאמן, ולשחזר יותר מאלף וחמש מאות מילים בשפה האינדו-אירופאית העתיקה, מילים שמעולם לא הועלו על הכתב. הם עשו זאת באמצעות השוואת מילים שיש להם את אותה המשמעות בשפות שונות – והפעלת חוק גרים עליהם, במהופך: דהיינו, במקומות שבהם ה-P הפכה ל-F, מחזירים את הגלגל לאחור והופכים את ה-F ל-P. אם מילים שונות בשפות שונות, לאחר הגלגול לאחור, מתכנסות לאותה מילה – אזי סביר להניח שכך נשמעה המילה המקורית בשפה האינדו-אירופאית, המילה שהיא אימן המקורית של כל אותן ואריאציות מודרניות. הדבר דומה לארבעה טורים של נמלים: אם עוקבים אחר ארבעת הטורים, וכל הארבעה מתכנסים לבסוף לאותו החור בקיר – המסקנה המתבקשת היא ששם נמצא קן הנמלים.
תרבותם של האינדו-אירופאים

לצד עדויות ארכיאולוגיות ואחרות, המילים שנחשפו, או נכון יותר לומר 'הונדסו לאחור' בעקבות עבודתו של יעקוב גרים, פתחו צוהר נדיר אל חייהם של בני התרבות האינדו-אירופית.

“There was a process by which linguists looked at the words and then compared that to archeological evidence and other known historical accounts. And they tried to piece it together – and what they found is that the pieces do fit together if you look very closely.”

הבה נכנס לעובי הקורה, ונגלה מה יכולה ללמד אותנו שפתם של האינדו-אירופאים על אורחות חייהם ותרבותם. השאלה הראשונה והבסיסית היא – היכן חיו? השפות- הצאצאיות של השפה האינדו-אירופית משתרעות על פני אזור נרחב באופן יוצא דופן: מחוג הקוטב הצפוני בנורבגיה ובשוודיה, ועד העמקים הלחים של מרכז הודו. האם חיו האינדו-אירופים באירופה ואז נדדו דרומה, או אולי להפך?

“There were words within the language for cows and sheep and horses, but there were no words for exotic animals. No words for animals from the Arctic, no words for animals from the Mediterranean. The same thing for plants: birch trees, elm trees – a lot of plants you’ll find in moderate climates, but no words for plants you’d find in the Mediterranean or further south.”

כפי שמציין שטראוד, העובדה שלאינדו-אירופאים היו מילים לכבשים ולפרות – כבשה הייתה והטרופיים מלמדת אותנו שהם לא חיו באזורים האלה. באותו האופן שבו אפשר למצוא בתנ"ך ארנבת ואריה – אבל לא פינגווינים, שאבותינו לא פגשו מימיהם. לאינדו-אירופים לא היו מילים לזיתים ולענבים, שני גידולים נפוצים במזרח התיכון – אך הייתה להם מילה משלהם לשלג, עובדות המרמזות על כך שחיו צפונה מהמזרח התיכון ומהאזורים הטרופיים. בנוסף, השפה האינדו-אירופית גם מאפשרת לנו לתחום את אזור המחיה של דובריה בכיוון מזרח.

“They had words for Honey Bee, and Mead and Honey. And honey bees only lived in certain parts of Europe: basically in the area west of the Urals. So as you put all those pieces together, you can narrow the scope to a certain region.”

שקלול העדויות הבלשניות והארכיאולוגיות מעלה כי האינדו-אירופים חיו, ככל הנראה, בערבות רחבות הידיים שמצפון לים השחור ולים הכספי, באזור שהוא היום אוקראינה ודרום רוסיה – אותן ערבות יורו-אסיה שמאוחר יותר היו ביתם של המונגולים, ומשם יצאו למסע הכיבוש הגדול תחת הנהגתו של ג'ינגס חאן.

המילים הידועות לנו בשפה האינדו-אירופאית – לדוגמא, אריגה (webh) ותפירה (syuh) – מספרות לנו גם מתי חיו בני תרבות זו.

“They have references to weaving and sewing – and that implies that there were sheep that had wool that was long enough for that purpose. Archaeologists know that European sheep didn’t have wool long enough when they were introduced. They have a sense of when sheep were introduced, and how long did it take for the wool to grow. So, these random pieces of knowledge get thrown into the pot.”

גם העובדה שהיו בשפה מילים המתארות מרכבות ורכיבה על סוסים, מציבה חסם תחתון לתיארוך שכן עד שנת 4500 לפנה"ס הספירה בערך, טכנולוגיות אלה לא היו בנמצא. את החסם העליון ניתן להציב בנקודה שבה החלה השפה האינדו-אירופאית להתפצל לשפות שהתפתחו בהמשך לשפות שאנו מכירים כיום.

“Beyond that point, we start to see the emergence of the first daughter languages, the first branches of this family start to become distinct. The Hittite language in Anatolia is generally considered to be an Indo-European language, and it’s in existence around 2000 BC. The Mycenaean Greek language, it’s in place around 1700-1800 BC. Sanskrit pops up shortly after that. They know that by that point the ancient language started to fracture to the various daughter languages that came later.”

החישובים האלה תוחמים את ימי התרבות האינדו-אירופאית בין 4500 לפנה"ס ועד 2500 לפנה"ס לערך. חשוב לציין שאלו הערכות מקורבות בלבד, כמובן, ושלא כל המומחים מסכימים על הפרטים וההשערות – אך זהו הקונצנזוס הכללי.

מה עוד אנחנו למדים על האינדו-אירופים מתוך שפתם? ובכן, המילים 'כבשה', 'עגל', 'צמר', 'פרה' ו'שור' מגלות לנו שהם החזיקו בבעלי חיים מבויתים וניצלו אותם לצרכיהם. גם כלבים היו להם: המילה kwon היא פרוטו-אינדו-אירופית ל'כלב', והיא המקור למילה הלועזית Canine – כלבי. היו להם מילים למחרשה, לתלם ולמטחנה ההופכת גרעינים לקמח – ומכאן שהיו בעלי מכישורים חקלאיים. הם חיו במבנים שאותם כינו domo, מילה שהתגלגלה אל האנגלית כ- domestic, 'ביתי'. באופן כללי, לאינדו-אירופים היו מילים רבות יותר המתארות בעלי חיים מסוגים שונים – מבוייתים ולא-מבוייתים – מאשר מילים המתארות צמחים וגידולים חקלאיים, עובדה המרמזת על כך שכלכלתם התבססה על רעיית עדרים וציד יותר מאשר על חקלאות.

השפה גם יכולה לגלות לנו דבר או שניים על המבנה החברתי שלהם. לאינדו-אירופאים היו מילים רבות לתיאור בני משפחה זכרים. למשל, pater ל'אב' ו- nepot מילה המתארת כל צאצא זכר שאינו הבן הישיר: זהו המקור למילה nephew, אחיין, ולביטוי נפוטיזם כסוג של פרוטקציה על רקע משפחתי. ריבוי המילים לתיאור קרבה משפחתית של זכרים, לעומת מיעוט מילים דומות לתיאור בני משפחה נשיים – מלמדת אותנו שמדובר היה בחברה פטריאלכית, שבה זכויות ורכוש עברו מאב לבניו והכלה עברה לגור עם משפחתו של החתן.

מאפיין מרתק נוסף של חברה עתיקה זו אפשר ללמוד ממילה בעלת אופי ייחודי, והיא המילה האינדו-אירופית ghosti. באנגלית מודרנית, בדומה לעברית, המילים 'אורח' ו'מארח' הן שתי מילים נפרדות בעלות משמעויות שונות וברורות: 'host ' הוא מישהו שמכניס מישהו לביתו, ו-guest הוא האדם המתארח. זו חלוקת התפקידים ברורה במערכת היחסים שבין האורח והמארח. אך שתי המילים הללו, host ו-guest, מגיעות אלינו מהמילה האינדו-אירופאית ל-ghosti שבה הצליל g עבר מעתק הגאים ל-h ברבות הזמן. ל-ghosti, אם כן, יש משמעות כפולה: היא מציינת 'אורח' וגם 'מארח'.
העובדה של-ghosti משמעות כפולה שכזו מלמדת אותנו שבחברה האינדו-אירופאית הנוודית, שבה שבטים נודדים פגשו זה את זה לעתים תכופות וחדרו זה לשטחיו של זה, המארח של היום יכול להיות האורח של מחר – ועל כן סביר להניח לאירוח הייתה חשיבות מיוחדת בחברה זו. המילה ghosti היא גם המקור למילים המודרניות hospital ו-hotel בעלי משמעות של אירוח. מצד שני, היא גם המקור למילה hostile , מה שאומר שאורחים אינם חייבים להיות ידידותיים.
אלו נגיעות על קצה המזלג ממה שחשפו החוקרים על בני תרבות עתיקה זו משפתם.
סוד הצלחתם של בני היאמנה

העדויות הבלשניות מלמדות אותנו, אם כן, שהאינדו-אירופאים חיו לפני כ-6000 שנה חיו בערבות העשב הנרחבות של יורו-אסיה. אבל הם לא בני האדם היחידים, כמובן. אירופה כבר הייתה מיושבת על ידי חקלאים שהגיעו אליה מאזור המזרח התיכון. במסופטמיה החלו צומחות ציוויליזציות עירוניות, שעתידות להוליד כמה מהאימפריות הגדולות שידע העולם, משומר ועד אשור. מדוע היו אלה דווקא האינדו-אירופים שזכו לכך ששפתם תתפשט על פני אזורים נרחבים כל כך, מאירופה ועד הודו?

רמז ראשון לחידה זו אפשר למצוא, כמובן, בשפתם.

“There’s a lot of mystery here, but there are clues in the language. The references to certain technologies: wagons, wheels, they have lots of words related to horses and horse riding. So we know they were herders, nomads. They didn’t build cities and stay fixed in one place.”

האינדו-אירופים, אם כן, החזיקו בטכנולוגיות מתקדמות יחסית לזמנם. המילה ekwos בשפה האינדו-אירופאית פרושה 'סוס', והיא המקור למילה המודרנית Equestrian, שפירושה פעילות הקשורה לרכיבה על סוסים. רכיבה על סוסים ורתימתם לעגלות הייתה ה'ההיי-טק' של ראשית תקופה הברונזה ולא הייתה מוכרת לחקלאים האירופים, למשל. היא איפשרה לאינדו-אירופים להיות ניידים באופן יוצא דופן לתקופתם, להשתחרר מהצורך להיות קרובים למקורות מים ומזון באופן תמידי, ולעבור במסעותיהם אזורים נרחבים. אבל היכולת לרכב על סוסים לא הייתה היתרון היחידי שלהם.

העדויות הארכיאולוגיות מאותה תקופה מוקדמת של ההיסטוריה האנושית אינן רבות. את רוב המידע המוקדם שבידיהם אספו החוקרים מתילי קבורה עתיקים שנתגלו באירופה ובערבות האירו-אסייתיות, שזכו לשם 'קברי קורגאן' Kurgan Graves. קברים אלה הם אחד המאפיינים המוכרים ביותר של תרבות עתיקה שזכתה לשם 'בני הימנה'Yamna People . בני הימנה היו נוודים שחיו בערבות אירו-אסיה בסביבות שנת 4500 לפני הספירה, ונחשבו בעיני רבים כמועמדים המבטיחים להיות אלה שדיברו בשפה האינדו-אירופית הקדומה. אבל כיוון שבני הימנה היו נוודים, והעדויות הכמעט יחידות לקיומם הם אותם עשרות בודדות של קברים – התקשו החוקרים להוכיח את ההשערה.

לפני כשלושים שנה, הופיעה לפתע טכנולוגיה חדשה ומהפכנית שנתנה בידי המדענים כלי חדש ורב עוצמה בחקר ההיסטוריה. הטכנולוגיה הזו היא 'השעון המולקולורי', שהוקדשו לה שני פרקים של "עושים היסטוריה" לפני מספר חודשים. טכניקת השעון המולקולורי מאפשרת לזהות מוטציות מסוימות בדנ"א, ובעזרתן לצייר אילן יוחסין של אוכלוסיות שלמות.
בשנת 2015 התפרסם מחקר גנטי של חוקרים מאוניברסיטת הארווארד שבארה"ב. הם ניתחו דנ"א של כמאה שלדים שנמצאו באירופה ובערבות הדשא של אירו-אסיה, משנת 8000 לפנה"ס ועד כ-3500 שנה לפנה"ס, חלקם הגדול בקברי הקורגן שתיארתי קודם. תוצאות המחקר הראו בוודאות גבוהה כי בסביבות שנת 2500 לפנה"ס, פרצו לפתע בני הימנה מערבות העשב האסייתיות, כבשו בסערה את צפונה של אירופה ומרכזה והפיצו את הדנ"א שלהם בקרב האוכלוסייה המקומית. עדות גנטית זו מתיישבת עם העדויות הבלשניות, לפיהן גם השפה האינדו-אירופית החלה להתפצל לשפות האירופאיות השונות בסביבות 2500 שנים לפנה"ס – ומכאן שיש סבירות גבוהה מאוד שבני הימנה הם אכן האינדו-אירופים הקדומים.

אך התגליות הגנטיות מעלות שאלה מסקרנת אחרת. בשנת 2500 לפנה"ס כבר הייתה אירופה, כאמור, מיושבת בידי אחרים: אוכלוסייה שהגיעה מאזור המזרח התיכון בזמנים קדומים יותר. כיצד ייתכן שההשתלטות הימנאית על אותה אוכלוסייה קיימת הייתה מהירה כל כך? גם כאן מציעה הגנטיקה תשובה, ואפילו תשובה מפתיעה למדי.

בשפה האינדו-אירופית קיימות לא מעט מילים הקשורות בחלב ובמוצריו, ואנו גם יודעים שהם גידלו בעלי חיים מבוייתים כגון פרות וכבשים. מכאן שחלב וגבינות תפסו, ככל הנראה, מקום חשוב בתזונתם של בני הימנה. עם זאת, יכולת בני אדם לעכל חלב שמופק מן החי אינה מובנת מאליה.

“One of the pieces of evidence has to do with Genetics. It appears that these people, having relied upon animal domestication, they begun to rely on the milk and dairy products of these animals. That could not have happened if they didn’t acquired tolerance to Lactose.”

לקטוז, או 'סוכר החלב' בשמה השני, היא מולקולה נפוצה בחלב שמפיקים יונקים כגון, פרות וכבשים. לתינוקות וצעירים יש אנזים המסוגל לפרק לקטוז – אך שכיחות האנזים יורדת עם הגיל. בקרב בני אדם בוגרים, יש אנשים שמסוגלים לפרק את הלקטוז ולעכל את החלב – וכאלה שאינם מסוגלים. היכולת לפרק לקטוז בגיל מבוגר, כך מסתבר, היא תוצאה של מוטציה אקראית שאירעה בקרב בני הימנה בערך באותה התקופה, כארבעת אלפים שנים לפנה"ס.

“Today many people are tolerant to Lactose, but if we go back to this period – almost everybody was intolerant to Lactose. You couldn’t have digested milk and cheese beyond children. Genetics discovered that within this same region, among the same people, there was an evolution that allowed them to become Lactose tolerant in adulthood.
It is believed that this was a contributing factor, because now they didn’t have to kill animals for meat – they could live of the milk and dairy. They also believe that this allowed them to become bigger and larger. These people had particular burial sites called ‘Kurgan Burials’. [The archaeologists] noticed that people buried in those graves are several inches taller than other people. They were living a healthier lifestyle. They had a healthy diet.
They were expanding into areas where people were hunter-gatherers. It didn’t take much of an advantage for them to overwhelm the people they encountered during that time.”

במילים אחרות, נדמה שבני היאמנה – דוברי השפה הפרוטו-אינדו-אירופאית הצעירה – נהנו ממוטציה אקראית שהעניקה להם יתרון אדיר על פני שכניהם: היכולת לעכל חלב וגבינה גם בגיל מבוגר. התזונה הטובה חיזקה אותם, ולצד היתרון הטכנולוגי של היכולת לרכב על סוס, איש עמד בדרכם. הם השתלטו וכבשו שטחים נרחבים, דחקו את רגליהם של בני האדם חסרי הסוסים והמוטציה, וכך נסללה הדרך להתפשטות שפתם לכל אורכה של יבשת אירופה ורוחבה במערב, הודו ואיראן שבמזרח – ומאוחר יותר, הרבה מעבר לכך.

“Then you have to consider that through colonialism and expansion those languages have continued [to spread]. You can view the colonization of north and south america as a later Indo-European expansion. English, French, Spanish, Portuguese – those languages are now the dominant languages in the Americas. You end up with about half the population of the world speaking Indo-European […] We might not be done with this expansion – it may be still on going.”

אם כן, אם מודדים 'הצלחה' במונחים של שפה ותרבות – ייתכן ובני הימנה הם אחת הקבוצות המצליחות ביותר בהיסטוריה האנושית. מי יודע, אולי ביום מן הימים יכבשו הימנה את הגלקסיה כולה… ואגב, בזמן ההתפשטות המהירה, קבוצה אחת בלבד של אנשים התנגדו לבני הימנה, ועמדו בפני קומתם המרשימה וסוסיהם המהירים.

“Where they hit their limit is when they hit Mesopotamia and the near-east [who had cities.] It is believed that this is why the languages stopped at the point. In those areas you have a different language family – the semitic language family. Once there was a civilization in place, the advantages they might have had in Europe and Northern-India where kind of limited.”

העובדה שחומות הערים הגדולות שצמחו בין הפרת והחידקל, באזור שהוא היום עיראק וסוריה, בלמו גם את התפשטותה של השפה האינדו-אירופאית, העלתה בראשי שאלה מסקרנת. אנחנו, יהודים וערבים, מדברים בשפות השייכות למשפחת השפות השמיות. האם ישנו קשר בין השפות השמיות לשפות האינדו-אירופאיות? דהיינו, האם הייתה אפילו תרבות מוקדמת יותר לתרבות בני היאמנה, ששפתם התפצלה ברבות הימים לשפה האינדו-אירופית ולשפה השמית המוקדמת? ובכן, מסתבר שאני לא כזה מקורי כמו שחשבתי.

“This is a question I get asked quite often. At this point, there isn’t really anything definitive, but we know that languages don’t appear out of nowhere – they evolve over time. They come from somewhere. There’s a general agreement that there was an older language that preceded the Indo-European language.
Another expert in this field is John McWhorter, who wrote several books about the history of English. Scholars noticed that there are a lot of words in the Germanic languages that don’t come from Indo-European, such as ‘sheep’. John Mcwhorter argues that these words may have come from a Semitic language. He thinks that during the time the Phoenicians were expending around the Mediterranean, maybe a group of speakers migrated into Europe and settled in northern European. He claims that he identified links between these words and Semitics words. It’s his view and it’s not generally accepted in the linguistic community, but he is very much on the cutting edge. I’m fascinated to see where this research goes, because it could show that a core of the Germanic languages might have a Semitic root if we look close enough.”

ההשערה הזו, בדבר הקשר האפשרית שאולי קיים בין השפות השמיות והשפות האינדו-אירופאית, מחזיר אותנו סיבוב שלם אל המחשבות שפתחו את הפרק. כולנו יודעים שבני האדם חולקים, בסופו של דבר, דנ"א דומה: השונות בין הגנים האינדיבידואלים של כל אחד מאיתנו הם כאין וכאפס לעומת הדימיון העקרוני ביניהם. אבל גנים אי אפשר לראות, וקוד הגנטי בולט הרבה פחות לעין משאר מאפיינים גופניים: גוום העור, עובי שפתיים, צבע העיניים וכדומה. שפה, לעומת זאת, היא משהו ברור ובולט מאוד – ולמרות שבשמיעה ראשונה נדמה שאין קשר רב בין פרסית, להודית ולאנגלית, עכשיו אנחנו יודעים לומר שלא רק שיש ביניהן דימיון רב, הם גם שפות-אחיות, צאצאיה של שפה אחת מקורית. מצויידים בידע חדש זה, ייתכן ובפעם הבא ונתהלך ברחובותיה של הודו – או מי יודע, ברחובותיה של טהרן – לא נרגיש כל כך זרים ושונים.

https://www.ranlevi.com/texts/indo_eurpean_language/