פרופ' אורן סופר וד"ר ענת בן דוד

מנתחים את המידע עלינו ברשת, והפעם הרווח כולו שלנו

באוניברסיטה הפתוחה ינסו להתחקות אחר אינפלציית האינפורמציה שאנחנו מייצרים באינטרנט כדי לחקור תופעות חברתיות. "השאלות אותן שאלות, אבל יש כעת כמויות של מידע חדש לנתח"
בכל גלישה שלנו באינטרנט אנחנו מייצרים מידע. מכל אימייל, סטטוס בפייסבוק, חיפוש בגוגל או תמונה באינסטגרם מישהו בצד השני יכול לצרוך עלינו — בחינם — מידע יקר. כמאמר הביטוי השגור ״כשמוצר ניתן לנו בחינם — אנחנו המוצר״, ובמקרה הזה — טרף קל למפרסמים ברשת. נשאלת השאלה מה אנחנו כמשתמשים יכולים להרוויח מכל המידע שמיוצר עלינו? האם וכיצד נוכל להבין באמצעותו טוב יותר את החברה בה אנו חיים, לחזות תופעות חברתיות או אפילו את תוצאות הבחירות?
בחודשים האחרונים מנסה האוניברסיטה הפתוחה לפתח גוף — ראשון מסוגו באקדמיה הישראלית — שיישתמש בכמויות המידע המיוצר ברשת לא כדי לייצר פרסומות ממוקדות יותר, אלא לטובת מחקרים חברתיים שינתחו תהליכים בחברה, קהילות ברשת והתנהגויות אופייניות לגולשים.
״כחוקרים חברתיים השאלות שלנו היו אותן שאלות גם לפני הרשת״, אומרת ד״ר ענת בן דוד, אחת ממקימות מעבדת המדיה באוניברסיטה. ״אבל יש כעת כמויות של מידע חדש לנתח. אנחנו בעולם רווי דאטא וכל הזמן אנחנו מייצרים דאטא על עצמנו וגם חברות מייצרות דאטא עלינו. הרבה מהמידע הזה פתוח ונגיש, אבל צריך כלים דיגיטליים מיוחדים על מנת לנתח אותו, וזה ארגז הכלים שאנחנו נפתח. החוקר יבוא עם שאלת מחקר ויתאימו את הכלי הטכנולוגי עבורו״.
במעבדה שואפים לפתח כמה שיותר כלים דיגיטליים, בהתאם לשאלות מחקריות שיתעוררו, על מנת ללקט ולנתח מידע מהרשת. אלו ישמשו חוקרים וחלקם אף יהיו פתוחים בעתיד לשימוש הציבור הרחב. כבר כיום משתמשים חוקרי המעבדה בכלי ראשוני שנמצא בפיתוח, שתפקידו לנתח טוקבקים מכתבות באינטרנט ומעמודי פייסבוק. החוקר מגדיר את העמודים והכתבות מהן נאסף המידע, ויכול גם לבקש לאסוף מידע לפי נושא או מילת חיפוש. לאחר כריית המידע, התוכנה מבצעת פילוח אוטומטי של התגובות לחיוביות ושליליות, ומציגה מפה סמנטית הקושרת ביניהן ומצביעה על דפוסים חוזרים. ״השלב הראשון הוא לאמן את האלגוריתם לזהות את החיובי והשלילי״, מסביר פרופ׳ אורן סופר, אחד ממנהלי המעבדה ומקימיה, וראש המחלקה לסוציולוגיה, מדע המדינה ותקשורת באוניברסיטה הפתוחה. ״עכשיו האלגוריתם מאומן כבר לגלות גם ציניות, לאחר שבעבר החשיב אותה כתגובה חיובית. כמובן שהזיהוי ישתפר ככל שנבצע יותר חיפושים״.
כלים דומים מופעלים בשנים האחרונות בחברות מסחריות ובמעבדות דומות קמו באירופה ובארה״ב, אך באקדמיה הישראלית השימוש בהם אינו נפוץ. עוד יתרון של הכלים המחקריים שיפותחו במעבדה הוא שהם מותאמים לשפה העברית ולאתרים הבולטים בישראל. עד היום היה קשה לבצע ניתוח טקסטואלי בעברית בכלים הקיימים בחו״ל, שכן אלו הותאמו לשפה האנגלית.
לדעת בן דוד, אנו מצויים כיום במשבר ידע. "עד עכשיו מדעי החברה התעסקו הרבה בסקרים ושאלונים, אבל בבחירות האחרונות חווינו את המשבר, כאשר היה פער עצום בין התחזיות של הסוקרים לבין דעת הקהל כפי שהשתקפה בתוצאות הבחירות". סופר מוסיף כי ״בשונה מחוקרים כמותיים שעובדים על שאלונים ובונים מדגם, במעבדה אפשר לשפוך כמויות עצומות של נתונים ולראות תוצאות שלא מתווכות דרך סקר או מדגם".
באמצעות השימוש בכלי המעבדה, שואפים החוקרים להיות מסוגלים לספק ניתוחים ותחזיות לקראת הבחירות הבאות דרך בחינת תגובות הגולשים לכל מפלגה ופוליטיקאי בזמן אמת. לאחרונה בחנו עמודי פייסבוק של כמה פוליטיקאים, בהם ראש הממשלה בנימין נתניהו, יו"ר יש עתיד יאיר לפיד, יו"ר הבית היהודי נפתלי בנט ויו"ר מרצ זהבה גלאון. לדברי בן דוד, ניתן להצביע על תנודות בדעת הקהל לפי מיפוי התגובות השליליות והחיוביות לפוסטים שהעלו הארבעה בשלושת החודשים האחרונים. ״מה שיוצא דופן בדף של נתניהו זה שלמעלה מ-90% מהתגובות בדף תומכות", היא אומרת. "אז עכשיו אנחנו שואלים למה. האם יש מגיבים ממומנים או אנשים שמוזמנים להגיב בצורה חיובית? הדברים מאוד ראשוניים ובשביל לבדוק יותר לעומק אולי נצטרף לפתח כלי חדש".
 
בן דוד מדגימה כיצד הכלים שיפותחו במעבדה צפויים גם לייעל ולשכלל מחקרים בתחומים רבים אחרים. ״כדי לחקור בעבר, למשל, הטרדת נשים באינטרנט הייתי צריכה להריץ שאלונים, להגיע לנשים, ולשאול אותן האם הוטרדו וכיצד. עכשיו אני יכולה גם לשאוב מידע מהאינטרנט על נשים שהוטרדו, ולא להגיע רק למידע דיווחי", היא אומרת. "נניח שהנחת המחקר שלי היא שנשים מוטרדות בעיקר בדפים של גיימרים — אני אלך לדפים של גיימרים ואוריד את הנתונים מכל הקבוצות האלה. בכמה קליקים את מורידה את כל המידע, והכלי מסדר לך אותו בצורה שאת יכולה להתחיל לעבוד איתה - בגרפים, טבלאות ומפות״.
הרעיון להקמת המעבדה נולד אצל סופר ועמיתיו כאשר עמדו לפני עדכון תוכנית לימודי התקשורת באוניברסיטה. אז התחדדה אצלם ההבנה שלימודי התקשורת המסורתיים, המנתחים את הטלוויזיה, הרדיו והעיתונים, ומתייחסים לאינטרנט כפלטפורמה נוספת, הופכים למיושנים מיום ליום. ״האינטרנט שינה את הדרך בה אנחנו צורכים מידע, מנתחים אותו ומגיבים לאירועים סביבנו", אומר סופר. ״כל המידע כבר נמצא ברשת, והשאיפה היא לעשות שימוש באינפורמציה העצומה הזאת. למעבדה הזו יהיה שימוש מחקרי וגם שימוש חברתי. בהחלט אפשר לעשות בנתונים האלה שימוש גם בדאטא ג׳ורנליזם, למשל".
האוניברסיטה הפתוחה מעוניינת כבר בזמן הקרוב להטמיע בקורסים את כלי המחקר שיפותחו, ובחזונו רואה סופר במעבדה מרכז לשיתוף פעולה בין חוקרים מתחומים שונים. "בעבודה סמינריונית בעידן של מדיה חדשה ניתן יהיה לצוות סטודנטים למדעי המחשב לסטודנטים ממדעי החברה — צד אחד ישאל את השאלה החברתית וצד שני יבנה את הכלים לאיסוף המידע מהרשת במעבדה שלנו", הוא אומר. "אנחנו לוקחים סיכון, שכן ההשקעה היא השקעה שתבוא על חשבון מחקר מדיה מסורתי, אבל זה סיכון מחושב שאני מאמין בו. בעולם כבר יש מעבדות כאלה, אחת המפותחות בהן היא ב-MIT, והשאיפה שלי היא להגיע לשם".
מלבד כלים לניתוח טקסטואלי, מנסים כעת לפתח במעבדה גם כלים לניתוח תמונות ודימויים ויזואליים. ״זה נמצא בשלב ראשוני, מחקרים שביצעתי עדיין השתמשו במילות חיפוש, למשל השוואה בין מילות חיפוש לפי תמונות בגוגל", אומרת בן דוד. "אנחנו מנסים להיכנס לפרויקט שיבחן גם איכויות אסתטיות של תמונה, לאבחן תמונות ולסווג אותן. יש הרבה דרכים לסווג תמונות, כך למשל תיאורטיקן רשת משפיע בשם לב מנוביץ׳ עשה פרויקט בשם ׳סלפי סיטי׳, שאסף תמונות אינסטגרם מחמש ערים שונות, וניתח מאפיינים של התמונות בניסיון לזהות דפוסים״.
בן דוד מזכירה פרויקט של אנתרופולוגים שחוקרים הגירה בבריטניה, בו ייצרו החוקרים מפות קשרים חברתיים לפי תמונות בפייסבוק ולאחר מכן ראיינו את הנערים עליהם התבסס המחקר בניסיון לברר אם הפרטים שהוסקו נכונים. לדבריה, ״יש היום סף מסוים. אם את לא מספיק יודעת לתכנת, יש דברים שלא תוכלי לעשות. אנחנו רוצים להוריד את הסף. שגם מי שלא יודע לתכנת יוכל לשאוב מידע ממקומות שונים ולנתח אותו. השאיפה היא ליצור גרסה אונליין לכל כלי שנפתח למחקר, כדי שסטודנטים וחוקרים שלנו ישתמשו בהם בלי הגבלה״.
 
הכתבה  של ירדן סקופ מ"הארץ" 4.10.2015: http://www.haaretz.co.il/news/education/.premium-1.2743752