טל גלילי

20 היסודות לאינטראקציה עם היצגי נתונים – סיכום הרצאה

ביום רביעי האחרון נתתי הרצאה של 50 דקות בסדנת ויזואליזציה מטעם האיגוד הישראלי לסטטיסטיקה על סוגי הפעולות האפשריות ("היסודות") אשר אפשריים כאשר מבצעים אינטראקציה עם היצגים גרפיים של נתונים (או בלעז: Interactive Data Visualization). בפוסט הנוכחי בכוונתי:

  1. להסביר מה זה אינטראקציה עם היצגי נתונים ולתת את המוטיבציה הסטטיסטית עבורה
  2. לפרט ולהסביר את 20 היסודות לאינטראקציה עם היצגי נתונים
  3. לדבר על ההזדמנויות והאתגרים שמציבים בפנינו היכולת לאינטראקציה עם היצגי נתונים

כל הדוגמאות שיוצגו בפוסט זה יושמו באמצעות התוכנה GGobi (תוכנה חופשית/קוד-פתוח). בפוסט הנוכחי אני לא אדון בתוכנות שמיישמות את העקרונות שיתוארו. אני מקווה לעשות זאת באחד הפוסטים העתידיים. לבינתיים, הנה דמו של 5 דקות על השימוש ב- GGobi (אפשר לקרוא את המשך הפוסט גם מבלי לצפות בו) :

brutally short intro to ggobi from Mat Kelcey on Vimeo.


לפני שאגש לנושא הפוסט, ברצוני להודות ליונתן רוזנבלט על הפידבק שהוא הציע בשלבים הראשונים של הכנת ההרצאה, ובעיקר להודות לפרופסור יואב בנימיני על שעות רבות של עזרה ואינספור עצות מועילות אשר גם עזרו למקד את ההרצאה וגם ליטשו אותה לכדי תוצר הרבה יותר מוצלח משהייתי מסוגל להפיק בכוחות עצמי.

מבוא: מה זה אינטראקציה עם היצגי נתונים?

נתחיל בכמה הגדרות.
היצג נתונים זה תרשים שמטרתו להציג נתונים. דוגמאות מקובלות הן תרשימי עמודה, הסטוגרמה, תרשימי עוגה, תרשימי פיזור, מפות תמתיות וכן הלאה.
היצג נתונים אינטראקטיבי – הוא תרשים שאיננו סטטי, דהיינו שניתן לבצע בו שינוי כלשהו.
אינטראקציה עם היצג נתונים – זה סוג הפעולות שהמשתמש יכול לבצע על היצג נתונים.
במהלך הכנת ההרצאה, הצלחנו (יואב ואנוכי) לאתר כעשרים יסודות המשמשים לאינטראקציות שאפשר לבצע על היצג נתונים אותם אתאר מיד. אך לפני כן אני רוצה להסביר את המוטיבציה הסטטיסטית לעבודה עם גרפים דינאמיים.

סטטיסטיקאים נוהגים לבצע שתי פעולות (משלימות) בעבודתם: ניתוח נתונים מאשש, וניתוח נתונים בלשי. מבלי להעמיק בנושא יותר מידי (כי הוא עולם ומלואו), ברצוני לסכם את שני הסוגים בקצרה:

התחום של אינטראקציה עם היצגי נתונים משוייך באופן מובהק לניתוח נתונים בלשי. ולוקה בכל הייתרונות והחסרונות של שיטה זו (אליהם לא אכנס בפוסט זה).

20 היסודות לאינטראקציה עם היצגי נתונים

את היסודות אירגנתי לפי קבוצות ותתי קבוצות (איכשהו ספרתי וזה יצא 20, למרות שהמספר הזה יכול להיות נתון למחלוקת). אני אציג כאן את כולם עם הסבר קצר ובסוף הרשימה מצורפת פרזנטציה עם צילומי מסך שמדגימים חלק מהעקרונות.

אחת המגבלות בפורמט הכתוב הוא הקושי להעביר מוטיבציה של פעולה זריזה על גרפים. אני מקווה שאת זה יספקו (גם אם באופן חלקי) הסרטונים/מצגת שאצרף בהמשך הפוסט, אשר ידגימו את העקרונות שאתאר.

מצגת וסרטונים להדגמת עקרונות

שקופיות מהמצגת שהוצגה בכנס:

ניתן לצפות בסרטונים על הברשה, וטיולים רב מימדיים בתוך אתר הבית של GGobi (הסרטונים לא הועלו ליוטיוב, אלא מופיעים כקטעי MOV קצרים, ולכן לא יכולתי לשלב אותם בפוסט הנוכחי)

לסיום: הזדמנויות ואתגרים בעבודה אינטראקטיבית עם היצגי נתונים

רגע, אז באיזה תוכנה להשתמש?

את העקרונות שתיארתי אפשר לראות מיושמים בתוכנות שמיועדות לעבודה סטטיסטית כמו GGobi או Mondrian (שתיהן בקוד פתוח), וגם בתוכנות בתשלום כמו JMP ואחרות. מעבר לזה, ניתן לראות שימוש בהרבה מהעקרונות הללו באפליקציות רשת מפורסמות שמאפשרות עבודה דינאמית עם נתונים. הדוגמא הכי מפורסמת לכך הוא האתר גאפמינדר של הנס רוסלינג.

לצערי הרב שתי התוכנות שיש כרגע בקוד פתוח ( GGobi ו- Mondrian), שתיהן בעיני מאד (איך ננסח זאת בעדינות) דלות. כדי להגיע לכלי שהוא באמת מעניין מבחינת תהליך עבודה שוטף, הכלי חייב (לדעתי) להיות קשור אדוקות לכלי העבודה המרכזי שבו אנו משתמשים לניתוח סטטיסטי.
במקרה שלי זה R. ובמקרה של R יקח עוד קצת זמן עד שהחבר'ה בקהילה יתכנתו כזה כלי (יש כרגע 2 נסיונות משמעותיים. הראשון הוא iPlots extreme שהוא דור המשך ל- iPlots והשני הוא איזשהו ממשק ל- Qt על ידי היוצרים של GGobi). כשיהיו לי עוד חדשות מלהיבות, אני אשמח לדווח.

יש לכם דוגמאות נוספות לאינטראקציה עם היצגים גראפיים של נתונים? שאלות או פירגון על הנושא? אתם מוזמנים לשתף אותי בהם בתגובות…

Exit mobile version