כיצד כולנו הולכים ללמד את גוגל לקרוא

גוגל הכריזה על רכישת השירות ר-קפצ'ה.

המשמעות של זה היא שגוגל תאסוף מידע שיאפשר לה ליצור אלגוריתמים סטטיסטיים מתקדמים לזיהוי תווים.

כתבתי על זה עוד בבלוג שלי, אתם מוזמנים להכנס ולקרוא:

"על הרכישה של גוגל את ר-קפצ'ה"

קבוצת דיון לישראלים המשתמשים ב-R

עמיתי למקצוע, יונתן רוזנבלט, הקים באחרונה קבוצת דיון בגוגל עבור ישראלים המשתמשים בתוכנה הסטטיסטית, קוד פתוח, R (הנה הסבר מרחב על What is R). הקישור לקבוצה הוא:

http://groups.google.com/group/israel-r-user-group

להתראות שם 🙂

מאגר נתונים כולל על האינטרנט בישראל – יוזמה חדשה ומרגשת

איגוד האינטרנט הישראלי רוצה להקים ולנהל מאגר נתונים על האינטרנט בישראל. אלו הם חדשות מרגשות, לא רק עבור סטטיסטיקאים אלא לכל מי שהוא "אוהב אינטרנט".

מאגר מידע על "האינטרנט בישראל" (שמיד נפרוט מה דבר כזה יכול להכיל), הוא מה שדרוש לנו כדי לדעת מה מצבנו וכדי לקבל פעולות לאן להמשיך הלאה.

כשמאגר כזה יוקם – יהיה מעניין מאד לדעת כמה אנשים משתמשים באינטרנט, מהי רמת הידע שלהם, מהם קצבי התעבורה, מהם הרגלי הצריכה של אנשים באינטרנט, באיזה מגמות ניתן להבחין ועוד ועוד. מידע כזה יאפשר לממשלה, לגופים עיסקיים ולאנשים בעלי יוזמות למען הקהילה – לדעת טוב יותר איפה להשקיע משאבים וכיצד להתקדם למקום טוב יותר.

כבר קיום הרבה גופים אוספים מידע מסוג זה, אך המידע לא מאורגן במקום מאוחד שיאפשר לנו להגיע אליו ולחקור אותו כדי לגלות תובנות.

לפרטים נוספים, אני מעתיק בזאת את הטקסט שהופץ על ידי איגוד האינטרנט הישראלי:

* * * * * *

איגוד האינטרנט הישראלי: בקרוב – מאגר נתונים כולל על האינטרנט בישראל

איגוד האינטרנט הישראלי מתחיל בתהליך הקמת מאגר נתונים על האינטרנט בישראל. המאגר יכיל נתונים גולמיים שיתעדכנו אחת לתקופה, אודות מגוון מימדים הקשורים לאינטרנט. בין הנתונים הצפויים להופיע במאגר: נושאים טכניים, דוגמת תשתיות פיזיות ותקשורת – רוחבי פס, נפחי תעבורה, שיטות חיבור בבתי אב, עסקים, סקטורים שונים, נתונים הכרוכים בממשל מקוון – שימוש באינטרנט לצורך מתן שירות לאזרח, מעורבות בתהליך קבלת החלטות (Netizenship) והחברה האזרחית – השימוש באינטרנט בחברה האזרחית, התנדבות ברשת, תוכן קהילתי והשימוש באינטרנט בקהילות וירטואליות.

המאגר יכלול גם נתונים בעלי גוון חברתי ועסקי, דוגמת נתוני הפער הדיגיטאלי ואף שימוש באינטרנט בעסקים – היקפי מסחר אלקטרוני ושיווק ופרסום באמצעות האינטרנט. נתונים נוספים שיכיל המאגר הנם כאלו שיתקבלו ממדידות ישירות שמבצע האיגוד, כגון מידע ציבורי על תעבורת ה-IIX, מספרי שמות מתחם תחת ה ccTLD .il , וסקרים אחרים שהאיגוד יבצע במישרין או באמצעות קבלני משנה.

עם השלמתו של המהלך יעמיד האיגוד את המאגר לרשות חוקרי אקדמיה, אנשי עסקים, מקבלי החלטות וכלל הציבור.

כצעד ראשון להקמת המאגר, יצא האיגוד בבקשה לקבלת מידע בנושא, מתוך מטרה לקרוא לבעלי עניין, המחזיקים בנתונים בנושא, מובילי דעת פוטנציאלים בתחום הערכת ומדידת האינטרנט ושותפים נוספים לקחת חלק בפרויקט.

לדברי רימון לוי, נשיא האיגוד, "השימוש הנרחב באינטרנט החל בשני העשורים האחרונים בלבד, ולכן תחום מדידת השימוש באינטרנט עוד בחיתוליו. המאגר יכלול נתונים מסקרים בינלאומיים בהם נכללה גם ישראל וכן סקרים שיבצע האיגוד או השותפים; אנו צופים כי הנתונים האיכותיים ביותר יגיעו מגופים בארץ אשר אוספים אותם כחלק מפעילותם השוטפת".

"השלב הקריטי בהקמת מאגר הנתונים הוא יצירת שותפות בין גופים בעלי נתונים ויכולת מדידה, אומר ד"ר ישע סיון, חבר הנהלת האיגוד ויו"ר הוועדה הטכנולוגית האחראית על קידום הפרויקט. "כגוף ניטראלי, יש ביכולתו של האיגוד להוביל את הקמת מאגר הנתונים תוך יצירת שיתוף פעולה בין השחקנים בתחום באופן שיתרום להם ולציבור הרחב. המאגר יאפשר לקבל החלטות על בסיס מידע מהימן ".

למידע נוסף ולהרחבה:
www.isoc.org.il/sts

איגוד האינטרנט הישראלי
השלוחה הישראלית של איגוד האינטרנט הבינלאומי. האיגוד הינו גוף בלתי תלוי הפועל ללא מטרת רווח למען התפתחות והטמעת את פני האינטרנט בארץ ומייצג את ישראל במסגרות בינלאומיות בעלות חשיבות רבה לקביעת עתיד האינטרנט. האיגוד מעורב בנושאים רבים הקשורים לאינטרנט, דוגמת רישום שמות מתחם בסיומת ישראלית, קידום מערכות פתוחות ופרויקטי קוד פתוח, עידוד ותמיכה בקבוצות משימה בנושאי נגישות לבעלי מוגבלויות, הגנה על ילדים מתכנים פוגעניים ברשת, ואינטרנט לגיל השלישי. כמו כן מפעיל האיגוד את משרד ה-W3C הישראלי. נשיא האיגוד: רימון לוי. אתר אינטרנט: http://www.isoc.org.il

עידכון: בינתיים האתר עלה לאוויר כאן.

לראות עד כמה החדשות לא מראות לנו

אליסה מילר הרצתה בטד (פחות מ- 4:30 דקות), והציגה את מפת העולם, לפי כמות הדקות של סיקור תקשורתי שכל מדינה קיבלה.
רק כ- 12% מזמן החדשות של ערוצים בארה"ב מוקדש לחדשות מהעולם. ערוצי החדשות בארה"ב הורידו ב- 50% את המחלקות של חדשות החוץ.
אלו, ועוד ערימה של מספרים, מוצגים בדרך וויזיואלית שמעבירה היטב את השאלה: האם התקשורת יוצרת את "ידע-העולם" שהיינו רוצים, בתרבות האמריקאית (שמתגאה בהיותה החזקה בעולם, ובעלת המודעות הגדולה ביותר ליחסים בינלאומיים).
ובכן, התשובה היא כמובן שלא, אבל מה שמעניין זה ההעברה של התשובה הזו.
צפייה נעימה:

מילה על סקר התמיכה ב- 892. וקליפ על "מהו האינטרנט?/ווב2.0/המכונה ואנו"

תרבות האינטרנט הישראלית קרבה לנקודת צומת מעניינת/מפחידה/מרגשת. באחרונה עבר חוק-סינון-האתרים (892) קריאה ראשונה בכנסת.
ואילו היינו שואלים אחד מ-46 נבחרי הציבור שהצביעו בעד החוק "למה הצבעת כך ?".
ייתכן והוא היה עונה לנו: "כי הסטטיסטיקה אומרת ש 56% מהאוכלוסייה הבוגרת בישראל תומכים בחוק סינון אתרים בעלי תכנים פורנוגרפיים.

ופה אני נכנס ושואל – מה בעצם הסטטיסטיקה הזו אמרה לנו ? האם היא אומרת ש- 56% מהאנשים באוכלוסיה היו רוצים ש- 892 יעבור?
התשובה שלי היא שאני לא יודע. ושגם חברי הכנסת לא יודעים.
בשביל שנבין מהי המשמעות של הסקר, יהיה עלינו לבחון את הסקר בצורה שקולה: להבין איך נבחרו המשיבים, כיצד הם משקפים את שאר מבנה האוכלוסיה, והכי חשוב – להבין מה בעצם הסקר שאל.
הניחוש שלי הוא שהסקר לא שאל "האם אתה רוצה ש- 892 יעבור?" אלא שאל "האם אתה מבין מספיק מה-זה-אינטרנט ?" (מספיק כדי להבין ש- 892 רע לתרבות האינטרנט בישראל, רע לדמוקרטיה ובנוסף לכל גם ייכשל בלהשיג את שהוא מנסה להשיג, אלא אם הוא ישפוך את התינוק עם המים).
והפרשנות שלי לתוצאות הסקר היא שאנשים שמשתמשים באינטרנט (בשביל אימיילים וקצת גלישה), עדיין לא הפנימו את מה שקרה פה בשנים האחרונות.
הסקר הנ"ל, שהעביר ערוץ הכנסת, עוד יקבל אצלי התייחסות מקיפה יותר (אבל לא היום). אך בינתיים:

בשביל האנשים שעוד-לא-הפנימו-מהו-אינטרנט, אני מצרף את הסרטון הבא (ותודה לאופיר כהן על הלינק).
הסרטון הוא באורך של 4:30 דקות, והצפייה בו ריגשה אותי מאד. הקליפ כותב, וממחיש כיצד עוד ועוד צורות חשיבה התפתחו: בדרך שבה אנו עובדים עם טקסט, מציגים טקסט, מקשרים טקסט, כותבים על טקסט, מפיצים טקסט. ובעצם, לא רק טקסט – אלא גם אודיו ווידיאו. ובעצם, לא רק אותם – אלא את עצמנו. והכל מלווה במוזיקת רקע מתאימה. תהנו:

Web 2.0 … The Machine is Us/ing Us