״פרטיות? אין לי מה להסתיר״ – כן יש לכם!

אם הייתי מקבל אגורה על כל פעם שהייתי שומע את המשפט הזה הייתי היום מליארדר.

זה אחד המשפטים הכי נאיבים וחסרי מודעות שבנאדם יכול להגיד בעידן הטכנולוגי שאנו נמצאים בו היום.

אנו נמצאים בתקופה בה חברות רעבות למידע, מידע שמזין מערכות בינה מלאכותיות שונות, מערכת סטטיסטיקה ואין לדעת מה עוד.

כל הבעיה מתחילה באחסון בענן

היום התשתיות המפותחות וזמינות הענן מאפשרות לחברות כמו אפל, אמאזון וגוגל לשמור מידע ללא הגבלה ללא התחשבות יתרה בשטח האחסון והתחזוקה הכרוכה בכך.

זה אומר שבעצם כל הקלטה או כל פיסת מידע שנאגרה עליכם מתועדת לה איפשהו בשרתים של החברה, ואמנם לא אכפת לכם כי ״אין לכם מה להסתיר״ חשוב לזכור שאין לדעת מה יעלה בגורל המידע הזה בעתיד.

יכול להיות שהחברה בעתיד תחליט לפתח ניתוח סטטיסטי על מידע ארכיוני שכולל את המידע שנצבר עליכם, ואין לכם מה לעשות עם זה במידה וזה לא ימצא חן בעיניכם. גרוע מזה, אין מערכת תוכנתית מאובטחת ב- 100% ולכן אין לדעת לאיזה ידיים המידע הזה עלול ליפול.

בנוסף, אם היום לא אכפת לכם לשתף זה לא אומר שבעתיד אתם לא תתחרטו ותשנו את דעתכם, רק שההבדל הוא שכבר לא יהיה לכם מה לעשות. המידע שנשלח לחברות הוא מידע שנמצא במסלול בכיוון אחד. אין חזרה.

תארו לעצמכם מקרה כזה, אתם בני 22, לא רואים כלום בעיניים ולא אכפת לכם מכלום. והוקלטתם לכאורה מדברים בצורה גזענית נגד כהי עור, כאשר הבנאדם שהקשיב להקלטה שלכם הוא לא אחר מאשר השכן שעלול להיעלב מהאמירה שלכם, והוא זיהה את הקול שלכם או פרטים מזהים אחרים שעלולים להיות מוקלטים.

Fast Forward כמה שנים קדימה, אתם בני 29, מחפשים עבודה, עם חליפה ועניבה, ניגשים לחדר הראיון, פותחים את הדלת, והשכן שלכם לשעבר יושב לו שם ממתין לראיין אותכם. אתם לא יודעים שהוקלטתם, הוא יודע.

זה נורמלי וזה טבעי שבאנדם משנה גישה, מחליף דעה או סתם בוחר בדרך חדשה עם חלוף השנים. קחו דוגמא קטנה לזה, הרבה אנשים מעלים תמונה או פוסט לפייסבוק בציערותם, ולאחר כמה שנים הם מחליטים למחוק את הפוסט או את התמונה כי הם מתביישים בה.

נסכם את זה בלומר שאתם לא שמים בגדים כי יש לכם מה להסתיר, אלא כי כל בנאדם, במודע או לא במודע, רוצה לשמור על פרטיותו.

בכלל האם זה הכרחי לאגור את כל המידע הזה?

ניקח לדוגמא את המקרה שהיה עם אפל השבוע שבו דווח על מקרים שבהם עובדי קבלן של אפל הקשיבו להקלטות קריאה לסירי שכנראה היו בטעות ולא בכוונה להעיר את סירי (פקודת ״Hey Siri״).

לכאורה, עובדי קבלן הקשיבו להקלטות האלה וסימנו האם זו הייתה הפעלה מכוונת או הפעלה כתוצאה מטעות או מחוסר הבנה של האייפון. למשל אפשר להגיד את המשפט "Hey Seriously" שתחילתו נשמעת כמו המשפט ״Hey Siri״ וזה כנראה יפעיל את סירי.

אך נשאלת השאלה – הם חובה לנציג אנושי לעבור על ההקלטות ״וללמד״ את המערכת. בשביל זה נצטרך להבין את ההבדל בין מערכות בינה Supervised (מונחית) או Unsupervised (לא מונחית).

הבדל בין מערכת בינה מונחית לבין מערכת בינה לא מונחית

מערכות בינה מונחות הן מערכות בינה שדורשות מישהו ״שילמד״ אותן, למשל מערכות לזיהוי אובייקטים בתמונות, נגיד מערכת שתפקידה להבדיל בין תמונות של חתולים לבין תמונות של כלבים.

במערכת המתוארת, יש צורך ״להראות״ למערכת לפחות אלפי דוגמאות של תמונות כלבים ולהגיד למערכת שזאת תמונה של כלב וכנ״ל לגבי חתולים.

לאחר מכן נרצה לבחון ולאמן את המערכת, ז״א לתת לה תמונה כאשר אנו יודעים שמדובר בתמונה של כלב ולראות מה המערכת תגיד, אם היא תגיד שמדובר בתמונה של כלב אז היישות המלמדת תסמן שהמערכת צדקה, ובמידה ולא היישות המלמדת תסמן שמדובר בטעות. המערכת תלמד מהפידבק בשני המקרים.

וזה החלק המונחה במערכת הנ״ל, יש יישות מלמדת שתפקידה לספק את המידע, לבחון וללמד.

לעומת זאת, דוגמא טובה למערכת לא מונחית היא שואב אבק חכם שלאחר כמה ימים של עבודה מבין שמתחת לספה שלכם יש הרבה אבק, כי הוא פשוט נתקל בזה הרבה פעמים וסביר להניח שפעם הבאה שהוא יתקל בספה יהיה שם אבק.

מקרה כמו של אפל יכול להיות לא מונחה בקלות

בהתחשבות במשאבים האינסופיים שיש לאפל (שלא לדבר על ההתגאות בפרטיות), היינו מצפים לראות קצת יותר השקעה ולפתח מערכת שתחליף את עובדי הקבלן (מערכת מונחית) למערכת לא מונחית.

במקרה הספיציפי הזה היה אפשר להחליף את שיטת העבודה בשיטה אוטומטית, שמטופלת ומעובדת אך ורק במכשיר לוקלית (ללא העברת מידע לשרתי החברה), ללא שום התערבות של נציג אנושי.

חשוב להבין שמערכות עיבוד והבנת קול מבוססות לרוב על Contextual-Understanding – הבנת הקשר. ניקח דוגמא, נגיד ומשתמש אומר את המשפט הבא ״He Seriously messed up" ששוב תחילתו נשמעת כמו "Hey Siri״ והאייפון שלכם עלול להפעיל את סירי בתגובה לזה.

במקרה הנ״ל קל מאוד לפענח את ההקשר ולהבין שלא מדובר בשאלה, וגם שלא מדובר בפקודה כלשהי ומכאן להסיק שמדובר בהפעלה שגויה, ובכך המערכת תבין לבד ותלמד מהמקרה (מערכת בינה לא מונחית).

ניקח דוגמא נוספת, נגיד והמשתמש הפעיל בטעות את סירי (בסגנון דומה לדוגמא הקודמת) והמשפט הכיל משהו שקשור למוצרי גינון, ובאייפון לא תועד שום חיפוש בדפדפן או שאלה נוספת שמופנית לסירי בנושא בשלוש דקות הבאות שלאחר ההפעלה השגויה. אז ניתן להניח שההפעלה הייתה שגויה והמערכת שוב תלמד מזה ותשפר את יכול זיהוי ההפעלה שלה.

אסור לנו להקל ראש בתחום הפרטיות במיוחד עכשיו, בתקופה בה הנושא נהיה יותר פתוח ולחברות קל מתמיד לאגור עלינו מידע. תזכרו – המידע שלכם הוא שלכם בלבד.

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *