הקול כולל הכל: מה אפשר לשמוע בקול שלכם?

מתארח: פרופ' ורד אהרונסון

פרופ' ורד אהרונסון, ראש מכון אפקה לעיבוד שפה, תגלה לנו איך "נשמעת" הקורונה ואיך מאבחנים דיכאון דרך הדיבור. בין לבין היא תסביר לנו האם סירי או אלקסה ועוזרות קוליות אחרות יודעות להבין איך אנחנו מרגישים.
/

מנחה- עידו קינן : אף אחד מאיתנו לא חושב על זה , אבל מסתבר שממש מתחת לאף תרתי משמע עשויה להתפתח שיטה חדשנית במיוחד לאבחון קורונה דרך הקול , פרופסור ורד אהרונסון ראש המכון אפקה לאיבוד שפה שלום

פרופסור אהרונסון שותפה למחקר פורץ דרך בהובלת משרד הביטחון שמטרתו לאבחן את המחלה ששינתה את חיינו בפרק הזה אנחנו נדבר על המחקר המתפתח על האופן שבו עיבוד השפה והקול עשויים להעיד על מצבים רפואיים ונפשיים אחרים , איך מלמדים את סירי ואלכסה לזהות רגשות ואיך גורמים לרובוטים להבין אותנו בני-האדם , פרופסור ורד אהרונסון איך נשמעת קורונה ?

פרופ" ורד אהרונסון : קורונה נשמעת כמו אוסף של פיצ'רים ומאפיינים מתמטיים שמוצאים מתוך הסיגנל הקול והם מלמדים אותנו להפריד בין חולים לבין בריאים , זה סוג של טכנולוגיה שאפשר להשתמש בה לכל מיני עיבודים אחרים אפשר לדוגמה להשתמש בה למחלות אחרות ועוד

מנחה- עידו קינן : ספציפית קורונה נוחה לגילוי בשיטה הזאת מכיוון שקורונה היא מחלה שקשורה למערכת הנשימה

פרופ" ורד אהרונסון :נכון מאוד , הקול האנושי מופק ע"י הרבה מערכות בגוף ולכן הטכנולוגיה הזאת של זיהוי מחלות באמת מתבססת על העובדה ש יש הרבה סטפס יש הרבה צעדים בדרך מהמוח שנותן את הפקודה הפק דיבור למערכות שבסופו של דבר מפיקות את הדיבור לדוגמה הריאות שדוחסות את האוויר במעלה הגרון , מיתרי הקול שרוטטים , הגרון עצמו , הפה , האף , השיניים , כל המערכות האלה בעצם מאפיינים ומפיקים את הקול שאנחנו שומעים ולכן אנחנו מנסים להבין עבור קול שאותו אנחנו קולטים מה קרה בדרך שגרם לבעיה , האם זה בגרון אם זה באף , האם זה בריאות ,  האם זה אולי אפילו במוח , סתם לדוגמה זה יכול להיות בן-אדם שמדבר לא לעניין ויכול להיות שיש לו איזשהו מחלה נוירולוגית או מחלה אחרת שמשפיע על התוכן של הדיבור שלו

מנחה- עידו קינן : אז צריך  Base Lineלפי שבודקים אם חלית במשהו

פרופ" ורד אהרונסון : אפשר גם להשתמש ב Base Line ואפשר גם להשתמש בפשוט הרבה מאוד אנשים שביניהם חלקם יהיו חולים מאוד , חלקם חולים מעט , חלקם חולים אסימפטומטיים , וחלקם בריאים ואנחנו בעצם רואים על פני האוכלוסייה הגדולה הזאת שכמובן היא מאוד מגוונת ולכל תת אוכלוסייה כזאת יש הרבה מאוד מאפיינים עדיין הרעיון שמערכת תדע להפריד בין הקבוצות השונות

מנחה- עידו קינן : איך עובדת מערכת לזיהוי הקורונה שפיתחת ?

פרופ" ורד אהרונסון :     המערכת של הזיהוי קורונה פותחה ע"י קבוצה גדולה של אנשים שהיא חדה יחידות מובחרות בצבא וחברות מסחריות ואנשים מהאקדמיה זה פרויקט לאומי , הדבר מתחיל בפיתוח אפליקציה שתשמש להקלטת הנבדקים , כאשר איננו לא סתם להקליט כל אחד מאיתנו יכול להקליט אצלו בטלפון ובמחשב הרעיון ולבנות פרוטוקול שהאנשים ידברו לפי הפרוטוקול הזה , כאשר הפרוטוקול מטרתו לחלץ מתוך הדיבור את אותם דברים שקשורים למערכת הנשימה כמו העברות שונות , דיבור מאוד מהיר , כמו שיעול או נשימה שגם חלק בתוכה הפקה של הסיגנל הזה שיוצא מהפה שלנו בעודנו מדברים ואת הפרוטוקול הזה ביצעו הנבדקים ואנחנו אחר כך מאבדים את האינפורמציה שמתקבלת

מנחה- עידו קינן : אז בעצם הלכתם לחולי קורונה מאובחנים והקלטתם אותם והשוויתם ובניתם אלגוריתם שמזהה מאפיינים ייחודיים לקורונה ואז התחלתם לנתח קולות זה כאילו היה קבוצת הניסוי

פרופ" ורד אהרונסון : נכון מאוד , אחד הדברים הבאמת מעניינים וקורונה היא לימדה אותנו הרבה דברים בכל תחומי החיים גם כן לימדה אותנו הרבה דברים על הקלטה , כי זה פעם ראשונה , עשינו הרבה מחקרים קודמים לזיהוי מחלות אחרות , נוירולוגיות ואחרות , בכל המחקרים האלה אפשר לקחת מקליט כמו שאנחנו יושבים עכשיו לגשת לנבדק אם מערכת סאונד טובה בחדר שקט ולהקליט אותו , זה יוצא טוב , ההקלטות יוצאות באיכות מצוינת ואנחנו פותרים מלכתחילה הרבה בעיות כאן לרוב הנבדקים האלה לא הייתה הגישה אי אפשר היה לגשת אליהם בבית החולים בוודאי לא וגם לא במלוניות השונות , כן הם היו צריכים להקליט את עצמם ולא זו בלבד והיו צריכים להכיר את עצמם לא בציוד מקצועי , כי אי אפשר היה אפילו להעביר להם את הציוד אלא על הטלפון שלהם וזה אומר שהיו הרבה טלפונים שונים , אנשים לא תמיד הבינו את ההוראות כפי שצריך , אנשים לפעמים הקליטו עם כל מיני דברים שונים ומשונים

מנחה- עידו קינן : ואולי זה מה שהופך את הניסוי הזה להרבה יותר אמיתי מאשר ניסויים קליניים אחרים מכיוון שהוא נבדק בתנאי השטח אמיתיים ונבדק באותם תנאים שבהם האפליקציה תשמש בפועל

פרופ" ורד אהרונסון : נכון מאוד הרבה פעמים יש ניסויים שנערכים בתנאי מעבדה עליו דווקא בדיבור בכל שטח במדע עושים את זה מהמעבדה התוצאות יוצאות פנטסטיות ואז מוציאים את זה לעולם האמיתי לשטח פתאום שום דבר לא זז לא זז הוא לא עובד כמו שצריך זה מה שנקרא MISMATCH כלומר ההקלטות באולפן ובמעבדה אינן תואמות לסביבת עבודה שנמצאת בשטח ופה באמת אנחנו מראש לא הלכנו לאגף הזה קיבלתי מראש הקלטנו בשטח בתנאים הכי אמיתיים שיש

מנחה- עידו קינן : ומה שיעור הזיהוי הנכון ושיעור הזיהוי השגוי

פרופ" ורד אהרונסון : אז התוצאות כרגע מאוד ראשוניות , כי האוכלוסייה שהוקלטה בסופו של דבר הייתה הקטנה הרבה ממה שביקשנו , הוקלטו רק כמה עשרות ולכן רוב העבודה שלנו הייתה באמת לאמן מערכות שאותם אנחנו רגילים להשתמש במאות ואלפי דגימות רק על כמה עשרות , היה בזה באמת הרבה מחקר רק אפילו בתחום הזה של איך באמת מנתחים DATA כל כך קטנה אנחנו בטח להוביל BIG DATA הפועל הנלווה לשמאל DATA ועדיין בתוצאות הראשונות מאוד מעודדות במראות 78% זיהוי נכון של חולים ובריאים ומה שהכי חשוב וזה גם מבחינת החשיבות הלאומית יש בה פחות מ-30% פוסאלאן זה אותו דבר שאומר לבן-אדם חולה כשבעצם בריא זה מאוד חשוב להבהיר שמדובר בבדיקה אם מדובר בדיאגנוזה זה לא שמישהו עכשיו בטלפון שלו יקבל דיאגנוזה אתה חולה קורונה הולך לקבל תרופה הולך לבית החולים , המערכת היא כמו בדיקת דם שאומרת יש לך למשל אחוז ככה וככה של כדוריות דם לבנות בדם , היא עדיין לא אומרת מה יש לך , היא אומרת לך עכשיו לרופא שהוא יפרש את הבדיקה וייתן לך בעצם את הדיאגנוזה , לצערנו או לשמחתנו תלוי מי מסתכל , אנחנו עדיין לא בעידן שבו מחשבים יכולים לרפא או לתת אפילו דיאגנוזה , זה דבר שעדיין לא נמצא רק בידי המאבחן האנושי ולכן הבדיקה היא פשוט איזשהו מדד מספרי שאחר כך לפי הצוות הרפואי או בדיקות אחרות לדוגמה PCR יכולות לאשש את התוצאות של הבדיקה הזאת ולתת בסופו של דבר את הדיאגנוזה מה יש לך במקרה זה האם אתה באמת חולה לקורונה

מנחה- עידו קינן : אז זה עשוי להישמע כמו מדע בדיוני , אבל זה באמת שיטה שיכולה לסייע באבחון של המחלה הזאת במחלות אחרות יש מחלות שכבר היום מאבחנים אותם בין השאר באמצעות קול

פרופ" ורד אהרונסון : יש הרבה מאוד התחלות וניסויים בכל מיני שלבים מתקדמים של זיהוי מחלות ע"י קול , כי זה פשוט הדבר הכי טבעי הכי פשוט שיש להקלטה , בדיקות אחרות דורשים לפעמים דקירות , דורשים חדר מיוחד לבדיקה דורשים

מנחה- עידו קינן : הקלטה זה חיישן שיש לכולנו בכיס

פרופ" ורד אהרונסון :     ולמעשה כולנו נוכל תמיד להבחין את עצמנו בכל מיני דברים , בנוסף לזה מה שאפילו יותר חשוב האבחנה , יש עוד משהו שנקרא מוניטור , נגיד שהבן-אדם שם אובחן כחולה , אבל אתם רוצים לראות איך משפיעות עליו התרופות , האם המצב שלו מחמיר או משתפר , הוא לא יכול לגשת לרופא כל שעה כל יום כדי לבדוק את הבדיקה הזאת במעבדת הרופא , אבל הוא יכול במשך היום לדבר ממנה ולדבר בטלפון ולפי זה הרופא בעצם מקבל את כל ההתפתחות של המחלה לאורך כל היום , ולאורך מספר ימים ואז אחרי שבוע שבועיים בן-אדם בא לרופא , עכשיו יש לו תמונה מלאה על מה היה באותו אופן , אגב אנחנו עובדים לא רק על זיהוי מחלות פיזיולוגיות אלא גם על מחלות נפשיות כמו למשל אחד המגיפות של ה-121 היא לא הקורונה אלא דכאון תופעה שתופסת הרבה מאוד אנשים לא מבחינה בין גברים , נשים , צעירים ומבוגרים , מזרח ומערב בגלובוס , גובה קורבנות וגורמת הרבה מאוד אומללות לנפגעים ולמשפחותיהם , אז הנה יש פה כלי מצוין , שהבן-אדם אולי ילך לפסיכולוג פעם בשבוע , או לפסיכיאטר פעם בחודש , אבל אפליקצית טלפון חכמה שמקליטה אותו ונותנת לו איזשהם חיבויים לו ולפסיכיאטר שלו יכולה לשמש באמת כאיזשהו כלי גם תומך וגם מי שנותן MONITORING של תופעה לאורך זמן

מנחה- עידו קינן : אנחנו בעצם נמצאים לקראת עתיד שיבוא יום אחד ובוא נגיד העוזרת הקולית סירי או אלכסה או גוגל שהם מקשיבים כל הזמן ומחכים למוצא פינו , בעצם ינתחו כל הזמן את הקול שלנו ואת כל הדברים שאפשר לגלות דרכו , כמו ששעוני כושר מודדים את לחץ הדם והדופק ואז אנחנו בניטור מתמיד ואז אנחנו בעצם יכולים מצד אחד לגלות מחלות ומוקדם יותר ומצד שני אנחנו לא מגדילים את ההיפוכונדריה , את החשש שמתמיד מפני איזשהו שינוי אם אני נשקל בבוקר ונשקל בערב והמשקל של יהיה שונה , אם הייתי נשקל כל שעה יכול להיות שזה לא היה מאפשר לי לעשות דיאטה כמו שצריך הייתי משתגע מזה

פרופ" ורד אהרונסון :נכון , אבל פה יש את העניין של הטכנולוגיה ומה עושים איתה , כל טכנולוגיה יכולה להיות חרב פיפיות ,יכול להיות דבר מאוד מאוד טוב וגם מאוד מאוד רע וצריך באמת לנהל את העניין בצורה הנכונה הכל צריך להיות בהסכמת הנבדק , הכל צריך להיות באיזשהו פיקוח של איזשהו מישהו מקצועי שגם בודק את העניין ורואה האם התופעה הזאת היא גורמת לנבדק להרגיש יותר טוב או יותר רע , אבל זה כבר עניין של מה שנקרא  USEABLE    איך אנחנו באמת גורמים לטכנולוגיות להיות יותר USEABLE ולהביא כמה שיותר טוב וכמה שפחות רע כמובן שיש כל מיני אנשים אחד טוב לו והשני רע לו וצריך לראות באמת למי לתת את זה באיזה מינון לתת את זה כמו בעצם כל תרופה , אגב גם הרפואה באופן כללי היום מדברת על פשר CENTRAL אלא באמת כל נבדק צריך לקבל את מה שמתאים לו ולא משהו שנקבע על סמך סטטיסטיקה באוכלוסייה

מנחה- עידו קינן : את דיברת על דיכאון ואולי אנחנו יכולים גם לדבר על מצבי רוח , התוכנות הללו יכולות לזהות איך אני מרגיש , מה מצבי ולהשתמש במידע הזה או לטובתי או לטובת אחרים שרוצים לדעת את המצב שלי , בעצם הרובוטים והתוכנות לומדים לזהות רגשות ?

פרופ" ורד אהרונסון : בהחלט זה חלק מהאינפורמציה שכלולה בתוך הדבר הזה שנקרא דיבור , נאמר חיים ומוות ביד הלשון זה נכון , כל פעם אנחנו מוצאים משהו מהפה מישהו יכול ללמוד אינפורמציה עלינו , אם זה אינפורמציה של מה אנחנו אומרים , למה אנחנו אומרים , מי אנחנו ומה יש לנו , אז נכון רגשות זה גם דבר שמובע ואפשר לזהות אותו דרך הדיבור

מנחה- עידו קינן : עוד לפני המכונות , גם בני אדם יכולים להבחין שמישהו מתרגש , עצוב , שמח , כועס לפי גוון הקול בין השאר

פרופ" ורד אהרונסון :בוודאי , המערכת הכי טובה עדיין לזיהוי דיבור וכל תופעות הדיבור היא המוח האנושי , אנחנו התפתחנו במשך מיליוני שנות אבולוציה , ההומו ספיאנס בשביל לזהות את הדיבור של בני מיננו , אנחנו יודעים לזהות הרבה דברים מה שאנחנו עושים עכשיו , זה מה שנקרא אינטליגנציה מלאכותית , אנחנו מנסים ללמד  בעצם את המכונה לזהות דברים כפי שאנחנו מזהים אותם

מנחה- עידו קינן : אבל הוא יכול לזהות יותר טוב גם כי יש לו חיישנים יותר טובים וגם כי יש לו יכולת לשים לב לשינוי תבניות שהן מינימליות עם ניואנסים ולנו יותר קשה כבני אדם לשים לב אליהם ובעצם אני תוהה אם אנחנו מייצרים פה איזושהי טכנולוגיה שאחר כך תאפשר לנתח אותנו בלי ידיעתנו וברצוננו , היום האתיקה של הרופאים אומרת שבן-אדם לא עובר בדיקה שהוא לא מסכים לה שהוא לא נותן הסכמה מודעת ומצד שני למישהו אחר יכול להקשיב לה בשיחה שלנו ולנפח את הקול שלך ואת הקול שלי ולראות מה מצבנו ואולי להשתמש במידע הזה אולי ישמש ואפילו לרעה

פרופ" ורד אהרונסון : אבל זה נכון לכל טכנולוגיה שאנחנו משתמשים אם ביום מה שנקרא אז יותר טוב שלא יהיה לך מה להסתיר בעולם הזה מישהו כבר יתפוס אותך לא משנה באיזה דרך הדיבור או דרך התמונה או דרך ההתנהגות או כל דבר אחר , אגב לגבי מה שאמרת שהמחשבים או המכונות שומעים אותנו יותר טוב רואים אותנו יותר טוב , זה לא מדויק הסנסוריים שלנו לא פחות טובים מהמכונות יש לנו ראייה מצוידת ושמיעה מצוינת לפחות לאלה שאין להם ליקויים ושוב זה מערכות שמאומנות , המוח שלנו יתאמן לזהות את הדברים שהעיניים והאוזניים שלנו קולטים ועושה את זה באמת בהצלחה רבה , דווקא מה שקשה זה לדמות במכונה לעשות את זה באותה מידת ההצלחה כמונו , מה שנכון מבחינת מה שנקרא רזולוציה , אני למשל לא יכולה לעשות זום עם העין שלי ולהסתכל למרחק טלסקופי , אני לא יכולה לעשות זום אין ולראות משהו מיקרוסקופי , את זה המחשב בעזרת אלקטרוניקה ואופטיקה כן יכול לעשות אותו דבר , באנלוגיה גם לגבי הדיבור , אבל עדיין יש לנו כברת דרך גדולה מאד לעשות לפני שהמחשב יוכל לזהות אותנו בעיקר תכונות אנושיות כאלה כמו רגשות , כמו שאנחנו מזהים זה את זה ובוודאי , אגב , לא רק כשאנחנו מזהים זה את זה , אלא איך שרופא או איש מקצוע יודע לזהות אותנו שהוא בכלל התמקצע ולהקשיב ולזהות את הדברים האלה בפציינטים שלו

מנחה- עידו קינן : איך הגעת לתחום הזה של זיהוי מאפיינים פיזיים ונפשיים באמצעות הקול ?

פרופ" ורד אהרונסון : אז אני התחלתי בעצם את הקריירה שלי בתחום הזה בחקר השמיעה , אני בניתי מודלים של רשות נוירונים למערכת השמיעה האנושית בכוונה לראות , אם אנחנו יכולים להקשיב יותר טוב לעקם צליל ולעשות כל מיני דברים בצורה מלאכותית תוך שימוש באמת בביולוגיה אנושית , כדי לראות איך אנחנו בעצם עושים סימולציה מה שאדם או החיות לצורך העניין עושות מאוד מאוד טוב , תוך כדי זה כמובן שנכנסתי לדיבור כמו רבים מעמיתיי כי מערכת הדיבור ומערכת השמיעה זה מערכות דואליות , הן עובדות יחד , לא סתם לדוגמה חרשים לא יודעים לדבר טוב , זה לא שהם לא יודעים לדבר , אבל הם חייבים את השמיעה בשביל לייצר את הדיבור , זאת אומרת זה מערכות שכל הזמן נותנות פידבק אחד לשנייה ולכן אנחנו משתמשים בהם כל הזמן ביחד , אז יחד עם המודלים של השמיעה התחלתי לעסוק במודלים של דיבור תמיד התעניינתי יותר באמת בקטע האקוסטי של הדיבור פחות בעיבוד דיבור , לצורך הבנת השפה או הבנת המלל , למרות שעסקתי גם בזה במחקרים שונים וזה באמת הביא אותי להסתכל על מה אומרת לנו המוזיקה של הדיבור , מה אומרת לנו האינטונציה לגבי מצבים שלנו , אם זה מצבים פיזיים או מצבים נפשיים

מנחה- עידו קינן : הזכרת חידושים ונתונים המחקרים שלך יכולים לסייע לבעיות שקשורות לדיבוב ולשמיעה ?

פרופ" ורד אהרונסון : בהחלט אחד הפרויקטים שעשינו בשנים האחרונות נקרא כיתה מונגשת , פרויקט שנועד להכליל את הילדים החרשים בכיתה רגילה , מה שאת עושה זה בעצם מתמללת את דברי המורה ומציגה לילד כבד השמיעה טקסט על אייפד שיש לו על השולחן

מנחה- עידו קינן : זאת אומרת עבודה על מערכות זיהוי דיבור בשפות שונות , ניטרלי מבחינה שפות או שצריך לפתח את זה לכל שפה ושפה בנפרד ?

פרופ" ורד אהרונסון : צריך לפתח את זה לכל שפה ושפה בנפרד , זה דבר שהוא ידוע בעיבוד דיבור , בכלל שפה יש לה משמעות על כל הספקטרום של התכונות של הדיבור ולכן צריך להתאים את המערכות משפה לשפה

מנחה- עידו קינן :  אנחנו יודעים שיש הרבה טקסט כדי ללמוד את הדיבור האנושי אז אנחנו יודעים שבטקסט יש הרבה  מאוד טקסיים אנושיים מההיסטוריה הרחוקה ועד היום , אבל הקלטות יש הרבה פחות שנים והשאלה היא איך מגיעים למאגרים של קולות ואיך את יודעת , את מקבלת עכשיו ערימה של הקלטות של אנשים , את לא יודעת בהכרח , מאיפה הם , מה הגיל שלהם ? מה המוצא שלהם ? באיזה מחלות הם חולים , איך משתמשים בזה ? כבייסליין כאל משהו שמלמדת האלגוריתם , איך אדם אמור להישמע ואיך נשמעות כל מיני חריגות מאדם בריא ורגיל

פרופ" ורד אהרונסון : אז פה אנחנו צוללים תרתי משמע למה שנקרא למידה חישובית עמוקה , זה בדיוק מה שהמערכות האלה עושות

מנחה- עידו קינן : במכללת אפקה אני מבין שמי שמוביל את התחום הזה זה ד"ר גדי פנקס

פרופ" ורד אהרונסון : נכון מאוד , הם מה שנקרא מלמדות את עצמם הם עושים על מאגרים מאוד גדולים של דיבור כאשר הן לא יודעות מי הם הדוברים או מה המחלה וכן הלאה ,הן לומדות ויוצרות לעצמם מה שקצת דומה למה שהם עושים במוח איזה תמונה פנימית כזאתי , של מה הם מאפיינים של דיבור , מסתכלים האם יש קבוצות שונות בתוך האוכלוסייה שעליה יישוב לא יודעת כלום , אחר כך המכונה הבאה ומשליכה את מה שהיא למדה זה נקרא טרנספרין אל האוכלוסיות ש יש עליהם תהיו כלומר, עכשיו אומרים לה תקשיבי זה באמת חולה וזה באמת בריא , זה באמת גבר , זה באמת אשה ואז בתוך הרשת העמוקה הזאת היא לומדת באמת להכליל , את מה שהיא למדה על אוכלוסייה הלא מתויגת או שאין עליה אינפורמציה ומכלילה אותה אל לאוכלוסייה שיש עליה את האינפורמציה ,זה אחד מהטכניקות המאוד השיפוטיות בכלל בעיבוד ובפרט בדיבור

מנחה- עידו קינן : אני יודע שאת עובדת עם מערכת הביטחון , יש פרויקטים ביטחוניים שאת יכולה לדבר עליהם ולספר איך משתמשים בכל הצבא במודיעין בתחומים כאלה ?

פרופ" ורד אהרונסון : במילה אחת לא

מנחה- עידו קינן : זה היה לא מאוד החלטי , ככה אני מזהה לפי הקול שלך ואת עוסקת גם הבנה של איך הכל בנוי כדי לשחזר קול ולחכות אותו ולסנתז קול אנושי של אדם ספציפי או קול אנושי גנרי באמצעות בינה מלאכותית

פרופ" ורד אהרונסון : אז אני אישית לא , אבל במרכז שלנו במרכז אפקה בלימוד שפה יש חוקרים שעוסקים בתחומים שונים כל אחד מהתחומים האלה הוא עולם ומלואו , באמת יש לנו קבוצה שעוסקת במה שנקרא היום ספופינג

מנחה- עידו קינן : תחום שמוביל אצלכם ד"ר יצחק לפידות

פרופ" ורד אהרונסון : נכון מאוד , ספופינג זה בעצם חיקוי ביומטרי בדיבור , זה אומר פשוט לחקות את הדיבור , כדי באמת להשתמש בביומטריקה מלאכותית , הם לחלוטין בשביל לדוגמה לפתוח דלתות שונות , אז כמו שעושים את זה לביומטריה אחרת כמו שיש טביעת אצבע אפשר לעשות את זה גם לקול וכמו תמיד בכל דור של האקרים וסייבר אז יש את הספונינג ויש את האנטי ספופינג , יש את האוכלוסייה השלמה שנלחמת בספופינג ומנסה  לזהות , האם באמת מדובר באדם אמיתי או במשהו מלאכותי שמנסה לחדור למקום זה או אחר

מנחה- עידו קינן : וזה משהו שרואים כבר סביבנו , זאת אומרת זה נפוץ , זה הונאות קוליות , כאילו זה דבר בעולם הנוכלים או שזה עדיין ברמה מאוד תיאורטית ?

פרופ" ורד אהרונסון :אני לא כל כך מחוברת לעולם התחתון , אבל אנחנו רואים את זה בכל תחומי החיים כן כשיש את האפשרות

מנחה- עידו קינן : אני שואל אם כבר מבחינת המחקר אתם עוד בשלבים ראשוניים או שיש כבר נגיד אם יש איזושהי מעבדה של אנשי טכנולוגיה סוררים שהחליטו להשתמש בזה לרעה או גופים ממשלתיים היכולות קיימות

פרופ" ורד אהרונסון : היכולות קיימות , אני מבינה שיש דברים כאלה , אני בוודאי לא בקשר איתם , אנחנו מנסים ללמוד ומה עם האלגוריתמים של ספופינג ומעם האנטי ספופינג , אנחנו מנסים לעזור, אנחנו עם הטובים

מנחה- עידו קינן : אנחנו יושבים עכשיו במרחק מותר ואלה לא מסכות , אבל הרבה מהשיחות שאנחנו מנהלים בימים אלה נעשות דרך מסכות ומסכות הם משנות את הקול שלנו מעממות אותו מחלישות אותו , מה המחקר יכול להגיד לנו על זה ?

פרופ" ורד אהרונסון : אז בהחלט יש השנה באופן טבעי הרבה מאוד מחקרים על דיבור דרך מסכה , ללא ספק שומעים אחרת ומן הסתם גם מהמאפיינים קצת שונים אחד הדברים המעניינים בתחום הזה , זה שהסתבר שהרבה אנשים גילו או הפנימו שיש להם בעיית שמיעה וזאת למה , כי הם באופן טבעי משתמשים הרבה בתנועות שפתיים כדי להבין את הדיבור של זה שמדברים איתו אבל

מנחה- עידו קינן : הם לא מודעים לזה

פרופ" ורד אהרונסון : ולא מודעים לזה או לא יודעים עד כדי כמה הם באמת משתמשים בזה ועכשיו פתאום אותם אנשים פשוט לא שומעים זאת בעיה שנצטרך לטפל בה

מנחה- עידו קינן : אז הקשר הזה בין שמיעה וראייה עם אחרים זה משהו שיש לכם איזה מחקר אינטרדיסציפלינרי על זה , כי אני יודע למשל מדוגמה מעולמות אחרים שכאשר חוש הריח מנוטרל הטעם משתנה , אנחנו לא תמיד מודעים לזה אבל הטעם מורכב ואצלנו הזיהוי של טעם מורכב אצלנו גם בחוש הריח אז יש נגיעה בחושים אחרים ובתחומים אחרים אצלכם ?

פרופ" ורד אהרונסון : בהחלט התחום הזה של זיהוי רגשות שדיברנו עליו כעת מושפע או משתמש הרבה באמצעים ויזואליים נוסף לכל אלה שמשתמשים בהבעות פנים בשפת גוף , השפה היא בעצם דבר שהם עושים כל הגוף לאו דווקא רק עם הדיבור או עם הפה ורק תמונה שלמה שלוקחת את כל המודים האלה כמו שאנחנו קוראים להם ,את כל האופני הבעה שיש לנו מצליחה לזהות בצורה ממש טובה דברים שהם כל כך עדינים ולא לא תמיד ברורים כמו רגש

מנחה- עידו קינן : את קמה בבוקר ומדברת לתוך אפליקציות ותוכנות שפיתחת ובודקת על עצמך כל מיני דברים זה משהו שנכנס לחיי היום-יום ?

פרופ" ורד אהרונסון : לא יודעת מחיי היום-יום בבית אבל במשרד בוא נגיד במעבדה , אנחנו כל הזמן מקליטים מקשיבים

מנחה- עידו קינן : מישהו נכנס הוא אומר בוקר טוב ואת אומרת לו זה לא בוקר טוב , זה לא מה שכתוב פה במחשב

פרופ" ורד אהרונסון : כמעט כן , אבל אני מכירה הרבה רופאים שאנחנו עובדים איתם בזיהוי מחלות שונות והם אומרים בן-אדם נכנס לי בדלת אומר לי בוקר טוב אני יודע שיש לו עוד מעט אלצהיימר ומחלות אחרות ואלה הרופאים שאנחנו באמת מתחקרים אותם כמה שיותר כדי להבין מה הם שומעים בין לנסות לתרגם את זה למשהו שגם המחשב יוכל לשמוע בעתיד

מנחה- עידו קינן : פוליגרף נחשב כלי לגמרי אמין וכזה שניתן לעבוד עליו יש פוליגרף של קול יש שבאמת אפשרות אני זוכר אפליקציה לפני כמה שנים שטענה שיכולה לשמוע דיבור ולהחליט אם את דוברת אמת ומשקרת ,זה אמיתי זה דבר שקיים

פרופ" ורד אהרונסון : קיים אבל לא עובד טוב למה כי כנראה א' קל מאוד לרמות את המכונה אגב גם פוליגרף עם הסטנדרטים לא ממש עובדים ב-100% הרבה פחות מזה ועדיין לא הצליחו לזהות את אותם מאפיינים שמבדילים בין אדם משקר לאדם שהוא שדובר אמת כנראה זה דבר יותר מסובך ממה שאנחנו כרגע יכולים לנפק אבל עובדים גם על זה

מנחה- עידו קינן : מה החלום שלך , הפריצת דרך המדעית שהיית רוצה לעשות בתחום של קול

פרופ" ורד אהרונסון : החלום הוא באמת וזה חלום שהיה לנו כשהקמנו את המרכז עיבוד שפה לפני יותר מעשור ושיהיה לנו מכונת שפיץ אולטימטיבית אותו רבות מופלא שבהינתן כל יכול לעשות תיוג של כל מה שיש בפנים מה נאמר מי אמר , מה מצבו , מי הוא , במה הוא חולה ועוד , את כל האלמנטים האלה ולתת לנו איזשהו תמונה מלאה לאדם דרך הדיבור

מנחה- עידו קינן : בינתיים אנחנו ניסינו לעשות את זה בשיחה של כחצי שעה ואולי הצלחנו ללמוד קצת עלייך ועל התחום פרופסור ויד אהרונסון ראש מכון אפקה לאיבוד צפה תודה רבה לך

פרופ" ורד אהרונסון : תודה לכם

מנחה- עידו קינן : ותודה לכן ולכם על ההאזנה כדי לשמוע את הפרקים הבאים יירשמו לפרויקט בספוטיפיי גוגל אפל דיזל או ביישומון האהוב עליכם אני עידו קינן לידות