מאחורי המיקרופון: איך עובד זיהוי קולי?

[rrssb]

 

בשנים האחרונות הממשק בין בני אדם למחשבים נעשה יותר טבעי ומבוסס גוף: מסכי מגע, זיהוי קול ותנועות, מה שאינטל מכנה "מחשוב תפיסתי".
בעוד שהשימוש בזיהוי תנועות הגיע לשיאים חדשים בעיקר בתחום קונסולות המשחקים, הרי שהממשק הקולי הפך נפוץ במקומות רבים: ממערכות לניתוב שיחות, דרך אימות על פי קול, וביתר שאת אצל הסייעניות הדיגיטליות שאצלנו בכיס, כמו Google Now, Siri וקורטנה של מיקרוסופט, שהפכו לחלק בלתי נפרד מהסמארטפונים. 

בסרט קצר בן שבע דקות שהפיקה גוגל ניתן ללמוד בתמציתיות על העבר והעתיד של זיהוי קולי:

 

אולי תתחברו גם לאלה?

על אודות המחבר לצפיה בכל הכתבות

הראל שטנשטיין

בעברו כתב הסלולר של מעריב, נענע10 וחורים ברשת ושימש ככתב פרילנסר של אתר EETimes האמריקאי. כיום מייעץ שטנשטיין לחברות הזנק ומפתחים בנושאי אסטרטגיה, שיווק ופיתוח אפליקציות לטלפונים חכמים ומחשבי לוח.

2 תגובותהשמיעו קולכם

  • תיקון טעות נפוצה: זיהוי קולי = מכונה שיודעת לזהות *מי* אמר את המשפט. זיהוי דיבור = מכונה שיודעת לזהות *מה* נאמר

  • יויו היקר,
    סמנטית, הצדק עמך.
    ברם, ניכר שהביטוי השגור יותר בעברית הוא זיהוי קולי, ולא זיהוי דיבור – בחרנו במושג הנהיר ומוכר יותר לקורא בישראל, ואין בכך שיבוש מהותי.

השאר תגובה

banner