שיחות עם המחשב שלך עשויות להיות מציאותיות יותר

תוכן עניינים:

שיחות עם המחשב שלך עשויות להיות מציאותיות יותר
שיחות עם המחשב שלך עשויות להיות מציאותיות יותר
Anonim

מזונות חשובים

  • Meta משתמשת בבינה מלאכותית כדי ליצור תוכניות שיכולות להביע רגשות בדיבור.
  • צוות הבינה המלאכותית של החברה אמר שהיא התקדמה בעיצוב קולות אקספרסיביים, כגון צחוק, פיהוק, בכי ו"צ'אט ספונטני" בזמן אמת.
  • AI משמש גם לשיפורים בזיהוי דיבור.
Image
Image

אולי בקרוב תוכל לנהל צ'אט טבעי יותר עם המחשב שלך, הודות לכוחה של בינה מלאכותית (AI).

Meta אמרה שהיא התקדמה משמעותית במאמץ שלה ליצור מערכות דיבור ריאליסטיות יותר שנוצרות בינה מלאכותית. צוות הבינה המלאכותית של החברה אמר שהוא עשה התקדמות ביכולת לדגמן קולות אקספרסיביים, כגון צחוק, פיהוק ובכי, בנוסף ל"צ'אט צ'אט ספונטני" בזמן אמת.

"בכל שיחה נתונה, אנשים מחליפים מלאים של אותות לא מילוליים, כמו אינטונציות, הבעה רגשית, הפסקות, מבטאים, מקצבים - כולם חשובים לאינטראקציות בין בני אדם", כתב הצוות בפוסט האחרון בבלוג. "אבל מערכות הבינה המלאכותית של היום לא מצליחות ללכוד את האותות העשירים והאקספרסיביים האלה, כי הן לומדות רק מטקסט כתוב, שלוכד את מה שאנחנו אומרים אבל לא איך אנחנו אומרים את זה."

דיבור חכם

בפוסט בבלוג, הצוות של Meta AI אמר שהם פועלים להתגבר על המגבלות של מערכות AI מסורתיות שאינן מסוגלות להבין אותות לא מילוליים בדיבור, כגון אינטונציות, הבעות רגשיות, הפסקות, מבטאים ומקצבים.המערכות מתאפקות כי הן יכולות ללמוד רק מטקסט כתוב.

אבל העבודה של Meta שונה מהמאמצים הקודמים מכיוון שדגמי הבינה המלאכותית שלה יכולים להשתמש במודלים של עיבוד שפה טבעית כדי ללכוד את האופי המלא של השפה המדוברת. חוקרי מטא אומרים שהמודלים החדשים יכולים לאפשר למערכות בינה מלאכותית להעביר את הסנטימנט שהם רוצים להעביר - כמו שעמום או אירוניה.

"בעתיד הקרוב, נתמקד ביישום טכניקות ללא טקסט לבניית יישומים שימושיים במורד הזרם מבלי להידרש לא תוויות טקסט עתירות משאבים או מערכות זיהוי דיבור אוטומטיות (ASR), כגון מענה לשאלות (למשל, "איך מזג האוויר?"), "כתב הצוות בפוסט בבלוג. "אנו מאמינים שפרוזודיה בדיבור יכולה לעזור לנתח טוב יותר משפט, מה שבתורו מקל על הבנת הכוונה ומשפר את הביצועים של מענה לשאלות."

AI Powers Comprehension

לא רק שמחשבים משתפרים בהעברת משמעות, אלא גם בינה מלאכותית משמשת לשיפורי כוח בזיהוי דיבור.

מדעני מחשב עובדים על זיהוי דיבור במחשב לפחות מאז 1952, כאשר שלושה חוקרי מעבדות בל יצרו מערכת שיכולה לזהות ספרות מספריות בודדות, אמר קצין הטכנולוגיה הראשי של AI Dynamics, Ryan Monsurate, בדוא ל אל Lifewire. בשנות ה-90, מערכות זיהוי דיבור היו זמינות מסחרית, אך עדיין היה להם שיעור שגיאות גבוה מספיק כדי למנוע שימוש מחוץ לתחומי יישומים ספציפיים מאוד כגון שירותי בריאות.

"עכשיו, כשמודלים של למידה עמוקה אפשרו למודלים של אנסמבל (כמו אלה של מיקרוסופט) להשיג ביצועים על-אנושיים בזיהוי דיבור, יש לנו את הטכנולוגיה לאפשר תקשורת מילולית עצמאית עם מחשבים עם מחשבים בקנה מידה גדול", אמר מונסוראט. "השלב הבא יכלול הפחתת העלות כך שלכל מי שמשתמש בסירי או בעוזרי הבינה המלאכותית של גוגל תהיה גישה לרמה זו של זיהוי דיבור."

Image
Image

AI שימושי לזיהוי דיבור מכיוון שהוא יכול להשתפר עם הזמן באמצעות למידה, אמר אריאל אוטניק, מנהל ההכנסות הראשי והמנהל הכללי בחברת הקול בינה מלאכותית Verbit.ai, ל-Lifewire בראיון באימייל. לדוגמה, Verbit טוענת שטכנולוגיית הבינה המלאכותית הפנימית שלה מזהה ומסננת רעשי רקע והדים ומתמללת רמקולים ללא קשר למבטא כדי ליצור תמלילים וכתוביות מפורטים ומקצועיים מווידאו ואודיו חיים ומוקלטים.

אבל אוטניק אמר שרוב הפלטפורמות הנוכחיות לזיהוי דיבור מדויקות רק ב-75-80%.

"AI לעולם לא יחליף באופן מלא בני אדם מכיוון שהביקורת האישית על ידי מתמללים, מגיהים ועורכים נחוצה כדי להבטיח תמליל סופי באיכות גבוהה ובדיוק גבוה", הוסיף.

אפשר להשתמש בזיהוי קולי טוב יותר גם כדי למנוע האקרים, אמר סנג'אי גופטה, סגן הנשיא הגלובלי לפיתוח מוצרים ופיתוח תאגידי בחברת זיהוי הקול Mitek Systems, באימייל.מחקרים מצביעים על כך שתוך שנתיים, 20 אחוז מכל התקפות ההשתלטות המוצלחות על חשבון ישתמשו בהגדלת קול סינתטית, הוא הוסיף.

"זה אומר שככל שטכנולוגיית זיוף עמוקים הופכת מתוחכמת יותר, עלינו ליצור בו זמנית אבטחה מתקדמת שיכולה להילחם בטקטיקות הללו לצד זיופים עמוקים של תמונות ווידאו", אמר גופטה. "המאבק בזיוף קולי דורש טכנולוגיית זיהוי חיוניות, המסוגלת להבחין בין קול חי לבין גרסה מוקלטת, סינתטית או ממוחשבת של קול."

תיקון 2022-05-04: תיקן את האיות של שמו של Ryan Monsurate בפסקה 9.

מוּמלָץ: