איך זיהוי קול שוטף נשאר מהיר, מדויק ופרטי

תוכן עניינים:

איך זיהוי קול שוטף נשאר מהיר, מדויק ופרטי
איך זיהוי קול שוטף נשאר מהיר, מדויק ופרטי
Anonim

מזונות חשובים

  • Fluent הוא מנוע זיהוי קולי המכבד פרטיות ומהיר במיוחד שאינו זקוק לחיבור לאינטרנט.
  • ניתן להטמיע אותו כמעט בכל מכשיר.
  • זה עובד בכל שפה.
Image
Image

Fluent.ai הוא מנוע זיהוי קולי וירטואלי שלא שולח את הפקודות שלך לאינטרנט, פועל כמעט באופן מיידי, יכול לעבוד בכל שפה, והוא כל כך קטן שאפשר להכניס אותו אפילו זול, נמוך -הספק מכשירים כמו שעון כושר, למשל.

בניגוד לסירי ואלכסה, Fluent הוא עוזר עצמאי שמבין אותך באופן מיידי ולומד ממך כך שהוא משתפר ככל שאתה משתמש בו יותר. אין לו עומק של עוזרים וירטואליים רגילים, אבל זה לא נועד. במקום זאת, הוא מהיר יותר, מדויק יותר ופרטי יותר מהמאמצים של אפל, אמזון וגוגל.

"דיבור לטקסט משתמש בעיבוד שפה טבעית, ואז נובע כוונה", אמר מנכ"ל פלונט פרובל לאלה ל-Lifewire במהלך ראיון עם זום. "זה דורש הרבה נתונים, והרבה כוח עיבוד. Fluent עובר ישירות מדיבור לכוונה, לוקח את הקול שלך וממיר אותו ישירות לפעולה."

שורה התחתונה

Fluent היא תוכנה לשליטה קולית. זה עובד על ידי האזנה לפקודה שלך והסרת כל המילים שאינן זקוקות לו, משאיר רק שמות עצם ופעלים חיוניים. "כבה את האורות", הופך רק לכבות ואורות. האלמנטים המהותיים מופשטים ממשפט אנושי מבולגן והופכים לצעדים.זה כמעט כמו לתכנת מחשב, להפוך רעיון מורכב למערכת ההוראות הפשוטה ביותר.

למה אפשר להשתמש בו?

Fluent יכול לשמש לכל דבר. המפתח הוא שהוא מאומן למצב ספציפי. עם שעון חכם, למשל, הוא עשוי להיות מאומן בפקודות לכושר, או לאוטומציה ביתית, יצירת לוח שנה וטיימר וכן הלאה. הגבלת מסד הנתונים הופכת הכל ליותר ממוקד ומשמרת אותו מהיר.

"האמת בעניין היא שעם ציוד לביש, אתה לא מחפש לנהל שיחה," אמרה לאלה, "אני רוצה שאולי שגרת האימונים האהובה עליי תתחיל, ורוצה אותה מהר מאוד."

מהירות ודיוק הם כל העניין. הדלקת וכיבוי האורות נמשכת אלפיות שניות, במקום שתצטרך לחכות עד שסירי תשלח את קולך לענן, המתן לעיבודו, ואז - שניות לאחר מכן - לאחר שהאורות יכבו.

הכשרה צרה זו גם מפחיתה את גודל האפליקציה. בשנה שעברה, גוגל סיפקה גרסה ניתנת להורדה לא מקוונת של העוזר שלה. זה היה, אומר לאלה, 85 מגה-בייט, עבד רק באנגלית, ולקח שישה חודשים לאמן אותו.

"יש לנו דגם אחד שעובד עם 13,000 פקודות והוא פועל ב-500 קילובייט", הוא אמר.

שורה התחתונה

היתרון הנוסף של מנוע זיהוי קול לא מקוון הוא הפרטיות. בשעון חכם של ילד, למשל, "אתה לא רוצה שקול של ילד יעבור לענן", אומרת לאלה. למעשה, Fluent יכול לעבוד בתוך מכשירים שאינם מתחברים לעולם לאינטרנט. זה לא רק טוב לפרטיות, אלא גם לאבטחה. אתה יכול להשתמש במנוע זיהוי קול לא מקוון בתוך מעבדות מחקר, מתקנים צבאיים ומקומות אחרים האוסרים על טלפונים סלולריים ומצלמות.

Limits

כמובן, יש כמה חסרונות לדגם הזה. האחת היא שלא ניתן להוסיף פקודות מאוחר יותר. לאחר השלמת ההכשרה הראשונית, זהו. גם העוזר המבוסס Fluent שלך לא יכול לחפש דברים באינטרנט עבור תוצאות הספורט שלך, השחקן שאתה מזהה בסרט הזה, אבל פשוט לא יכול למקם, וכן הלאה.

Image
Image

במקום זאת, המערכת חכמה מספיק כדי לזהות מתי היא לא יכולה לעזור והיא תעביר את הבקשה למשהו שיכול. אם תבקש מהשעון שלך את תחזית מזג האוויר, פלואנט תבין שהיא לא מבינה. "אז הוא יתקשר לשירות שתוכנת מראש בשעון, בין אם זה אלקסה של אמזון או גוגל, ואז יתקשר לענן", ויעביר את הפקודה הקולית הגולמית שלך כדי לקבל את התשובה.

גישה ההיברידית הזו שומרת על המהירות של עוזר מקומי, לא מקוון, עם הכוח של Alexa או Google Assistant כגיבוי.

האם אתה יכול לקנות כל מכשיר שוטף?

עדיין לא. החברה נותנת רישוי לטכנולוגיה שלה ועושה את ההכשרה עבור חברות אחרות. הודות ל-COVID, שתי השקות גדולות נדחו לשנה הבאה. אבל אתה יכול לצפות לראות את זה מופיע בשעונים ומכשירי כושר אחרים, רמקולים, רכזות אוטומציה ביתית וכן הלאה.

זה יהיה נהדר אם זה היה משולב ישירות בסמארטפונים כמו אייפון, מה שהופך את המשימות היומיומיות למהירות יותר, וייעזר רק ב-Siri כשצריך. זו תהיה האפליקציה הרוצחת האמיתית.

עדכון: 22 באוקטובר, 10:12 בבוקר. ביצעו שינויים כדי להתייחס ל-Fluent כמנוע זיהוי קולי ולא כעוזר קולי.

מוּמלָץ: