האם הקולות הסופר-מרשימים של ספרי אודיו של AI טובים או רעים?

תוכן עניינים:

האם הקולות הסופר-מרשימים של ספרי אודיו של AI טובים או רעים?
האם הקולות הסופר-מרשימים של ספרי אודיו של AI טובים או רעים?
Anonim

מזונות חשובים

  • DeepZen משתמש ב-AI (בינה מלאכותית) כדי ליצור ספרי אודיו מציאותיים להדהים מטקסט.
  • הטכנולוגיה משתמשת בשחקני קול אנושיים אמיתיים כדי לספק את אבני הבניין.
  • Amazon ו-Audible לא מקבלים כרגע ספרי אודיו שנוצרו על ידי מחשב.
Image
Image

DeepZen היא חברה שיוצרת קולות מחשב המשמשים בספרי אודיו, המבוססים על הקולות האמיתיים של שחקנים אנושיים. האיכות מפחידה-טובה מספיק כדי להאזין לה במשך שעות בכל פעם.הגימיק כאן הוא רכיב ה-AI (בינה מלאכותית), שיכול לקרוא את הטקסט ולהסיק את התגובה הרגשית הנכונה על סמך הקשר. לאחר מכן הוא מכניס את הרגש הזה לקול.

זה מרשים ונוח מאוד. אבל האם אנחנו באמת רוצים חווית ספר אודיו הומוגנית? ומה עם השחקנים הקוליים האלה?

"מנקודת המבט של מוציא לאור האינדי, כל דבר שמפחית את העלות של הפקת ספרי אודיו הוא מעניין מאוד", אמר ריק קרליל, הבעלים של המוציא לאור העצמאי Carlile Media, ל-Lifewire באמצעות דוא"ל.

"אבל האטרקציה הזו מניחה שהמוצר יהיה באיכות שווה לקריינות המסורתית. אני לא חושב שאנחנו עדיין שם במאה אחוז. אל תבינו אותי לא נכון, DeepZen טוב להפליא. זה פריצת דרך אדירה, והיוצרים שלה ראויים לשבחים והצלחה עצומים. אבל זה עדיין לא מושלם."

אודיו זה 'טוב מספיק'

הדרך הטובה ביותר להבין את האיכות של DeepZen היא להאזין לדגימות.אם לא ידעת שהם נוצרו במחשב, אולי אפילו לא תבין. לא לזמן מה בכל מקרה. בואו נניח שה-AI של DeepZen מושלם ושהוא אף פעם לא מפרש לא נכון את התווים הרגשיים שהוא אמור להכות.

Image
Image

גם אז, אדם יכול להציע פרשנויות מגוונות יותר ולעתים קרובות יותר מפתיעות. שחקן עשוי להכניס טוויסט בלתי צפוי למילים שמחשב אף פעם לא ישקול. ובמציאות, פרשנות הבינה המלאכותית בוודאי עדיין לא טובה כמו זו של שחקן קול מקצועי.

"כאחד שעובד על סרטים ולאחרונה בעולם של קריינות אודיו, בזמן שאני מתרשם מה-AI-אני יודע בוודאות שיש עומקים עמוקים של משמעות שמכונה לא יכולה לפרש, "קול מקצועי השחקן פול קראם אמר ל-Lifewire באימייל.

"האם יהיה גל של מחברים לא ידועים שמשתמשים בו? אני מבטיח שזה יהיה 'טוב מספיק'."

להיות מספיק טוב, בשילוב עם הנוחות והחיסכון בעלויות, עשוי להספיק כדי להביא מפרסמי אינדי לשירות.

"ספרי אודיו יכולים לעלות עד $500 לשעת שמע גמורה (הרבה יותר עבור קול של ידוענים), וזה לא כולל את עלות הזמן של הניהול והמנהל", אומר קרליל. "היכולת להפחית בחצי את העלות על ידי העלאת כתב יד לספק כמו DeepZen היא אטרקטיבית ביותר."

Talking Trouble

זה עדיין לא ממש קל כמו לפטר את השחקנים הקוליים ולהעלות כתבי יד ל-DeepZen. יש כרגע מחסום אחד בפני ביטוי AI קל של ספרי אודיו, והוא מאמזון.

Image
Image

"נכון לעכשיו, ACX, המסלול של המוציא לאור העצמי להפצת ספרי אודיו של Audible ואמזון, לא יקבל ספרי אודיו שאדם לא הקליט", אומר קרליל.

למה? איכות. הנה ערך השאלות הנפוצות מהאתר:

"טקסט לדיבור או הקלטות אוטומטיות אחרות אינן מותרות. מאזינים נשמעים בוחרים ספרי שמע לביצוע החומר, כמו גם את הסיפור. כדי לעמוד בציפייה הזו, ספר האודיו שלך חייב להיות מוקלט על ידי אדם."

זה אומר שספרי אודיו שנוצרו על ידי DeepZen אזלו לעת עתה, לפחות. זו ספקולציה טהורה, אבל DeepZen נראה כמו רכישה די טובה עבור אמזון, המאפשרת לה למכור את השירות ולשמור אותו אך ורק עבור ספרי Audible. וגם אם זה לא יקרה, אם האיכות של ספרי אודיו שנוצרו על ידי מחשב טובה כמו זו, נראה שאין סיבה קטנה לא לעשות חריג לכלל זה.

האם תשמח להאזין לספרי אודיו שנעשו כך? כשזה יקרה, רוב האנשים אפילו לא יחשדו. חלקם עשויים להעדיף את השלמות של קולות שנוצרו על ידי מחשב מכיוון שהם יהיו נקיים מהטיקים וההרגלים הקוליים שלפעמים יכולים להסיח את דעתם. הטכנולוגיה מתאימה גם למשחקי וידאו, מודעות טלוויזיה ורדיו, וכל תרחיש אחר שבו תעסיק שחקן קול.

הטכנולוגיה של DeepZen גם תהיה דרך מצוינת ליצור אוטומטית פודקאסטים חדשותיים ממאמרים כתובים, מה שיכול להיות שימושי עבור הנסיעה.

ומה עם השחקנים הקוליים האלה? ובכן, תהיה לפחות הזדמנות אחת: הם יכולים ללכת ולעבוד עבור DeepZen.

מוּמלָץ: