מזונות חשובים
- Google השיקה כלי חדש המאפשר למשתמשים לחפש שירים באמצעות זמזום, שירה או שריקה.
- הכלי החדש משתמש בלמידה חישובית כדי להתאים רצועה מזומזמת למסד נתונים של יותר מחצי מיליון שירים שמתעדכן ללא הרף.
- משתמשי Google שואלים איזה שיר מתנגן כמעט 100 פעמים בכל חודש.
גוגל השיקה תכונה חדשה בשם "זמזום לחיפוש" כדי לפתור בעיה מתסכלת: ששיר תקוע לך בראש ולא מצליח להבין איך קוראים לו.
הרעיון לזמזם כדי למצוא שיר נראה פשוט להפליא, אז למה גוגל משיקה את התכונה הזו רק ב-2020? ובכן, מסתבר שזיהוי שירים בדרך זו הוא למעשה די מסובך, בין השאר בגלל שהגרסאות הממזמזמות שלנו נוטות להיות שונות למדי מהרצועה המקורית. בפוסט שפורסם לאחרונה בבלוג הבינה המלאכותית שלה, גוגל מסבירה כיצד היא השתמשה בלמידת מכונה כדי לפתור את הבעיה הזו, ובסופו של דבר לעזור לאנשים למצוא שיר על ידי זמזום, שריקה או שירת המנגינה גם כשהביצוע שלהם פחות מדוייק.
"ההתמקדות שלנו ב-Hum to Search היא בסיוע לאנשים לזהות ולמצוא מוזיקה שתקועת להם בראש", אמר דובר גוגל ל-Lifewire באימייל.
רק התחל לזמזם
משתמשי גוגל שואלים איזה שיר מתנגן כמעט 100 מיליון פעמים בכל חודש, Aparna Chennapragada, סגן נשיא גוגל ומנהל כללי של קניות צרכניות, אמר סרטון המציג כמה תכונות חיפוש חדשות. עכשיו יש דרך לגלות.
תכונת "המהום לחיפוש" מובנית באפליקציה לנייד של Google, בווידג'ט של חיפוש Google וב-Google Assistant. כדי לגשת אליו דרך האפליקציה, הקש על סמל המיקרופון ואמור "מה זה השיר הזה?" הבחירה בלחצן "חפש שיר" עובדת גם היא.
כדי לעבוד נכון, התכונה דורשת לזמזם לפחות 10-15 שניות. משתמשי אנדרואיד יכולים לזמזם כדי למצוא שירים ביותר מ-20 שפות, בעוד שרק שירים באנגלית עובדים באייפון. הכלי לא תמיד מסוגל לזהות שיר מיד, אבל ברגע שהוא כן, התוצאות די טובות.
"יותר ממחצית מהשירים של קבוצה רחבה של משתנים (טון, גובה, עוצמת הקול וכו') מזוהים על ידי האלגוריתמים שלנו, אבל כמובן, הדיוק תלוי באיכות הזמזום, בסוג של השיר, ועוד", אמר דובר גוגל ל-Lifewire באימייל. "אבל ברגע שהוא מזוהה, בערך ארבע מתוך חמש תשובות נכונות."
עם זאת, זו לא הפעם הראשונה שבה נעשה שימוש בזמזום באפליקציה לזיהוי מוזיקה. SoundHound מציע תכונה דומה, כפי שצוין על ידי CNN Business, והוא זמין גם באנדרואיד ו-iOS. לדברי דובר גוגל, התכונה החדשה אינה מעלה חששות לגבי פרטיות, והיא גם לא "משנתה את האופן שבו גוגל מטפלת באינטראקציות מבוססות אודיו", הם אמרו ל-Lifewire באימייל.
למידת מכונה
למרות הפשטות של הרעיון, לזמזם מנגינה כדי למצוא את הקלטת האולפן די קשה מבחינה טכנית. ישנן מספר סיבות לכך, מסביר כריסטיאן פרנק של Google Research בפוסט בבלוג של 12 בנובמבר. קודם כל, גרסה מזומזמת של השיר יכולה להיות שונה מאוד מההקלטה בפועל, מה שמקשה על ההתאמה בין השניים. אז בעוד ש-Shazam ושלל אפליקציות אחרות כבר קיימות לזיהוי השיר שאתה שומע במסעדה או במקום ציבורי אחר, השימוש במנגינה מזומזמת כבסיס לחיפוש זה יכול להיות מסובך יותר.
"עם מילים, קולות רקע וכלי נגינה, האודיו של הקלטת מחזמר או אולפן יכול להיות שונה לגמרי ממנגינה מזומזמת", כותב פרנק."בטעות או בתכנון, כשמישהו מזמזם את הפרשנות שלו לשיר, לעתים קרובות הגובה, המפתח, הקצב או הקצב עשויים להשתנות מעט או אפילו משמעותית."
בגלל שהגרסאות המזומזמות של השירים יכולות להיות שונות כל כך מהמקוריות, פרנק מציין ששיטות עבר רבות דרשו התאמה בין הזמזום של אדם לגרסה של השיר שיש לה רק מנגינה, או רצועה הכוללת זמזום. זה הפך את מקרי השימוש בעולם האמיתי למאתגרים, מכיוון שניתן להגביל את מסדי הנתונים עם השירים האלה ויש לעדכן אותם באופן ידני.
גוגל מסבירה שלתכונת ה-Hum to Search, היא משתמשת במודלים של למידת מכונה כדי להפוך אודיו ל"רצף מבוסס-מספרים" המייצג את המנגינה של השיר - מה שהוא אומר שאפשר לחשוב עליו כ"טביעת אצבע."
יותר ידידותי למשתמש
השימוש בלמידת מכונה בתכונת ה-Hum to Search של Google בסופו של דבר הופך את הכלי להרבה יותר קל לשימוש בעולם האמיתי.מכיוון ש-Hum to Search תואם את המנגינה המזמזמת של המחפש עם השיר בפועל, הכלי מסוגל לעבוד עם השירים החדשים כשהם יוצאים במקום מסד נתונים שצריך לעדכן כל הזמן עם גרסאות מזומזמות של כל רצועה. בנוסף, אתה לא צריך גובה גובה מושלם כדי להשתמש בו.
"המערכת הנוכחית מגיעה לרמת דיוק גבוהה במסד נתונים של שירים שמכיל למעלה מחצי מיליון שירים שאנו מעדכנים ללא הרף", אמרה גוגל בהודעת ה-Hum to Search שלה. "לקורפוס השירים הזה עדיין יש מקום לגדול כדי לכלול עוד מהלחנים הרבים בעולם."