מזונות חשובים
- DALL·E היא רשת עצבית חדשה שיכולה לצייר תמונות על סמך טקסט.
- הרשת היא אחד ממספר הולך וגדל של פרויקטים של AI שיכולים לחקות את התפוקה היצירתית של בני אדם.
- מומחים אומרים שתמונות שצוירו על ידי AI אינן יצירות מקוריות.
זוז, פיקאסו. רשת עצבית חדשה יכולה לצייר תמונות על סמך טקסט.
DALL·E, אוסף של שמות האמן סלבדור דאלי וה-WALL·E של פיקסאר, יכול לקחת כל טקסט וליצור ממנו תמונה. המערכת משתמשת ברשת עצבית שעברה הכשרה על מיליארדי תמונות ודוגמאות טקסט.זהו אחד ממספר הולך וגדל של פרויקטים של בינה מלאכותית שיכולים לחקות, אבל לא לשחזר, את התפוקה היצירתית של בני אדם.
"מכיוון שהשפה הטבעית מתפתחת כל הזמן, ותלויה מאוד בניואנסים הקשריים, ללמד מכונה להבין שפה מספיק טוב כדי לצייר תמונה היא הישג משמעותי מאוד", תמרה שוורץ, פרופסור לאבטחת סייבר במכללת יורק בפנסילבניה, אמר בראיון באימייל. "תאר לעצמך אמן סקיצות משטרתי, זה כישרון נדיר, שיש לו את היכולת ליצור תמונה על סמך תיאור עד."
שימוש ב-Big Data להפקת תמונות
DALL-E נוצר על ידי חברת המחקר בינה מלאכותית OpenAI ופועלת על ידי צבירת כמויות אדירות של נתונים מהאינטרנט. לאחר מכן הנתונים מעובדים על ידי מודל שפה טבעית ומאומנים להפיק תמונות מטקסט. DALL-E פועל בדומה ל-GPT-3 שיצא לאחרונה, מודל שפה שנוצר על ידי OpenAI שניתן לבקש ממנו ליצור קטעי טקסט מקוריים. GPT-3 הוכשר באמצעות חצי טריליון מילים של טקסט אינטרנטי ויכול להפיק טקסט אמיתי באופן מפתיע.
ללמד מכונה להבין שפה מספיק טוב כדי לצייר תמונה הוא הישג משמעותי מאוד.
מייקל יורושקין, מייסד ו-CTO של BroutonLab, חברת מדעי נתונים, אמר בראיון בדוא"ל ש-DALL-E הוא "אחד הפעמים המוצלחים של האנושות לחקות את היצירתיות והדמיון שלנו". הוא הוסיף, "קל יותר להבין כיצד בינה מלאכותית חוזה משהו על ידי מעבר על נתונים רלוונטיים, אבל קשה יותר להבין כיצד היא מסוגלת ליצור שרטוטים מתוך דברים שלא 'שמעה' עליהם קודם לכן."
שוורץ מקפיד לציין שה-AI אינו יוצר מידע, אלא לוקח נתוני שפה והופך אותם לתמונות.
"היצירתיות הראשונית מגיעה מהאדם שבנה את המשימה", אמר שוורץ. "יש קצת 'יצירתיות' מצד הבינה המלאכותית, מכיוון שהיא מתנסה בשילובים שונים של נתונים ואז בוחרת מתוך מספר תפוקות פוטנציאליות.עם זאת, אדם בוחן את התפוקות ומלמד את הבינה המלאכותית כיצד לבחור מבין השילובים הרבים."
עבודת בילוש רובוט?
מכונה יכולה להתנסות בשילוב הנתונים והאובייקטים הזה הרבה יותר מהר מאשר אמן אנושי. שוורץ ציין ש-DALL-E יוכל יום אחד להיות שותף לבלש שינסה לשחזר זירת פשע באמצעות מערכון, המבוסס על עדות של עדי ראייה.
"כאשר עדים מספקים את הצהרותיהם, המחשב יכול לקחת את המידע המדובר בשפה הטבעית וליצור ציור של הסצנה, או ציורים רבים של הסצינה", אמרה. "לאחר מכן ניתן לשלב את ההדמיות הללו כדי ליצור תמונה מדויקת יותר של ראיות אבודות. ניתן להעשיר את ההדמיה הזו על ידי שילוב תמונות קודמות של המיקום לפני הפשע."
כמה תוכניות אחרות מונעות בינה מלאכותית יכולות לייצר אמנות. לדוגמה, Ai-Da משתמשת במערכת זרועות רובוטית וטכנולוגיית זיהוי פנים בשילוב עם בינה מלאכותית כדי ליצור אמנות.המערכת יכולה לנתח תמונה שמונחת בחזית המכונה, המוזנת לתוך אלגוריתם להפקת תנועות הזרוע של הרובוט.
עם זאת, אמנים אנושיים לא צריכים לדאוג שמאסטרים רובוטיים יחליפו אותם, טען אחמד אלגמאל, מנהל מעבדת האמנות והבינה המלאכותית באוניברסיטת רוטגרס, בניו יורק טיימס בשנה שעברה.
"בעוד שההגדרה של אמנות הולכת ומתפתחת, בבסיסה, זוהי צורה של תקשורת בין בני אדם", כתב. "ללא אמן אנושי מאחורי המכונה, בינה מלאכותית יכולה לעשות מעט יותר מאשר לשחק עם צורה, בין אם זה אומר מניפולציה של פיקסלים על מסך או הערות בפנקס מוסיקלי. פעילויות אלו יכולות להיות מרתקות ומסקרנות מבחינה תפיסתית, אך חסרות להן משמעות ללא אינטראקציה בין אמן וקהל."
לאחר שבדקתי את העבודה של DALL-E, אני מבין את הנקודה של אלגמאל שהתמונות שנוצרו על ידי AI אינן אמנות. מצד שני, הם טובים יותר מכל אמנות שיכולתי ליצור. אז, באמת, מה ההבדל?