מזונות חשובים
- Nvidia הציגה לאחרונה טכניקה שהופכת תמונות דו-ממדיות לסצנות תלת-ממדיות תוך שניות בלבד.
- השיטה משתמשת בכוח המחשב כדי להעריך איך האור מתנהג בעולם האמיתי.
- The metaverse הוא אזור אחד שבו סצנות תלת-ממד מועילות מכיוון שניתן לצפות בהן מכל נקודת מבט של מצלמה.
טכנולוגיה חדשה של בינה מלאכותית (AI) מ-Nvidia עשויה להפוך בקרוב תמונות דו-ממדיות לסצנות תלת-ממדיות תוך שניות בלבד, מה שהופך את היצירה של מרחבים וירטואליים סוחפים כמו המטא-ברס לטריוויאלי כמו עיבוד תמלילים.
Nvidia הדגימה לאחרונה את שיטת הצילום הנקראת Instant NeRF, המשתמשת בכוח מחשוב כדי להעריך כיצד האור מתנהג בעולם האמיתי. זה יכול להפוך את התמונות הישנות שלך לסצנת משחק וידאו, או שהוא יכול לשמש לאימון רובוטים ומכוניות בנהיגה עצמית כדי להבין את הגודל והצורה של חפצים בעולם האמיתי.
"הדמיה תלת-ממדית מביאה לעולם חדש של טרנספורמציה", אמר אורן דבי, מנכ"ל Visionary.ai, חברת ראייה ממוחשבת שמפעילה את האלגוריתמים התלת-ממדיים שלה בפלטפורמת Nvidia, בראיון למייל ל-Lifewire. "באמצעות תלת מימד, אתה מחקה עומק בעולם האמיתי לתוך הסצנה וגורם לתמונה להיראות חיה ומציאותית יותר. מלבד מצלמות AR/VR ומצלמות תעשייתיות, שבהן התלת מימד נפוץ מאוד, אנו רואים שהוא נמצא בשימוש כמעט בכל סמארטפון ללא משתמש אפילו יודע."
הוספת מידות
התמונה המיידית הראשונה, שצולמה לפני 75 שנה במצלמת פולארויד, נועדה ללכוד את עולם התלת-ממד בתמונה דו-ממדית במהירות. כעת, חוקרי בינה מלאכותית עובדים על ההיפך: הפיכת אוסף תמונות סטילס לסצינה דיגיטלית בתלת מימד תוך שניות.
התהליך, הידוע כעיבוד הפוך, משתמש בבינה מלאכותית כדי להעריך את האופן שבו האור מתנהג בעולם האמיתי, מה שמאפשר לחוקרים לשחזר סצינה תלת-ממדית מקומץ תמונות דו-ממדיות שצולמו בזוויות שונות. Nvidia טוענת שהיא פיתחה גישה שמבצעת את המשימה הזו כמעט באופן מיידי.
Nvidia השתמשה בגישה זו עם טכנולוגיה חדשה הנקראת שדות קרינה עצביים, או NeRF. החברה אומרת שהתוצאה, המכונה Instant NeRF, היא טכניקת NeRF המהירה ביותר עד כה. המודל דורש שניות בלבד כדי להתאמן על כמה עשרות תמונות סטילס ולאחר מכן הוא יכול להציג את סצינת התלת-ממד המתקבלת תוך עשרות אלפיות שניות.
"אם ייצוגים תלת-ממדיים מסורתיים כמו רשתות מצולעים דומים לתמונות וקטוריות, NeRFs הם כמו תמונות מפת סיביות: הם לוכדים בצפיפות את הדרך שבה אור קורן מאובייקט או בתוך סצנה", דייוויד לואבקה, סגן נשיא למחקר גרפי ב- Nvidia, אמרה בהודעה לעיתונות. "במובן זה, NeRF מיידי יכול להיות חשוב לתלת-ממד כמו שמצלמות דיגיטליות ודחיסת JPEG היו לצילום דו-ממדי, מה שמגדיל באופן משמעותי את המהירות, הקלות והטווח של צילום ושיתוף בתלת-ממד."
איסוף נתונים כדי להזין NeRF מחייב את הרשת העצבית ללכוד כמה עשרות תמונות שצולמו ממספר מיקומים מסביב לסצינה, כמו גם את מיקום המצלמה של כל אחת מהצילומים האלה.
The NeRF מאמן רשת עצבית קטנה לשחזר את הסצנה על ידי חיזוי צבע האור המקרין בכל כיוון, מכל נקודה בחלל התלת-ממדי.
The Appeal of 3D
The metaverse הוא אזור אחד שבו סצנות תלת מימד שימושיות מכיוון שניתן לצפות בהן מכל נקודת מבט של מצלמה, אמר בראד קווינטון, מייסד פלטפורמת Perceptus for Augmented Reality (AR), ל-Lifewire בראיון באימייל. בדיוק כמו שאנחנו יכולים לעבור בחדר בחיים האמיתיים ולראות את תוכנו מזוויות רבות ושונות, עם סצנה תלת מימדית משוחזרת, אנחנו יכולים לנוע למעשה בחלל ולראות אותו מכל פרספקטיבה.
"זה יכול להיות שימושי במיוחד ליצירת סביבות לשימוש במציאות מדומה", אמר קווינטון.
תוכניות כמו לכידת אובייקטים של אפל משתמשות בטכניקה הנקראת פוטוגרמטריה כדי ליצור אובייקטים תלת-ממדיים וירטואליים מסדרה של תמונות דו-ממדיות. המודלים התלת מימדיים ישמשו באופן נרחב ביישומי מציאות מדומה ויישומי AR, חזה קווינטון. לדוגמה, כמה AIs, כמו זה בפלטפורמת Perceptus AR, משתמשים במודלים תלת מימדיים כדי ליצור הבנה של העולם האמיתי, המאפשרת יישומי AR בזמן אמת.
השימוש בתמונות תלת-ממד גם מחקה עומק בעולם האמיתי בסצנה וגורם לתמונה להיראות חיה ומציאותית יותר, אמר דבי. כדי ליצור אפקט Bokeh (המכונה מצב דיוקן או מצב קולנועי), יש צורך במיפוי עומק תלת מימדי. הטכניקה משמשת כמעט בכל סמארטפון.
"זה כבר הסטנדרט לצלמי וידאו מקצועיים שמצלמים סרטים, וזה הופך לסטנדרט עבור כל צרכן", הוסיפה דבי.