האקרים מוכנים לעזאזל בשיפור בינה מלאכותית

תוכן עניינים:

האקרים מוכנים לעזאזל בשיפור בינה מלאכותית
האקרים מוכנים לעזאזל בשיפור בינה מלאכותית
Anonim

מזונות חשובים

  • קולקטיב חדש של מפתחים בונה דגמי AI בקוד פתוח.
  • הקבוצה משתמשת במודלים מסיביים לאימון שפה שהיא תשחרר תחת רישיונות פתוחים.
  • בינה מלאכותית בקוד פתוח יכולה לעזור להפוך את הכוח הפוטנציאלי לשינוי משחק של הטכנולוגיה החדשה פחות מועדת להטיות וטעויות.
Image
Image

יש הרבה מחקר על בינה מלאכותית על ידי חברות גדולות (AI), אבל קבוצה מקוונת אחת רוצה לעשות דמוקרטיזציה של התהליך.

EleutherAI הוא קולקטיב שהוקם לאחרונה של חוקרים, מהנדסים ומפתחים מתנדבים המתמקד במחקר בינה מלאכותית בקוד פתוח. הארגון משתמש בבסיסי הקוד GPT-Neo ו-GPT-NeoX כדי להכשיר מודלים מסיביים של שפה שהוא מתכנן לשחרר תחת רישיונות פתוחים.

"נתוני קוד פתוח מועילים לחוקרים מכיוון שלמדענים יש יותר משאבים פנויים להשתמש בהם כדי להכשיר מודלים ולהשלים מחקר", אמר אדוארד קוי, מנכ"ל חברת AI Graviti, בראיון ל-Lifewire. החברה שלו לא מעורבת ב- EueutherAI. "אנחנו יודעים שעשרות פרויקטים של בינה מלאכותית נעצרו בגלל מחסור כללי בנתונים איכותיים ממקרי שימוש אמיתיים, ולכן חיוני ליצור הנחיות שמבטיחות איכות נתונים, בעזרת הקהילה המשתתפת."

זו הדרך

ההתחלה של EleutherAI הייתה צנועה. בשנה שעברה, חוקר בינה מלאכותית בשם קונור ליהי פרסם את ההודעה הבאה בשרת של דיסקורד: "היי חבר'ה תנו [SIC] לתת ל-OpenAI לרוץ בשביל הכסף שלהם כמו בימים הטובים."

וכך, הקבוצה הוקמה. כעת יש לו מאות תורמים שמפרסמים את הקוד שלהם במאגר התוכנה המקוון GitHub.

מאמצי AI במקור פתוח אינם חדשים.למעשה, פלטפורמת ניהול זרימת העבודה Airflow של Airbnb ומנוע גילוי הנתונים של Lyft הם התוצאות של שימוש בכלי קוד פתוח כדי לאפשר לצוותי נתונים לעבוד טוב יותר עם נתונים, ציין עלי רחמן, מנהל פרויקטים של חברת התוכנה CloudiTwins בראיון דוא ל עם Lifewire..

"כפי שמהפכת הקוד הפתוח הובילה לשינוי בפיתוח תוכנה, כך גם היא הניעה את הפיתוח והדמוקרטיזציה של מדע הנתונים והבינה המלאכותית", אמר רהמן. "קוד פתוח הפך למאפשר קריטי של פתרונות מדעי נתונים ארגוניים, כאשר רוב מדעני הנתונים משתמשים בכלי קוד פתוח."

פתיחת הדלת

פיתוח AI בקוד פתוח יכול לעזור להפוך את הכוח הפוטנציאלי לשינוי משחק של הטכנולוגיה החדשה פחות נוטה להטיות וטעויות, טוענים כמה משקיפים.

מחקר בינה מלאכותית מתרחש כעת בעיקר בשטח פתוח, כאשר כמעט כל החברות, מעבדות המחקר והאוניברסיטאות מציגות את תוצאותיהן מיד בפרסומים מלומדים, אמר קוש וארשני, חוקר בינה מלאכותית ב-IBM, בראיון למייל ל-Lifewire.

"הקהילה הפתוחה הזו חיונית, מכיוון שהיא מספקת רמות משופרות של בלמים ואיזונים כדי להבטיח ש-AI נחקר, נוצר, נפרס ומיושם באחריות", הוסיף ורשני. "זה קריטי במיוחד במצבים שבהם מערכות אלו יכולות להשפיע על חייהם של חברי החברה הפגיעים ביותר שלנו. פתיחות זו חלה לא רק על למידת מכונה כללית ואלגוריתמים של למידה עמוקה, אלא גם על אלמנטים של AI מהימן."

רמן אמר שאחד ההבדלים הקריטיים בין תוכנות קנייניות לתוכנות קוד פתוח הוא גמישות והתאמה אישית. למחקר AI קנייני יהיו בעיות באבטחה, עדכונים ואופטימיזציות.

Image
Image

"הסיבה לכך היא שהגישה מבוססת הקהילה מבוססת הקוד הפתוח מקבלת מידע רב ערך מאלפי מומחים בתעשייה המזהים פרצות אבטחה פוטנציאליות אשר לאחר מכן מתוקנות מהר יותר", הוסיף רהמן."הקונצנזוס של הקהילה אומר שהאיכות מובטחת והזדמנויות חדשות מזוהות ביתר קלות."

בעיה נוספת היא שמחקר בינה מלאכותית קניינית לא יהיה בר-פעולה הדדית, כלומר הוא לא יכול לעבוד עם פורמטים שונים של נתונים וסביר להניח שתהיה לו נעילה של ספקים, מה שמונע מחברות לבדוק ולנסות את התוכנה לפני שהם מתחייבים לפתרון, רחמן אמר.

אבל לא כל היבט של מחקר בינה מלאכותית צריך להיות בקוד פתוח, אמר כריס קנט, מנכ"ל חברת ה-AI הרפואי Reveal Surgical, בראיון למייל ל-Lifewire. "חשוב להגן על התמריצים הכלכליים המניעים את הפיתוח המסחרי של יישומי מפתח של בינה מלאכותית", אמר.

עם זאת, מחקר בנושא AI צריך רכיב חזק של קוד פתוח, אמר קנט. הוא הוסיף שקוד פתוח פועל לבניית אמון ושימוש במערכי נתונים שאינם נשלטים או לא אמורים להיות נשלטים על ידי מוסדות או חברות בודדות.

"גישת קוד פתוח היא הדרך הטובה ביותר לזהות ולפצות על הטיה בסיסית שעשויה להתקיים במערכות אימון ותוביל ליישומים הוליסטיים, יצירתיים ואמינים יותר של AI", אמר קנט.

מוּמלָץ: