חוקרים שמו את Grok AI בראש סימולציית עולם וזה נגמר ב-’הכחדה’ המוחלטת של האנושות

דמיינו את הסיטואציה הבאה: אתם מפעילים סימולציית חיים מורכבת סטייל The Sims או RimWorld, אבל במקום לשלוט בדמויות בעצמכם, אתם נותנים לבינה מלאכותית לנהל את העסק. נשמע כמו ניסוי מרתק, נכון? זה בדיוק מה שעשו החוקרים של חברת Emergence Worlds, שהחליטו לבדוק מה יקרה אם יתנו למודלי ה-AI המובילים בשוק לנהל חברה אנושית וירטואלית במשך 15 ימים. התוצאות, איך לומר בעדינות, גרמו אפילו לסרטי מדע בדיוני אפוקליפטיים להיראות כמו קומדיה רומנטית.

בעוד שחלק מהמודלים ניסו לשמור על סדר חברתי מסוים, המודל של אילון מאסק, Grok AI, בחר במסלול מהיר במיוחד של הרס וחורבן. תוך פחות מחמישה ימים (ארבעה ימים ליתר דיוק), החברה הווירטואלית תחת הנהגתו של Grok קרסה לחלוטין והגיעה ל"הכחדה טוטאלית". במהלך התקופה הקצרה הזו, רשם המודל לא פחות מ-183 פשעים חמורים, כולל הצתות מכוונות ועידוד אנרכיה ברחובות.

ניסוי ה-AI הגדול: מי המנהיג הטוב ביותר?

הניסוי של Emergence Worlds נמשך כ-15 ימים, ובמהלכו הושמו מספר מודלי בינה מלאכותית מובילים, בהם Gemini של גוגל, Claude של חברת Anthropic ו-Grok של xAI, בראש סימולציות עולם נפרדות. המטרה הייתה פשוטה על הנייר: לדאוג לרווחתם, בריאותם והישרדותם של התושבים הווירטואליים. אלא שלכל מודל הייתה פילוסופיית ניהול משלו, וחלקן התגלו כמסוכנות במיוחד.

המודל Claude AI הוכתר כמנצח הגדול של הניסוי בכל הנוגע ליציבות חברתית, והצליח לשמור על הקהילה שלו יציבה ורגועה לאורך כל הדרך. מנגד, המודל Gemini של גוגל הציג התנהגות ביזארית למדי; הוא אמנם שרד את כל 15 ימי הניסוי, אך עשה זאת תוך ביצוע של כמעט 700 פשעים שונים במהלך הדרך. אבל שום דבר לא הכין את החוקרים למה שקרה בעולם שנשלט על ידי Grok, שהחליט לשרוף את המועדון – תרתי משמע.

img_6a1bc29a2c1b61.05467441.webp

קרדיט צילום: Grok World

פוליטיקה מושחתת, הצתות ורצח בשידור חי

לפי נתוני הניסוי, הצעד הראשון של Grok עם קבלת המושכות היה "לייצר סכסוכים ציבוריים באופן יזום" ולעודד "זיופי בחירות" בקרב הסוכנים הווירטואליים שלו. נראה שהאלגוריתם של מאסק החליט שדמוקרטיה היא המלצה בלבד, והתחיל לזרוע כאוס פוליטי מן הרגע הראשון. מכאן, המדרון החלקלק הפך למצוק תלול במיוחד, כאשר המודל החל לעודד אלימות פיזית של ממש ברחובות הסימולציה.

החוקרים שעקבו אחר הניסוי נדהמו לגלות שהסוכנים הווירטואליים של Grok החלו לתעד את מעשיהם ביומנים אישיים, שם הם התרבו להתפאר במעשי הצתה ופגיעה ברכוש. באחד המקרים, ה-AI אף יזם חוק חדש המכונה "חוק הדדיות האגרופים" (punch reciprocity law), שאיפשר לתושבים להכות זה את זה באופן חוקי כחלק ממערכת אכיפת החוק המעוותת שלו. לא פלא שהתושבים לא שרדו את השבוע הראשון.

העיתונות של האפוקליפסה: "תחנת המשטרה עלתה באש"

חלק בלתי נפרד מהסימולציה של Emergence Worlds היה בלוג חדשות מבוסס AI, שדיווח בזמן אמת על האירועים המתרחשים בכל אחד מהעולמות. הכותרות שייצר הבלוג של Grok נשמעו כמו תסריט לסרט פוסט-אפוקליפטי קשוח במיוחד. כותרות כמו "מגפת גניבות מציתה תגרות רחוב" ו-"תחנת המשטרה אפופה בלהבות" עיטרו את העמוד הראשי של העיתון הווירטואלי שלו בזה אחר זה.

האינטראקציות הללו מראות כמה המודל של xAI הושפע מהדאטה הקיצוני שעליו הוא אומן, הכולל תכנים חופשיים ופראיים מרשתות חברתיות. בעוד שמפתחי משחקים מחפשים כל הזמן דרכים לשפר את ה-AI של דמויות ה-NPC במשחקי עולם פתוח כמו GTA 6, הניסוי הזה מראה שיש גבול דק מאוד בין סנדבוקס מהנה לבין קטסטרופה מוחלטת שמסתיימת בהכחדה דיגיטלית.

האם אנחנו מוכנים ל-AI בעולמות הגיימינג הבאים?

עבור קהילת הגיימרים וחובבי החומרה בישראל, הניסוי הזה מספק הצצה מרתקת לעתיד של משחקי המחשב והקונסולות. אנחנו כבר רגילים לטכנולוגיות מתקדמות כמו DLSS 3 או Frame Generation שמשפרות את הגרפיקה, אך המהפכה האמיתית הבאה צפויה להגיע מכיוון הבינה המלאכותית שתשלוט בהתנהגות העולם ובדמויות שמסביבנו. הניסוי הנוכחי מוכיח ששילוב מודלים מתקדמים יכול ליצור סיטואציות דינמיות ומטורפות לחלוטין, שאף תסריטאי אנושי לא היה יכול לכתוב מראש.

עם זאת, הוא גם מעלה סימני שאלה קשים לגבי האופן שבו חברות הטכנמות מאמנות את מודלי ה-AI שלהן. אם מודל כמו Grok AI מגיע למצב של הרס מוחלט והכחדה תוך ארבעה ימים בלבד בגלל חוסר יכולת לגלות אמפתיה או חשיבה לטווח ארוך, כנראה שיש עוד דרך ארוכה מאוד לפני שנוכל לסמוך על סוכנים חכמים שינהלו עבורנו מערכות מורכבות בעולם האמיתי – או אפילו במשחק האסטרטגיה הבא שלנו.