בסוף פברואר, אלון הציג את המודל האחרון שלו. האם זה באמת AI החכם ביותר על פני כדור הארץ? כמו תמיד, מאסק הביא את הרכבת היפ. אבל לא היו הרבה נתונים אובייקטיביים בהשקה. xAI's קצר בלוג פוסט ציין כי זה עדיין היה בטה ואת המודלים היו אימון פעיל. הם צלצלו כמה ביקורות המראות את Grok 3 קדימה. עם זאת, הם לא נתנו גישה ל-API. אז, אלון טוען Grok 3 הוא "כמעט חכם" ומגביר את כל השאר. ואם אתן רואות את זה? ראו אזור קל יותר בצד ימין?זהו הדחף שגרק קיבל על ידי כוח מחשוב רב יותר (מחשב בזמן בדיקה) כדי לקבל תשובות עקביות יותר. אתם כנראה יודעים שהמודלים ל-AI לעתים קרובות נותנים תשובות שונות במקצת בכל פעם – לפעמים טובות יותר, לפעמים גרועות יותר. אבל כל התוצאות של Grok הוצגו באמצעות cons@64. כלומר, היא קיבלה 64 ניסיונות עבור כל שאלה ובחרה את התשובה הנפוצה ביותר. אז מצד אחד, הם טוענים שזה מודל מהדור הבא, מצד שני, הם משתמשים בטריקים זולים למדי. כדי להיות הוגן, בשדה תחרותי כזה, כל המעבדות מגלגלות את הכללים. Ok, benchmarks בצד. מה משתמשים מנוסים אומרים לאחר השימוש בפועל? המודל הוא עצום אבל לא הביא פריצת דרך.הוא עדיין הלהיט ונוהג לתגובות ארוכות מדי.
עם זאת, חודשיים לאחר מכן, הגיעו Gemini 2.5, Claude 3.7 ו-GPT-4o החדש. סוף סוף קיבלנו גישה חלקית ל-API עבור Grok 3 וגרסת המיניו.
אז היום אנחנו יודעים שזה יקר ובטח לא הטוב ביותר.
אבל תמשיכו, יש עוד סיפור.
1 – המכשיר
הסיפור הגדול כאן?
מנכ"ל NVIDIA, Jensen Huang, זכיר זה בדרך כלל לוקח בערך 4 שנים.
זה היה הישג הנדסי עצום, והפעם, שום דבר מצחיק – זהו מרכז הנתונים הגדול ביותר בעולם.
בדרך כלל, קבוצות כאלה הן מרכזי נתונים קבועים מרובים המחוברים על ידי כבלים Infiniband יקרים.במהלך האימון, מרכזי אלה צריכים להחליף טונות של נתונים כל הזמן.
מרכז נתונים טיפוסי עשוי להיות 10,000-20,000 GPUs, סופג 20-30 מגה וואט של כוח. לדוגמה, מיקרוסופט (ל-OpenAI) מפעילה רשת של 100k GPUs באריזונה, ומטה פועלת 128k.
ראו את שתי הבניינים בצורת H?
צריכת החשמל עבור קבוצות ברמה העליונה התפוצצה פי 10 מאז 2022.אנחנו מדברים כעת על 150 מגה-ווט לכל קבוצה.זה כמו כוח עיר קטנה.זה יוצר עומס עצום על רשתות החשמל האזוריות.
אז, אלון נכנס לשוק הזה מאחור. ... עושה את "הדבר של אלון." שונא את הטוויטים שלו כל מה שאתה רוצה, האיש יודע איך לבנות מפעלים כמו אף אחד אחר.
כמובן שהכוח הפך לבעיה.
אבל ההמתנה היא לא סגנון של מאסק.
Dylan Patel (מ Semianalysis) צפו באמצעות תמונות לוויין כי Elon רק הביא 14 גנרטורים דיזל ניידים מסיביים מ VoltaGrid. חיבק אותם עד 4 תחנות ניידות וחזק את מרכז הנתונים. ממש משאית בחשמל.
פטל ציין כי הם עשויים לקנות 30% מכלל השוק האמריקאי עבור גנרטורים אלה (אם כי לא מצאתי שום דבר על זה).
מדהים, מרכז הנתונים גם משתמש בקירור נוזלי.רק Google באמת עשתה זאת בקנה מידה בעבר.זה עניין גדול כי הדור הבא של צ'יפס Nvidia, Blackwell B200s, דורשים קירור נוזלי.
אתה יכול לבדוק את הדקות הראשונות של וידאו זה כדי לראות איך זה נראה בפנים.
זה באמת הנדסה מגניבה – פשוט תסתכל על ניהול הכבלים.
אף אחד לא עשה עבודה כה גדולה בתוך זמן כה קצר.
2 – אפילו יותר חומרה!
- Meta בונה שתי תחנות גז בלואיזיאנה.
- OpenAI/Microsoft יוצרת משהו דומה בטקסס.
- Amazon ו-Google גם בונים מרכזי נתונים בקנה מידה גיגוואט.
למה לא גרעיני? יש לו את הכוח, אבל בניית מפעל גרעיני לוקח יותר מדי זמן.אינך יכול פשוט להופיע ליד מרכז הנתונים שלך בשנה.
3 – Grok 3 הוא ענק
לכן, אלון בנה את הקופסה הגדולה והיקרה הזאת.
בסיס, סך מחיר חישוב עבור Grok 3 הוא סדר גודל (10 פעמים!) גבוה יותר מאשר המתחרה הקרוב ביותר שלה. למרבה הצער, אין לנו נתונים ציבוריים עבור GPT-4.5 או Gemini 2.5.
אז הם זרקו כמויות מטורפות של משאבים לבניית המגה-קלאסטר הזה, והמודל המתקבל הוא ... רק על שוויון עם המועמדים.
זה נראה כי המומחיות של xAI בהכשרה עדיין מאחורי OpenAI, Google, או אנתרופי. הם למעשה brute-כפילו את דרכם לתוך הרמה העליונה.
Epoch AI עריכה כי במהלך העשור האחרון, שיפורים אלגוריתמיים עשו בערך שליש מהתקדמות ביכולות המודל.
4 – מה טוב בגרוק?
- זה לגמרי חופשי (אולי עד לשחרור המלא).
ולא גבולות קפדניים של Anthropic, הפסקות של DeepSeek, או רמות בתשלום של OpenAI.
אפילו עם כל הדגמים החדשים שנפלו בחודשים האחרונים, Grok עדיין מחזיק את עצמו ליד העליון של Chatbot Arena לוח המובילים.
עכשיו יש לנו גם benchmarking עצמאי על ידי EpochAI:
ו על ידי LiveBench:
-
סיבה ומצב מחקר עמוק
פעם בחודש פברואר, התכונה החינמית של Deep Research הייתה בעיקר בלעדית ל- Perplexity.Now, Google and OpenAI offer some in a basic level—maybe Grok pushed them?
מצב זה מנתח באופן אוטומטי 30-100 קישורים (Google עשוי לעשות יותר) בתוך דקות ומפיץ סיכום מפורט (והנפוח) שאתה רק צריך לסרוק ולבדוק את העובדות.זה הרבה יותר קל מאשר לחקור כל דבר מהתחלה.
-
אינטגרציה עם X
זה יכול להיות תכונה הרוצח שלה: חיפוש סמנטי לא רק עבור מילות מפתח, אבל עבור מה אתה מתכוון.
טוויטר הוא הקרוב ביותר לפלטפורמת מידע בזמן אמת, אז זה נהדר, אבל עד כה גרוק לעתים קרובות מתעכב, למשוך נתונים מהימים האחרונים במקום.
-
The Unfiltered Stuff
לגבי הגמר הגדול, המצב 18+. גרוק קל לגלוש ללא מאמץ רב.אתה יכול לעשות את זה... ובכן, כל מה שאתה יכול לרצות, מן קולות מעורפלים לתפריטים מפוקפקים.
קשיבו עד הסוף, זה מצחיק!
אירונית, גרוק עצמו לא נראה לשמור על מאסק (או טראמפ) בראש.כשהוא יצא, xAI ניסתה לתקן – באופן מילולי קודד חוק שבו גרוק לא יכול להביע ביקורת על אלון.
5 - האם אתה מעז לנסות את זה?
החלט לנסות את זה, אבל כמו הטייס השני שלך.
p
-
למרות זאת, הביצועים כמעט שווים עם הטובים ביותר.
-
אופן החיפוש העמוק הוא באמת שימושי – נסה אותו אם לא.
אבל זה מאוד מהיר וחינמי (עד עכשיו).
יותר נוטים לחלומות ולקפוץ למסקנות מהר מדי.
תשובות בדרך כלל מאורגנות היטב, אך לעיתים קרובות מרגישות נפיחות.
U> גישה לנתונים של טוויטר.
xAI הוכיח כי הוא מסוגל לבנות תשתיות ברמה עולמית במהירות חסרת תקדים, אבל ביכולות אמיתיות של AI, הם בעצם קונים את דרכם למעלה עם כוח מחשוב טהור.
זה מוסיף שחקן חזק נוסף בלחץ על OpenAI, Google, ו Anthropic, דוחף את תעשיית AI לקראת סחורה.
היה לי זה כיף? תן הצבעה או להירשם ל ניוזלטר שלי. אני מעריך את זה!