paint-brush
هل يمكن لـ DeepSeek الصينية تحطيم نظرية "المزيد من وحدات معالجة الرسوميات، المزيد من القوة"؟بواسطة@linked_do
689 قراءة٪ s
689 قراءة٪ s

هل يمكن لـ DeepSeek الصينية تحطيم نظرية "المزيد من وحدات معالجة الرسوميات، المزيد من القوة"؟

بواسطة George Anadiotis9m2025/01/30
Read on Terminal Reader

طويل جدا؛ ليقرأ

نحن الآن في أوائل عام 2025، وربما نشهد بالفعل لحظة إعادة تعريف للذكاء الاصطناعي كما عرفناه خلال العامين الماضيين. هل أصبحت مقولة "كل ما تحتاجه هو المزيد من وحدات معالجة الرسوميات" على وشك التغيير؟
featured image - هل يمكن لـ DeepSeek الصينية تحطيم نظرية "المزيد من وحدات معالجة الرسوميات، المزيد من القوة"؟
George Anadiotis HackerNoon profile picture
0-item
1-item
2-item

نحن الآن في أوائل عام 2025، وربما نشهد بالفعل لحظة إعادة تعريف للذكاء الاصطناعي كما عرفناه خلال العامين الماضيين. هل أصبحت مقولة "كل ما تحتاجه هو المزيد من وحدات معالجة الرسوميات" على وشك التغيير؟


يا له من تحول غير عادي في الأحداث. أولاً، مشروع ستارجيت . يهدف المشروع المشترك الذي أنشأته شركة OpenAI وSoftBank وOracle وشركة الاستثمار MGX إلى استثمار ما يصل إلى 500 مليار دولار أمريكي في البنية التحتية للذكاء الاصطناعي في الولايات المتحدة بحلول عام 2029.


وتعد شركات آرم ومايكروسوفت وإنفيديا وأوراكل وأوبن إيه آي الشركاء التكنولوجيين الأساسيين في ما أطلق عليه "مشروع مانهاتن للقرن الحادي والعشرين"، بدعم مباشر من الإدارة الأميركية. ووصفه الرئيس دونالد ترمب بأنه "أكبر مشروع للبنية الأساسية للذكاء الاصطناعي في التاريخ".


إن قائمة الشركاء التكنولوجيين الرائدين في الولايات المتحدة في المشروع والاستثمار الضخم في ما كان بمثابة مبادرة استراتيجية للولايات المتحدة - البنية التحتية للذكاء الاصطناعي لتأمين الريادة في مجال الذكاء الاصطناعي - هو ما يدفع التوازي مع مشروع مانهاتن.


إن شركتي تصنيع شرائح الذكاء الاصطناعي في القائمة - آرم وإنفيديا - يقودهما رؤساء تنفيذيون من أصول تايوانية. وهذا أمر ملحوظ، بالنظر إلى العلاقات المتوترة المستمرة بين تايوان والصين، وحقيقة أن مشروع ستارجيت هو الأحدث في سلسلة من السياسات الأمريكية الأخيرة التي تهدف إلى تنشيط البنية التحتية والمعرفة المحلية للذكاء الاصطناعي مع فرض قيود على بقية العالم ، وخاصة الصين.


ومع ذلك، لم يكن أي من ذلك مهمًا للسوق، الأمر الذي دفع أسهم Nvidia إلى الارتفاع مرة أخرى خلال العامين الماضيين عند الإعلان عن مشروع Stargate . ولكن كل هذا كان قبل إصدار DeepSeek R1.


DeepSeek R1 هو نموذج استدلال مفتوح المصدر جديد، تم إصداره بعد أيام قليلة من الإعلان عن مشروع Stargate. تم تطوير النموذج بواسطة شركة DeepSeek الناشئة في مجال الذكاء الاصطناعي الصينية، والتي تدعي أن R1 يضاهي أو حتى يتفوق على ChatGPT o1 من OpenAI في العديد من المعايير الرئيسية ولكنه يعمل بتكلفة ضئيلة.


ما يلفت الانتباه في DeepSeek R1 هو أنه تم تطويره في الصين، على الرغم من كل القيود المفروضة على شرائح الذكاء الاصطناعي والتي تهدف إلى إعاقة القدرة على إحراز تقدم في مجال الذكاء الاصطناعي. هل يعني هذا أن الحكمة التقليدية التي تركز عليها OpenAI والولايات المتحدة والتي تقول "كل ما تحتاجه هو المزيد من وحدات معالجة الرسوميات" في مجال الذكاء الاصطناعي على وشك أن تنقلب ؟

رقائق الذكاء الاصطناعي، والمال، والموهبة، والهندسة

الحقيقة هي أنه عندما رتبنا محادثة حول رقائق الذكاء الاصطناعي مع كريس كاكريس قبل بضعة أيام، لم يكن مشروع ستارجيت ولا ديب سيك آر 1 قد ظهرا على مسرح الذكاء الاصطناعي. ورغم أننا لم نتوقع هذه التطورات بوعي، إلا أننا كنا نعلم أن رقائق الذكاء الاصطناعي موضوع يستحق الاهتمام، وكان كاكريس مطلعًا على هذا الموضوع.


لقد أصبح من التقليد إلى حد ما بالنسبة لـ Orchestrate all the Things تحليل شرائح الذكاء الاصطناعي واستضافة رؤى من الخبراء في هذا المجال، والمحادثة مع Kachris هي أحدث قطعة في هذا التقليد.


كريس كاكريس هو مؤسس ومدير تنفيذي لشركة InAccel . تساعد شركة InAccel الشركات على تسريع تطبيقاتها باستخدام مسرعات الأجهزة في السحابة بشكل أسهل من أي وقت مضى. وهو أيضًا باحث معروف على نطاق واسع ولديه أكثر من 20 عامًا من الخبرة في FPGAs ومسرعات الأجهزة للتعلم الآلي ومعالجة الشبكات ومعالجة البيانات.

بعد أن استحوذت شركة Intel مؤخرًا على شركة InAccel ، عاد كاكريس إلى البحث، حيث يعمل حاليًا كأستاذ مساعد في قسم الهندسة الكهربائية والإلكترونية في جامعة غرب أتيكا.


عند إعداد المشهد للمحادثة بهذه الأخبار في الوقت المناسب، كانت الملاحظة الافتتاحية لكاتشريس هي أن الابتكار في رقائق الذكاء الاصطناعي هو "رياضة باهظة الثمن"، وهذا هو السبب في أنه يحدث في الغالب في الصناعة وليس في الأوساط الأكاديمية. ومع ذلك، أشار في الوقت نفسه إلى أن الموارد المطلوبة لا تقتصر على المال فحسب، بل إن هذا يستلزم أيضًا الموهبة والهندسة.


بالنسبة لكاتشر، كانت السياسات الأمريكية على المسار الصحيح من حيث هدفها المتمثل في إعادة الخبرات إلى الوطن وجعل البلاد مكتفية ذاتيًا. وباعتباره مواطنًا أوروبيًا، فقد دعا الاتحاد الأوروبي أيضًا إلى تطبيق مبادرات مماثلة، إلى جانب العديد من الأصوات التي تدعو الاتحاد الأوروبي إلى تكثيف لعبته في مجال وحدة معالجة الرسوميات . ومع ذلك، هل يمكننا أن نتعلم أي شيء من النظر إلى كيفية تحقيق نجاح DeepSeek؟

التعلم من نجاح DeepSeek

وبحسب تقرير " الذكاء الاصطناعي التوليدي في دول البريكس+ "، فإن الصين، على عكس دول البريكس الأخرى، تستخدم بطاقات الرسوميات الأجنبية (عبر السحابة وفي مراكز البيانات الخاصة بها) والبطاقات المحلية التي تصنعها الشركات الصينية.


في الوقت الحالي، هناك أكثر من 10 شركات في الصين تعمل على تطوير بطاقات الرسوميات الخاصة بها، ويقال إن عملية التحول إلى وحدات معالجة الرسوميات المحلية بعد استخدام NVIDIA ليست صعبة بالنسبة للشركات الصينية.


يبدو أنه من أجل الحفاظ على القدرة التنافسية في سباق الذكاء الاصطناعي، سيتعين على الدول إعادة النظر في خياراتها، وربما استعارة صفحات من دليل اللعب الصيني . واتفق كاكريس على أن الصين كانت تتقدم بخطوات واسعة، حيث قامت أولاً بتقليد ثم تطوير تقنيات مبتكرة خاصة بها.


"إنهم قادرون على المزج والمطابقة. فهم قادرون على الجمع بين إصدارات مختلفة من وحدات معالجة الرسوميات ووحدات المعالجة الأخرى من أجل إنشاء مركز بيانات أو سحابة قوية. وهذا مفيد للغاية، خاصة إذا كنت تعتقد أنه في الماضي، كان عليك شراء معدات جديدة كل ثلاث أو أربع سنوات ربما.


"الآن أصبح الابتكار سريعًا جدًا لدرجة أنه في كل عام تقريبًا، يكون لديك المزيد والمزيد من الرقائق والمعالجات الأكثر قوة. هل من المنطقي التخلص من المعالجات التي يبلغ عمرها عامًا أو عامين؟ لذلك، بالتأكيد، تحتاج إلى إيجاد طريقة لاستغلال الموارد، حتى لو كانت موارد غير متجانسة. سيكون هذا أكثر كفاءة من حيث التكلفة"، قال كاكريس.


إن التكلفة التي تم الإبلاغ عنها لتدريب DeepSeek R1 تشكل حجة قوية لدعم هذا النهج. بالإضافة إلى التدريب على البنية التحتية غير المتجانسة، تضمن نهج DeepSeek تقليل الدقة العددية، والقدرة على قراءة الرموز المتعددة، وتطبيق تقنية مزيج الخبراء الذكية.


وتتمثل النتيجة في خفض تكاليف التدريب من 100 مليون دولار إلى حوالي 5 ملايين دولار وتقليص احتياجات الأجهزة من 100 ألف وحدة معالجة رسومية إلى 2000 وحدة فقط، مما يجعل تطوير الذكاء الاصطناعي متاحًا على وحدات معالجة الرسوميات القياسية للألعاب. وعلاوة على ذلك، حتى لو لم يكن DeepSeek مفتوح المصدر بنسبة 100% - أياً كان ما يعنيه ذلك بالنسبة لماجستير القانون - فإن عمليته يمكن تكرارها.




تشكل شرائح الذكاء الاصطناعي ونماذج الذكاء الاصطناعي مفتوحة المصدر جزءًا من التدريب الشامل للذكاء الاصطناعي العملي.


مختبرات نظرية وعملية. رحلة شاملة. مقاعد محدودة.


انقر هنا للتسجيل في دورة تدريب الذكاء الاصطناعي البراجماتي


تقييم سوق شرائح الذكاء الاصطناعي

كان رد الفعل الفوري على الأخبار هو موجة بيع واسعة النطاق ، حيث انخفض سهم Nvidia بنسبة 17% بعد الأخبار . وقد بدأ السوق بالفعل في تصحيح مساره وقت كتابة هذا التقرير، حيث أصبح الاتجاهان الهبوطي والصعودي متوقعين إلى حد ما.


من ناحية أخرى، أثبتت DeepSeek أن هناك مجالًا كبيرًا لتحقيق مكاسب في الكفاءة في تدريب نماذج الذكاء الاصطناعي ذات الأداء الأفضل، مما يقوض بشكل نشط الحكمة التقليدية. من ناحية أخرى، لا يعني هذا أن Nvidia لم تعد الرائدة ، ويمكننا أن نتوقع رؤية مفارقة جيفون في العمل مرة أخرى .


حافظت Nvidia على وتيرة الابتكار في عام 2024 ، حيث أعلنت عن أحدث بنية Blackwell الخاصة بها وشحنتها لاحقًا، ووسعت نظامها البيئي وحققت العديد من المعالم المالية والتجارية. وسلط كاكريس الضوء على أن Nvidia لم تعد تبيع الرقائق فحسب، بل انتقلت نحو التكامل الرأسي لتقنية NVLink الخاصة بها مع رقائقها على منصة DGX .


لكن وحدات معالجة الرسوميات من Nvidia ليست اللعبة الوحيدة في المدينة. فقد أعلنت AMD من جانبها عن مسرع ذكاء اصطناعي جديد، Instinct MI325X . وكما أشار كاتشريس، فإن سلسلة MI300 قوية للغاية، وتتميز بوحدات متخصصة لتسريع المحولات - وهي بنية أساسية لنماذج اللغات الكبيرة. ويُزعم أن نمو AMD مدفوع بمركز البيانات ومنتجات الذكاء الاصطناعي .


ستكون الغالبية العظمى من الأشخاص والمنظمات من مستخدمي الذكاء الاصطناعي، وليسوا منشئي الذكاء الاصطناعي. بالنسبة لهم، فإن استخدام أو حتى بناء تطبيقات الذكاء الاصطناعي ليس في الحقيقة مسألة تدريب نموذجهم الخاص، بل استخدام أو ضبط نموذج مدرب مسبقًا.


كما أشار كاكريس إلى التقدم الذي أحرزته شركة إنتل مع Gaudi. ولكن على الرغم من قدرات الأداء العالية التي يتمتع بها Gaudi 3، إلا أن إنتل تبدو متأخرة من حيث حصة السوق، ويرجع ذلك إلى حد كبير إلى البرمجيات . وفي الوقت نفسه، تتخذ إنتل خطوات لبيع وحدة FPGA الخاصة بها، Altera .


ويؤكد كاتشرس أن وحدات FPGA قد لا تكون الحل الأكثر كفاءة لتدريب الذكاء الاصطناعي، ولكنها مفيدة للغاية في الاستدلال، وهنا تكمن المساحة الكافية للمنافسة والابتكار. وهذا هو على وجه التحديد ما كانت InAccel تعمل عليه ــ بناء طبقة برمجية للعمل مع وحدات FPGA ــ وهو ما أدى إلى استحواذ شركة إنتل عليها.


بطبيعة الحال، أكد كاكريس على أهمية طبقة البرمجيات. ففي نهاية المطاف، حتى لو كانت الشريحة تتمتع بأداء متفوق، إذا لم يكن من السهل استخدامها من قبل المطورين عبر طبقة البرمجيات، فإن هذا من شأنه أن يعيق تبنيها. وتحتفظ إنفيديا بميزة كبيرة في طبقة البرمجيات بسبب مجموعة أدوات CUDA التي تمتلكها ، والتي تواصل الاستثمار فيها.


وتبذل بقية الصناعة، بقيادة شركة إنتل عبر مبادرة UXL Foundation / OneAPI ، جهوداً لمواكبة التطور. وتمتلك شركة AMD طبقة برمجية خاصة بها ــ ROCm. ولكن اللحاق بالركب لن يحدث بين عشية وضحاها. وكما قال كاتشرس، يتعين على طبقة البرمجيات أن تمكن من استخدام طبقة الأجهزة دون تغيير سطر واحد من التعليمات البرمجية.


كما تعمل شركة Nvidia على تكثيف استراتيجيتها في مجال الاستدلال والبرمجيات من خلال إطار عمل NIM الذي أصدرته مؤخرًا ، والذي يبدو أنه اكتسب بعض التبني . كما تركز المنافسة أيضًا على الاستدلال . هناك مجموعة من المنافسين مثل Groq و Tenstorrent و GraphCore و Cerebras و SambaNova ، يتنافسون على قطعة من فطيرة سوق الاستدلال.

الحافة: التسارع وكفاءة الطاقة

في حين أن DeepSeek هو عرض بارز لفوائد التحسين، إلا أنه ليس العرض الوحيد. شارك Kachris في دراسة استقصائية شاملة ومقارنة حديثة لتسريع الأجهزة في برامج LLM ، حيث كان العديد منها موجهًا نحو الاستدلال.


تتمثل إحدى الطرق لتحقيق ذلك في القيام بذلك عبر واجهات برمجة التطبيقات الخاصة بموفري الذكاء الاصطناعي - عادةً OpenAI أو Anthropic. ومع ذلك، بالنسبة لحالات الاستخدام الأكثر تعقيدًا، ولأسباب تتعلق بالخصوصية أو الامتثال أو الميزة التنافسية أو متطلبات التطبيق أو التكلفة، سيرغب المستخدمون النهائيون في نشر نماذج الذكاء الاصطناعي على البنية الأساسية الخاصة بهم.


يشير جاري ماركوس إلى خمسة أشياء يبدو أن معظم الناس لا يفهمونها حول DeepSeek

قد يشمل ذلك مجموعة كاملة من البيئات، بدءًا من السحابة المحلية والخاصة إلى الحافة والجهاز العاري. وخاصة مع برامج إدارة التعلم الآلي، هناك حتى خيار تشغيلها محليًا على أجهزة جاهزة . سألنا كاتشرس عما إذا كان يعتقد أن النشر المحلي / الحافة لبرنامج إدارة التعلم الآلي منطقي.


وأشار كاتشرس إلى أن الاستدلال قد ينجح مع الإصدارات "المصغرة" أو "المكممة" من نماذج الذكاء الاصطناعي. وتشير الأبحاث إلى أن الإصدارات ذات البت الواحد من النماذج قابلة للتطبيق . وأشار كاتشرس إلى أنه على الرغم من وجود بنيات أجهزة متخصصة، فإن وحدات معالجة الرسوميات ووحدات FPGA المتوفرة على نطاق واسع توفر أفضل أداء، مع كون وحدات FPGA أكثر كفاءة في استخدام الطاقة.

المضي قدمًا: الابتكار والتخصص

وفيما يتعلق بالتطورات المستقبلية، سلط كاتشرس الضوء على الحوسبة في الذاكرة باعتبارها مجالاً يستحق المتابعة. والفكرة الرئيسية هنا هي القدرة على الجمع بين التخزين والحوسبة على نفس الوحدة، وبالتالي القضاء على الحاجة إلى نقل البيانات وتحقيق أداء أفضل. وهذا مستوحى من الطريقة التي تعمل بها الشبكات العصبية البيولوجية، ويشار إليه بالحوسبة العصبية الشكلية.


هناك المزيد من مجالات التطورات الجديرة بالملاحظة، مثل الشرائح الصغيرة ، وهي شرائح متخصصة مصممة خصيصًا لهندسة المحولات التي تعمل على تشغيل أجهزة LLM ، والتكنولوجيا الفوتونية ، ولغات البرمجة الجديدة للذكاء الاصطناعي .


وفيما يتعلق بالآفاق القصيرة والمتوسطة المدى، والسؤال حول ما إذا كان هناك مجال للابتكار في عالم تهيمن عليه شركة إنفيديا، يعتقد كاتشريس أن الأنظمة المضمنة والذكاء الاصطناعي الحافة تمثل فرصة للمنافسين:


"توجد متطلبات ومواصفات مختلفة في مجال الذكاء الاصطناعي الطرفي. أعتقد أن هناك مجالًا للابتكار في الذكاء الاصطناعي الطرفي، على سبيل المثال في تطبيقات الفيديو للمستشفيات، أو القيادة الذاتية والطيران.


أعتقد أن هذا سيحدث. دعنا نتحدث عن وحدات معالجة الرسوميات. إن شركة NVIDIA هي الشركة الرائدة في وحدات معالجة الرسوميات، ولكن كان هناك نقص في وحدات معالجة الرسوميات للأجهزة القابلة للارتداء. ورأينا شركة رائعة، Think Silicon ، تتقدم وتطور وحدة معالجة رسوميات متخصصة في الأساور الرياضية أو الساعات الذكية، ثم استحوذت عليها شركة Applied Materials .


"إن الابتكار سوف يحدث في مجالات صغيرة جدًا بالنسبة لشركات مثل Nvidia أو Intel، ولكنها جيدة بما يكفي للشركات الأصغر حجمًا التي يمكنها صنع منتجات متخصصة".


انضم إلى النشرة الإخبارية Orchestrate all the Things

قصص حول كيفية تدفق التكنولوجيا والبيانات والذكاء الاصطناعي ووسائل الإعلام إلى بعضها البعض وتشكيل حياتنا.

تحليلات ومقالات ومقابلات وأخبار. من المتوسط إلى الطويل، من مرة إلى ثلاث مرات شهريًا.

انقر هنا للاشتراك