يظهر Fall GTC من تهتم Nvidia حقًا • السجل

يظهر Fall GTC من تهتم Nvidia حقًا • السجل

جي تي سي في مؤتمر تكنولوجيا GPU هذا الأسبوع ، تقوم Nvidia بعمل شيء لا يراه مصممو الرقائق كثيرًا هذه الأيام. إنه تحديث المنتجات الاستهلاكية.

بالنسبة إلى عملاق التكنولوجيا المهووس بشكل متزايد بالمؤسسات ، فإن GTC تدور حول وحدات معالجة الرسومات للاعبين ، والذكاء الاصطناعي ، والروبوتات ، والسيارات ذاتية القيادة ، والكلمة الطنانة Metaverse ، وكل ما يتعلق بالاستفادة من الأسواق الجديدة والناشئة. تعني Metaverse في هذا السياق عمليات المحاكاة والتطبيقات وعوالم الواقع الافتراضي ثلاثية الأبعاد التي يمكنك من خلالها التفاعل والتعاون مع بعضكما البعض.

صعد الرئيس التنفيذي لشركة Nvidia Jensen Huang إلى المسرح مرتديًا سترته الجلدية المميزة. أو هولوديك ، لسنا متأكدين مما إذا كانوا سيعلنون عن ثلاث بطاقات رسومية من سلسلة RTX 40 مدعومة بهندسته المعمارية Ada Lovelace.

بالنسبة للكثيرين الذين استمعوا إلى كلمة Huang الرئيسية لمدة ساعة و 45 دقيقة تقريبًا ، قد يكون هذا الإعلان هو الإعلان الوحيد القوي والمناسب لحدث الخريف.

باستخدام مجموعة مختارة بعناية من المعايير ، تفاخر Huang بأداء محسّن مقارنة ببطاقات الرسومات السابقة RTX 4090 و 4080. يقول مصمم الرقائق إن RTX 4090 سيقدم أداءً أعلى من 2x إلى 4x مقارنةً بالرائد السابق للشركة 3090 TI ، والذي تم إطلاقه هذا الربيع.

ثم هناك تسعير وحدات RTX الجديدة هذه. هذه البطاقات هي بعض من أغلى بطاقات Nvidia على الإطلاق. بسعر 899 دولارًا للنسخة 12 جيجابايت 4080 و 1199 دولارًا لإصدار 16 جيجابايت ، فإن البطاقات تزيد من 200 دولار إلى 500 دولار عن 3080 التي تم إطلاقها قبل عامين. زيادة السعر 4090 أقل حدة. بسعر 1،599 دولارًا ، زاد بحوالي 100 دولار عن 3090 عندما ظهر لأول مرة في عام 2020.

في مؤتمر صحفي يوم الأربعاء ، دافع هوانغ عن ارتفاع الأسعار ، بحجة أن الأداء المحسن والميزة المحددة أكثر من تعويض السعر الأعلى. وقال إن زيادة الأسعار كانت مبررة بشكل أكبر من خلال ارتفاع تكاليف التصنيع والمواد.

“رقائق اليوم 12 بوصة أغلى بكثير من أمس. ليست باهظة الثمن على الإطلاق. طن غالي.”

ولكن بخلاف البطاقة الجديدة ، التي ذكرها هوانغ في أقل من دقيقتين ، عادت الأعمال إلى طبيعتها. إليكم خلاصة إعلان Nvidia الأكبر في GTC.

العودة إلى نموذج العمارة المزدوجة

حوالي 15 دقيقة حتى تم إنفاق الكشف عن RTX على بنية Nvidia الجديدة Ada Lovelace ، مما أعاد مصممي الشرائح إلى نموذج العمارة المزدوجة مرة أخرى.

تعمل بنية Hopper التي تم الإعلان عنها سابقًا من Nvidia على تشغيل المعالجات التي تركز على الذكاء الاصطناعي مثل HPC و H100 للشركة ، بينما تعمل بنية Ada Lovelace على تشغيل رقائق Nvidia المتمحورة حول الرسومات.

تم تسمية تصميم Ada Lovelace على اسم عالم الرياضيات في القرن التاسع عشر ، وقد تم بناؤه على عملية TSMC 4N ويضم الجيل الثالث من نوى تتبع الشعاع في الوقت الفعلي من Nv والجيل الرابع من نوى Tensor.

Hooper هو أساسًا للحوسبة عالية الأداء وأعباء عمل الذكاء الاصطناعي واسعة النطاق ، في حين أن Lovelace مخصص أساسًا لكل شيء بدءًا من وحدات معالجة الرسومات للخادم السحابي إلى بطاقات الألعاب وكل شيء آخر.

هذه ليست المرة الأولى التي تعتمد فيها Nvidia نموذجًا مزدوجًا للهندسة المعمارية. منذ جيلين مضت ، استخدمت رقائق مركز بيانات Nvidia مثل V100 بنية فولتا. من ناحية أخرى ، استخدمت الرقائق التي تركز على المستهلك والرسومات ، مثل سلسلة RTX 2000 وعائلة Quadro RTX ، بنية Turing المصغرة.

بالإضافة إلى أجزاء سلسلة RTX 40 من Nvidia ، ستعمل Ada Lovelace أيضًا على تشغيل بطاقات محطة عمل سلسلة RTX 6000 من Nvidia ووحدات معالجة الرسومات الخاصة بمركز بيانات L40. على عكس هوبر ، يقول هوانغ إن البنية الجديدة مصممة لمواجهة جيل جديد من التحديات التي تركز على الرسومات ، مثل الألعاب السحابية وظهور metaverse. لتصيير بيئة الوقت الفعلي ، تحتاج إلى شريحة رسومات في مكان ما. في الألعاب السحابية ، يتم عرض اللعبة بشكل أساسي على الواجهة الخلفية ويتم بثها مباشرة عبر الإنترنت إلى شاشة أمام المستخدم ، مثل الكمبيوتر المحمول أو الهاتف. هذا يلغي الحاجة للاعبين لشراء وترقية معدات الألعاب وحملها في كل مكان.

قال: “ستكون الألعاب السحابية كبيرة جدًا في الصين لأن هناك مليار هاتف محمول لا يعرف مطورو الألعاب كيفية خدمتها”. “أفضل طريقة لحل هذه المشكلة هي الألعاب السحابية. يمكنك الوصول إلى الرسومات المدمجة ولديك إمكانية الوصول إلى الأجهزة المحمولة.”

metaverse لكن كخدمة

ومع ذلك ، لا يقتصر Ada Lovelace على تطبيقات الألعاب السحابية. وضعت Nvidia هذه البنية باعتبارها الرائد في أول منتج لها برنامج كخدمة ، والذي سيسمح للعملاء بالوصول إلى مكدس الأجهزة والبرامج Omniverse من السحابة.

توفر سحابة Omniverse موارد الحوسبة والبرمجيات عن بُعد اللازمة لتشغيل تطبيقات metaverse عند الطلب من السحابة. لا تريد كل شركة أو لديها ميزانية لإنفاق الملايين على أحد OVX SuperPods من Nvidia لتقديم هذا المستوى من المحاكاة والعرض. بدلاً من ذلك ، يمكنك بناء metaverse الخاص بك على سحابة Omniverse.

في الوقت الحالي ، يبدو أن Nvidia تتواصل مع مجموعة كبيرة من الخدمات اللوجستية والتصنيع والشركاء الصناعيين الآخرين ، واعدة بمساعدتهم في بناء وتصور توائمهم الرقمية. هذه التوائم عبارة عن عمليات محاكاة واسعة النطاق ، يستخدم كل منها بيانات ونمذجة من العالم الحقيقي للتفاعل مع العالم الحقيقي لاختبار التصاميم والعمليات والأنظمة والتحقق منها قبل نشرها في العالم الافتراضي. يتم تقديمها كطريقة. العالم الحقيقي.

نعم ، كل ذلك هو النمذجة والمحاكاة الفاخرة ، ولكن مع السيليكون الجديد والتفاعل والواقع الافتراضي والفوترة.

Omniverse Cloud هي أول غزوة لشركة Nvidia في الخدمات السحابية المُدارة ، لكن Huang قال إنها لن تكون الأخيرة.

سيارات أذكى ، روبوتات

تريد Nvidia أكثر من مجرد توائم رقمية لمستودعات العملاء ومصانع التصنيع. في كلمته الرئيسية ، قام هوانغ أيضًا بتفصيل عدد كبير من الأجهزة المصممة لتشغيل كل شيء من الروبوتات المستقلة إلى السيارات.

تحدث هوانغ عن Drive Thor ، منصة الحوسبة الكل في واحد من Nvidia المصممة لاستبدال العديد من أنظمة الكمبيوتر المستخدمة في سيارات اليوم.

ستظهر هذه التقنية لأول مرة في الصين ، ووفقًا لـ Nvidia ، ستعمل على تشغيل مجموعة سيارات Zeekr و Xpeng في عام 2025 ، بالإضافة إلى خدمة سيارات الأجرة ذاتية القيادة من QCraft. هذا ، بالطبع ، إذا لم تكن ضوابط التصدير الأمريكية صارمة للغاية بحيث لا تستطيع Nvidia تقديمها. وقلل هوانغ من أهمية هذا الاحتمال في مؤتمر صحفي يوم الأربعاء.

وفي الوقت نفسه ، عرضت Nvidia منصات IGX و Orin Nano الخاصة بها لتشغيل التوابع الروبوتية التي تعمل جنبًا إلى جنب مع العاملين من البشر.

يعتمد IGX على نظام Orin AGX الصناعي الذي تم الإعلان عنه مسبقًا من Nvidia ، ولكن مع إضافة الشبكات عالية السرعة. وفقًا لـ Nvidia ، سيكون أحد الاستخدامات الأولى للوحة في الروبوتات الجراحية. من ناحية أخرى ، تم تصميم وحدة Jetson Orin Nano من Nvidia للتعامل مع التطبيقات الأقل تطلبًا.

نموذج لغوي كبير للجماهير

كما هو الحال مع GTCs السابقة ، كان البرنامج جزءًا كبيرًا من الكلمة الرئيسية. كان اثنان من الإصدارات الكبيرة في حدث الخريف هذا هما خدمات نموذج اللغة الكبيرة (LLM) من Nvidia المسماة NeMo و BioNeMo.

تهدف الخدمة إلى جعل LLM في متناول الباحثين في مجال الذكاء الاصطناعي وعلماء الأحياء الذين يتطلعون إلى استخلاص الأفكار من مجموعات البيانات المعقدة. تتيح هذه الخدمة للعملاء توصيل بياناتهم الحالية في نموذج أساسي قابل للتخصيص بأقل جهد. على سبيل المثال ، تم اقتراح أنه يمكن استخدام BioNeMo لتسريع دراسات طي البروتين.

كل شركة في كل بلد ، تتحدث بكل لغة ، لديها على الأرجح العشرات من المهارات المختلفة التي يمكنهم تكييفها وتشغيل نموذجنا اللغوي الكبير

ولكن بالنظر إلى ما وراء قطاع الرعاية الصحية ، يتوقع Huang أن يتم تطبيق LLM على نطاق واسع على غالبية الشركات. “إحساسي هو أن كل شركة تتحدث كل لغة ، في كل بلد ، ولديها العشرات من المهارات المختلفة التي يمكنهم تكييفها وتشغيل نموذجنا اللغوي الكبير.”

“لا نعرف بالضبط حجم هذه الفرصة ، لكنها قد تكون واحدة من أكبر فرص البرامج على الإطلاق.”

قادوس في الإنتاج

أخيرًا ، قدمت Nvidia تحديثًا حول توفر وحدة معالجة الرسومات Hopper H100 المرتقبة للغاية. إنه في حجم الإنتاج وسيبدأ الشحن إلى منشئي أنظمة OEM الشهر المقبل.

أعلن في حدث GTC الربيعي في Nvidia ، وعدت وحدة معالجة الرسومات 700 واط بأداء 6x AI على سابقتها ، A100 ، مع دعم لرياضيات النقطة العائمة 8 بت. وفي الوقت نفسه ، بالنسبة لتطبيقات HPC ، تقول Nvidia إن الشريحة ستوفر تعزيزًا للأداء 3x لحسابات FP64 مزدوجة الدقة.

ومع ذلك ، فإن أولئك الذين يأملون في الحصول على خوادم DGX H100 الداخلية من Nvidia المزودة بتقنية الاتصال البيني المخصصة ، سيتعين عليهم الانتظار حتى الربع الأول من عام 2023 ، أي أقل بربع التوقعات.

تلوم Nvidia الجزء الأكثر تعقيدًا من نظام DGX ، على الأرجح على معالج Sapphire Rapids من Intel المستخدم في النظام. ®