كالفين تشي ، من يعمل في بحث بدء التشغيل يسمى جلين، أحب استخدام الأحدث الذكاء الاصطناعي خوارزميات لتحسين منتجات شركته.

يوفر Glean أدوات للبحث من خلال تطبيقات مثل Gmail و Slack و Salesforce. يقول Qi إن تقنيات الذكاء الاصطناعي الجديدة لتحليل اللغة ستساعد عملاء Glean في اكتشاف الملف الصحيح أو المحادثة بشكل أسرع كثيرًا.

لكن تدريب مثل هذه الخوارزمية المتطورة للذكاء الاصطناعي يكلف عدة ملايين من الدولارات. لذلك يستخدم Glean نماذج أصغر للذكاء الاصطناعي وأقل قدرة ولا يمكنها استخراج نفس المعنى من النص.

“من الصعب على الأماكن الأصغر ذات الميزانيات الأصغر أن تحصل على نفس المستوى من النتائج” مثل الشركات مثل متصفح الجوجل أو أمازون، يقول تشي. يقول إن أقوى نماذج الذكاء الاصطناعي “غير واردة”.

أنتج الذكاء الاصطناعي اختراقات مثيرة في العقد الماضي – برامج يمكنها التغلب على البشر في الألعاب المعقدة ، وتوجيه السيارات عبر شوارع المدينة في ظل ظروف معينة ، والاستجابة للأوامر المنطوقة ، وكتابة نص متماسك بناءً على موجه قصير. تعتمد الكتابة بشكل خاص على التطورات الحديثة في قدرة أجهزة الكمبيوتر على تحليل اللغة ومعالجتها.

هذه التطورات هي إلى حد كبير نتيجة تغذية الخوارزميات بنص أكثر كأمثلة للتعلم منها ، ومنحها المزيد من الرقائق التي يمكن من خلالها استيعابها. وهذا يكلف مالاً.

انصح أوبن إيه آي نموذج اللغة GPT-3 ، كبير ، محاكاة رياضيا الشبكة العصبية تم تغذيتها بكميات كبيرة من النصوص المأخوذة من الويب. يمكن أن يجد GPT-3 أنماطًا إحصائية تتنبأ ، بتماسك مذهل ، بالكلمات التي يجب أن تتبع الكلمات الأخرى. من خارج الصندوق ، يعد GPT-3 أفضل بكثير من نماذج الذكاء الاصطناعي السابقة في مهام مثل الإجابة على الأسئلة وتلخيص النص وتصحيح الأخطاء النحوية. وبحسب أحد المقاييس ، فهي أكثر قدرة 1000 مرة من سابقتها GPT-2. لكن تكلفة تدريب GPT-3 ، حسب بعض التقديرات، ما يقرب من 5 ملايين دولار.

يقول Qi: “إذا كان GPT-3 سهل الوصول إليه ورخيص الثمن ، فسيؤدي ذلك إلى زيادة فعالية محرك البحث لدينا”. “سيكون هذا حقًا قويًا حقًا.”

التكلفة المتصاعدة للتدريب على الذكاء الاصطناعي المتقدم هي أيضًا مشكلة للشركات القائمة التي تتطلع إلى بناء قدراتها في مجال الذكاء الاصطناعي.

يقود دان ماكريري فريقًا داخل قسم واحد من Optum ، وهي شركة تكنولوجيا معلومات صحية ، يستخدم نماذج لغوية لتحليل نصوص المكالمات من أجل تحديد المرضى المعرضين لخطر أكبر أو التوصية بالإحالات. ويقول إنه حتى تدريب نموذج لغوي بحجم واحد في الألف من GPT-3 يمكن أن يستهلك بسرعة ميزانية الفريق. تحتاج النماذج إلى التدريب على مهام محددة ويمكن أن تكلف أكثر من 50000 دولار ، تُدفع لشركات الحوسبة السحابية لاستئجار أجهزة الكمبيوتر والبرامج الخاصة بهم.

يقول ماكريري إن موفري الحوسبة السحابية ليس لديهم سبب وجيه لخفض التكلفة. يقول: “لا يمكننا الوثوق في أن موفري الخدمات السحابية يعملون على خفض التكاليف بالنسبة لنا لبناء نماذج الذكاء الاصطناعي الخاصة بنا”. إنه يبحث في شراء رقائق متخصصة مصممة لتسريع تدريب الذكاء الاصطناعي.

يرجع جزء من سبب التقدم السريع للذكاء الاصطناعي مؤخرًا إلى أن العديد من المعامل الأكاديمية والشركات الناشئة يمكنها تنزيل واستخدام أحدث الأفكار والتقنيات. الخوارزميات التي أنتجت اختراقات في معالجة الصور ، على سبيل المثال ، ظهرت من المعامل الأكاديمية وتم تطويرها باستخدام أجهزة جاهزة ومجموعات بيانات مشتركة بشكل مفتوح.

مع مرور الوقت ، حدث ذلك تصبح واضحة بشكل متزايد هذا التقدم في الذكاء الاصطناعي مرتبط بالزيادة الهائلة في قوة الكمبيوتر الأساسية.

لطالما كانت الشركات الكبرى تتمتع دائمًا بمزايا من حيث الميزانية ، والنطاق ، ومدى الوصول. والكميات الكبيرة من طاقة الكمبيوتر هي حصص مائدة في صناعات مثل اكتشاف الأدوية.

الآن ، يدفع البعض لتوسيع نطاق الأمور بشكل أكبر. مايكروسوفت قالت هذا الأسبوع ، مع Nvidia ، قامت ببناء نموذج لغوي أكبر بمرتين من GPT-3. باحثون في الصين يقولون إنهم قاموا ببناء نموذج لغوي أكبر بأربع مرات من ذلك.

يقول ديفيد كانتر ، المدير التنفيذي لـ MLCommons، وهي منظمة تتعقب أداء الرقائق المصممة للذكاء الاصطناعي. يقول إن فكرة أن النماذج الأكبر يمكنها إطلاق العنان لقدرات جديدة قيّمة يمكن رؤيتها في العديد من مجالات صناعة التكنولوجيا. قد يفسر ذلك لماذا تصمم تسلا رقائقها الخاصة فقط لتدريب نماذج الذكاء الاصطناعي على القيادة الذاتية.

يشعر البعض بالقلق من أن التكلفة المتزايدة للاستفادة من أحدث وأعظم التقنيات يمكن أن تبطئ وتيرة الابتكار عن طريق حجزها لأكبر الشركات وتلك التي تستأجر أدواتها.

يقول: “أعتقد أنه يقلل من الابتكار” كريس مانينغ، أستاذ بجامعة ستانفورد متخصص في الذكاء الاصطناعي واللغة. “عندما يكون لدينا عدد قليل فقط من الأماكن حيث يمكن للأشخاص اللعب بأجزاء داخلية من هذه النماذج بهذا الحجم ، يجب أن يقلل ذلك بشكل كبير من مقدار الاستكشاف الإبداعي الذي يحدث”.

.

By admin