لطالما تفاخرت شركات الذكاء الصناعي بحجم وقدرات منتجاتها الضخمة، ولكن في الآونة الأخيرة، بدأ التركيز على النماذج الأصغر والأكثر كفاءة، التي تقول الشركات إنها ستساعد في تقليص التكاليف واستهلاك الطاقة.
تستند برامج مثل ChatGPT إلى خوارزميات تُعرف باسم «النماذج اللغوية الكبيرة»، وقد تفاخرَ مُنشئو روبوت المحادثة العام الماضي بأن نموذج GPT-4 يحتوي على ما يقارب تريليوني «معامل»، وهي اللبنات الأساسية لهذه النماذج.
يسمح الحجم الضخم لنموذج GPT-4 لـChatGPT بالرد على استفسارات في مجالات متعددة من الفيزياء الفلكية إلى علم الحيوان، لكن إذا كانت الشركة بحاجة إلى برنامج يعرف شيئاً محدداً، مثل التماسيح، يمكن أن تكون الخوارزمية أصغر بكثير.
كما قال لوران فيليكس من شركة إيكيميتريكس الاستشارية، «لا تحتاج إلى معرفة شروط معاهدة فرساي للإجابة على سؤال حول عنصر معين من الهندسة».
التوجه نحو النماذج الأصغر
بدأت شركات مثل غوغل، ومايكروسوفت، وميتا، وأوبن إيه آي في تقديم نماذج أصغر، كما تتيح أمازون أيضاً جميع أحجام النماذج على منصتها السحابية.
وفي حدث حديث في باريس، قالت كارّا هيرست، مديرة الاستدامة في أمازون، إن هذا التحول يُظهر أن صناعة التكنولوجيا تتجه نحو «الاعتدال والتوفير».
الاحتياجات الطاقية للنماذج الصغيرة
النماذج الصغيرة تكون أكثر ملاءمة للمهام البسيطة مثل تلخيص الوثائق أو فهرستها، أو البحث في قاعدة بيانات داخلية.
على سبيل المثال، تقوم شركة ميرك الأميركية للأدوية بتطوير نموذج بالتعاون مع شركة بوسطن كونسلتينغ جروب لفهم تأثير بعض الأمراض على الجينات، وقال نيكولا دي بيلفون، رئيس الذكاء الصناعي في بوسطن كونسلتينغ جروب، «سيكون نموذجاً صغيراً جداً، يتراوح بين مئات الملايين وعدد قليل من مليارات المعاملات».
وقال لوران دوديه، رئيس شركة LightOn الفرنسية الناشئة المتخصصة في النماذج الصغيرة، إن هذه النماذج لها العديد من المزايا مقارنة بنماذجها الأكبر، وأضاف: «غالباً ما تكون أسرع وقادرة على الرد على المزيد من الاستفسارات والمستخدمين في الوقت نفسه»، كما أشار إلى أنها أقل استهلاكاً للطاقة، ما يجعلها أكثر كفاءة من الناحية البيئية، وهو ما يمثل أحد المخاوف الرئيسية المرتبطة بالذكاء الاصطناعي.
تحتاج النماذج الكبيرة إلى مجموعات ضخمة من الخوادم «لتدريب» برامج الذكاء الاصطناعي ومعالجة الاستفسارات، وهذه الخوادم، المكونة من رقائق متقدمة للغاية، تتطلب كميات ضخمة من الكهرباء لتشغيلها وتبريدها، أما النماذج الصغيرة فتحتاج إلى عدد أقل بكثير من الرقائق، ما يجعلها أقل تكلفة وأكثر كفاءة في استهلاك الطاقة.
النماذج الصغيرة لا تحتاج إلى مراكز بيانات
يُشدد أيضاً على أن النماذج الصغيرة يمكن أن تعمل دون الحاجة إلى مراكز بيانات، حيث يمكن تثبيتها مباشرة على الأجهزة، وقال آرثر مينش، رئيس شركة «ميسترال إيه آي» الفرنسية الناشئة: «هذه إحدى الطرق لتقليل البصمة الكربونية لنماذجنا».
وأشار لوران فيليكس إلى أن استخدام النماذج مباشرة على الأجهزة يعني أيضاً مزيداً من «الأمان والسرية للبيانات»، حيث يمكن تدريب البرامج باستخدام بيانات خاصة دون الخوف من تسريبها.
ومع ذلك، لا تزال النماذج الأكبر تتمتع بميزة في حل المشكلات المعقدة والوصول إلى مجموعة واسعة من البيانات، وقال دي بيلفون إن المستقبل سيشمل على الأرجح تواصل النماذج المختلفة مع بعضها بعضاً.
وأضاف «سيكون هناك نموذج صغير يفهم السؤال ثم يرسل هذه المعلومات إلى عدة نماذج بأحجام مختلفة حسب تعقيد السؤال، وإلا، سنواجه حلولاً إما غالية جداً أو بطيئة جداً، أو كلاهما».