Home أخبار يتميز جهاز Phi-3 Mini من Microsoft بأداء على مستوى ChatGPT في حزمة...

يتميز جهاز Phi-3 Mini من Microsoft بأداء على مستوى ChatGPT في حزمة معلمات 3.8B خفيفة للغاية

36
0

لماذا يهم: تتطلب قدرات الذكاء الاصطناعي المتقدمة عمومًا نماذج ضخمة مستضافة على السحابة تحتوي على مليارات أو حتى تريليونات من المعلمات. لكن Microsoft تتحدى ذلك باستخدام Phi-3 Mini، وهو عبارة عن قوة ذكاء اصطناعي صغيرة الحجم يمكن تشغيلها على هاتفك أو الكمبيوتر المحمول الخاص بك مع تقديم أداء ينافس بعضًا من أكبر نماذج اللغات المتوفرة.

يبلغ وزن Phi-3 Mini 3.8 مليار معلمة فقط، وهو الأول من بين ثلاثة نماذج مدمجة جديدة للذكاء الاصطناعي تعمل عليها Microsoft. قد يكون صغيرًا، لكن مايكروسوفت تدعي أن هذا الجهاز الصغير الذي يمكن إنجازه بشكل زائد يمكن أن يتفوق كثيرًا على فئة وزنه، مما ينتج عنه استجابات قريبة مما قد تحصل عليه من نموذج يبلغ حجمه 10 أضعاف حجمه.

وتخطط شركة التكنولوجيا العملاقة لمتابعة Mini بـ Phi-3 Small (7 مليار معلمة) وPhi-3 Medium (14 مليار) في وقت لاحق. ولكن حتى جهاز Mini الذي يحتوي على 3.8 مليار معلمة يتشكل ليصبح لاعبًا رئيسيًا، وفقًا لأرقام Microsoft.

تُظهر هذه الأرقام أن Phi-3 Mini متمسك بقوته ضد الأوزان الثقيلة مثل المعلمة GPT-3.5 التي تزيد عن 175 مليارًا والتي تعمل على تشغيل ChatGPT المجاني، بالإضافة إلى نموذج Mixtral 8x7B التابع لشركة Mistral الفرنسية. إنه ليس سيئًا على الإطلاق بالنسبة لنموذج صغير الحجم بما يكفي للتشغيل محليًا دون الحاجة إلى اتصال سحابي.

إذًا كيف يتم قياس الحجم بالضبط عندما يتعلق الأمر بنماذج لغة الذكاء الاصطناعي؟ يعود الأمر كله إلى المعلمات – القيم الرقمية في الشبكة العصبية التي تحدد كيفية معالجتها وإنشاء النص. المزيد من المعلمات يعني عمومًا فهمًا أكثر ذكاءً لاستفساراتك، ولكن أيضًا زيادة في المتطلبات الحسابية. ومع ذلك، فإن هذا ليس هو الحال دائمًا، كما أوضح سام ألتمان، الرئيس التنفيذي لشركة OpenAI.

في حين يُشاع أن النماذج العملاقة مثل GPT-4 من OpenAI وAnthropic’s Claude 3 Opus تحتوي على مئات المليارات من المعلمات، فإن Phi-3 Mini يصل الحد الأقصى إلى 3.8 مليار فقط. ومع ذلك، تمكن باحثو مايكروسوفت من الحصول على نتائج مذهلة من خلال نهج مبتكر لتحسين بيانات التدريب نفسها.

من خلال تركيز نموذج المعلمة الصغير نسبيًا البالغ 3.8 مليار على مجموعة بيانات منسقة للغاية من محتوى الويب عالي الجودة والمواد المولدة صناعيًا والمتطورة من نماذج Phi السابقة، فقد أعطوا Phi-3 Mini مهارات كبيرة نظرًا لمكانته الهزيلة. يمكنه التعامل مع ما يصل إلى 4000 رمز مميز للسياق في المرة الواحدة، مع توفر إصدار خاص بحجم 128 ألف رمز مميز أيضًا.

“لأن القراءة من مواد تشبه الكتب المدرسية، من مستندات عالية الجودة تشرح الأشياء بشكل جيد جدًا، فإنك تجعل مهمة نموذج اللغة لقراءة وفهم هذه المواد أسهل بكثير،” توضح Microsoft.

يمكن أن تكون الآثار ضخمة. إذا كانت نماذج الذكاء الاصطناعي الصغيرة مثل Phi-3 Mini قادرة حقًا على تقديم أداء تنافسي مع الشركات العملاقة التي يزيد عددها عن مليار معلمة اليوم، فقد نتمكن من ترك مزارع الذكاء الاصطناعي السحابية التي تستهلك الكثير من الطاقة خلفنا للقيام بالمهام اليومية.

لقد أتاحت Microsoft بالفعل النموذج لتطبيقه على سحابة Azure، وكذلك عبر مضيفي نموذج الذكاء الاصطناعي مفتوح المصدر Hugging Face وOllama.

مصدر

LEAVE A REPLY

Please enter your comment!
Please enter your name here