كل ما تحتاج معرفته عن: GPT-4O نسخة خارقة للاستخدام المحدود مجاناً

منذ سنتين

شركة أوبن أيه آي تعلن إطلاق GPT-4O نسخة خارقة من الذكاء الاصطناعي وإتاحته للاستخدام المحدود مجاناً في موقع الشركة - كل ما تحتاج معرفته عن النموذج الجديد

في تطورٍ انتظر الكثيرون، أتاحت شركة أوبن أيه آي، الرائدة في تقديم نموذج الذكاء الاصطناعي الخارق CHATGPT، نسخة جديدة ومحدثة مع إتاحة الاستخدام المحدود مجاناً لأول مرة وهي GPT-4O، فور أوه.

وحسب مراجعة "نشوان نيوز"، فقد أتاح موقع الدردشة شات جي بي تي لأول مرة نموذج 4O بوصفه نسخة خارقة، للمستخدمين بدلاً عن النموذج المتاح سابقاً شات جي بي تي 3.5.

ويقول خبراء إن التطور الجديد، يشكل تحولاً مذهلاً في خدمات الذكاء الاصطناعي، بالنظر إلى القدرات الخارقة التي يقدمها النموذج الجديد، مقارنة بسلفه، إذ أن الإجابة تختلف بصورة إيجابية، إلى جانب التحديث في العديد من الجوانب، بما سرعة توليد النص والتعديلات وغيرها.

كيف يعرف النموذج الجديد ميزاته؟

لدى طرح نشوان نيوز على النموذج سؤالاً، عن هويته، يجيب أن نموذج GPT-4o، وهو أحدث إصدار من نماذج الذكاء الاصطناعي التي طورتها شركة OpenAI. تم تصميمي لتحسين الأداء والكفاءة عبر مجموعة من الأنماط، بما في ذلك النصوص والصور والصوت، بهدف تحقيق استخدام عملي وآمن في مختلف التطبيقات".

ويضيف: إليك بعض النقاط الرئيسية حولي:

السلامة والأمان:
- تم بناء نظام السلامة الخاص بي بعناية من خلال تقنيات مثل تصفية بيانات التدريب وتحسين سلوكي بعد التدريب.
- خضعت لاختبارات مكثفة من قبل خبراء خارجيين في مجالات متعددة مثل علم النفس الاجتماعي والتحيز والمعلومات المضللة لتحديد المخاطر ومعالجتها.

الأداء والكفاءة:
- تم تحسين الكفاءة في جميع الطبقات التقنية، مما جعلني أسرع مرتين وأقل تكلفة بنسبة 50% مقارنةً بالإصدارات السابقة.
- يمكنني معالجة النصوص والصور بفعالية عالية، وسأكون قادرًا على التعامل مع الصوت والفيديو قريبًا.

التوفر والاستخدام:
- أنا متاح للاستخدام في ChatGPT سواء في الطبقة المجانية أو في الطبقة Plus مع حدود رسائل أعلى.
- يمكن للمطورين الوصول إليّ عبر واجهة برمجة التطبيقات (API) كنموذج للنص والرؤية، مع خطط لتوفير قدراتي الصوتية والمرئية الجديدة لمجموعة مختارة من الشركاء.

التطوير المستمر:
- تستمر الشركة في تحسين أدائي ومعالجة المخاطر الجديدة فور اكتشافها.
- يتم اختبار وتحسين قدراتي باستمرار لضمان تقديم أفضل تجربة للمستخدمين.

كيف يتم استخدامه؟

توضح لقطة الشاشة التالية إجابة شات جي بي تي فور أوه، مع إمكانية تبديل النموذج إلى 3.5:

لقطة شاشة توضح إجابة GPT-4o وإمكانية التبديل بينه وبين النموذج السابق 3.5 (نشوان نيوز)

ما هو نموذج الاصطناعي الجديد المتاح للمستخدمين (برسائل محدودة مجاناً)؟

تقول الشركة إن GPT-4o أفضل بشكل خاص في فهم الرؤية والصوت مقارنة بالنماذج الحالية، وتوضح أنه قبل GPT-4o ، كان يمكنك استخدام وضع الصوت للتحدث إلى ChatGPT بزمن انتقال يبلغ 2.8 ثانية (GPT-3.5) و 5.4 ثانية (GPT-4) في المتوسط.

لتحقيق ذلك ، يعد وضع الصوت عبارة عن خط أنابيب من ثلاثة نماذج منفصلة: نموذج بسيط يقوم بنسخ الصوت إلى نص ، ويأخذ GPT-3.5 أو GPT-4 النص ويخرج النص ، ويقوم نموذج ثالث بسيط بتحويل هذا النص مرة أخرى إلى صوت.

تعني هذه العملية أن المصدر الرئيسي للذكاء ، GPT-4 ، يفقد الكثير من المعلومات - لا يمكنه مراقبة النغمة أو مكبرات الصوت المتعددة أو ضوضاء الخلفية بشكل مباشر ، ولا يمكنه إخراج الضحك أو الغناء أو التعبير عن المشاعر.

باستخدام GPT-4o ، قامت الشركة، بتدريب نموذج جديد واحد من طرف إلى طرف عبر النص والرؤية والصوت ، مما يعني أن جميع المدخلات والمخرجات تتم معالجتها بواسطة نفس الشبكة العصبية. نظرا لأن GPT-4o هو نموذج الشركة الأول الذي يجمع بين كل هذه الطرائق ، ما يزال يجري اختباره النموذج.

شات جي بي تي فور أوه gpt-4o (موقع Openai)

تحسين التفكير

يحدد GPT-4o درجة عالية جديدة تبلغ 88.7٪ على 0-shot COT MMLU (أسئلة المعرفة العامة). تم جمع كل هذه الخلاصات مع الجديد إيفال بسيط(يفتح في نافذة جديدة) مكتبة. بالإضافة إلى ذلك ، في MMLU التقليدي بدون CoT من 5 طلقات ، يحدد GPT-4O درجة عالية جديدة تبلغ 87.2٪.

السلامة والقيود لنموذج GPT-4o

تم تصميم نموذج GPT-4o مع مراعاة السلامة عبر جميع الأنماط من خلال تقنيات مثل تصفية بيانات التدريب وتحسين سلوك النموذج بعد التدريب. كما أنشأت الشركة أنظمة سلامة جديدة لتوفير الحماية في المخرجات الصوتية.

قامت الشركة بتقييم GPT-4o وفقًا لإطار الجاهزية الخاص بنا وبما يتماشى مع التزاماتنا الطوعية. أظهرت تقييماتنا للأمن السيبراني، CBRN، الإقناع، واستقلالية النموذج أن GPT-4o لا يتجاوز مستوى الخطر المتوسط في أي من هذه الفئات.

شمل هذا التقييم تشغيل مجموعة من التقييمات الآلية والبشرية خلال عملية تدريب النموذج. اختبرنا الإصدارات قبل وبعد تنفيذ تدابير السلامة باستخدام تخصيص دقيق ومطالبات مخصصة لاستجلاء قدرات النموذج بشكل أفضل.

خضع نموذج GPT-4o أيضًا لاختبارات مكثفة من قبل أكثر من 70 خبيرًا خارجيًا في مجالات مثل علم النفس الاجتماعي، التحيز والإنصاف، والمعلومات المضللة لتحديد المخاطر التي يمكن أن تُدخَل أو تتفاقم بالأنماط الجديدة المضافة. استخدمت الشركة هذه الدروس لبناء تدخلات سلامة تهدف إلى تحسين أمان التعامل مع GPT-4o. سنستمر في التخفيف من المخاطر الجديدة عند اكتشافها.

وتضيف: ندرك أن الأنماط الصوتية في GPT-4o تقدم مجموعة من المخاطر الجديدة. اليوم، نطلق بشكل عام المدخلات النصية والصورية والمخرجات النصية. خلال الأسابيع والأشهر القادمة، سنعمل على البنية التحتية التقنية، وسهولة الاستخدام بعد التدريب، والسلامة اللازمة لإصدار الأنماط الأخرى. على سبيل المثال، في وقت الإطلاق، ستكون المخرجات الصوتية محدودة بمجموعة مختارة من الأصوات المعدة مسبقًا وستلتزم بسياسات السلامة الحالية لدينا. سنشارك المزيد من التفاصيل التي تعالج النطاق الكامل لأنماط GPT-4o في البطاقة النظامية القادمة.

من خلال اختبارات الشركة وتكراراتها مع النموذج، لاحظنا عدة قيود موجودة عبر جميع أنماط النموذج، سيتم توضيح بعضها أدناه.

توفر النموذج

تود الشركة الحصول على تعليقات للمساعدة في تحديد المهام التي لا يزال فيها GPT-4 Turbo يتفوق على GPT-4o، حتى تتمكن من الاستمرار في تحسين النموذج.

نموذج GPT-4o هو أحدث خطوة في دفع حدود التعلم العميق، وهذه المرة في اتجاه الاستخدام العملي. أنفقت الشركة الكثير من الجهود على مدار العامين الماضيين في العمل على تحسين الكفاءة في كل طبقة من الطبقات. وكنتيجة أولى لهذا البحث، تمكنت الشركة من توفير نموذج بمستوى GPT-4 على نطاق أوسع بكثير. سيتم طرح قدرات GPT-4o بشكل تدريجي (مع بدء الوصول الموسع لفريق الاختبار الأحمر اليوم).

بدأت قدرات النص والصورة في GPT-4o في الانتشار اليوم في ChatGPT. ستقوم الشركة بتوفير GPT-4o في الطبقة المجانية، وللمستخدمين في الطبقة Plus مع حدود رسائل أعلى تصل إلى 5 مرات. سيتم إطلاق نسخة جديدة من وضع الصوت مع GPT-4o في المرحلة الألفا ضمن ChatGPT Plus في الأسابيع القادمة.

يمكن للمطورين الآن الوصول إلى GPT-4o في واجهة برمجة التطبيقات (API) كنموذج للنص والرؤية. يعد GPT-4o أسرع مرتين، وأرخص بنسبة 50%، وله حدود معدل أعلى بـ5 مرات مقارنة بـ GPT-4 Turbo. تخطط الشركة لإطلاق دعم لقدرات الصوت والفيديو الجديدة في GPT-4o لمجموعة صغيرة من الشركاء الموثوق بهم في API في الأسابيع القادمة.