عودة

نظرة متعمقة على OpenAI DevDay: ماذا أُعلن بجانب GPT-4 Turbo؟

By Sean Chen, 10 نوفمبر، 2023

官網文章_OpenAI_devDay_2023.png



في 2023/11/06، عُقد مؤتمر OpenAI DevDay حيث تجاوز المدير التنفيذي لشركة OpenAI، سام ألتمان، التوقعات مرة أخرى، مما أتاح للمطورين إمكانيات جديدة. من خلال هذا المقال، دعونا نتعرف على جاذبية GPT-4 Turbo للمطورين.




عُقد مؤتمر OpenAI DevDay في 2023/11/06، بينما كانت الشركات التقنية الكبرى الأخرى تحاول اللحاق بأداء GPT-4، تجاوز المدير التنفيذي لشركة OpenAI، سام ألتمان، التوقعات مرة أخرى، مما أتاح للمطورين إمكانيات جديدة، وأظهر بوضوح مكانة OpenAI الرائدة في الذكاء الاصطناعي.

GPT-4 Turbo: أسرع، وأكبر في حجم النصوص، وأرخص

يشير السياق إلى "إدخال النصوص للنموذج اللغوي الكبير والحوارات المتبادلة". في الماضي، كان الحد الأقصى لحجم النصوص المدعوم هو 32,000 رمز (وكان متاحًا فقط لبعض المطورين)، بينما يسمح GPT-4 Turbo بحجم نصوص يصل إلى 128,000 رمز، مما يعادل إدخال كتاب من 300 صفحة دفعة واحدة إلى GPT-4 Turbo ليقوم النموذج بتوليد النصوص. أما من حيث السرعة، فقد كان العيب الأكبر في GPT-4 هو البطء، حيث كان يتطلب وقتًا طويلاً أثناء عملية التوليد، لذا كانت الشركات تفضل استخدام GPT-3.5 لحل معظم المشكلات العملية. لذلك، حل GPT-4 Turbo هذه المشكلة، مما جعل سرعة التوليد تقترب من GPT-3.5، مما يثري سيناريوهات دمج GPT-4 Turbo في المستقبل. أما من حيث التكلفة، فإن تكلفة النصوص المدخلة أرخص بثلاث مرات، والنصوص المخرجة أرخص بمرتين مقارنة بالإصدار السابق من GPT-4.


وظيفة استدعاء الدوال (Function calling) الأكثر ودية للمطورين


ما هي وظيفة استدعاء الدوال (Function calling)؟

أعلنت OpenAI في وقت سابق من هذا العام عن وظيفة "استدعاء الدوال"، التي تمكن المطورين من استدعاء دوال برمجية مخصصة عند استخدام GPT. بمعنى آخر، يمكن للذكاء الاصطناعي الذكي الاتصال بمختلف واجهات برمجة التطبيقات (API)، مما يزيد بشكل كبير من المجالات التي يمكن لـ OpenAI استخدامها. وتكمن قوة النموذج في أنه بمجرد أن يقدم المطورون واجهات متعددة للأوامر البرمجية، يمكن لـ GPT أن يقرر بنفسه أي أمر يجب استدعاؤه، ويمكنه استخدام المعلمات المناسبة للتنفيذ.

مثال: يوفر مطور المصابيح الذكية أمرين: "تعيين اللون" و"تعيين فترة الاستشعار". يحتوي أمر تعيين اللون على ثلاثة معلمات: الضوء الأبيض، الضوء الطبيعي، والضوء الليلي. عند إدخال نص إلى GPT: "يرجى تعيين المصباح المناسب لليل"، سيقرر GPT تلقائيًا استخدام أمر "تعيين اللون"، وسيستخدم المعلمة "الضوء الليلي" تلقائيًا، دون الحاجة إلى تدخل بشري في عملية اتخاذ القرار. في الماضي، كان من الضروري استخدام تقنية معالجة اللغة الطبيعية (NLP) لكتابة منطق مخصص لتحقيق هذه الوظيفة، والآن يمكن تحقيق ذلك فقط باستخدام استدعاء برنامج GPT.

ما الذي تم تعديله هذه المرة؟

في هذا التحديث، أصبح بإمكان GPT تحديد الأوامر والمعلمات التي يجب استخدامها بدقة أكبر، وتم تحسين قدرة GPT على استدعاء أمر واحد فقط في كل مرة. في الماضي، عندما كانت السيناريوهات أكثر تعقيدًا، كان المطورون بحاجة إلى كتابة برامج إضافية للسماح باستدعاء الدوال عدة مرات؛ في هذا التحديث، يمكن لـ GPT تنفيذ أوامر متعددة في وقت واحد، والسماح للنتائج التي تم الحصول عليها من كل أمر بالانتقال إلى الآخر. على سبيل المثال: عند استخدام النص "أنا معتاد على الاستيقاظ في منتصف الليل لتناول الماء، يرجى تعيين وضع المصباح المناسب"، يمكن لـ GPT أن يقرر استدعاء أوامر "تعيين اللون" و"تعيين فترة الاستشعار"، وتحديد معلمة "فترة الاستشعار" لتكون "من الساعة 01:00 إلى 06:30"، واستخدام "تعيين اللون" مع المعلمة "الضوء الليلي".

بالإضافة إلى ذلك، كانت ردود النموذج اللغوي في الماضي تعتمد على "نصوص غير محددة الصيغة"، وإذا كنت ترغب في الحصول على رد بصيغة محددة، كان عليك أن تطلب في النص "يرجى الرد بصيغة xml"؛ ومع ذلك، كان المطورون يواجهون مشكلة في أن الردود لم تكن دائمًا بصيغة xml، وغالبًا ما كانت تحتوي على نصوص عادية، مما يؤدي إلى حدوث أخطاء في تحويل الصيغ. والآن، يسمح GPT-4 Turbo للمطورين بتعيين معلمة response_format، التي يمكن تعيينها إلى xml أو json أو صيغ API شائعة أخرى، مما يزيد من استقرار البرنامج.

أخيرًا، تسمح OpenAI أيضًا للمستخدمين بتعيين معلمة Seed، التي تحدد عشوائية محتوى الردود من GPT. من خلال تعيين هذه المعلمة، يمكن للمطورين ضمان اتساق الردود من النموذج اللغوي، مما يتيح لهم كتابة حالات اختبار بثقة أكبر (لتجنب إنتاج النموذج اللغوي لردود مختلفة فجأة)، مما يزيد من قابلية اختبار البرنامج وجودته.


بالإضافة إلى النقطتين المذكورتين أعلاه، فإن إطلاق مساعد API هو الحدث الرئيسي في DevDay من حيث توسيع سيناريوهات التطبيق.

مساعد API (Assistants API)

في الماضي، إذا كنت ترغب في استخدام النموذج اللغوي الكبير لتطوير تطبيقات الذكاء الاصطناعي التوليدية، كان عليك استخدام حزم طرف ثالث مثل LangChain، التي تمنح النموذج اللغوي الكبير قدرات متقدمة، مثل: استخدام نماذج لغوية متعددة، القدرة على تخصيص البيانات، الذاكرة والوكيل (Agent، الذي يسمح للذكاء الاصطناعي بتنفيذ المهام المتتالية واتخاذ القرارات المتتالية)، لإكمال تطبيقات الذكاء الاصطناعي الأكثر تعقيدًا.

ومع ذلك، فإن مساعد API الذي تم إطلاقه في DevDay يدمج القدرات المذكورة أعلاه في API الرسمي، مما يوفر على المطورين المشاكل التي يواجهونها عند دمج حزم الطرف الثالث. هذه هي المرة الأولى التي يخرج فيها الرسمي من تحسين أداء النموذج اللغوي الكبير فقط، ويبدأ في استكشاف تطبيق "الوكيل". تشير الوثائق الرسمية إلى أن "المساعد هو ذكاء اصطناعي موجه نحو الهدف، يسمح باستخدام أوامر محددة، واستخدام بيانات خارجية أو استخدام نماذج لغوية وأدوات مختلفة لتنفيذ المهام".


كما أن مساعد API الجديد يحتوي على عدة أدوات مدمجة، بالإضافة إلى "استدعاء الدوال" المذكور أعلاه، فإنه يوفر أيضًا "مترجم الأكواد" و"استرجاع البيانات".


مترجم الأكواد (Code Interpreter)

يسمح "مترجم الأكواد" في GPT-4 بتنفيذ الأكواد التي يكتبها في بيئة صندوق الرمل (حاليًا يدعم فقط Python)، في الماضي، كان على المهندسين نسخ الأكواد التي ساعد GPT-4 في كتابتها ولصقها في بيئة التطوير الخاصة بهم لاختبارها، ولكن بيئة صندوق الرمل التي توفرها OpenAI كافية لتمكين GPT-4 من مراجعة الأكواد الخاصة به للتأكد من صحتها، ويمكنه تعديل الأكواد تدريجيًا بناءً على النتائج التي تم الحصول عليها بعد التنفيذ حتى يتم تحقيق الهدف.

ومع ذلك، فإن دور مترجم الأكواد يتجاوز "تمكين GPT-4 من مراجعة صحة الأكواد التي يكتبها"، فالأهمية الأكبر تكمن في "تمكين النموذج اللغوي الكبير من امتلاك جهاز كمبيوتر خاص به"، حيث يمكن للكمبيوتر تنفيذ معظم المهام. الآن يمكن للنموذج اللغوي الكبير التفاعل بطريقة برمجة الأوامر، وعلى الرغم من أن التنفيذ في بيئة صندوق الرمل المقيدة يجعل مترجم الأكواد قادرًا فقط على استخدام حزم طرف ثالث محددة، إلا أنه يمكنه تنفيذ "معظم المهام التي يجيدها لغة البرمجة Python"، مثل: معالجة البيانات واستدعاء API، ويمكنه قراءة ملفات الأكواد الكبيرة التي يقدمها المستخدمون. من حيث الأمان، يمكن لبيئة صندوق الرمل تجنب إساءة استخدام القدرات القوية للنموذج اللغوي الكبير، وبالتالي توفر ضمانًا معينًا للأمان.



استرجاع البيانات (Retrieval)

يتيح "استرجاع البيانات" للمستخدمين تحميل بياناتهم الخاصة (مثل: بيانات مجال صناعي معين، معلومات المنتجات أو الوثائق الداخلية) وجعل النموذج اللغوي الكبير قادرًا على الإجابة بناءً على هذه البيانات، مما يتيح تطبيقها في صناعتهم أو مجالهم. كانت هذه الوظيفة محور تنافس منذ ظهور GPT-3. في DevDay، كان استرجاع البيانات هو الحل الأصلي الذي تقدمه OpenAI لهذه الوظيفة لأول مرة، على سبيل المثال: لتمكين الشركات من إنشاء روبوتات المعرفة الداخلية، مثل مدير المشروع الذكي، محلل النظام الذكي؛ في مجالات مثل الرعاية الصحية والمالية، كانت روبوتات خدمة العملاء تتطلب تقنيات معالجة اللغة المعقدة لتحقيقها، ولكن الآن مع النموذج اللغوي القوي GPT-4، ومع وظيفة استرجاع البيانات التي تقدمها OpenAI، يمكن للمطورين التركيز على المنطق التجاري، دقة البيانات وتعديل التفاصيل. بالإضافة إلى ذلك، لم يعد هناك حاجة لاستخدام قواعد البيانات المتجهة، معالجة البيانات المجزأة أو خوارزميات البحث المحددة التي كانت تتطلبها حزم الطرف الثالث في الماضي، حيث يتم دعمها جميعًا من قبل OpenAI الرسمي، مما يوفر الجهد والتكاليف المرتبطة بتلك العمليات. كما أكدت OpenAI أن المحادثات والملفات المستخدمة في مساعد API لن تُستخدم لتدريب الجيل التالي من نموذج OpenAI.



الخاتمة

بشكل عام، بالإضافة إلى تحسين كفاءة النموذج باستمرار، تواصل OpenAI توسيع تطبيقات النموذج اللغوي الكبير. قال سام ألتمان إن GPT-5 لن يظهر في المستقبل القريب، ومع دقة GPT-4 الحالية، يبدو أن إنفاق تكاليف كبيرة لتدريب نموذج لغوي أكبر ليس ضروريًا، بل إن تحسين أداء GPT-4، وسهولة استخدامه وقابليته للتوسع هو ما يركز عليه OpenAI حاليًا؛ وبالنسبة للمطورين، الشركات والمستهلكين النهائيين، فإن إدخال المزيد من الذكاء الاصطناعي القوي والقابل للتطبيق في معظم السيناريوهات أصبح محور التحول الرقمي للجيل القادم. إن GPT الذي أنشأته OpenAI يشبه الدماغ في عالم التكنولوجيا المستقبلية، ونحن نعتقد أن الإبداع والتقدم القادم سيجعل الذكاء الاصطناعي أكثر قدرة على استخدام الأدوات، و"الرؤية"، و"الاستماع"، و"التحدث" و"الرسم" بسلاسة.

المزيد من مدونتنا

اتصل بنا

اتصل بنا

دعنا نتحدث عن أفكارك!

انطلق بأعمالك مع شريكك الرقمي المبتكر. سنرد عليك خلال يوم عمل واحد. (GMT+8)