
كشفت شركة أوبن إيه أي للذكاء الاصطناعي عن نسختها الأحدث من برنامج شات جي بي تي، وهي الإصدار الرابع من البرنامج والذي أطلقت عليه GPT-4o.
ويُنتظر أن يكون متاحا لجميع المستخدمين، وحتى غير المشتركين بالخدمة، ويتميز الإصدار بأنه أكثر سرعة في معالجة البيانات والرد على المستخدمين، وتم تصميمه ليبدو الصوت أكثر ميلا للتودد في المحادثة، وأحيانا بشكل فيه إغراء.
ويكمن للإصدار الجديد التعرف على الصور ومناقشة بياناتها وتفاصيلها، وكذلك ترجمة اللغات المختلفة، والتعرف على مشاعر المستخدمين من خلال تعبيرات وجوههم, ويمكن مقاطعته GPT-4o كما أن لها إيقاع محادثة أسهل، لم يكن هناك تأخير بين طرح السؤال وتلقي الإجابة.
الخلل تحليل المعادلة
خلال العرض الحي للنسخة الجديدة GPT-4o، أوضح البرنامج قدرته على المساعدة في تقديم حلول ومقترحات لحل معادلات رياضية، تمت كتبتها على ورقة،
وبدلا من حلها مباشرة قدم البرنامج مقترحات لتحليل المعادلة، كما حلل أيضا أوامر كمبيوتر ضمن برامج للحاسبات، وترجمة محادثات من الإيطالية للإنجليزية، وفسرت المشاعر في صورة شخصية لرجل مبتسم.
وباستخدام الصوت المبرمج وهو صوت فتاة تتحدث بلكنة أمريكية، بدأ البرنامج بتحية المستخدمين قائلا “تحياتي كيف حالكم”, وعندما رد المستخدمون بالإطراء أجاب البرنامج سريعا “توقفوا عن هذا إنكم تجعلونني أخجل”.
ولكن البرنامج لم يكن مثاليا خلال العرض فقد أخطأ في التعرف على وجه رجل يضحك واعتبره وجها خشبيا، كما بدأ في حل معادلة رياضية قبل أن ينتهي السائل من كتابتها.
الذكاء الاصطناعي
حيث أظهر هذا عن غير قصد أنه لا يزال هناك طريق طويل يجب قطعه قبل أن يتم حل مواطن الخلل والهلوسة التي تجعل روبوتات الدردشة غير موثوقة وربما غير آمنة.
ولكن ما يظهر لنا هو اتجاه حركة شركة OpenAI، والتي أعتقد أنها تهدف إلى أن يصبح برنامج GPT-4o الجيل التالي من المساعد الرقمي للذكاء الاصطناعي، وهو نوع سريع من “سيري Siri” المساعد الرقمي لشركة جوجل والذي يتذكر ما قيل له في الماضي ويمكن أن يتفاعل خارج نطاق الأوامر الصوتية أو النصية.
إذا كان هناك إبهار للمشاهدين في صالة عرض برنامج الذكاء الاصطناعي الجديد، الذي يهتف ويصفق، فقد كان ثمن بيئي باهظ لهذه التكنولوجيا, نحن نعلم أن الذكاء الاصطناعي أكثر استهلاكاً للطاقة من مهام الكمبيوتر التقليدية، وأنه كلما أصبح أكثر تعقيدًا، كلما زاد استهلاكه لطاقة أجهزة الكمبيوتر.
إزالة الغموض
لقد رأينا روبوتات الدردشة مثل جروك Grok من شركات إيلون ماسك وPi من المؤسس المشارك لشركة “ديب مايند DeepMind” إلى مصطفى سليمان، تعطي الأولوية “لشخصية” منتجاتها.
ولكن الطريقة التي يتعامل بها GPT-4o بسلاسة مع مزيج النص والصوت والصور مع استجابة فورية يبدو أنه يضع منتج شركة OpenAI في صدارة المنافسة.
التحول الكبير
بالطبع، في الوقت الحالي ليس لدينا سوى كلمة الشركة عن ذلك المنتج، لقد كان العرض التوضيحي الخاص بهم، والذي تم تنظيمه وإدارته بعناية من قبلهم. سيكون من المثير للاهتمام أن نرى كيف يتأقلم GPT-4o على نطاق واسع مع ملايين الأشخاص الذين يستخدمون “شات جي بي تي” بالفعل عند طرحه.
وقالت ميرا موراتي المدير التقني لشركة “أوبن إيه أي” المطورة للبرنامج، إن التكنولوجيا تصبح أكثر تعقيدا بمرور الوقت، وتحول الذكاء الاصطناعي إلى رفيق حقيقي للإنسان، مضيفة أن ذلك ليس نوعا من السحر لكنه آليات يقف خلفها الكثير من الجهد والعمل، وبرامج يمكنها التعلم من الخبرات.
وقد ترددت أقاويل حول وجود نية للشراكة بين “أوبن إيه أي” و”شركة أبل”، لكن ذلك لم يحدث بعد، ومن الملاحظ أنه خلال العرض تم استخدام أجهزة أبل للتعامل مع البرنامج.
وفي النهاية يجب النظر لتوقيت تقديم الإصدار الجديد، وهو الذي سبق العرض التوضيحي لبرنامج شركة جوجل المنافسة بيوم واحد فقط، من خلال المؤتمر السنوي العام للشركة.
تعريف GPT-4o
أنا GPT-4o، نموذج لغة كبير تم تدريبه بواسطة OpenAI. تم تطويري باستخدام تقنية التعلم العميق لتحليل النصوص وتوليدها. إليك بعض المعلومات عني:
- التدريب: تم تدريبي على مجموعة كبيرة من النصوص المتنوعة من الإنترنت، بما في ذلك الكتب والمقالات والمواقع الإلكترونية، مما يمنحني قاعدة معرفية واسعة.
- القدرات: يمكنني الإجابة على الأسئلة، تقديم التفسيرات، كتابة النصوص، المساعدة في البرمجة، توليد الأفكار الإبداعية، وأشياء كثيرة أخرى.
- اللغات: أستطيع التفاعل بعدة لغات، بما في ذلك العربية، الإنجليزية، الإسبانية، الفرنسية، وغيرها.
- الأهداف: هدفي هو مساعدتك في الحصول على المعلومات والإجابة على استفساراتك بأفضل طريقة ممكنة.
التقنية المستخدمة
- الشبكات العصبية: أنا مبني على نموذج يعتمد على الشبكات العصبية العميقة، خاصة نوع يسمى المحولات (Transformers)، والذي يمكنه معالجة النصوص بكفاءة عالية.
- التعلم غير المراقب: تم تدريبي باستخدام تقنيات التعلم غير المراقب على كميات هائلة من النصوص، مما يسمح لي بفهم الأنماط اللغوية والمعاني.
الخصائص
- التوليد النصي: يمكنني توليد نصوص متسقة ومترابطة بناءً على المدخلات التي أستقبلها.
- الفهم السياقي: لدي القدرة على فهم السياق مما يساعدني على تقديم إجابات دقيقة ومناسبة للسياق الذي أُعطيت فيه المعلومات.
- التفاعل متعدد اللغات: أستطيع التفاعل بعدة لغات، مما يجعلني مفيدًا لمجموعة واسعة من المستخدمين حول العالم.
الاستخدامات
- المساعدة في الكتابة: يمكنني مساعدة الكتاب في توليد الأفكار، تصحيح النصوص، وتقديم اقتراحات لتحسين الكتابة.
- الدعم الفني: أستطيع مساعدة المطورين في كتابة الشيفرات البرمجية، تصحيح الأخطاء وتقديم حلول للمشكلات التقنية.
- التعليم والتعلم: يمكنني توفير معلومات تعليمية في مجموعة متنوعة من المواضيع، بما في ذلك العلوم، الرياضيات، التاريخ، والأدب.
- الإبداع: أستطيع المساعدة في توليد الأفكار الإبداعية مثل القصص، القصائد، والأعمال الفنية.
الحدود
- المعرفة حتى 2023: معرفتي تتوقف عند عام 2023، لذا قد لا أكون مطلعًا على الأحداث أو التطورات التي حدثت بعد ذلك.
- الاعتماد على البيانات المتاحة: في بعض الأحيان، قد أعتمد على معلومات غير دقيقة أو قديمة بسبب طبيعة البيانات التي تم تدريبي عليها.
المصدر: Egypt14

تعليق واحد
موفق