هز إطلاق شات جي بي تي في نوفمبر 2023 جوجل من أساساتها. شكل روبوت الدردشة الشهير مثل هذا التهديد لأعمال الشركة لدرجة أنه كان عليها الإعلان عن حالة طوارئ وبدأت في الاستثمار في اللحاق بعربة الذكاء الاصطناعي التوليدي.
لم يؤد هذا الجهد فقط إلى إصدار جوجل بارد ولكن أيضًا جوجل جيميني.
تم إطلاق جيميني يوم الأربعاء، 6 ديسمبر 2023، ومع مرور الأشهر، سنتابع رحلتهم – هناك فرصة جدية أن تتمكن Google من الاستيلاء على تاج الذكاء الاصطناعي الشهير من شات جي بي تي.
ما هو جوجل جيميني ؟
جيميني هي مجموعة من النماذج اللغوية الكبيرة (LLMs) التي تستفيد من تقنيات التدريب المأخوذة من ألفا-جو، بما في ذلك التعلم المعزز وأشجار البحث، والتي لديها القدرة على عزل شات جي بي تي باعتباره حل الذكاء الاصطناعي الأكثر انتشارًا على هذا الكوكب.
يأتي ذلك بعد أشهر من دمج جوجل بين مختبري براين (Brain) و ديب مايند (DeepMind AI) لإنشاء فريق بحث جديد يسمى جوجل ديب مايند، وبعد إطلاق بارد والجيل التالي من بالم2 LLM.
مع توقع الباحثين أن تبلغ قيمة سوق الذكاء الاصطناعي التوليدي 1.3 تريليون دولار بحلول عام 2032، من الواضح أن جوجل تبذل قصارى جهدها للاستثمار في الفضاء للحفاظ على مكانتها كشركة رائدة في تطوير الذكاء الاصطناعي.
كل ما نعرفه حتى الآن عن جيميني
مرة أخرى في مايو، أصدر سوندار بيتشاي (Sundar Pichai)، الرئيس التنفيذي لشركة جوجل و Alphabet، منشور مدونة مع نظرة عالية المستوى على LLM، موضحًا:
تم إنشاء جيميني من الألف إلى الياء ليكون متعدد الوسائط وفعالًا للغاية في تكامل الأدوات وواجهة برمجة التطبيقات وتم بناؤه لتمكين الابتكارات المستقبلية، مثل الذاكرة والتخطيط.
وأشار بيتشاي أيضًا إلى أنه “بينما لا نزال مبكرين، نشهد بالفعل قدرات رائعة متعددة الوسائط لم نشهدها في النماذج السابقة.
بمجرد ضبطه واختباره بدقة من أجل السلامة، سيكون جيميني متاحًا بأحجام وقدرات مختلفة، تمامًا مثل بالم 2
أشارت مقابلة الرئيس التنفيذي لشركة جوجل ديب مايند ديميس هاسابيس (Demis Hassabis) مع Wired إلى أن جيميني “ستجمع بعض نقاط القوة في أنظمة نوع ألفا-جو مع القدرات اللغوية المذهلة للنماذج الكبيرة“.
هل سيأخذ جيميني التاج من ChatGPT؟
واحدة من أكبر المحادثات حول إصدار جيميني هي ما إذا كان نموذج اللغة لديه ما يلزم لإزاحة شات جي بي تي، والذي وصل هذا العام إلى أكثر من 100 مليون مستخدم نشط شهريًا.
في البداية، كانت جوجل تستخدم قدرة جيميني على إنشاء نصوص وصور لتمييزها عن GPT4، ولكن في 25 سبتمبر 2023، أعلنت OpenAI أن المستخدمين سيكونون قادرين على إدخال استفسارات الصوت والصورة إلى ChatGPT.
الآن، تقوم OpenAI بتجربة نهج نموذج متعدد الوسائط وقد ربطت شات جي بي تي بالإنترنت، وربما يكون التمييز الأكثر تهديدًا بين الاثنين هو مجموعة جوجل الواسعة من بيانات التدريب المسجلة الملكية. يمكن لجوجل جيميني معالجة البيانات المأخوذة عبر الخدمات، بما في ذلك بحث جوجل و يوتيوب و جوجل Books و جوجل Scholar.
يمكن أن يؤدي استخدام هذه البيانات المسجلة الملكية في تدريب نماذج جيميني إلى ميزة مميزة في تطور الرؤى والاستنتاجات التي يمكن أن تستخلصها من مجموعة البيانات. هذا صحيح بشكل خاص إذا كانت التقارير السابقة التي تفيد بأن جيميني قد تم تدريبه على ضعف عدد التوكنز لـGPT4 صحيحة.
بالإضافة إلى ذلك، لا يمكن التقليل من أهمية الشراكة بين فريقي جوجل ديب مايند وبراين هذا العام، لأنها تضع OpenAI وجهاً لوجه مع فريق من باحثي الذكاء الاصطناعي العالميين، بما في ذلك المؤسس المشارك لشركة جوجل سيرجي برين و عالم الذكاء الاصطناعي وخبير التعلم الآلي ديب بول بارهام.
هذا فريق متمرس لديه فهم عميق لكيفية تطبيق تقنيات مثل التعلم المعزز وأشجار البحث لإنشاء برامج ذكاء اصطناعي يمكنها جمع الملاحظات وتحسين حل المشكلات بمرور الوقت، والتي استخدمها فريق ديب مايند لتعليم ألفا-جو هزيمة بطل عالمي في لعبة الـGO عام 2016.
سباق التسلح للذكاء الاصطناعي
إن مزيج جيميني من القدرات متعددة الوسائط، واستخدام التعلم المعزز، وقدرات توليد النصوص والصور، وبيانات جوجل الخاصة هي جميع المكونات التي يحتاجها جيميني للتفوق على GPT-4.
بيانات التدريب هي العامل المميز الرئيسي، بعد كل شيء، سيتم تحديد المنظمة التي تفوز بسباق تسلح النماج اللغوية الكبيرة إلى حد كبير بناءً على من يدرب نماذجهم على أكبر وأغنى مجموعة بيانات.
ومع ذلك، حيث ورد أن OpenAI تعمل على الجيل التالي من الـLLM متعدد الوسائط يسمى جوبي (Gobi)، لا يمكننا شطب عملاق الذكاء الاصطناعي التوليدي الآن. السؤال الآن هو، من ينفذ الذكاء الاصطناعي متعدد الوسائط بشكل أفضل ؟