- ℃ 11 تركيا
- 2 نوفمبر 2024
باللغة العربية.. الإمارات تطلق تطبيق "جيس" للذكاء الاصطناعي
باللغة العربية.. الإمارات تطلق تطبيق "جيس" للذكاء الاصطناعي
- 31 أغسطس 2023, 9:31:14 ص
- تم نسخ عنوان المقال إلى الحافظة
أطلقت مجموعة ذكاء اصطناعي لها صلات بالعائلة الحاكمة في أبو ظبي ما وصفته بأنه البرنامج الأعلى جودة باللغة العربية على مستوى العالم، في الوقت الذي تمضي فيه دولة الإمارات العربية المتحدة قدما في الجهود الرامية إلى قيادة اعتماد منطقة الخليج للذكاء الاصطناعي التوليدي.
والتطبيق، المعروف باسم "جيس" هو نموذج مفتوح المصدر ومتاح للاستخدام من قبل أكثر من 400 مليون متحدث باللغة العربية في العالم، وهو مبني على مجموعة كبيرة من البيانات باللغتين العربية والإنجليزية، وفقا لما أورده تقرير لصحيفة "فايننشال تايمز" وترجمه "الخليج الجديد".
وجاء إطلاق التطبيق، الذي تم الكشف عنه يوم الأربعاء، ثمرة لتعاون بين G42، وهي شركة تعمل في مجال الذكاء الاصطناعي ويرأسها مستشار الأمن القومي الإماراتي الشيخ، طحنون بن زايد آل نهيان، وجامعة محمد بن زايد للذكاء الاصطناعي في أبوظبي، وسيريبراس، وهي شركة متخصصة في الذكاء الاصطناعي، ومقرها كاليفورنيا.
ويأتي إطلاق "جيس" في الوقت الذي تقوم فيه دولة الإمارات والمملكة العربية السعودية بشراء الآلاف من رقائق "نيفيديا" الإلكترونية عالية الأداء، اللازمة لبرامج الذكاء الاصطناعي، وسط اندفاع عالمي لتأمين الإمدادات اللازمة لدعم تطوير الذكاء الاصطناعي.
وسبق لدولة الإمارات أن طورت نموذجًا لغويًا كبيرًا مفتوح المصدر (LLM)، يُعرف باسم فالكون، في معهد الابتكار التكنولوجي، المملوك للدولة، في مدينة مصدر بأبو ظبي، باستخدام أكثر من 300 شريحة نيفيديا.
وفي وقت سابق من هذا العام، وقعت شركة سيريبراس صفقة بقيمة 100 مليون دولار لتزويد 9 أجهزة كمبيوتر عملاقة لشركة G42، وهو أحد أكبر العقود من نوعها لمنافس محتمل لنيفيديا.
وفي السياق، قال أندرو جاكسون، الرئيس التنفيذي لـ "إنسبشن"، وهي وحدة الأبحاث التطبيقية للذكاء الاصطناعي التابعة لمجموعة G42، والتي تدعمها شركة Silver Lake العملاقة للأسهم الخاصة: "كانت دولة الإمارات رائدة في هذا المجال (الذكاء الاصطناعي)، ونأمل أن نكون متقدمين على اللعبة".
وأضاف: "إننا ننظر إلى هذا باعتباره سباقًا عالميًا (..) تركز معظم برامج LLM على اللغة الإنجليزية. اللغة العربية هي واحدة من أكبر اللغات في العالم. لماذا لا يحصل المجتمع الناطق باللغة العربية على ذلك؟"
ومع ذلك، فإن هدف دول الخليج، المتمثل في ريادة مجال الذكاء الاصطناعي، أثار مخاوف بشأن احتمال إساءة استخدام التكنولوجيا من قبل القادة المستبدين في الدول الغنية بالنفط.
وتتمتع برامج LLM الأكثر تقدمًا اليوم، بما في ذلك GPT-4، الذي يشغل "تشات جي بيتي" وPaLM من شركة "جوجل"، المشغل لبرنامجه "بارد"، ونموذج LLaMA مفتوح المصدر من من شركة "ميتا"، بالقدرة على فهم وإنشاء النص باللغة العربية، ومع ذلك، قال جاكسون إن العنصر العربي في النماذج الحالية، "مخفف إلى حد كبير".
فأداء جيس أفضل من فالكون، بالإضافة إلى النماذج مفتوحة المصدر مثل LLaMA، عند قياس دقتها باللغة العربية، وفقًا لمبدعيها.
((3))
ومع ذلك، قال مطورو فالكون إن برمجياتهم لم يتم تدريبها مسبقًا باللغة العربية، ومنهم البروفيسور تيموثي بالدوين، القائم بأعمال عميد جامعة محمد بن زايد للذكاء الاصطناعي، مشيرا إلى أن "جيس تم تصميمه أيضًا للحصول على فهم أكثر دقة لثقافة وسياق المنطقة، على عكس معظم النماذج التي تركز على الولايات المتحدة".
وأضاف أنه تم إنشاء حواجز الحماية للتأكد من أن جيس "لا يخرج عن الحدود المعقولة من حيث الحساسيات الثقافية والدينية".
وأشار إلى التأكد من جيس بإجراء اختبارات مكثفة للتخلص من المحتوى "الضار" أو "الحساس"، وكذلك "المخرجات المسيئة أو غير المناسبة التي لا تمثل قيم المنظمات المشاركة في تطوير النموذج".
وتابع بالدوين: "من الواضح أن جيس أفضل من أي شيء آخر باللغة العربية، وفي اللغة الإنجليزية، تظهر المقارنات أننا قادرون على المنافسة أو حتى أفضل قليلاً في المهام المختلفة مقارنة بالنماذج الحالية".
وتم تسمية جيس على اسم أعلى جبل في دولة الإمارات، وجرى تدريبه على مدار 21 يومًا على مجموعة فرعية من الكمبيوتر العملاق Condor Galaxy 1 AI من شركة سيريبراس على يد فريق في أبو ظبي.
وتعاونت مجموعة G42 مع كيانات أخرى في أبوظبي كشركاء لإطلاق هذه التكنولوجيا، بما في ذلك شركة بترول أبوظبي الوطنية، وصندوق الثروة المبادلة، والاتحاد للطيران.
وكان أحد التحديات في تدريب النموذج هو الافتقار إلى بيانات عالية الجودة باللغة العربية على الإنترنت، مقارنة باللغة الإنجليزية.
ويستخدم جيس اللغة العربية الفصحى الحديثة، والتي يتم فهمها في جميع أنحاء الشرق الأوسط، بالإضافة إلى اللهجات المنطوقة المتنوعة في المنطقة من خلال الاعتماد على كل من الوسائط ووسائل التواصل الاجتماعي والرموز.