معترفة بخوضها مغامرة غير محسوبة النتائج، تعاود "إم آي تي" (Massachusetts Institute of Technology) هذا العام تقديم تصورات مستقبلية تعرض فيها أبرز أربعة ترندات للذكاء الاصطناعي في العام الجديد، بعد إقدامها على هذه الخطوة في ديسمبر (كانون الأول) العام الماضي.
وفي حين تستند توقعاتها إلى تحليل ذكي ودقيق لمعلومات أوردتها في مقالتها، يمكن للقارئ أن يلاحظ أن البناء الذي اعتمدت عليه من الممكن أن يجعل ما سيرد في هذا المقالة أكثر من مجرد توقعات.
من 2023 إلى 2024
بادئ ذي بدء يمكن القول إن "إم آي تي" أصابت توقعين العام الماضي، في حين تحقق نصف الثالث والرابع في طور التحقق، إذ كانت رهاناتها الأربعة الكبرى لعام 2023 هي أن النماذج متعددة الوسائط، أي تعمل مع النصوص والصور والصوت، ستكون الشيء الكبير التالي في برامج الدردشة الآلية، وقد تحقق هذا التوقع في "جي بي تي-4" من "أوبن أيه آي" و "جيمني" من "غوغل ديب مايند".
والتوقع الثاني أن يقوم صناع السياسات بوضع لوائح تنظيمية جديدة صارمة، والحقيقة أنه في ديسمبر صدرت أخيراً الموافقة على قانون الذكاء الاصطناعي للاتحاد الأوروبي.
أما التوقع الثالث فكان بخصوص ضغوط ستعانيها شركات التكنولوجيا الكبرى بعد ظهور الشركات الناشئة مفتوحة المصدر، وهنا أصابت بصورة جزئية، إذ إن المصادر المفتوحة لا تزال مستمرة في صنع طفرات، ومع ذلك فإن شركات الذكاء الاصطناعي مثل (OpenAI) و(Google DeepMind) لا تزال تسرق الأضواء.
والتوقع الأخير كان أن الذكاء الاصطناعي سيغير نهج شركات الأدوية الكبرى إلى الأبد، وهنا أشارت "إم آي تي" إلى أنه من السابق لأوانه معرفة ذلك، إذ إنه في حين تجري ثورة اكتشاف الأدوية على قدم وساق إلا أن الأدوية الأولى التي طورت باستخدام الذكاء الاصطناعي لا تزال بعيدة بضعة أعوام أيضاً من الطرح في الأسواق.
أما في توقعات هذا العام فقررت "إم آي تي" الذهاب أبعد مما هو واضح وجلي لكثيرين، وعما يتم تداوله بصورة مكثفة من قبل متابعي هذا المجال، إذ تذكر في مقالتها "نحن نعلم أن نماذج اللغات الكبيرة ستستمر في الهيمنة وأن المنظمين سيكونون أكثر جرأة، وأن مشكلات الذكاء الاصطناعي، بدءاً بالتحيز ووصولاً إلى حقوق النشر، ستشكل أجندة الباحثين والمنظمين والجمهور، ليس فقط عام 2024 ولكن لأعوام مقبلة، وبدلاً من ذلك اخترنا بعض الاتجاهات النوعية والأكثر خصوصية للتنبه إليها عام 2024".
روبوتات الدردشة المخصصة
التوقع الأول هو أن شركات التكنولوجيا التي استثمرت بكثافة في الذكاء الاصطناعي التوليدي ستتعرض لضغوط عام 2024 لإثبات قدرتها على جني الأموال من منتجاتها، وللقيام بذلك يعمل عملاقا الذكاء الاصطناعي "غوغل" و "أوبن أيه آي" بصورة كبيرة على تطوير منصات سهلة الاستخدام تسمح للأشخاص بتخصيص نماذج لغوية قوية وإنشاء روبوتات دردشة صغيرة خاصة بهم تلبي حاجاتهم الخاصة من دون الحاجة إلى مهارات برمجية، إذ أطلق كلاهما أدواتاً تتيح لأي شخص أن يصبح مطور تطبيقات ذكاء اصطناعي توليدي، أي يمكن القول، بحسب "إم آي تي"، إنه في 2024 قد يصبح الذكاء الاصطناعي التوليدي مفيداً بالفعل للشخص العادي، وسنرى مزيداً من الأشخاص يقومون بتعديل ملايين من نماذج الذكاء الاصطناعي الصغيرة.
وتتابع أن نماذج الذكاء الاصطناعي الحديثة أصبحت مثل "جي بي تي-4" و"جيمني" متعددة الوسائط، مما يعني أنها تستطيع معالجة الصور ومقاطع الفيديو حتى، لذا من الممكن لهذه القدرات الجديدة إطلاق حزمة كاملة من التطبيقات الجديدة.
لكن بطبيعة الحال يعتمد نجاح هذه الخطوة على ما إذا كانت هذه النماذج تعمل بصورة موثوقة، إذ لا تزال النماذج اللغوية مستمرة في اختلاق الأشياء والهلوسة، إضافة إلى أن النماذج التوليدية لا تزال مليئة بالتحيزات، كما أنه من السهل اختراقها، والحقيقة أنه لم تتمكن شركات التكنولوجيا من حل أي من هذه المشكلات حتى اليوم.
حرفة صناعة الأفلام تتغير بصورة جذرية
أما الموجة الثانية من الذكاء الاصطناعي التوليدي فستكون الفيديو، إذ تتوقع "إم آي تي" أن نصل إلى مستوى تحويل النص إلى فيديو وأن يحل محل تحويل النص إلى صورة، وتقول "إم آي تي" إنها حصلت على أول لمحة عما يمكن أن تفعله النماذج التوليدية عندما تم تدريبها على تجميع صور ثابتة عدة معاً في مقاطع مدتها بضع ثوان، وكانت النتائج مشوهة بعض الشيء لكن التكنولوجيا تحسنت بسرعة، إذ تقوم شركة "رانواي"، وهي شركة ناشئة متخصصة في أبحاث الذكاء الاصطناعي التطبيقية وصناعة نماذج فيديو إبداعية، بإصدار نسخ جديدة من أدواتها كل بضعة أشهر، كما أقامت "رانواي" التي شاركت في إنشاء نموذج التعلم العميق لتحويل النص إلى صورة، الذي أصدر عام 2022، مهرجاناً سنوياً يعرض أفلاماً تجريبية تم إنتاجها باستخدام مجموعة من أدوات الذكاء الاصطناعي، لذا من غير المستغرب أن تنتبه الأستوديوهات الكبرى إلى هذا الأمر، بخاصة أن عمالقة السينما مثل "باراماونت" و"ديزني" تستكشف اليوم طريقة استخدام الذكاء الاصطناعي التوليدي في مختلف نواحي خط الإنتاج الخاص بها، كما تستخدم تقنية مزامنة شفاه الممثلين مع كثير من اللغات الأجنبية.
اقرأ المزيد
يحتوي هذا القسم على المقلات ذات صلة, الموضوعة في (Related Nodes field)
وبحسب "إم آي تي" فقد بدأت تقنية التزييف العميق في الظهور أيضاً لأغراض التسويق أو التدريب، وعلى سبيل المثال تصنع "شركة سينثيسيا"، وهي شركة متخصصة في إنتاج الوسائط الاصطناعية وتقوم بتطوير البرامج المستخدمة لإنشاء محتوى فيديو بواسطة الذكاء الاصطناعي، أدواتاً تملك ميزات عدة ومنها قراءة أي نص بضغطة زر، ووفقاً للشركة تستخدم تقنيتها الآن من قبل 44 في المئة من الشركات المدرجة في قائمة (companies Fortune 10).
المعلومات الانتخابية المضللة في كل مكان
وفي تصورها الثالث تتحدث "إم آي تي" عن أنه من الممكن أن يشكل التضليل الانتخابي والتزييف العميق الناتج من الذكاء الاصطناعي مشكلة كبيرة مع توجه عدد كبير من الناس إلى صناديق الاقتراع عام 2024، بخاصة أننا كنا شهدنا بالفعل السياسيين يستخدمون هذه الأدوات كسلاح، ففي الأرجنتين مثلاً قام اثنان من المرشحين الرئاسيين بمهاجمة خصومهما من طريق تزييف صور ومقاطع فيديو بواسطة الذكاء الاصطناعي، وكذلك في سلوفاكيا انتشرت مثل النار في الهشيم تزييفات لزعيم حزب ليبرالي مؤيد لأوروبا خلال الانتخابات في البلاد.
وتناقش "إم آي تي" أنه في حين من الصعب تحديد مدى تأثير هذه الأمثلة على نتائج الانتخابات، إلا أن انتشارها يمثل اتجاهاً مثيراً للقلق، إذ سيصبح التعرف على ما هو حقيقي عبر الإنترنت أصعب من أي وقت مضى، وقد تكون لهذا عواقب وخيمة في مناخ سياسي ملتهب أصلاً.
وتتابع أنه قبل بضعة أعوام فقط كان إنشاء التزييف العميق يتطلب مهارات تقنية متقدمة، لكن الذكاء الاصطناعي التوليدي جعل الأمر سهلاً ومتاحاً بسهولة مع تزايد درجة واقعية النتائج، وطالما أن تقنيات تتبع المحتوى لا تزال في أيامها الأولى، وأن منصات وسائل التواصل الاجتماعي لا تزال متمهلة في إزالة المعلومات المضللة، وسيكون العام المقبل حاسماً بالنسبة إلى أولئك الذين يكافحون انتشار مثل هذا المحتوى.
روبوتات المهمات المتعددة
واستهلت "إم آي تي" الحديث عن توقعها الرابع بمقدمة صغيرة أشارت فيها إلى التحول الذي شهدته الأعوام القليلة الماضية في مجال الذكاء الاصطناعي بعيداً من استخدام نماذج صغيرة عدة، مدرب كل منها على القيام بمهمات مختلفة ومنها التعرف إلى الصور ورسمها والتعليق عليها، نحو نماذج فردية متجانسة مدربة على القيام بكل هذه الأشياء وأكثر.
وذكرت أن علماء الروبوتات بدأوا فعلياً في بناء مزيد من الروبوتات المستوحاة من بعض التقنيات الأساس وراء الطفرة الحالية للذكاء الاصطناعي التوليدي، والتي بإمكانها القيام بمجموعة واسعة من المهمات، مثل الروبوتات ذات الأغراض العامة، إذ إنه في حين يمكن للنماذج متعددة الوسائط حل المهمات البصرية، إضافة إلى المهمات اللغوية، يمكن أن يعمل النهج نفسه مع الروبوتات، لذلك لن يكون من الضروري تدريب أحدهم على تقليب الفطائر وآخر على فتح الأبواب، بل سيكون هناك نموذج واحد يمنح الروبوتات القدرة على القيام بمهمات متعددة ويناسب جميع الحالات.
وذكرت "إم آي تي" أمثلة عدة ظهرت في عام 2023، وعلى سبيل المثال في يونيو (حزيران) أصدرت شركة "ديب ميند" جهاز "روب كات" والذي يولد بياناته الخاصة اعتماداً على التجربة والخطأ لمعرفة كيفية التحكم في كثير من أذرع الروبوتات المختلفة، بدلاً من ذراع واحد محدد.
كما أشارت إلى أن المشكلة الرئيسة تتعلق بنقص البيانات، فبالمقارنة بالذكاء الاصطناعي التوليدي الذي يعتمد على مجموعة بيانات ضخمة من النصوص والصور وغيرها، نجد أن لدى الروبوتات عدداً قليلاً جداً من المصادر الجيدة التي تساعدها في تعلم كيفية القيام بكثير من المهمات الصناعية أو المنزلية المطلوبة منها.
لكن فريقاً من "جامعة نيويورك" يعمل اليوم على معالجة هذه المشكلة من طريق تطوير تقنيات تسمح للروبوتات بالتعلم من طريق التجربة والخطأ، والتوصل إلى بيانات التدريب الخاصة بها أثناء تقدمها، وبحسب "إم آي تي" فقد بدأ هذا النهج يؤتي ثماره بالفعل في مجال السيارات ذاتية القيادة، إذ تقود الشركات الناشئة موجة جديدة من الذكاء الاصطناعي ذاتي القيادة الذي يستخدم نموذجاً واحداً كبيراً للتحكم في السيارة بدلاً من نماذج عدة أصغر للتحكم في مهمات قيادة محددة. واليوم تقوم فعلياً شركة "ويف" المتخصصة في اتباع نهج يركز على الذكاء الاصطناعي في القيادة الذاتية باختبار سياراتها ذاتية القيادة في شوارع لندن الضيقة والمزدحمة.