الإمارات – السابعة الإخبارية
الذكاء الاصطناعي.. في زمن تتسابق فيه شركات التكنولوجيا لتطوير روبوتات الدردشة المدعومة بالذكاء الاصطناعي، والتي أصبحت قادرة على تحليل عقود قانونية معقدة، وتلخيص أبحاث علمية، وحتى فهم روايات أدبية وخطابات سياسية، يبقى السؤال الحاسم: هل تفهم هذه النماذج ما تقرأه فعلاً؟
للإجابة على هذا التساؤل المحوري، أجرت صحيفة واشنطن بوست تجربة فريدة من نوعها جمعت أبرز خمسة مساعدين ذكاء اصطناعي: ChatGPT (من OpenAI)، Claude (من Anthropic)، Copilot (من Microsoft)، Meta AI (من Meta)، وGemini (من Google)، واختبرتهم عبر أربعة أنواع من النصوص: أدب، علوم صحية، قانون، وسياسة.

تجربة متعددة الزوايا وتحكيم بشري متخصص
ولضمان الحياد والدقة، استعانت الصحيفة بمجموعة من الخبراء في كل مجال، بمن فيهم مؤلفون، باحثون، ومحامون، لتقييم أداء كل روبوت على أساس 115 سؤالاً تفصيلياً. النتائج كشفت تباينًا حادًا، تراوح بين إجابات مذهلة من حيث الدقة والتحليل، إلى أخطاء صادمة وهفوات حرجة.
والملاحظة الأخطر أن جميع الروبوتات، باستثناء Claude، قامت باختلاق معلومات – وهي الظاهرة المعروفة في عالم الذكاء الاصطناعي باسم “الهلوسة”.
1. الأدب: مهمة معقدة وتصدر حذر لـ ChatGPT
في مجال الأدب، وُجد أن الرواية المختارة “عشيقة ابن آوى” شكّلت تحديًا كبيرًا للروبوتات. ChatGPT جاء في الصدارة، لكنه أغفل شخصيتين محوريتين ولم يتطرق بشكل كافٍ لموضوعات هامة مثل العبودية والحرب الأهلية.
أما Gemini، فكانت إجاباته “مضللة وغير دقيقة”، وفق تقييم لجنة التحكيم. ومع ذلك، نالت الإجابات التحليلية من ChatGPT وClaude إعجاب المؤلف كريس بوهجاليان، الذي قال إن الروبوتين “عبّرا عن المشاعر الحقيقية في الرواية بشكل لافت”.
2. القانون: Claude يتفوق في الدقة
تضمنت التجربة تحليل عقدي إيجار واختراعات، حيث لاحظ المحامي ستيرلينغ ميلر أن بعض الروبوتات “اختصرت بشكل مضر”. ChatGPT، مثلاً، أغفل بندًا رئيسيًا يتعلق بملكية الاختراعات، بينما قدم Claude أداءً دقيقًا وتحليلاً شاملاً، بل واقترح تعديلات قانونية فعالة على نص العقد.
3. العلوم الصحية: Claude يحصد العلامة الكاملة
في مجال الطب، تفوق Claude بوضوح، خاصة في ملخصه لإحدى أوراق بحثية عن “كوفيد طويل الأمد”، حيث حصل على تقييم 10 من 10، من قبل متخصصين اعتبروا ملخصه “دقيقًا وعمليًا للأطباء”.
ويرى الخبراء أن أداء الذكاء الاصطناعي في العلوم يرجع إلى أن الأوراق الطبية غالبًا ما تكون مكتوبة بأسلوب منظم ومنهجي، ما يجعلها “أسهل للهضم” آليًا.

4. السياسة: ChatGPT يقرأ ترامب جيدًا
تحليل خطابات الرئيس الأمريكي السابق دونالد ترامب مثّل اختبارًا لفهم السياق والنبرة السياسية. وقد تفوق ChatGPT في نقل الأسلوب والرسائل الضمنية، في حين فشلت أدوات أخرى، مثل Copilot، في محاكاة نبرة ترامب، ما أثر على دقة التحليل.
Claude يفوز بالمسابقة… ولكن!
بناءً على مجموع النقاط، جاء Claude في المركز الأول، وكان الوحيد الذي لم يصدر عنه اختلاقات أو “هلوسات”. لكن المثير للاهتمام أن أداء أي من الأدوات لم يتجاوز 70% من مجموع النقاط الممكنة، ما يعكس محدودية هذه التقنيات رغم تطورها.
الذكاء الاصطناعي… أداة لا بديل
ورغم الإعجاب الكبير ببعض التحليلات المقدمة من Claude وChatGPT، شدد الخبراء المشاركون في التجربة على أن الذكاء الاصطناعي لا يمكنه حتى الآن أن يحل محل الخبير البشري، سواء أكان محاميًا أو طبيبًا أو كاتبًا.
لكن في الوقت ذاته، فإن هذه الأدوات تمثل وسيلة قوية لفهم المواضيع المعقدة بسرعة، وتبسيط المصطلحات، وتوفير نقطة انطلاق جيدة للباحثين والمهنيين.
خلاصة: بين الوعد والتحذير
تجربة واشنطن بوست سلطت الضوء على الفجوة المستمرة بين قدرة روبوتات الذكاء الاصطناعي على “قراءة النصوص” وقدرتها على “فهمها فعلاً”.
وحتى مع التقدم الهائل في النماذج اللغوية، يبقى العقل البشري هو المرجع النهائي للدقة والمعنى.
ورغم الإعجاب الكبير ببعض التحليلات المقدمة من Claude وChatGPT، شدد الخبراء المشاركون في التجربة على أن الذكاء الاصطناعي لا يمكنه حتى الآن أن يحل محل الخبير البشري، سواء أكان محاميًا أو طبيبًا أو كاتبًا.
لكن في الوقت ذاته، فإن هذه الأدوات تمثل وسيلة قوية لفهم المواضيع المعقدة بسرعة، وتبسيط المصطلحات، وتوفير نقطة انطلاق جيدة للباحثين والمهنيين.
AI Agent هذا هو ثورة الذكاء الاصطناعي
الكثير ممكن يسأل كيف استفيد من برامج الذكاء الاصطناعي وكيف اخليه يشتغل عني وتزيد إنتاجيتي؟
والأغلبية يستخدمه فقط للإجابة على الاسئلة (وهو خارق حقيقية) لكن بدون استخدام AI Agent فأنت فقط تستفيد من 20٪ من خدماته
خلنا نقسمها استخدامات… pic.twitter.com/ALkP7MnIrB
— الصقري | Alsagri (@AlsagriCapital) June 4, 2025