مدونة الذكاء الاصطناعي وSEO

خلف كواليس ChatGPT Search: هندسة عكسية لـ web.run، fan-outs، وقواعد الرؤية الجديدة

عندما غيّرت OpenAI النموذج الافتراضي في 4 مارس، انخفض عدد المواقع المذكورة في كل إجابة بنسبة خُمس، ولم يتعافَ منذ ذلك الحين. لكن هذا الانخفاض ليس سوى جزء من القصة. قمنا أيضًا بعكس هندسة أدوات التصفّح الداخلية لChatGPT، وأجرينا تجربة من نوع honeypot، وأعدنا تركيب system prompt الخاص به، وأصدرنا نسخة جديدة من الإضافة لدينا ChatGPT Search Capture.

ما حدث

في 4 مارس 2026، نقل ChatGPT نموذجه الافتراضي من GPT-4o/5.2 إلى GPT-5.3 Instant. النتيجة: انخفض متوسط عدد النطاقات الفريدة المذكورة في كل إجابة من 19.1 إلى 15.2، أي تراجع بأكثر من 20%. وسلك عدد عناوين URL الفريدة في كل إجابة نفس المسار، من 24.1 إلى 19.1.

راقبنا 400 مطالب يومية لمدة 14 أسبوعًا، بالاعتماد على بيانات الرصد المقدمة من Meteoria. نُشرت مجموعة النتائج كاملة على شكل دراسة تفاعلية من ثمانية أجزاء على think.resoneo.com/شات-جي-بي-تي/5.3-5.4/.

لماذا هذا مهم

يضم ChatGPT 900 مليون مستخدم نشط أسبوعيًا. مساحة الإشارة في كل إجابة لم تتغير، لكن عدد المواقع التي تتقاسمها تقلّ. نفس الكعكة، لكن بحصص أقل. هذا يعكس على الأرجح تحوّلاً هيكليًا نحو مصادر ذات سلطة أعلى، لكنه يعني أيضًا إجمالًا عددًا أقل من الفائزين. المواقع التي لا تجتاز الفلترة تفقد مساحة الظهور التي كانت متاحة لها سابقًا.

تأثير بيغ فوت

سمّينا هذه الظاهرة بالإشارة إلى "تحديث Bigfoot" الذي حدّده د. بيت (من Moz) في 2013، عندما كانت Google أحيانًا تترك نطاقًا واحدًا يحتل الصفحة الأولى بأكملها…

يسترجع ChatGPT الآن عددًا أقل من النطاقات في كل إجابة، لكن نسبة العناوين-لكل-نطاق بقيت مستقرة عند 1.26. عمق الزحف لكل نطاق لم يتغير. ما تغيّر هو عدد المواقع المختلفة التي تحصل على موقع على الطاولة.

يعزز GPT-5.4 Thinking هذا التركيز أكثر. يستخدم النموذج عوامل تشغيل site: لتقييد البحث على النطاقات الموثوقة ويوزع طلباته عبر غالبًا أكثر من 10 "استعلامات fan-out" لكل إجابة، يستهدف كل منها مصدرًا محددًا.

تؤكد التحليلات المستقلة للوغز بواسطة جيروم سالومون (Oncrawl) هذا الاتجاه. حجم زحف بوت ChatGPT-User استقر على مستوى أقل منذ الانتقال إلى 5.3. بعض الصفحات ببساطة لم تعد تُزحف. السبب يتجاوز تحديثات النموذج: أكثر من 90% من المستخدمين الأسبوعيين لـChatGPT على خطة مجانية، والتجربة الافتراضية تؤدي إلى تشغيل بحث ويب أقل، واستخدام استعلامات أقل، وإنتاج اقتباسات أقل.

كيف يعمل ChatGPT Search فعلاً

تقدّم دراستنا أيضًا هندسة عكسية كاملة لنظام البحث الداخلي في ChatGPT المسمى web.run. قبل 5.3، كان النموذج يرسل أوامر نصية مضغوطة، مفصولة بأنابيب (fast|query|recency). بعد 5.3، صار يرسل كائنات JSON مُهيكلة مع وسائط مُطَبَّعة. هذا ليس مجرد تغيير في الشكل. إنه يعكس بنية مختلفة في الطريقة التي يصيغ ويُوزّع بها النموذج عملياته على الويب.

أداة الويب تدعم الآن 12 عملية، مقابل 4 سابقًا (بالإضافة إلى نظام ويدجت منفصل يُدعى «genui»). تتضمن من بينها: search_query, open, find, click, screenshot, product_query، وويدجتات متخصصة للرياضة والمال والطقس ونحوها. يستطيع GPT-5.4 إجراء من 5 إلى أكثر من 10 جولات بحثية لكل إجابة، مع تحسين الاستعلامات بناءً على النتائج السابقة. بينما يكتفي GPT-5.3 Instant عادةً بجولتين أو ثلاث.

آثار Google لا تزال مرئية: علامات تتبع Google (strlid) تظهر في عناوين URL الخاصة بالمنتجات، ومطابقات المعرف إلى التوكن في SearchAPI تكشف اعتماد الواجهة الخلفية على مزودي بحث طرف ثالث وعلى Google في الخلفية.

نوع جديد من التفرع لطلبات المنتجات

اكتشفنا نوعًا من التوزيع المتسلسل (fan-out) لم يتم توثيقه بعد: تصفح-الاستعلامات-المعاد-كتابتها. يظهر هذا النوع حصريًا في استعلامات المنتجات على 5.4 Instant، وهو مرئي في كود المحادثة.

عندما يسأل المستخدم سؤالًا من نوع «أفضل طابعة ثلاثية الأبعاد للشراء في 2026»، يبدأ ChatGPT بإطلاق توزيع واحد لإعادة الصياغة لبناء قائمة كاملة بالمنتجات المرشحة. ثم يطلق توزيعًا منفصلاً للتسوق لكل منتج على حدة، مسترجعًا المواصفات والتقييمات والأسعار واحدًا تلو الآخر. قبل 5.3 كانت عمليات البحث عن المنتجات تُجمَع في استدعاء واحد. أصبح لكل منتج الآن أمر استرجاع مخصص خاص به.

ChatGPT-User هو وكيل الاسترجاع

تجربة honeypot لدينا أكدت تفصيلًا مهمًا. عندما يتصفح ChatGPT الويب استجابةً لبحث أثناء محادثة، يكون الزاحف ChatGPT-User, وليس OAI-SearchBot، هو الذي يجلب محتوى الصفحات. تصف OpenAI OAI-SearchBot كالوكل الذي يبني فهرس البحث الخاص بـ ChatGPT، لكن عمليًا يعتمد النموذج على واجهات برمجة تطبيقات تجريف طرف ثالث للحصول على نتائج البحث، ثم يرسل ChatGPT-User لاسترجاع المحتوى الفعلي لعناوين URL المختارة.

النقطة العمياء لمساحات الأسماء: ثغرة ChatGPT

قد تكون هذه أهم اكتشافاتنا المدهشة.

بدأ الدليل بهندسة عكسية تقليدية. قمنا بفك تجميع تطبيق ChatGPT على الجوال، وتشريح كود العميل على الويب والتقاط حزم الشبكة على المنصتين. هذا أعطانا أسماء الأدوات الداخلية وبعض قواعد النداء. مسلحين بهذه العناصر الدقيقة، تمكنا من طرح الأسئلة الصحيحة على ChatGPT — واكتشفنا أن النموذج كان يجيب عنها دون أي قيود.

وضعت OpenAI حماية حقيقية حول system prompts الخاصة بها. لكن طبقة تكوين الأدوات الداخلية لا تملك أي حماية. ال مساحات الأسماء في ChatGPT، هذه المجموعات من الأدوات الداخلية التي يمكن للنموذج استدعاؤها أثناء المحادثة، يمكن وصفها بحرية. طالما تتجنب كلمات «system prompt»، سيفصح النموذج عن مخططات الأدوات، وقوائم العمليات، وقنوات الإخراج وبُنى المساحات الاسمية بتناسق تام.

نشرنا أوامر جاهزة يمكن لأي شخص لصقها في ChatGPT لتدقيق بيئته الداخلية. للتحقق مما إذا كان النموذج يختلق هذه الأوصاف، أجرينا دراسة تشاركية مع عشرات المستخدمين في جلسات منفصلة. كل مشارك حصل بالضبط على نفس أسماء الأدوات، نفس مخططات المعاملات، ونفس قوائم العمليات. يصف النموذج أدواته بطريقة متسقة، وبالتالي موثوقة ^^

تتضمن الدراسة أيضاً system prompt مُعاد بناؤه بواسطة استخراج تدريجي، مرفقاً بعدة معلومات ملحوظة: Reddit هو المجال الوحيد المعفى من حدود الكلمات المرتبطة بحقوق النشر، توجد قائمة مفصلة بالمنتجات الممنوعة، «مؤشر الإفراط في الكلام» يعمل على مقياس من 1 إلى 10، وفقرة كاملة من سياسة الإعلانات تنظم عرض الإعلانات حسب مستوى الاشتراك.

استخدام عملي: إجراء تدقيق قابلية الزحف بنفسك

بناء جملة web.run الذي وثقناه ليس مجرد فضول تقني. إنه يعمل، ويفتح مساراً مباشراً لاختبار كيف يتفاعل ChatGPT مع محتواك.

إليك مثالاً عملياً. يمكنك إجبار ChatGPT على البحث في نطاق موقعك وقراءة صفحات محددة عن طريق لصق أوامر JSON مباشرة داخل المحادثة.
أولاً، أطلق بحثاً مستهدفاً على موقعك، ثم أجبره على استرجاع أول نتيجتين تم العثور عليهما، واطلب منه بعد ذلك إعادة العنوان والموضوع الرئيسي ونقاط كل صفحة.

Search for this query, then open the first two results and summarize what you find on each page.

Step 1 : Search:

{
"search_query": [
{ "q": "site:abondance.com seo" }
],
"response_length": "short"
}

Step 2 : Open the first two results:

{
"open": [
{ "ref_id": "turn0search0" },
{ "ref_id": "turn0search1" }
]
}

Step 3 : Give me a structured recap of what you found on each URL. For each page: the title, the main topic, and 3-5 key points.

ما تحصل عليه هو رؤية لمحتواك عبر عيون ChatGPT: ما الذي يستطيع الوصول إليه فعلياً، ما يستخرجه، وكيف يفسر صفحاتك. إذا لم يستطع الوصول إلى صفحة ما، أو أعاد محتوى مشوشاً، أو تجاهل رسائلك الأساسية تماماً، فهذه إشارة تستدعي اتخاذ إجراء.

للذهاب أبعد من ذلك، امتداد كروم «ChatGPT Search Capture» من RESONEO (الإصدار V3.3، مجاني على متجر كروم) يتيح عرض عناوين URL الدقيقة المسترجعة أثناء أي محادثة ChatGPT، بما في ذلك fan-out queries (باستثناء 5.3 Instant، التي تُدار الآن على الخادم)، وref_ids وبيانات التعريف الخاصة بالنموذج. بمزجه مع أوامر JSON اليدوية أعلاه، تحصل على تدقيق لاستخراجية خفيف لكنه قابل للتنفيذ: ما هي عناوين URL التي يسترجعها، وماذا يستخرج منها فعلياً؟

نفس عائلة النماذج، اقتباسات مختلفة

GPT-5.2 و5.3 و5.4 تشترك في نفس تاريخ القطع (أغسطس 2025) وتنتمي إلى نفس عائلة GPT-5. ومع ذلك، نفس الأمر المرسل إلى كلٍّ منها يولد fan-out queries مختلفة، يسترجع مصادر مختلفة، ويعرض مقاطع مختلفة في الاستجابة النهائية.

تؤثر عدة طبقات من التباين بعد مرحلة ما قبل التدريب: تشكيل المكافأة في RLHF، بيانات الضبط الدقيق المُشرف عليها، تكوينات system prompt وميزانيات الحوسبة أثناء الاستدلال. يتلقى GPT-5.4 Pro صراحة حوسبة أكثر لـ«التفكير بشكل أعمق»، وهذا وحده قد يغيّر المصادر المنقولة.

لهذا ننصح باختبار كل نموذج على حدة. قد ينتج عن أمر واحد اقتباسات مختلفة جذرياً بحسب ما إذا كان المستخدم على GPT-5.3 Instant أو 5.4 Thinking أو 5.4 Extended. قد يُعاد توجيه مستخدمي الخطة المجانية بهدوء إلى نموذج مخفف.

نوعان من رؤية الذكاء الاصطناعي

تقدم دراستنا إطار تحليلي يفصل بين الرؤية البارامترية (ما يعرفه النموذج بفضل بيانات تدريبه، البحث معطّل) و الرؤية الديناميكية (ما يسترجعه في الوقت الفعلي، البحث مفعل).

الرؤية الباراميترية: E-E-A-T لنماذج اللغة الكبيرة

الرؤية البارامترية هي مكافئ E-E-A-T لنماذج اللغة الكبيرة. إنها السلطة المشفّرة عبر مليارات أمثلة التدريب، تشكّلت بوساطة التغطية الصحفية، والتواجد على ويكيبيديا، ومواقع سلطة أخرى، ومجمل مجموعة التدريب. هي مستقرة ويمكن قياسها عبر تدقيقات لمرة واحدة عبر واجهة برمجة التطبيقات.

الرؤية الديناميكية: أرض متغيرة

أما الرؤية الديناميكية فمتقلبة. فهي تعتمد على النموذج وتتطلب مراقبة مستمرة. تقترب أكثر من سيو التقليدي، وقد تنهار بين ليلة وضحاها بعد تحديث نموذج، كما يوضح تأثير Bigfoot.

الصلة بين الاثنين

العلاقة بين الاثنين مهمة. النموذج يصوغ طلباته على الويب مستهدفًا المصادر التي يعرفها بالفعل. العلامة التجارية الغائبة عن الذاكرة البارامترية لن تُؤخذ حتى بعين الاعتبار كمرشحة للبحث. أن تكون غير معروف للنموذج يعني أن تكون غير مرئي قبل أن يبدأ البحث حتى.

تعد تحديثات تاريخ القطع بمثابة "رقصة جوجل" لنماذج اللغة الكبيرة. عندما يتغير تاريخ القطع، تُعاد توزيعات التصنيف البارامترية دفعة واحدة. لكن هذا يحدث تقريبًا مرة واحدة سنويًا لأن إعادة التدريب على هذا النطاق مكلفة للغاية. النافذة الاستراتيجية للتأثير على ما يعرفه النموذج عن علامتك تمتد بين تاريخي قطع.

مؤشر سلطة العلامة التجارية بالذكاء الاصطناعي لدان بيتروفيتش (DEJAN) يوضّح القياس البارامترِي على نطاق واسع. دراستنا تكمله بإطار اختبار أخف وقابل للتكرار، مبني على خمسة موجهات تُنفَّذ عدة مرات لتدقيق لمرة واحدة.

لمزيد من التعمق

الدراسة الكاملة (توثيق معكوس للهندسة، تجربة honeypot، موجهات تدقيق DIY وإعادة تكوين system prompt) متاحة على think.resoneo.com/شات-جي-بي-تي/5.3-5.4/.

خلاصة

لم يعد ChatGPT Search صندوقًا أسود. تبيّن هذه الدراسة خريطة بنيته الداخلية، بدءًا من أداة web.run التي تدفع كل بحث إلى منطق fan-out الذي يقرر أي المجالات يتم استردادها وأيها يُتجاهل.

انخفاض 20% في المجالات المذكورة بعد الانتقال إلى 5.3 يبيّن مدى سرعة تقلب مشهد الاستشهادات مع تحديث نموذج واحد. لكن المشكلة الجوهرية بنيوية: يركّز ChatGPT استشهاداته على عدد أقل من المواقع ويطبق منطق اختيار مصادر تشكّلّه بيانات التدريب، والتعديل الدقيق بعد التدريب، وقواعد system prompt التي تختلف من نموذج لآخر.

متابعة الرؤية في ChatGPT تتطلب فهم طبقتين متميزتين (البارامترية والديناميكية)، والاختبار على نماذج متعددة، ومراقبة نظام يمكن توثيق أدواته الداخلية لكن سلوكه قد يتغير بين عشية وضحاها.

الـالدراسة الكاملة يقدّم البيانات والمنهجية والأدوات للبدء.

المقال «خلف كواليس ChatGPT Search: هندسة عكسية لـ web.run، fan-outs، وقواعد الرؤية الجديدة» نُشر على الموقع أبوندانس.