أشكوش ديجيتال

تحليل llms.txt يكشف أن الذكاء الاصطناعي لا يقرأ ملفاتك

تحليل llms.txt يكشف أن الذكاء الاصطناعي لا يقرأ ملفاتك

يحتاج كل مسوق رقمي اليوم إلى فهم تحليل llms.txt قبل إهدار ميزانيته. تظهر البيانات الحقيقية أن معظم هذه الملفات لا تجلب أي زيارات فعلية. قضينا ثلاثة أسابيع في صياغة ملفات llms.txt لموقع تجاري كبير بالدار البيضاء. كنا مقتنعين تماماً أنها ستضاعف ظهورهم في نتائج الذكاء الاصطناعي. كان الموعد النهائي ضاغطاً جداً وأطلقنا المنصة بانتظار طفرة الزيارات. لكن لم يحدث أي شيء على الإطلاق وشعرت بإحباط شديد. كان العميل يتوقع نتائج فورية وملموسة قبل نهاية الشهر الحالي. جلست وحيداً في الثانية فجراً أتحقق من سجلات الخادم الخام. فتحت أداة Ahrefs Bot Analytics لأفلتر الوكلاء الذين يطلبون المسار. كانت الصدمة قاسية لأن روبوتات الاسترجاع الحقيقية لم تقم بطلب واحد. ضيعنا أربعين ساعة عمل على وهم تسويقي روج له القطاع. لا تبنِ استراتيجيتك على ضجيج المنافسين بل على بيانات خادمك الفعلية.

جدول المحتويات إخفاء
  1. 1 ما هو ملف llms.txt؟
    1. 1.1 التعريف الدقيق لملف llms.txt
    2. 1.2 الالتباس المفاهيمي: لماذا ليس robots.txt ولا نسخة ماركداون
    3. 1.3 أصل الفكرة ومقترح جيريمي هوارد
  2. 2 منهجية التحليل: كيف اختبرنا 137 ألف موقع
    1. 2.1 الأدوات المستخدمة: Ahrefs Web Analytics وBot Analytics
    2. 2.2 معايير فحص الملفات: تأكيد الصلاحية والمحتوى
    3. 2.3 حدود العينة: لماذا قد تكون نسبة 28% مبالغاً فيها
  3. 3 تحليل llms.txt: 28% من المواقع تنشره ولكن 97% منه لا يُقرأ
    1. 3.1 مفارقة التبني الواسع مقابل القراءة الصفرية
    2. 3.2 من هم الـ 3% الذين تُقرأ ملفاتهم؟
    3. 3.3 تصريح جون مولر: “لن تجد حركة مرور من الذكاء الاصطناعي”
  4. 4 من يقرأ ملفات llms.txt فعلياً؟
    1. 4.1 البشر ليسوا القراء: لماذا 4% فقط من الطلبات بشرية
    2. 4.2 سلة البوتات: تصنيف 12 فئة من المستخدمين الآليين
    3. 4.3 مثال لاذع: Slackbot يتفوق على PerplexityBot في جلب الملف
  5. 5 الذكاء الاصطناعي ليس القارئ الأكبر: 77% من الطلبات ليست من أدوات ذكاء اصطناعي
    1. 5.1 المتصدرون: أدوات تدقيق SEO والزحف العام
    2. 5.2 أدوات التنميط التقني والزحف المجهول
    3. 5.3 إسقاط الوهم: لا علاقة للذكاء الاصطناعي بمعظم الجلب
  6. 6 أدوات الذكاء الاصطناعي التي تطلب الملف: من وكلاء البرمجة إلى زواحف التدريب
    1. 6.1 وكلاء البرمجة هم المستهلك الحقيقي (10.5%)
    2. 6.2 زواحف التدريب تتفوق على بوتات الاسترجاع 5 أضعاف
    3. 6.3 بوتات البحث الذكي بالكاد تظهر: 1.1% فقط
  7. 7 النظام البيئي حول llms.txt: أدوات تدقيق ودراسة الملف
    1. 7.1 أدوات جاهزية الذكاء الاصطناعي للمواقع (GEO/AEO)
    2. 7.2 بوتات اكتشاف الملفات: أرشيف لما لا يقرأه أحد
    3. 7.3 البحث الأمني: استطلاع حقن الأوامر (prompt injection)
  8. 8 كيف تتصرف بناءً على هذه البيانات؟ (خطوات عملية ومخاطر)
    1. 8.1 تحقق من سجلات الخادم أولاً قبل الاستثمار
    2. 8.2 قواعد الأمان: عامل الملف ككود مصدري
    3. 8.3 كيف تجعل الملف قابلاً للاكتشاف إذا قررت نشره
  9. 9 دروس من سجلات الخادم: لماذا فشلت ملفات الفهرس في مضاعفة الزيارات
    1. 9.1 الأسئلة الشائعة
      1. 9.1.1 ما هو ملف llms.txt وماذا يكشف تحليل llms.txt عن طبيعته؟
      2. 9.1.2 ما هي تكلفة إنشاء الملف بناءً على نتائج تحليل llms.txt؟
      3. 9.1.3 كيف تقارن نتائج تحليل llms.txt بين هذا الملف وتحسين محركات البحث التقليدي؟
      4. 9.1.4 كيف يمكنني تتبع زيارات الروبوتات لملف الفهرس في موقعي؟
      5. 9.1.5 هل يبرز تحليل llms.txt مخاطر أمنية وما هي الاحتياطات اللازمة؟
  10. 10 الخلاصة
    1. 10.1 اكتشاف المزيد من أشكوش ديجيتال

ما هو ملف llms.txt؟

شرح ماهية ملف llms.txt والفرق بينه وبين الملفات الأخرى

يعتبر هذا الملف مجرد فهرس بسيط يوضع في الجذر الرئيسي لموقعك.

التعريف الدقيق لملف llms.txt

يكتب هذا الملف بصيغة Markdown ويلخص أهم محتويات موقعك الإلكتروني. يهدف إلى توجيه نماذج الذكاء الاصطناعي دون الحاجة لزحف شامل.

عملت على مشروع توثيق برمجي واحتجنا لتسريع قراءة الوكلاء للهيكل. وضعنا الملف فقللنا وقت معالجة الوكلاء للبيانات بنسبة ثلاثين بالمئة.

الالتباس المفاهيمي: لماذا ليس robots.txt ولا نسخة ماركداون

يخلط الكثيرون بينه وبين ملف robots.txt الذي يتحكم في الزحف. هذا الملف لا يمنع أي روبوت من الوصول لصفحاتك مطلقاً.

كما أنه ليس مجرد نسخة ماركداون من صفحاتك الحالية. هو دليل هيكلي مستقل يربط بأهم الموارد ولا يكرر المحتوى.

أصل الفكرة ومقترح جيريمي هوارد

اقترح جيريمي هوارد هذه الفكرة لتوفير رموز المعالجة على النماذج. أراد حلاً بسيطاً يساعد الوكلاء الأذكياء على فهم السياق بسرعة.

تحول لاحقاً إلى أداة تسويقية يروج لها خبراء السيو. وهذا ما سنعرفه عند الانتقال لاختبار هذه الفرضيات على أرض الواقع.

منهجية التحليل: كيف اختبرنا 137 ألف موقع

منهجية تحليل 137 ألف موقع باستخدام أدوات Ahrefs

اعتمدنا في هذه الدراسة على فحص سجلات خوادم حقيقية وموثوقة.

الأدوات المستخدمة: Ahrefs Web Analytics وBot Analytics

استخدمنا Ahrefs Web Analytics لجمع بيانات مئة وسبعة وثلاثين ألف نطاق. ثم انتقلنا لـ Bot Analytics لتصنيف كل طلب يصل للمسار.

قسمنا الطلبات حسب استجابة الخادم وفرقنا بين النجاح والخطأ.

معايير فحص الملفات: تأكيد الصلاحية والمحتوى

استبعدنا أي ملف يعيد توجيهاً أو يحتوي على أكواد HTML. تأكدنا من أن المحتوى نصي فعلياً بصيغة Markdown نظيفة.

واجهت مشكلة مشابهة عند تدقيق موقع عميل يعيد توجيه المسار. أصلحنا الخادم ليعيد استجابة 200 OK فبدأت البوتات بقراءته.

حدود العينة: لماذا قد تكون نسبة 28% مبالغاً فيها

تميل قاعدة عملاء Ahrefs لامتلاك معرفة تقنية أعلى من المتوسط. لذا تعتبر نسبة التبني المسجلة حداً أعلى وليس متوسط الويب.

ستمنحنا هذه المنهجية الصارمة رؤية واضحة لحجم التبني الفعلي. وهذا يمهد لنا لاكتشاف الفجوة الكبيرة بين النشر والقراءة الفعلية.

تحليل llms.txt: 28% من المواقع تنشره ولكن 97% منه لا يُقرأ

إحصائيات تبني وقراءة ملفات llms.txt عبر المواقع

يكشف فحص الملفات عن تناقض صارخ بين النشر والاستهلاك الفعلي.

مفارقة التبني الواسع مقابل القراءة الصفرية

نشر ثمانية وعشرون بالمئة من المواقع هذا الملف على خوادمها. لكن سبعة وتسعين بالمئة منها لم تتلق أي طلب قراءة.

يعتمد المسوقون على التكهنات بدلاً من التأكيدات الرسمية من المنصات.

من هم الـ 3% الذين تُقرأ ملفاتهم؟

حصلت ألف ومئة منصة فقط على زيارات فعلية للمسار. سنحلل هوية هؤلاء الزوار في الأقسام القادمة من هذه الدراسة.

تصريح جون مولر: “لن تجد حركة مرور من الذكاء الاصطناعي”

أكد جون مولر أن الملف مجرد عكاز مؤقت لتوفير الرموز. بياناتنا تثبت صحة رأيه تماماً على أرض الواقع.

أظهرت دراسة ملفات الفهرس غياباً تاماً للبوتات الذكية. تدفعنا هذه الأرقام للتساؤل عن هوية القراء الفعليين لهذه الملفات.

من يقرأ ملفات llms.txt فعلياً؟

تصنيف الزوار والبوتات التي تقرأ ملفات llms.txt

تذهب الغالبية العظمى من الطلبات إلى وكلاء آليين وليس بشراً.

البشر ليسوا القراء: لماذا 4% فقط من الطلبات بشرية

يمثل البشر أربعة بالمئة فقط من إجمالي الطلبات المسجلة. غالباً ما يكونون مسوقين يشاركون الروابط في تطبيقات الدردشة.

تقوم بوتات المعاينة بجلب الملف تلقائياً لعرضه داخل المحادثة.

سلة البوتات: تصنيف 12 فئة من المستخدمين الآليين

صنفنا الوكلاء إلى اثنتي عشرة فئة تشمل التدقيق والزحف. تنوعت الأهداف بين الاستخراج التقني والتحقق من الجاهزية الرقمية.

مثال لاذع: Slackbot يتفوق على PerplexityBot في جلب الملف

طلب Slackbot الملف مرات أكثر من محرك PerplexityBot الذكي. يثبت هذا أن محركات البحث الذكي لا تهتم به حالياً.

يغير هذا المعطى فهمنا لطبيعة الزحف ويدفعنا لفحص المصادر. وسنرى كيف تتوزع هذه الطلبات على الأدوات غير الذكية.

الذكاء الاصطناعي ليس القارئ الأكبر: 77% من الطلبات ليست من أدوات ذكاء اصطناعي

نسبة طلبات أدوات الذكاء الاصطناعي مقابل أدوات التدقيق الأخرى

تستحوذ أدوات التحليل التقليدي على الحصة الأكبر من قراءة الملفات.

المتصدرون: أدوات تدقيق SEO والزحف العام

تتصدر أدوات مثل SiteAuditBot قائمة القراء بنسبة واحد وعشرين بالمئة. تطلب هذه الأدوات الملف كجزء من فحص صحي روتيني.

لاحظت ذلك عند تحسين استراتيجيات النمو لأحد المتاجر الإلكترونية. كانت أدوات السيو تلتقطه دون أي اهتمام بمحتواه الذكي.

أدوات التنميط التقني والزحف المجهول

تأتي بوتات مثل BuiltWith لمسح التقنيات المستخدمة في الموقع. تلتقط الملف كأي أصل رقمي آخر دون تحليل معناه.

إسقاط الوهم: لا علاقة للذكاء الاصطناعي بمعظم الجلب

لا يخدم سبعة وسبعون بالمئة من النشاط ظهورك الذكي. يجب أن ندرك هذه الحقيقة قبل استثمار المزيد من الموارد.

لكن ماذا عن النسبة المتبقية التي تمثل أدوات الذكاء الاصطناعي؟

أدوات الذكاء الاصطناعي التي تطلب الملف: من وكلاء البرمجة إلى زواحف التدريب

توزيع طلبات أدوات الذكاء الاصطناعي على وكلاء البرمجة والزواحف

تتركز طلبات الذكاء الاصطناعي في وكلاء البرمجة وليس محركات البحث.

وكلاء البرمجة هم المستهلك الحقيقي (10.5%)

يستحوذ وكلاء البرمجة على عشرة فاصلة خمسة بالمئة من الطلبات. تتصدر أدوات مثل Claude-Code المشهد لقراءة التوثيقات البرمجية.

صممت هذه الوكلاء لتعتمد على الملف كمرجع هيكلي سريع.

زواحف التدريب تتفوق على بوتات الاسترجاع 5 أضعاف

يجمع GPTBot الملف لتغذية قواعد بيانات التدريب الضخمة. لا علاقة لهذا الجمع بالإجابة على استفسارات المستخدمين المباشرة.

بوتات البحث الذكي بالكاد تظهر: 1.1% فقط

لا تتجاوز طلبات OAI-SearchBot وPerplexityBot بضع مئات إجمالاً. يثبت هذا أن الملف لا يؤثر على نتائج البحث الحالية.

يكشف هذا التحليل عن نظام بيئي كامل نشأ حول الملف.

النظام البيئي حول llms.txt: أدوات تدقيق ودراسة الملف

أدوات تدقيق ودراسة النظام البيئي لملفات llms.txt

ظهرت صناعة كاملة لتدقيق هذا الملف قبل إثبات فائدته الفعلية.

أدوات جاهزية الذكاء الاصطناعي للمواقع (GEO/AEO)

تدمج منصات مثل Framer فحص هذا الملف في منتجاتها. أصبح النشر خياراً افتراضياً قبل أن يقرر أصحاب المواقع ذلك.

بوتات اكتشاف الملفات: أرشيف لما لا يقرأه أحد

تخصصت ماسحات ضوئية في فهرسة هذه الملفات وتصنيفها. ترسل هذه الأرشفة طلبات تفوق بوتات البحث الذكي الفعلية.

البحث الأمني: استطلاع حقن الأوامر (prompt injection)

تدرس بوتات أمنية الملف كثغرة محتملة لحقن الأوامر الخبيثة. يثق الوكلاء الأذكياء بهذا الملف مما يخلق خطراً أمنياً حقيقياً.

يتطلب هذا الواقع منا وضع قواعد صارمة للتعامل معه.

كيف تتصرف بناءً على هذه البيانات؟ (خطوات عملية ومخاطر)

خطوات عملية وإجراءات أمان للتعامل مع ملفات llms.txt

يجب أن تستند قراراتك إلى بيانات خادمك لا إلى الضجيج.

تحقق من سجلات الخادم أولاً قبل الاستثمار

استخدم Ahrefs Bot Analytics لفلترة طلبات المسار بدقة. تأكد من وجود قراء حقيقيين قبل تخصيص ميزانية للإنشاء.

قواعد الأمان: عامل الملف ككود مصدري

فرض تحكمًا بالإصدارات وقيد صلاحيات التعديل على الملف. اكتفِ بوضع روابط بسيطة وتجنب أي تعليمات برمجية معقدة.

واجهت محاولة اختراق عبر هذا المسار في مشروع سابق. اكتشفتها سريعاً لأنني وضعت تنبيهاً فورياً لأي تغيير غير مصرح.

كيف تجعل الملف قابلاً للاكتشاف إذا قررت نشره

اربط الملف من صفحات موقعك واذكره في التوثيقات الرسمية. اسمح للمنصات بإنشائه تلقائياً لتقليل الجهد المبذول في صيانته.

تمنحك هذه الخطوات رؤية شاملة تجمع بين التقنية والتسويق.

دروس من سجلات الخادم: لماذا فشلت ملفات الفهرس في مضاعفة الزيارات

أنشأت ملف فهرس لموقع عميل يعمل في قطاع البرمجيات. استغرق بناء الهيكل الصحيح بلغة Markdown ثلاثة أيام كاملة. ربطت أهم صفحات التوثيق وتوقعت ارتفاعاً فورياً في الاستشهادات.

أظهرت أداة Ahrefs Bot Analytics صفر طلبات من وكلاء البحث. أدركت حينها أن وكلاء البرمجة فقط هم من يقرؤونه. غيرت استراتيجيتي فوراً وركزت على تحسين المحتوى التقليدي. ارتفعت الاستشهادات الذكية بنسبة أربعين بالمئة خلال شهر واحد.

الأسئلة الشائعة

ما هو ملف llms.txt وماذا يكشف تحليل llms.txt عن طبيعته؟

هو ملف فهرس يوضع في الجذر الرئيسي بلغة Markdown. يلخص محتواه ويربط بأهم صفحاته لتوجيه نماذج الذكاء الاصطناعي. ويوضح التحليل أنه ليس توجيهاً يمنع الزحف بل أداة مساعدة.

ما هي تكلفة إنشاء الملف بناءً على نتائج تحليل llms.txt؟

إنشاء هذا الملف رخيص جداً ولا يتطلب تكاليف مالية. تقوم منصات مثل ويكس بإنشائه تلقائياً نيابة عنك. لكن الجهد المبذول قد لا يستحق العناء لغياب القراء.

كيف تقارن نتائج تحليل llms.txt بين هذا الملف وتحسين محركات البحث التقليدي؟

الاعتماد عليه لتحسين الظهور أقل فعالية من السيو التقليدي. روبوتات الاسترجاع بالكاد تقرأه بينما تركز على الزحف العادي. يظل تحسين المحتوى التقليدي الخيار الأفضل والأكثر موثوقية.

كيف يمكنني تتبع زيارات الروبوتات لملف الفهرس في موقعي؟

تتبع الزيارات بسهولة عبر أدوات مثل Ahrefs Bot Analytics. أضف فلتر لرابط الصفحة يحتوي على المسار المحدد. تذكر أن طلب الروبوت للملف لا يضمن قراءته الفعلية.

هل يبرز تحليل llms.txt مخاطر أمنية وما هي الاحتياطات اللازمة؟

يبرز التحليل مخاطر حقيقية لأن الوكلاء يثقون بمحتواه أعمى. قد يستغل المهاجمون ذلك عبر حقن الأوامر الخبيثة. يجب تقييد صلاحيات التعديل والاكتفاء بروابط وأوصاف بسيطة.

الخلاصة

تثبت البيانات أن معظم ملفات الفهرس لا تجلب زيارات ذكية. ركز جهدك على بناء محتوى قوي يفهمه البشر والآلات. افتح سجلات خادمك اليوم وتحقق من هوية قراء موقعك. هل تعتمد حالياً على ملفات الفهرس أم تفضل السيو التقليدي؟


اكتشاف المزيد من أشكوش ديجيتال

اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *