الرئيسية / دليل شامل لملف Sitemap.xml وتحليل أخطائه باستخدام Labrika

دليل شامل لملف Sitemap.xml وتحليل أخطائه باستخدام Labrika

ملف Sitemap.xml هو في الأساس خريطة لموقعك الإلكتروني مصممة خصيصًا لسهولة التنقل وفهرسة موقعك بواسطة محركات البحث. وهو موجود داخل مجلد public_html (أو جذر الموقع) ويتضمن تعليمات مهمة لزاحفي محركات البحث تحدد الصفحات التي يجب زيارتها، بالترتيب، وكم مرة يجب زيارتها.

هذا يسرع بشكل كبير عملية فهرسة الصفحات المهمة ويسمح لزاحفي البحث بتخصيص وقت الزحف للصفحات ذات الأهمية العالية لك وللمستخدمين.

إنشاء sitemap.xml ليس دائمًا مطلوبًا ولكنه دائمًا موصى به، خاصة للمواقع الكبيرة ذات آلاف الصفحات. مع المواقع الأكبر، يأتي الحاجة إلى التأكد حقًا من أن زاحفي محركات البحث يقضون وقتهم على تلك الصفحات ذات القيمة العالية ذات المحتوى العميق والنية التجارية، وليس الصفحات الجانبية التي تقدم قيمة ضعيفة.

كقاعدة عامة، عندما تقوم البرمجيات وأنظمة إدارة المحتوى بإنشاء ملف sitemap.xml تلقائيًا، فإنها تتضمن جميع الصفحات المتاحة للفهرسة. مالك موقع إلكتروني نموذجي غير محتمل أن يكون على دراية بذلك، وقد يكون قد حدد noindex لصفحات معينة، لكن خرائط الموقع المولدة تلقائيًا تشمل هذه الصفحات وتضيع ميزانية الزحف القيمة!

يُنصح بشدة باستخدام الإضافات أو البرمجيات المخصصة أو مولدات خرائط الموقع لتكوين عناوين URL محددة لتظهر في خريطة موقعك، عناوين URL معينة لتجنبها، الترتيب الذي يجب زحف عناوين URL به، وكم مرة يجب زحفها.

أخطاء Sitemap التي وجدها Labrika

انتباه! تقرير أخطاء Sitemap سيكون متاحًا فقط إذا تم تكوين الأذونات الكافية لفحص الموقع بأكمله بشكل صحيح. وإلا، سيتمكن Labrika من عرض الصفحات المدرجة خصيصًا في sitemap.xml فقط بدلاً من عرض جميع الصفحات على الموقع، ثم مقارنتها عبر الصفحات المدرجة في Sitemap.

يساعد تحليل Sitemap في Labrika في العثور على الأنواع التالية من الأخطاء:

  • الصفحات التي موجودة في Sitemap ولكنها غير قابلة للوصول للفهرسة.

  • الصفحات التي موجودة في Sitemap لكنها تحتوي على علامة noindex.

  • الصفحات التي لا موجودة في Sitemap ولكنها قابلة للفهرسة.

يرجى ملاحظة: محركات البحث المختلفة تعالج قواعد Sitemap بطرق مختلفة. غوغل، في أغلب الأحيان، سيقوم بفهرسة الصفحات التي يمكن الوصول إليها فقط من خلال الزحف التلقائي دون sitemap. أي، الصفحات التي يمكن الوصول إليها عبر روابط داخلية ضمن وقت الزحف المخصص وعمق الزحف لموقعك في ذلك اليوم. لن ينظر إلى ملف sitemap.xml لتحديد الروابط التي يجب زحفها، بل يستخدم Sitemap كدليل لكم مرة يجب زحف الصفحات المدرجة في Sitemap.