تحليل أخطاء Sitemap.xml وإصلاحها بواسطة Labrika
ملف Sitemap.xml هو في الأساس خريطة لموقعك الإلكتروني مصممة خصيصًا للتنقل السهل وفهرسة موقعك من قبل محركات البحث. وهو موجود داخل مجلد public_html (أو جذر الموقع) ويشمل تعليمات مهمة لزواحف محركات البحث تحدد الصفحات التي يجب زيارتها، وبالترتيب، وكم مرة يجب زيارتها.
هذا يسرع بشكل كبير عملية فهرسة الصفحات المهمة ويسمح لزواحف البحث بتخصيص وقت الزحف للصفحات ذات الأهمية العالية بالنسبة لك وللمستخدمين.
إنشاء sitemap.xml ليس دائمًا ضروريًا ولكنه دائمًا موصى به، خاصة للمواقع الكبيرة التي تحتوي على آلاف الصفحات. مع المواقع الأكبر، يأتي الحاجة إلى التأكد حقًا من أن زواحف محركات البحث تقضي وقتها على تلك الصفحات ذات القيمة العالية مع المحتوى العميق والنية التجارية، وليس الصفحات الجانبية التي تقدم قيمة ضعيفة.
كقاعدة عامة، عندما تقوم البرمجيات وأنظمة إدارة المحتوى (CMS) بإنشاء ملف sitemap.xml تلقائيًا، فإنها تشمل جميع الصفحات المتاحة للفهرسة. مالك موقع إلكتروني نموذجي غير محتمل أن يكون على دراية بهذا، وقد قام بتعيين noindex لصفحات معينة، لكن خرائط المواقع المولدة تلقائيًا تشمل هذه الصفحات وتضيع ميزانية الزحف القيمة!
يُنصح بشدة باستخدام الإضافات، البرمجيات المخصصة، أو مولدات خرائط المواقع لتكوين عناوين URL محددة لتظهر في خريطة الموقع، عناوين URL معينة لتجنبها، الترتيب الذي يجب زحف عناوين URL به، وكم مرة يجب زحفها.
أخطاء Sitemap التي وجدتها Labrika
تنبيه! تقرير أخطاء Sitemap سيكون متاحًا فقط إذا تم تكوين الأذونات الكافية لمسح الموقع بأكمله بشكل صحيح. وإلا، ستتمكن Labrika من عرض الصفحات المدرجة خصيصًا في sitemap.xml فقط بدلاً من عرض جميع الصفحات على الموقع، ثم مقارنتها مع الصفحات المدرجة في Sitemap.
يساعد تحليل Sitemap في Labrika في العثور على الأنواع التالية من الأخطاء:
-
الصفحات التي موجودة في Sitemap ولكنها غير قابلة للفهرسة.
-
الصفحات التي موجودة في Sitemap لكنها تحتوي على علامة noindex.
-
الصفحات التي لا توجد في Sitemap ولكنها قابلة للفهرسة.
يرجى ملاحظة: محركات البحث المختلفة تعالج قواعد Sitemap بطرق مختلفة. Google، في أغلب الأحيان، سيقوم بفهرسة الصفحات التي يمكن الوصول إليها فقط من خلال الزحف التلقائي دون Sitemap. أي، الصفحات التي يمكن الوصول إليها عبر روابط داخلية ضمن وقت الزحف المخصص وعمق الزحف لموقعك في ذلك اليوم. لن ينظر إلى ملف sitemap.xml لتحديد الروابط التي يجب زحفها، بل يستخدم Sitemap كدليل لكم مرة يجب زحف الصفحات المدرجة في Sitemap.
الصفحة موجودة في Sitemap، لكنها غير قابلة للفهرسة
يبرز هذا التقرير معظم الصفحات المعزولة، والتي هي في الأساس صفحات موجودة على موقعك لكن لا توجد روابط واردة تشير إليها وهي "غير مملوكة".
في حالة أن مثل هذه الصفحات يتم فهرستها بطريقة ما من قبل محركات البحث، فمن المحتمل أن تكون لديها PageRank صفر وستصنف بشكل سيء. إنه موثق جيدًا عبر الإنترنت أن Google ومحركات البحث الكبيرة الأخرى تستخدم درجات PageRank (وأشكالها المختلفة) لتحديد قوة SEO وقيمة الصفحات. كان ذلك منذ بضع سنوات فقط عندما سمحت Google باستخدام شريط أدوات يظهر PageRank لصفحاتك، لكن للأسف، تم إزالته من المجال العام. طبيعيًا، تريد PageRank جيدًا لصفحاتك المختلفة، لذا إذا انتهى أحد صفحات الهبوط الخاصة بك في هذه الفئة الخطأ (أي أن صفحتك ليست مجرد صفحة معزولة) فستريد الوصول إلى مصدر المشكلة فورًا.
الأسباب الشائعة لكون صفحتك موجودة في Sitemap، لكنها غير قابلة للفهرسة:
-
رابط من صفحة/صفحات تحمل علامة noindex يؤدي إلى هذه الصفحة، أو الصفحات المؤدية إلى هذه الصفحة غير مستجيبة. نتيجة لذلك، لا يمكن لزاحف محرك البحث التقدم أو التراجع، وبالتالي ينهي الجلسة.
-
الروابط إلى الصفحات المطلوبة محظورة. على سبيل المثال، من خلال السمة rel="nofollow". أي، يرى الزاحف الرابط إلى الصفحة، لكنه لا يمكنه التنقل إليه لأنه محظور.
-
لا توجد روابط إلى هذه الصفحة وهي فعلاً "معزولة".
-
تم حذف الصفحة في محرر الموقع/CMS لكن ملف HTML لا يزال حيًا على الموقع.
-
الصفحة موجودة في Sitemap لكنها غير قابلة للزحف، لذا لا يمكن فهرستها.
هذا النوع من الخطأ أفضل تصحيحه من خلال القيام بما يلي؛
تحقق من الصفحات التي تحتوي على علامات noindex وnofollow وصححها و/أو تأكد من إضافة الصفحة بشكل صحيح إلى القائمة الرئيسية لتمكين الزحف الصحيح. أيضًا، أكثر من مرة، نرى هذا النوع من الخطأ مع المواقع التجارية والمعلوماتية التي تحظر الترقيم.
كيفية إصلاح المشكلة؟
عندما تكون الصفحة متاحة في Sitemap لكن لا توجد روابط داخلية من أي صفحة أخرى على الموقع، فإنها تعرف بصفحة معزولة.
الصفحات المعزولة سيئة لـ SEO لأنها لا تحمل وزن رابط وبالتالي تعتبر غير مهمة من قبل محركات البحث. كما تم استخدامها سابقًا في SEO الأسود.
بمجرد تحديدها في لوحة التحكم الخاصة بنا يمكنك:
- إعادة دمج الصفحة في مخطط الربط الخاص بموقعك إذا كانت الصفحة مفيدة، تصنف للكلمات الرئيسية، أو لديها روابط خلفية من مواقع خارجية.
- دمج الصفحة مع أخرى إذا كانت لديها صفحة قريبة مكررة مرتبطة بالفعل على الموقع.
- إزالة الصفحة تمامًا إذا لم تكن لها فائدة. أو إرجاع رمز 404، أو 410 (محتوى منتهي الصلاحية).
- بالنسبة لصفحات المنتجات حيث قد يكون العنصر قد انتهى، يمكنك ربط منتجات جديدة في نفس الفئة، مما يجعل الصفحة مصدر قيادة جديد. (هذا ما تفعله eBay مع قوائم المزادات المنتهية). مساعدة في توليد المزيد من الحركة.
الصفحة موجودة في Sitemap لكن تحتوي على علامة noindex
هذه صفحات تم حظر فهرستها باستخدام علامة noindex لكنها لا تزال موجودة في مكان ما في Sitemap.
يضع الناس علامة noindex على الصفحات لأسباب متنوعة لكن وجود صفحات noindex مدرجة في Sitemap يمكن أن يؤدي إلى تسرب بيانات سرية لكن الأرجح، يؤدي إلى إهدار الزواحف وقتها وميزانية الزحف.
لإصلاح هذه المشكلة تحتاج فقط إلى إزالة صفحة/الصفحات noindex من Sitemap لتجنب أي محركات بحث فهرسة صفحة عن غير قصد يجب ألا تفعل ذلك (على الرغم من أنهم يتبعون عادةً علامة noindex).
كيفية إصلاح المشكلة؟
يحدث هذا عادةً عندما تم حظر صفحة من الفهرسة من خلال سمة rel="nofollow".
تضمين هذه الصفحات في Sitemap غير مفيد حيث يستخدم ميزانية الزحف وقد يؤدي إلى تسرب معلومات سرية. لإصلاح هذا يمكنك ببساطة إزالة الصفحة من Sitemap الخاص بك.
تحميل ملف Sitemap.xml الخالي من الأخطاء بواسطة Labrika
لكل من تقارير أخطاء Sitemap المختلفة المدرجة أعلاه، تقدم Labrika لك القدرة على تحميل نسخة خالية من الأخطاء ومصححة من ملف sitemap.xml الخاص بك. هذا يجب أن يوفر عليك وقت تصحيح ملف sitemap.xml الخاص بك يدويًا، وأهم من ذلك، جعل استخدام أفضل لميزانيات زحف محرك البحث الخاصة بك.