محتوى مكرر
ما هو المحتوى المكرر؟
المحتوى المكرر هو المحتوى الذي يظهر على الإنترنت في أكثر من مكان. يتم تعريف "مكان واحد" هذا على أنه موقع له عنوان موقع فريد ( URL ) - لذلك إذا ظهر نفس المحتوى في أكثر من عنوان ويب ، فهذا يعني أن لديك محتوى مكررًا.
برغم من ليس جيدًا من الناحية الفنية ، يمكن أن يؤثر المحتوى المكرر أحيانًا على تصنيفات محرك البحث. عندما يكون هناك العديد من القطع ، كما تسميها Google ، يمكن أن يؤدي وجود محتوى "مشابه إلى حد كبير" على أكثر من موقع إنترنت واحد إلى صعوبة تحديد محركات البحث أي إصدار أكثر صلة باستعلام بحث معين.
لماذا المحتوى المكرر مهم؟
لمحركات البحث
يمكن أن يمثل المحتوى المكرر ثلاث مشكلات رئيسية لمحركات البحث:
- إنهم لا يعرفون الإصدارات التي يجب تضمينها / استبعادها من فهارسهم.
- إنهم لا يعرفون ما إذا كانوا سيوجهون مقاييس الارتباط (ثقة ، سلطة ، نص المرساة ,ربط الإنصاف ، وما إلى ذلك) في صفحة واحدة أو اجعلها منفصلة بين الإصدارات المتعددة.
- إنهم لا يعرفون أي الإصدارات يتم ترتيبها لنتائج الاستعلام.
لأصحاب المواقع
عند وجود محتوى مكرر ، قد يعاني مالكو مواقع الويب من التصنيفات وفقدان حركة المرور. غالبًا ما تأتي هذه الخسائر من مشكلتين رئيسيتين:
- لتوفير أفضل تجربة بحث ، نادرًا ما تعرض محركات البحث إصدارات متعددة من نفس المحتوى ، وبالتالي فهي مضطرة لاختيار الإصدار الذي من المرجح أن يكون أفضل نتيجة. هذا يضعف الرؤية كل واحد من الزوجي.
- يمكن تخفيف ارتباط الأسهم بشكل أكبر ، حيث يتعين على المواقع الأخرى الاختيار بين التكرارات. بدلاً من جميع الروابط الواردة التي تعرض جزءًا من المحتوى ، فإنها ترتبط بقطع متعددة ، وتنشر قانون الارتباط بين التكرارات. لأن الروابط الواردة هي عامل الترتيب ، يمكن أن يؤثر ذلك على رؤية البحث لجزء من المحتوى.
النتيجة الصافية؟ جزء من المحتوى لا يحقق رؤية البحث ، خلاف ذلك.

كيف تحدث مشكلات المحتوى المكرر؟
في الغالبية العظمى من الحالات ، لا يقوم مالكو مواقع الويب بإنشاء ملفات عمدا محتوى مزدوج. لكن هذا لا يعني أنه ليس هناك. في الواقع ، حسب بعض التقديرات ، تصل إلى 29% من الأنسجة هو في الواقع محتوى مكرر!
دعنا نلقي نظرة على بعض الطرق الأكثر شيوعًا لإنشاء محتوى مكرر عن طريق الخطأ:
1. متغيرات URL
يمكن أن تتسبب معلمات URL ، مثل تتبع النقرات وبعض التعليمات البرمجية التفصيلية ، في حدوث مشكلات مكررة في المحتوى. قد تكون هذه مشكلة ليس فقط بسبب المعلمات نفسها ، ولكن أيضًا بسبب الترتيب الذي يتم به عرض هذه المعلمات في عنوان URL نفسه.
على سبيل المثال:
- Www.widgets.com/blue-widgets؟c… هو نسخة مكررة منه www.widgets.com/blue-widgets؟c… & cat = 3 "class =" redactor-autoparser-object "> www.widgets. com / blue-widgets نسخة منه www.widgets.com/blue-widgets ؟ قطة = 3 ولون = أزرق
وبالمثل ، فإن معرّفات الجلسات هي منشئ محتوى مزدوج شائع. يحدث هذا عندما يكون لكل مستخدم يزور موقعًا معرف تسجيل دخول مختلفًا مخزنًا في عنوان URL.

يمكن أن تتسبب إصدارات المحتوى القابلة للطباعة أيضًا في حدوث مشكلات مكررة في المحتوى عند فهرسة إصدارات متعددة من الصفحات.

الدرس المستفاد هنا هو أنه ، عندما يكون ذلك ممكنًا ، يكون من المفيد غالبًا تجنب إضافة عناوين URL أو إصدارات بديلة من عناوين URL (يمكن أن تمر المعلومات التي تحتوي عليها عادةً من خلال البرامج النصية).
2. HTTP مقابل HTTPS أو WWW مقابل الصفحات التي لا تتبع WWW
إذا كان موقعك يحتوي على إصدارات منفصلة على "www.site.com" و "site.com" (مع أو بدون البادئة "www") وكان المحتوى نفسه موجودًا في كلا الإصدارين ، فقد قمت بإنشاء نسخ مكررة لكل من هذه الصفحات بشكل فعال. الأمر نفسه ينطبق على المواقع التي تحتفظ بإصداري http: // و https: //. إذا كان كلا الإصدارين من الصفحة مباشرًا ومرئيًا لمحركات البحث ، فقد تواجه مشكلة محتوى مكرر.
3. المحتوى الذي تم نسخه أو نسخه
لا يشمل المحتوى منشورات المدونة أو المحتوى التحريري فحسب ، بل يشمل أيضًا صفحات معلومات المنتج. قد يكون المشطون الذين يعيدون نشر محتوى مدونتك على مواقعهم الخاصة مصدرًا مألوفًا أكثر للمحتوى المزدوج ، ولكن هناك مشكلة شائعة في مواقع التجارة الإلكترونية: معلومات المنتج. إذا كانت العديد من المواقع المختلفة تبيع نفس العناصر وكلها تستخدم أوصاف الشركة المصنعة لهذه العناصر ، فإن المحتوى نفسه ينتج عنه مواقع متعددة على الويب.
كيفية حل مشاكل المحتوى المزدوج
يعتمد حل مشكلات المحتوى المزدوج على نفس الفكرة المركزية: تحديد أي نسخة مكررة هي الفكرة "الصحيحة".
متى يمكن العثور على محتوى على موقع على عناوين URL متعددة ، يجب أن يكون كذلك تم تطبيعه لمحركات البحث. لنلقِ نظرة على ثلاث طرق رئيسية للقيام بذلك: استخدام إعادة التوجيه 301 إلى عنوان URL الصحيح ، أو السمة rel = canonical ، أو استخدام أداة تهيئة Google Search Console.
إعادة توجيه 301
في كثير من الحالات ، تكون أفضل طريقة لمكافحة المحتوى المكرر هي إنشاء واحد إعادة توجيه 301 من الصفحة "المكررة" إلى الصفحة الرئيسية للمحتوى.
عندما يتم دمج عدة تصنيفات في صفحة واحدة ، فإنها لا تتوقف عن التنافس مع بعضها البعض. كما أنها تخلق إشارة أقوى على الملاءمة والشعبية بشكل عام. سيؤثر هذا بشكل إيجابي على قدرة الصفحة "الصحيحة" على الحصول على نتيجة جيدة.

Rel = "عادي"
هناك خيار آخر للتعامل مع المحتوى المكرر وهو استخدام الميزة rel = canonical . يخبر هذا محركات البحث أنه يجب التعامل مع صفحة معينة كنسخة من عنوان URL محدد ، ويجب أن تُنسب جميع الروابط ومقاييس المحتوى و "قوة التصنيف" التي تطبقها محركات البحث إلى تلك الصفحة إلى عنوان URL المحدد.

السمة rel = "canonical" هي جزء من رأس HTML لصفحة الويب وتبدو كما يلي:
الشكل العام:
... [رمز آخر قد يكون في رأس HTML للمستند الخاص بك] ... ... [رمز آخر قد يكون موجودًا في رأس HTML للمستندات الخاصة بك] ...
يجب إضافة السمة rel = canonical إلى رأس HTML لكل نسخة مكررة من الصفحة ، مع استبدال قسم "عنوان URL للصفحة الرئيسية" برابط إلى الصفحة الرئيسية (العادية). (تأكد من الاحتفاظ بعلامات اقتباس.) تنفق السمة نفس المقدار تقريبًا من الروابط (قوة الترتيب) مثل إعادة التوجيه 301 ، ولأنها تنطبق على مستوى الصفحة (بدلاً من الخادم) ، فإنها غالبًا ما تستغرق وقت نشر أقل للتنفيذ.
فيما يلي مثال على ميزة عادية في الممارسة:

استخدامه موزبار لتحديد السمات العادية.
هنا ، يمكننا أن نرى أن BuzzFeed تستخدم السمات rel = canonical لتخصيص استخدام معلمات URL (في هذه الحالة ، تتبع النقرات). على الرغم من إمكانية الوصول إلى هذه الصفحة من خلال عنواني URL ، فإن السمة rel = canonical تضمن تعيين جميع المقاييس الخاصة بالروابط والمحتوى نفسه إلى الصفحة الرئيسية (/ no-one-do-this-now).
Meta Robots Noindex
إحدى العلامات الوصفية التي يمكن أن تكون مفيدة بشكل خاص للتعامل مع المحتوى المكرر هي ميتا روبوت ، عند استخدامها مع القيم "noindex ، اتبع". عادة ما يطلق عليه Meta Noindex ، اتبع والمعروفة تقنيًا باسم content = "noindex ، تابع" يمكن إضافة علامة meta-robot هذه إلى رأس HTML لكل صفحة فردية يجب استبعادها من فهرس محرك البحث.
الشكل العام:
... [رمز آخر قد يكون في رأس HTML للمستند الخاص بك] ... ... [رمز آخر قد يكون في رأس HTML للمستند الخاص بك] ...
تسمح علامة meta-robot لمحركات البحث بالزحف إلى الروابط الموجودة على الصفحة ، ولكنها تمنعها من تضمين تلك الروابط في فهارسها. من المهم أن تكون قادرًا على الزحف إلى الصفحة المكررة ، حتى إذا طلبت من Google عدم فهرستها ، لأن Google تحذرك صراحةً من تقييد وصول الزحف إلى المحتوى المكرر على موقعك. (ترغب محركات البحث في رؤية كل شيء في حالة ارتكابك لخطأ في التعليمات البرمجية الخاصة بك. فهي تتيح لها إجراء "مكالمة أزمة" [مؤتمتة محتملة] في مواقف غامضة بخلاف ذلك.)
يعد استخدام meta-robots حلاً جيدًا بشكل خاص لمشكلات المحتوى المكررة المتعلقة بـ ترقيم الصفحات .
النطاق المفضل ومعالجة المعلمات في Google Search Console
يتيح لك Google Search Console تحديده القطاع المفضل من موقعك (على سبيل المثال http://yoursite.com بدلاً من http://www.yoursite.com) وحدد ما إذا كان يجب على Googlebot القيام بذلك اكتشاف معلمات URL المختلفة مختلفة (معالجة المعلمات).

اعتمادًا على بنية عنوان URL وسبب مشكلات المحتوى المزدوج ، قد يوفر تعيين المجال المفضل لديك أو معالجة المعلمة (أو كليهما!) حلاً.
العيب الرئيسي لاستخدام المعلمات كطريقة أساسية للتعامل مع المحتوى المكرر هو أن التغييرات التي تجريها تعمل فقط مع Google. لن تؤثر أي قواعد يتم تطبيقها باستخدام Google Search Console على طريقة تفسير Bing أو برامج الزحف الأخرى لمحركات البحث لموقعك. ستحتاج إلى استخدام أدوات مشرفي المواقع لمحركات البحث الأخرى بالإضافة إلى تخصيص الإعدادات في Search Console.
طرق إضافية للتعامل مع المحتوى المكرر
- حافظ على التناسق عند الارتباط داخليًا بالموقع. على سبيل المثال ، إذا وجد مشرف الموقع أن الإصدار العادي للنطاق هو www.example.com/ ، فيجب أن تنتقل جميع الروابط الداخلية إلى العنوان http: // www. example.co ... بدلا من http: // example.com/pa… (لاحظ عدم وجود شبكة الاتصالات العالمية).
- عند توزيع المحتوى ، تأكد من أن موقع الاتحاد يضيف رابطًا إلى المحتوى الأصلي ، وليس متغيرًا لعنوان URL. (شاهد حلقة Fridayboard من Whiteboard على ذلك من خلال التعامل مع المحتوى المكرر للمزيد من المعلومات.)
- لإضافة حماية إضافية ضد سرقة المحتوى التي تسرق ائتمان تحسين محركات البحث (SEO) للمحتوى الخاص بك ، من المستحسن إضافة ارتباط rel = canonical ذاتي الإشارة إلى صفحاتك الحالية. هذه ميزة عادية تعرض عنوان URL الموجود بالفعل ، وذلك لمنع بعض محاولات الكاشطة.
ارتباط rel = normal مُشار إليه ذاتيًا: عنوان URL المحدد في العلامة rel = normal هو نفسه عنوان URL للصفحة الحالية.
على الرغم من أنه لن يتم نقل جميع أدوات الكشط عبر كود HTML الكامل لموادهم المصدر ، إلا أن البعض سيفعل ذلك. بالنسبة لأولئك الذين يفعلون ذلك ، ستضمن العلامة ذات المرجعية rel = العادية أن إصدار موقعك سيُضاف إلى المحتوى "الأصلي".