תוכן משוכפל
מהו תוכן כפול?
תוכן כפול הוא תוכן המופיע באינטרנט ביותר ממקום אחד. "מקום אחד" זה מוגדר כאתר עם כתובת אתר ייחודית ( כתובת אתר ) - כך שאם אותו תוכן מופיע ביותר מכתובת אינטרנט אחת, יש לך תוכן משוכפל.
למרות ש לא בסדר טכנית , תוכן כפול יכול לפעמים להשפיע על דירוג מנוע החיפוש. כשיש הרבה חלקים, כפי שגוגל קוראת לזה , תוכן "דומה באופן מהותי" ביותר מאתר אינטרנט אחד יכול להקשות על מנועי החיפוש להחליט איזו גרסה הכי רלוונטית לשאילתת חיפוש נתונה.
למה תוכן כפול חשוב?
עבור מנועי חיפוש
תוכן כפול יכול להציג שלוש בעיות מפתח עבור מנועי החיפוש:
- הם לא יודעים אילו גרסאות יש לכלול/להוציא מהאינדקסים שלהם.
- הם לא יודעים אם הם ינהלו את מדדי הקישור (אמון, סמכות, טקסט עוגן ,הון קישור , וכו') בעמוד אחד או לשמור אותו נפרד בין גרסאות מרובות.
- הם לא יודעים אילו גרסאות לדרג עבור תוצאות שאילתה.
לבעלי אתרים
כאשר יש תוכן כפול, בעלי אתרים עלולים לסבול מדירוג ואובדן תנועה. הפסדים אלו נובעים לרוב משתי בעיות עיקריות:
- כדי לספק את חווית החיפוש הטובה ביותר, מנועי החיפוש רק לעתים נדירות יציגו גרסאות מרובות של אותו תוכן, ולכן הם נאלצים לבחור איזו גרסה צפויה להיות התוצאה הטובה ביותר. זה מדלל את הנראות כל אחד מהכפילים.
- ניתן לדלל עוד יותר את Equity Link, מכיוון שאתרים אחרים צריכים לבחור בין כפילויות. במקום שכל הקישורים הנכנסים יראו פיסת תוכן, הם מקשרים לחלקים מרובים, ומפיצים את חוק הקישור בין הכפילים. כי קישורים נכנסים הם גורם דירוג , לאחר מכן זה יכול להשפיע על נראות החיפוש של פיסת תוכן.
התוצאה נטו? פיסת תוכן אינה משיגה נראות בחיפוש, אחרת.

כיצד מתרחשות בעיות תוכן כפול?
ברוב המוחלט של המקרים, בעלי אתרים לא יוצרים בְּמֵזִיד תוכן כפול. אבל זה לא אומר שזה לא קיים בחוץ. למעשה, לפי כמה הערכות, עד 29% של הרקמה הוא למעשה תוכן משוכפל!
בואו נסתכל על כמה מהדרכים הנפוצות ביותר ליצור תוכן משוכפל בטעות:
1. וריאציות של כתובת אתר
פרמטרים של כתובת אתר, כגון מעקב אחר קליקים וקוד פרטים מסוימים, עלולים לגרום לבעיות תוכן כפול. זו יכולה להיות בעיה הנגרמת לא רק מהפרמטרים עצמם, אלא גם מהסדר שבו הפרמטרים האלה מוצגים בכתובת ה-URL עצמה.
לדוגמה:
- Www.widgets.com/blue-widgets?c... הוא שכפול שלו www.widgets.com/blue-widgets?c… & cat = 3 "class =" redactor-autoparser-object "> www.widgets. com / blue-widgets הוא עותק שלו www.widgets.com/blue-widgets ? חתול = 3 וצבע = כחול
באופן דומה, מזהי כניסה הם יוצר תוכן כפול נפוץ. זה קורה כאשר לכל משתמש שמבקר באתר יש מזהה התחברות שונה מאוחסן בכתובת האתר.

גרסאות תוכן ידידותיות להדפסה יכולות גם לגרום לבעיות תוכן כפולות בעת הוספת גרסאות מרובות של דפים לאינדקס.

לקח אחד כאן הוא שכאשר זה אפשרי, לעתים קרובות מועיל להימנע מהוספת כתובות אתרים או גרסאות חלופיות של כתובות אתרים (המידע שהן מכיל יכול לעבור בדרך כלל דרך סקריפטים).
2. HTTP לעומת HTTPS או WWW לעומת דפים שאינם WWW
אם לאתר שלך יש גרסאות נפרדות ב-"www.site.com" ו-"site.com" (עם ובלי הקידומת "www") ואותו תוכן קיים בשתי הגרסאות, למעשה יצרת כפילויות של כל אחד מהדפים האלה. אותו דבר לגבי אתרים שמתחזקים גם http:// וגם https://. אם שתי הגרסאות של דף פועלות וגלויות למנועי חיפוש, אתה עלול להיתקל בבעיית תוכן כפול.
3. תוכן שהועתק או הועתק
התוכן כולל לא רק פוסטים בבלוג או תוכן עריכה, אלא גם דפי מידע על מוצרים. מגרדים שמפרסמים מחדש את תוכן הבלוג שלך באתרים שלהם עשויים להיות מקור מוכר יותר לתוכן משוכפל, אבל יש בעיה אחת נפוצה באתרי מסחר אלקטרוני: מידע על מוצר. אם אתרים רבים ושונים מוכרים את אותם פריטים וכולם משתמשים בתיאורים של היצרן של פריטים אלה, אותו תוכן מביא למספר אתרים באינטרנט.
כיצד לפתור בעיות תוכן כפול
פתרון בעיות תוכן כפול מבוסס על אותו רעיון מרכזי: קביעה איזה כפיל הוא ה"נכון".
בכל פעם שניתן למצוא תוכן באתר בכתובות URL מרובות, זה צריך להיות מנורמל עבור מנועי החיפוש. בואו נסתכל על שלוש דרכים בסיסיות לעשות זאת: שימוש בהפניה 301 לכתובת האתר הנכונה, התכונה rel = canonical, או שימוש בכלי התצורה של Google Search Console.
הפניה מחדש 301
במקרים רבים, הדרך הטובה ביותר להילחם בתוכן משוכפל היא ליצור אחד הפניה מחדש 301 מהעמוד "כפול" לדף הבית של התוכן.
כאשר מספר דירוגים משולבים בעמוד אחד, הם לא מפסיקים להתחרות זה בזה. הם גם יוצרים אות חזק יותר של רלוונטיות ופופולריות באופן כללי. זה ישפיע לטובה על היכולת של הדף ה"נכון" לקלוע טוב.

Rel = "רגיל"
אפשרות נוספת להתמודדות עם תוכן משוכפל היא להשתמש בתכונה rel = קנוני . זה אומר למנועי חיפוש שיש להתייחס לדף נתון כאל עותק של כתובת אתר שצוינה וכל הקישורים, מדדי התוכן ו"כוח הדירוג" שמיושמים על ידי מנועי החיפוש על דף זה צריכים להיות מזוכים לכתובת ה-URL שצוינה.

התכונה rel = "canonical" היא חלק מכותרת ה-HTML של דף אינטרנט ונראית כך:
טופס כללי:
... [קוד אחר שעשוי להיות בראש ה-HTML של המסמך שלך] ... ... [קוד אחר שעשוי להיות קיים בראש ה-HTML של המסמכים שלך] ...
יש להוסיף את התכונה rel = canonical לכותרת ה-HTML של כל גרסה כפולה של דף, כאשר הקטע "URL של דף הבית" מוחלף בקישור לדף הבית (הרגיל). (הקפד לשמור מרכאות.) התכונה מוציאה בערך אותה כמות של קישורים זהים (כוח דירוג) כמו ההפניה מחדש 301, ומכיוון שהיא חלה ברמת העמוד (במקום בשרת), לעתים קרובות לוקח פחות זמן פריסה ליישום.
להלן דוגמה לתכונה נורמלית בפועל:

משתמש בזה MozBar לזהות תכונות רגילות.
כאן, אנו יכולים לראות ש-BuzzFeed משתמש בתכונות rel = canonical כדי להתאים אישית את השימוש בפרמטרים של כתובת URL (במקרה זה, מעקב אחר קליקים). למרות שדף זה נגיש עם שתי כתובות URL, התכונה rel = canonical מבטיחה שכל המדדים של אותם קישורים ותוכן מוקצים לדף הבית (/ אף אחד-עושה-זה-עכשיו).
Meta Robots Noindex
מטא תג אחד שיכול להיות שימושי במיוחד להתמודדות עם תוכן כפול הוא מטא-רובוט , בשימוש עם הערכים "noindex, follow." בדרך כלל נקרא Meta Noindex, עקוב ומכונה מבחינה טכנית תוכן = "noindex, follow" ניתן להוסיף תג מטא-רובוט זה לראש ה-HTML של כל דף בודד שיש להוציא אותו מאינדקס של מנוע חיפוש.
טופס כללי:
... [קוד נוסף שעשוי להיות בראש ה-HTML של המסמך שלך] ... ... [קוד נוסף שעשוי להיות בראש ה-HTML של המסמך שלך] ...
תג המטא-רובוט מאפשר למנועי חיפוש לסרוק קישורים בדף, אך מונע מהם לכלול את הקישורים הללו באינדקסים שלהם. חשוב להיות מסוגל לסרוק את הדף הכפול, גם אם אתה אומר לגוגל לא להוסיף אותו לאינדקס, מכיוון שגוגל מזהירה אותך במפורש לא להגביל את גישת הסריקה לתוכן משוכפל באתר שלך. (מנועי חיפוש רוצים לראות הכל במקרה שאתה עושה טעות בקוד שלך. זה מאפשר להם לבצע "שיחת משבר" [עלולה להיות אוטומטית] במצבים מעורפלים אחרת).
שימוש במטא-רובוטים הוא פתרון טוב במיוחד לבעיות תוכן כפול הקשורות דִפּוּף .
טיפול מועדף בדומיין ובפרמטרים ב-Google Search Console
Google Search Console מאפשר לך להגדיר אותו מגזר מועדף של האתר שלך (למשל http://yoursite.com במקום http://www.yoursite.com) וציין אם Googlebot צריך לזהות פרמטרים שונים של כתובת אתר שונה (טיפול בפרמטרים).

בהתאם למבנה כתובת האתר והגורם לבעיות התוכן הכפול שלך, הגדרת הדומיין המועדף או הטיפול בפרמטרים (או שניהם!) עשויה להציע פתרון.
החיסרון העיקרי בשימוש בפרמטרים כשיטה העיקרית להתמודדות עם תוכן משוכפל הוא שהשינויים שאתה מבצע עובדים רק עבור גוגל. כללים שחלים באמצעות Google Search Console לא ישפיעו על האופן שבו Bing או סורקים אחרים של מנועי חיפוש מפרשים את האתר שלך. תצטרך להשתמש בכלי מנהלי האתרים עבור מנועי חיפוש אחרים בנוסף להתאמה אישית של ההגדרות ב-Search Console.
שיטות נוספות להתמודדות עם תוכן משוכפל
- שמור על עקביות בעת קישור פנימי לאתר. לדוגמה, אם מנהל אתר מגלה שהגרסה הרגילה של דומיין היא www.example.com/, אז כל הקישורים הפנימיים צריכים לעבור אל כתובת http://www. example.co… במקום זאת http: // example.com/pa… (שימו לב להיעדר www).
- בעת הפצת תוכן, ודא שאתר הקונסורציום מוסיף קישור חזרה לתוכן המקורי, ולא גרסה לכתובת האתר. (צפו בפרק Fridayboard של Whiteboard על זה על ידי התמודדות עם תוכן משוכפל למידע נוסף.)
- כדי להוסיף הגנה נוספת מפני גניבת תוכן שגונבת קרדיט SEO עבור התוכן שלך, מומלץ להוסיף קישור rel = קנוני עם הפניה עצמית לדפים הקיימים שלך. זוהי תכונה רגילה שמציגה את כתובת האתר שכבר יש לה, על מנת למנוע כמה ניסיונות מגרד.
קישור rel = normal: כתובת האתר המצוינת בתג rel = normal זהה לכתובת הדף הנוכחית.
למרות שלא כל הסקראפרים יועברו דרך קוד ה-HTML המלא של חומר המקור שלהם, חלקם יעברו. למי שכן, תג ההפניה העצמית rel = רגיל יבטיח שגרסת האתר שלך תיזקף כחלק התוכן "המקורי".