حفاظت از وبلاگ وردپرسی در برابر مطالب تکراری


duplicate content Searchهمانطور که حتماً می دانید وجود مطالب تکراری در صفحات مختلف سایت یا وبلاگ ها تاثیر بسیار بدی در رتبه صفحات و نمایش صفحات سایت یا وبلاگ ما در نتایج موتورهای جستجوگر دارد. بسیاری از افرادی که از سیستم وردپرس برای  راه اندازی سایت یا وبلاگ خود استفاده می کنند نگرانی های قابل قبولی درباره نحوه نمایش مطالب خود در صفحات مختلف وردپرس دارند. در این مطلب از آی تی گشت سعی می کنیم با استفاده از ابزارها و راهکارهای مختلف از ثبت شدن مطالب تکراری سایت یا وبلاگ خود در موتورهای جستجوگر جلوگیری کنیم و با این کار قدم بزرگی درباره بهینه سازی وبلاگ خود برای موتورهای جستجوگر ( SEO ) سایت خود برداریم.

چند نمونه از تکرار شدن مطالب نوشته شده در وبلاگ وردپرسی

با توجه به قالبی که از آن برای انتشار وبلاگ یا وب سایت خود استفاده می کنید , افزونه ها و ساختار لینک های داخلی سایت خود ممکن است مطالب تکراری در صفحات متفاوتی از سایت شما باشد. همانطور که می دانید حنماً نیازی به تکرار مطالب وجود دارد که وردپرس در صفحات مختلف آن ها را تکرار می کند پس تنها کاری که کافیست ما انجام دهیم این است که به ربات های خزنده موتورهای جستجوگر بگوییم صفحاتی که در آن ها مطالب تکرار می شوند را دنبال نکنند. نمونه ای از این صفحات در زیر مشاهده می کنید.

1. صفحه خوراک مطالب ( Feed ) یکی از صفحاتی است که مطالب ما در آن دوباره نویسی می شود. برای مثال

https://itgasht.wordpress.com/feed/

2. صفحه خوراک نظرات بازدید کنندگان که آخرین نظرات کاربران شما در پایین مطالب خود در آن تکرار می شود و این نظرات فقط باید در پایین مطلب اصلی برای موتورهای جستجوگر قابل مشاهده باشند. برای مثال

https://itgasht.wordpress.com/comments/feed/
https://itgasht.wordpress.com/2010/10/14/comments-blog-seo/feed/
https://itgasht.wordpress.com/2010/11/10/wordpress-duplicate-content/feed/
...

3. اگر در تنظیمات وبلاگ خود گفته اید که نظرات کاربران در مطالب سایت شما مثلاً اگر برای یک مطلب 20 عدد شد نظرات بعدی صفحه بندی شوند ( هر 20 نظر در یک صفحه ) به طور اتوماتیک صفحات نظرات در اکثر قالب ها شامل مطب اصلی پست شما نیز می باشد و این باعث از بین رفتن ارزش مطالب شما در موتورهای جستجوگر می شود اگر تعداد نظرات کاربران شما زیاد باشد ! برای مثال

https://itgasht.wordpress.com/2010/11/10/wordpress-duplicate-content/comment-page-1/
https://itgasht.wordpress.com/2010/11/10/wordpress-duplicate-content/comment-page-2/
...

4. صفحه بندی مطالب نیز باعث تکرار شدن مطالب در صفحات متفاوت می شود. مثلاً وقتی تعیین می کنید که هر 10 مطلب در یک صفحه نمایش داده شود در هر صفحه مطالب نمایش داده می شود اما توجه داشته باشید که این مطالب در صفحات آرشیو برچسب ها ( Tags ) و دسته بندی های کلی شما نیز نمایش داده می شوند. برای مثال

https://itgasht.wordpress.com/page/2/
https://itgasht.wordpress.com/page/3/
...

5. اگر آدرس اینترنتی وبلاگ یا وبسایت شما هم با WWW و بدون WWW قابل دسترس باشد بسیاری از موتورهای جستجوگر قادر به تشخیص یکتا بودن صفحات نیستن و با ایندکس کردن هر دو صفحه در وبلاگ یا وب سایت شما دارای مطالب تکراری در صفحات مختلف خود می شود. برای مثال

https://itgasht.wordpress.com/2010/11/10/wordpress-duplicate-content
http://www.itgasht.wordpress.com/2010/11/10/wordpress-duplicate-content
wordpress duplicate content

در تصویر هر رنگ نشانگر یک مطلب یکتا است و هر دایره نشانگر یک URL

 

استفاده از فایل robots.txt برای جلوگیری از ثبت مطالب تکراری در موتورهای جستجوگر

اولین روش و ساده ترین روشی که برای هدایت ربات موتورهای جستجوگر برای دنبال نکردن صفحاتی که در آن ها مطالب تکراری است پیشنهاد می کنم استفاده از فایل robots.txt در شاخه اصلی وبلاگ خود ( برای مثال https://itgasht.wordpress.com/robots.txt ) که محتوای این فایل به صورت کامل به ربات های خزنده موتورهای جستجوگر می گوید که چه آدرس هایی را دنبال نکنند. برای مثال من یک فایل ربات تکست برای وردپرس نوشتم به صورت زیر که علاوه بر جلوگیری از ایندکس شدن صفحاتی که دارای مطالب تکراری هستند صفحاتی که اصلاً نباید در موتورهای جستجوگر ثبت شوند مثل صفحات و فایل های مدیریتی وبلاگ ( مثل wp-admin ) و صفحات ارسال بازخورد ( TrackBack ) در آن رعایت شده. البته با توجه به ساختار لینک ها و آدرس دهی صفحات خود می توانید آن را بهینه تر کنید و فقط یک نمونه است و در آن باید آدرس نسخه XML نقشه سایت خود و نکات دیگری را اضافه کنید.

User-agent: *
Disallow: /cgi-bin/
Disallow: /wp-
Disallow: /feed/
Disallow: /trackback/
Disallow: /comments/feed/
Disallow: /page/
Disallow: /comments/

استفاده از چکیده مطلب در وبلاگ های وردپرسی

یکی دیگر از روش هایی که فکر می کنم مفید باشه استفاده از چکیده مطلب است. پیشنهاد می کنم وقتی مطلبی را می نویسید ابتدا چکیده ( Excerpt ) از آن را در پایین قسمت افزودن مطلب جدید در قسمت مدیریتی وبلاگ وردپرسی خود بنویسید البته اگر این قسمت را خالی بگزارید 55 کلمه اول از مطلب شما به عنوان چکیده استفاده می شود. این متن به دو منظور استفاده می شود.

1.بجای متن کامل در خوراک مطالب وبلاگ شما نمایش داده می شود که این امر کمک شایانی به ما در نگهداری از یکتا بودن پست خود می کند چون به غیر از جلوگیری تکرار مطلب در وبلاگ ما در دیگر سایت های RSS خوان که آخرین نوشته های خوراک مطالب وبلاگ ها و وب سایت دیگر در آن ها نمایش داده می شود مطالب شما به صورت کامل درج نمی شود و دیگر موتورهای جستجوگر صفحات سایت شما را اگر تازه تاسیس است و رتبه پایینی دارند خط نمی زنند به دلیل وجود مطالب تکراری در وب.
* برای فعال سازی این امکان از قسمت مدیریت وبلاگ وردپرسی خود > تنظیمات > خواندن بروید و در قسمت » برای هر نوشته در خوراک، نمایش بده » بجای متن کامل گزینه خلاصه را انتخاب کنید.

2. بجای استفاده متن کامل مطلب در صفحات تگ ها , دسته بندی ها , نویسنده , صفحه بندی اصلی و نمایش جستجو بجای متن اصلی می توانید از آن استفاده کنید که باعث از بین نرفتن ارزش صفحه اصلی مطلب در موتورهای جستجوگر و سبک شدن صفحات شما می شود.
* برای مثال وقتی می خواهیم خلاصه مطلب ( چکیده ) در صفحات آرشیو ماهانه و دسته بندی ها نمایش داده شود بجای استفاده از کد the_content(); به طور معمول در چرخه از کد زیر می توانیم استفاده کنیم

<?php if ( is_category() || is_archive() ) {
the_excerpt();
} else {
the_content();
} ?>

استفاده از rel=»canonical» برای جلوگیری از ایندکس شدن صفحات با مطالب تکراری

اگر به صورت کامل با سیستم وردپرس , HTML , PHP و ساختار قالب وبلاگ وردپرسی خود آشنا هستید می توانید برای اینکه به موتور جستجوگر گوگل بفهمانید که صفحه ی جاری یک صفحه با مطالب از صفحه دیگری است و نیازی به ایندکس شدن آن نیست از rel=»canonical» استفاده کنید برای مثال فرض می کنیم که صفحه https://itgasht.wordpress.com/about/comments/ همان صفحه https://itgasht.wordpress.com/about/ است پس در قسمت <head> صفحه https://itgasht.wordpress.com/about/comments/ کافی است کد زیر را جاگذاری کنید.

<head>
...
<link rel="canonical" href="https://itgasht.wordpress.com/about/"/>
</head>

توجه داشته باشید در صورتی که این کد را به صورت نادرستی در قالب وبلاگ خود جاگذاری کنید و یا اگر از کدهای PHP برای شرط گذاشتن استفاده می کنید کاملاً مواظب باشید چون استفاده نادرست از این کد نه تنها به شما کمک نمی کند برای جلوگیری از دیده نشدن مطالب تکراری توسط موتورهای جستجوگر بلکه می تواند به رتبه صفحات وب شما ضربه شدیدی وارد کند !

از .htaccess کمک بگیرید

همانطور که در قسمت پنجم «چند نمونه از تکرار شدن مطالب نوشته شده در وبلاگ وردپرسی» گفتیم شما باید تمام درخواست هایی که بدون WWW هستند را منتقل کنید به آدرس وبلاگ یا وب سایت خود با WWW و یا بلعکس همچنین درخواست هایی که در آخر آن ها ( / ) درج نشده است مانند https://itgasht.wordpress.com/about را بهتر است به https://itgasht.wordpress.com/about/ تبدیل کنید با یک redirects 301 مطمئاً که برای اینکار می توانید با اضافه کردن کد زیر به فایل .htaccess خود که در شاخه اصلی سایت یا وبلاگ شما قرار دارد.

RewriteEngine On
RewriteCond %{HTTP_HOST} !^www\.yoursite\.com$ [NC]
RewriteRule ^(.*)$ http://www.yoursite.com/$1 [R,L]
RewriteBase /
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteRule . /index.php [L]

فایل Sitemap.xml خود را تنها با آدرس صفحات اصلی پر کنید

پیشنهاد می کنم که تنها مجموعه آدرس های یکی از لیست های آرشیو , برچسب ها , دسته بندی ها و یا نویسنده ها در فایل Sitemap.xml خود داشته باشید. با توجه به رتبه فعلی صفحات و یا تعداد ورودی ها به هر یک از این لیست ها می توانید بهترین را انتخاب کنید.

استفاده از افزونه های آماده برای جلوگیری از مطالب تکراری در وبلاگ وردپرسی

خوشبختانه تقریباً برای هر کاری افزونه های آماده ای برای وردپرس به صورت رایگان در دسترس است. شما می توانید با استفاده از افزونه های زیر خیال خود را راحت کنید که موتورهای جستجوگر مطالب تکراری را در وبلاگ شما ثبت نمی کنند.

افزونه No Duplicate Content
این افزونه از canonical استفاده می کند که آن را در بالا توضیح دادیم. خوبی کار با آن اینست که دیگر نیازی به جاگذاری دستی در صفحات قالب خود نداریم.

افزونه Duplicate Content Cure
این افزونه با اضافه کردن متا تگ robots در صفحاتی که محتوای آن ها تکراری است از ایندکس شدن آن ها در موتورهای جستجوگر جلوگیری می کند ولی ضربه ای به لینک های داخلی و خارجی داخل آن صفحه وارد نمی کند با اضافه کردن کد زیر در قسمت <head> آن صفحه این کار انجام می شود.

<meta name="robots" content="noindex,follow">

و …

با دنبال کردن خوراک مطالب (?) آی تی گشت از آخرین مطالب با خبر شوید و یا با عضویت رایگان در خبرنامه آی تی گشت آخرین مطالب را در ایمیل خود بخوانید.

Advertisements

, , , , , , ,

  1. #1 توسط فربد در 2010/11/10 - 8:44 ق.ظ.

    سلام. بسیار عالی. خیلی از وبلاگ های خارجی رو که موضوع مرتبط با سئو دارند رو می خونم و توی هیچکدومشون همچین مطلب کاملی رو ندیده بود. خیلی ممنون.فقط یک سوال دارم از خدمتتون. چرا از وردپرس.کام استفاده می کنید؟ یک هاست و دومین شخصی بهتر نیست؟

    • #2 توسط itgasht در 2010/11/12 - 3:32 ق.ظ.

      فربد جان ممنون از لطف شما. معمولاً زیاد مطالب وبلاگ های دیگر رو نمی خونم درسته که برای نوشتن باید باید و باید این کار رو کرد و من خودم همیشه توصیه می کنم این عمل را ولی به قول یکی از دوستان خواندن بیش از حد مطالب دیگران باعث می شود که خودتان نتوانید بنویسید و هر ایده ای برای مطلبی جدید در وبلاگتان به سرتان بزند ناخودآگاه آن را رد کنید. در مورد سوالتون هم 100 درصد یک هاست شخصی و Domain شخصی بهتر است تا نوشتن در سیستم های وبلاگ نویسی رایگان ( البته وردپرس.کام یکسری برتری نسبی نیز دارد ) اما خوب کار با وردپرس در یک هاست شخصی برای وبلاگ خودم من رو از زندگی off می کند چون یک سیستم متن باز است و من هم خیلی کنجکاو و عاشق تغییرات کدها و خروجی آن. راستی آدرس وبلاگ خودتون هم حتماً برام بفرستید خوشحال می شم.

  2. #3 توسط encaria در 2010/11/10 - 7:02 ب.ظ.

    آفرین خوشم اومد مخصوصا توضیحاتی که در مورد فایل Sitemap.xml و تگ canonical دادی

  3. #4 توسط آرش حسینیان در 2010/11/11 - 7:18 ق.ظ.

    مرسی

  4. #5 توسط mory_fun در 2010/11/11 - 12:09 ب.ظ.

    خوشم اومد آفرین

  5. #6 توسط blindday در 2010/11/11 - 6:06 ب.ظ.

    آقا دمت گرم..اخر یکی پیدا شذ اینا رو به ما فهموند!

  6. #7 توسط 1wsa در 2010/11/11 - 11:56 ب.ظ.

    سلام دوست عزیز میخواستم بدونم که ایا امکان این وجود دارد که در وردپرس دات کام در وبلاگم صفحات جدا داشته باشم و در ان صفحات مانند صفحه اول جندین پست بگذارم یا نه چون من وقتی صفحه ای میسازم فقط یک مطلب را میتوانم در ان صفحه بریزم اما امروز یه وبلاگ دیدم که و قتی وارد ادرس http://koreanphotoblog.wordpress.com/ شدی چهار گزینه میبینی شما روی هرکدام که کلیک کنی صفحه ای با امکانات صفحه اول میبینی و می توانی بیشمار مطلب پست کنی

    • #8 توسط itgasht در 2010/11/12 - 2:47 ق.ظ.

      1wsa عزیز از قالب Coraline استفاده شده در این وبلاگی که گفتید و از کارهای خود Automattic است. امتحانش کن شاید در قسمت امکانات اضافی قالبش بشه تنظیمش کرد. البته فکر می کنم اگر در وردپرس.کام عضو VIP شوید ( وبلاگ شما روزیانه بیش از 25000 بازدید داشته باشه ) یکسری از امکانات برای شما باز می شود. شاید این هم یکدام از اون امکانات باشد.

  7. #9 توسط 1wsa در 2010/11/12 - 12:03 ق.ظ.

    باز هم یه سوال شما گفتید که نمیشه کدی رو به جز کدهای خود وردپرس به وبلاگ زیاد کرد اما من دو تا وبلاگ دیدم که کدهای امارگیر به ولاگ خودشون زیاد کرده بودن چطوری؟
    ادرس وبلاگها:bigbanglife.wordpress.com
    egza.wordpress.com
    اگه راهی داری بهم بگو چطور این کار رو میشه کرد

    • #10 توسط itgasht در 2010/11/12 - 3:01 ق.ظ.

      کد های جاوا اسکریپت نمی شود اضافه کرد 1wsa جان ولی برای اضافه کردن کد های اچ تی ام ال می تونید از قسمت مدیریت > نما > ابزارک ها , یک ابزارک متن / HTML به صفحات خودت اضافه کنید و در آن کدی که بعد از ثبت نام از سایت های آمارگیر به شما داده می شود مثل sitemeter.com و statcounter.com که در حقیقت به شما آدرس یک عکس رو می دهند که در ابزارک جاسازیش می کنید و هر با که این تصویر از صفحات شما بارگذاری می شود آن را شمارش می کنند که البته یکسری محدودیت ها نسبت به آمارگیر هایی که کد جاوا اسکریپت به شما می دهند دارند.

    • #11 توسط Shabnam naghebi در 2010/11/19 - 4:37 ق.ظ.

      بسیار عالی ممنون