Duplicate Content क्या है इसको Find कैसे करे ? SEO Guide

Blogging में हमे हर दिन कुछ नयी चीज सीखने का मौका मिलता है.ब्लॉग्गिंग का मतलब ही सीखना होता है,आप कितना सीखते है,अपनी knowledge को बढ़ाते है और उस knowledge को  एक quality content के रूप में ब्लॉग पोस्ट में लिखते है.आज की पोस्ट से भी आपको काफी कुछ सीखने को मिलेगा.

आज मैं बात करूँगा कि Duplicate Content क्या होता है.Duplicate content को find कैसे करे और इसका search engine optimization पर बुरा प्रभाव होता है या अच्छा प्रभाव देखने को मिलता है और इससे साथ ही जो blogger duplicate content को लेकर confuse रहते है उनके सभी सवालों का जबाव इस पोस्ट में मिल जायेगा.

यदि आप भी नीचे दिए गये सवालों के बारे में जानने की चाहत रखते है तो इस पोस्ट को ज़रूर पढ़े,क्योकि इस पोस्ट में मैं duplicate content related सभी सवालों के जबाव देने की कोशिश करूँगा.

1 - Duplicate Content क्या है ?

2 - डुप्लीकेट content के कितने types होते है.

3 - google किस content को डुप्लीकेट मानता है.

4 - साईट में डुप्लीकेट content होने पर सर्च इंजन ऑप्टिमाइजेशन पर किस प्रकार का प्रभाव होता है,?
5 - duplicate content को find कैसे करे ?

तो आइये शुरू करते है और इसकी पूर्ण जानकारी प्राप्त करने की कोशिश करते है.


duplicate-content-kya-hai-duplicate-content-ko-find-kaise-kare

Duplicate Content क्या है ?


simple language में internet पर जब कोई एकसमान content एक से अधिक स्थानों पर होता है तो उस प्रकार के कंटेंट को डुप्लीकेट कंटेंट की संज्ञा दी जाती है.इसकी एक और परिभाषा बनाई जा सकती है – ‘ जब एक समान कंटेंट या सामग्री इन्टरनेट पर एक से अधिक url address पर मिलती है.तो उसको duplicate content माना जाता है.


अब बात करते है कि google या दूसरे search engine डुप्लीकेट कंटेंट के लिए कोनसी परिभाषा देते है –‘ ऐसी सामग्री या कंटेंट जो एक domain address से अधिक  domain address पर पाया जाता है या अलग अलग url address पर पायी जाने वाली एक समान सामग्री या कंटेंट जो एकसमान हो या आपस में मेल खाती हो,duplicate content की श्रेणी में आती है.


अब मैं आपको बताता हूँ कि एक ही domain पर duplicate content क्या होता है और अलग - अलग domain पर डुप्लीकेट कंटेंट क्या होता है.


एक ही domain पर पाया जाने वाला डुप्लीकेट कंटेंट - जब एक ही domain पर अलग अलग url address पर एक समान कंटेंट हो तो उसको डुप्लीकेट कंटेंट माना जायेगा.मैं अपने ब्लॉग के द्वारा उदाहरण देने की कोशिश करता हूँ.

अब देखिए यह सभी url मेरे ब्लॉग के homepage पर ही open होते है या फिर कह सकते है की जब इन url को open किया जायेगा तो ZoneHindi ब्लॉग का homepage open होगा.



अब आप इन तीनो url को देखिए यह सब अलग - अलग url है किसी में तो https version है तो किसी में http या किसी में www के द्वारा url open हो रहा है.लेकिन यह तीनो url address मेरे ब्लॉग के homepage पर ही आ रहे है.यानि की अलग - अलग url address लेकिन उनका content एक समान है.इसे subdomain डुप्लीकेट कंटेंट भी कहा जा सकता है.लेकिन इसका seo पर कोई बुरा प्रभाव नहीं होता क्योकि googlebots यह जानते है की इसमें content copy नहीं किया गया,यानि subdomain duplicate content seo को नुकसान नहीं पहुँचाता है.


अब होता यह है कि google या जब दूसरे search engine के bots इन सभी url को अलग अलग मानकर crawl करते है जिससे बाद में हमारी साईट में duplicate content की समस्या आ जाती है.यह तो था एक ही domain पर डुप्लीकेट content लेकिन अब बात करते है कि अलग - अलग domain पर duplicate content कैसे हो जाता है.


अलग - अलग डोमेन पर पाया जाने वाला duplicate content - मान लीजिये की किसी एक blogger ने किसी एक topic पर कोई quality ब्लॉग पोस्ट लिखी और किसी content चोर के द्वारा उस content को पूरा का पूरा करके copy कर लिया गया और एक नए ब्लॉग पोस्ट में पब्लिश कर दिया गया.उदाहरण -


तो अब अलग अलग domain पर अलग - अलग url address में एक समान कंटेंट है जो पूरा का पूरा हुबहू मेल खाता है तो इस प्रकार के content को भी duplicate content की संज्ञा दी जाएगी.लेकिन यदि कोई blogger उसी topic पर पोस्ट लिखता है जो पहले किसी blogger ने लिखी हुयी है लेकिन उससे बेहतर लिखता है या अपने तरीके से लिखता है ,मेरा मतलब किसी प्रकार का copy paste नहीं करता है उस प्रकार के content को google या दूसरे search engine fresh content मानते है न कि duplicate.इस बात का हमेशा ध्यान ध्यान रखे की copy paste करने वाला content seo को हमेशा नुकसान पहुँचाता है.

एक blogger को fresh content और duplicate content में मैने जो ऊपर अंतर बताया है वो पता होना चाहिए.एक नया blogger पहले से लिखे हुए topic पर ब्लॉग पोस्ट लिख सकता है लेकिन शर्त यह होनी चाहिए की वह उससे कुछ बेहतर लिखे,अपने अंदाज में लिखे किसी भी प्रकार का copy paste न करे,इस स्थिति में वह पोस्ट fresh content कहलाती है और google search engine में अच्छी rank भी प्राप्त कर सकती है.


जबकि पूरी की पूरी copy करके paste करके जो ब्लॉग पोस्ट लिखी जाती है वो भी rank कर सकती है क्योकि google या दूसरे search engines के bots कई बार content को अलग अलग समझकर copy content को भी original content से ऊपर search रैंकिंग दे सकते है,लेकिन अब search engine के जो updates होती है उनकी वजह से इस copy paste के काम में रोक काफी हद तक लग चुकी है.अब google इस तरह से पूरी की पूरी content copy साईट को spam site मानकर चलता है,इस प्रकार की साईट high rank प्राप्त कर लेगी यह केवल एक मजाक है.

अब कुछ blogger दूसरे bloggers को copy cat या content चोरी करने वाला कहते है या फिर कई लोगो का मानना है की ज़्यादातर hindi bloggers एक समान content लिखते है लेकिन उनको एक बार सभी blogs को ज़रूर पढना चाहिए जिससे आपको पता चल सके की हर एक blogger का चाहे topic एक समान हो लेकिन उन सबमे बहुत फर्क है,बेहतर से बेहतर content लिखे जा रहे है.जिससे users व search engines का benefits हो रहा है क्योकि उसको एक से बढ़िया एक quality content मिल रहा है.

हाँ मैं मानता हूँ की कुछ content चोरी करने वाले digital चोर ( copy paste करने वाले वो मैं blogger नहीं मानता ) होते है जो सही मायने में blogging का अर्थ नहीं जानते वो नहीं जानते की एक पोस्ट को लिखने में 3 से 5 घन्टे लगते है उनके लिए ब्लॉग्गिंग केवल copy करना paste करना है.

इस कारण अब  आप किसी को भी copy cat या content चोरी करने वाला कहने से पहले उसके ब्लॉग को ज़रूर view करे.अब duplicate content के कुछ और types की बात करते है.

Duplicate Content के प्रकार -


ऊपर आप subdomain duplicate content और अलग अलग domain डुप्लीकेट content के बारे में जान चुके है लेकिन अब मैं आपको इसके कुछ और types के बारे में बताने की कोशिश करता हूँ.


Translator Duplicate Content - अब मान लीजिये की कोई blogger किसी दूसरे ब्लॉग की पोस्ट जो english में है उसको online ट्रांसलेटर द्वारा या फिर गूगल ट्रांसलेटर के द्वारा हिन्दी में ट्रांसलेटर करके किसी भी अपने ब्लॉग पर या किसी और ब्लॉग पर पब्लिश कर दे तो क्या होगा.अब कुछ blogger मानते है की यह डुप्लीकेट कंटेंट नहीं होगा.लेकिन कुछ मानते है की यह duplicate content होगा.


इसका मैं आपको जबाव देता हूँ देखिए इस प्रकार online ट्रांसलेटर के द्वारा ट्रांसलेटर content साफ़ साफ़ देखने पर आसानी से पता लग जाता है की यह किसी दूसरी language से इस language में translate किया गया है ठीक उसी प्रकार smart search engine google,bing आदि के क्रमश googlebot,bingbot को यह समझने में ज्यादा problem नहीं होगी की यह duplicate content है.इस प्रकार के content को duplicate content माना जायेगा.और हो सकता है की यह rank भी न करे.


इस प्रकार यदि आप ट्रांसलेट कंटेंट को लिखना चाहते है तो कोशिश यह रखे की ज्यादा से ज्यादा content आप खुद लिखे,जिससे यह साफ़ साफ़ प्रतीत न हो की यह totally translate content है.यानि की केवल ट्रांसलेटर tool के द्वारा content translate करके पब्लिश करने की गलती न करे.उसमे स्वय कुछ editing करे और अपने तरीके से content को लिखने की कोशिश करे जिससे google उस content को quality और fresh content समझे .इस प्रकार खुद लिखे ट्रांसलेटर content search रैंकिंग में अच्छा स्थान प्राप्त कर सकते है.


 Scraping Content - अब इस प्रकार के कंटेंट को समझने की कोशिश करते है.देखिए scrap का हिन्दी में अर्थ होता है खंड या भाग या छेड़छाड़.और content का मतलब होता है सामग्री या टेक्स्ट जो हम लिखते है.content scraping से मतलब होता है कि किसी भी विस्तृत content से important या काम में आने वाली विशेष जानकारी जो ज्यादा महतवपूर्ण है उसको किसी computer सॉफ्टवेयर के द्वारा या किसी और तरीके से अलग कर लेना.जैसे की स्टूडेंट्स notes बनाते है.ठीक उसी प्रकार कुछ content चोरी करने वाले किसी दूसरे ब्लॉग के content की scraping कर लेते है.


उसके बाद जो विशेष महतवपूर्ण डाटा मिलता है उसको अपनी साईट पर या ब्लॉग पर पब्लिश कर देते है.लेकिन अब search engine smart हो गये है मेरा कहने का मतलब ही scraping content को भी google या दूसरे search engine इसको duplicate content मानते है.


Curation Content - अब इस प्रकार का कंटेंट डुप्लीकेट कंटेंट नहीं माना जायेगा.लेकिन इस प्रकार का कंटेंट क्या होता है इसको समझने की जरुरत होती है.curation से तात्पर्य है कि निरक्षण और content का मतलब हम सभी जानते है.देखिए इस प्रकार का content वो content कहलाता है जिसमे हम उन चीजो का उल्लेख करे जो सत्य हो मेरा कहने के मतलब है की universal truth हो,किसी महान इंसानों के अनमोल वचन हो,शायरियाँ हो,किसी महान इंसान के विचार हो,उसकी आत्मकथा हो,चुटकले हो आदि curation content कहलाते है.


इस प्रकार का content कभी भी गूगल या किसी और search engine के द्वारा duplicate नहीं माना जाता है.आपने देखा होगा की बहुत सी साईट पर एक ही प्रकार के शायरियाँ,अनमोल कथन देखे होंगे लेकिन google या कोई भी search engine उसको duplicate content नहीं मानता है.अब कुछ लोग कहने लगते है कि आपको कैसे पता,आप google में काम करते हो तो उनको मेरा एक सीधा सा जबाव है की duplicate content के  बारे में 2 से 3 दिन Research कीजिये आपको खुद पता लग जायेगा.


 Syndication Content - अब इस प्रकार के कंटेंट की बात करते है कि क्या इस प्रकार का कंटेंट डुप्लीकेट कंटेंट कहलाएगा तो इसका जबाव है नहीं google या bing इस प्रकार के content को डुप्लीकेट नहीं मानते है.लेकिन इस सिंडिकेशन कंटेंट का मतलब पहले समझना होगा.


देखिए कई साईट कुछ इस प्रकार की होती है कि वो आपनी ब्लॉग पोस्ट या लेखो को सेल करती है यानि की बेचती है,जिससे अलग - अलग webmaster या साईट owner,blogger उनसे यह पोस्ट,लेख खरीद लेते है और फिर उस पोस्ट को अपनी साईट या ब्लॉग पर पब्लिश कर देते है.या कुछ साईट इस प्रकार के content को copy व दूसरी साईट पर पब्लिश करने की आज्ञा बिना कोई पैसा लिए दे देती है लेकिन उनकी शर्त यह होती है की यदि आप हमारी साईट के content को खुद की साईट पर पब्लिश करना चाहते है तो आपको आपकी website से हमारी साईट पर एक dofollow backlink देनी होगी.


इस प्रकार content सिंडिकेशन से एक ही लेख ही अलग - अलग साईट पर कॉपिया बन जाती है.लेकिन इस प्रकार के content को google duplicate नहीं मानता है.लेकिन यदि कोई दूसरा व्यक्ति आपकी साईट या ब्लॉग की पोस्ट,लेख आदि को हुबहू अपनी साईट पर copy आपकी अनुमति के बिना कर रहा है तो आप उससे contact करके उसको चेतावनी दे सकते है लेकिन यदि फिर भी वह copy करना जारी रखता है तो DMCA में शिकायत करना ज़रूरी हो जाता है.



Mobile version content - अब आपकी साईट है जो computer में भी open होती है और मोबाइल में भी यानि की साईट के 2 version होते है डेस्कटॉप version और मोबाइल version.अब आपने देखा होगा की कई big popular sites को जब डेस्कटॉप में open करते है तो इस प्रकार का url address होता है.


लेकिन जब उनको मोबाइल में open करते है तो उस साईट का url कुछ इस प्रकार से होता है.


तो आपने देखा कि इसमें m है वो मोबाइल version को show करता है.इस प्रकार का मोबाइल version content duplicate content नहीं कहलाता क्योकि जब search engines के bots इनको crawl करते है तो उनको इस बात का अंदाजा हो जाता है की यह किसी विशेष साईट का मोबाइल version content है न कि duplicate content.blogger blogs में भी blogs का डेस्कटॉप व मोबाइल version होता है.


others duplicate content types - देखिए जो मुख्य रूप से डुप्लीकेट कंटेंट के प्रकार थे वो मैने आपको बता दिए लेकिन इसके कुछ और उदाहरण है.मान लीजिये की आपने एक पोस्ट लिखी ब्लॉग कैसे बनाये और उसके labels केटेगरी सेट कर दी ब्लॉग्गिंग और blogger.तो अब जब search engine bots आपके ब्लॉग की ब्लॉग्गिंग केटेगरी की posts को check करेगा तो भी उसको वो पोस्ट मिलेगी और जब blogger केटेगरी की पोस्ट को crawl करेगा तो उस दिशा में भी duplicate content की समस्या show हो सकती है.लेकिन इससे seo पर बुरा प्रभाव नहीं होता है.लेकिन फिर भी हमे इसको fix कर लेना चाहिए.

Duplicate Content का Search Engine Optimization पर Effect --


तो सबसे मुख्य प्रशन जो अक्सर blogger मुझसे पूछते रहते है.इसका जबाव मैं आपको ऊपर दे चुका हूँ.की किस प्रकार का content duplicate content माना जायेगा और किस प्रकार का content duplicate content नहीं होगा.सीधे शब्दों में यदि आप किसी भी दूसरे साईट या ब्लॉग के content को हुबहू copy करके अपने ब्लॉग पर paste करते रहेंगे तो इससे आपका बहुत नुकसान होगा.

देखिए मान लीजिये की आपने 20 लेख किसी और साईट से copy करके paste करके पब्लिश कर दिए और आपने 50 कंटेंट लेख खुद अपनी मेहनत से लिखे है यानि की आपके ब्लॉग पर कुल content ब्लॉग पोस्ट 70 हो जायेंगी.यदि google या किसी और search engine को जब भी पता चल गया है आपके ब्लॉग पर copied duplicate content है तो वह आपकी साईट को spam मानकर चलता है.


जिससे आपके ब्लॉग की वो posts भी SERP में low rank पर हो जायँगी जिनको आपने मेहनत करके लिखा था और high rank तक पहुँचाया था.तो इसका सीधा मतलब है कि जो Copied Duplicate content होगा वो हमेशा आपके साईट के लिए हानिकारक होगा.उससे आपकी साईट का search engine optimization घटकर बिलकुल कम हो जायेगा.जिससे ब्लॉग्गिंग करना आप बंद भी कर सकते है.


इस लिए हमेशा fresh व खुद लिखा हुआ quality content पेश करे,जिससे आपकी व आपकी साईट की blogging industry में एक high reputation बनी रहे.अब नीचे मैंने बताया है कि duplicate content को check किन online tools की मदद से किया जा सकता है.मैं केवल फ्री tools के बारे में बात करूँगा.


Blog या Website के Duplicate Content को Find कैसे करे ?


इसके लिए आप नीचे दिए गये फ्री tools का इस्तेमाल कर सकते है.लेकिन यह कितना सही अनुमान लगाते है इसके बारे में कहना मुश्किल है.लेकिन फिर भी यह 70% तक सही अनुमान लगाते है की कितना % duplicate content किसी साईट या ब्लॉग में है.


1 – Copyscape - copyscape से भी डुप्लीकेट कंटेंट find किये जा सकते है.यह एक फ्री tool है यानि की हम आसानी से अपनी ब्लॉग या website को scan check कर सकते है.


2 – Sitelinker -- यह एक बेस्ट tool है इसमें डुप्लीकेट कंटेंट के साथ साथ broken links आदि का भी पता चल जाता है.इस tool से यह आसानी से पता चल जाता है की duplicate content किस पेज में कितने words के रूप में है या कितने परसेंट duplicate content है.इस tool का आप फ्री में आसानी से इस्तेमाल कर सकते है.

3 – DupliChecker - यह भी एक अच्छा फ्री tool है,इसमें हम अपनी पोस्ट को paste करके check कर सकते है की duplicate content कितना है.
4 - Google Webmaster Tool -जी हाँ,यह भी एक duplicate content checker की भांति भी काम करता है.जब google search engine को हमारी साईट या ब्लॉग में कुछ duplicate content के बारे में पता चलता है तो वह हमे notification दे देता है.जिससे हम आसानी से पता चल जाता है की किस प्रकार के url duplicate content problem create कर रहे है.

तो आज की पोस्ट में केवल इतना ही,मुझे उम्मीद है कि आपको आज की पोस्ट से duplicate content से संबंधित सभी सवालों के जबाव मिल गये होंगे.इसी तरह के लेख पढ़ते रहे के लिए हमारे ब्लॉग के साथ बने रहे.आज की इस पोस्ट Duplicate Content क्या है इसे Find कैसे करे  को social media पर दूसरे bloggers के साथ साँझा ज़रूर करे.अपना ख्याल रखे.

जानकारी अच्छी लगी है तो हमारा Facebook Page Follow करे

Share This Post :-


2 comments:

  1. बहुत ही शानदार लिखा है आपने। डुप्लीकेट कंटेंट पर मैंने बहुत सारी पोस्ट पढ़ी है उनमें सबसे बेस्ट है ये।

    ReplyDelete

आपको पोस्ट कैसी लगी कमेंट बॉक्स में ज़रूर लिखे,यदि आपका कोई सवाल है तो कमेंट करे व उत्तर पाये ।