重複コンテンツはSEO対策において、避けるべきです。しかし、判定の基準や概要について、よくわからないという方も多いのではないでしょうか。
そこでこの記事では、重複コンテンツを避けるべき理由やペナルティのリスク、対策方法について解説していきます。
コンテンツSEOに取り組もうと考えている方は、ぜひ参考にしてください。
目次
SEOにおける重複コンテンツとは?
重複コンテンツとは、既存のWebページと構成している情報がほとんど同じコンテンツのことです。Googleは、下記のように定義しています。
一般に、重複するコンテンツとは、ドメイン内または複数ドメインにまたがって存在する、同じ言語の他のコンテンツと完全に同じであるか非常によく似たコンテンツのブロックを指します。
重複コンテンツを避ける|Google検索セントラル
また、重複コンテンツは2種類存在し、性質が異なります。
- 外部サイトとの重複コンテンツ
- 自社サイト内での重複コンテンツ
それぞれ詳しく解説していきます。
関連記事:コンテンツSEOとは?現役SEOコンサルタントが徹底解説
外部サイトとの重複コンテンツ
外部のサイトのページと内容が重複しているコンテンツで、SEOにおいて問題になりやすいです。
他サイトからのテキストや画像のコピー、あるいは類似によって重複コンテンツとして判定される可能性があります。また、既出の情報だけで構成されたページは、有益なコンテンツとはみなされず、検索上位に表示されません。
そのためコンテンツを作成する際は、独自の情報を記載するようにし、ツールを使用して既存のページと重複していないか確認することが重要です。
自社サイト内での重複コンテンツ
自社サイト内で内容が似ているページが複数存在する場合、重複コンテンツと判定されることがあります。
自サイト内であれば、意識すれば回避できますが、Webサイトの仕組み上やむを得ず生成されてしまう、以下のような重複コンテンツも存在します。
- wwwの有無
- 商品ページのバリエーションごとのページ
対策を行わないと、意図せずSEO評価を下げてしまうため注意が必要です。
重複コンテンツによるSEO対策への影響
重複コンテンツによって、次のような影響が生じる可能性があります。
- 被リンク評価が分散する
- 各ページが上位表示されにくくなる
- ユーザビリティを低下させる
- ペナルティを受ける可能性がある
これらの影響を把握し、サイト改善に役立てましょう。
被リンク評価が分散する
被リンクはページを評価するための客観的な指標です。サイト内に重複コンテンツが存在すると、本来1つのページに集まるはずだった被リンクによる評価が、複数のページに分散されてしまいます。
似たようなページがサイト内に複数存在する場合、どのページも十分な評価が得られなくなるおそれがあるでしょう。
各ページが上位表示されにくくなる
重複コンテンツがあると、検索エンジンがどのページを優先的に表示すべきか、コンテンツを評価する際に支障をきたします。検索意図が類似するキーワードを対策した際に、生じやすい問題です。
複数のページが似たような内容で競合することになり、評価が分散してしまいます。また重複コンテンツが多いサイトは、情報の整理ができていない質の低いサイトという印象を与え、サイト全体の信頼性を損なう可能性もあります。
ユーザビリティを低下させる
重複コンテンツは、ユーザーの混乱を招きます。同じような情報が複数のページに散らばっていると、ユーザーは探したい情報へとたどり着けず、目的のページを見つける前に離脱してしまうでしょう。
また重複コンテンツが生じているということは、サイト内の情報整理ができていないということです。ページによって記載されている情報が違うと、ユーザーはどの情報が正確で最新のものか、判断に迷ってしまいます。
ペナルティを受ける可能性がある
サイト内の重複コンテンツはユーザーの利便性を損ないますが、Googleのペナルティには該当しません。ただし、外部サイトをコピーして作成したコンテンツはペナルティの対象です。検索順位の低下やインデックスの削除などの措置を受ける可能性が高いでしょう。
またコピーコンテンツはSEO効果に悪影響を及ぼすだけでなく、著作権法上の問題もあります。著作権侵害が認められた場合は、損害賠償請求や刑事罰の対象となる可能性もあるため、十分注意しなければなりません。
SEOで重複コンテンツと判定される基準と確認する方法
重複コンテンツにならないためには、判定基準と確認方法を把握しておくことが大切です。次の項目にあてはまる場合は、重複コンテンツと見なされる可能性が高いでしょう。
- 同じ内容のURLが複数ある
- 外部サイトのコンテンツと酷似している
また、詳しく調べるためには、下記の方法を実施します。
- 実際の検索結果を見てみる
- Google Search Console(サーチコンソール)でチェックする
- コピペチェックツールを利用する
- 類似ページ判定ツールを利用する
- URLの後ろに「&filter=0」のパラメータを追加する
それぞれ詳細を解説します。
実際の検索結果を見てみる
手軽な確認方法は、実際に検索してほかのページと類似している点がないかチェックする方法です。特段のツールを必要としないため、誰でも簡単に確認できます。
ただし、ページを1つずつチェックする手間がかかります。人の目で確認していくため、類似している箇所を見落としてしまう可能性もあるでしょう。確認すべきページが多い場合や、細部にわたってチェックしなければならないときは、ツールの使用を検討するのがおすすめです。
Google Search Console(サーチコンソール)でチェックする
Googleが提供するツールであるGoogle Search Consoleでは、Webサイトの正確な情報をチェックできます。まずはGoogle Search Consoleにアクセスし、重複コンテンツに関する警告やエラーが表示されていないか確認しましょう。
もし重複コンテンツに関するメッセージがある場合は、ページの詳細を確認して対策を実施します。ただし、重複コンテンツに該当するすべてのページがGoogle Search Console上に警告として表示されているとは限りません。
Google Search Consoleのデータが更新されるまでには、数日から数週間のタイムラグがあります。エラーが表示されない場合も、重複コンテンツに該当するページがないか確認しましょう。
コピペチェックツールを利用する
短時間でインターネット上から類似する文章を抽出し、一致率を表示できるのがコピペチェックツールの利点です。チェックしたい文章をツール上に入力するだけで、ほかのサイトとの一致率を確かめられます。
ただしツールによって精度が異なり、無料版ではチェックできる文字数や回数に制限があります。必要に応じて有料ツールの導入も検討するとよいでしょう。
類似ページ判定ツールを利用する
類似ページ判定ツールは、似ている可能性が高いページを抽出できるツールです。
判定したいページのURLを入力するだけで、似ているページや類似の程度を確認できます。
無料で利用できる代表的なツールとして「sujiko.jp」があげられます。sujiko.jpでは異なる2つのURLを入力することで、類似率の確認が可能です。
URLの後ろに「&filter=0」のパラメータを追加する
URLで検索する際に「&filter=0」のパラメータを追加するテクニックもあります。通常の検索結果では、通常類似するページが表示されないようフィルタリングが適用された内容が表示されています。
「&filter=0」はこのフィルタリングを解除するパラメータです。検索してもページが表示されていない場合は「&filter=0」のパラメータを追加して検索すると、表示されることがあります。
このような場合は、検索結果から除外されていると考えられるため、Googleから重複コンテンツ、もしくは類似するページと判断されている可能性が高くなります。
SEO対策を外注しようとお考えの方はこちら>>>【失敗しない】SEO対策を外注へ依頼する前にぜひ知ってほしい内容を徹底解説
SEO対策を外注する場合の費用相場について知りたい方はこちら>>>SEO対策を代行業者へ依頼する場合の料金の相場は?
弊社SEOサービスランクエストではどんなお客様に対しても、予算状況に応じてSEOサービスを提供ができるように、「オーダーメイド型プラン」もご用意しております。お客様の課題や状況に合わせた最適なプランをご提案いたしますので、今後SEO代行業者をお探しになられる方は、ぜひ弊社サービスの内容をご覧ください。
SEOを意識した重複コンテンツの対策方法
重複コンテンツを作成しないために意識すべきポイントは、以下のとおりです。
- URLの正規化を行う
- 301リダイレクトを設定する
- noindexを設定する
- URLパラメータを設定する
- トップレベルドメインを使う
- 類似するコンテンツを少なくする
- 不要なページを削除する
- 一次情報を掲載する
- 引用タグを使う
- 定型文の使用を避ける
- 内部リンクの一貫性を保つ
- 空のページを公開しない
- ブログやフォーラムなどのシステムを理解する
- Googleにコンテンツの存在を伝える
- Googleにコンテンツの削除を申請する
- 必要に応じてrobots.txtを申請する
- それぞれ詳しく解説していきます。
URLの正規化を行う
自サイト内の重複コンテンツに対しては、URLの正規化が必須です。
URLの正規化とは、同一内容のページが複数ある場合に、1つのURLにGoogleの評価を集約する対策です。正規化を行わないと、重複コンテンツ内でアクセス数や被リンク評価が分散してしまうため、SEOに不利になります。
canonicalタグを使って、HTML内に評価してほしいURLを一つ記述するだけで実装できるため、必ず行いましょう。
301リダイレクトを設定する
重複するコンテンツがある場合は、ページを移行させるための301リダイレクトを設定することで、問題が解決する可能性があります。訪問者が古いページに訪れても、自動的に新しいURLへと遷移するため、利便性の向上につながるでしょう。
また301リダイレクトには、旧ページからのSEO評価を引き継げるメリットもあります。複数のページで類似するコンテンツが存在する場合は、301リダイレクトで統合し、新しいURLに評価を集約させることが可能です。
ただしユーザーが求めている情報と異なるページに遷移させてしまうと、ユーザーエクスペリエンスが悪化し、離脱率の上昇につながります。301リダイレクトは正しく活用し、ユーザー体験の向上を図りましょう。
noindexを設定する
noindexを設定することで、検索エンジンに対して特定のページをインデックスしないように指示できます。noindexを設定したページは、どのようなキーワードで検索しても検索結果に表示されません。
類似コンテンツと見なされそうなページに対してnoindexを設定することで、検索エンジンから重複コンテンツと判断されるリスクを減らせます。なお、除外されたURLはGoogle Search Consoleのカバレッジから確認可能です。
URLパラメータを設定する
URLパラメータとは、URLの末尾から「?」の後に続く部分で、ページの追加情報を表すものです。パラメータは複数の商品ページをまとめたり、流入先を明らかにしたりする際に付与されます。
しかし、このパラメータつきURLが複数存在することで、Googleからコピーコンテンツと判断されるおそれがあるのです。URLパラメータ設定は、Googleに対してどのパラメータを含むURLをクロール対象とするかを伝える際に役立ちます。
なおURLパラメータツールは、旧Google Search Consoleからダッシュボードにアクセスすることで設定できましたが、現在ではサポートが終了しています。必要に応じて、canonicalタグやrobots.txtを活用しましょう。
トップレベルドメインを使う
言語別に同一コンテンツを作成する場合は、可能な限り国ごとのトップレベルドメインを使用しましょう。サブドメインやサブディレクトリよりも、トップレベルドメインで対象国を示したほうが、検索エンジンが理解しやすいためです。
たとえば、日本・イギリス・アメリカに向けた同一コンテンツを作る場合を見てみましょう。
よい例 | 悪い例 |
---|---|
https://example.jp/ https://example.uk/ https://example.us/ |
https://jp.example.com/ https://uk.example.com/ https://us.example.com/ |
このように、国ごとのトップレベルドメインを使用するがわかりやすくなります。
類似するコンテンツを少なくする
サイト内に類似コンテンツが多くならないよう、作成段階から注意することが大切です。階層表や管理表などを用いることでコンテンツの重複を防ぎ、サイト全体の構造を明確にできます。具体的には、次のような対処をします。
- 各ページの役割やターゲットを明確にする
- コンテンツマップを作成する
- 類似するテーマは一つのページにまとめる
- 関連性の高いキーワードを適切に配置する
- ユーザーの検索意図と重複していないか確認する
- コンテンツに独自の視点や情報を盛り込む
事前にサイトの階層構造を設計し、各ページの情報を適切に管理することで、迷うことなくコンテンツ制作を進められます。さらに古いコンテンツも定期的に見直し、重複していないかチェックすることで、万全の体制が整うでしょう。
不要なページを削除する
不要なページを削除することで、サイト全体の構造がシンプルになり、ユーザーが迷わず目的のページにたどり着けるようになります。また検索エンジンにとっても、サイトの構造が明確になるため、評価の向上につながりやすいメリットがあります。
不要なページは、次の要素を踏まえてチェックしてください。
- ほかのコンテンツとの関連
- 検索エンジンの評価
- ユーザーの検索意図
また、削除する前にほかのページと統合できるかや、情報の整理によって改善できるか検討することが大切です。
一次情報を掲載する
一次情報とは、コンテンツ作成者の体験から得たオリジナルの情報を指します。
たとえば、自ら行った実験や検証、調査、考察の結果などが該当します。一次情報は、自身の経験に基づいて発信する情報であるため、他サイトには掲載されていません。
そのため、重複コンテンツの判定を受ける可能性は限りなく低く、有益なコンテンツとしても評価されやすいです。SEOを行う上での基本でもあるため、意識して掲載しましょう。
引用タグを使う
引用タグとは、サイト内に掲載している情報が他サイトからの引用である旨を、Googleに伝えるHTMLタグです。
正確にはblockquote(ブロッククォート)タグという名称です。
下記のように、他サイトから参照したテキストや画像を、引用元の情報と共にタグで囲めば、検索エンジンに情報が引用であることを伝えられます。
<blockquote> <p>ここに他サイトの情報をそのまま記載</p> <p>引用:<a href=”引用元サイトのURL”>引用元のサイト名</a></p> </blockquote> |
コンテンツ作成には、一次情報の掲載が望ましいですが、権威のある機関などの情報を補足として記載したほうが説得力が増す場合もあります。
たとえば、SEOに関する記事であれば、ルールを定めているGoogleが発信している情報が最も信頼できます。自身の見解と引用を組み合わせれば、より品質の高いコンテンツにできるため、有効活用しましょう。
定型文の使用を避ける
定型文の使用はできるだけ避けましょう。
導入文やコンバージョンエリアをテンプレート化しているケースはよく見られますが、ページが増える度に重複率も上がっていきます。
どうしても必要な場合は、各ページに記載するのは最低限の要約文に抑え、共通のページにリンクするなどの工夫で解消できます。
内部リンクの一貫性を保つ
内部リンクを分かりやすく整理することにより、重複コンテンツの防止につながります。内部リンクを整理するためには、パーマリンクに一貫性を持たせることが大切です。
パーマリンクを設定する際は、下記のポイントを意識するとよいでしょう。
- サイト全体で一貫性のある設定方法にする
- 階層構造を明確にする
- 特殊文字やスペースを避ける
- できる限り短く覚えやすい文字列にする
パーマリンクを設定する際は、ページの内容を反映したキーワードを含めるのがおすすめです。ページ内容とキーワードが関連付けられることで、検索エンジンやユーザーの理解を助けます。設定する文字列には規則性を持たせ、サイト全体で統一することを心がけましょう。
空のページを公開しない
空のページは内容が薄く、ユーザーの利便性を損なうと判断されます。そのため空のページは公開せず、作成途中のコンテンツは非公開設定にしておきましょう。
空ページや内容の薄いページがある場合は削除するか、noindexタグを用いてインデックスされないようにしてください。そうすることで、Googleは有益な情報が含まれるページを集中してクロール(探索)できるようになり、サイト全体の品質が改善されます。
ブログやフォーラムなどのシステムを理解する
ブログやフォーラムなどのCMS(コンテンツ管理システム)の仕組みを理解しておくと、重複コンテンツの発生原因を特定し、対策を立てやすくなります。
多くのCMSでは、自動的にURLが生成される仕組みが採用されています。この際、類似するURLが生成される可能性が高いです。また、カテゴリーやタグの構造を見直し、重複するコンテンツを減らす工夫も必要でしょう。
CMSの仕組みを理解しておくことで、同じテーマの投稿が増えてきた際も対処しやすくなります。パーマリンクやカテゴリー、タグなどのCMSの設定を見直し、重複コンテンツの防止を図りましょう。
Googleにコンテンツの存在を伝える
Googleサーチコンソールを使用して、インデックスを希望するURLをGoogleに伝えられます。自サイト内の重複コンテンツがある場合は、事前に申請しておきましょう。
また、万が一重複コンテンツがインデックスされてしまった場合は、URL削除ツールを使えば削除できます。
Googleにコンテンツの削除を申請する
Webサイトからページを削除しても、Google検索で表示されてしまうことがあります。Googleの検索結果から速やかにページを削除したい場合は、削除ツールを使って申請を行ってください。
削除ツールを使えば1日程度で反映されますが、リクエストが有効な期間は約6ヶ月間です。ページ自体を削除していない場合はnoindexタグを設定するか、パスワードで保護する必要があります。詳しくはGoogleヘルプの「Google 検索からウェブ検索結果を削除する」を参照してください。
必要に応じてrobots.txtを設定する
robots.txtは、検索エンジンのクローラーを制御するためのテキストファイルです。クローラーをブロックすることで、特定のページがインデックスされるのを防ぎます。適切に設定することでクロールの最適化につながり、重要なページが優先的に巡回されるようになります。
ただし、すでにインデックス済みのページを削除させたい場合は、robots.txtを設定しないよう注意しましょう。robots.txtが設定されているとクローラーがページを巡回できないため、noindexタグを見つけられなくなります。
またrobots.txtを過度に使用すると、意図せず重要なページがインデックスされなくなる可能性もあります。必要なページにのみ設定し、記述に誤りがないよう注意してください。
重複コンテンツチェックにおすすめなSEOツール
コンテンツを作成したら、重複コンテンツに該当しないかの確認が大切です。チェックに便利な3つのツールを紹介していきます。
- Googleサーチコンソール
- CopyContentDetector
- sujiko.jp
Googleサーチコンソール
GoogleサーチコンソールはGoogleが無料で提供しているアクセス解析ツールです。以下の手順で、簡単に重を複チェックできます。
- 左側のメニューから「セキュリティと手動による対策」をクリック
- 「手動による対策」をクリック
「問題が検出されませんでした」と表示されれば、重複コンテンツの心配はありません。
万が一警告などが表示されていれば、表示内容を参考に改善を進めましょう。
CopyContentDetector
CopyContentDetectorは、テキストの重複率を調査できるツールです。以下の手順で、既存のWebページとの重複度を割合(%)で表示してくれます。
- 調査したいテキストを貼り付け
- 「規約に同意してコピペチェックをする」をクリック
数値が高くなればなるほど、重複コンテンツと判定される可能性が高くなるため、ページの公開前に一度使用することをおすすめします。
sujiko.jp
sujiko.jpは、指定したコンテンツとの重複率を判定できるツールです。
- 自社のページURL
- 比較したいページのURL
これら入力して、「判定」をクリックするだけで調査を行ってくれます。公開したページにしか使えませんが、テキストだけでなくHTMLの類似度まで調査してくれる便利なツールです。
まとめ:重複コンテンツを避けてSEOで上位表示を目指そう
重複コンテンツがあると、評価の分散や順位の低下などSEOに悪影響を与えてしまいます。特に外部サイトとの重複コンテンツは、ペナルティの対象であり、著作権を侵害する恐れもあるため、注意が必要です。
一次情報を盛り込み、URLの正規化や引用タグの使用など、適切な設定を行いながら、有益な情報を発信し、上位表示を目指しましょう。
SEO対策を外注する際の注意点について知りたい方は、以下の記事をご覧ください。
SEO対策を外注する前に、注意すべきポイントや外注先の選び方について詳しく解説しています。
外注先を探している、既にSEO対策を外注しているが効果が出ないとお悩みの方必見です。
SEO対策を外注しようとお考えの方はこちら>>>【失敗しない】SEO対策を外注へ依頼する前にぜひ知ってほしい内容を徹底解説
SEO対策を外注する場合の費用相場について知りたい方はこちら>>>SEO対策を代行業者へ依頼する場合の料金の相場は?
弊社SEOサービスランクエストではどんなお客様に対しても、予算状況に応じてSEOサービスを提供ができるように、「オーダーメイド型プラン」もご用意しております。お客様の課題や状況に合わせた最適なプランをご提案いたしますので、今後SEO代行業者をお探しになられる方は、ぜひ弊社サービスの内容をご覧ください。