Googleにインデックスされず、その理由が分からないとお悩みではありませんか?
そこで今回は、Googleからインデックスされない原因と対処法を解説します。
スムーズにインデックス登録を促す方法もお伝えしていますので、SEO担当者の方はぜひ参考にしてください。
目次
Googleにおけるクロールとインデックスの仕組み
Googleにインデックスされない原因を解説する前に、検索エンジンの仕組みを理解しましょう。
Webページが検索結果に反映されるまでには、クロールとインデックスの2つの工程を踏む必要があります。ここからは、Googleにおけるクロールとインデックスの仕組みを解説します。
クロールとは
検索エンジンは、クローラーというロボットを活用して、世界中で公開されているWebページの情報を収集(クロール)します。
新しいページが追加されたときはもちろん、既存のコンテンツが更新された際も随時、実施されます。なお、クローラーはWebページ上のリンクを辿って巡回しているため、どこからもリンクがつながっていないページには訪れません。
そのため、Webページを見つけられるようにリクエストを送信したり、クロールしやすい状態に整えたりする必要があります。
関連記事:クローラー(Crawler)とは?上位化のための対策を紹介
インデックスとは
インデックスは、クローラーが収集した情報を分析してGoogleのデータベースに登録する行為です。
インデックスに登録されたページは、ユーザーが検索した際に提供するためのデータとして扱われます。キーワードに合致した情報があれば、検索エンジンが自動的に判断して検索結果に表示します。
なお、Webページがインデックスされなければ、どのようなキーワードで検索されても検索結果に反映されません。そのため、内部リンクを充実させたりパンくずリストを設定したりして、クローラーが巡回しやすいようにサイトを構築する必要があります。
関連記事:Googleインデックス登録とは?登録方法やリクエスト方法を徹底解説
インデックスの確認方法
自社サイトのインデックス状況は、以下の方法で状態を確認しましょう。
- 検索窓に「site:」を入力する
- Googleサーチコンソールを活用する
順番に解説します。
検索窓に「site:」を入力する
ツールを使用せずにインデックスの状況を調べたい場合は、Googleの検索窓に「site:調べたいページのURL」を入力しましょう。以下のように検索結果で該当ページが表示される場合は、問題なくインデックスされています。
「site:」の後にドメインを入力すれば、サイト自体がインデックスされているか調査できます。新たに作成したサイトのインデックス状況を知りたい場合は、活用するとよいでしょう。
なお、検索結果に「一致する情報が見つかりませんでした」と表示される場合は、インデックスされていない可能性が高いです。
Googleサーチコンソールを活用する
正確なインデックス状況を知りたい場合は、Googleサーチコンソールが有効です。確認したいページのURLを画面上部の検索窓に入力すると、現在の状況が表示されます。
「URLはGoogleに登録されています」と表示されたら、インデックスされているサインです。
一方「URLがGoogleに登録されていません」と出た場合は、インデックスされていません。画面中央に登録されない理由が記載されるので、確認しましょう。
なおインデックス未登録の場合、「クロール済–インデックス未登録」や「検出–インデックス未登録」と表示される場合があります。
どちらもインデックスに至っていないことに変わりはありませんが、具体的にどう対策をとればよいかわからない方もいるでしょう。
次の項目でそれぞれの違いを解説します。
関連記事:Googleサーチコンソールの機能や使い方をやさしく解説【2023年版】
インデックス未登録の「クロール済」と「検出」の違い
クロール済–インデックス未登録 | クロールはされているがインデックスに登録されない |
検出–インデックス未登録 | クローラーに認識されてはいるものの、クロールが実施されていない |
「クロール済–インデックス未登録」は、クロールはされていますがインデックスに登録されていない状態を指します。
Googleからインデックスに登録する必要がないと判断された場合、このように表示されるケースが多いです。具体的には、内容が重複していたり、検索需要が低いテーマだったりするページが該当します。
そのため、インデックスに登録させるには、ユーザーに有益なページになるように、テーマの見直しやリライトを施す必要があるでしょう。
一方の「検出–インデックス未登録」は、クローラーに認識されてはいるものの、クロールが実施されていないページに対して表示されます。
この場合、コンテンツの質が悪いとは一概に言い切れません。時間が経てば、正常にクロールがおこなわれる可能性もあります。
しかし、検出の状態のままクロール状況が改善されない場合は、何らかの対策を講じる必要があるでしょう。
Googleにインデックスされない原因
Googleにインデックスされない原因は、主に以下の10個です。
- 新規ドメインを使用している
- Googleのガイドライン違反によるペナルティを受けている
- コンテンツの品質が低い
- サイト内のリンク構造に問題がある
- Webサーバーに不具合が起きている
- robots.txtを設定している
- canonicalタグの記述でURLの指定に誤りがある
- noindex設定がされている
- 外部サイトからの流入や被リンクが少ない
- 類似ページと判断されている
インデックスされない場合は、上記のいずれかに該当している可能性があります。当てはまる項目がないか確認しましょう。
新規ドメインを使用している
新しく立ち上げたばかりのサイトを、Googleが見つけられていない可能性があります。新規ドメインの場合、Googleがサイトを認知するのに一定の期間を要するためです。
ただサイトを作成し、自然にクローラーがくるのを待つだけでは時間がかかります。そのため新規サイトは、クローラーに訪れてもらうためのアクションが必要です。
後に紹介する方法で、インデックスのリクエストを送信しましょう。
ペナルティを受けている
Googleガイドラインで定められている以下の項目に抵触した場合、ペナルティの対象となります。
- コンテンツの自動生成
- リンク プログラムへの参加
- オリジナルのコンテンツがほとんどまたはまったく存在しないページの作成
- クローキング
- 不正なリダイレクト
- 隠しテキストや隠しリンク
- 誘導ページ
- コンテンツの無断複製
- 十分な付加価値のないアフィリエイト
- サイト
- ページへのコンテンツに関係のないキーワードの詰め込み
- フィッシングや、ウイルス、トロイの木馬、その他のマルウェアのインストールといった悪意のある動作を伴うページの作成
- リッチ スニペット マークアップの悪用
- Google への自動化されたクエリの送信
また、中古ドメインの場合、前のサイトがペナルティを受けていた可能性もあります。Googleからペナルティの通知が来ていないか確認してみてください。
万が一、ペナルティを受けた場合は該当の項目を改善し、サーチコンソールで再審査リクエストを送信しましょう。
コンテンツの品質が低い
品質の低いサイトはクロールの頻度が低下する傾向があります。
たとえば正確性に欠ける情報を扱っていたり、ガイドラインに違反するようなコンテンツがあったりすると、サイトの評価が下がります。
その結果、インデックスされにくくなるのです。したがって、コンテンツひとつひとつの品質を高めていく必要があります。
関連記事:低品質コンテンツとは?SEOへの影響や対処法を解説
サイト内のリンク構造に問題がある
サイト内に内部リンクや被リンクが少ないと、クローラーにページを見つけてもらえず、インデックスされにくくなります。
クローラーはリンクを伝って移動するため、まずは内部リンクを充実させることが大切です。また、被リンクを獲得できるよう外部対策を行い、他サイトやSNSから流入を増やす施策も有効です。
リンク経由でクローラーが巡回しやすくなるよう、サイト改善を図りましょう。
関連記事:SEOに強いディレクトリ構造とは?設計のポイントや最適化のメリットを解説
Webサーバーに不具合が起きている
Webサーバーのエラーによって、サイトが閲覧できない状態になると、クローラーが巡回できません。
たとえばサーバーに負荷がかかり、500エラーが発生した場合は、長期間アクセスできなくなる恐れがあります。SEOへの悪影響を防ぐため、一時的なアクセス停止になった場合は、503エラーのHTTPステータスコードを返しましょう。
また、サーバーの状態を定期的にチェックすることでエラーを予防できます。
robots.txtを設定している
robots.txtがサイト内のルートディレクトリに配置されていると、クロールされなくなります。
robots.txtとは、クローラーをブロックするためのファイルです。インデックスされたいページに誤って設定されている場合は、更新したファイルをサーバーにアップロードする必要があります。
関連記事:robots.txtとは?機能や目的・活用方法を解説
canonicalタグの記述でURLの指定に誤りがある
重複コンテンツの解消に役立つcanonicalタグですが、URLの指定に誤りがあるとインデックスの不具合が生じます。
canonicalタグの正規化を行う場合は、URLに間違いがないかよく確認しましょう。
関連記事:カノニカルタグとは?設定が必要なケースや注意点を解説
noindex設定がされている
noindexとは、指定したページのインデックスをブロックするメタタグです。検索エンジンに表示させないページを設定しますが、使い方によってはインデックスを妨げる原因となります。
たとえばnoindexタグを大量に付けてしまうと、クローラーが訪れる機会が減少し、インデックスされにくくなります。したがって、最低限のページにnoindexタグを設定することが重要です。
関連記事:noindexタグとは?設定する時の注意点やSEOへの影響を解説
外部サイトからの流入や被リンクが少ない
基本的に規模が大きく、流入や被リンクが多いサイトほど、クローラーが頻繁に巡回します。
そのため、外部サイトからの流入や被リンクが少ない場合は、Googleにインデックスされづらい傾向があります。この場合は、SNSや他媒体への掲載を積極的におこない、被リンクを充実させるのが効果的です。
関連記事:SEOにおける被リンクとは?獲得する5つのポイントを解説
類似ページと判断されている
Googleがページをクロールした結果、類似コンテンツだと判断された場合は、インデックスされない可能性が高いです。
ページの内容を見直して差別化することで、インデックスの促進につなげられるでしょう。
関連記事:重複コンテンツはSEO対策では避けるべき!影響や必要な対策を解説
Googleにインデックスされないときの対処法
インデックスされるためには、クローラーにサイトを訪れてもらう必要があります。クローラーの巡回を促すには、以下6つの方法が効果的です。
- XMLサイトマップを活用する
- URL検査ツールを使う
- クローラビリティの向上
- Webサイトの質を高める
- パーマリンクを再設定する
- YouTubeの概要欄にURLを記載する
それぞれ詳しく解説していきます。
XMLサイトマップを活用する
XMLサイトマップを活用することで、検索エンジンにWebサイトの構造を伝えられます。
サイト内のページ数が多かったり、内部リンクが不十分だったりすると、クローラーがサイト内を上手く巡回できません。XMLマップを設置するとクローラーが迷うことなく、サイト内を巡回できます。
関連記事:XMLサイトマップとは?必要性やGoogleへの送信方法を紹介
URL検査ツールを使う
立ち上げたばかりのサイトや、更新したばかりのページは、Googleに認識されにくい傾向があります。そのようなときはURL検査ツールを使って、Googleにクロールをリクエストしましょう。
Googleサーチコンソールにアクセスして「URL検査」の検索窓に、インデックスをリクエストしたいページのURLを入力します。
「URLがGoogleに登録されていません」と表示されるため、「インデックス登録をリクエスト」を送信しましょう。なお、「URLはGoogleに登録されています」と表示される場合は、インデックス済みなので問題ありません。
関連記事:Googleサーチコンソールとは?使い方・導入方法を解説
クローラビリティの向上
クローラビリティとは、クローラーが情報収集しやすいかの度合いを指します。
内部リンクを充実させたり、パンくずリストを設置したりして、クローラーが巡回しやすいサイト設計にすると、クローラビリティを高められます。
Webサイトの情報をスムーズに収集してくれるため、自然にインデックス登録を促せるのです。
関連記事:クローラー(Crawler)とは?上位化のための対策を紹介
Webサイトの質を高める
クローラーは、定期的に更新されているサイトやアクセスの多いサイトを、優先的に巡回する傾向があります。そのため、Webサイトの質を高めることで、クローラーが訪問しやすくなります。
コンテンツを充実させたり、情報の信頼性を担保したりして、サイト全体の評価を高めましょう。
関連記事:低品質コンテンツとは?SEOへの影響や対処法を解説
パーマリンクを再設定する
ページがGoogleにインデックスされないときは、パーマリンクを再設定することで反映される場合もあります。
WordPressでWebサイトを管理している場合は、記事編集画面からパーマリンクを変更して、インデックスの登録リクエストを送信しましょう。
なお、パーマリンクには可能な限り意味のある単語を設定してください。過度に複雑なURLは、クロールの際に問題が生じたり、必要以上に帯域幅を消費したりする状況を招きます。
関連記事:パーマリンクとは?SEOへの影響や特徴について解説
YouTubeの概要欄にURLを記載する
自社でYouTubeを運営している場合、動画の概要欄にWebページのURLを記載することで、インデックスを促す効果が期待できます。
YouTubeを活用していない企業は一から作成する手間がかかりますが、動画を配信する企業にとっては有効な方法でしょう。
Googleにインデックスされないようにする方法
すべてのページをGoogleにインデックスさせると、悪影響を及ぼす可能性もあります。
たとえば低品質なコンテンツや、ユーザーにとって価値の低いページをインデックスさせると、サイトの評価を全体的に落としかねません。検索結果に表示させたくないページがある場合、下記2つの方法でインデックスを拒否しましょう。
- robots.txtを使う
- noindexを設定する
それぞれの方法を解説します。
robots.txtを使う
robots.txtとは、クロールを制御するためのファイルです。robots.txtの設定は、下記の手順で行います。
- robots.txtのテキストファイルを作成
- ファイル内にルールを記述
- サイトのルートにrobots.txtファイルをアップロード
robots.txtファイルで指定したページには、クローラーが訪れなくなります。
関連記事:robots.txtとは?機能や目的・活用方法を解説
noindexを設定する
クローラーがページを訪れた際、noindexが設定されていると、インデックス登録が見送られます。
ただしブロックするのはインデックスのみで、クローラーの巡回を拒否するものではありません。クローラー自体を拒否したい場合は、robots.txtを利用しましょう。
関連記事:noindexタグとは?設定する時の注意点やSEOへの影響を解説
インデックスに関してよくある質問
最後に、インデックスに関してよくある質問に回答します。
Googleにインデックスされるまでにかかる時間は?
インデックスされるまでの時間は、公開から1日〜1週間程度といわれています。新規ドメインの場合だと、数週間〜数ヵ月かかるケースも珍しくありません。
なお、登録リクエストを実施した場合は、数時間〜1日でインデックスされることもあります。同じWebサイトでも、ページによって登録されるまでの時間に差があるため、焦らず待つとよいでしょう。
Googleにインデックスされなくなった原因は?
Webページがインデックスされない原因はさまざまですが、リンク構造に問題があるケースが多いです。
検索エンジンのクローラーは、Webサイトに貼られたリンクを辿って情報を収集します。そのため、サイト内外からのリンクが設置されていないページは、インデックスされづらい傾向があります。
具体的には、他のページから孤立している新規ドメインや、関連リンクを貼っていないサイト、外部対策を講じていないサイトが該当します。
Googleは以前よりインデックスの基準を厳しくしている?
Googleは、ユーザーにより質の高いコンテンツを提供するために、インデックスの基準を厳しくしています。
Web上には、膨大な数のコンテンツが次々と公開されています。広大なプラットフォームを持つGoogleといえど、インデックスのために使用できるリソースには限りがあります。
そのため基準を厳しく設定し、質の低い情報はインデックスしないようにしています。
サブドメインがGoogleにインデックスされない原因は?
サブドメインがインデックスされないのは、クローラーが訪れていないか、巡回のペースが遅いことが原因として挙げられます。
サブドメインは、メインサイトとは別のものとして扱われます。評価も一切引き継がれません。そのため、インデックスまでに時間を要する傾向があります。
関連記事:サブドメインとは?サブディレクトリとの違いや作り方を解説
まとめ:Googleにインデックスされやすいサイト構造にしよう
クローラーがスムーズに巡回できる構造にすることで、インデックス登録が促進されます。
また、ユーザーの検索意図を読み取り、クエリと関連性が高い良質なコンテンツ制作を心がけることもポイントです。必要なときはクロールをリクエストし、根本的なサイト改善と合わせて実施していきましょう。
【関連記事】
【失敗しない】SEO対策を外注へ依頼する前にぜひ知ってほしい内容を徹底解説
SEO対策を代行業者へ依頼する場合の料金の相場は?
弊社SEOサービスランクエストではどんなお客様に対しても、予算状況に応じてSEOサービスを提供ができるように、「オーダーメイド型プラン」もご用意しております。お客様の課題や状況に合わせた最適なプランをご提案いたしますので、今後SEO代行業者をお探しになられる方は、ぜひ弊社サービスの内容をご覧ください。