こんな疑問にお答えします
本記事の内容
- Googleサーチコンソール「ページのインデックス登録」とは
- Googleサーチコンソール「ページのインデックス登録」には2つのステータスがある
- 各ステータスでエラーが起きた時の対処法について
本記事の執筆者
Googleサーチコンソールの「ページのインデックス登録」は、自分のブログがGoogleにインデックスされているか(Googleの検索結果に表示されるか)を確認できる機能です。
もし「未登録」が多い場合、以下のような理由が考えられます。
- Googleに無視されている
- 間違った設定をしている
- 記事の質が低い
Googleからのアクセスは重要です。
そのため、Googleと良い関係を築くことが必要です。
Googleサーチコンソールの「ページのインデックス登録」機能を利用すると、その関係を築く方法を学べます。
指示に従って修正することが大切です。
しかし、Googleサーチコンソールの説明が分かりにくいこともあります。
この記事では、説明を分かりやすくし、解決策を提案します。
特に以下の方々にはぜひ読んでいただきたい記事です。
- Googleからのアクセス数を増やしたい方
- Googleのインデックス数を増やしたい方
- Googleサーチコンソール「ページのインデックス登録」の使い方が分からない方
- Googleサーチコンソール「ページのインデックス登録」でエラーが発生している方
- エラーの解決方法が分からない方
エラーで困っている方は、この記事を最後まで読み、改善できる箇所に早急に対応しましょう。
目 次
- 1 Googleサーチコンソール「ページのインデックス登録」とは
- 2 ページがインデックスに登録されない理由
- 2.1 サーバーエラー(5xx)
- 2.2 リダイレクト エラー
- 2.3 noindex タグによって除外されました
- 2.4 見つかりませんでした(404)
- 2.5 ソフト 404
- 2.6 URLがrobots.txtによってブロックされています
- 2.7 アクセス禁止(403)が原因でブロックされました
- 2.8 他の4xxの問題が原因で、URLがブロックされました
- 2.9 robots.txt によりブロックされましたが、インデックスに登録しました
- 2.10 コンテンツのない状態でページがインデックスに登録されています
- 2.11 代替ページ(適切な canonical タグあり)
- 2.12 クロール済み - インデックス未登録
- 2.13 ページにリダイレクトがあります
- 2.14 検出 - インデックス未登録
- 2.15 重複しています。送信されたURLが正規URLとして選択されていません
- 2.16 重複しています。ユーザーにより、正規ページとして選択されていません
- 2.17 重複しています。Google により、ユーザーがマークしたページとは異なるページが正規ページとして選択されました
- 2.18 未承認のリクエスト(401)が原因でブロックされました
- 2.19 ページ削除ツールによりブロックされました
- 3 まとめ:Googleサーチコンソール「ページのインデックス登録」について学ぼう
Googleサーチコンソール「ページのインデックス登録」とは
Googleサーチコンソールの「ページのインデックス登録」機能は、ブログがGoogleに登録されているかを確認ができます。
ブログがGoogleによってインデックスされていなければ、Googleの検索結果に現れません。
SEOを始める前に、この登録状況をチェックしましょう。
ステータスには「未登録」と「登録済み」の2種類があります。
理想は全ページが「登録済み」状態です。
しかし、ページ数が増えれば「未登録」のページも出てきます。
この機能は「未登録」の理由を示し、問題解決に役立ちます。
ページがインデックスに登録されない理由
インデックス登録されなかった際に、Googleサーチコンソールの中で出てくる「理由」は以下の通りです。
- サーバーエラー(5xx)
- リダイレクト エラー
- URL が robots.txt によってブロックされています。
- noindex タグによって除外されました
- 見つかりませんでした(404)
- ソフト 404
- URLがrobots.txtによってブロックされています
- アクセス禁止(403)が原因でブロックされました
- 他の4xxの問題が原因で、URLがブロックされました
- robots.txt によりブロックされましたが、インデックスに登録しました
- コンテンツのない状態でページがインデックスに登録されています
- 代替ページ(適切な canonical タグあり)
- クロール済み - インデックス未登録
- ページにリダイレクトがあります
- 検出 - インデックス未登録
- 重複しています。送信されたURLが正規URLとして選択されていません
- 重複していますが、ユーザーが正規ページとして選択していません
- 重複しています。Google により、ユーザーがマークしたページとは異なるページが正規ページとして選択されました
- 未承認のリクエスト(401)が原因でブロックされました
- ページ削除ツールによりブロックされました
それぞれのエラーが起きる要因と解決案を解説していきます。
サーバーエラー(5xx)
ページをリクエストした時に、サーバーから5XX(例:501)のエラーが返されることを意味します。
つまりGoogleがページをインデックスしようとした際に、URLにアクセスできなかったことを示しています。
このエラーが発生する原因としては以下のようなものがあります。
- プログラムにエラーが発生している場合
- サーバーが過負荷になっている場合
- ページが正しく開けない場合
これからのエラーが発生した場合の解決策は以下の通りです。
解決案1
あなたのブログ内でキーワード検索をした際に表示されるページのことを動的ページと呼びます。
つまり、プログラムによって生成されたページのことを言います。
動的ページを生成するプログラムが複雑になると、応答に時間がかかってしまい、タイムアウトの原因になることがあります。
この問題を避けるためには、パラメータのリストを短くし、使用する数を少なくすることで解決できます。
ぜひ試してみてください。
解決案2
- サーバーが停止していないか
- 何らかの理由で負荷が生じて、サーバーが重くなっていないか
- サーバーの構成ミスが起きていないか
もしレンタルサーバーを利用している場合は、上記の3つの問題が発生していないか、サーバー会社に問い合わせてみてください。
それでも問題が解決しない場合は、僕がおすすめする別のレンタルサーバーに乗り換えることを検討してみてください。
レンタルサーバーを乗り換える場合には、WordPressが使えるレンタルサーバー5社を比較【2024年保存版】を参考にしてみてください。
-
WordPressが使えるレンタルサーバー5社を比較【2024年保存版】
解決案3
実際にはGoogleにインデックスされたいのに、ファイアウォールやDoS対策保護システムの設定ミスなどによるシステムレベルの問題が原因で、クローラーがブロックされてしまうケースがあります。
どの段階でブロックが行われているのかを調査し、クローラーのブロックを解除しましょう。
リダイレクト エラー
リダイレクトエラーが発生する原因として、Googleは以下のように述べています。
リダイレクト チェーンが長すぎる
リダイレクト ループが発生している
リダイレクト URL が最終的に URL の最大長を超えた
リダイレクト チェーンに不正または空の URL がある引用元:ページ インデックス登録レポート
Lighthouseのようなデバッグツールを使い、リダイレクトに関する情報を入手してください。
Lighthouseの導入に関しては、以下のページから確認できます。
解決案
Googleが述べている原因が該当しないか確認し、原因が見つかり次第、それぞれの修正を行う。
noindex タグによって除外されました
noindexとは、ブログ内の一部のページをGoogleにインデックスされたくない場合に使う手法です。
検索エンジンのクローラー全般に対してインデックスを拒否する場合には
<meta name="robots" content="noindex">
というタグを使用します。
一方、Googleのクローラーのみに対してインデックスを拒否する場合には
<meta name="googlebot" content="noindex">
というタグを使用します。
これらのタグをページ内に入れることで、そのページはインデックスされなくなります。
そのため、sitemap.xmlの中にnoindexの設定がされているURLが含まれている場合、エラーが発生します。
確認方法
- 表内のURLの横にある虫眼鏡のアイコンをクリックします。
- [カバレッジ] > [インデックス登録を許可?] で、レポートに noindex がインデックス登録を妨げていることが記載されています。
解決案:sitemap.xmlの見直し
Gsitemap.xmlにnoindexが設定してあるページが含まれていたら削除するか、noindexが設定されているのをインデックスの許可(タグの削除)で解決できます。
見つかりませんでした(404)
あなたが送ったURLの中に、指定したページが存在しないというエラーが発生したことを意味します。
Googleによると、
ほとんどの 404 エラーは修正しなくても問題はありません。404 エラーはサイトのインデックス登録やランキングに影響を及ぼすことはないためです。
つまり、エラーが発生してもSEOには大きな影響はないとされています。
まだクローリングしてほしいページがあるにも関わらずエラー画面に出くわしてしまい、Googleのクローラーが作業を停止し、別のウェブサイトに移動してしまう可能性があるので、できるだけエラーが発生しないようにするといいでしょう。
解決策としては、以下の方法を考えてみてください。
解決案
- 該当ページを復活させる
- 該当ページが移動している場合は、新しいページへの3XXリダイレクト(例:301リダイレクト)を設定する。
- 送信したsitemap.xmlに誤りがある場合は、該当URLを削除する
これらの対策を行うことで、404エラーを解消し、問題を解決できます。
ソフト 404
送信されたURLには、インデックスする必要のないページとしてGoogleによってソフト404エラーとして判定されました。
通常の404エラーとソフト404エラーとでは、ページの存在しない点は同じですが、返されるステータスコードに違いがあります。
ページの存在 | ステータスコード | |
ソフト404エラー | 存在しない | 200など |
404エラー | 存在しない | 400 |
この問題が生じる原因として、
- プログラム上のミス。本来ステータスコード404を返すべきところで、200を返してしまっているケース
- サーバーソフトの設定ミス
- .htaccessファイルの記述ミス
などが考えられます。
解決案
該当ページをGoogleサーチコンソールで該当ページを見つけ、上記のような原因でミスがないかの確認し対応する。
URLがrobots.txtによってブロックされています
URLがrobots.txtファイルによってクローラーのアクセスをブロックされている時、この問題が発生します。
robots.txtは、ブログ内でクローラーがアクセスしてもよいURLを指示するためのファイルです。
クローラーはこれらの指示に従う必要がありますが、その実際の従順さはクローラーによって異なります。
Googleのクローラーはrobots.txtの指示に従いますが、他の検索エンジンのクローラーはその指示に必ずしも従わないことがあります。
確実にクローラーに従わせたい場合は、noindexの設定を行うことが有効です。
解決案
- もし送信したsitemap.xmlファイルが間違っている場合は、該当するURLを削除する
- もしrobots.txtファイルが間違っている場合は修正する
アクセス禁止(403)が原因でブロックされました
あなたが送ったURLの中に、以下のようなページがあるかもしれません。
- 会員登録の手続きやログインが必要なページ
- IP制限がかかっているページ
このようなページが存在し、ログインができなかった時に返されるエラーが403エラーなのです。
解決案
- ログインなしでも閲覧できるようにする
- IP制限の解除する
- 送信したsitemap.xmlに誤りがある場合は、該当するURLを削除する
これらの方法を試してみてください。
他の4xxの問題が原因で、URLがブロックされました
これまでに紹介したエラーとは異なり、エラーが発生した時に表示されるエラーです。
「URL検査ツール」で対象のURLを調べ、状況を詳しく確認しましょう。
確認後、必要に応じて修正を行いましょう。
これまでは「エラー」のカバレッジについて説明しました。
次に、2番目のステータスである「有効(警告あり)」に進みます。
robots.txt によりブロックされましたが、インデックスに登録しました
この警告は、robots.txtでブロックする指示を出していたにもかかわらず、クローラーによってインデックスに登録された場合に表示されます。
前述したように、robots.txtの指示に従うクローラーと従わないクローラーが存在することを説明しました。
Googleのクローラーは基本的に指示に従うクローラーですが、なぜインデックスされてしまうのか?
その理由は、ブロックされていない他のページからのリンク経由でクロールされてしまうため、その結果、インデックスに登録されてしまうからです。
解決案
- クローリングを避けたい場合は、noindexの設定を行う
- インデックス登録に問題がなければ、該当URLをrobots.txtから削除する
コンテンツのない状態でページがインデックスに登録されています
この警告が表示されるのは、該当ページがGoogleのインデックスに登録されているが、何らかの理由でコンテンツが読み取れない場合です。
Googleがインデックスできない形式になっている可能性があります。
解決案
- コンテンツを元に戻す
- もしコンテンツを元に戻すことができない場合は、404エラーを返す
次は3つ目のステータスの「除外」の説明になります。
代替ページ(適切な canonical タグあり)
重複しているページが存在するが、canonical タグが設定されているため、どのページを優先すべきかはGoogle側で認識されている。
これは、運営者の意図した設定通りになっていることを意味しています。
したがって、修正を行う必要はありません。
クロール済み - インデックス未登録
Googleはブログをクローリングはしているが、まだそのページをインデックスされていない状態を示しています。
その気持ちはよくわかります。
僕もも苦労して作成したページが「クロール済み - インデックス未登録」と表示されたときは、Googleの意図が分からず、少々腹立たしさを感じます。
この現象の原因は明確ではありませんが、1つの大事な理由が存在するようです。
コンテンツ(記事)の品質が低いからかもしれません。
Googleのジョン・ミューラー氏は、様々な理由が考えられるし、具体的なサイトを見ない限りは断定できないと述べているが、次のことを言及しています。
サイトマップで送信したページでも、そのページへの内部リンクが存在しない場合、それほど重要なコンテンツとは見なされず、インデックスされないことがあります。
解決案
ページにリダイレクトがあります
URLにリダイレクト処理が行われているため、インデックスに登録されなかったことを意味しています。
解決案
- 特に問題がなければ、このままで大丈夫です
- リダイレクト処理を解除し、元のURLにページを戻す
検出 - インデックス未登録
このページはGoogleによって、sitemap.xmlやフィードで検出されましたが、まだクロールされていないステータスです。
GoogleのJohn Mueller(ジョン・ミューラー)氏が「検出 - インデックス未登録」について語っている動画です。
彼が挙げる原因は以下の4つです。
- ウェブサイトが予想以上に負荷がかかるため、クロールを中止した
- 内部リンクが存在せず、孤立したページになっているから
- 低品質なコンテンツと見なされた可能性があるから
- 重複コンテンツと判断されたから
解決案
- サイトを軽量化する(画像の最適化、不要なCSSやJavaScriptの削除、プラグインの削減)
- サーバーの高速化(上位プランに移行するか、別のレンタルサーバーに移行する)
- 内部リンク(可能なら外部リンクも)を追加する(ただし、無意味なリンクはユーザーを混乱させる可能性があるため注意が必要)
- 記事の品質を改善する(記事構成からの見直し)
- 重複コンテンツが存在する場合は、canonicalタグを使う
-
ブログの記事構成を作り方【記事の良し悪しは構成で決まる】
重複しています。送信されたURLが正規URLとして選択されていません
このメッセージは、あなたのウェブサイト内に似たページが複数存在しており、「重複ページ」と見なされています。
例えば、同じページでも、異なるURLとして扱われることがあります。
例1:同じトップページですが、パラメータが付与されたことで異なるURLとして扱われてしまう
https://naoyamablog.net/
https://naoyamablog.net/?p=abc
例2:httpsとhttpが存在し、異なるURLとして扱われてしまう
https://naoyamablog.net/
http://naoyamablog.net/
ユーザーにとって価値のあるページを正規ページとして選択できますが、コンテンツが全く同じ場合、Googleはどちらを正規ページにすべきか判断できないことがあります。
そのような場合に表示されるのが、「重複しています。送信されたURLが正規URLとして選択されていません」というメッセージなのです。
重複しています。ユーザーにより、正規ページとして選択されていません
こちらの場合も、「重複していますが、送信されたURLが正規URLとして選択されていません」と同様の状況です。
ただし、こちらでは運営者がGoogleに正規ページとして伝えていないことを意味しています。
重複しています。Google により、ユーザーがマークしたページとは異なるページが正規ページとして選択されました
正規ページがGoogleとウェブサイトの運営者で異なる場合に、この問題が発生します。
未承認のリクエスト(401)が原因でブロックされました
401エラーは、クローラーによるブログへのアクセスが、何らかの原因でブロックされている状態のときに表示されます。
よくあるケースとしましては、関係者だけが閲覧できるようにするために、ベーシック認証のような認証機能をページに設けられてしまったことにより、クローラーがページを巡回できずに、このような原因報告をしている可能性が高いです。
解決案
- 認証機能を無効にする
- 参照元のリンク設定が間違っている場合には、リンクを正しく修正する
ページ削除ツールによりブロックされました
「ページ削除ツールによりブロックされました」のエラーは、Googleの「URL削除リクエスト」という機能を使われてた場合に表示されるエラーです。
まずは、どんなリクエストが送信されているのか、Googleの「削除リクエストの履歴を確認する」の手順に従って、確認しましょう。
もし誤った削除申請であれば、キャンセルの手続きを行いましょう。
まとめ:Googleサーチコンソール「ページのインデックス登録」について学ぼう
本記事を簡単にまとめると…
本記事のまとめ
Googleサーチコンソール「カバレッジ」とは
自分のブログがGoogleにインデックスされているか(Googleの検索結果に表示されるか)を確認できる機能。
ページがインデックスに登録されない理由
- サーバーエラー(5xx)
- リダイレクト エラー
- URL が robots.txt によってブロックされています。
- noindex タグによって除外されました
- 見つかりませんでした(404)
- ソフト 404
- URLがrobots.txtによってブロックされています
- アクセス禁止(403)が原因でブロックされました
- 他の4xxの問題が原因で、URLがブロックされました
- robots.txt によりブロックされましたが、インデックスに登録しました
- コンテンツのない状態でページがインデックスに登録されています
- 代替ページ(適切な canonical タグあり)
- クロール済み - インデックス未登録
- ページにリダイレクトがあります
- 検出 - インデックス未登録
- 重複しています。送信されたURLが正規URLとして選択されていません
- 重複していますが、ユーザーが正規ページとして選択していません
- 重複しています。Google により、ユーザーがマークしたページとは異なるページが正規ページとして選択されました
- 未承認のリクエスト(401)が原因でブロックされました
- ページ削除ツールによりブロックされました
Googleサーチコンソールの「ページのインデックス登録」は、あなたのブログがインデックスされているかどうかを、Googleから教えてくれるありがたい機能です。
ブログのページ数が増えると、エラーが発生しやすくなるので、定期的にチェックして修正できる部分は積極的に修正しましょう。
Googleサーチコンソールについてもっと詳しく学びたい方は、以下の記事もぜひチェックしてみてください。
Googleサーチコンソールに関する記事