ブログ

Googleサーチコンソールで重複コンテンツ問題を解決せよ!【ブログ運営者必読】

2021年10月12日

Googleサーチコンソール「重複コンテンツ」
悩んでいる人
重複コンテンツはなぜいけないのでしょうか?

 

こんな疑問にお答えします

 

本記事の内容

  • 重複コンテンツとは
  • なぜ重複コンテンツは悪なのか
  • 重複コンテンツは検索結果に影響があるのか?
  • 重複コンテンツの調べ方
  • 重複コンテンツが見つかった時の対応方法
  • 他サイトで自分の同じコンテンツが見つかった場合の対処法

 

本記事の執筆者

NaoYamaBlogの運営者「なおやま」の紹介

なおやま(@naoyama_san

 

重複コンテンツは、Webサイトが誕生して以来の問題です。

 

人の作った内容をそのまま転用したり、似た記事をたくさん作ることがあります。

 

この問題が続けば、検索エンジンの検索結果には同じ内容ばかりが表示し、ユーザーが困ることになります。

 

Googleは、このような問題が起こるのを防ぐために、検索の品質を高めることに努力しています。

 

この記事では、Googleが重複コンテンツをどう捉えているかを詳しく説明します。

 

特に以下の方々には読んでいただきたい記事です。

  • Googleの重複コンテンツの定義について知りたい方
  • 重複コンテンツとSEOの関係性について知りたい方
  • 自分のブログに重複コンテンツがあると自覚している方

 

もしあなたのブログに重複コンテンツがあるかもしれないと思っている方は、ぜひ最後まで読んでください。

 

 

Googleが考える重複コンテンツとは?

Googleが考える重複コンテンツとは?

おそらく、この記事を読んでいる方が気になるであろう、以下についてまず解説していきます。

  • Googleが言う重複コンテンツとは何か?
  • 重複コンテンツはどんな問題を引き起こすかのか?
  • 重複コンテンツは検索結果に影響があるのか?
  • 重複コンテンツの調べ方
  • 重複コンテンツが見つかった時の対応方法

 

Googleの検索順位に悪影響を及ぼす可能性があるため、この重要な内容を理解しましょう。

 

Googleが言う重複コンテンツとは

一般に、重複するコンテンツとは、ドメイン内または複数ドメインにまたがって存在する、他のコンテンツと完全に同じであるか非常によく似たコンテンツのブロックを指します。

 

ブログで同じ内容を繰り返すのは避けたほうが良いです。

 

他人の記事を無断で使うのは問題外ですが、自分のブログ内での繰り返しも、Googleによって評価が下がることがあります。

 

また、新しくて価値のある情報(質の高い情報)を提供することが大切です。

 

あわせて読みたい
【ブロガー必見】質の高い記事とは【やることは4つだけ】
【ブロガー必見】質の高い記事とは【やることは4つだけ】

 

重複した内容があれば、検索結果で不利になる恐れがあるので、気をつけましょう。

 

重複コンテンツはどんな問題を引き起こすかのか?

重複コンテンツには、いくつかの問題があります。

  1. Googleが自動で正規のページを決めてしまう
  2. リンクからの評価が分散してしまう
  3. Googleのクローラーがページを巡るのに時間がかかる

 

Googleが自動で正規のページを決めてしまう

Googleが同じ内容のページがたくさんあるとき、どれを検索結果に出すか迷うことがあります。

 

悩んでいる人
全部のページを検索結果に表示させればいいのではないでしょうか?

 

しかし、それではユーザーの満足度が低下する恐れがあります。

 

例えば、「ブログ アフィリエイト」を検索して、トップ10が全部同じだったらどう思いますか?

 

そんなとき、Googleを使う意味がなくなりますよね。

 

だから、Googleは同じような内容を避けています。

 

ただ、全てを排除するわけではありません。

 

Googleはいくつかの基準で「正規ページ」を選んで、それを検索結果に表示します。

 

正規ページの選び方には2つの方法があります。

  1. Googleが自動で決める方法
  2. サイト運営者が指定する方法

 

どの URL が正規版かを Google に明示的に伝えなかった場合、Google によって正規 URL が選択されるか、またはいずれの URL も同等の重要性を持つと見なされます。

 

もし運営者が選ばなければ、意図しないページが表示されるリスクもあります。

 

リンクからの評価が分散してしまう

例えば、あなたのブログには3つの重複コンテンツ記事(A記事、B記事、C記事)があるとしましょう。

 

被リンクの評価

 

それぞれが外部のサイトからリンクをもらっていて、

A記事は1つの被リンクを受け取っており、1ポイント。
B記事は2つの被リンクを受け取っており、2ポイント。
C記事は5つの被リンクを受け取っており、5ポイント。

※説明を分かりやすくするために「ポイント」で表現しています。

 

これによりポイントがバラバラになっています。

 

しかし、B記事を正規ページとすると、A記事とC記事はGoogleの検索結果に表示されません。それにもかかわらず、被リンクのポイントは元々2ポイントだったのが、1ポイント+2ポイント+5ポイントの合計8ポイントとなります。

 

 

こうすることで、リンクの価値をひとつにまとめ、全体の評価を出すことができます。

 

その結果、ページの重要性が増し、Googleからの評価も上がり、検索結果で上位表示がされやすくなるのです。

 

Googleのクローラーがページを巡るのに時間がかかる

重複ページのクロールに要する時間を削減するため。Googlebot がサイトのポテンシャルを最大限に引き出すには、サイト内の同一ページの PC 版とモバイル版のクロールよりも、新しい(または更新された)ページのクロールに時間をかけるほうが効率的です。

 

Googleは公式見解で、重複ページよりも新しいページに時間を費やすべきだと述べています。

 

重複ページがインデックスに含まれると、Googleのクローラーが同じ情報を複数回処理する必要が生じます。

 

これは、検索エンジンの時間と力の無駄遣いにつながることがあります。

 

重複コンテンツの削除や適切な設定を行うことで、クローラーの巡回時間を節約し、ページのインデックス作業により効果的に時間を使えるようになります。

 

重複コンテンツは検索結果に影響があるのか?

重複コンテンツというのは確実に存在するものなんだ。ブログ記事の一部を引用してそのブログへリンクを張ることも当てはまる。したがって重複コンテンツが起こるとどんな時でもスパムになるというのは事実じゃない。もし重複コンテンツがすべてスパムだと決めつけてしまったら、検索品質を上げるというよりも損なってしまう結果になってしまうだろう。

 

日本のSEO第一人者である鈴木謙一氏(@suzukik)によると、GoogleのMatt Cutts(マット・カッツ)氏は、重複コンテンツによって検索結果にペナルティが課されることはないと述べています(※一部を除く)。

 

悩んでいる人
一部を除くとのことですが、どのような重複コンテンツがペナルティの対象となるのでしょうか?

 

対象となるのは以下の2つです。

  • 無断で複製されたコンテンツ
  • 他のサイトからのコピーで構成されたサイト

これらについて詳しく見ていきましょう。

 

無断複製されたコンテンツ

無断で複製されたコンテンツとは、Googleは以下のように定義しています。

  • 他のサイトのコンテンツをコピーし、独自のコンテンツや付加価値を加えることなく転載しているサイト
  • 他のサイトのコンテンツをコピーし、(語句を類義語に置き換えたり自動化された手法を使用したりして)若干の修正を加えた上で転載しているサイト
  • なんらかの独自の体系付けやユーザーへの利便性を提供することなく他のサイトからのコンテンツ フィードをそのまま掲載しているサイト
  • ユーザーに実質的な付加価値を提供することなく、他のサイトの動画、画像、その他のメディアなどのコンテンツを埋め込んだだけのサイト

 

もし、あなたのコンテンツがこの定義に該当する可能性がある場合、速やかに修正することをおすすめします。

 

他のサイトからのコピーで構成されているサイト

2012年7月18日に、Googleは「ペンギンアップデート」という新しい検索アルゴリズムを導入しました。

 

このアップデートに関して、Googleの公式ブログでは以下のように発表しています。

このアルゴリズムの変更では、低品質なサイトの掲載順位を下げ、同時に、良質なサイトの掲載順位をより適切に評価します。例えば、ユーザーにとってあまり価値のないサイト、利便性の低いサイト、他のサイトからのコピーで構成されているようなサイトの掲載順位は下がります。

 

もしあなたのブログが他のサイトの内容をコピーしているなら、上位に表示されることはありません。

 

現に上位表示されている場合でも、Googleはこのようなサイトを認めません。

 

だから、今後の大きなアップデートで影響を受ける可能性があります。

 

重複コンテンツの調べ方

悩んでいる人
重複コンテンツはどのように調べればいいのですか?

 

Googleサーチコンソールで調べる方法

Googleサーチコンソールの「ページのインデックス登録」の中にある『ページがインデックスに登録されなかった理由』から、以下が表示されている場合には、重複コンテンツがあることのサインです。

  • 重複しています。ユーザーにより、正規ページとして選択されていません
  • 重複しています。送信されたURLが正規URLとして選択されていません
  • 重複しています。Googleにより、ユーザーがマークしたページとは異なるページが正規ページとして選択されました

 

コピペチェックツールで調べる方法

Googleサーチコンソール以外で調べる場合には、コピペチェックツールと呼ばれるツールを使って調べましょう。

 

重複コンテンツが見つかった時の対応方法

重複コンテンツが見つかった時には、Googleは以下の5つの方法を薦めています。

  1. rel=canonical(カノニカルタグ)を使う
  2. canonical HTTP ヘッダーを使う
  3. サイトマップ(sitemap.xml)を使う
  4. 301リダイレクトを使う
  5. 記事の統合

 

逆に、Googleが薦めていない方法は

  • robots.txtを使う
  • URL削除ツールを使う
  • noindexを使う

引用元:重複した URL を正規 URL に統合する | Google 検索セントラル | Google Developers

 

Googleが推奨している4つの方法について解説していきます。

 

rel=canonical(カノニカルタグ)を使う

canonicalタグは、URLは異なるがほぼ同じページの場合に使用します。

 

たとえば、ECサイトで同じ商品を色ごとに別々に見せる時です。

 

 

商品の機能や値段、素材などの紹介が同じで、色だけが違う状況です。

 

この場合、Googleは同じ内容とみなしがちです。

 

赤い商品を主なページに選ぶと、黒や白の商品ページは主ではないページとします。

 

そこで、黒や白のページにはcanonicalタグを設けることが大切です。

 

canonicalタグの設定

 

例 ‹link rel=”canonical” href=”https://naoyamablog.net/red.html”›

 

注意点

  • 必ずhead要素に入れてください。
  • URLは相対パスではなく絶対パスで記入してください。

 

canonical HTTP ヘッダーを使う

PDFファイルでは、HTMLタグが使えません。

 

その代わりに、canonical HTTPヘッダーを用いることで、Googlebotに正しい情報を伝えることが可能です。

 

この方法で、必要なページがしっかりと検索結果に表示されるようにしましょう。

 

Link: ‹https://naoyamablog.net/pdf/download.pdf›; rel="canonical"

 

注意点

URLは相対パスではなく絶対パスで記入してください。

 

サイトマップ(sitemap.xml)を使う

正規ページのURLをsitemap.xmlに記載してGoogleに送信することで、Googleサーチコンソールを通じて正規ページであることを伝えられます。

 

注意点

非正規ページのURLは記載しないでください。

 

301リダイレクトを使う

canonicalタグを使うと、正規ページとそうでないページの両方ともページを閲覧することができます。

 

一方、301リダイレクトは、あるページから別のページへ自動的に転送する方法です。

 

これにより、訪問者は最初にアクセスしたページを見れなくなります。

 

よくあるパターンとしては、
https://www.naoyamablog.net/
https://naoyamablog.net/
「www.」の有無で異なるアドレスを持つページがある場合、一方を正規として設定し、もう一方から転送したい時に301リダイレクトを利用します。目的は、「https://naoyamablog.net」だけを表示することです。

 

301リダイレクトの設定は、「.htaccess」ファイルを編集することで行えます。

 

このファイルはサーバー上にあり、ウェブサイトの動作を調整するのに使われます。

 

記事の統合

重複コンテンツ(記事)が見つかった場合には統合して、1つのページにまとめてしまうというのも解決策の1つになります。

 

他サイトで自分の同じコンテンツが見つかった場合

悩んでいる人
一生懸命作った記事が、別のブログで使用されているのを見つけたら、どうたらいいですか?

 

ブログが人気になると、記事が無断で使われることがあります。

 

記事の盗用者にnoindexとcanonicalの設定を依頼しても、応じてもらえないことが多いです。

 

最悪な場合は、オリジナルのコンテンツであるにも関わらず、Googleが盗用者のページを正規と判断してしまい、あなたのページが検索結果に表示されなくなるかもしれません。

 

この問題に直面したら、Googleへの著作権侵害の削除依頼を提出することができます。

 

著作権侵害による削除

 

泣き寝入りをせずに申し立てをしましょう。

 

まとめ:Googleサーチコンソールで重複コンテンツ問題を解決せよ!

本記事を簡単にまとめると…

本記事のまとめ

重複コンテンツとは
Googleが定義している重複コンテンツとは、ドメイン内または複数ドメインにまたがって存在する、他のコンテンツと完全に同じであるか非常によく似たコンテンツ
 
重複コンテンツはどんな問題を引き起こすかのか?

  • Googleが自動で正規のページを決めてしまう
  • リンクからの評価が分散してしまう
  • Googleのクローラーがページを巡るのに時間がかかる

 
重複コンテンツは検索結果に影響があるのか?
重複コンテンツによって、検索結果においてペナルティが課されることはない(※一部を除く)
 
ペナルティの対象になるのは

  • 無断複製されたコンテンツ
  • 他のサイトからのコピーで構成されたサイト

 
無断複製されたコンテンツとは

  • 他のサイトのコンテンツをコピーし、独自のコンテンツや付加価値を加えることなく転載しているサイト
  • 他のサイトのコンテンツをコピーし、(語句を類義語に置き換えたり自動化された手法を使用したりして)若干の修正を加えた上で転載しているサイト
  • なんらかの独自の体系付けやユーザーへの利便性を提供することなく他のサイトからのコンテンツ フィードをそのまま掲載しているサイト
  • ユーザーに実質的な付加価値を提供することなく、他のサイトの動画、画像、その他のメディアなどのコンテンツを埋め込んだだけのサイト

 
重複コンテンツが見つかった時の対応方法

  • rel=canonical(カノニカルタグ)を使う
  • canonical HTTP ヘッダーを使う
  • サイトマップ(sitemap.xml)を使う
  • 301リダイレクトを使う

 
他サイトで自分の同じコンテンツが見つかった場合

  • 記事を盗用した側に、noindexとcanonicalの設置依頼
  • Googleに著作権侵害による削除依頼を出す

Googleの重複コンテンツに対する考え方が理解できましたか?

 

もしGoogleサーチコンソールで重複する内容の警告を見つけたら、すぐに手を打ちましょう。

 

Googleでの高い評価を得るには、Googleが困ることはしないことです。

 

上位表示を目指すためには、Googleのポリシーに適合することが重要です。

 

SEOを行う際にはグレーゾーンの手法は避けましょう。

 

現時点では問題がないかもしれませんが、次のGoogleの検索アルゴリズムの更新で順位が低下する可能性があります。

 

Googleの理念を理解した上で、適切なSEOを行えば上位表示が可能です。

 

まずはこの機会に重複コンテンツ対策を実施しましょう。

 

Googleサーチコンソールについて詳しく学びたい方は、以下の記事もチェックしてみてください。

 

 

  • この記事を書いた人
  • 最新記事

なおやま

【IT業界歴20年目のWEB大好きマーケター】 ▶︎ WEBデザイナー → WEBディレクター → WEBマーケターに転身 ▶︎ WEBサイトに集客し、リアルの店舗に送客するビジネスが得意 ▶︎ アフィリエイト歴10年以上 ▶︎ A8アフィリエイター選手権でマスター級1位を獲得 ▶︎「Webマーケティングは面白さを当ブログで発信中

-ブログ