ソフト404エラーが表示される原因と対処法について解説
ステータスコードの404(存在しないページ)は知っていても、ソフト404という用語を知らない人も少なくありません。
今回は、ソフト404エラーの概要と表示される原因のほか、対処法も併せて解説します。
- SEOに悩むサイト担当者必見!世界最高水準のテクニカルSEOツール「Lumar」
-
URLを入れるだけでサイト内部の問題を一括検出。
Googleと同じ視点でサイトクロール、
大規模サイトでも手軽に高度なSEO分析ができます!まずは無料デモクロールを試して、あなたのサイトの問題点を一括検出!
ソフト404エラーとは?
まずは、Google検索セントラルに掲載されている、「ソフト404エラー」の定義を確認してみましょう。
ソフト404とはユーザーがURLにアクセスした際に、ページが存在しないことを伝えるために200レベル(成功)のコードを返すエラーのことです。
以降で、詳しく解説します。
通常の404エラーとの違い
通常の404エラーはページ内コンテンツの状態とステータスコードが、対象ページに存在しない点で一致しています。
ソフト404エラーと通常のエラーとの違いは、以下の通りです。
ページ内コンテンツ | HTTPステータスコード | |
---|---|---|
ソフト404エラー | 存在しないと判断されている | 200(OK) |
通常の404エラー | 存在しない | 404(Not Found) |
「送信されたURLはソフト404エラーのようです」とは?
本来なら対象ページは存在しないコンテンツなので、Googleの検索エンジンに登録されることを指しており、可能性としてはインデックス登録の必要がないページであるといえるでしょう。
一方で、ソフト404エラーが表示されるということは、対象ページのURLがインデックスを求めている状態を指します。この矛盾を知らせるのが「送信されたURLはソフト404エラーのようです」というメッセージです。
ソフト404の判定がエラーと除外で表示されるのはなぜ?
ソフト404の判定がエラーと除外で表示されるのは、XMLサイトマップへの記載有無の違いです。
除外レポートに表示されるページの場合、XMLサイトマップへの記載がないことに加えインデックスを求めていない状態なので、Googleも404判定によりインデックス登録を行いません。
そのため不一致が発生していないことから、エラーではなく除外と表示されます。
ソフト404エラーの原因
ここからは、ソフト404エラーの原因について考えていきましょう。ソフト404エラーの原因は、サイト運営者視点から大別すると以下の2つに分かれます。
原因 | |
---|---|
インデックスさせる必要がないページ | 404設定されていない |
インデックスさせたいページ | Googleにインデックスされる基準に足りていない |
404設定されていない
インデックスさせる必要のないページの原因として、最も多くかつシンプルなパターンが404設定をしていないことです。たとえば、以下のようなページの場合に表示されます。
- 記事や商品が存在しない場合
- ページが削除された場合
- 該当する記事や商品が存在しない一覧ページ
- example.com/aaaaaaなどの仮ページ
メインコンテンツが少ない・質が低い
メインコンテンツが少なかったり質が低かったりするとGoogleにインデックス登録されない可能性が高いですが、まれにソフト404エラーと判定されることもあります。
メインコンテンツが適切に読み込まれていない
JavaScriptを使用している場合、メインコンテンツが適切に読み込まれないかもしれません。その場合低品質のページと認識され、ソフト404エラーの表示される可能性が高まります。
Googleの誤判定
Googleの誤判定が原因の場合もあります。該当ページ内のコンテンツが豊富なほど誤判定される可能性は下がりますが、判定には決まった基準があるわけでもありません。
Googleはソフト404判定する際にレイアウトやテキストなど、さまざまな要素を参考に自動判定していると考えられます。特にテキストを強調表記して使用しているページは誤判定されやすく、「存在しません」や「Error」などが表示されやすいでしょう。
ソフト404エラーの対処法
ソフト404エラーが表示されたらエラーの原因をつきとめ、それに見合った対処をする必要があります。
まずはグーグルサーチコンソールのインデックスカバレッジレポートから、エラーになっているページのURLを探しましょう。エラーページがわかったら原因に沿って対処していきますが、その際まずはインデックスさせる必要性の有無を確認してください。
ページのHTTPステータスコードを設定する
ページやコンテンツが存在しない場合は、以下のようなHTTPステータスコードを設定しましょう。
- ページ未検出を示す:404 Not Found
- ページが消滅したことを示す:410 Gone
- ページを移動した場合:301リダイレクト
ステータスコードの設定は、WordPressのようなCMSを使用している場合は自動で行なってくれます。手動で設定する場合は、htaccessファイルを使って行うことが多いでしょう。404は、以下のように記載します。
このように404.htmlを適切に設定しておけば、404というステータスコードとともに404.htmlの内容が表示されます。
ここで注意したいのが、絶対パスでの記載です。絶対パスとは、以下のようにページの最初から最後までを記した形態のことです。
noindex設定を行う
noindex設定とは、特定のページをインデックスさせたくない場合に用います。ステータスコードを変更せず200(OK)のままにする場合でも、noindexタグによりインデックスさせないことを示せるでしょう。
ページによっては404設定をするよりもnoindex設定のほうが、問題が簡単に解決する場合もあります。
canonical設定を行う
該当のページとは別に正規ページが存在することを示したい場合は、canonical設定を行うとソフト404判定を避けることが可能です。
誤判定されている場合は原因を突き止める
インデックスさせたいページが誤判定されている場合は、誤判定のもととなる原因をつきとめましょう。「存在しません」などのテキストや強調表示を使用していないか、確認してみてください。
コンテンツ読み込みの改善を図る
コンテンツの読み込みが悪いため、誤判定されている場合もあります。メインコンテンツの表示にJavaScriptを使用した場合は、サーチコンソールのURL検査ツールでコンテンツの状態を確認してみましょう。
検査ツールの結果から公開URLの公開テストを行えば、以下のような読み込みにくい原因が発見できます。
- リソースがrobots.txtでブロックされている
- リソースが多い、もしくは大きすぎることで読み込みに時間がかかる
- ツールに表示されるスクリーンショットに特定のコンテンツが表示されない
これらの問題が見つかったら、読み込みの改善を図りましょう。
ページ内コンテンツの改善を図る
リソースに問題がなければ、ページ内コンテンツを改善しましょう。オリジナル性の低いコンテンツがソフト404エラーの原因になっているかもしれません。
オリジナル要素を増やし、ページ内のコンテンツの質を上げることが大切です。
まとめ
ソフト404エラーはさまざまな原因で表示されますが、コンテンツ数が少ない間はそれほど大きな問題にはつながりません。
サイトを大きく成長させていくつもりなら、規模の小さい内から、エラー表示への対応を意識して行うことが大切です。
- SEO対策でビジネスを加速させる「SEO Dash! byGMO」
-
SEO対策でこんな思い込みしていませんか?
- 大きいキーワードボリュームが取れないと売上が上がらない・・
- コンサルに頼んでもなかなか改善しない
- SEOはコンテンツさえ良ければ上がる
大事なのは自社にあったビジネス設計です。
御社の課題解決に直結するSEO施策をご提案します