SEM Vol.19|Webマスター向けTips | Discover Bing

Web マスター向け Tips

Vol.19 ページレベルのウェブスパムによる有害行為

今日、インターネットのエキサイティングな世界では、世界の情報に文字通り指先一つでたどり着けますし、いつまでもコミュニケーションやショッピングや調査など、いろいろ楽しめますが、スパムには大いにがっかりさせられます。インボックスをいっぱいにする一方的なスパムメールも、ルーターや幹線の利用可能な帯域のうち大きな部分を占めています。しかし、メールだけが考慮すべき唯一のスパムではありません。

ウェブスパムは、検索エンジンと検索者コミュニティにとって悩みの種(のひとつ)です。検索エンジンは、検索ユーザーができるだけ早く欲しいものを見つけられるような、素晴らしいエクスペリエンスを提供したいと思っています。検索ユーザーは、検索エンジンを使って、探している情報をできるだけ素早く手に入れたいと思っています。ウェブマスターは、検索ユーザーからウェブサイトを見つけてもらい、直帰(バウンス)せずにコンバージョンして欲しいと思っています。

ウェブスパム、これらの役に立たない屑ページは、検索エンジン最適化(SEO)技術を使ってあからさまに人を騙すだけで、価値のあるコンテンツをまったく含みません。検索エンジンのみならず、検索ユーザーにとってフラストレーションの元凶であり、結果的にコンバージョンを求めるウェブマスターの利益に反するものです(見込み客を困らせることは販売テクニックとは言えませんよね!)

タマゴ、ベーコン、スパム、スパム、さらにスパムでは、ウェブスパムを定義し、ジャンクとの違いを説明しました。ウェブスパムには2種類あることにも触れています。この記事ではその一つである、ページレベルのウェブスパムについて深く掘り下げて考えたいと思います。

ページレベルのウェブスパムの定義

ページレベルのウェブスパムは、オンページのSEOトリックを使います(次のブログで説明するリンクレベルのウェブページと混同されないように)。この手のサイトのウェブマスターとオプティマイザーは、検索エンジンを騙すことで、コンテンツの妥当性において、彼らのウェブページの価値以上の上位ランクを獲得できると信じているのです。ときとして実際のコンテンツとは全く無関係のサブジェクトエリアだったりしますが、これは検索者を騙して、エンドユーザーには何のメリットもない、彼らのスパムサイトへアクセスさせるためなのです。

以下のいかがわしいSEO技術を使うと、Bingはあなたのサイトをページレベルのウェブスパムを疑い、より詳細に調査します。あなたのサイトがウェブスパムを使っていると判断されると、その結果としてペナルティが科される可能性があります。

Bingは、これらの技術の大部分の背後にある考え方は正当性を持つことを認識しています。それを利用することが常に自動的にウェブスパムを意味するとは言っていません。その利用の背後にある意図が問題で、それによってウェブスパムであるかどうか、サイトペナルティが必要かどうかを決定します。検索エンジンの観点から言えば、ウェブスパムに労力を傾けることは、エンドユーザーに何の価値ももたらさないと理解してください。すべての努力が、不正に検索エンジンのランキングに影響を与えるために仕向けられているのです。あのマーサ スチュアートも、それはよくないことね、と言うでしょうね。

キーワードのURLとリンクの詰め込み

定義: これはそれらの単語で検索したとき、検索エンジンのインデックスで優位なランキングを得るため、過度に繰り返されるキーワードとフレーズを利用したものです。

問題: キーワードが、自然言語としては理解不能なほど過度に繰り返されます。このような過度な繰り返しは、エンドユーザーに見えない場所(表示されるページテキストの外)に追加できます。ウェブスパムページの中には、ページのテーマに無関係なキーワードを繰り返し用いているものもあります。このような状況が検知されると、Bingはそのテクニックをウェブスパムの可能性と判断し、注意します。

私たちがチェックするポイント: ウェブスパム提供者は、以下のようなやり方を使ってキーワードスタッフィングを行います。

  • キーワードを過剰に繰り返すこと。 ページ上のコンテンツに関連する繰り返し回数はウェブスパムの指標です。通常、繰り返しキーワードの詰め込み(キーワードスタッフィング)は、ページのコンテンツの量に比例します。たとえば、ひとつのトピックに特化した非常に長いテキストページなら、その主要テーマであるキーワードを何回か繰り返すのが自然でしょう。しかし、コンテンツの少ないページで、同じ言葉を同じだけ繰り返していれば、キーワードスタッフィングのサインです。
  • ページやサイトのテーマに無関係な言葉を詰め込むこと。 サイトのテーマとは無関係なのに、ウェブで検索数が多いとされている言葉をページに詰め込んでいるとウェブスパムの可能性があります。適正であるかどうかは、キーワードがウェブスパムの可能性をはらんでいるかどうかを評価する重要なファクターです。
  • テキストをオンページに詰め込むこと。 人間が理解できず、読めないキーワードを、そのページのテキストとして撒き散らすことは明らかに問題です。ページにそのようなコンテンツがあっても、人々にとって無用ですし、ウェブスパムと疑われます。
  • ページの見えにくいところに詰め込むこと。 繰り返しのキーワードを、ページの末尾、リンク、Altテキスト、タイトルタグといった、ページの見にくいところに置くことはウェブスパムのサインです。
  • 詰め込んだキーワードをページのコードに隠すこと。 ページのキーワードを検索エンジンクローラー(別名ボット)が見るコードに置き、人間が見るブラウザー上で表示されないようにする設定は、非常に疑わしいことです。テキストのフォントをバックグラウンドと同じ色にしたり、極小のフォントを使ったり、style="display: none"class="hide"(どちらもタグ付けされたコンテンツがユーザーに表示されないようにします)といったタグの属性を使って、詰め込んだキーワードを隠すことは、精密検査の対象として検索エンジンの注意を喚起します。

キーワードの<meta>タグを詰め込むだけでは、ウェブスパムの判定理由にはならないことに注意してください。しかし、<meta>タグの詰め込みは他のウェブスパム技術が使われている可能性を示唆しますので、検索エンジンが、より詳細な調査を行う場合があります。

ウェブマスターとしては、この情報に過剰反応しないことが大切です。適切なキーワードを適度に繰り返すことは一般的なことですし、ページコンテンツの言語で自然に用いられ、ページが有益かつ適切なコンテンツを提供している限り、ウェブスパムとは見なされません。重要なメッセージは常に同じで、検索エンジンボットではなく、人間のためのページを構築するということがベストな結果を生みます。キーワードの賢明な作り方と使い方に関する詳しい情報は、 The key to picking the right keywordsPut your keywords where the emphasis is をご覧ください。

スペルミスとコンピュータ生成の言葉

定義: 様々なスペリングのターゲット キーワードが集められたページで、中でもページやサイトのテーマに無関係な場合は、そのキーワードリストがコンピュータによって生成されたものであることを示唆します。

問題: 大量のスペルミス、珍しい言葉やフレーズが過剰に含まれている場合、ウェブスパムと見なされます。これらの言葉がページやサイトのテーマに即しているかどうかが決め手になります。

私たちがチェックするポイント: Bingチームは通常、ウェブスパムのサイトで以下のテクニックを見ています

  • スペルミスしたキーワードの過剰使用。 スペルミスの言葉を可能な限り繰り返し、大量に並べられていれば過剰です。そのページはウェブスパムの厳密な調査に値します。
  • サイトのテーマに無関係の大量なスペルミスの言葉。 ページやサイトのテーマと無関係であると定義される言葉を、様々なスペルで延々と並べている場合、サイトがウェブスパムである可能性を示唆します。
  • 人気のサイトのURLのよくあるスペルミスを使ったドメインネーム。 よくあるスペルミスのURLと、その他コンピュータ生成のコンテンツは、一般にウェブスパムサイトと見なされます。

リダイレクトとクローキング

定義: ウェブサイトは、アクセスしてきたウェブクライアントの特性からユーザーを認識し、違うページにリダイレクトすることができます。これらには、参照コード(referral code)、ユーザーエージェント(ボットあるいは人間)、IPアドレスに基づくリダイレクトが含まれますが、これに限定されるわけではありません。

問題: リダイレクトは、場合によっては正当なテクニックにもなり得ます。たとえば、ウェブクライアントを限定した、モバイルデバイスのウェブブラウザー専用の表示にしたり、クライアントのIPアドレスをウェブサーバーが確認して、コンテンツの表示言語を決める(geo-targeting)等です。しかし、ユーザーエージェントが検索エンジンボットかエンドユーザーのウェブブラウザーかに基づいて、コンテンツをフィルタリングしているときは問題です。この種のフィルタリングはあらゆる場所で機能し、ボットには、キーワードスタッフィングのページとはまったく異なる、欺くためのコンテンツに見せます。この意図で使われている場合にはウェブスパムです。

こういったテクニックを導入するウェブマスターが分かっていないのは、検索エンジンがこれらの意図された詐欺を検知できるということです。ユーザーエージェントベースでコンテンツが表示される場合、それぞれのバリエーションのコンテンツの差が、モバイルやデスクトップのブラウザーでなされるのと、同じ考え方でなされていない場合に確認できます。

私たちがチェックするポイント: ウェブマスターの中には、検知されたユーザーエージェントが検索エンジンボットの場合、ウェブサイトが以下の詐欺テクニックを使うように設計している人もいます。

  • スクリプトベースのリダイレクト。 表示するページを自動的に変えるためにJavaScriptあるいは タグのリフレッシュを用いている場合、たいていが疑わしいため、Bingから調査されます。これは、一部のサイトがJavaScriptを使って、アクセスするすべてのユーザーエージェントを新しいページにリダイレクトしているからで、たいていそのページにはウェブスパムが含まれます。しかし、検索エンジンボットはJavaScriptをネイティブで実行できませんのでリダイレクトは行われず、それ故に、本来ならば、オリジナルページのコンテンツをインデックスする(とはいえ検索エンジンボットはこの行為を検知しますが)はずです。
  • リフェラル リダイレクト。 一部のウェブサイトは、リファラーを確認してページを表示します。リファラーがSERP(検索エンジン結果ページ)の際、ターゲットのウェブサイトが、ユーザーが直接URLを入力したときと違うページを表示する場合、この行為はウェブスパムと見なされます。
  • 検索エンジンボットをターゲットページにリダイレクト。 一部のサイトは、特定のユーザーエージェントを検出して検索エンジンボットを代わりのキーワードスタッフィング等の各種ウェブスパム技術で改造されたテキストベースのページに送ります(ただしユーザーエージェントがエンドユーザーのウェブブラウザーだと、サイトは通常のウェブコンテンツページを提供します)。リダイレクトが、検索エンジンのユーザーエージェントを騙すためだと検出された場合、これはクローキングのウェブスパムバージョンです。ボットは、特別なページへリダイレクトされるときに検知します。これに出会ったら、通常はウェブスパムのサインですし、さらに詳しく調査されるでしょう。
  • エンドユーザーをターゲットページにリダイレクト。 往々にしてウェブマスターは、クローキングを使って先ほど述べたこととはまったく反対のことを行います。ユーザーエージェントが検索エンジンボットだと、トピックAのきちんと最適化されたコンテンツを提供しますが、ウェブブラウザーでサイトにアクセスすると、全く異なるサブジェクトのコンテンツのページは表示します(典型的なのが不法サイトで、ポルノ、カジノ、オンライン賭博、違法薬品といった類のものです)。ここで大切なのは、検索エンジン結果ページ(SERP)で関心を集める、一般に検索されるトピックで上位表示されるための努力です。ですので、検索者がSERPでリンクを見つけ、ブルーリンクをクリックして、無意識にウェブスパムページにリダイレクトされていたとしたらどうでしょう。

これらの技術を使うウェブマスターの問題は、詐欺技術はそれほど有効ではないということです。検索エンジンは様々な技術で、リダイレクトやクローキングのウェブスパムといった詐欺的な動きを発見します。それらが明らかになってしまうと、犯人のウェブサイトは厳しいペナルティを科されます。悪意のあるコンサルタントを雇ったり、ウェブ上のソースから見つけてきた悪意あるSEOアドバイスに従ってしまう、善意のウェブマスターやオンラインビジネスのオーナーはトラブルに陥るでしょう。 Bing , Yahoo , and Google の公式ウェブマスターガイドラインの他、このブログで明らかになった問題を見直すことで、検索にとって適切なウェブサイトへの長い道のりを進むことになるのです。

ウェブスパムに関する次のブログでは、リンクレベルのウェブスパムを詳しく見ていきます。また、あなたのサイトがウェブスパムと判断され、問題を解決した後に、どうすればよいか、Bingインデックスに正常なウェブサイトとして再掲載してもらうためのリクエストの仕方についての情報も提供する予定です。引き続きご期待ください!

それではまた・・・。

-- Rick DeJarnette, Bing Webmaster Center