Googleは現在、重複コンテンツを発見した場合、原則としてオリジナルページ(コンテンツ)を検索上位に表示するように試みています。あるいは、同一コンテンツが掲載された2つのサイトを比較した時、両者の評価スコア(ランキングアルゴリズムによる、重要度や信頼度の評価。本記事では単に評価スコアとする)に著しいかい離があった場合、スコアが高い方を(高スコアを有する方がコンテンツのオリジナルホルダーである可能性が高いため)検索結果に表示し、一方を「非表示」とします。非表示とは、当該検索クエリにおいては検索結果に表示しないことで、検索結果情報の多様性(diversity)を担保するということです。削除ではありません。
ただし、コンテンツを掲載した複数のサイトが皆、評価スコアが高い場合 - つまり、『教えてgoo、MSN相談箱、OKWave』をはじめとするQ&Aサイトのネットワークを指す -、いずれも検索結果に表示されてしまいます。
一応、OKWaveのネットワークの中でも、評価が比較的低いサイトは検索結果にほとんど出現しないようになっている(アルゴリズムによってそういう調節がうまくいっているということ)のですが、教えてgooやMSN相談箱といった絶対的な評価が高いサイトは、非表示にはならないのです。理由は、単純にオリジナルホルダーを決定できない、非表示にするとシンジケーションビジネスを阻害する、など様々な理由や事情があります。
さらに言えば、OKWaveのQ&Aネットワークの場合、「オリジナルコンテンツの所有者」と呼べるものが(オンライン上は)存在しないため、いずれか1つしか検索結果に表示しなくなるのも問題となるでしょう。たとえば、「教えてgoo」を経由してQ&Aが投稿されても、BIGLOBEなんでも相談室を経由してQ&Aが投稿されても、そのコンテンツは皆で共有される仕組みです。
というわけで、今回の米Googleが発表した内容と、OKWaveの件は直接的には関係ないと思います※。単純に「コンテンツ供給を受けることが悪い」という誤った解釈はなさらないように皆さんご注意ください。Googleはコンテンツシンジケーションを否定しているわけではありません。低品質なサイトの排除が主目的です。
※ じゃぁ、検索クエリによって同一Q&Aコンテンツが多数ヒットしてしまう課題を放置していいかというと、それはまた別の話。実際、Twitter上でも邪魔という意見が多いことが示しているように。
Googleが指摘する”コンテンツファーム”とは? (前篇)::SEM R (via syoichi)
