Google検索ランキングのAPIドキュメントが14,000ケ漏洩流出

Google検索の内部エンジニアリングドキュメントが約14,000件漏洩したとのニュースが話題です。この漏洩により、これまで秘密にされていたGoogle検索ランキングに関与していると予測されるAPIドキュメントの一部が明らかになったと話題になっています。対象のAPI群が現在も使用されているものなのか不明なことと、記述されている評価指標ごとの重み付けについては記載が無いのでSEOにおいて対策比重の判断はつかないとの前提はありますが、参考までに内容を把握していきましょう。

漏洩内容

漏洩したドキュメントには、Google検索アルゴリズムの様々な要素に関する詳細情報が含まれています。具体的には、以下の項目について記載されています。

  • 14,000以上のランキング機能
  • サイト権威(siteAuthority)の計算方法
  • ナビゲーションブースト(Navboost)モジュールによるクリック信号の処理
  • セッション中のクリック数に基づく結果の保存
  • ホスト年齢(hostAge)属性による新サイトのサンドボックス化
  • Chromeからのサイトレベルビュー測定機能によるページ品質スコアの算出

このニュースはSEO業界で大きな話題となっています。これまでGoogleは、検索アルゴリズムの詳細を公開しておらず、推測の元にSEO対策を進めることが大半でした。しかし、今回の漏洩により、一部項目については明確にGoogleがデータを参照して可能性が高まった為、今後のSEO対策における方針立てに参考にしていける部分はあるかとの所感です。

注意点

ただし、漏洩した情報がすべて最新の情報であるとは限りません。また、Googleは常にアルゴリズムを更新しており、今回の漏洩情報に基づいて対策を行ったとしても、必ずしも効果が保証されるわけではありません。

また内容を踏まえると大きく既存のSEO対策の根幹が変わってくることは無いとの認識でした。内部・外部・コンテンツの各軸での相対評価を意識しつつ、自社にしか記述できない知見や見解を加え、ユーザーに役立つ情報発信に努めていきましょう。


出典元:Report: 14,000+ Google Search Ranking Features Leaked
by Barry Schwartz on May 28, 2024 – 6:15 am

ランド・フィッシュキン氏はマイク・キング氏とともに、司法省以外では最大級のデータ漏洩の一つを公表した可能性がある。Google 検索とその内部ランキング機能およびシグナルに関するものだ。この文書は匿名の情報源(現在は匿名ではない。下記参照)からのものだが、ランド・フィッシュキン氏によって検証されており、Google 検索の仕組みに関する大量の詳細が含まれている。

さらに重要なのは、私が以前ここで取り上げたように、過去 20 年間に多数の Google 検索従業員が行った Google の声明のいくつかと矛盾しているように思われることです。

まだ全部読んではいませんが、皆さんが自分でこれを読むことが重要だと感じました。詳細は以下の見出しでご覧いただけます。

ランド氏は、「彼らの主張の多くは、グーグル社員が長年にわたり公にしてきた声明と真っ向から矛盾している。特に、クリック中心のユーザーシグナルが採用されていること、サブドメインがランキングで個別に考慮されていること、新しいウェブサイト用のサンドボックスがないこと、ドメインの年齢が収集または考慮されていることなどを同社が繰り返し否定していることなどだ」と書いている。

マイク・キングは次のように書いています。「私は API リファレンス ドキュメントを確認し、他の過去の Google リークや DOJ の反トラスト法に関する証言と照らし合わせて検討しました。私はこれを、近々出版する私の著書『The Science of SEO』のために行った広範な特許およびホワイトペーパーの調査と組み合わせます。私が確認したドキュメントには Google のスコアリング機能に関する詳細は記載されていませんが、コンテンツ、リンク、ユーザー インタラクションについて保存されているデータに関する豊富な情報が記載されています。また、操作および保存されている機能に関する説明も、さまざまな程度 (がっかりするほどまばらなものから驚くほど詳細に説明されているものまで) あります。これらを大まかに「ランキング要因」と呼びたくなりますが、それは正確ではありません。」

Aleyda Solis はXでリーク情報の一部を要約した短い記事を書いています。

  • ドキュメントには14Kのランキング機能などが記載されています
  • Googleには「siteAuthority」と呼ばれる計算機能がある。
  • Navboostには、ユーザーを投票者として表すクリック信号に完全に焦点を当てた特定のモジュールがあり、クリックは投票として保存されます。
  • Googleはセッション中に最も長くクリックされた結果を保存します
  • GoogleにはhostAgeという属性があり、これは「配信時に新しいスパムをサンドボックス化するため」に特に使用されます。
  • ページ品質スコアに関連するモジュールの1つには、Chromeからのサイトレベルのビュー測定機能があります。

まだすべてを確認する時間がないので、今後数日かけて確認する予定です。

また、これについて Google 社員が公にコメントしているのをまだ見たことがありません。これは新しいことだとわかっていますし、これについて Google 社員がコメントするかどうかもわかりません。

これはYandex の検索ランキング漏洩に少し似ています。

これに関するソーシャル メディアの投稿がいくつかあります。繰り返しますが、これは公開されてからまだ数時間しか経っておらず、Rand と Mike 以外にはこれを詳細に処理する時間がありませんでした。


https://x.com/randfish/status/1795282226038624418

翻訳:

Google 検索は、世界で最も秘密主義で厳重に守られたブラック ボックスの 1 つです。しかし、もうそうではないかもしれません。

過去四半世紀、Google の検索部門からこれほどの規模や詳細にわたる漏洩が報告されたことはありません。 #SEOにいるなら、おそらくこれを目にするはずです。

https://twitter.com/iPullRank/status/1795276385734504667

翻訳:

さあ、パーティーを始めましょう!

数週間前、私はこれまで書いた中で最も重要なものを出版すると言いました。それは間違いでした。

Google 検索アルゴリズムに関連するドキュメントが漏洩したため、私は週末をかけてそれを徹底的に調べました。

https://ipullrank.com/google-algo-leak

https://x.com/aleyda/status/1795341283940020248

翻訳:

Google 検索の内部エンジニアリング ドキュメントが漏洩し、
@iPullRank
👀によって分析されました。これらの多くは Google によって使用が否定されていました👇

  • ドキュメントには14Kのランキング機能などが記載されています
  • Googleには「siteAuthority」と呼ばれる計算機能がある
  • Navboostには、ユーザーを投票者として表すクリック信号に完全に焦点を当てた特定のモジュールがあり、クリックは投票として保存されます。
  • Googleはセッション中に最も長くクリックされた結果を保存します
  • GoogleにはhostAgeという属性があり、これは「配信時に新しいスパムをサンドボックス化するため」に特に使用されます。
  • ページ品質スコアに関連するモジュールの1つには、Chromeからのサイトレベルのビュー測定機能があります。

さらに!SEO 担当者必読の資料です。ぜひご覧ください。

https://x.com/CyrusShepard/status/1795360779191079340

翻訳:

Googleの弁護士によって(おそらく)削除されるまで、漏洩したGoogleランキングAPIドキュメントへの直接リンクがここにあります。

google_api_content_warehouse v0.4.0

これらのページを保存してください!

https://x.com/gfiorelli1/status/1795335077980991633

翻訳:

@iPullRank
による非常に興味深いブログ投稿。
彼が書き、私たちが保存している多くのもののうちのもう一つは、有用性です⬇️

https://x.com/brodieseo/status/1795321349105414652

翻訳:

SEO に携わっているなら必読です。14,000 の属性 (機能) に基づく新しい Google リーク。

Chrome、ホームページの信頼性、ページ タイトルなどに関連する興味深い情報。

https://x.com/YoungbloodJoe/status/1795295617129886026

翻訳:

どうやら、Google 検索の担当者が「偶然」エンジニアリング ドキュメントを漏洩したようです。このドキュメントには、検索エンジンの仕組みに関する多くの秘密が明らかにされており、その中には、Google 内部で何らかの手動介入があった可能性がある「人間によるラベル付け」されたドキュメントに高い重みを付ける「ゴールデン ドキュメント」フラグがあることも含まれていますが、これは長い間否定されてきました。

https://x.com/ViperChill/status/1795363273120051478

翻訳:

リークされた Google ドキュメントに、思いつく限りのキーワードを詰め込んでいます。オンラインに長く残ることはないと思います。

https://x.com/RangerShay/status/1795425687399960595

翻訳:

Google検索Leakにより 14,000 以上のランキング要因が明らかに…「ベビーパンダの降格」も含まれる?!?

パンダが降格したようだ…でもベビーパンダに?Googleは最近、低品質のサイトに対して甘くなっているようだ

https://x.com/RyanJones/status/1795466675443110322

翻訳:

漏洩した文書についての私の見解。 これが本番環境用かテスト用かはわかりません。私の推測では、主に潜在的な変更をテストするためのものだと思います。 何が Web や他の分野で使用されているかはわかりません。Google Home やニュースなどにのみ使用されているものもあるかもしれません。 ML アルゴリズムへの入力が何で、トレーニングに何が使用されるかはわかりません。クリックは直接の入力ではなく、クリック可能性を予測するモデルをトレーニングするために使用されると推測します。(トレンドブースト以外) また、これらのフィールドの一部は、すべてのサイトではなく、トレーニング データ セットにのみ適用されると推測しています。 Google は嘘をついていないと言っているのでしょうか? まったくそんなことはありません。しかし、先入観を持たずに、このリークを批判的に検証してみましょう。

https://x.com/filiwiese/status/1795494080446964084

翻訳:

@randfishと@iPullRank について訂正します。ドキュメントは yoshi-code-bot というボットによって 3 月 27 日ではなく 3 月 13 日に公開されました。私の推測では、これは Google の内部コード ベースから誤ってプッシュされたもので、おそらく自動化されており、人間によるものではありません。


これを本当に掘り下げていくのを楽しみにしています。

私はこれら 2 つのストーリーを簡単に読み、実際の API ドキュメントを少し調べてみました。正直なところ、過去 20 年以上にわたって Google 検索について追跡してきたすべてのことを踏まえると、これらは本当に正当なもののように見えます。これらのドキュメントの詳細の一部は、実際のランキング機能としてオンレコとオフレコの両方で聞いたものですが、私の理解ではもう使用されていないものや、どのように使用されているかがわからないものもあります (つまり、ランキングに直接使用されるのか、または事後のランキング検証に使用されるのか)。私の意見では、これらのドキュメントを詳細に調べる価値はあります。

リーク元が発言しました – Erfan Azimi さんが私にこのビデオをメールで送ってきました

Web業界10年以上の知見を持って、無料にてご相談へ対応いたします。
情報収集目的でも歓迎です。お気軽にご連絡ください。

  • 人材育成領域

    人材育成領域

    サイト流入
    2.3倍
    (6,843セッション→16,001セッション)
    反響
    2.1倍(12→25件)
    上位表示キーワード例
    「人材育成(検索Vol.8,100)」
  • 婚活領域

    婚活領域

    サイト流入
    2.1倍
    (52,945セッション→110,164セッション)
    反響
    1.3倍(412→536件)
    上位表示キーワード例
    「婚活(検索Vol.40,500)」
  • 日常用品領域

    日常用品領域

    サイト流入
    3.3倍
    (31,874セッション→105,514セッション)
    反響
    3.4倍(84→293件)
    上位表示キーワード例
    「お水(検索Vol.4,400)」

Web集客・制作・PRのご相談はこちらよりどうぞ

以下の内容でよろしければ、送信ボタンを押して下さい。

会社名
氏名
メールアドレス必須
電話番号
お問い合わせの種類
お問い合わせ内容

個人情報保護方針に同意の上、
送信ください

この記事の監修者

株式会社ブランディングワークス編集部

株式会社ブランディングワークス編集部

SEO対策・コンテンツマーケティングの支援事業者。SEO支援を中心に、伴うWeb制作修正やコンテンツ制作まで一気通貫した支援を実施。実績のあるパートナー会社と連携してその他Webマーケティング(広告運用・SNS・メディアのマネタイズetc.)も幅広くカバーし、戦略立案から実行までを総合的に支援も可能。

LIGブログに掲載されました