Google検索の内部エンジニアリングドキュメントが約14,000件漏洩したとのニュースが話題です。この漏洩により、これまで秘密にされていたGoogle検索ランキングに関与していると予測されるAPIドキュメントの一部が明らかになったと話題になっています。対象のAPI群が現在も使用されているものなのか不明なことと、記述されている評価指標ごとの重み付けについては記載が無いのでSEOにおいて対策比重の判断はつかないとの前提はありますが、参考までに内容を把握していきましょう。
漏洩内容
漏洩したドキュメントには、Google検索アルゴリズムの様々な要素に関する詳細情報が含まれています。具体的には、以下の項目について記載されています。
このニュースはSEO業界で大きな話題となっています。これまでGoogleは、検索アルゴリズムの詳細を公開しておらず、推測の元にSEO対策を進めることが大半でした。しかし、今回の漏洩により、一部項目については明確にGoogleがデータを参照して可能性が高まった為、今後のSEO対策における方針立てに参考にしていける部分はあるかとの所感です。
注意点
ただし、漏洩した情報がすべて最新の情報であるとは限りません。また、Googleは常にアルゴリズムを更新しており、今回の漏洩情報に基づいて対策を行ったとしても、必ずしも効果が保証されるわけではありません。
また内容を踏まえると大きく既存のSEO対策の根幹が変わってくることは無いとの認識でした。内部・外部・コンテンツの各軸での相対評価を意識しつつ、自社にしか記述できない知見や見解を加え、ユーザーに役立つ情報発信に努めていきましょう。
出典元:Report: 14,000+ Google Search Ranking Features Leaked
by Barry Schwartz on May 28, 2024 – 6:15 am
ランド・フィッシュキン氏はマイク・キング氏とともに、司法省以外では最大級のデータ漏洩の一つを公表した可能性がある。Google 検索とその内部ランキング機能およびシグナルに関するものだ。この文書は匿名の情報源(現在は匿名ではない。下記参照)からのものだが、ランド・フィッシュキン氏によって検証されており、Google 検索の仕組みに関する大量の詳細が含まれている。
さらに重要なのは、私が以前ここで取り上げたように、過去 20 年間に多数の Google 検索従業員が行った Google の声明のいくつかと矛盾しているように思われることです。
まだ全部読んではいませんが、皆さんが自分でこれを読むことが重要だと感じました。詳細は以下の見出しでご覧いただけます。
ランド氏は、「彼らの主張の多くは、グーグル社員が長年にわたり公にしてきた声明と真っ向から矛盾している。特に、クリック中心のユーザーシグナルが採用されていること、サブドメインがランキングで個別に考慮されていること、新しいウェブサイト用のサンドボックスがないこと、ドメインの年齢が収集または考慮されていることなどを同社が繰り返し否定していることなどだ」と書いている。
マイク・キングは次のように書いています。「私は API リファレンス ドキュメントを確認し、他の過去の Google リークや DOJ の反トラスト法に関する証言と照らし合わせて検討しました。私はこれを、近々出版する私の著書『The Science of SEO』のために行った広範な特許およびホワイトペーパーの調査と組み合わせます。私が確認したドキュメントには Google のスコアリング機能に関する詳細は記載されていませんが、コンテンツ、リンク、ユーザー インタラクションについて保存されているデータに関する豊富な情報が記載されています。また、操作および保存されている機能に関する説明も、さまざまな程度 (がっかりするほどまばらなものから驚くほど詳細に説明されているものまで) あります。これらを大まかに「ランキング要因」と呼びたくなりますが、それは正確ではありません。」
Aleyda Solis はXでリーク情報の一部を要約した短い記事を書いています。
まだすべてを確認する時間がないので、今後数日かけて確認する予定です。
また、これについて Google 社員が公にコメントしているのをまだ見たことがありません。これは新しいことだとわかっていますし、これについて Google 社員がコメントするかどうかもわかりません。
これはYandex の検索ランキング漏洩に少し似ています。
これに関するソーシャル メディアの投稿がいくつかあります。繰り返しますが、これは公開されてからまだ数時間しか経っておらず、Rand と Mike 以外にはこれを詳細に処理する時間がありませんでした。
https://x.com/randfish/status/1795282226038624418
Google search is one of the most secretive, closely-guarded black boxes in the world. Well, maybe not anymore.
— Rand Fishkin (follow @randderuiter on Threads) (@randfish) May 28, 2024
In the last quarter century, no leak of this magnitude or detail has ever been reported from Google’s search division. If you’re in #SEO, you should probably see this. pic.twitter.com/JxEs55IV21
翻訳:
Google 検索は、世界で最も秘密主義で厳重に守られたブラック ボックスの 1 つです。しかし、もうそうではないかもしれません。
過去四半世紀、Google の検索部門からこれほどの規模や詳細にわたる漏洩が報告されたことはありません。 #SEOにいるなら、おそらくこれを目にするはずです。
https://twitter.com/iPullRank/status/1795276385734504667
Ok, let’s get this party started!
— Mic King (@iPullRank) May 28, 2024
A couple weeks ago I said I was publishing the most important thing I ever wrote. I was wrong.
Documentation related to the Google Search algorithm leaked and I spent the weekend tearing it apart.https://t.co/v71B16Ggov
✌🏾
翻訳:
さあ、パーティーを始めましょう!
数週間前、私はこれまで書いた中で最も重要なものを出版すると言いました。それは間違いでした。
Google 検索アルゴリズムに関連するドキュメントが漏洩したため、私は週末をかけてそれを徹底的に調べました。
https://ipullrank.com/google-algo-leak
https://x.com/aleyda/status/1795341283940020248
🚨 Google Search’s Internal Engineering Documentation Has Leaked and analyzed by @iPullRank 👀 Many of these had been denied to be used by Google👇
— Aleyda Solis 🕊️ (@aleyda) May 28, 2024
* There are 14K ranking features and more in the docs
* Google has a feature they compute called “siteAuthority”
* Navboost has… pic.twitter.com/dlpCIQdpDm
翻訳:
Google 検索の内部エンジニアリング ドキュメントが漏洩し、
@iPullRank
👀によって分析されました。これらの多くは Google によって使用が否定されていました👇
さらに!SEO 担当者必読の資料です。ぜひご覧ください。
https://x.com/CyrusShepard/status/1795360779191079340
Until it (possibly) gets taken down by Google’s lawyers, here’s a direct link to the leaked Google ranking API docs
— Cyrus SEO (@CyrusShepard) May 28, 2024
“google_api_content_warehouse v0.4.0”
Save these pages! https://t.co/8RgmoF69z9 pic.twitter.com/9dXobbr2U1
翻訳:
Googleの弁護士によって(おそらく)削除されるまで、漏洩したGoogleランキングAPIドキュメントへの直接リンクがここにあります。
「google_api_content_warehouse v0.4.0」
これらのページを保存してください!
https://x.com/gfiorelli1/status/1795335077980991633
Extremely interesting blog post by @iPullRank.
— Gianluca Fiorelli (@gfiorelli1) May 28, 2024
Another one of the many he writes and we save for is usefulness ⬇️ https://t.co/VZH8EARV1G
翻訳:
@iPullRank
による非常に興味深いブログ投稿。
彼が書き、私たちが保存している多くのもののうちのもう一つは、有用性です⬇️
https://x.com/brodieseo/status/1795321349105414652
Must-read if you work in SEO. New Google leak based on 14K attributes (features).
— Brodie Clark (@brodieseo) May 28, 2024
Interesting stuff related to Chrome, homepage trust, page title & more.
-> Secrets from the Algorithm: Google Search’s Internal Engineering Documentation Leak by @iPullRank https://t.co/k3k2tq1Mea pic.twitter.com/yTSO4UcQ5b
翻訳:
SEO に携わっているなら必読です。14,000 の属性 (機能) に基づく新しい Google リーク。
Chrome、ホームページの信頼性、ページ タイトルなどに関連する興味深い情報。
https://x.com/YoungbloodJoe/status/1795295617129886026
Apparently someone at Google Search “accidentally” leaked an engineering document that reveals a ton of secrets about how the search engine works, including that they have a “Golden Document” flag which puts more weight on a document that is “Human labeled” which could mean some… pic.twitter.com/zeG79f161B
— Joe Youngblood (@YoungbloodJoe) May 28, 2024
翻訳:
どうやら、Google 検索の担当者が「偶然」エンジニアリング ドキュメントを漏洩したようです。このドキュメントには、検索エンジンの仕組みに関する多くの秘密が明らかにされており、その中には、Google 内部で何らかの手動介入があった可能性がある「人間によるラベル付け」されたドキュメントに高い重みを付ける「ゴールデン ドキュメント」フラグがあることも含まれていますが、これは長い間否定されてきました。
https://x.com/ViperChill/status/1795363273120051478
Spamming every keyword I can think of into these leaked Google docs. Guessing they won’t be online for long.
— Glen Allsopp 👾 (@ViperChill) May 28, 2024
Full credit to @randfish, @iPullRank and their anonymous source. pic.twitter.com/G8LdxR0xwu
翻訳:
リークされた Google ドキュメントに、思いつく限りのキーワードを詰め込んでいます。オンラインに長く残ることはないと思います。
https://x.com/RangerShay/status/1795425687399960595
#Google Search #Leak Reveals 14,000+ Ranking Factors… Including “Baby Panda Demotion”?!?
— Shay Harel (@RangerShay) May 28, 2024
Looks like Panda got demoted… but to a BABY PANDA? Guess Google’s going soft on low-quality sites these days pic.twitter.com/Ob2bndHnzH
翻訳:
Google検索Leakにより 14,000 以上のランキング要因が明らかに…「ベビーパンダの降格」も含まれる?!?
パンダが降格したようだ…でもベビーパンダに?Googleは最近、低品質のサイトに対して甘くなっているようだ
https://x.com/RyanJones/status/1795466675443110322
My take on the leaked docs.
— Ryan Jones (@RyanJones) May 28, 2024
We don’t know if this is for production or for testing. My guess is it’s mostly for testing potential changes.
We don’t know what’s used for web or for other verticals. Some things might only be used for a Google home or news etc.
We don’t know…
翻訳:
漏洩した文書についての私の見解。 これが本番環境用かテスト用かはわかりません。私の推測では、主に潜在的な変更をテストするためのものだと思います。 何が Web や他の分野で使用されているかはわかりません。Google Home やニュースなどにのみ使用されているものもあるかもしれません。 ML アルゴリズムへの入力が何で、トレーニングに何が使用されるかはわかりません。クリックは直接の入力ではなく、クリック可能性を予測するモデルをトレーニングするために使用されると推測します。(トレンドブースト以外) また、これらのフィールドの一部は、すべてのサイトではなく、トレーニング データ セットにのみ適用されると推測しています。 Google は嘘をついていないと言っているのでしょうか? まったくそんなことはありません。しかし、先入観を持たずに、このリークを批判的に検証してみましょう。
https://x.com/filiwiese/status/1795494080446964084
Just a correction for @randfish and @iPullRank : the docs were published on March 13th, not March 27th, by a bot called yoshi-code-bot. My guess is that this was accidentally pushed live from Google’s internal code base, possibly automated and not by any person. #SEO #Googleleak
— Fili 🇪🇺 🇳🇱 (@filiwiese) May 28, 2024
翻訳:
@randfishと@iPullRank について訂正します。ドキュメントは yoshi-code-bot というボットによって 3 月 27 日ではなく 3 月 13 日に公開されました。私の推測では、これは Google の内部コード ベースから誤ってプッシュされたもので、おそらく自動化されており、人間によるものではありません。
これを本当に掘り下げていくのを楽しみにしています。
私はこれら 2 つのストーリーを簡単に読み、実際の API ドキュメントを少し調べてみました。正直なところ、過去 20 年以上にわたって Google 検索について追跡してきたすべてのことを踏まえると、これらは本当に正当なもののように見えます。これらのドキュメントの詳細の一部は、実際のランキング機能としてオンレコとオフレコの両方で聞いたものですが、私の理解ではもう使用されていないものや、どのように使用されているかがわからないものもあります (つまり、ランキングに直接使用されるのか、または事後のランキング検証に使用されるのか)。私の意見では、これらのドキュメントを詳細に調べる価値はあります。
リーク元が発言しました – Erfan Azimi さんが私にこのビデオをメールで送ってきました
Web業界10年以上の知見を持って、無料にてご相談へ対応いたします。
情報収集目的でも歓迎です。お気軽にご連絡ください。