AI検索で引用されるコンテンツの書き方|Grounding Budgetと自己完結型パッセージ設計

#ai seo #ai検索 #LLMO #コンテンツ設計 #Grounding Budget
💡ポイント

この記事でわかること

  • ChatGPTやGoogle AI Overviewに引用される記事と、従来SEOで評価される記事の設計思想の根本的な違い
  • 英語圏で2025〜2026年に確立されつつある4つの核論点(Grounding Budget・自己完結型パッセージ・エンティティ権威・マルチモーダル)
  • AI検索向けに段落・見出し・スキーマをどう再設計すべきか、具体例つきの実務手順
  • ケンランSEOの1次情報注入機能を使って「他にないデータ」をAIに渡す設計思想

避けたいこと

  • 「長ければ長いほどSEOに強い」という従来の発想のままAI検索時代に突入すること
  • AIライティングで量産した均質な文章を、構造だけ整えて公開すること

結論の先取り: AI検索で引用される記事は、Grounding Budget・自己完結型パッセージ・エンティティ構造・マルチモーダルの4軸で設計し直す必要があります。

はじめに|「読ませる記事」から「抽出される記事」へ

従来のSEOで評価される記事は、読者が上から下まで読み進めることを前提に設計されてきました。導入で興味を引き、見出しで構造を見せ、本文で深掘りし、最後にまとめで締める。いわば「読ませる」ための設計思想です。

ところがChatGPT・Perplexity・Google AI Overviewといった「AI検索」が普及した2025〜2026年、英語圏のSEO業界では全く別の設計思想が急速に立ち上がりつつあります。それが「抽出される記事」という発想です。

AI検索は記事全体を読ませません。ユーザーの質問に対して、関連しそうな段落だけを切り出して回答文に組み込みます。つまり書き手が相手にしているのは、通読する人間ではなく「1段落だけ持ち出すLLM(大規模言語モデル)」なのです。

この視点の転換を整理したのが、Search Engine Land が2026年に公開したプレイブック記事(Search Engine Land – How to write for AI search)などに代表される英語圏の一連の論考です。本記事ではその核論点を日本語圏の実務に翻訳し、今日から記事設計に組み込める形でお届けします。

本記事はAI SEO完全ガイドのクラスター記事として、特に「AI検索側で引用されるための設計」の深掘りを担当します。

Grounding Budget|LLMが1ページから抽出できるトークンには上限がある

Grounding Budget(グラウンディング予算)とは

Grounding Budget(グラウンディング予算) とは、LLMがユーザーの質問に回答するために参照するコンテンツの総量と、1ページあたりに割り当てられるトークン量の制約を指す概念です。英語圏では2026年にかけて一般化しつつある実務用語です。

Search Engine Land のプレイブックによれば、LLMはクエリ1件あたり約1,900語前後しか参照できず、1ページあたりの割り当ては約380語(中央値)にすぎないとされています(Search Engine Land – Machine-Readable Content Playbook)。日本語に換算すると、1ページから抽出されるのはおよそ600〜800文字程度と考えてよいでしょう。

Grounding Budgetから導かれる設計原則
  • LLMは記事全体を読まない。抽出するのは冒頭数段落+質問に合致した中間段落
  • 5,000文字以下の記事は約66%の抽出率、20,000文字超の記事は約12%まで低下するというデータがある
  • 「長文ほど強い」という従来SEOの常識は、AI検索最適化では逆の圧力を生む

実務への落とし込み

Grounding Budgetを踏まえると、記事構造は次のように変えるべきです。

  1. 冒頭40〜60語(日本語なら80〜120字)に結論と定義を密度高く入れる — ここが最も抽出されやすい
  2. 見出し直下の段落を「その見出しだけで自己完結」するように書く — LLMは見出し+直下段落をセットで抽出する傾向がある
  3. 長大な記事は複数のクラスター記事に分割する — 1記事5,000〜8,000字を基本に、さらに深い論点は別記事へ分離

ただし日本語圏の検索結果では依然として長文優位の傾向も残っているため、「短くすれば良い」わけではありません。ピラー記事は従来SEO向けに長く、クラスター記事はAI検索向けに凝縮する というハイブリッド運用が現実解です。

自己完結型パッセージ(Self-Contained Passage)設計

Self-Contained Passage(自己完結型パッセージ)とは

Self-Contained Passage(自己完結型パッセージ) とは、段落単位で文脈なしに読んでも意味が通じる書き方を指します。LLMは記事全体の文脈を保持せず、1段落だけを切り出して回答文に埋め込むため、その段落だけで主語・条件・数値・結論が揃っている 必要があります。

言い換えると、「これは」「先ほどの」「弊社の」といった代名詞・指示語・文脈依存表現を排除し、固有名詞と具体的な数値・条件を明示する書き方です。

ビフォーアフター例

ビフォー(文脈依存型)

先ほど説明したこの手法は、特にECサイトで効果を発揮します。実際の導入企業では、CVRが大幅に改善したという報告が多数あります。弊社のデータでもそれは裏付けられています。

この段落をLLMが抽出しても、「この手法」が何を指すのかわかりません。「実際の導入企業」も「弊社」も具体性ゼロです。結果として引用候補から外れます

アフター(自己完結型)

トピッククラスター設計は、特にSKU数が1,000点を超えるECサイトで効果を発揮します。ケンランSEOが2025年に観測した導入10社の平均値では、クラスター導入3ヶ月後のオーガニックCVRが1.2%から1.9%へ改善しました。

この段落は単体で持ち出しても意味が通ります。主語(トピッククラスター設計)、条件(SKU1,000点超のEC)、観測主体(ケンランSEO)、期間(2025年・導入3ヶ月後)、数値(1.2%→1.9%)がすべて埋め込まれています。LLMはこうした段落を選好します。

実務チェックポイント

  • 各段落を冒頭から読んだとき、主語がその段落内に書かれているか
  • 「それ」「この」「先ほど」といった指示語で始まっていないか
  • 数値・日付・企業名・地名などの固有情報が段落内に閉じているか
  • 1段落は134〜167語(日本語なら250〜320字)程度を目安にする(Wellows – Google AI Overviews Ranking Factors

エンティティ権威(Entity Authority)への対応

ドメイン権威からエンティティ権威へ

Entity Authority(エンティティ権威) とは、特定のブランド・企業・人物・サービス名がWeb上でどれだけ広く、一貫した文脈で言及されているかを指します。英語圏では2026年にかけて、従来の「ドメイン権威(DA)」(サイト全体の被リンク等に基づく評価指標)に代わる新しい評価軸として注目されています。

Search Engine Journal および Search Engine Land の分析によれば、AI Overview被引用ページと従来のドメイン権威指標の相関は r=0.43からr=0.18へ低下 しており、かわりにエンティティ単位の認知度との相関が強まっているとされています(Search Engine Journal – Enterprise SEO AI Trends 2026)。象徴的なのはAI Overview被引用ページの47%が検索順位5位以下から来ているというデータで、順位だけでは引用を勝ち取れない現実を示しています。

エンティティ権威を高める実務施策

  1. Author schema(著者スキーマ)の整備 — 執筆者の氏名・肩書・所属・過去記事をWeb上で一貫させる
  2. Wikipedia / Wikidata への言及形成 — 自社ブランドや主要人物がWikidataに登録されているか確認
  3. sameAs プロパティでのプロファイル統合 — 企業サイト・LinkedIn・GitHub・SNSを構造化データで相互リンク
  4. 一貫した表記 — 企業名・サービス名の表記揺れ(「ケンランSEO」「Kenran SEO」等)を統一する

エンティティ権威は一朝一夕には構築できません。しかし 3〜6ヶ月のスパンで継続的に言及を積み上げる ことで、AI検索における引用確度は確実に高まります

マルチモーダルシグナル|AI Overviewが評価する技術要件

Wellows 社がGoogle AI Overviewの結果15,847件を分析した研究(Wellows – Google AI Overviews Ranking Factors)では、被引用確率と相関の高い要因として次の順序が報告されています。

  • 1位|マルチモーダルコンテンツ: テキスト+画像+動画+スキーマ、相関r=0.92、156%引用率向上
  • 2位|リアルタイムファクト検証: 信頼できる出典へのリンク、r=0.89、89%向上
  • 3位|セマンティック完全性: 自己完結した回答、r=0.87、4.2倍
  • 4位|スキーママークアップ: 73%向上
  • 5位|エンティティ密度: 1,000語あたり15〜20エンティティ、r=0.76

特筆すべきはマルチモーダル要件がトップに来ていることです。テキストだけの記事は、同じ情報量でも画像・動画・表・構造化データを組み合わせた記事に比べて引用確度が大幅に低いというのが、英語圏の研究結果です。

日本語圏の実務では、次の最低ラインを押さえておくと良いでしょう。

スキーマ(構造化データ)の役割

AI検索時代のスキーマ(構造化データ)の役割は、従来SEOとは少し違います。従来は「検索結果のリッチリザルト表示」が主目的でしたが、AI検索では 「この段落が何についての回答か」をLLMに明示するシグナル として機能します。

実装すべき主要スキーマは次の3つです。

詳細な仕様は Google Search Central の構造化データドキュメント を参照してください。重要なのは「スキーマを入れれば順位が上がる」のではなく、AIが段落の意味を正しく把握するためのヒント として機能するという点です。

llms.txt|AIクローラー向けの案内ファイル

llms.txt は、ChatGPT・Perplexity・Google AI Overview等のAIクローラーに対して「このサイトの重要ページはここです」と案内するテキストファイルです。2024年後半から英語圏で提唱され、2026年現在は実装するサイトが徐々に増えています。

詳しい仕様と書き方は llms.txt完全ガイド で解説していますが、要点は次の3つです。

  1. 軽量版(llms.txt)と完全版(llms-full.txt)の2種類を用意する
  2. ピラーページ・1次情報ページを優先的に列挙する
  3. カテゴリ別の階層構造で整理する

ケンランSEOでは pro プラン以上で llms.txt の自動生成機能を提供しており、microCMS連携・WordPress XMLアップロード・Redirectionマップ連携の3方式に対応しています。中小企業向け価格帯で llms.txt 生成までカバーするツールは2026年時点では希少なので、手元で動かして感触を掴みたい方には有力な選択肢です。

1次情報の設計|AIに引用されるための「他にないデータ」

ここまでの論点(Grounding Budget・自己完結型パッセージ・エンティティ権威・マルチモーダル・スキーマ)はすべて 技術的な器 の話でした。しかし本当の差別化は、その器の中身である コンテンツの独自性 にあります。

AIに引用される記事の共通点は、「他の記事にないデータや経験が書かれている」ことです。言い換えると、AIが他の100記事から合成できない情報が1つでも入っているかどうかが、引用される記事と埋もれる記事を分けます。

1次情報の具体例

Semrush が20,000キーワード・42,000記事を分析した2025年の研究では、1位に表示されるコンテンツの80%は人間執筆で、純粋なAI生成は9% にすぎないと報告されています(Search Engine Land – Human vs AI Study)。この差を生むのは、AIが生成できない「経験に基づく1次情報」の有無です。

ケンランSEOのサイトナレッジ注入機能|1次情報をAIに渡す設計思想

ケンランSEOには「サイトナレッジ」という機能があります。これは、そのサイト固有の業界知識・ターゲット読者像・過去に効果があった施策パターン・避けたい表現・自社の差別化ポイントなどを蓄積しておき、AI改善提案やリライト提案の生成時にプロンプトへ自動注入する仕組みです。

これをAI検索向けコンテンツ設計の文脈で捉え直すと、次のように言えます。

サイトナレッジ注入の設計思想

汎用LLMは世の中の平均的な知識しか持ちません。しかし自社の1次情報をプロンプトに注入すれば、LLMはその情報を踏まえたそのサイト固有の回答を生成します。つまりサイトナレッジ注入は「AIに1次情報を渡して独自性のあるアウトプットを得る」という発想の、実装された一つの形です。

入力されたナレッジは外部AIモデルの学習には使われず、ケンランSEO内に閉じた形で保持されます。社外秘の業界ノウハウを扱う中小企業・専門サービス業でも比較的安心して使える設計です。

記事制作時にこの発想を取り入れるなら、執筆前に「この記事に入れられる自社1次情報を3つ書き出す」 というワークフローを組むのがおすすめです。3つの1次情報を各セクションに分散して配置するだけで、AIが合成できない記事に仕上がります。

AI検索向けコンテンツ設計チェックリスト

記事を公開する前に、次の10項目を確認してください。

  • 冒頭80〜120字に結論と定義が密度高く入っているか(Grounding Budget対応)
  • 各段落は代名詞・指示語なしで単体理解できるか(自己完結型パッセージ)
  • 数値・固有名詞・日付がセクション内に閉じているか
  • 1段落の長さが250〜320字程度に収まっているか
  • 著者情報(Author schema)が整備されているか(エンティティ権威)
  • 画像・表・動画・スキーマのいずれかが各セクションにあるか(マルチモーダル)
  • FAQPage / HowTo / Article の適切なスキーマが付与されているか
  • 信頼できる1次出典への外部リンクが3本以上あるか(ファクト検証シグナル)
  • その記事にしかない1次情報が最低3つ含まれているか
  • llms.txt が整備され、該当記事が記載されているか

まとめ|AI検索時代の記事設計は4軸で組み直す

AI検索で引用される記事は、従来SEOで評価される記事とは設計思想が異なります。本記事で扱った論点を改めて整理します。

  1. Grounding Budget — LLMが1ページから抽出するのは約380語(日本語600〜800字)。冒頭密度を高め、1記事を凝縮する
  2. 自己完結型パッセージ — 段落単体で意味が通るように、主語・数値・条件を段落内に閉じる
  3. エンティティ権威 — ドメイン権威から、ブランド・人物・サービス単位の認知度へ評価軸が移行している
  4. マルチモーダル+スキーマ — テキストだけでは足りず、画像・動画・表・構造化データで意味を明示する

そしてこれらの器の上に載せるべき中身は、他の記事にない1次情報です。AIが合成できない経験・データ・失敗事例を3つ以上各記事に埋め込むこと。これがAI検索時代の記事設計の中核です。

関連記事


本記事で参照した主な英語圏出典:

ケンランSEO編集部

著者