AI検索で引用されるコンテンツの書き方|Grounding Budgetと自己完結型パッセージ設計
はじめに|「読ませる記事」から「抽出される記事」へ
従来のSEOで評価される記事は、読者が上から下まで読み進めることを前提に設計されてきました。導入で興味を引き、見出しで構造を見せ、本文で深掘りし、最後にまとめで締める。いわば「読ませる」ための設計思想です。
ところがChatGPT・Perplexity・Google AI Overviewといった「AI検索」が普及した2025〜2026年、英語圏のSEO業界では全く別の設計思想が急速に立ち上がりつつあります。それが「抽出される記事」という発想です。
AI検索は記事全体を読ませません。ユーザーの質問に対して、関連しそうな段落だけを切り出して回答文に組み込みます。つまり書き手が相手にしているのは、通読する人間ではなく「1段落だけ持ち出すLLM(大規模言語モデル)」なのです。
この視点の転換を整理したのが、Search Engine Land が2026年に公開したプレイブック記事(Search Engine Land – How to write for AI search)などに代表される英語圏の一連の論考です。本記事ではその核論点を日本語圏の実務に翻訳し、今日から記事設計に組み込める形でお届けします。
本記事はAI SEO完全ガイドのクラスター記事として、特に「AI検索側で引用されるための設計」の深掘りを担当します。
Grounding Budget|LLMが1ページから抽出できるトークンには上限がある
Grounding Budget(グラウンディング予算)とは
Grounding Budget(グラウンディング予算) とは、LLMがユーザーの質問に回答するために参照するコンテンツの総量と、1ページあたりに割り当てられるトークン量の制約を指す概念です。英語圏では2026年にかけて一般化しつつある実務用語です。
Search Engine Land のプレイブックによれば、LLMはクエリ1件あたり約1,900語前後しか参照できず、1ページあたりの割り当ては約380語(中央値)にすぎないとされています(Search Engine Land – Machine-Readable Content Playbook)。日本語に換算すると、1ページから抽出されるのはおよそ600〜800文字程度と考えてよいでしょう。
- LLMは記事全体を読まない。抽出するのは冒頭数段落+質問に合致した中間段落
- 5,000文字以下の記事は約66%の抽出率、20,000文字超の記事は約12%まで低下するというデータがある
- 「長文ほど強い」という従来SEOの常識は、AI検索最適化では逆の圧力を生む
実務への落とし込み
Grounding Budgetを踏まえると、記事構造は次のように変えるべきです。
- 冒頭40〜60語(日本語なら80〜120字)に結論と定義を密度高く入れる — ここが最も抽出されやすい
- 見出し直下の段落を「その見出しだけで自己完結」するように書く — LLMは見出し+直下段落をセットで抽出する傾向がある
- 長大な記事は複数のクラスター記事に分割する — 1記事5,000〜8,000字を基本に、さらに深い論点は別記事へ分離
ただし日本語圏の検索結果では依然として長文優位の傾向も残っているため、「短くすれば良い」わけではありません。ピラー記事は従来SEO向けに長く、クラスター記事はAI検索向けに凝縮する というハイブリッド運用が現実解です。
自己完結型パッセージ(Self-Contained Passage)設計
Self-Contained Passage(自己完結型パッセージ)とは
Self-Contained Passage(自己完結型パッセージ) とは、段落単位で文脈なしに読んでも意味が通じる書き方を指します。LLMは記事全体の文脈を保持せず、1段落だけを切り出して回答文に埋め込むため、その段落だけで主語・条件・数値・結論が揃っている 必要があります。
言い換えると、「これは」「先ほどの」「弊社の」といった代名詞・指示語・文脈依存表現を排除し、固有名詞と具体的な数値・条件を明示する書き方です。
ビフォーアフター例
先ほど説明したこの手法は、特にECサイトで効果を発揮します。実際の導入企業では、CVRが大幅に改善したという報告が多数あります。弊社のデータでもそれは裏付けられています。
この段落をLLMが抽出しても、「この手法」が何を指すのかわかりません。「実際の導入企業」も「弊社」も具体性ゼロです。結果として引用候補から外れます。
トピッククラスター設計は、特にSKU数が1,000点を超えるECサイトで効果を発揮します。ケンランSEOが2025年に観測した導入10社の平均値では、クラスター導入3ヶ月後のオーガニックCVRが1.2%から1.9%へ改善しました。
この段落は単体で持ち出しても意味が通ります。主語(トピッククラスター設計)、条件(SKU1,000点超のEC)、観測主体(ケンランSEO)、期間(2025年・導入3ヶ月後)、数値(1.2%→1.9%)がすべて埋め込まれています。LLMはこうした段落を選好します。
実務チェックポイント
- 各段落を冒頭から読んだとき、主語がその段落内に書かれているか
- 「それ」「この」「先ほど」といった指示語で始まっていないか
- 数値・日付・企業名・地名などの固有情報が段落内に閉じているか
- 1段落は134〜167語(日本語なら250〜320字)程度を目安にする(Wellows – Google AI Overviews Ranking Factors)
エンティティ権威(Entity Authority)への対応
ドメイン権威からエンティティ権威へ
Entity Authority(エンティティ権威) とは、特定のブランド・企業・人物・サービス名がWeb上でどれだけ広く、一貫した文脈で言及されているかを指します。英語圏では2026年にかけて、従来の「ドメイン権威(DA)」(サイト全体の被リンク等に基づく評価指標)に代わる新しい評価軸として注目されています。
Search Engine Journal および Search Engine Land の分析によれば、AI Overview被引用ページと従来のドメイン権威指標の相関は r=0.43からr=0.18へ低下 しており、かわりにエンティティ単位の認知度との相関が強まっているとされています(Search Engine Journal – Enterprise SEO AI Trends 2026)。象徴的なのは「AI Overview被引用ページの47%が検索順位5位以下から来ている」というデータで、順位だけでは引用を勝ち取れない現実を示しています。
エンティティ権威を高める実務施策
- Author schema(著者スキーマ)の整備 — 執筆者の氏名・肩書・所属・過去記事をWeb上で一貫させる
- Wikipedia / Wikidata への言及形成 — 自社ブランドや主要人物がWikidataに登録されているか確認
- sameAs プロパティでのプロファイル統合 — 企業サイト・LinkedIn・GitHub・SNSを構造化データで相互リンク
- 一貫した表記 — 企業名・サービス名の表記揺れ(「ケンランSEO」「Kenran SEO」等)を統一する
エンティティ権威は一朝一夕には構築できません。しかし 3〜6ヶ月のスパンで継続的に言及を積み上げる ことで、AI検索における引用確度は確実に高まります。
マルチモーダルシグナル|AI Overviewが評価する技術要件
Wellows 社がGoogle AI Overviewの結果15,847件を分析した研究(Wellows – Google AI Overviews Ranking Factors)では、被引用確率と相関の高い要因として次の順序が報告されています。
- 1位|マルチモーダルコンテンツ: テキスト+画像+動画+スキーマ、相関r=0.92、156%引用率向上
- 2位|リアルタイムファクト検証: 信頼できる出典へのリンク、r=0.89、89%向上
- 3位|セマンティック完全性: 自己完結した回答、r=0.87、4.2倍
- 4位|スキーママークアップ: 73%向上
- 5位|エンティティ密度: 1,000語あたり15〜20エンティティ、r=0.76
特筆すべきはマルチモーダル要件がトップに来ていることです。テキストだけの記事は、同じ情報量でも画像・動画・表・構造化データを組み合わせた記事に比べて引用確度が大幅に低いというのが、英語圏の研究結果です。
日本語圏の実務では、次の最低ラインを押さえておくと良いでしょう。
- 記事冒頭に要約図・比較表を1つ入れる
- セクションごとに補足画像かスクリーンショットを配置する
- データを扱うセクションにはHTMLテーブルを使う(画像化しない)
- 可能なら動画解説を1本埋め込む
スキーマ(構造化データ)の役割
AI検索時代のスキーマ(構造化データ)の役割は、従来SEOとは少し違います。従来は「検索結果のリッチリザルト表示」が主目的でしたが、AI検索では 「この段落が何についての回答か」をLLMに明示するシグナル として機能します。
実装すべき主要スキーマは次の3つです。
- FAQPage — Q&A形式のセクションに付与。AI検索で最も抽出されやすい形式
- HowTo — 手順解説記事に付与。ステップ単位で引用されやすくなる
- Article + Author — 著者情報をエンティティとして明示し、E-E-A-Tを強化
詳細な仕様は Google Search Central の構造化データドキュメント を参照してください。重要なのは「スキーマを入れれば順位が上がる」のではなく、AIが段落の意味を正しく把握するためのヒント として機能するという点です。
llms.txt|AIクローラー向けの案内ファイル
llms.txt は、ChatGPT・Perplexity・Google AI Overview等のAIクローラーに対して「このサイトの重要ページはここです」と案内するテキストファイルです。2024年後半から英語圏で提唱され、2026年現在は実装するサイトが徐々に増えています。
詳しい仕様と書き方は llms.txt完全ガイド で解説していますが、要点は次の3つです。
- 軽量版(
llms.txt)と完全版(llms-full.txt)の2種類を用意する - ピラーページ・1次情報ページを優先的に列挙する
- カテゴリ別の階層構造で整理する
ケンランSEOでは pro プラン以上で llms.txt の自動生成機能を提供しており、microCMS連携・WordPress XMLアップロード・Redirectionマップ連携の3方式に対応しています。中小企業向け価格帯で llms.txt 生成までカバーするツールは2026年時点では希少なので、手元で動かして感触を掴みたい方には有力な選択肢です。
1次情報の設計|AIに引用されるための「他にないデータ」
ここまでの論点(Grounding Budget・自己完結型パッセージ・エンティティ権威・マルチモーダル・スキーマ)はすべて 技術的な器 の話でした。しかし本当の差別化は、その器の中身である コンテンツの独自性 にあります。
AIに引用される記事の共通点は、「他の記事にないデータや経験が書かれている」ことです。言い換えると、AIが他の100記事から合成できない情報が1つでも入っているかどうかが、引用される記事と埋もれる記事を分けます。
1次情報の具体例
- 自社サービスの実稼働データ: 「導入10社の平均CVR変化」「2025年のクロール処理件数」等
- 独自調査・アンケート結果: N数と調査方法を明記した定量データ
- 現場の写真・スクリーンショット: ストックフォトではなく実物
- A/Bテストの結果: 勝敗と数値を公開する
- 失敗事例: 上手くいかなかった施策の記録(これは特にAIが合成できない)
Semrush が20,000キーワード・42,000記事を分析した2025年の研究では、1位に表示されるコンテンツの80%は人間執筆で、純粋なAI生成は9% にすぎないと報告されています(Search Engine Land – Human vs AI Study)。この差を生むのは、AIが生成できない「経験に基づく1次情報」の有無です。
ケンランSEOのサイトナレッジ注入機能|1次情報をAIに渡す設計思想
ケンランSEOには「サイトナレッジ」という機能があります。これは、そのサイト固有の業界知識・ターゲット読者像・過去に効果があった施策パターン・避けたい表現・自社の差別化ポイントなどを蓄積しておき、AI改善提案やリライト提案の生成時にプロンプトへ自動注入する仕組みです。
これをAI検索向けコンテンツ設計の文脈で捉え直すと、次のように言えます。
汎用LLMは世の中の平均的な知識しか持ちません。しかし自社の1次情報をプロンプトに注入すれば、LLMはその情報を踏まえたそのサイト固有の回答を生成します。つまりサイトナレッジ注入は「AIに1次情報を渡して独自性のあるアウトプットを得る」という発想の、実装された一つの形です。
入力されたナレッジは外部AIモデルの学習には使われず、ケンランSEO内に閉じた形で保持されます。社外秘の業界ノウハウを扱う中小企業・専門サービス業でも比較的安心して使える設計です。
記事制作時にこの発想を取り入れるなら、執筆前に「この記事に入れられる自社1次情報を3つ書き出す」 というワークフローを組むのがおすすめです。3つの1次情報を各セクションに分散して配置するだけで、AIが合成できない記事に仕上がります。
AI検索向けコンテンツ設計チェックリスト
記事を公開する前に、次の10項目を確認してください。
- 冒頭80〜120字に結論と定義が密度高く入っているか(Grounding Budget対応)
- 各段落は代名詞・指示語なしで単体理解できるか(自己完結型パッセージ)
- 数値・固有名詞・日付がセクション内に閉じているか
- 1段落の長さが250〜320字程度に収まっているか
- 著者情報(Author schema)が整備されているか(エンティティ権威)
- 画像・表・動画・スキーマのいずれかが各セクションにあるか(マルチモーダル)
- FAQPage / HowTo / Article の適切なスキーマが付与されているか
- 信頼できる1次出典への外部リンクが3本以上あるか(ファクト検証シグナル)
- その記事にしかない1次情報が最低3つ含まれているか
- llms.txt が整備され、該当記事が記載されているか
まとめ|AI検索時代の記事設計は4軸で組み直す
AI検索で引用される記事は、従来SEOで評価される記事とは設計思想が異なります。本記事で扱った論点を改めて整理します。
- Grounding Budget — LLMが1ページから抽出するのは約380語(日本語600〜800字)。冒頭密度を高め、1記事を凝縮する
- 自己完結型パッセージ — 段落単体で意味が通るように、主語・数値・条件を段落内に閉じる
- エンティティ権威 — ドメイン権威から、ブランド・人物・サービス単位の認知度へ評価軸が移行している
- マルチモーダル+スキーマ — テキストだけでは足りず、画像・動画・表・構造化データで意味を明示する
そしてこれらの器の上に載せるべき中身は、他の記事にない1次情報です。AIが合成できない経験・データ・失敗事例を3つ以上各記事に埋め込むこと。これがAI検索時代の記事設計の中核です。
関連記事
- AI SEO完全ガイド — AI時代のSEO戦略の全体像、ピラー記事
- LLMO完全ガイド — LLMOピラー、AI検索最適化の全体設計
- AI検索時代のSEO戦略 — AI検索特有の戦略論点
- llms.txt完全ガイド — llms.txt の仕様と実装手順
本記事で参照した主な英語圏出典:
- Search Engine Land – How to write for AI search: A playbook for machine-readable content
- Search Engine Journal – 5 Key Enterprise SEO And AI Trends For 2026
- Wellows – Google AI Overviews Ranking Factors
- Search Engine Land – Human content is 8x more likely than AI to rank #1
- Search Engine Land – Mastering GEO in 2026