AI・LLMO 2026/4/9

AI検索で引用されるコンテンツの書き方｜Grounding Budgetと自己完結型パッセージ設計

#ai seo #ai検索 #LLMO #コンテンツ設計 #Grounding Budget

💡ポイント

この記事でわかること

ChatGPTやGoogle AI Overviewに引用される記事と、従来SEOで評価される記事の設計思想の根本的な違い
英語圏で2025〜2026年に確立されつつある4つの核論点（Grounding Budget・自己完結型パッセージ・エンティティ権威・マルチモーダル）
AI検索向けに段落・見出し・スキーマをどう再設計すべきか、具体例つきの実務手順
ケンランSEOの1次情報注入機能を使って「他にないデータ」をAIに渡す設計思想

避けたいこと

「長ければ長いほどSEOに強い」という従来の発想のままAI検索時代に突入すること
AIライティングで量産した均質な文章を、構造だけ整えて公開すること

結論の先取り: AI検索で引用される記事は、Grounding Budget・自己完結型パッセージ・エンティティ構造・マルチモーダルの4軸で設計し直す必要があります。

はじめに｜「読ませる記事」から「抽出される記事」へ

従来のSEOで評価される記事は、読者が上から下まで読み進めることを前提に設計されてきました。導入で興味を引き、見出しで構造を見せ、本文で深掘りし、最後にまとめで締める。いわば「読ませる」ための設計思想です。

ところがChatGPT・Perplexity・Google AI Overviewといった「AI検索」が普及した2025〜2026年、英語圏のSEO業界では全く別の設計思想が急速に立ち上がりつつあります。それが「抽出される記事」という発想です。

AI検索は記事全体を読ませません。ユーザーの質問に対して、関連しそうな段落だけを切り出して回答文に組み込みます。つまり書き手が相手にしているのは、通読する人間ではなく「1段落だけ持ち出すLLM（大規模言語モデル）」なのです。

この視点の転換を整理したのが、Search Engine Land が2026年に公開したプレイブック記事(Search Engine Land – How to write for AI search)などに代表される英語圏の一連の論考です。本記事ではその核論点を日本語圏の実務に翻訳し、今日から記事設計に組み込める形でお届けします。

本記事はAI SEO完全ガイドのクラスター記事として、特に「AI検索側で引用されるための設計」の深掘りを担当します。

Grounding Budget｜LLMが1ページから抽出できるトークンには上限がある

Grounding Budget（グラウンディング予算）とは

Grounding Budget（グラウンディング予算） とは、LLMがユーザーの質問に回答するために参照するコンテンツの総量と、1ページあたりに割り当てられるトークン量の制約を指す概念です。英語圏では2026年にかけて一般化しつつある実務用語です。

Search Engine Land のプレイブックによれば、LLMはクエリ1件あたり約1,900語前後しか参照できず、1ページあたりの割り当ては約380語（中央値）にすぎないとされています(Search Engine Land – Machine-Readable Content Playbook)。日本語に換算すると、1ページから抽出されるのはおよそ600〜800文字程度と考えてよいでしょう。

Grounding Budgetから導かれる設計原則

LLMは記事全体を読まない。抽出するのは冒頭数段落＋質問に合致した中間段落
5,000文字以下の記事は約66%の抽出率、20,000文字超の記事は約12%まで低下するというデータがある
「長文ほど強い」という従来SEOの常識は、AI検索最適化では逆の圧力を生む

実務への落とし込み

Grounding Budgetを踏まえると、記事構造は次のように変えるべきです。

冒頭40〜60語（日本語なら80〜120字）に結論と定義を密度高く入れる — ここが最も抽出されやすい
見出し直下の段落を「その見出しだけで自己完結」するように書く — LLMは見出し＋直下段落をセットで抽出する傾向がある
長大な記事は複数のクラスター記事に分割する — 1記事5,000〜8,000字を基本に、さらに深い論点は別記事へ分離

ただし日本語圏の検索結果では依然として長文優位の傾向も残っているため、「短くすれば良い」わけではありません。ピラー記事は従来SEO向けに長く、クラスター記事はAI検索向けに凝縮する というハイブリッド運用が現実解です。

自己完結型パッセージ（Self-Contained Passage）設計

Self-Contained Passage（自己完結型パッセージ）とは

Self-Contained Passage（自己完結型パッセージ） とは、段落単位で文脈なしに読んでも意味が通じる書き方を指します。LLMは記事全体の文脈を保持せず、1段落だけを切り出して回答文に埋め込むため、その段落だけで主語・条件・数値・結論が揃っている 必要があります。

言い換えると、「これは」「先ほどの」「弊社の」といった代名詞・指示語・文脈依存表現を排除し、固有名詞と具体的な数値・条件を明示する書き方です。

ビフォーアフター例

ビフォー（文脈依存型）

先ほど説明したこの手法は、特にECサイトで効果を発揮します。実際の導入企業では、CVRが大幅に改善したという報告が多数あります。弊社のデータでもそれは裏付けられています。

この段落をLLMが抽出しても、「この手法」が何を指すのかわかりません。「実際の導入企業」も「弊社」も具体性ゼロです。結果として引用候補から外れます。

アフター（自己完結型）

トピッククラスター設計は、特にSKU数が1,000点を超えるECサイトで効果を発揮します。ケンランSEOが2025年に観測した導入10社の平均値では、クラスター導入3ヶ月後のオーガニックCVRが1.2%から1.9%へ改善しました。

この段落は単体で持ち出しても意味が通ります。主語（トピッククラスター設計）、条件（SKU1,000点超のEC）、観測主体（ケンランSEO）、期間（2025年・導入3ヶ月後）、数値（1.2%→1.9%）がすべて埋め込まれています。LLMはこうした段落を選好します。

実務チェックポイント

各段落を冒頭から読んだとき、主語がその段落内に書かれているか
「それ」「この」「先ほど」といった指示語で始まっていないか
数値・日付・企業名・地名などの固有情報が段落内に閉じているか
1段落は134〜167語（日本語なら250〜320字）程度を目安にする（Wellows – Google AI Overviews Ranking Factors）

エンティティ権威（Entity Authority）への対応

ドメイン権威からエンティティ権威へ

Entity Authority（エンティティ権威） とは、特定のブランド・企業・人物・サービス名がWeb上でどれだけ広く、一貫した文脈で言及されているかを指します。英語圏では2026年にかけて、従来の「ドメイン権威（DA）」（サイト全体の被リンク等に基づく評価指標）に代わる新しい評価軸として注目されています。

Search Engine Journal および Search Engine Land の分析によれば、AI Overview被引用ページと従来のドメイン権威指標の相関は r=0.43からr=0.18へ低下 しており、かわりにエンティティ単位の認知度との相関が強まっているとされています(Search Engine Journal – Enterprise SEO AI Trends 2026)。象徴的なのは「AI Overview被引用ページの47%が検索順位5位以下から来ている」というデータで、順位だけでは引用を勝ち取れない現実を示しています。

エンティティ権威を高める実務施策

Author schema（著者スキーマ）の整備 — 執筆者の氏名・肩書・所属・過去記事をWeb上で一貫させる
Wikipedia / Wikidata への言及形成 — 自社ブランドや主要人物がWikidataに登録されているか確認
sameAs プロパティでのプロファイル統合 — 企業サイト・LinkedIn・GitHub・SNSを構造化データで相互リンク
一貫した表記 — 企業名・サービス名の表記揺れ（「ケンランSEO」「Kenran SEO」等）を統一する

エンティティ権威は一朝一夕には構築できません。しかし 3〜6ヶ月のスパンで継続的に言及を積み上げる ことで、AI検索における引用確度は確実に高まります。

マルチモーダルシグナル｜AI Overviewが評価する技術要件

Wellows 社がGoogle AI Overviewの結果15,847件を分析した研究(Wellows – Google AI Overviews Ranking Factors)では、被引用確率と相関の高い要因として次の順序が報告されています。

1位｜マルチモーダルコンテンツ: テキスト+画像+動画+スキーマ、相関r=0.92、156%引用率向上
2位｜リアルタイムファクト検証: 信頼できる出典へのリンク、r=0.89、89%向上
3位｜セマンティック完全性: 自己完結した回答、r=0.87、4.2倍
4位｜スキーママークアップ: 73%向上
5位｜エンティティ密度: 1,000語あたり15〜20エンティティ、r=0.76

特筆すべきはマルチモーダル要件がトップに来ていることです。テキストだけの記事は、同じ情報量でも画像・動画・表・構造化データを組み合わせた記事に比べて引用確度が大幅に低いというのが、英語圏の研究結果です。

日本語圏の実務では、次の最低ラインを押さえておくと良いでしょう。

記事冒頭に要約図・比較表を1つ入れる
セクションごとに補足画像かスクリーンショットを配置する
データを扱うセクションにはHTMLテーブルを使う（画像化しない）
可能なら動画解説を1本埋め込む

スキーマ（構造化データ）の役割

AI検索時代のスキーマ（構造化データ）の役割は、従来SEOとは少し違います。従来は「検索結果のリッチリザルト表示」が主目的でしたが、AI検索では 「この段落が何についての回答か」をLLMに明示するシグナル として機能します。

実装すべき主要スキーマは次の3つです。

FAQPage — Q&A形式のセクションに付与。AI検索で最も抽出されやすい形式
HowTo — 手順解説記事に付与。ステップ単位で引用されやすくなる
Article + Author — 著者情報をエンティティとして明示し、E-E-A-Tを強化

詳細な仕様は Google Search Central の構造化データドキュメントを参照してください。重要なのは「スキーマを入れれば順位が上がる」のではなく、AIが段落の意味を正しく把握するためのヒント として機能するという点です。

llms.txt｜AIクローラー向けの案内ファイル

llms.txt は、ChatGPT・Perplexity・Google AI Overview等のAIクローラーに対して「このサイトの重要ページはここです」と案内するテキストファイルです。2024年後半から英語圏で提唱され、2026年現在は実装するサイトが徐々に増えています。

詳しい仕様と書き方は llms.txt完全ガイドで解説していますが、要点は次の3つです。

軽量版（llms.txt）と完全版（llms-full.txt）の2種類を用意する
ピラーページ・1次情報ページを優先的に列挙する
カテゴリ別の階層構造で整理する

ケンランSEOでは pro プラン以上で llms.txt の自動生成機能を提供しており、microCMS連携・WordPress XMLアップロード・Redirectionマップ連携の3方式に対応しています。中小企業向け価格帯で llms.txt 生成までカバーするツールは2026年時点では希少なので、手元で動かして感触を掴みたい方には有力な選択肢です。

1次情報の設計｜AIに引用されるための「他にないデータ」

ここまでの論点（Grounding Budget・自己完結型パッセージ・エンティティ権威・マルチモーダル・スキーマ）はすべて 技術的な器 の話でした。しかし本当の差別化は、その器の中身である コンテンツの独自性 にあります。

AIに引用される記事の共通点は、「他の記事にないデータや経験が書かれている」ことです。言い換えると、AIが他の100記事から合成できない情報が1つでも入っているかどうかが、引用される記事と埋もれる記事を分けます。

1次情報の具体例

自社サービスの実稼働データ: 「導入10社の平均CVR変化」「2025年のクロール処理件数」等
独自調査・アンケート結果: N数と調査方法を明記した定量データ
現場の写真・スクリーンショット: ストックフォトではなく実物
A/Bテストの結果: 勝敗と数値を公開する
失敗事例: 上手くいかなかった施策の記録（これは特にAIが合成できない）

Semrush が20,000キーワード・42,000記事を分析した2025年の研究では、1位に表示されるコンテンツの80%は人間執筆で、純粋なAI生成は9% にすぎないと報告されています(Search Engine Land – Human vs AI Study)。この差を生むのは、AIが生成できない「経験に基づく1次情報」の有無です。