誰がllms.txtを見ているのか
観察
seo.codequest.workにllms.txt / llms-full.txtを設置した。GA4でアクセスログを確認すると、アクセス自体はある。しかしそれがAIクローラーなのか人間なのか、GA4だけでは判別できない。GA4はJavaScript計測であり、多くのボットはJSを実行しないためそもそも計測対象外になる。
違和感
CDNログやサーバーログを持つ企業の大規模調査を見ると、状況は「AI検索全般に効く」という期待とは大きく異なる。Mintlifyの25社CDN分析ではllms.txtにアクセスしているのはほぼChatGPT(OAI-SearchBot)のみ。llms-full.txtはllms.txtの約5.6倍アクセスされている。Longatoの1,000ドメイン30日間CDNログ監査ではPerplexityBotからのllms.txtリクエストがゼロ。ClaudeBotからのリクエストもゼロ。「AI検索全般に効く」という前提がデータレベルで崩れている。
GA4の限界がここで露呈する。GA4はUser-Agentベースのボットフィルタリングがあるため、AIクローラーのアクセスを正確に捕捉できない。llms.txtの効果検証にはCDNログレベルの解像度が必要だ。GA4で「llms.txtにアクセスがある」と安心するのは、計測の盲点に依存した判断になる。
それでもチェック項目にしている理由
自サイトでの観察
seo.codequest.workにllms.txtを設置した後、実際にChatGPTからのアクセスを確認している。Mintlifyの25社CDN分析で報告されているのと同じ現象が自サイトでも起きている。llms.txtを設置すれば、少なくともChatGPTは読みに来る。これは観察された事実だ。
設計判断: 「先にチェック対象にする」
SEO_CHECKはllms.txtを技術SEOのチェック項目として実装している。配点はBasic 1点、Pro最大3点。30万ドメイン調査で相関が出ていないのにチェック項目にしている理由は明確だ。今後の展開次第でAI検索の評価項目になる可能性があるなら、先にチェック対象に含めておく。「効果が確定してから対応する」のでは遅い。設置コストが極めて低い施策であればなおさら、ユーザーには先行して備えてもらう方が価値がある。
配点の控えめさが示すもの
Rich Results適格性は効果がCTR改善として実証されているから20点。llms.txtは「アクセスされている事実はあるが、引用やランキングへの影響は未証明」だから1〜3点。この配点差は確度の差を表現している。AIベンダーが公式にサポートを表明する、あるいは大規模調査で効果が確認されれば、配点は見直す。チェック項目として先行して含めておくことと、現時点での確度に応じた配点にすることは両立する。
Proプランでの3点の内訳は、設置で1点、タイトルとリンクの完備で+1点、.well-knownパスへの対応で+1点。設置の有無だけでなく実装品質も見ている。備えるなら正しく備える — これはSEO_CHECKの全項目に共通する設計思想だ。
AI引用の痕跡はあるか
発見
GSCではAI引用のトラフィックを直接分離する手段がない(2026年4月時点)。Google AI Overviewsの表示は確認できるが、ChatGPTやPerplexityからの引用トラフィックはGSCの計測対象外だ。llms.txtを設置した効果をGSCで測ることは、そもそも計測アーキテクチャ上の不可能に直面する。
外部調査データ
SE Rankingの30万ドメイン調査ではllms.txt有無とAI引用頻度に統計的相関がない。ALLMOの94,614引用URL分析ではllms.txtページが引用されたのはわずか1件(0.001%)。OtterlyAIの90日実験では62,100件のAIボットリクエスト中、llms.txtアクセスは84件(0.1%)にとどまった。「llms.txtを置いたからAI検索に引用される」を裏付けるデータは、現時点で存在しない。
GA4ではボットを識別できず、GSCではAI引用を分離できず、CDNログを持たない限りllms.txtの効果を正確に計測する方法がない。計測不能な施策のROIを論じること自体に限界がある。
仮説: llms.txtの効果は「GEO」ではなく「開発者ツール連携」
観察
llms.txtを実際に日常的に活用しているのはClaude Code・Cursor・Windsurf等のコーディングアシスタントだ。開発者がユーザー指示で明示的にURLを指定し、ドキュメントを読み込ませる用途で使われている。AI検索エンジンが自律的にllms.txtを読みに行く挙動とは根本的に異なる。
仮説
llms.txtの実用的価値は「AI検索最適化」ではなく「開発者ツール向けのドキュメント構造化」にある。GEO施策としてのROIは現時点でデータに裏付けられていないが、開発者エコシステムにおけるドキュメント提供手段としては機能している。
検証
dev5310の実験でもPerplexityBotのllms.txtリクエストはゼロ。Perplexityはコンテンツ本体を直接クロールしており、llms.txtを参照していない。ClaudeBotも同様。一方でClaude CodeやCursorはユーザー指示があれば読み込む。「自律的に読まれる」と「指示で読み込ませる」は別の話だ。
仮説: ChatGPTがllms-full.txtを多くアクセスする理由
観察
MintlifyのCDNデータでllms-full.txtはllms.txtの約5.6倍アクセスされている。ChatGPTがllms-full.txtトラフィックの大半を占める。他のAIシステムからのアクセスはほぼない。
仮説
LLMはRAG的な部分取得より全文取り込みを好む傾向がある。目次(llms.txt)より全文(llms-full.txt)を選択するのはこの傾向に合致する。ただし「アクセスしている」と「回答に活用している」は別問題だ。アクセスが引用に結びつくかは未検証であり、SE Rankingの30万ドメイン調査では相関が確認されていない。
分析
ChatGPTだけがllms.txtを読んでいる事実は、OpenAIがこの仕様を何らかの形で活用している可能性を示唆する。しかし「読んでいる=引用に反映されている」を立証するデータはない。30万ドメインで相関なしという結果は、仮にChatGPTがllms.txtを読んでいても、それが回答品質や引用確率に寄与していない可能性を指している。
仮説: 「公式サポートゼロ」が意味するもの
観察
llms.txtを公式にサポートすると表明したAIベンダーはゼロだ。OpenAI、Anthropic、Google、Meta — いずれも公式なサポート宣言を出していない。GoogleのJohn Muellerは「No AI system currently uses llms.txt」と明言している。
矛盾
しかしGoogle自身のドキュメントサイトにはllms.txtが設置されている。MuellerのコメントとGoogleの実装が矛盾している。この矛盾は「将来への備え」か「内部CMSの自動生成」かで評価が分かれるが、いずれにせよ「公式にはサポートしていないが、実質的にはファイルを配置している」状態だ。
仮説
AIベンダーは「公式サポート」を表明することの法的・規範的リスクを回避している可能性がある。サポートを宣言すれば「llms.txtを読んでいるならrobots.txtのdisallowも尊重すべき」という議論が発生する。事実上の読み取りと公式サポートを切り離すことで、クロール範囲の自由度を確保している可能性がある。
この分析から得た判断基準
llms.txtの設置コストは極めて低い(テキストファイル1つ)。やっても損はないが、GEO施策としての優先順位は低い。「設置した=AI検索対策済み」と考えるのは過大評価だ。
効果を計測するならCDNログでUser-Agent別のアクセスを追う。GA4やGSCでは捕捉できない。CDNログがなければ、llms.txtの効果を定量的に評価する手段がないことを受け入れる必要がある。
llms.txtよりも、サイト本体のコンテンツ品質・構造化データ・E-E-A-Tの方がAI引用に寄与する可能性が高い。「Googleへの伝達精度を上げる」方がAI引用にも効く — これは構造化データの分析と同じ結論だ。
GEOの正体
GEO(Generative Engine Optimization)は2023年にPrinceton・Georgia Tech・IIT Delhiの研究者が提唱した概念で、AI搭載の検索エンジン全般に対するコンテンツの最適化を指す。Google検索だけでなく、ChatGPT・Perplexity・Geminiなどすべてのai検索が対象だ。
しかし今回のデータが示しているのは、GEO専用の特効薬は現時点では存在しないということだ。llms.txtの効果は未証明。AI検索エンジンごとに挙動はバラバラ。「GEO施策」として一括りにできる統一的な最適化手法が見当たらない。
SEO_CHECKの見解
GEOの正体は、現時点では「良いSEOそのもの」だ。AI検索エンジンはllms.txtではなくサイト本体のコンテンツを直接クロールしている。コンテンツの専門性、構造化データによる意味の明示、E-E-A-Tの確立 — Googleへの伝達精度を上げることが、そのままAIにとっての引用しやすさにもなる。
ただし、AI検索は急速に進化している。今日の「効果なし」が明日の「必須施策」になる可能性は十分にある。だから「GEOという概念を念頭に置きながらSEO対策をする」のが正しいアプローチだと考えている。SEO_CHECKがllms.txtを効果未証明の段階からチェック項目に含めているのもこの考え方に基づく。将来何か変わるかもしれない — その変化に備えて、今できる低コストの施策は先行して実装しておく。