SEOラボ

AI参照元別に流入記事のジャンルは分かれるか

自社GA4で30日間のAI参照元別流入を計測したところ、参照元ごとに流入記事のジャンルが明確に分かれて観測された。観測事実と、安易に一般化できない理由をフェアに整理する。

9分で読める2026-05-18

AI参照元別流入記事のジャンルとは、ChatGPT・Gemini・Perplexity等のAIサービス経由でWebサイトに着地するページの種類のことです。当社が別途運営するWeb制作者向けメディアの30日分GA4データでは、参照元AIごとに流入する記事のジャンルが明確に分かれて観測されました。ただし1サイト・短期間のスナップショットであり、業界一般の傾向としては扱えません。

要約

観測の要点

ジャンルの具体名(A〜Kが何のジャンルか)は当社が別途運営する観測元サイトの競合状況に配慮して伏せている。AI参照元とジャンルの対応関係・割合のみを共有する。

  • 1ChatGPT経由の流入は単一ジャンル(ジャンルA)が約64%を占め、次点(ジャンルB)が約28%。上位2ジャンルで9割超に集中する分布が観測された。
  • 2Gemini経由の流入は別の単一ジャンル(ジャンルE)が約58%を占め、残りは複数ジャンル(A・F・C・G)に分散した。
  • 3OpenAI Search経由の流入はさらに別のジャンル(ジャンルH)が約71%を占め、上位1ジャンルへの集中度がもっとも高かった。
  • 4Perplexity経由の流入は3つのジャンル(I・J・K)だけに分布し、A〜Hのいずれの主要ジャンルへの着地もゼロだった。
  • 5ChatGPTとGeminiの両方から流入が観測された記事は2ジャンル(A・C)に限定。それ以外のAI同士では、同じ記事への流入はほぼ重複していない。
  • 6ジャンル分布はAIごとに明確に分かれた。ただし、これが「AIの選好」なのか「自サイト構成の写像」なのかは現データだけでは切り分けできない。
検証手法

計測条件(再現できる粒度で開示)

観測対象は、当社が別途運営するWeb制作者・フロントエンド開発者向けメディアのGA4プロパティ。本ブログ(seo.codequest.work)とは別サイトであり、トラフィック規模や具体的なURLは公開していない。代わりに、計測手法と分類軸を再現可能な粒度で開示する。

GA4クエリ条件

期間:
30日間(2026年4月18日〜2026年5月17日)
ディメンション:
sessionSource × landingPagePlusQueryString
メトリクス:
totalUsers, sessions, eventCount
フィルタ:
sessionSource ∈ { chatgpt.com / openai.com / openai / perplexity.ai / gemini.google.com / gemini.com / claude.ai / copilot.microsoft.com / you.com / phind.com }
観測されなかった参照元:
claude.ai / copilot.microsoft.com / you.com / phind.com

得られたランディングページを、URLパターンとページタイトルから合計11ジャンルに手作業で分類した。1記事は1ジャンルに排他的に割り当てている。各ジャンルの具体名は観測元サイトの競合状況に配慮して伏せ、本記事ではA〜Kの記号で参照する。

観測結果

AI参照元別の流入ジャンル分布

ジャンル特定が可能だったランディングのみを母数として、AI別の分布割合を集計した。割合はおおまかな構成比として読んでほしい。

ジャンルラベルはA〜Kの記号に統一して匿名化している。記号が同じなら同じジャンルを指し、AI間で共通の記号が出てくる場合は両方のAIが同じジャンルに流入していることを示す(例:ジャンルAはChatGPTでもGeminiでも観測されている)。ジャンルの具体名(A〜Kが何のジャンルか)は、観測元サイトの競合状況に配慮して伏せている。

ChatGPT

単一ジャンル(ジャンルA)への集中度が高い。上位2ジャンルで全体の9割超を占めた。

ジャンルA
64%
ジャンルB
28%
ジャンルC
4%
ジャンルD
4%

Gemini

別の単一ジャンル(ジャンルE)が過半を占めた。ChatGPTの主要ジャンル(A)も二番目に出現するが、ChatGPTほどの集中ではない。

ジャンルE
58%
ジャンルA
17%
ジャンルF
8%
ジャンルC
8%
ジャンルG
8%

OpenAI Search

さらに別のジャンル(ジャンルH)が大半を占めた。同じOpenAI系列でも、ChatGPTとは集中先がはっきり違うことが観測された。

ジャンルH
71%
ジャンルE
14%
ジャンルD
14%

Perplexity

他のAI参照元では一切観測されなかった3ジャンル(I・J・K)だけに分布。他AIの主要ジャンル(A〜H)への着地はゼロだった。

ジャンルI
60%
ジャンルJ
20%
ジャンルK
20%

クロスAI観測

ChatGPTとGeminiの両方から流入が観測された記事は2ジャンル(A・C)に限られた。それ以外のAI同士では、同じ記事への流入はほぼ重複していない。AIごとに参照される記事ジャンルだけでなく、参照される記事そのものも分かれている可能性が示唆される。

仮説解釈

なぜジャンルが分かれて見えるのか(仮説)

観測されたパターンの背景には複数の仮説が考えられる。いずれも本データだけでは検証できない。本節は仮説の整理であり、結論ではない。

1

訓練データ・回答ロジックの違い説

各AIは異なる訓練データセット・引用ロジックを持つ。コードに強いとされるモデル・ツール推薦に強いとされるモデルなど、得意領域の差が引用パターンに反映されている可能性。検証には複数サイトでのクロス集計が必要。

2

UI動線の違い説

Geminiの検索画面はWorkspace連携や機能発見的な動線を持ち、Perplexityは下調べ・比較用途を前面に出している。UI設計の違いが「どのジャンルへ着地しやすいか」を間接的に方向付けている可能性。

3

利用シーン・ユーザー層の違い説

ChatGPTは「コードを書く相棒」、Perplexityは「下調べ」、Geminiは「Workspace連携の生産性ツール」のように、ユーザーが各AIを使う場面そのものが異なる。結果として参照される記事ジャンルも異なる、という解釈。

4

サイト構成の写像説(最重要の反証仮説)

観測元サイトに特定ジャンルの記事がもともと多い場合、AIが「そのジャンルを参照しに来ている」のではなく「サイトに存在するジャンル分布をそのまま映している」だけかもしれない。この場合、観測されたパターンは「AI側の傾向」ではなく「自サイトの構成」に過ぎない。

観測の限界

この観測で言えないこと(最重要セクション)

本記事はラボの観測共有であり、業界一般の指針ではない。読者が安易に一般化しないよう、現データの限界を明示する。

1サイトのデータである

観測対象は当社が別途運営する1サイトのGA4データに限られる。サイト構成・対象読者層・カテゴリ分布などはサイト固有の事情であり、業界一般を代表しない。

短期間のスナップショットである

30日という観測期間は、AI参照元の動向を語るには短い。各AIのUI更新・回答ロジック変更・季節要因に左右される可能性が高く、傾向の安定性を保証しない。

サイト構成バイアスを切り分けられていない

「Gemini=ジャンルEが過半」という観測も、対象サイトにジャンルE相当の記事が多いことの単純な反映である可能性を排除できていない。AI参照元 × ジャンル分布の交互作用を識別するには、構成の異なる複数サイトでのクロス検証が必要。

GA4側の計測上限がある

AI経由のアクセスはリファラを送らないケース・直接アクセスとして計測されるケース・sessionSourceが (not set) になるケースが混在する。今回の集計でも (not set) のレコードが存在し、AI流入の真値とは差がある可能性が高い。

「AIの選好」と読み替えてはいけない

観測されたジャンル分布の偏りを「AIが○○を好む」と表現してはならない。この記事中で「好む」「prefer」相当の語彙を使っていないのは意図的だ。観測と選好は別レイヤーである。

反対仮説:単なる偶然・分布の写像

観測されたパターンは「AI側の意味のある傾向」ではなく、「短期サンプルの偶然」「サイト構成の単純な写像」である可能性が常にある。これらの反対仮説をデータで棄却できない限り、観測パターンを意思決定の根拠にはできない。

もしこの傾向が一般化できるなら(if構文の実務メモ)

前節までの限界を承知のうえで、「もしこの傾向が一般化できるなら」という条件付きで、AI時代のコンテンツ設計に応用しうる方向を整理する。本記事はジャンルの具体名を伏せているため、ここでも個別ジャンル向けの打ち手は提示しない。代わりに、自サイトのGA4で同じ集計を回して「自サイト版のジャンル分布」を作るための手順を示す。

AI参照元観測された集中度の型自サイトで確認すべきこと
ChatGPT単一ジャンルに60%超が集中(上位2ジャンルで90%超)自サイトでも上位ジャンルに集中するか確認。集中するなら、その上位ジャンル記事の構造化データ型と見出し構造を最優先で点検。
Gemini主要ジャンルが過半。ChatGPTとは別ジャンルに集中ChatGPT向け改善とは別の記事群が伸びる可能性。「主要ジャンルがChatGPTと一致するか/違うか」を見て、改善対象記事の重複を確認。
OpenAI Search1ジャンルへの集中度がもっとも高い(約71%)自サイトでも1ジャンル集中が極端に出るかを確認。出る場合、そのジャンル記事の直接回答ブロック・FAQPage構造化データを優先点検。
Perplexity3〜数ジャンルに分散。他AIの主要ジャンルへの流入はゼロ他AIで主要だったジャンルがPerplexityでもゼロかを確認。ゼロなら、Perplexity経由は別の記事群が担うことになる前提で内部リンク戦略を組む。

繰り返すが、いずれも「観測で示唆される」レベルの方向性であって、実行を保証するものではない。自サイトのGA4で逆の傾向が観測されたなら、上記表は無視してよい。

観測を強化するための次のアクション

  • 1観測期間を90日・180日に延長し、傾向の安定性を継続観測する。
  • 2構成の異なる複数サイト(コンテンツ中心/ツール中心/コーポレート)で同様の手法を回し、サイト構成バイアスを切り分ける。
  • 3ランディングのジャンル分類軸を、構造化データの type(HowTo・SoftwareApplication・FAQPage・Article等)でクロス集計する。
  • 4リファラなし・(not set) を含む直接流入も母数に加え、AI流入の真値推計に近づける(タイムスタンプ・UA・着地パターンからの推定)。
  • 5本サイト(seo.codequest.work)でも同じ計測を回し、コンテンツSEOツール業界での参照パターンを別サンプルとして記録する。

まとめ:観測の共有として読んでほしい

AI参照元別に流入ジャンルが明確に分かれて観測された。これは「事実として観測された」レベルの主張だ。

一方で、「AIがそのジャンルを好むから」と断定する根拠はまだない。サイト構成の写像である可能性、短期スナップショットの偶然である可能性、いずれも棄却できていない。本記事は、観測を業界一般化せず、複数仮説と限界をセットで共有する形にこだわっている。AIエコシステムが急速に動く現在、「観測の正直な共有」自体に意味があると考えている。

AI参照元に届くサイト構造になっているかチェックする

構造化データ・見出し構造・直接回答ブロック・E-E-A-Tなど、AI引用に効くとされる項目を含めて、CodeQuest.work SEOで一括診断。

今井政和

この記事を書いた人

今井政和

SEOディレクター / フロントエンド開発者

Web業界20年以上の経験を持つSEOディレクター。CodeQuest.work SEOの開発者。WordPress公式プラグイン「ORECTIC SEO CHECK」作者。著書に「三方良しで勝つ 江戸商人に学ぶ現代WEB戦略」。

@imai_director

よくある質問

観測されたAI別のジャンル傾向は他のサイトでも再現できますか?
現時点では断定できません。今回の観測は当社が別途運営する1サイトのGA4データに基づくものであり、サイト構成や扱うジャンルの分布そのものがバイアスとして含まれます。たとえば「Gemini流入がジャンルEに偏って見える」のは、AI側の傾向ではなく自サイト側にジャンルE相当の記事が多いことの写像である可能性があります。複数サイト・長期間のデータで検証されない限り、業界一般の傾向としては扱えません。
ChatGPT・Gemini・Perplexity・OpenAI SearchはGA4でどう識別しましたか?
GA4のディメンション sessionSource を chatgpt.com / openai.com / openai / gemini.google.com / gemini.com / perplexity.ai / claude.ai / copilot.microsoft.com / you.com / phind.com の10種で絞り込みました。期間は30日間、ディメンションは sessionSource × landingPagePlusQueryString、メトリクスは totalUsers / sessions / eventCount を取得しています。claude.ai / copilot / you / phind は当該期間に流入が確認できませんでした。
「ジャンルが分かれて観測された」を「AIがこのジャンルを好む」と読み替えてよいですか?
読み替えるべきではありません。本記事では「観測された」「示唆される」「ありそう」レベルにとどめ、AI側の選好(好む/優先する)を断定する表現を避けています。理由は、観測されたパターンが (1) AIの引用傾向、(2) AIのUI動線、(3) ユーザーの使い方、(4) 自サイトの記事構成の写像、のいずれによるものかを切り分けられないためです。複数の解釈が可能な段階で「好む」と書くと、根拠が観測の重みを超えてしまいます。
なぜ具体的な記事タイトルやセッション数を公開していないのですか?
別途運営しているサイト側の競合状況に配慮し、流入先の特定や流入規模の特定につながる情報は公開していません。本記事の目的は「AI参照元別にジャンルが分かれるパターンが観測された」という事実と方法論の共有であり、当該サイトのトラフィック規模の開示ではありません。再現可能性を担保するため、計測手法・ディメンション・期間は明示しています。
実務的にこの観測をどう活かせますか?
「もしこの傾向が一般化できるなら」という条件付きで2つの方向があります。(1) llms.txt のセクション構成をAI別に意識して並べる(ChatGPT向けに集中するジャンル群とGemini向けに集中するジャンル群を意識的に分ける)、(2) 記事の構造化データを「AI別の引用されやすい型」に整理する(HowTo型・SoftwareApplication型・FAQPage型などをジャンル別に最適化)。ただし現時点では一般化は早計なので、自サイトのGA4で同様の傾向が観測できるかをまず確認してから動くべきです。