UFO目撃は「人口の割に」どこで多いのか — 残差で読み解くMakeoverMonday 2026 Week25

UFO目撃は「人口の割に」どこで多いのか — 残差で読み解くMakeoverMonday 2026 Week25

公開日: 2026-06-24
カテゴリ: MakeoverMonday

今週のお題

今週のMakeoverMondayは、米国NUFORC(National UFO Reporting Center)に寄せられたUFO目撃報告のデータ(約1,317件)。州・都市・形状・目撃時間など、1件ごとの報告が緯度経度つきで記録されています。

「どの州でUFO目撃が多いか」を素直に数えると、上位はフロリダ(119件)、カリフォルニア(117件)、テキサス(82件)……と並びます。ただ、これは半分は当たり前の話です。人が多い州ほど、目撃する人も、報告する人も増える。目撃数の地図は、ほとんど人口の地図と同じになってしまいます。

そこで今回は問いを一段変えました。「人口で予測される目撃数より、実際に多い/少ない州はどこか?」 ——人口の効果を差し引いて、それでも残る”UFOらしさ”を見つけにいきます。

作成したダッシュボード

Tableau Public でダッシュボードを見る

タイトルは「Where Are UFO Sightings More Common Than Expected?」。上段に「人口 × 目撃数」の散布図、下段に全米コロプレスマップ(個別目撃地点を黒点で重ね描き)を配置し、両者を同じ色基準で連動させています。

工夫した点・こだわり

1. 「実数」ではなく「予測との差(残差)」を主役にした

散布図に人口を説明変数とした回帰直線(=期待される目撃数)を引き、各州が直線の上か下かで色を分けました。直線より上=人口の割に目撃が多い(青)、下=少ない(オレンジ)。色は残差を表す発散(ダイバージング)配色で、レンジは −33.75 〜 +56.62。

これにより、ひと目で物語が立ち上がります。

  • フロリダ:散布図で大きく直線の上に飛び出す最大の正の外れ値。人口規模から期待される以上に目撃報告が多い州。
  • ペンシルベニア/ワシントン/オハイオ/ミシガン:いずれも直線の上側(青)。人口の割に目撃が多いグループ。
  • ニューヨーク/イリノイ:人口は多いのに直線の下側(オレンジ)。期待を下回る「報告が少ない」州。
  • カリフォルニア:目撃数自体は2位(117件)だが、巨大な人口で説明できる範囲=ほぼ直線上。「多いけれど想定通り」。

「件数ランキング」では埋もれてしまうこの差こそが、今回いちばん伝えたかった示唆です。

2. 散布図とマップを同じ残差カラーで連動

同じ色基準を散布図とマップで共有することで、「散布図で飛び出している青い点=マップでも青く塗られた州」と視線が自然につながります。下段マップにはアラスカ・ハワイをインセットで配置し、本土と離れた地域も切り捨てずに見せています。

3. 州を選んで深掘りできるインタラクション

「Click state!」のガイドを置き、州を選ぶと該当州だけがハイライトされる作りにしました(パラメータ+ブール式での選択判定)。全体傾向を見てから、気になる州を1つ掘る、という探索の流れを用意しています。

4. テーマに合った遊び心

UFO・宇宙人・指差しのイラストを余白に添え、データの堅さとお題のユーモアのバランスを取りました。装飾は分析領域を邪魔しない位置・サイズに抑えています。

使ったTableauの技術・Tips

■ 人口から目撃数を予測する計算フィールド(線形回帰の固定式)

// c.Predicted Sightings(人口から期待される目撃数)
7.44147e-07 * SUM([population]) + 15.0829

回帰の傾きと切片を定数として埋め込み、「人口 × 約0.00000074 + 15.08」で各州の期待目撃数を算出しています。これが散布図の点線(基準線)の正体です。

■ 残差=実測−予測で「期待からのズレ」を作る

// num(実測の目撃数)
COUNTD([id])

// c.Residual(残差:実測 − 予測)
[num] - [c.Predicted Sightings]

この残差を色に割り当てるだけで、「多い/少ない」が定量的に表現できます。COUNTD で重複報告IDを排除して件数を数えている点もポイントです。

■ トップ州を基準にしたシェア表示(LOD × 表計算)

// c.percentage%
[num] / WINDOW_MAX(MIN({FIXED [state] : [num]}))

{FIXED [state] : [num]} で州ごとの目撃数を固定し、WINDOW_MAX で最大州(フロリダ)を分母に取ることで「トップ州を100%とした相対値」を作っています。LOD表現と表計算を組み合わせる定番パターンです。

■ パラメータ+ブール式による州ハイライト

// f.selected state
IIF([p.state] = "ALL", TRUE, [state] = [p.state])

「ALLなら全件、州が選ばれていればその州だけTRUE」というブール値を作り、色やフィルタに使うことで、選択した州だけを浮かび上がらせています。

■ 設計の裏づけ(Tableau公式資料より)

  • 発散配色は「基準からの正負」にこそ使う:今回の残差のように中央(=期待どおり=0)を境に上下へ意味が分かれる指標は、発散カラーが最適です(『Visual Analysis Best Practices』)。
  • 2つの量の関係は散布図で:人口と目撃数のような連続量どうしの関係を見るなら散布図、というチャート選択の基本に沿っています(『最適なチャートを選択する方法』)。
  • データに語らせるより、問いを設計する:「どこが多い?」を「期待よりどこが多い?」へ言い換えた問いの立て方は、データストーリーテリングの核心です(『Data Storytelling』ホワイトペーパー)。

学び・振り返り

今回の最大の学びは、「実数の地図はしばしば人口の地図でしかない」という落とし穴を、残差という一手間で乗り越えられたことです。件数だけを見ればフロリダもカリフォルニアも「多い州」ですが、人口で割り戻すとフロリダは突出した外れ値、カリフォルニアは想定通り——まったく違う物語が見えてきます。

回帰式を定数で固定する方式は手軽ですが、データが更新されると傾き・切片を引き直す必要があります。次は MODEL_QUANTILE / MODEL_PERCENTILE などの予測モデリング関数や、Tableauの傾向線機能から係数を動的に拾う形にすると、再現性と保守性が上がりそうです。「なぜフロリダだけ多いのか(観光客数・沿岸部・打ち上げ施設など)」という次の問いにもつなげていきたいところです。


Tableau Public プロフィール: public.tableau.com/app/profile/tamaball38175


⚠️ 注記: この記事はAIを活用して生成されています。内容に誤りが含まれる可能性があります。技術的な詳細については公式ドキュメントも合わせてご確認ください。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です