グラフ選びの判断基準は「時系列か否か」だけではない?実務で迷わなくなる3つの視点
「時系列なら折れ線、それ以外は棒」という定説を耳にされた方は多いと思います。これは便利な目安ですが、正確ではありません。本当の判断軸は「カテゴリ間に意味のある順序があるかどうか」、すなわちデータ構造そのものを見ることにあります。
新人時代に「時系列データは折れ線、カテゴリ別データは棒」と教わった方は多いのではないでしょうか。シンプルで覚えやすく、たいていの場面では正解にたどり着けるルールです。ですが、実務に長く関わってくると、このルールには大事な部分が抜け落ちていると感じる場面が出てきます。
たとえば、「商品A・B・C・D・Eの売上」というデータを思い浮かべてください。時系列ではないので、定説に従えば棒グラフ一択です。ところが、もしこの順序が「価格帯の安い順」だったらどうでしょう。あるいは「ターゲット年齢の若い順」だったら。順序に意味があるなら、折れ線グラフのほうが構造を伝えられる可能性があります。
「軸が連続的か離散的か」がすべて
本当の判断基準は、横軸(X軸)が連続的な変化を表しているか、離散的な区分を表しているかです。連続的とは、隣り合う値の「間」に意味がある状態を指します。1月と2月の間には、1月15日や1月末日が物理的に存在します。20歳と30歳の間には、25歳が存在します。これらは連続的なデータです。
離散的とは、隣り合う値の間に意味がない状態を指します。「商品A」と「商品B」の間に「商品Aと商品Bの中間の何か」は存在しません。「東京」と「大阪」の間に意味のある中間値はありません。これらは離散的なカテゴリです。
折れ線グラフは、点と点を線で結びます。つまり「点の間にも何かがあるはずだ」という前提で描かれます。連続的なデータには適切ですが、離散的なカテゴリに使うと、本来存在しないはずの「間」を視覚的に作り出してしまいます。
順序付きカテゴリという中間地帯
世の中には、純粋な時系列でも純粋な離散カテゴリでもない、中間地帯のデータがあります。たとえば年代別の人口(20代、30代、40代…)、満足度の段階(とても満足、満足、普通、不満、とても不満)、商品サイズ(S、M、L、XL)などです。
これらは離散的ですが、順序に意味があります。20代と30代の間に「25代」はありませんが、20代の次は30代であって、いきなり40代に飛ぶことはありません。順序を逆にすると意味が変わってしまいます。こうしたデータを順序付きカテゴリと呼びます。
順序付きカテゴリでは、棒グラフでも折れ線グラフでも構いません。判断基準は「読み手に何を伝えたいか」になります。年代別の人口分布で「30代が突出して多い」ことを伝えたいなら棒グラフ、「30代を頂点に分布が広がっている流れ」を伝えたいなら折れ線グラフ。同じデータでも、語りたいことが違えば最適な選択は変わるのです。
時系列でも棒グラフが適切なケース
逆に、時系列データであっても棒グラフが適切な場面があります。「四半期の売上」「月次の新規契約数」のように、各期間の値そのものを比較する目的が強い場合です。
四半期売上を折れ線で描くと、Q1からQ2、Q2からQ3への「変化の流れ」が強調されます。一方、棒グラフで描くと、Q3が最大、Q2が最小、というように各四半期の絶対値の比較が前面に出ます。
判断のヒントは「読み手が比較するときに、隣り合う値だけを見るか、すべての値を見渡すか」です。月次のPV推移を見るとき、私たちは1月から12月までの線の動きを追いかけます。隣り合う変化に注目したいなら折れ線が向きます。一方、年に4回しかない四半期では、4つの数字をフラットに比較したい意図のほうが強いはずです。そういうときは棒グラフが向きます。
「時系列だから折れ線」ではなく、「隣り合う値の関係に意味があるから折れ線」と考えれば迷いません。
意外と多い「ハイブリッド」ニーズ
実務では「個別比較も傾向も、両方見せたい」という要望が頻繁に発生します。たとえば月次売上を、各月の値を比較しつつ、年間の傾向も伝えたいような場合です。
このとき、無理に1つのグラフに詰め込もうとすると、複合グラフ(棒+折れ線)に行き着きます。それ自体は悪くない選択ですが、第二の折れ線が「移動平均」や「累計」など、棒グラフの値とは別の指標を運んでいることが望ましいです。同じ値を棒と折れ線で重ねるのは、視覚的なノイズが増えるだけで情報量は増えません。
もう一つの解決策として、2つのグラフを並べる方法があります。左に棒グラフで個別の月を比較できる絵を、右に折れ線グラフで年間の傾向が見える絵を配置します。1つのグラフで全部を語ろうとせず、2つの視点で語る。資料のスペースが許すなら、これが最も誠実な選択であることが多いものです。
判断フローを整理してみる
これまでの議論を、実務で使える判断フローに整理します。
まず、横軸が順序を持たないカテゴリ(地域・部署・商品など、入れ替えても意味が変わらないもの)であれば、迷わず棒グラフです。横棒・縦棒の判断は、項目名の長さで決めてください。長ければ横棒。
横軸が連続量(時間・年齢・温度・所得など)であれば、折れ線グラフが第一候補です。ただし、「変化の流れ」よりも「個別の値の比較」を強調したい場合に限り、棒グラフを選びます。
横軸が順序付きカテゴリ(年代区分・サイズ・満足度段階など)であれば、伝えたいメッセージで選びます。傾向重視なら折れ線、個別比較重視なら棒グラフ。どちらでも成立する場合は、離散性を尊重して棒グラフを選ぶのが教科書的には推奨されます。
シンプルなルールほど、強い
「時系列なら折れ線」というルールは、確かに便利です。新入社員向けの研修ではいまだに有効でしょう。ですが、グラフ選びに少しでも自信を持ちたい方には、もう一段深い視点をおすすめします。
「データの構造を見る」という視点です。横軸が連続なのか、離散なのか。離散なら、順序があるのか、ないのか。これだけ意識すれば、ほとんどの場面で迷わずグラフを選べるようになります。残るのは、メッセージの優先度で決める部分だけです。
道具の選び方は、結局のところ材料の見極めから始まります。グラフ選びにおける「材料」は、データの構造です。次にデータを目の前にしたとき、5秒だけでも「このデータの軸は連続か、離散か」と自問してみてください。グラフ選びの精度が、確実に一段上がるはずです。