データ可視化に知っておくべき7種類のグラフの作り方
データ可視化により、データが直感的になり、データの裏にある秘密を簡単に見つけることができます。可視化効果を効率的に実現する際、様々な種類のグラフ・チャートがあります。
複雑なデータ分析をする以上、複雑なグラフ・チャートで表現しなければ技術性が見えないと思う方が多いかもしれませんが、実際に、シンプルなグラフを適切に使えば、思いがけない効果を得ることができます。
この記事は7種類の可視化グラフの正しい作り方を解説します。
データを表示するグラフ・チャートを選択する前に、データを知っておくことが重要であり、特にデータ間の関係を分析する必要があります。よく見られるデータ間の関係は下記の通り:
データの関係性についての詳しい説明はデータ可視化:1つの図でわかるグラフ/チャートの選び方。
データ間の関係を明確化してから、最適なグラフのタイプを選択し、印象的なデザインを作りましょう。
一.棒グラフ
棒グラフはデータの時系列的な変化、さまざまなデータの比較、および部分と全体の関係を表します。四つのタイプがあります。
1.縦棒グラフ:
時系列データを表示します。
2.積み上げ棒グラフ:
部分と全体の関係を比較するときに使用でき、離散データと連続データに適用します。
3.横棒グラフ:
データのカテゴリが多く、軸ラベルが長い場合に使用できます。
4.100% 積み上げ棒グラフ:
各グループの合計値が重要ではなく、部分と全体の関係にのみ注意を払うときに使用します。
棒グラフの作り方:
1.水平方向の軸ラベル:
軸ラベルが読みやすくなるように、垂直方向に並べないでください。
2.適切な列間隔:
列間隔は列幅の1/2にするべきです。
3.横軸の値は0から始まる:
座標の原点が0を超えると、全体の値を正確に表すことができません。
4.配色の統一性を持たせる:
同じ色を使うのが一番いいです。データを強調したい場合、目立つ色を使ってもいいです。
5.カテゴリを適切に配置する:
単語の頭文字で並べ替えます。
二.円グラフ
円グラフは、離散データと連続データに適し、簡単に部分と全体の関係を表現することができます。データの量が少ない場合は、この方法が最も魅力的でわかりやすい方法です。二つのタイプがあります。
1.一般の円グラフ:
データの内訳、全体の割合や構成比を表します。
2.ドーナッツグラフ:
真ん中に最も重要な要素を置くことができます。
円グラフの作り方:
1.扇形のスライスを正しく配置する:
2つのデザインパータンがあります。
パータン一:最も大きいスライスを時計回りに12時の位置に配置します。 次に、2番目に大きいものを反時計回りに12時の位置に置きます。上の図に示すように、残りのスライスを反時計回りに配置します。
パータン二:最も大きいスライスを12時に置きます。上の図に示すように残りのスライスを時計回りに配置します。
2.5つ以下のカテゴリー:
データの割合が小さすぎると、グラフ上の地域を区別するのが難しくなります。カテゴリが多すぎる場合は、重要度の低いカテゴリを【その他】カテゴリに入れます。
3.比較関係を示す時に複数の円グラフを使用しない:
データを比較するには、円グラフではなく100% 積み上げ棒グラフを使用してください。
4.パーセンテージの合計が100%になるようにします。
三.折れ線グラフ
折れ線グラフは、時系列データ間の関係と連続データを表示します。トレンド、累積、減少と変化の表示に使われます。
折れ線グラフの作り方
1.4つ以下のデータ系列:
系列が四つを超えると、もう一つの折れ線グラフを作ります。
2.実線のみを使用する:
点線は注意を分散します。
3.横軸の値は0から始まる:
小さな範囲におけるデータの変化を表す場合は、目盛間隔を縮小します。
4.折れ線の最後に系列名のラベルを直接表示する:
短時間で折れ線の意味を閲覧者に伝えることができます。
5.折れ線の高さは、縦軸の最大値と同じぐらいにする:
折れ線グラフの最大の高さは、縦軸の最大値の2/3になります。
四.面積グラフ
面積グラフは時系列データ間の関係を示すことができます。折れ線グラフと異なるのは、面グラフは数量を明確に示すことができます。二つのタイプがあります。
1.積み上げ面積グラフ:
部分と全体の関係を可視化し、部分が全体に対する貢献を表示します。
2.100% 積み上げ面積グラフ:
全体の合計値が重要ではなく、部分が全体に対する割合を示す時に使用されます。
面積グラフの作り方:
1.読みやすくする:
積み上げ面積グラフでは、変化が目立つデータを一番上に、変化が小さいデータを一番下に配置します。
2.横軸は0から始まる:
データの精度を保持できます。
3.離散データを表示しない:
不安定なデータではなく、温度などの安定したデータを表示します。
4.4つ以下のデータ系列:
データ系列が多すぎると、チャートが読みにくくなります。
5.透明色の柔軟な使用:
データが重ならないようにしてください。重なりが避けられない場合、透明色を使用します。
五.散布図
散布図は、2組の変数間の関係を示します。データ量が多い場合は相関関係を示すことができます。
散布図の作り方
1.横軸は0から始まる。
2.複数の変数グループを含む:
サイズと色を使って変数を追加します。
3.トレンドラインを使用する:
トレンドラインはデータのトレンドと関連性を表示できます。
4.2つ以下のトレンドラインを使う。
六.バブルチャート
バブルチャートは散布図を構成するデータに加えて、それに関係するもう一つの量的なデータを加え、円の大きさで表すグラフです。
バブルチャートの作り方:
1.ラベルをはっきりさせる:
バブルとそのラベルを対応させます。
2.適切なバブルのサイズ。
3.ほかの形のバブルを使わない。
七.ヒートマップ
ヒートマップは、2次元データの個々の値を色や濃淡によって表現する可視化グラフです。
ヒートマップの作り方
1.簡潔な地図のアウトラインを使用する:
複雑なアウトラインが閲覧者の注意を分散します。
2.データ範囲を限定する:
データ範囲は3〜5グループにする必要があります。 範囲外のデータは+/-で示されます。
3.パターンをシンプルにする:
あまり多くのパターンを使うと、閲覧者がわからなくなります。
4.適切な色を使う:
色の対比が強すぎると、グラフの見た目が悪くなります。 地域を区別するために同じ色の濃さと明るさを調整する方が良いです。
以上はデータ可視化の代表的な7種類のグラフです。いずれのグラフを使うにしても、データを正しく、効果的に可視化することが重要です。
また、データの量が大きくなったり、データ間の関係が複雑になったりすると、上記の7種類より高度なグラフによってデータを分析する必要があります。
本記事はFineReportブログに掲載しました。(http://www.finereport.com/jp/analysis/datavisualgraph/)