33 視覚化の詳細

33.1 描画の原理

描画の原理(Grammar of Graphics)

Ggplot2 は、描画の原理という理論に則って設計されています。

一つ一つが層(Layer)になっていって、それを定めていくことで、描画(グラフを描いていくこと)をするという設計思想になっています。

  • データ:Data

  • 変数の対応:Aestics(絵を飾る要素): Mapping

  • 幾何的関数:Geom Functions

  • 統計的処理方法:Stat Option

  • 配置の選択:Position Option

  • 座標の選択:Coordinate Function

  • 尺度関数:Scale Function

  • テーマ関数:Theme Function

簡易的に表現すると、全体として次のようなコードになるというものです。すでに、実例をみてきましたから、おおまかなことは理解できるかと思います。このような設計思想を理解すると、コードを書く時にも、順に頭のなかで構成していくこともできるので、論理的に考えることができます。

ただ、あまり、理論にこだわるのは、ハードルを高くするだけだと思いますので、ここでは、設計思想の背景には、そんなものがあるのかぐらいに理解してくださればよいと思います。

ggplot (data = <DATA> ) +
  <GEOM_FUNCTION> (mapping = aes( <MAPPINGS> ), 
    stat = <STAT> , position = <POSITION> ) + 
  <COORDINATE_FUNCTION> + 
  <FACET_FUNCTION> + 
  <SCALE_FUNCTION> + 
  <THEME_FUNCTION>
  1. 最初にデータを指定します。パイプを使うことも可能です。

  2. 幾何関数は一つに限る必要はありませんが、まず、変数の対応を mapping = aes() で、定義し、それに、統計処理が必要な時は、stat として加え、場所指定をする時には、position として加えます。

  3. 座標系を指定します。

  4. 座標軸の物差しを指定します。

  5. 全体のテーマなどを最後に指定します。

33.2 詳細

上記の原理の詳細について述べます。

33.2.1 データ:Data

33.2.2 変数の対応:Aestics(絵を飾る要素)Mapping

33.2.3

幾何的関数:Geom Functions

33.2.4 統計的処理方法:Stat Option

33.2.5 配置の選択:Position Option

33.2.6 座標の選択:Coordinate Function

33.2.7 尺度関数:Scale Function

  • scale_x_log10(), scale_y_log10(): x 軸、または、y 軸を log10 の値にして表示。log10(1000) = 3, log10(1000000) = 6 など

  • scale_color_manual(..., values), scale_fill_manual(..., values): 引数 values = c() で、色を指定。RGB HEX Code または、色名。

    • RGB Color Codes Chart [リンク]

    • values = c("#999999", "#E69F00", "#56B4E9", "#FF0000", "#00FF00") , values = c("red", "orange", "yellow", "blue", "green")

  • scale_size_manual(..., values)

  • scale_shape_manual(..., values): [リンク]

  • scale_linetype_manual(..., values)

    • solid, dashed, dotted, dotdash, longdash, twodash. [リンク]
  • scale_alpha_manual(..., values)

33.2.8

33.2.9 テーマ関数:Theme Function

33.3 視覚化逆引き事典