婚約指輪についてdiamondsデータで学びを深める
ブライダルリング専門ブランド「アイプリモ調べ」によれば,2018年の時点で, 婚約指輪をあげた(もらった)者の割合は60.8%, 指輪を選んだ方法は,パートナーとお店に行ってが46.8%
ということから,やはりまだ婚約指輪は一般的みたいなので,知識をつけて おく必要はありそう。
ダイヤモンドの4C(Cut, Color, Clarity, Carat)の説明 zexy.net
diamondsデータについて
library(tidyverse) # 因子型変数の確認 levels(diamonds$cut) levels(diamonds$color) levels(diamonds$clarity)
[1] "Fair" "Good" "Very Good" "Premium" "Ideal"
[1] "D" "E" "F" "G" "H" "I" "J"
[1] "I1" "SI2" "SI1" "VS2" "VS1" "VVS2" "VVS1" "IF"
- cutとclarityは悪い方から順に並んでいる
- color だけ良い方から順に並んでいる
colorの水準を逆転
dat <- diamonds %>% mutate(color = fct_rev(color))
diamondsデータで4Cと値段の関係をプロットする
まずは全体のデータで横軸にカラット,縦軸に値段の散布図を作成
ggplot(data = dat) + geom_point(aes(carat, price))
1ctを超えると急激に値段が上昇している。
下記リンク先の説明によれば,
大きい方がいい?婚約指輪のダイヤモンド|結婚指輪・婚約指輪|ゼクシィ
婚約指輪のカラット数は0.3〜0.5ctが一般的
であるため,横軸の表示を0.3〜0.5ctに制限
ggplot(data = dat) + geom_point(aes(carat, price)) + coord_cartesian(xlim = c(0.3,0.5), ylim = c(0,5000)) # X軸とY軸の範囲指定
重なって分かりにくいので,jitterを追加
ggplot(data = diamonds) + geom_jitter(aes(carat, price), alpha = 0.3) + coord_cartesian(xlim = c(0.3,0.5), ylim = c(0,5000))
カラットと値段の散布図でカットの色別
ggplot(data = dat) + geom_jitter(aes(carat, price, color = cut), alpha = 0.5) + coord_cartesian(xlim = c(0.3,0.5), ylim = c(0,5000)) + guides(color = guide_legend(reverse = TRUE)) # legendの順番逆に(良い方が上に来るように)
カラットと値段の散布図でカラーの色別
ggplot(data = dat) + geom_jitter(aes(carat, price, color = color), alpha = 0.5) + coord_cartesian(xlim = c(0.3,0.5), ylim = c(0,5000)) + guides(color = guide_legend(reverse = TRUE)) # legendの順番逆に(良い方が上に来るように)
カラットと値段の散布図で透明度の色別
ggplot(data = diamonds) + geom_jitter(aes(carat, price, color = clarity), alpha = 0.5) + coord_cartesian(xlim = c(0.3,0.5), ylim = c(0,5000)) + guides(color = guide_legend(reverse = TRUE)) # legendの順番逆に(良い方が上に来るように)
婚約指輪の一般的なカラットの範囲では,透明度がいちばん値段との関係がありそう, という学びが得られた。カットはそれほど値段との関係がはっきりしなそう。