いずにゃんの研究日記

専門性を広げるための練習場

婚約指輪についてdiamondsデータで学びを深める

ブライダルリング専門ブランド「アイプリモ調べ」によれば,2018年の時点で, 婚約指輪をあげた(もらった)者の割合は60.8%, 指輪を選んだ方法は,パートナーとお店に行ってが46.8%

www.iprimo.jp

ということから,やはりまだ婚約指輪は一般的みたいなので,知識をつけて おく必要はありそう。

ダイヤモンドの4C(Cut, Color, Clarity, Carat)の説明 zexy.net

diamondsデータについて

library(tidyverse)

# 因子型変数の確認
levels(diamonds$cut)
levels(diamonds$color)
levels(diamonds$clarity)

[1] "Fair" "Good" "Very Good" "Premium" "Ideal"
[1] "D" "E" "F" "G" "H" "I" "J"
[1] "I1" "SI2" "SI1" "VS2" "VS1" "VVS2" "VVS1" "IF"

  • cutとclarityは悪い方から順に並んでいる
  • color だけ良い方から順に並んでいる

colorの水準を逆転

dat <- 
  diamonds %>% 
  mutate(color = fct_rev(color))

diamondsデータで4Cと値段の関係をプロットする

まずは全体のデータで横軸にカラット,縦軸に値段の散布図を作成

ggplot(data = dat) + 
  geom_point(aes(carat, price)) 

f:id:izunyan:20190504000440p:plain

1ctを超えると急激に値段が上昇している。

下記リンク先の説明によれば,
大きい方がいい?婚約指輪のダイヤモンド|結婚指輪・婚約指輪|ゼクシィ

婚約指輪のカラット数は0.3〜0.5ctが一般的

であるため,横軸の表示を0.3〜0.5ctに制限

ggplot(data = dat) + 
  geom_point(aes(carat, price)) + 
  coord_cartesian(xlim = c(0.3,0.5), ylim = c(0,5000)) # X軸とY軸の範囲指定

f:id:izunyan:20190504001055p:plain

重なって分かりにくいので,jitterを追加

ggplot(data = diamonds) + 
  geom_jitter(aes(carat, price), alpha = 0.3) + 
  coord_cartesian(xlim = c(0.3,0.5), ylim = c(0,5000))

f:id:izunyan:20190504001817p:plain

カラットと値段の散布図でカットの色別

ggplot(data = dat) + 
  geom_jitter(aes(carat, price, color = cut), alpha = 0.5) + 
  coord_cartesian(xlim = c(0.3,0.5), ylim = c(0,5000)) +
  guides(color = guide_legend(reverse = TRUE)) # legendの順番逆に(良い方が上に来るように)

f:id:izunyan:20190504004117p:plain

カラットと値段の散布図でカラーの色別

ggplot(data = dat) + 
  geom_jitter(aes(carat, price, color = color), alpha = 0.5) + 
  coord_cartesian(xlim = c(0.3,0.5), ylim = c(0,5000)) +
  guides(color = guide_legend(reverse = TRUE)) # legendの順番逆に(良い方が上に来るように)

f:id:izunyan:20190504004121p:plain

カラットと値段の散布図で透明度の色別

ggplot(data = diamonds) + 
  geom_jitter(aes(carat, price, color = clarity), alpha = 0.5) + 
  coord_cartesian(xlim = c(0.3,0.5), ylim = c(0,5000)) +
  guides(color = guide_legend(reverse = TRUE)) # legendの順番逆に(良い方が上に来るように)

f:id:izunyan:20190504004113p:plain

婚約指輪の一般的なカラットの範囲では,透明度がいちばん値段との関係がありそう, という学びが得られた。カットはそれほど値段との関係がはっきりしなそう。