いずにゃんの研究日記

専門性を広げるための練習場

R

はじめてのggplot2(2):棒グラフを好みの色で描く

R

Aqoursのメンバーごとの身長の棒グラフを描く メンバーの並び順を変える 棒グラフを色で塗りつぶす 各メンバーの棒グラフの色をそれぞれ指定する ggplot2の基本の構造等は前回の解説を参照。 izunyan.hatenablog.com まずはいつものデータの読み込み。tidyve…

はじめてのlubridate(1)日付データを扱う

R

データを読み込む 日付変数に変換する 横軸が日付で縦軸が売上本数の線グラフを描いて,それぞれの達成日を点で示す 時点間の日数を計算して変数にする 追記:30万本目達成のデータ追加(2017/11/03) 日付データは,Rの基本的な関数だと初学者では扱うのが…

はじめてのtidyr(2):2つの変数の値を1つの変数にまとめる。または逆に分割する

R

以下のように,名字と名前が別々の変数となっている場合に, フルネームにして1つの変数としてまとめたいという時に役に立つ方法を 解説する。まずはデータの読み込み。 library(tidyverse) dat <- data_frame( family=c("高海","桜内","松浦","黒澤","渡辺"…

けものフレンズのTwitterアカウントフォロワー変動履歴をAnime APIから読み込んでグラフにしてみる

R

2月6日頃から,ネット上で「けものフレンズ」への関心が急激に高まっていたようである。下図はGoogleトレンドのグラフであるが,2月9日を100とした場合に,2月5日に9だった指標が,6日に35,2月8日に90,といった具合に変化していた。 公式Twitterアカウント…

日本語データの入ったcsvを読む込む(Windowsの場合)

R

今回はたぶんWindows限定の内容な気がする。RStudioはVersion 1.0.44を使用。 csvファイルを用意する いつものように「ラブライブ!サンシャイン!!」から,スクールアイドルグループAqoursのメンバーのデータを使用する。 library(tidyverse) dat <- data_fr…

はじめてのggplot2(1):基本構造と散布図

R

タイトルはggplot2であるが,RStudioを起動したら迷わず,関連パッケージを一気に読み込んでくれるtidyverseパッケージをロードすればよい。 library(tidyverse) いつものように「ラブライブ!サンシャイン!!」のスクールアイドルグループAqoursのメンバーの…

はじめてのdplyr(4):キー変数で2つのデータを横に連結する

R

タイトルはdplyrであるが,RStudioを起動したら迷わず,関連パッケージを一気に読み込んでくれるtidyverseパッケージをロードすればよい。 library(tidyverse) 2つのデータの作成 過去の記事, はじめてのdplyr(1):行のソートと選択,変数のkeepとdropま…

因子型(factor型)の水準操作が便利になるforcatsパッケージ

R

カテゴリ変数を扱う際に,因子型(factor型)の理解が必要になるが,最初は扱いに苦労する。しかし,それを解決するパッケージがあるらしい。 factor型をいじるためのパッケージ{forcats}の全関数の紹介と解説をまとめました https://t.co/q0XbodxLNZ tidyve…

RでAnime APIから季節のアニメ情報を読み込んで一覧できるデータフレームにする

R

3か月ごとに,アニメの新番組チェックが忙しくなる時期がやってくる。 こんなとき,放映されるアニメ番組一覧の情報を手軽に作成できたら便利である。 それがRでできたらさらに心健やかになるに違いない。 アニメ番組一覧の情報について,アニメとITの融合「…

はじめてのtidyr(1):データをwideからlongにする,その逆も

R

サンプルデータは下記記事を参照。 izunyan.hatenablog.com name grade height B W H 1 高海千歌 2 157 82 59 83 2 桜内梨子 2 160 80 58 82 3 松浦果南 3 162 83 58 84 4 黒澤ダイヤ 3 162 80 57 80 5 渡辺曜 2 157 82 57 81 6 津島善子 1 156 79 58 80 7 …

はじめてのdplyr(2):平均値を算出しデータセットに追加,層別の計算も

R

前回の izunyan.hatenablog.com の続きを解説する。サンプルデータは上記記事を参照。 まずは,単純に身長の平均値をheightmという名前で作成してみる。 チートシートでは,"Summarise Data"の部分。 dat %>% summarise(heightm=mean(height)) heightm 1 158…

はじめてのdplyr(1):行のソートと選択,変数のkeepとdropまで

R

本記事は,Rのパッケージdplyrを自分が数日前に使い始めて感動したので,まだ使ってない人が気軽に使えるようになるための解説である。dplyrが使いこなせれば,データの整理が非常に楽になりそう。 すでにdplyrが話題になって久しいことは感じていたが,なか…