読者です 読者をやめる 読者になる 読者になる

いずにゃんの研究日記

専門性を広げるための練習場

けものフレンズのTwitterアカウントフォロワー変動履歴をAnime APIから読み込んでグラフにしてみる

R

2月6日頃から,ネット上で「けものフレンズ」への関心が急激に高まっていたようである。下図はGoogleトレンドのグラフであるが,2月9日を100とした場合に,2月5日に9だった指標が,6日に35,2月8日に90,といった具合に変化していた。 公式Twitterアカウント…

日本語データの入ったcsvを読む込む(Windowsの場合)

R

今回はたぶんWindows限定の内容な気がする。RStudioはVersion 1.0.44を使用。 csvファイルを用意する いつものように「ラブライブ!サンシャイン!!」から,スクールアイドルグループAqoursのメンバーのデータを使用する。 library(tidyverse) dat <- data_fr…

はじめてのggplot2(1):基本構造と散布図

R

タイトルはggplot2であるが,RStudioを起動したら迷わず,関連パッケージを一気に読み込んでくれるtidyverseパッケージをロードすればよい。 library(tidyverse) いつものように「ラブライブ!サンシャイン!!」のスクールアイドルグループAqoursのメンバーの…

はじめてのdplyr(4):キー変数で2つのデータを横に連結する

R

タイトルはdplyrであるが,RStudioを起動したら迷わず,関連パッケージを一気に読み込んでくれるtidyverseパッケージをロードすればよい。 library(tidyverse) 2つのデータの作成 過去の記事, はじめてのdplyr(1):行のソートと選択,変数のkeepとdropま…

因子型(factor型)の水準操作が便利になるforcatsパッケージ

R

カテゴリ変数を扱う際に,因子型(factor型)の理解が必要になるが,最初は扱いに苦労する。しかし,それを解決するパッケージがあるらしい。 factor型をいじるためのパッケージ{forcats}の全関数の紹介と解説をまとめました https://t.co/q0XbodxLNZ tidyve…

RでAnime APIから季節のアニメ情報を読み込んで一覧できるデータフレームにする

R

3か月ごとに,アニメの新番組チェックが忙しくなる時期がやってくる。 こんなとき,放映されるアニメ番組一覧の情報を手軽に作成できたら便利である。 それがRでできたらさらに心健やかになるに違いない。 アニメ番組一覧の情報について,アニメとITの融合「…

はじめてのtidyr(1):データをwideからlongにする,その逆も

R

サンプルデータは下記記事を参照。 izunyan.hatenablog.com name grade height B W H 1 高海千歌 2 157 82 59 83 2 桜内梨子 2 160 80 58 82 3 松浦果南 3 162 83 58 84 4 黒澤ダイヤ 3 162 80 57 80 5 渡辺曜 2 157 82 57 81 6 津島善子 1 156 79 58 80 7 …

はじめてのdplyr(3):適切なデータ表示になるデータフレームの便利版

R

チートシートのいちばん最初,"Syntax"の部分で紹介されている,大規模データを扱う時に重宝するデータセットの作成方法について説明する。 次のような行数の多いデータセットを作成してみる。以下のコードをコピペして実行すればデータができる。 dat <- da…

はじめてのdplyr(2):平均値を算出しデータセットに追加,層別の計算も

R

前回の izunyan.hatenablog.com の続きを解説する。サンプルデータは上記記事を参照。 まずは,単純に身長の平均値をheightmという名前で作成してみる。 チートシートでは,"Summarise Data"の部分。 dat %>% summarise(heightm=mean(height)) heightm 1 158…

はじめてのdplyr(1):行のソートと選択,変数のkeepとdropまで

R

本記事は,Rのパッケージdplyrを自分が数日前に使い始めて感動したので,まだ使ってない人が気軽に使えるようになるための解説である。dplyrが使いこなせれば,データの整理が非常に楽になりそう。 すでにdplyrが話題になって久しいことは感じていたが,なか…