Rの使い方:相関係数・散布図

  • 2021年7月2日
  • 2021年10月1日
  • 統計-R
  • 492view

相関係数

Rで相関係数を求めるにはcor.test()を使用します。

ここでは例としてHbA1cとLDL-Cの相関係数を求めます。

 

今回使用するcsvファイルはこちらから

cor.test(df$HbA1c, df$LDL.C, method="spearman")

 

画像6

rhoが相関係数です。

相関係数 -1、p値<0.05でHbA1cとLDL-Cに負の相関が有意に認められました。

 

ここからは相関係数を表した図を作成します。

libraryの”ggsci”と”tidyverse”を使用します。

packageやlibraryの使い方については、こちらを参考にしてください。

library(ggsci)
library(tidyverse)
plt <- ggplot(df, aes(x=HbA1c, y=LDL.C))
plt <- plt + geom_point()
plt <- plt + geom_smooth(method = "lm", se=FALSE)+theme_bw()+xlim(4,9)+ylim(20,200)+
   labs(x="HbA1c (%)", y="LDL-C (mg/dL)")

上記コードではggplotで図を作成しています。

画像7

x軸をHbA1c, y軸をLDL-Cとしています。

xlim, ylimで表示する範囲を指定できます。

labsで表示する軸のタイトルを変更できます。

xlim, ylim と coord_cartesian の違いについてはこちらが良記事です。

 

わからなければ練習用データを使用し、下記コードをコピペして実行してみてから、自分が使いたいデータに当てはめることをお勧めします。

cor.test(df$HbA1c, df$LDL.C, method="spearman")

library(ggsci)
library(tidyverse)
plt <- ggplot(df, aes(x=HbA1c, y=LDL.C))
plt <- plt + geom_point()
plt <- plt + geom_smooth(method = "lm", se=FALSE)+theme_bw()+xlim(4,9)+ylim(20,200)+
   labs(x="HbA1c (%)", y="LDL-C (mg/dL)")

 

世界最大級のオンライン学習プラットフォーム Udemy

スポンサーリンク
最新情報をチェックしよう!