この記事ではデータの概要の確認方法を紹介します。
連続変数の要約
summary()で最大値、四分位点、平均値、中央値、最小値が表示されます。
今回はrenshuというデータファイルのHeight(身長)の最小値(Min)、四分位点(1st Qu, 3rd Qu)、中央値(Median)、平均値(Mean)、最大値(Max)がわかりました。
離散変数の集計
table()で0と1の個数が集計されます。
今回はrenshuというデータファイルのMale(1)が5人、Female(0)が5人であることがわかりました。
さらにprop.table(table())で0と1の割合を求めることができます。
今回はrenshuというデータファイルのMale(1)が50%、Female(0)が50%であることがわかりました。
Table1の作り方
論文のTable1にあたるBaseline Characteristicsの作り方です。
患者背景の要約を行います。
まずinstall.packages (“tableone”)でtableoneというパッケージをインストールします。
インストールするとlibrary(“tableone”)でこのパッケージを使用することができます。
CreateTableOne(vars = c(“Height”, “BW”, “BMI”, “LDL”, “HDL”, “DM”), strata = “Male”, factorVars = “DM”, data = renshu)
vars:テーブルに入れる変数
strata:群分けする変数
factorVars:varsにある離散変数
data:データフレーム名
p = 0.05未満を有意とすると、今回のBaseline Characteristicsでは、Male(1)はFemale(0)と比べてHeight、BW有意に高値で、BMIが有意に低値ということがわかりました。
Tableoneパッケージはこちらで解説されており、最初に知ったときは感動しました。