看護研究の分析方法(量的研究)~アンケートを分析しよう|看護研究「攻略」マニュアル(6)
「看護研究の担当になっちゃった!」という若手ナースのみなさんに向けて、看護研究の進め方や無理なくできるポイントを連載で解説していきます(連載一覧はこちら)。
第6回は「データの分析方法」です。
「難しい統計学とか無理~」と泣きたくなりますが、若手ナースが初めて取り組む看護研究では、そこまで高度な統計手法は必要なかったりします。
今回は、アンケート調査など「量的研究」で集めたデータの分析方法について、若手ナースの看護研究でよく使われる「分析方法の初歩」をやさしく解説します。
- 第7回:「質的研究」で集めたデータの分析方法(2022年6月公開予定)
もくじ
「量的研究」で集めたデータを分析する手順
さっそく、「量的研究で集めたデータの分析方法」を見ていきましょう。量的研究では、アンケート調査(質問紙法)でデータを収集することが多く、若手ナースの看護研究でも定番の研究方法です。
アンケートで収集したデータを分析するときは、次のような手順で「データの下ごしらえ」から始めましょう。
1)データを整理する(コーディング)
まずは、データを分析しやすい形に整理するところからスタートです。
回収したアンケート用紙には「01、02、03……」などとシリアルナンバー(ID)を振り、整理したデータと元の用紙を突き合わせられるようにしておきます。
シリアルナンバーを振ったら、次は「コーディング」の作業です。コーディングとは、アンケートの回答を数字(コード)に置き換えること。シンプルな数字に置き換えることで、データが扱いやすくなります。
こうしたデータのことを、統計の世界では「変数」と呼びます。性別・年齢・思う/思わないーなど、「回答者によって変わる数」と覚えておくと良いでしょう。
変数は4つの種類に分けられ、統計の世界では「尺度水準」と呼びます。後半でも出てきますが、ここではひとまず「データには、こんな4つの尺度(種類)があるんだな」と押さえておくくらいでOKです!
2)データを入力する
コーディングが終わったら、パソコンにデータを入力していきます。Excel(エクセル)やGoogleスプレッドシートを使うのが良いでしょう。ここでは、Excelを例にしていきます。
複数回答で尋ねた項目は、ちょっと注意が必要です。1つのセルに何個も数値を入れるのはNG。下の図のように、選択肢の数だけ列を分けて、別々に数値を入れるようにします。
入力データに間違いがあると、分析結果に響いてきます。入力データと元のアンケート用紙を突き合わせて確認するなど、ミスがないように気をつけましょう。
3)分析方法を選び、データを分析する
材料となるデータの下ごしらえが終わったら、分析方法を選びます。
データを分析するとは、「このデータから、こんな傾向が読み取れます」という結果を導くこと。ざっくり言えば、回答の平均値を出してみたり、年齢や経験の違いで特徴があるかどうかを比べてみたりする作業です。
どんなデータから何を見てみたいのかで、ある程度、分析方法は決まってきます。
若手ナースの看護研究では、次のような分析方法を用いることが多いでしょう。
この後は、それぞれの分析方法の基本的なポイントを解説していきます。
「研究計画書」にも「分析方法」をざっくり書いておく必要があるので、実際はもう少し早い段階で、分析方法の見当を付けておくことになります。
1つのデータの分布を見る(ヒストグラム、標準偏差)
1つの回答項目(変数)のデータについて、どんな分布の仕方をしているのかを見てみるのは、最もシンプルで基本的な分析方法です。
平均値や中央値、比率、標準偏差(平均値と比べたときのデータのバラつき具合)を読み解くなどが一般的です。
たとえば、回答者の年齢や体重、経験年数の特徴を見るときや、「こんな人たちに回答してもらいました」とデータ全体をとらえるときなどに用います。どんな研究でも、ほぼ必ずやるものと考えて良いでしょう。
ここでは、普段あまりなじみのない「ヒストグラム」と「標準偏差」について、基本的な考え方や分析の手順を説明します。
ヒストグラム
ヒストグラムとは、回答の分布を視覚的にわかりやすくグラフ化したものです。
上の例のように、グラフの山が真ん中にあり、左右対称になっている分布は「正規分布」と呼びます。
正規分布であれば、「平均値と中央値と最頻値が同じ」で、偏りがないデータと言えます。上の例の場合、平均値・中央値・最頻値はいずれも「5回」となっています。
▼平均値…全回答の合計を回答者の数で割った値
▼中央値…全回答を小さい順から並べたとき、ちょうど真ん中の順番に当たる値
▼最頻値…全回答の中で最も出現頻度が高い値
一方、下の例のように山が偏っていたり、2つになっている分布は「平均値・中央値・最頻値がズレている」ことになります。
この例の場合も、平均値を計算すると「5回」になります。でも、「A病棟の看護師は平均して月5回の夜勤を担当している」と分析するよりも、「人によって担当する夜勤回数のバラつきが大きく、一部の看護師に夜勤が集中している」と分析するのが適切ですよね。
こんなふうに、ヒストグラムでは「データのバラつき具合」を読み取ることができます。
ヒストグラムを作るには、Excelなどのグラフ機能を使うのが便利です。ヒストグラムにしたいデータを選択し、【挿入】タブ→【縦棒グラフの挿入】→【2-D縦棒】と進むと、パッとグラフが出てきます=下図参照。
縦棒と縦棒の間は空けないのが一般的です。グラフが出てきたら【縦棒を右クリック】→【データ系列の書式設定】→【系列のオプション】→【要素の間隔】と進み、「0%」にすると、縦棒同士がくっついたグラフになります。
標準偏差
標準偏差を出すのも、データのバラつき具合を検証する方法の一つです。
標準偏差とは、平均値に対して、どれくらいバラつきのあるデータなのかを表す基準のようなもの。
文献検討でチェックした論文に、「平均年齢は70.0 ± 10.0歳であった」のような表記を見たことがあるかもしれません。この「± ◯◯」が標準偏差のことです。統計表などでは「SD(Standard Deviation)」と略されます。
この「平均年齢 70.0 ± 10.0歳」が意味するのは、「調査対象は全員が60~80歳の人で、平均年齢は70歳」ということではありません。「調査対象のうち約68%が60~80歳の人で、平均年齢は70歳」を意味しています(正規分布の場合)。
※「68%って数字、どこから出てきたの?」と不思議かもしれませんが、これは正規分布の性質として決まっているものです。「正規分布はそうなるものなのだ」と理解しておきましょう!
標準偏差が大きい数値になるほど、グラフの山は低く・横幅が広くなり、標準偏差が小さい数値になるほど、グラフの山は高く・横幅が狭くなります。
つまり、「標準偏差が小さい=回収したデータはバラつきが少なく、平均値の近くにギュッと集まっている」と読み取れるというわけです。
標準偏差は、ExcelやGoogleスプレッドシートの関数で自動的に算出できます。【数式】タブ→【その他の関数】→【統計】→【STDEV.S】→標準偏差を出したいデータ範囲を選択すればOKです=下図参照。ただ、標準偏差の意味をより理解するなら「標準偏差の計算式」も一度、検索して確かめておくといいですね。
ちなみに、平均値は【AVERAGE】、中央値は【MEDIAN】で出せます。
※Excelなどの関数で標準偏差を求めるには「STDEV.P」と「STDEV.S」があります。母集団(例:A病院の看護師全員)の標準偏差を出したいときは「P(population)」、母集団から抽出したサンプル(例:A病院の看護師のうち50人)の標準偏差を出したいときは「S(sample)」を選びます。
2つの群のデータの関係を見る(カイ二乗検定、t検定)
「男性と女性」「経験年数が5年未満の看護師と、5年以上の看護師」のように、2つの群(グループ)を比べてデータの関係を見てみるのは、若手ナースの看護研究でよく取り組まれる分析方法です。
たとえば、
- 経験年数が5年以上の看護師と5年未満の看護師で、看護記録の負担感に違いがあるか
- ◯◯の研修を受ける前と後で、看護記録の記入時間に変化があるか
など、2つの変数(例:経験年数と負担感)の間に、どんな関係が成り立つかを調べるときに用います。
ここでは、よく使われる2つの分析方法「カイ二乗検定」「t検定」を見てみましょう。ちょっと難しくなってきますが、できるだけ統計用語を使わずに基本のポイントに絞って押さえていきます!
カイ二乗検定(χ2検定)
カイ二乗検定(χ2検定)は、比べたいデータ(変数)が「名義尺度」「順序尺度」のときに使う分析方法です。
若手ナースの看護研究では、
◯◯の看護師と△△の看護師で、◎◎についての回答(そう思う・やや思う・どちらでもない・あまり思わない・思わない)を比べる
といったケースで、カイ二乗検定が使われることが多いでしょう。
カイ二乗検定は、次の4つのステップで行います。
【1】クロス表を作る
まずは、実際のデータから比べたい2つの変数のクロス表を作ります。ここでは「経験年数が5年未満の看護師と5年以上の看護師で、看護記録の負担感に違いがあるか」を例にします。
※ここでは、わかりやすいように項目を単純化しています。「どちらでもない」の列を加えて2×3のクロス表にしたり、行と列を足して3×3のクロス表にしたりと、行列が増えてもカイ二乗検定は使うことができます。
【2】期待度数を求める
次に「期待度数」を求めます。
期待度数とは「2つの変数に関係がないとしたら…?」と仮定した場合の数値のこと。
つまり「経験年数と負担感に関係はない」としたら、5年未満も5年以上も、負担あり・なしの割合は同じになるはずだよね!という数値の表(↓)ができます。
【1】の実際のデータと比べると、5年未満の看護師は「負担あり」の割合が期待度数より高いことなどがわかりますね。
この期待度数は、意外と簡単な計算式で求められます。
▼aの期待度数
(a+b)×(a+c)÷N にクロス表の数字を当てはめる(45×40÷100=18)
▼bの期待度数
(a+b)×(b+d)÷N にクロス表の数字を当てはめる(45×60÷100=27)
▼cの期待度数
(c+d)×(a+c)÷N にクロス表の数字を当てはめる(55×40÷100=22)
▼dの期待度数
(c+d)×(b+d)÷N にクロス表の数字を当てはめる(55×60÷100=33)
【3】カイ二乗値(χ2値)を求める
次に、カイ二乗値(χ2値)を求めます。
カイ二乗値とは、実際のデータと期待度数のズレのこと。つまり、【1】と【2】のズレです。このズレが偶然や誤差の範囲なのかを調べて「偶然や誤差ではない」と明らかになれば、「経験年数と負担感の間には関係がある」という分析結果を導けます。
カイ二乗値は【1】【2】で求めた数値を使って、次のように求めます。
カイ二乗値(χ2値)=[(実際のデータ-期待度数)2 ÷ 期待度数]の合計
この例では、カイ二乗値=8.25と算出できました。
※画像の各数値を合計すると「8.24」ですが、Excel上で小数点第3位以下が四捨五入されるため「8.25」となっています。
カイ二乗値の計算方法を説明しましたが、実は、Excelの関数を使うことで【3】のステップは省くことも可能です。「カイ二乗値はこういう意味で、こうやって計算できる」ことは頭に入れておきつつ、実際の作業はExcelにまかせても大丈夫です。具体的な方法は次のステップで解説します。
【4】確率(p値)を確かめる
カイ二乗値(実際のデータと期待度数のズレ)を算出したら、このズレが偶然や誤差で起こる確率を確かめます。
この確率のことを「p値」と呼びます。p値は「p<0.05となり、有意差がある」といった表現でよく使われるので、文献検索で探した論文でも見たことがあるかもしれませんね。
一般に、p値が0.05未満(5%未満、p<0.05)であれば有意差がある、つまり偶然の結果などではないと言ってOKとされています。
p値を確かめるには、2つの方法があります。
1つ目の方法は「カイ二乗値の分布表」に当てはめる方法です。分布表は、Googleなどで「カイ二乗値 分布表」と検索すれば出てきます。表の中で、【3】で計算したカイ二乗値はどのへんに該当するかを見れば、「p<〇〇」がわかるという仕組みです。
今回は、2×2のクロス表なので「自由度1」の行に当てはめます。【3】で出したカイ二乗値は「8.25」でした。その確率は「0.01より小さく、0.001より大きい」となり、「p<0.01」と確認できました。
2つ目の方法は、Excel関数を使う方法です。この方法は、実際のデータと期待度数があればOKなので、【3】カイ二乗値を求めるステップを省略できて便利です。
Excelの【数式】→【その他の関数】→【統計】→【CHISQ.TEST】と進みます。
実際のデータと期待度数をそれぞれ入力すると、p値が自動計算されます。
今回は「p=0.0041」という結果が出ました。
こうして、2つの方法のいずれかでp値を確かめた結果、今回の例の場合、
経験年数5年未満の看護師と5年以上の看護師で、看護記録の負担感についてカイ二乗検定で分析した結果、「経験年数5年未満の看護師」のほうが「負担感あり」の割合が有意に多く見られた(p<0.01)
という分析結果を導くことができました!
カイ二乗検定は、若手ナースの看護研究でもよく使われる分析方法です。難しく感じるかもしれませんが、手順通りにやれば大丈夫なので、ぜひ試してみてください。
t検定
t検定は、比べたいデータ(変数)に「間隔尺度」「比例尺度」があるときに用いる分析方法です。
おおむね、2つの群の「平均値の差」を調べるものと考えておけばOKです。
若手ナースの看護研究では、
◯◯の患者と△△の患者で、◎◎の時間・血圧・血糖値の平均値を比べる
といったケースで、t検定が使われることが多いでしょう。
では、t検定の手順を見てみましょう。ここでは、最も一般的なExcelの分析ツールを活用します。
【1】「対応がある」「対応がない」をチェックする
t検定は「対応があるかないか」で、やり方が少し異なります。
対応があるとかないとか、耳慣れない言葉ですが、統計学の世界では、比べる対象が同じ人・モノのときは「対応がある」、違う人・モノのときは「対応がない」と言うことになっています。
自分の看護研究はどちらか、まずは対応のあるなしをチェックしましょう。
【2】データの表を用意する
次に、分析したいデータの表を用意します。
ここでは「『研修を受ける前』と『受けた後』で、看護記録の記入時間の平均値を比べる」を例にします。平均値や標準偏差も出しておくと、結果をまとめるときにスムーズです。
※ここでは、わかりやすいように項目を単純化しています。
【3】Excelの分析ツールを使う
【2】のデータでは、「研修後は看護記録の記入時間が短縮された」ように見えますが、「本当にそう言えるのか、それとも偶然や誤差の範囲なのか」について、Excelの分析ツールを使って確かめます。
まず、Excelの【データ】タブから【データ分析ツール】を選択します。
※Excelにデータ分析ツールがない場合、次の手順で追加できます。
【ファイル】→【オプション】→【アドイン】→【分析ツール】→【設定】→【分析ツール】にチェックを入れてOK
いろんな分析方法が出てくる中に3種類の「t検定」があるはずです。次のように選択します。
▼対応がある
【t検定: 一対の標本による平均の検定ツール】
▼対応がない
・データが正規分布→【t検定: 等分散を仮定した2標本による検定】
・データが正規分布にならない→【t検定: 分散が等しくないと仮定した2標本による検定】
今回の例は対応があるので、【t検定: 一対の標本による平均の検定ツール】を選択します。
手順に沿ってデータを入力すると、結果の表がポン!と表示されます。
【4】結果を確認する
最後に、分析ツールで出た結果から「偶然や誤差の範囲なのか」確認します。
結果表にはいろいろありますが、チェックするのは、ひとまず「P(T<=t)両側」です。
P(T<=t)両側は、p値と同じ意味で「これが偶然や誤差の範囲なのかの確率」を示す値です。
一般に、p値が0.05未満(5%未満、p<0.05)であれば有意差がある、つまり偶然などではないと言ってOKとされています。
今回の結果は「p値は0.0425…」で、p<0.05 になりましたね。
ということで、ここまでのt検定の作業によって、
ある病棟の看護師◯人について、研修を受講する前と受講した後で、看護記録の記入に要する時間を対応のあるt検定を用いて比較したところ、研修前は85±31.1分、研修後は60±17.8分であり、有意に短縮されたことが認められる(p<0.05)
という分析結果を導くことができました!
やってみたら何とかなる!
ここまで大変おつかれさまでした!
初めて目にする統計用語や計算、Excelの使い方があって、ひるんでしまうかもしれません。
けれど、初めにもある通り、若手ナースの看護研究では、ここで紹介したメジャーな分析方法の基本を押さえられれば、けっこう何とかなるものです。わからないところは調べながらでも、まずは挑戦してみましょう!
次の第7回では、質的研究で集めたデータの分析方法について解説します。
東京有明医療大学看護学部教授前田 樹海(まえだ・じゅかい)
「看護研究が嫌いになる看護師」を救いたい! 看護研究の目的は「将来の看護の発展に役立てること」ではありますが、看護研究に取り組めば、現場の課題を深く考える力や客観的にとらえる力がきっと身につきます。みなさんができるだけ肩の力を抜いて看護研究に取り組めるお手伝いをしていきます。著書『この1冊でできる!はじめての看護研究』(ナツメ社)『臨床ナースから看護研究者まで 研究発表のプレゼンもっとよくなります!』(日本看護協会出版会)。
看護roo!編集部 烏美紀子(@karasumikiko)
(引用・参考文献)
1)前田樹海.この1冊でできる!はじめての看護研究.ナツメ社,2015,p159
2)大口祐矢.看護の現場ですぐに役立つ看護研究のポイント.秀和システム,2017,p121
3)柴山大賀.看護研究のイロハを学ぼう!-看護研究の進め方.循環器ナーシング,2016年12月号,48-54
4) 及川慶浩.はじめての看護研究 統計学編.メディカ出版,2012,p109
掲示板でいま話題
アンケート受付中
「あなたにとって看護とは?」…一言でどうぞ!
- 私にとって看護とは…(答える!) 6%
- 答え探し中です 83%
- 他の回答
- 投票数2392票
- 残り4日
看護師をしていて《一番疲れる身体の部位》ってどこ?
- 頭(精神的に) 65%
- 目 2%
- 他の回答
- 投票数2227票
- 残り6日
今日の看護クイズ
本日の問題
◆周術期・麻酔の問題◆全身麻酔導入の2時間前まで摂取してもよいものはどれでしょう?
- 牛乳
- 果肉入りジュース
- アルコール
- ブラックコーヒー
10454人が挑戦!
解答してポイントをGETナースの給料明細
みん5年目 / 病棟 / 長野県
令和6 06 19
¥ 258,500 | ¥ 12,000 | ¥ 61,260 | |
¥ 0 | ¥ 30,000 | ¥ 17,400 | |
6回 | 2交代制 | 6時間 | |
¥ 379,160 | ¥ 1,246,000 | ¥ 5,795,920 |
ぼな1年目 / 病棟 / 北海道
令和6 08 03
¥ 202,200 | ¥ 27,000 | ¥ 7,600 | |
¥ 0 | ¥ 0 | ¥ 13,200 | |
1回 | 2交代制 | 16時間 | |
¥ 250,000 | ¥ 620,000 | ¥ 3,620,000 |
8972人の年収・手当公開中!
給料明細を検索
コメント