信頼性の検討方法:相対信頼性と絶対信頼性

1. はじめに

EBPTの確立が目指されている今日、従来から一般的に用いられている理学療法評価に科学的な視点から改めて検討を加えることは、理学療法研究の重要な責務の1つである。その理学療法研究の中で、理学療法評価法の信頼性を検討することは、それら評価法を臨床応用した際の効果判定の精度を高めることとなる。このため近年、理学療法評価法の信頼性を検討する報告が多くなっている。
信頼性を検討している先行研究では、特に国内の報告において、「相対信頼性(relative reliability)」を用いた報告が多い。相対信頼性とは、ピアソンの積率相関係数(Peason's correlation coefficient, r), あるいは級内相関係数(intraclass correlation coefficients; ICC)、α係数(クロンバックのα係数, Cronbach's coefficient alpha)などの係数を用いて信頼性を検討する方法である。この相対信頼性は、2つの測定値間の相関の強さを係数で表すため、理解しやすいという長所がある。しかし、豊田は、相対信頼性による信頼性の検討の欠点として、次の2つを挙げている1)
1. その指標が評価方法固有の性質を表現していない。
2. 測定値(尺度値)のレベル(大きさ)ごとの測定精度を論じられない
まず1つめは、相対信頼性による信頼性は、対象である評価とそれを実施した集団の組み合わせにしか言及できないという問題点である。すなわち、相対信頼性で示された信頼性は、対象とした集団とは別の集団には保証されず、評価方法そのものの精度を表している指標ではないのである。
次の2つめの問題点は, 2つの測定値が内包する誤差の種類と量に関する情報を得ることはできない、と換言できる。
測定値は真の値(true value, true qurantity)と誤差(error)から成り立っている。この誤差は、偶然誤差(random error)と、系統誤差(systematic bias)に大きく2つに分けられる(注1)。偶然誤差は平均値などから双方向へ、比較的対照的な振れや「分散」のことで、さらに(生物学的)個体差(biological variation)と測定誤差(measurement error)に分けられる。系統誤差は真の値からの構造的・系統的乖離のことで、加算誤差(fixed bias)と比例誤差(proportional bias)の2つに分けられる。加算誤差とは真の値の大小にかかわらず特定方向に生じる誤差である。対して比例誤差は真の値に比例して大きくなる誤差のことである。つまり、比例誤差は尺度値のレベルに比例して大きくなる誤差である(図1)2)3)4)


図1 誤差の分類

注1
偶然誤差は確率誤差(indeterminate error)、系統誤差は定誤差(determnate bias)ともいわれる。また、本稿では"error"と"bias"を、特定方向への振れや「乖離」の意味を示す目的で、それぞれ偶然誤差と系統誤差に対応した英語表記として用いた。
これら誤差に関して足立は、次の3つの理由から、偶然誤差に比較して系統誤差は研究や臨床上重大(seriousness)であるとしている4)
  1. 双方向に乖離する偶然誤差は、同一条件下の測定の繰り返しにより克服される(精度が向上する、あるいは0(ゼロ)に収束する)
    対して、一方向にしか乖離しない系統誤差は、克服されにくい特徴を有している
  2. 系統誤差がどれだけ潜入しているかの情報が不可知である
  3. 試験の計画・実施段階で発生した系統誤差には、検定・推定法のいずれも原則的に無力である
相対信頼性, 特にその研究で求められるICC値を補償するために、適切な測定の使用計画(回数)を求めるD研究(decision study; 決定研究)は、同一条件下の繰り返し測定により精度が向上することを前提としている。すなわち、測定値が内包する誤差の種類を偶然誤差に限定している。対して、系統誤差は同一条件下での測定の繰り返しにより同手順では克服できない。このことから、信頼性を検討する際には、それら測定値に含まれる誤差の種類を明らかにしなければならない。
また、種類が特定された誤差の量を明らかにしなければ、それら評価方法を臨床応用する際に、複数回測定した際の測定値の差が臨床上有用なのもかどうかを判断できないということがある。例えば、ある理学療法介入の動的バランスに対する効果を判定するために、介入前後でTimed Up and Go test(以下TUG)を測定し、介入前後でそれぞれ18.5秒、14.6秒の結果を得たとする。しかし、介入前後でTUGが3.9秒向上したことから、すなわち動的バランス向上とは判断できない。なぜならば、この測定値の変化量3.9秒には、介入による効果(真の変化 "true change")に加え、測定時に混入した誤差が含まれているからである。このことから、信頼性を検討する際には、それら測定値に含まれる誤差の種類とともにその量についても明らかにしなければならない。
前述した相対信頼性に対して, 測定値の中にどの種類のばらつきや誤差が, どの程度混入しているかを検討する方法が「絶対信頼性absolute reliability」である。絶対信頼性とは、係数ではなく、この誤差の範囲を測定方法と同じ単位で示すことで、「真の変化」を明確にする方法である。特に, 信頼性を検討しようとしている評価方法を臨床応用する際には, 測定の際の誤差を最小限にする対策を検討できるという点で, 相対信頼性よりも絶対信頼性の方が実用的である。
本研究では、絶対信頼性の検討手順を、次の3ステップに分けて解説する。
1. 研究デザインの検討
2. 系統誤差の有無・種類の確認
3. 誤差の範囲の推定
また、解説に当たっては次の2点に留意した。
  1. 具体例を示し、関数電卓あるいはマイクロソフト社エクセルの関数で簡単に計算できるよう配慮した。
  2. 残念ながら絶対信頼性に関する主要な和論文は少ない。このため、読者が関連英文献を参考にした場合に、専門用語の解釈を容易にすることを目的として、特に著者が和訳に難渋した誤差や統計学の専門用語について、可能な限り、英単語を付記した。

 「研究テーマ」に戻る     第2章に進む