Glossary

調査・統計用語集

層化抽出

標本調査は母集団を知るために実施する。母集団の特性が未知だからこそ調査するのであるが、そもそも母集団に関して情報が皆無ということは少ない。日本人すべての消費者を目標母集団とするマーケティング調査において、ある商品の購入意向率は未知かも知れないが、全国の市町村の人口分布などは分かる。これは国家予算を使って、国勢調査と経済センサスを全数調査で実施している成果でもある。
 層化抽出は母集団に関して既知の情報を利用して、調査目的にとって有効な層を設定し、層別に無作為抽出する。調査・分析で集団を分析する場合、分析データが異質の層の混成になっていないかをチェックすることが重要であるように、標本抽出においても層化することで調査の精度が高まる効果があり、可能な限り層化をしたほうがよい。

<層化抽出の事例>
 全国規模の標本調査や、企業・事業所を対象とする標本調査では、しばしば層化抽出が適用される。代表的な層化抽出の例として3例を示す。

「国民生活に関する世論調査」(内閣府)
 1948年からほぼ毎年実施している全国世論調査。2016年は18歳以上の日本人1万人を調査対象者として、層化二段無作為抽出を適用した。層化は地区(11層)×都市規模(25層)×調査区特性(7層)としている。第一次抽出単位(地点)は国勢調査区である。
 これは非常に細分化した層化である。地点数は350であるが、地区×都市規模の層化の段階で、すでに各層に2~3地点しか配分されない層が20以上となる。
 ◉ 地区(11層):北海道/東北/関東/北陸/東山/東海/近畿/中国/四国/北九州/南九州
 ◉ 都市規模(25層):21大都市/20万人以上の市/10万人以上の市/10万人以下の市/町村
 ◉ 調査区特性(7層):準世帯・給与住宅/第2次産業住宅/第3次産業住宅/商工業/漁業/農林業/その他

  「日本人の国民性調査」(統計数理研究所)
 1953年から5年ごとに継続的に実施されている全国調査。2013年は20歳~85歳の日本人6400人を調査対象として、層化二段無作為抽出を適用した。第一次抽出単位(地点)は町丁字で、地点数は400。層化は地方性と人口規模で市区町村を6層に分類した。沖縄県を一つの層としている点が特徴的である。
 ①    区部
 ②    20万人以上の市
 ③    10万人以上の市
 ④    10万人未満の市
 ⑤    郡部
 ⑥    沖縄県

「特定サービス産業実態調査」(経済産業省)
 経産省による基幹統計調査で、2015年は28業種の事業所48,934を調査対象として抽出した。層化は業種(28層)×事業従事者規模(8層)×都道府県(47層)である。このうち事業従事者の8層は以下のような区分とした。
 ①    4人以下
 ②    5~9人
 ③    10~29人
 ④    30~49人
 ⑤    50~99人
 ⑥    100~299人
 ⑦    300~499人
 ⑧    500人以上

<層化することの利点>
 推計の目的としている調査項目について、層内はできるだけ同質で、層間では異質であるように層化する。同質・異質という表現は、具体的には層内分散は小さく、層間分散は大きくするということになる。こうすることで単純無作為抽出よりも高い精度を得られる。仮に効果的な層化でなくても、少なくとも単純無作為抽出と同じ精度になるので、可能な限り層化を考えることが多い。
 層化すると精度が高まることの直観的な理解としては、極端な例を考えるとよい。同じ標本サイズであれば、母分散が大きい場合より、小さいほうが推定精度がよい。
 ある商品の普及率を推定する標本調査を想定しよう。もしも母集団における普及率が100%だったら、標本サイズが小さくても、つまり3人調査であっても100人調査であっても、普及率は100%だという調査結果になる。母集団における普及率が0%の場合も同様である。
 しかし母集団における普及率が50%だとしたら、3人調査をして50%と推定するのは難しいだろう。つまり精度が悪くなる.
 分散は50%の時に最大になり、100%と0%の時に最小(分散=0)になる。100%や0%に近いほど、すなわち分散が小さいほど推定の精度は高い。これが母集団において層内の分散が小さいような層化をするということに関連する。

<層の数の決め方>
 「国民生活に関する世論調査」の層は非常に多く、「日本人の国民性調査」は6層しかなかったが、適切な層の数はあるだろうか。理論的には3層よりも多くしても著しい向上はないとの報告がある。ただし、推定精度の観点だけでなく、調査管理上の都合と層化を対応させることもある。都道府県を層にするのは、そのような例である。層が多いと地点ごとの標本の割当が不均一になるのも不都合である。「日本人の国民性調査」もかつては多くの層化をしていたが、地点のソートを工夫して系統抽出することで、層化と同じ効果を狙って現在の層化計画になっている。

<層への標本配分の決め方>
 層への標本の配分方法として、比例割当と最適割当がある。比例割当は母集団の大きさに比例して標本サイズを配分する。全体集計の際に重みを調整する必要はないという利点がある。最適割当は層内の分散に比例させて配分する。その結果、各層の抽出率は異なる。特に大きな分散の層では抽出率が1に近づくため全数調査になる。大企業の層になると、社数は少ないが分散が大きくなり、悉皆層(全数調査)とすることが多い。最適割当では全体集計において抽出率の違いを調整した重みをつける必要がある。
 「国民生活に関する世論調査」と「日本人の国民性調査」は比例割当である。共通する性格は個人の意識調査である点である。世論調査は民主主義の観点から有権者1人の重みは等しい、との思想があるので、そのような背景からも比例割当が適している。消費者を対象とするマーケティング調査でも比例割当が多い。
 しかし企業が標本となると事情は異なる。企業の場合、従業員数にせよ売上高にせよ、規模に関する指標は著しく偏った分布をしている。大企業と零細企業が統計に与える重みは明らかに異なる。そのため「特定サービス産業実態調査」は比例割当ではなく、最適割当(ネイマン割当)を採用している。

ico_information

課題からお役立ち情報を探す

調査・データ分析に役立つ資料を
ご覧いただけます。

ico_contact

調査の相談・お問い合わせ

調査手法の内容や、
調査・データ分析のお悩みまで気軽に
お問い合わせください。

ico_mail_black

メルマガ登録

企業のリサーチ、データ分析に役立つ情報を
お届けします。