広告 統計学基礎

記述統計学と推測統計学とは?: 統計学の基本を学ぶ

2023年9月23日

統計学はデータの解析と理解に不可欠なツールです。データを使って意思決定をするためには、統計学の基本概念を理解することが大切です。この記事では、統計学の基本をわかりやすく説明し、具体例を交えて紹介します。

データとは何か?

まず、統計学の出発点はデータです。データは情報の集まりで、日常生活やビジネスにおいてさまざまな形で存在します。例えば、以下のようなデータが考えられます。

・売上データ: 月ごとの製品売上の金額
・気温の記録: 毎日の最高気温と最低気温
・アンケート回答: 顧客満足度に関するアンケート回答

データは数値や記号で表現され、それ自体に意味があります。
統計学の目的は、データから洞察を得ることです。

記述統計学とは何か?

統計学は大きく分けて二つの分野に分かれます。その一つが記述統計学(Descriptive Statistics)です。記述統計学は、データを整理し要約するためのツールとして、平均値や分散、標準偏差などの情報を提供します。

具体例を考えてみましょう。
あるクラスの生徒たちのテストスコアを収集し、以下のような統計量を計算したとします。

平均テストスコア: 80点
最高テストスコア: 95点
最低テストスコア: 65点
テストスコアの分散: 49

この情報を通じて、クラス全体のテストの平均的な成績やばらつきを理解できます。

推測統計学とは何か?

もう一つの分野が推測統計学(Inferential Statistics)です。推測統計学は、サンプルデータを使用して母集団全体に関する推論を行う方法を提供します。

仮に、ある学校の全生徒数が非常に多く、すべての生徒のテストスコアを調査することが不可能な場合を考えてみましょう。代わりに、ランダムに選んだ30人の生徒のテストスコアを収集し、その平均スコアから学校全体の平均スコアを推測することができます。このように、推測統計学はサンプルから全体を推測するための方法を提供します。

質的データとは?

質的データ(Qualitative Data)は、カテゴリや属性を表すデータの種類です。
質的データは数値ではなく、特定の特性や特徴を示します。
質的データは通常、名義尺度(Nominal Scale)または順序尺度(Ordinal Scale)で測定されます。

名義尺度(Nominal Scale)は、データをカテゴリやカテゴリに属するものとして分類するための尺度です。名義尺度では、データを数値として表すことはできず、単に異なるカテゴリやカテゴリのラベルを付けることができます。名義尺度は、データを分類し、カテゴリ間の違いを識別するのに役立ちますが、数値的な計算や比較はできません。

具体例として、以下のようなデータが名義尺度に該当します。

<具体例>
性別
: 男性、女性、その他
血液型: A型、B型、AB型、O型
地域: 東京、大阪、名古屋、福岡

これらのデータはカテゴリに分類され、数値的な大小関係を持ちません。
名義尺度は、データの分類やグループ化に使用され、順序や数量に関する情報は提供しません。

量的データとは?

量的データ(Quantitative Data)は、数値によって表されるデータの種類です。
量的データは数量を示し、通常、間隔尺度(Interval Scale)または比率尺度(Ratio Scale)で測定されます。
間隔尺度では、数値の差が意味を持ちますが、ゼロ点は任意です。
比率尺度では、ゼロ点も意味を持ち、比率計算が可能です。

<具体例>
年齢: 25歳、30歳、40歳
身長: 165センチメートル、180センチメートル
収入: 月収500ドル、1000ドル、2000ドル
時間: 1時間、2時間、3時間

これらの量的データは、数値によって数量を表し、計算や比較が可能です。

質的データと量的データの違い

質的データと量的データの主な違いは以下です。

データの性質: 質的データはカテゴリや属性を表し、数量を持たない。量的データは数量を表す数値を持つ。
尺度の種類: 質的データは名義尺度または順序尺度で測定される。量的データは間隔尺度または比率尺度で測定される。
演算の適用: 質的データでは算術演算は適用できないが、量的データでは算術演算が可能。(林知己夫によって開発された質的変数を分析する手法(数量化理論)というものがあります。いつか解説したいと思います)

参考文献

1) 統計学入門 (基礎統計学Ⅰ)  東京大学教養学部統計学教室  ISBN-13 ‏ : ‎ 978-4130420655

-統計学基礎
-