広告 統計学

統計学の歴史①:古代から現代まで、データ分析の進化と発展の軌跡

2025年2月18日

私たちの周りには数字があふれています。「平均気温は何度」「感染者数は何人」「支持率は何パーセント」——日常生活でこうした統計情報に触れない日はないでしょう。しかし、これらの数字がどのように集められ、分析され、解釈されるのかについて深く考える機会は多くありません。

統計学は、データから意味のある情報を引き出し、不確実性のある世界で合理的な意思決定を行うための学問です。現代社会においてその重要性は絶えず高まっていますが、統計学自体は長い歴史を持っています。古代文明における人口調査から始まり、確率論の誕生、科学的方法論の発展、そしてデジタル革命によるビッグデータ分析まで、統計学は時代とともに進化してきました。

この記事では、統計学の歴史を時代を追って紐解きながら、その発展の軌跡を探ります。古代から中世の初期統計活動、17世紀の確率論の誕生、19世紀の統計学の学問的確立、20世紀の推測統計学の発展、そして現代のコンピュータ技術とビッグデータが統計学にもたらした革命的変化まで、幅広く見ていきます。

統計学の歴史を学ぶことは、単なる年表や人物の羅列を知ることではありません。それは人類が不確実性と向き合い、データから知識を生み出してきた知的探求の旅の物語です。また、統計学の歴史は科学、経済、政治、社会の歴史と密接に絡み合っています。統計的思考の発展がどのように社会を変え、逆に社会の変化が統計学にどのような影響を与えてきたのかも見えてくるでしょう。

さらに、統計学の歴史を知ることは、現代の統計的手法や概念の起源や意味をより深く理解することにもつながります。なぜ特定の方法が開発されたのか、どのような問題を解決するために考案されたのか、そしてどのような論争や議論を経て現在の形になったのか——こうした背景を知ることで、統計学をより豊かに、より批判的に捉えることができるようになります。

それでは、統計学という学問の壮大な旅路を、時間の流れに沿って探検していきましょう。古代文明の簡素な集計から、現代の高度に洗練された統計的手法まで、データと人類の関わりの歴史を紐解いていきます。

1. 統計学の起源と基礎の確立

1-1 古代から中世の統計的活動

統計学という名前こそなかったものの、データを収集して集計・分析する活動は古代文明の時代から存在していました。その最も古い例の一つが人口調査です。古代バビロニアや中国、エジプト、ローマ帝国など、多くの文明で人口や資産の調査が行われていました。

古代バビロニアでは紀元前3800年頃から、農作物の収穫量や家畜の数を粘土板に記録していたことが分かっています。これは税金の徴収や資源分配のために必要だったのです。古代エジプトでも、ナイル川の氾濫後に農地の再測量が行われ、これに基づいて税金が課されていました。

特に体系的だったのが古代中国の統計活動です。紀元前2世紀の漢の時代には、人口、土地、農業生産などの詳細な調査が定期的に行われていました。これらのデータは「漢書」などの歴史書に記録され、政策立案の基礎として使用されていました。

西洋では、ローマ帝国の人口調査(センサス)が有名です。紀元前6世紀頃から始まったローマのセンサスは、市民権を持つ男性の数、その財産、兵役適格者数などを調査するもので、5年ごとに実施されていました。これは税金徴収と兵役の割り当てを目的としていましたが、同時に社会階層の区分けにも利用されていました。

中世ヨーロッパでは、1086年にウィリアム征服王によって実施された「ドゥームズデイ・ブック」が重要な統計的記録として残っています。これはイングランドの土地、所有者、価値、住民などに関する包括的な調査で、課税目的で作成されました。その詳細さと網羅性から「最後の審判の書」という意味の名前が付けられたほどです。

日本でも、7世紀の大化の改新以降、戸籍や土地台帳である「計帳」が作成されていました。これは課税や徴兵のために人口や土地を把握するためのものでした。

このように、古代から中世にかけての統計活動は主に行政的・財政的目的、特に税の徴収と兵役の割り当てのために行われていました。これらは現代の統計学と比べるとかなり原始的なものでしたが、データの収集と整理という統計の基本的な概念は既に実践されていたのです。

しかし、この時代の統計的活動にはいくつかの重要な制約がありました。まず、データ収集は非常に労力を要し、時間もかかりました。また、集められたデータは主に合計や平均といった単純な集計にとどまり、より複雑な分析は行われていませんでした。さらに、データの精度や信頼性も現代の基準からすれば疑問符が付くものでした。

それでも、これらの初期の統計活動は、社会における定量的情報の重要性に対する認識を高め、後の統計学発展の土台となりました。人口、経済活動、資源などに関する体系的なデータ収集の伝統は、近代国家の統治システムに不可欠な要素として引き継がれていくことになります。

1-2 確率論の誕生と発展

統計学の発展において決定的な転機となったのは、17世紀における確率論の誕生です。確率の概念自体は古くからギャンブルの文脈で直感的に理解されていましたが、数学的な理論として体系化されたのはこの時期になってからでした。

確率論誕生の発端となったのは、フランスの数学者パスカルとフェルマーの往復書簡(1654年)と言われています。賭博好きの貴族シュバリエ・ド・メレから持ち掛けられた「未完のゲームの賭け金をどう分配すべきか」という問題を二人が議論したのです。この問いへの回答を探る過程で、確率の基本的な概念や計算方法が初めて明確に定式化されました。

パスカルはこの問題をさらに深く追求し、期待値の概念を発展させました。彼の著書「パンセ」に含まれる「パスカルの賭け」は、神の存在を信じることの期待効用を確率論的に分析したもので、確率を実際の意思決定に応用した初期の例として知られています。

次の重要な進展は、ヤコブ・ベルヌーイの「推測術」(1713年、死後出版)によってもたらされました。ベルヌーイは「大数の法則」を初めて証明し、多数の試行を繰り返すことで確率の経験的な値が理論値に近づくことを示しました。これは実験的なデータから一般的な法則を導き出すための理論的基盤を提供するものでした。

18世紀には、ド・モアブルが正規分布(ガウス分布)の基礎となる数式を導出し、確率論の応用範囲を広げました。また、トーマス・ベイズは条件付き確率の理論を発展させ、「ベイズの定理」を考案しました。これは後に統計学の重要な一分野となるベイズ統計学の基礎となるものでした。

この時代の確率論の発展は、単なる数学的好奇心から生まれたものではありませんでした。保険業の発達、人口統計の必要性、科学的観測における誤差の分析など、実際的な問題に対処するために確率論が求められたのです。特に生命保険や年金の計算に必要な死亡率表の作成は、確率論と統計学の発展に大きく貢献しました。

確率論の発展は、「偶然」や「運」と考えられていた現象に数学的な秩序を見出すという画期的な概念転換をもたらしました。不確実性を数量化し、予測可能なものとして扱えるようになったことで、科学から経済、政治に至るまで、あらゆる分野に大きな影響を与えました。現代の統計学の基礎となる「確率的思考」の枠組みは、この時代に形成されたのです。

1-3 近代統計学の基礎を築いた先駆者たち

17世紀後半から18世紀にかけて、確率論の発展と並行して、データの収集・分析に焦点を当てた「政治算術」や「人口統計学」といった分野が生まれました。これらは現代的な意味での統計学の直接の先駆けとなるものでした。

「政治算術」の創始者とされるのがイギリスのウィリアム・ペティです。彼は1676年に『政治算術』を著し、国家の経済力や人口動態を数字で分析する方法を提案しました。ペティは「数、重さ、尺度を用いて議論する」ことの重要性を説き、政策決定における定量的アプローチの先駆けとなりました。

同様に重要な貢献をしたのが、イギリスの商人ジョン・グラントです。彼は1662年に『死亡表に関する自然的・政治的観察』を発表し、ロンドンの死亡記録を分析しました。グラントは死亡率のパターンを見出し、初めての生命表を作成しました。この研究は疫学や公衆衛生学の基礎となり、また保険数理学の発展にも大きく貢献しました。

18世紀になると、ドイツのゴットフリート・アッヘンヴァルが「統計学(Statistik)」という言葉を初めて使用しました。当時のドイツ語での「統計学」は、国家の「状態(State)」を記述する学問という意味で、主に国家の政治的・経済的特徴を比較・記述する定性的な学問でした。

一方、数学者であり天文学者でもあったフランスのピエール=シモン・ラプラスは、確率論を天文学的観測の誤差分析に応用しました。彼の著書『確率の解析理論』(1812年)は、中心極限定理の一般化や最小二乗法の理論的基礎付けなど、統計学の発展に不可欠な数学的基盤を提供しました。

ベルギーの天文学者・統計学者アドルフ・ケトレーは、社会現象にも自然科学のような規則性があると考え、「社会物理学」という概念を提唱しました。彼は犯罪率や結婚率などの社会的事象にも統計的法則性を見出し、社会統計学の発展に大きく貢献しました。また、彼は「平均人(l'homme moyen)」という概念を導入し、正規分布の社会科学への応用を促進しました。

イギリスのフランシス・ゴルトンは、相関と回帰の概念を発展させました。彼は人間の身体的・知的特性の遺伝に関心を持ち、親と子の身長データなどを分析する中で、2つの変数間の関係を測定する方法を考案しました。これは後に彼の弟子であるカール・ピアソンによって「相関係数」として定式化されることになります。

これらの先駆者たちの貢献により、18世紀末から19世紀初頭にかけて、統計学は単なるデータの収集・記述から、データの分析・解釈・予測を行う科学へと発展していきました。彼らの仕事は、次の世代の統計学者たちによって体系化され、19世紀後半から20世紀初頭にかけての統計学の急速な発展の基盤となったのです。

R言語

2025/2/26

ベルヌーイ分布とは?確率論の基本から具体例、Rでのシミュレーションまで解説!

確率論や統計学の基礎において、「ある事象が起こるか、起こらないか」を表現するのに便利な分布がベルヌーイ分布です。 例えば、 コインを投げたときに表(1)が出る確率 メールがスパム(1)かそうでない(0)か 機械が正常に作動するか(1)しないか(0) このように、結果が**「成功」または「失敗」の二択** となる確率モデルを扱う際にベルヌーイ分布が使われます。本記事では、以下のポイントを解説します。 ✅ ベルヌーイ分布の基本概念と性質✅ 実際のデータや応用例を用いた説明' ...

ReadMore

R言語

2025/2/27

ロバスト統計学とは?異常値に強い統計手法の基礎からRによる実装まで徹底解説!

統計分析を行う際、データの中に 外れ値(異常値) が含まれていることはよくあります。例えば、以下のようなケースが考えられます。 ✅ 売上データにおいて、一部の異常に高い値がある✅ 医療データで、極端に異常な検査結果が混ざっている✅ センサー測定値にノイズが含まれ、誤ったデータが発生している このような異常値の影響を受けると、平均値や標準偏差などの統計量が歪み、本来のデータの傾向を適切に反映できなくなる 可能性があります。 この問題を解決するのが、ロバスト統計学(R ...

ReadMore

特殊なグラフ

2024/4/26

R言語でQQプロットを作成する方法

はじめに QQプロット(Quantile-Quantileプロット)は統計分析で非常に役立つツールです。これを使って、データセットが特定の理論分布に従っているかどうかを視覚的に評価することができます。R言語には、この種のプロットを簡単に作成できる強力なツールが用意されています。この記事では、R言語を使用してQQプロットを作成する基本的なステップを説明します。 必要なパッケージ QQプロットを描くためには、基本的にstatsパッケージが必要ですが、これはRの標準パッケージに含まれているため、特別なインストー ...

ReadMore

統計学基礎

2025/2/27

多重共線性とは?統計分析への影響と対策、Rでの検出方法を徹底解説!

統計分析や機械学習において、説明変数(独立変数)同士が強い相関を持つこと は、回帰モデルの推定精度を低下させる可能性があります。 このような状況を 「多重共線性(Multicollinearity)」 と呼びます。 多重共線性が起こると何が問題か? ✅ 回帰係数の推定値が不安定 になり、解釈が難しくなる✅ 統計的な有意性(p値)が正しく評価できなくなる✅ モデルの予測精度が低下 し、新しいデータに対して適用しにくくなる 例えば、以下のようなデータセットを考えます。 ...

ReadMore

回帰分析

2025/2/26

偏回帰分析とは?基本概念から解釈、Rによる実装まで徹底解説!

統計分析において、「ある説明変数が目的変数に与える影響を評価したい」と考えることはよくあります。しかし、多くのデータには 複数の説明変数が同時に影響を及ぼしている ため、単純な単回帰分析では正しい評価ができないことがあります。 そこで活用されるのが 偏回帰分析(Partial Regression Analysis) です。 ✅ 偏回帰分析の主な目的 特定の変数が目的変数に与える影響を、他の変数の影響を除外した上で評価する 多変量データの中で、各説明変数の相対的な寄与度を明確にする 重回帰分 ...

ReadMore

統計学基礎

2025/2/26

ベイズ統計学とは?事前確率と事後確率を用いた推論の基礎からRでの実装まで徹底解説!

統計学において、「新しい情報を得たときに、既存の知識をどのように更新するか?」という問題は非常に重要です。その問題に答えるのがベイズ統計学 です。 ベイズ統計学(Bayesian Statistics) は、事前確率(prior probability)と新しいデータの尤度(likelihood)を組み合わせ、事後確率(posterior probability)を求めることで推論を行います。 例えば、以下のようなケースで活用されています。 ✅ 医療診断:「ある検査で陽性が出た場合、本当に病 ...

ReadMore

-統計学

S