統計と数の神秘

古代ギリシア人は 「万物の根源」は何であるかを考えた。
哲学者達は、火とか土とか原子とかといった答えをだした。しかし最もユニークなのは、万物の根源は「数」と答えた人物である。
その人物とはピタゴラスで、宇宙に秘められた「数の神秘」に気づいていたのかもしれない。
以前あった映画「博士が愛した数式」で、モットモ印象的だったのは、「完全数」の話である。
「完全数」とは、自分自身を除く約数の和に等しい自然数のことである。
たとえば「6」という数字の約数は1、2、3で すべて合計すると6、「28」という数字の約数は1、2、4、7、14でこれをすべて足すと28となるが、そういう数字はザラにはないらしい。
ピタゴラスは、神様が6日間で世界を創造された(旧約聖書)のも6が完全数だからだと考えた。
「6」の次の完全数は「28」だが月が地球を一周するのが28日である。
「数の神秘」といえば世界的大ベストセラー「ダヴィンチコード」で紹介されていた「黄金比率」(1:1.61803 )もソノ一つであろう。
この黄金比は「フィボナッチ数列」から求められるが、自然界にはコノ「黄金比率」によって象られているものが多いという。
つまり、この宇宙の背後には、偶然では説明のツカナイ「知性の輝き」といったモノが存在しているのだ。

ところでイマ「統計学」が脚光を浴びている。
学生時代に、一応「統計学の基礎」のようなものを学んだことがあるが、このレベルでも「数の神秘」の入口に立ったヨウナ感じを得たことを覚えている。
マズ「統計学」は、他の数学分野とは異なる「要素」がアルことに気がついた。
他の数学分野は、人間の理性ノミによって展開できるのに、統計学では「経験」(実験)によってノミ確かめられる要素が存在することである。
例えば、サイコロを振ると毎回色々な目が出てくるようにみえるが、多くの回数を振ると、1~6の各目は出る確率はダンダン1/6に近づいていくことがわかる。
しかし、これくらいなら実験によらなくても、ナントナク「推測」できる。
モウヒトツの例は、最も有名な確率分布である「正規分布」に関することである。
「正規分布」とは、大まかに言うと「釣鐘状」をした左右対称の分布で、その中央線は「平均値」「中央値」「最頻値」が重なっている。
身長や体重など、縦軸に人数をとって様々なデータを数多く集めて記録すれば、コノ「正規分布」に近づいていく。
ただし「正規分布」とはいっても、平均値とデータのバラツキよって「形状が異なる」ことはいうまでもない。
ただ「正規分布」がナニヨリ便利なのは、平均値をゼロ、分散を1とする形に「変換」(標準化)できることであり、そこに持ち込めばスデに計算済みの「標準正規分布表」により、様々な確率を読み取ることができる点である。
ところで最近統計学の出番が「飛躍的」に拡大しているため注目を浴びているが、もともとはサンプルから全体を推定するのが主要な出番だった(と思う)。
例えば日本人全体からなる母集団の学力や体力を全数調査して「平均」や「分散」を調べるのはアマリニモ膨大な労力を要する。
そこでサンプルをとって「統計的推定」を行えば充分に「信頼度」の高い値を求めることができるというものである。
個人的に、この推定の前提にある「中心極限定理」ナルものを知った時、「数の神秘」の入口に立った感じがした。
フランスのラプラスが発見したコノ定理の中身は次のとうりである。
ある母集団から10個のサンプルをとって平均を記録する。
これを30回ぐらい繰り返し、30ポイントの「平均」を記録していく。
そういう各サンプルの「平均値」は、標本個数、試行回数を増やすホド正規分布に近づくことが「実験」によって確かめられている。
ただ「平均値」のサラに平均をプロットしているので、母集団全体のバラツキよりも少ないバラツキ、すなわちタテに長い形状の正規分布にナッテいるのはいうまでもない。
そして興味深いことに、母集団が必ずしも正規分布をしなくとも、そういう結果が得られるということである。
ちなみに、正規分布以外にも「t分布」「カイ二乗分布」ナドがある。
「t分布」は、スチューデントというペンネームで論文を書いたWSGosettによって書かれたので、「スチューデントのt分布」で知られる。
釣鐘の形をしていて平均も0であるのも標準正規分布と同じだが、サンプル数増えるにつれて(自由度が増す)だんだん形を変えていくのが標準正規分布とのチガイである。
またカイ二乗分布は、すべてのデータを標準化(平均をゼロに、分散を1に変換)した値を二乗して合計した値の分布で、「独特の」分布をする。
実は「数の神秘」の入口だと思えたのは、これら「t分布」「カイ二乗分布」イズレモ 標本個数、試行回数を増やすほど「正規分布」に近くなることが「実験」によって確かめられている点である。
正規分布にモチコメバ上記のように「標準化」できるので、「標準正規分布表」から「平均」や「分散」を簡単に「推計」できるのである。
さて、統計学が他の数学分野と違う点のモウヒトツは「アイデア」に満ちた領域であることである。
例えば、グラフ上に点在するデータの「傾向」を一目でわかるように「直線に」するための「最小二乗法」などナント素晴らしいアイデアかと思う。
つまり統計学は数学の中ではアイデア勝負の分野といえそうだが、そうしたアイデアで「統計学」を築いた人物がロナルド・A・フィッシャー(1890年~1962年)である。
この人がアミ出した「実験計画法」というものは、医療、災害、環境汚染、経済、経営ならゆる分野に応用できるという点で、今日の「統計学」が負う一番の功労者であるといって過言ではない。
1920年代末のイギリスにて、陽射しの強いある夏の午後、何人かの英国紳士達が屋外のテーブルで紅茶を楽しいんでいた時、ある夫人が「紅茶を先に入れたミルクティ」か「ミルクを先にいれた紅茶か」、味がちがうからスグわかるといった。
その場にいたほとんどの紳士は夫人の話を笑い飛ばしたが、一人「その命題をテストしてみよう」と提案した髭の男がいた。
彼こそがロナルド・フィッシャーであった。
フィッシャーはさっそくティーカップをずらりと並べ、見えないところで2種類の違った入れ方のミルクティを用意した。
そして適当な順番で婦人にミルクティを飲ませ、婦人の答えをメモしてちょっとした確率計算をした。
このことの最終結果は書きのこしていないが、同席していた人物によれば、婦人はスベテを正解したという。
そしてフィッシャーが「ランダム化」した実験の上での「確率」を導いたことは確かであり、それによって「正否」を判断したのは、当時としてはヨホド斬新な手法であったに違いない。
彼女がランダムなる五杯のミルクティを飲んでいたとすれば、偶然スベテあてる確率は2の5乗分の1、すなわち32分の1、やく3.1パーセントである。
もし10ぱいだったとしたら、1024分の1つまり0.1パーセントとなる。
さて婦人の主張の正しさの説明は、「英国王立化学協会」が2003年に発表した「一杯の完璧な紅茶の入れ方」の中にある。
「牛乳は紅茶の前に注がれるべきである。なぜなら牛乳タンパクの変性は、牛乳が摂氏75度になると生じることが確かだからである。
もし牛乳がお湯の中に注がれると、それぞれの牛乳滴は牛乳としてのまとまりからハズレ、確実に変性が生じる時間を紅茶の高温に取り囲まれる。
もしお湯が冷たい牛乳に注がれるならば、このような状況はあるかにおこりにくい」。

最近、統計学がブームを呼んでいるのは、コンピュータ・ネットワークの発達によりネットの背後に飛躍的な分量のデータが記録されるようになったからだ。
例えば私が職場で見たホームページの履歴は県の「役所」に残されており、こうした何千人の職員の履歴の集積(ビッグデータ)をビジネス活用しようと思えばできないことではない。
さて、最近では「プラチナデータ」という言葉もヨク見かける。
「プラチナデータ」もビッグデータの一つだが、コチラは作家・東野圭吾による「造語」であり、現実には存在しない「架空のもの」と見てよい。
映画「プラチナデータ」では、単なるDNA鑑定ではなくて、プロファイリングを組み合わせた「DNA操作システム」が登場する。
そして物語は、DNA捜査システムの「開発者」である兄妹が殺害されたことから始まる。
この事件を探る捜査官が、残された「遺伝子」情報を検索すると、コンピュータが示したのはナント「彼自身」の名前だったのである。
捜査官は過去の心の傷により「多重人格」であり、「もう一人の自分」を疑いツツ、「真相」の解明に向かっていく。
調査を進めるうちに「プラチナデータ」というものの存在をツカム。
それは政治家や官僚達の血縁者は、プラチナデータとして「特別扱い」されているという秘密であった。
物語上の近未来において、DNA捜査システムを有効に使う為、国民全員にDNA登録を推進しようと国を挙げて努力している。
しかし、身内に犯罪者が出たらDNAを基に捜査を進めて行くのだから、血縁関係にある人間全員に容疑がカカルことになる。
一方で、自分が犯罪を犯さないという確信があったとしても、自分の血縁関係にある人間全員が絶対に犯罪を犯さないと確信出来る人が大勢いるワケではない。
「プラチナデータ」は、「DNA捜査システム」が発達した近未来世界において、ドンナことが起きるかを示したサスペンスである。
さて、現在の統計学の出番で、スグニ思いつくのは死亡率との関わりでの「保険料の算定」や、欠陥品を一定水準以下に管理する「品質管理」である。
ところで、日本の製品について一つのジョークがある。
IBMが日本の会社に部品の製造を依頼して、「100個の内ひとつ程度の不良品は許容できる」という文書を渡した。
すると日本の会社は、101個の部品を作り、一応「不良品」も一つ作りましたといって品物を渡したという。
日本のQC(品質管理)能力の高さを示すエピソードである。
こうした統計的手法の大前提が「大数の法則」というものである。
「大数の法則」とは、個々では偶然と思われる事象でも、その事象を独立に繰り返していくと、ある一定の確率に近づく。
そして現代の経済社会は、この「大数の法則」を様々な分野で「意図的に使って」営まれているといっても過言ではない。
特に「大数の法則」と「リスク管理」とを結びつけた金融技術(例えば「証券化」)は近年著しい進化をみせた。
次のような「二つ」の投資案件があったとしよう。
1億円というお金を投入した時に、次のような「収益」と「リスク」を想定してみる。
「投資1」収益は80%の確率で3億円を生むことができ、20%の確率でゼロである。
「投資2」収益100%の確率で2億円を生むことができる。
「投資1」が「投資2」よりも「期待値」としては高い(3億×0.8>2億)のだが、なにせゼロになる可能性もあるので、確実に2億円を出す「投資2」を選択する人もカナリ多いに違いない。
しかし「投資1」を100人が同時に実施すれば、78件から83件グライは期待値の2億4000万円を生み、2億4000万円×100=240億円の「総収益」をホボ確実に生み出せる。
そして1件あたりで計算すると、結局2億4000万円の「収益」がホボ実現することになる。
このように投資の「件数」が増えると、個々の投資条件のリスクは変わらなくても、投資家全体が直面するリスクが変わる。
つまり「リスク構造」が変わるのである。
結局「金融技術」とは「大数の法則」を使って「リスクの構造」を変えることにほかならない。
そしてこうした金融技術が「資金の流れ」を促し社会を富ませることができるのである。
さて金融技術の典型が「証券化」である。何のために「証券化」するかといえば、ズバリ「リスクの分散」である。
「証券化」とは、本来市場で取引されない資産を工夫して市場で取引される資産に転換することである。
「株券」もその一例だが、金融技術の例として「貸出債権」の売買のケースを考えよう。
「貸出債権」とは分かりやすくいえば、銀行が「借用証書」を他人に売ってしまうことである。
この銀行が地元に100件の貸出先を持っていたとする。一件あたりの貸出額は1000万円で、貸し出しリスクは4パーセントとする。
すなわち貸出しの96パーセントにあたる960万円は回収できる。
この銀行が地域の不況のアオリで経営難に陥り、ここで貸出債権の設定ツマリ借用証書の販売を行うとする。
仮にバラで売るとすると、返済の予想額が960万円なので960万円で「売り」たいところだが、買い手からすれば960万円確実に入るわけではないので、940万円程度でしか売れないかもしれない。
この20万円のディスカウント分は、買い手が反映したリスクを反映しているので、「リスクプレミアム」と呼ぶ。
しかし100件ごとマトメテ売れば、話は違ってくる。
この銀行は「大数の法則」の考えを使って、貸出先ごとの個別リスクを「分散する」ことができ、940万円よりも「高い値段」で売ることが可能である。
また、依然残った「地域リスク」も分散可能である。
例えばこの銀行が不景気の地域のA支店と好景気の地域のB支店を持っていたとすれば、A支店100件とB支店100件を合わせて「束に」して売れば、この「地域リスク」さえも分散できる。
こうした「証券化」のプロセスでは、証券をマトメ買いして切り売りすることで、リスク分散のメリットをを生み出し、貸出債権を売った銀行、証券化した金融機関、証券化商品を新たに購入した投資家が享受することになる。
こうしてローリスク・ハイリターンの「金融商品」を創り出すのが金融工学なのだが、バブルが引き起こした問題とは、リスクを測ることができない「バブル」が混入したところである。
バブルは、市場関係者の見通し、計算、合理性のすべてをユガメしまい、どんな優れたビジネスモデルでも、機能しなくなった。
それが近年世界を揺さぶったサブプライムローンであり、「真のリスク」が見えニククなるほど「何層」にもでリスクを分散した点ニモ問題があったといえる。

さて、統計学全般の大前提たる「大数の法則」も数の神秘マタハ数の魔術の一つといえよう。
イギリスで清教徒革命から名誉革命、王政復古へと進む歴史上の転換期に、宇宙には美しい調和があり、宇宙を表すシンプルな美しい数式はないかと考えたのが、アイザック・ニュートンである。
実はニュ-トンが生涯「追求」していたものが3つある。物理学・錬金術・聖書である。
ニュートンはキリスト教・正統といわれる「三位一体」を否定し、通常の教会に設置された十字架や聖像さえも「偶像崇拝」だと退けた。
ニュートンの精神の透徹さは、同時代人を凌駕していたとみたい。
そんなニュートンの「世界観」が表出されるある出来事が起こった。
ハレー彗星の発見者ハレーがニュートンを訪ねてきたのである。
ハレーはニュートンに、引力が距離の二乗に反比例するなら、惑星の「軌道」はどうなるかと問うた。
彼はこの出会いを契機に力学と天文学を一つの体系にするテーマに全精力を注入した。
そして3ヶ月後に手紙というよりも論文ほどの厚さの書がハレーに届いたのである。
そうしてこれらを基にして、1687年に「自然哲学の数学的原理」(通称プリンピキア)が完成し、王立協会に提出された。
この原稿を見たハレーは、興奮のアマリ卒倒しそうだった。ナゼナラこの時、天と地が実にシンプルな美しい数式により「一体化」したのである。
そして、このシンプルさと美しさコソ、ニュートンによる「宇宙には知性が存在する」ことの証明であったように思える。