デジタル・デザイン・ラボラトリーな日々

アラフィフプログラマーが数学と物理と英語を基礎からやり直す。https://qiita.com/yaju

確率を理解してみる-ベイズの定理

はじめに

前回、ベイズ主義のところで「ベイズの定理」について軽くふれました。
yaju3d.hatenablog.jp

今回、「ベイズの定理」についてもう少し詳しく説明していきます。

ベイズの定理

P(Y|X) = \displaystyle{\frac{P(Y)P(X|Y)}{P(X)}}

  • P(X) : X が起きる確率
  • P(Y) : Y が起きる確率(事前確率)
  • P(X|Y) : Y の後でX が起きる確率(条件付き確率、尤度)
  • P(Y|X) : X の後でY が起きる確率(条件付き確率、事後確率)

確率変数

確率は p(X) という記号で表します。ここで X は「確率変数」、 p(X) は「 X の確率分布」あるいは単に「 X の確率」と言います。X の取り得る値 a に対してその確率を p(X=a),または簡単に p(a) と書きます。

サイコロの例にすると、X はサイコロをふって出る目の「確率変数」、p(X) がその「確率分布」とします。このとき,X の取り得る値は1から6までの6通りです。
すべての目が同じ割合で出るとすると、「確率の合計は1」という条件から、p(X=1) = ... = p(X=6) = 1/6 となります。

ここまで確率変数は1つでしたが、確率変数は複数個になる場合もあります。特に機械学習では、よほど簡単な例題でも複数の確率変数を持っています。

同時確率と条件付き確率

2個の確率変数 X, Y に対する確率分布を p(X, Y) と書き、XとYの「同時分布」または「同時確率」と言います。
確率変数 X に何かある値が与えられているときのYの確率を p(Y|X) と書き、Xが与えられているときのYの「条件付き確率」と言います。 確率変数 X は気にせずに、確率変数 Y のみの確率を考える場合もあります。これは p(X, Y) の Y に関する「周辺確率」と言い、単純に p(Y) と書きます。

例えば「あなたは女性だとして、美人である確率は?」という問題があった場合、先ほどの記号で表すと「P(美女|女性)」となります。
p(Y|X)で、X が前提の上で Y がで成り立つ確率となるわけです。
ベン図で表した場合
f:id:Yaju3D:20160911231744p:plain

数式 P(Y|X) = \displaystyle{\frac{P(X \cap Y)}{P(X)}}

数式の変形

最初の方でベイズの定理の数式を書いたのですが、先ほどの数式と違いますね。
これは式を変形した結果なのです。
P(Y|X) = \displaystyle{\frac{P(Y)P(X|Y)}{P(X)}}P(Y|X) = \displaystyle{\frac{P(X \cap Y)}{P(X)}}

分子の部分 参照:ベイズの定理の基本的な解説
f:id:Yaju3D:20160911234122p:plain

変形式は何故そうなるのか?
P(Y|X) = \displaystyle{\frac{P(X \cap Y)}{P(X)}}
なので、分母を消してみます。分母を消すには左辺と右辺にP(X)を掛けます。

P(X)P(Y|X) = \displaystyle{P(X \cap Y)}
変形式を分かりやすくするため、左辺と右辺の入れ替えて表示します。
P(X \cap Y) = \displaystyle{P(X)P(Y|X)}
分子は変形式と同じ? ちょっと待って下さいね。
よく見るとP(X)P(Y|X)P(Y)P(X|Y) とXとYの順序が違ってます。
実は、P(X)P(Y|X) = P(Y)P(X|Y) となることが証明(参照:ベイズの定理の証明)されています。
よって、
P(Y|X) = \displaystyle{\frac{P(X)P(Y|X)}{P(X)} = \frac{P(Y)P(X|Y)}{P(X)}}

問題例1 喫煙者の推定の問題

問題

「男性10人、女性7人が一室でパーティーを開いた。男子の喫煙者は5人、女性は3人である。部屋に入ったら煙草の吸殻が1本、灰皿の上にあった。このとき、吸った人が女性である確率を求めなさい(煙草の吸い回しはしていないと仮定する)」
出展:ベイズ推定の例題とその解

ベイズの定理による解法

吸った人が女性である確率を求めるということは、P(女性|喫煙者)を求めることである。
ベイズの定理によって、下記式を求めることになる。
P(女性|喫煙者) = \displaystyle{\frac{P(女性)P(喫煙者|女性)}{P(喫煙者)}}
P(女性) = \displaystyle{\frac{7}{(7+10)} = \frac{7}{17}}
P(喫煙者|女性) = \displaystyle{\frac{3}{7}}
P(喫煙者) = \displaystyle{\frac{(3+5)}{(7+10)} = \frac{8}{17}}
上式に代入して、分母の分母を消すために17を分母と分子に掛けます。17と7が相殺されます。
P(女性|喫煙者) = \displaystyle{\frac{\frac{7}{17} \times \frac{3}{7}}{\frac{8}{17}} = \frac{\frac{7}{17} \times \frac{3}{7} \times \frac{17}{1} }{\frac{8}{17} \times \frac{17}{1} }= \frac{3}{8}}

集合論による解法

次の図のような状況であった。吸殻を残したのは喫煙者の誰かであり、喫煙者が女性である確率は、図から明らかに\displaystyle{\frac{3}{8}}である。
f:id:Yaju3D:20161001194113p:plain

解説

この例題から分かるように、この問題をベイズの定理を使って解く理由は特にない。普通にベン図を使った集合論で解けば良い。
それでもベイズの定理を使うことを推奨できるとすれば、定理の各項にかなり機械的に数値を当てはめれば良いことだろうか。

問題例2 1976年の早稲田大学の入試問題

問題

5回に1回の割合で帽子を忘れるくせのあるY君が、正月にA、B、Cの3軒を順に年始回りをして家に帰ったとき、帽子を忘れてきたことに気がつきました。2 軒目の家Bに忘れてきた確率はいくらになりますか。 出展:その124 忘れ易い条件 その2

f:id:Yaju3D:20161016223312p:plain
f:id:Yaju3D:20161016223332p:plain

通常の解法

5回に1回忘れるとため、3軒のそれぞれで忘れる確率は\displaystyle{\frac{1}{5}}
しかし、回る順番が決まっておりそのうちの2軒目のBで忘れる確率が求められている。

1軒目のAで忘れないことが前提になるため、Bでの忘れる確率は1軒目Aで忘れない確率\displaystyle{\frac{4}{5}}
Bで忘れる確率\displaystyle{\frac{1}{5}}を掛けた、\displaystyle{\frac{4}{5} \times \frac{1}{5} = \frac{4}{25}}
同様にもしもCで忘れる確率となれば、\displaystyle{\frac{4}{5} \times \frac{4}{5} \times \frac{1}{5} = \frac{16}{125}}です。 f:id:Yaju3D:20161016225000p:plain
では、Bで忘れる確率\displaystyle{\frac{4}{5}}が正解であると思いがちですが、「確率の問題を取り扱う場合、すべてのケースの確率を合計すると1になる」という前提があります。
3軒のA、B、C どれかで忘れる確率は、\displaystyle{\frac{1}{5}}\displaystyle{\frac{4}{25}}\displaystyle{\frac{16}{125}}の合計になるので、\displaystyle{\frac{1}{5} + \frac{4}{25} + \frac{16}{125} = \frac{25}{125} + \frac{20}{125} + \frac{16}{125} = \frac{61}{125}}となりますが、これだけでは\displaystyle{1}になりません。
f:id:Yaju3D:20161016231231p:plain
では、その残りの\displaystyle{\frac{64}{125}}は何か?
それはこの合計を出したときの条件以外のときの確率で、これら3軒のどこにも帽子を忘れないという確率です。つまり\displaystyle{\frac{4}{5} \times \frac{4}{5} \times \frac{4}{5} = \frac{64}{125}}

f:id:Yaju3D:20161018033745p:plain
確率の問題を取り扱う場合、すべてのケースの確率を合計すると\displaystyle{1}とする必要があるため、そのようにするにはそれぞれに対し\displaystyle{\frac{61}{125}}倍すればいいのです。
計算すると\displaystyle{\frac{25}{61}+\frac{20}{61}+\frac{16}{61}=1}となって、A、B、Cそれぞれの割合、つまり帽子を忘れてくる確率が順に\displaystyle{\frac{25}{61}}\displaystyle{\frac{20}{61}}\displaystyle{\frac{16}{61}}と出てきます。
したがってBで帽子を忘れてきたとされる確率は\displaystyle{\frac{20}{61}}になります。

ベイズの定理による解法

X を帽子を忘れるという事象
Y を帽子を家 B に忘れるという事象とする。

求める確率は P(Y|X) = \displaystyle{\frac{P(X \cap Y)}{P(X)}}
(条件付き確率の定義)

P(X)は帽子をどこかに忘れる確率:
\displaystyle{\frac{1}{5} + \frac{4}{5} \times \frac{1}{5} + \frac{4}{5} \times \frac{4}{5} \times \frac{1}{5} = \frac{61}{125}}

P(X \cap Y) は帽子を家 B に忘れる確率:
\displaystyle{\frac{4}{5} \times \frac{1}{5} = \frac{4}{25}}

よって求める確率は(※\frac{5}{5}は分母125にして打ち消すため)
\displaystyle{\frac{\frac{4}{25}}{\frac{61}{125}} = \frac{\frac{4}{25} \times \frac{5}{5}}{\frac{61}{125}} = \frac{\frac{20}{125}}{\frac{61}{125}} = \frac{20}{61}}

参照

確率を理解してみる-頻度主義とベイズ主義

はじめに

前回、確率の基礎を説明しました。 yaju3d.hatenablog.jp

今回は、機械学習や統計で使っている確率を説明します。

最初に,機械学習にとって確率はどういう役割なのかを確認しておきましょう。実のところ,機械学習に確率が必須というわけではありません。ニューラルネットワークサポートベクターマシンなどの有名な手法も「確率を用いない機械学習」ですし,その他にも数多くの手法があります。しかし,「確率を用いない機械学習」の多くは,「結果のランキングを作りづらい(評価値の大小に意味がない)」「条件が異なる場合の結果を比較できない」などの欠点があります。一方の「確率を用いる機械学習」では,評価結果や推定されたパラメータが「どれくらい信用できるか(もっともらしいか)」を確率として計算します。確率同士は比較可能なので,計算結果を使ってランキングを作ったり,前提条件が異なっている結果同士を比較したり(よいモデルを探すときによく行われます),ということが自然にできるのです。
出展:第2回 確率の初歩:機械学習 はじめよう|gihyo.jp … 技術評論社

上記記事に「機械学習に確率が必須というわけではありません。」と書かれていて、少しやる気を失って前記事から間が空いてしまいました。記事を書くってパワーがいるんですよね。

頻度主義とベイズ主義

高校までで学んできた確率とこれから学ぶ確率は、そもそも何が違うのでしょうか?
それには、頻度主義とベイズ主義の用語がキーになります。
数理統計学では頻度主義(frequentism)とベイズ主義(Bayesianism)があり、今も大論争が続いているそうです。

統計的機械学習の最終目的は「有限回しか試行できない中で、すべての目が同じ確率で出ると言ってもよいか」という問題を工学的に(つまり現実的に)解くことなのです。

頻度主義

高校生程度で習う確率の概念は基本的に頻度主義で、すなわちランダムな事象が生起・発生する頻度をもって確率とする考えです。
例えばサイコロの目が1になる確率を無限の数のサイコロを投げて、以下のような式で表すとする考えとなります。

P(1の目) = 1の目が出た数 / サイコロを振った数

ベイズ主義

現実の世界で確率を求める時に、頻度主義で確率を求めることが出来ないことが多々ある。
例えば何かの検診を受けて何かの癌マーカーが陽性になった時、実際に癌である確率みたいな確率である。これも頻度主義で求めれないことは出来るかも知れないが、数字を出すには非常に時間と工数がかかる。
頻度主義では不確かさの定量化はランダム性にのみ基づくのに対し、ベイズ主義では情報が不足していることにも基づくとし、不確かさの定量化を広く考える。

ベイズ確率

ベイズ確率はベイズ主義による「確率」の考え方で、ベイズの定理に基づいて求める。

ベイズの定理

P(Y|X) = \displaystyle{\frac{P(Y)P(X|Y)}{P(X)}}

歴史

ベイズ確率は、ベイズの定理の特別な場合を証明した18世紀イギリスの確率論研究家トーマス・ベイズ(1702-1761)にちなんだ命名(実際の命名は1950年代)ではあるが、ベイズ自身が現在のようなベイズ確率やベイズ推定の考え方を持っていたかどうかは定かでない。ベイズ確率の考え方を積極的に用いたのはフランスの数学者シモン・ラプラス(1749-1827)(ベイズの定理の一般的な場合を証明した)である。
出展:ベイズ確率 - Wikipedia

活用

最も有名な例はスパムメールの判定で「ベイジアンフィルタ」と呼ばれています。
他にもがん検診、犯罪捜査、マーケティング人工知能など様々に使われている。

最後に

次回は、ベイズの定理についてもう少し説明していきます。

参照

確率を理解してみる-基礎編

はじめに

確率は最も実生活で役立つ分野といっても過言ではない。未来に起こりうる事象の割合である確率を勉強することは、予知能力を手に入れることにも等しい。元々、確率分野は「何とかして賭けに勝ちたい」という強い思いから始まった分野である。未来を予測することができれば、賭けでは非常に有利になる。人生には様々な分岐があり、どちらへ進むべきかを迷うことも多い。そんなとき、確率的思考ができる人とできない人では、どれだけ自分にとって有利な選択ができるかに差が生じてしまうのである。
出展:数A 確率 | 受験の月

確率が分かるようになると合理的な判断ができるようになりそうですね。
機械学習では「確率」が重要キーワードですし、これまで「順列と組合せを理解してみる」の記事を書いてきたのも確率を理解したいためです。

確率とは

「ある事象が発生する可能性の大きさを表す数値」のことである。
中学2年の時に確率の概念を習っているんですね。てっきり、高校の順列と組合せの後で習うと思い込んでいました。

確率といったら、「サイコロを1回振った時に3が出る確率は1/6である」といった例が有名です。

確率の求め方

\displaystyle 起こる確率=\frac{ある事柄が起こる場合の数}{起こりうるすべての場合の数}

一般式は、起こる場合が全部でn通り、事柄Aの起こる場合がa通り、その確率をpとする。
\displaystyle p = \frac{a}{n} (0≦p≦1)
※確率の英語「probability(プラバビリティ:アメリカ読み、プロバビリィ:イギリス読み)」

先程の「サイコロを1回振った時に3が出る確率」では、分母側は「出る目は全部で6通り」、分子側は「3の出る目は1通り」で \displaystyle  \frac{1}{6} となります。

問題と解説

1個のさいころを投げるとき,4以上の目が出る確率を求めよ

目が4以上になるのは、4,5,6の3通りです。
出る目は全部で6通りです。
\displaystyle p = \frac{3}{6} = \frac{1}{2} となります。

2個のサイコロを同時に投げるとき、2個のサイコロの目の和が6となる確率を求めよ

目の和が6になるのは、{1,5},{2,3},{3,3},{4,2},{5,1}の5通りです。
出る目は全部で 6^2 = 36 通りです。
\displaystyle p = \frac{5}{36}となります。

1~10までの異なる番号のついた10枚のカードから、2枚のカードを取り出すという試行において、次の事象が起こる確率を求めよ。

(1) 2枚とも偶数である。
同時に取り出すため、順番は考えないことで組合せを使う。
全事象は、\displaystyle _{10} C _2 通りとなる。
2枚とも偶数なのは、{2,4,6,8,10}の5枚のカードから同時に2枚を取り出すので、 \displaystyle _5 C _2 通りとなる。
\displaystyle p = \frac{_5 C _2}{_{10} C _2} = \frac{2}{9} となります。

(2) 少なくても1枚は奇数である。
少なくても1枚は奇数ということは2枚とも偶数でなければよいことになる。よって全体から引くことする。 このように「ある事象Aに対して、この事象Aが起こらないという事象」をAの余事象といいます。
2枚とも偶数であるのは先程求めましたので、全体「1」から引けばいいです。
※全事象の確率の方針は必ず「1」となる。
\displaystyle p = 1 - \frac{_5 C _2}{_{10} C _2} = 1 - \frac{2}{9} = \frac{7}{9} となります。

リンゴ2つとバナナ4つの入ったかごから2つの果物を同時に取り出すとき、リンゴ1つとバナナ2つを取り出す確率を求めてください。

全事象は、果物6個の中から3個を選ぶ組合せなので、 \displaystyle _6 C _3 通りとなります。
リンゴ2個の中から1個、バナナ4個の中から2個を選ぶ組合せは、\displaystyle _2 C _1 \times _4 C _2 通りです。
よって確率は、\displaystyle p = \frac{_2 C _1 \times _4 C _2}{_6 C _3} = \frac{2 \times 6}{20} = \frac{12}{20} = \frac{3}{5}

男4人、女3人の計7人を並べるとき、両端が2人とも女子である確率を求めてください。

全事象は、7人の並べ方なので順列となり、\displaystyle _7 P _7 通りとなります。
両端が女子となる時、両端の二人の並べ方は、\displaystyle _3 P _2、間の5人の並べ方は \displaystyle _5 P _5
よって求める確率は、\displaystyle p = \frac{_3 P _2 \times _5 P _5}{_7 P _7} = \frac{3 \times 2 \times 5 \times 4 \times 3 \times 2 \times 1}{7 \times 6 \times 5 \times 4 \times 3 \times 2 \times 1} = \frac{6}{42} = \frac{1}{7}

最後に

今回はあくまで基礎の部分です。これすら自分的にはまだ勉強不足なところがありますが大まかな確率の概念が分かれば良しとします。
機械学習や統計で使っている確率はまた違った求め方になりますので、次回に説明していきます。

参照

順列と組合せを理解してみる-競馬の組合せ

はじめに

これまで順列と組合せを学んできたので、応用として競馬の組合せを計算してみたいと思います。 yaju3d.hatenablog.jp yaju3d.hatenablog.jp

競馬の組合せ

18頭出る場合で想定してみます。

単勝

1着になる馬を当てる馬券です。

1着になる馬は18通り考えられます。
一般式  n
n = 18 なので 18 通りです。

複勝

3着までに入る馬を当てる馬券です。

考え方は単勝と同じです。
一般式  n
n = 18 なので 18 通りです。

馬単

1着と2着になる馬の馬番号を着順通りに当てる馬券です。

1着の馬は18通り、2着は1着の馬を除外して17通りで順列となります。
一般式  _n P _2
n = 18 なので  18 \times 17 = 306 通りです。

馬連

1着と2着になる馬の馬番号の組合せを当てる馬券です。

1着と2着の順序は関係ないため、組合せを使います。
一般式  _n C _2
n = 18 なので  \displaystyle \frac{18 \times 17}{2 \times 1} = 153 通りです。

枠連

1着と2着になる馬の枠番号の組合せを当てる馬券です。

枠を8通りにしたとして、考え方は馬連と同じです。
一般式  _n C _2
n = 8 なので  \displaystyle \frac{8 \times 7}{2 \times 1} = 28 通りです。

枠連(ゾロ目含む)

枠連の場合、同じ枠で1着と2着になる可能があるのでゾロ目も考慮する。

枠を8通りにしたとして、考え方は枠連にゾロ目分を加算します。
一般式  _n C _2 + n
n = 8 なので  \displaystyle \frac{8 \times 7}{2 \times 1} + 8 = 28 + 8 = 36 通りです。

または、全体から引く
一般式  n^2 - _n C _2
n = 8 なので  \displaystyle 8 \times 8 - \frac{8 \times 7}{2 \times 1} = 64 - 28 = 36 通りです。

ワイド

3着までに入る2頭の組合せを馬番号で当てる馬券です。

2頭の順序は関係ないため、考え方は馬連と同じ組合せを使います。
一般式  _n C _2
n = 18 なので  \displaystyle \frac{18 \times 17}{2 \times 1} = 153 通りです。

3連単

1着、2着、3着となる馬の馬番号を着順通りに当てる馬券です。

1着の馬は18通り、2着は1着の馬を除外して17通り、3着は同様に16通りで順列となります。
一般式  _n P _3
n = 18 なので  18 \times 17 \times 16 = 4896 通りです。

3連複

1着、2着、3着となる馬の組合せを馬番号で当てる馬券です。

1着と2着と3着の順序は関係ないため、組合せを使います。
一般式  _n C _3
n = 18 なので  \displaystyle \frac{18 \times 17 \times 16}{3 \times 2 \times 1} = 816 通りです。

ボックス

ボックスとは、連勝式馬券(枠連、馬連、三連複、三連単)で選択した全ての番号の組み合わせを購入する投票方法です。

式別 展開
枠連  _n C _2 n(n-1) / 2
馬連  _n C _2 n(n-1) / 2
ワイド  _n C _2 n(n-1) / 2
3連複  _n C _3 n(n-1)(n-2) / 6
馬単  _n P _2 n(n-1)
3連単  _n P _3 n(n-1)(n-2)

5頭を馬連ボックスで買うとした場合、n = 5を計算式に当てはめると、5(5-1) / 2 = 5 \times 4 / 2 = 10 通りになります。6頭なら 6(6-1) / 2 = 6 \times 5 / 2 = 15 通りです。
5頭を3連単ボックスで買うと、5(5-1)(5-2) = 5 \times 4 \times 3 = 60 通りになります。

※枠連をボックスで購入するとゾロ目(例 3-3、5-5)は含まれません。

フォーメーション

フォーメーションとは、特に三連単の時に1着・2着・3着それぞれに可能性のある馬番を選択する投票方法です。
ボックスでは買い目が増えるのが難点です。そこでもう少し予想の幅を狭めて目数を減らす買い方がフォーメーションとなります。

式別 展開
枠連 n n
馬連 n n
ワイド n n
3連複(軸1頭)  _n C _2 n(n-1) / 2
3連複(軸2頭) n n
馬単 n n
3連単(軸1頭)  _n P _2 n(n-1)
3連単(軸2頭) n n

枠連・馬連・ワイド・馬単・3連複(軸2頭)・3連単(軸2頭)

「軸と他1頭」と考えて n 通りとなります。

3連複(軸1頭)

「軸1頭と馬連BOX」と考えて、馬連BOXと同じ  _n C _2 となります。

3連単(軸1頭)

「軸1頭と馬単BOX」と考えて、馬単BOXと同じ  _n P _2 となります。

5頭を3連単ボックスで買うと60通りですが、1着はこの馬しかありえないと考えると3連単(軸1頭)とします。
1着以外の4頭の組合せで考えます。
n=4なので、4(4-1) = 4 \times 3 = 12 通りになります。ボックスで買うより48点も少なくなります。

マルチ

マルチ投票とは「馬単ながし」、「3連単ながし」において、軸と相手の着順を入れ替えた組合せも同時に購入する投票方法です。
言葉だけだと分かりにくいので例を挙げて見てみましょう。

式別 展開
馬単 n \times 2 n x 2
3連単(軸1頭)  _n P _2 \times 3 n(n-1) x 3
3連単(軸2頭) n n x 6

馬単

軸馬①から相手馬②③④に流した場合
・マルチなし→1着①から2着②③④流しの3点です。(軸馬2着固定もできます)
・マルチあり→上記3点に加え、2着①から1着②③④への流し3点で計6点です。
つまり「裏」も購入するって事です。軸馬が1着の時と2着の時両方が対象です。

フォーメーションの馬単が nですから、裏も対象となるため n \times 2 となります。

3連単(軸1頭)

軸馬①から相手馬②③④の場合
1着①から2・3着②③④に流した場合の①-②-③、①-②-④、①-③-②、①-③-④、①-④-②、①-④-③ の6点に加え
2着①から1・3着②③④に同様に流した場合の6点
3着①から1・2着②③④に同様に流した場合の6点の計18点です。

[A(軸)][B][C]というグループですので、ABCの組み合わせ(=馬単の3頭BOX)と同じ考え方になります。
3連単(軸1頭)に3を掛けた n(n-1) \times 3で計算できます。

上記例の4頭の場合、1着以外の3頭の組合せで考えます。
n=3なので、3(3-1) \times 3 = 3 \times 2 \times 3 = 18 通りとなります。

3連単(軸2頭)

軸馬①②から相手馬③④⑤の場合
①-②-☆、②-①-☆、①-☆‐②、②‐☆‐①、☆‐①‐②、☆‐②‐①以上の6パターンがあり、☆の部分に相手馬③④⑤が入ります。
よって6パターン×相手3頭で計18点です。

3連単(軸2頭)は[A(軸)][B(軸)][C]というグループですので、ABCの順列(=馬単の3頭BOX)と同じ考え方になります。
3連単(軸2頭)に6を掛けた n \times 6で計算できます。

上記例の5頭の場合、1着2着以外の3頭の組合せで考えます。
n=3なので、3 \times 6 = 18 通りとなります。

終わりに

即PATで投票内容を入力すると組合せの件数が出てくるけど、なんでこんな件数になるんだろうと思ってた部分があったので、理解が出来てすっきりした感じです。

余談ですが出来るだけ損をしたくない方は、即PATに「投票金額自動配分機能」があります。
参照:マニュアルの「金額」の入力の予算金額セット

これは購入予算額を入力するだけで、どのベットが的中しても払戻金が均一に近くなるように各ベットの購入金額を自動配分する機能です。

参考

順列と組合せを理解してみる-組合せ

はじめに

前回、順列を説明しました。今回は組合せとなります。 yaju3d.hatenablog.jp

順列と組合せの違いですが、順列の場合は「順番をつける」、組合せの場合は「順番をつけない」となります。

組合せ

組合せには下記の公式があります。Cはcombination(コンビネーション)の頭文字です。
公式: \displaystyle _n C _r = \frac{_n P _r}{r!}

問題と解説

A、B、C、D、Eの5人から3人を選ぶ

理解するために公式を使わずに問題を解いてみましょう。
3人を選ぶというのは、選ばれた組(3人)と選ばれない組(2人)に分けるということです。
まず、選ばれた組に1人目、2人目、3人目という「席」があると考えて順列と同様に考えます。
 _5 P _3 = 5 \times 4 \times 3 = 60通りとなります。

ところが、これでは「1人目、2人目、3人目」が「A、B、C」のときと「A、C、B」のときは、組としては同じなのに重複して数えられています。
f:id:Yaju3D:20160717113527p:plain

同じ3人が選ばれたときの並び方 3! = 6通り分が重複しています。
これが「B、C、D」…「C、D、E」など他の組合せでも同様となるため、元の式を 3! で割ってしまえばいいです。

 \displaystyle \frac{_5 P _3}{3!} = \frac{5 \times 4 \times 3}{3 \times 2 \times 1} = 10通りとなります。

計算式を一般化

先程の計算式を一般化してみます。

 \displaystyle \frac{_5 P _3}{3!} = \frac{1}{3!} \times \frac{5!}{2!} (←\displaystyle _n P _r = \frac{n!}{(n - r)!}より)
 \displaystyle = \frac{5!}{3! \times (5 - 3)!}

よって、組合せは次の方法で計算できます。
 \displaystyle = \frac{n!}{r!(n-r)!}
最初の式に戻すと公式と同じになります。
 \displaystyle = \frac{_n P _r}{r!}

問題と解説

10人の人間から7人の代表を選ぶとき、選び方の場合の数を求めよ。

公式を使ってみます。
 \displaystyle _{10} C _7 = \frac{10 \times 9 \times 8 \times 7 \times 6 \times 5 \times 4}{7 \times 6 \times 5 \times 4 \times 3  \times 2  \times 1} = \frac{10 \times 9 \times 8}{3  \times 2  \times 1} = 120通りとなります。

これくらいならまだしも、例えば、 _{100} C _{98}だと計算が大変になります。
コンビネーションにはこれを簡単にできる性質があります。
 \displaystyle _n C _r = _n C _{(n-r)}
先程の計算を当てはめてみます。
 \displaystyle _{10} C _7 = _{10} C _{(10-7)} = _{10} C _3 = \frac{10 \times 9 \times 8}{3  \times 2  \times 1} = 120通りで同じとなります。

問題と解説

男6人と、女4人の計10人から4人の代表を選ぶとき、男2人と女2人となる選び方の場合の数を求めよ。

これは積の法則を使います。
 \displaystyle _6 C _2 + _4 C _2 = \frac{6 \times 5}{2 \times 1} \times \frac{4 \times 3}{2 \times 1} = 90通りとなります。

重複組合せ

順列に重複順列があるように組合せにも重複組合せがあります。

重複組合せには下記の公式があります。重複組合せはcombination with repetitionsですが Hを使われています。Hは同次多項式(homogeneous polynomial)がおそらく由来とのことです。
公式: _n H _r = _{n+r-1} C _r

問題と解説

青,赤,黒の三種類の玉がたくさんある。この中から4つ玉を選ぶときに得られる色のパターンが何通りあるか求めよ。

3種類のものから重複を許して4個選ぶ場合の数なので、重複組合せの公式から
 \displaystyle _3 H _4 = _6 C _4 = 15通りとなります。

参考

順列と組合せを理解してみる-順列

はじめに

前回、順列に入る前に「場合の数」として「積の法則」と「和の法則」を説明しました。 yaju3d.hatenablog.jp

ここで重要なのは「積の法則」で、事象の数がいくつあっても、それが同時に起こる場合は積の法則で場合の数を求めます。

順列とは

順列とは、ひと言で言うと「並べ替え」のことです。 数学的な説明だと「一般に互いに異なる n個のものから r個取り出して、それを1列に並べるとき、その並べ方を、n個のものから r個取る」を順列といいます。
分かりにくいので、実際に問題を説いてみましょう。

問題と解説

1、2、3の3個の数字を並べ替えて3桁の整数を作ります。1度使った数字は2度は使いません。考えうる整数のパターンは何通りできるでしょうか?

積の法則で、 3 \times 2 \times 1 = 6通りとなります。

場合の数が少ないので樹形図で表現してみます。
f:id:Yaju3D:20160710161743p:plain

1度使った数字は2度は使わないため、次の数字のパターンは1つずつ減っていきます。
これは数学の定義では、nの階上(かいじょう) n! として表します。

nの階乗は1から n までの整数を乗算したもので、以下のように展開できます。 n! = n \times (n-1) \times (n-2) \times \cdots \times 2 \times 1

席とは

「並べ替える」というのを視点を変えてみると、下図のように「用意された席に要素を当てはめる」と考えることができます。
f:id:Yaju3D:20160710213741p:plain

n=rの場合

A、B、Cの3人が3つの席に座る方法(順番)は何通りあるか。

「席の問題」では、「席を順番に埋める」ことを考えます。3つの席(n)に3人(r)と n=rの場合となります。

1つ目の席の埋め方は、A、B、Cの3通り。
2つ目の席は、1つ目の席に座った人以外の2通り 。
3つ目の席は、1つ目と2つ目の席に座った人以外(残り)の1通り。

積の法則で、 3! = 3 \times 2 \times 1 = 6通りとなります。

n<rの場合

A、B、C、D、Eの5人が3つの席に座る方法は何通りか。

「席の問題」なので、まず席を順番に埋めてみます。3つの席(n)に5人(r)と n<rの場合となります。

f:id:Yaju3D:20160710222219p:plain

積の法則で、 5 \times 4 \times 3 = 60通りとなります。

順列の計算方法

n<rの場合の計算では、5(=n)から始めて3(=r)個の数を、1ずつ減らしています。
問題の人数(n)や席の数(r)が変わっても、計算の方法は同じです。

順列には下記の公式があります。Pはpermutation(パーミュテーション)の頭文字です。
公式:\displaystyle _n P _r = \frac{n!}{(n-r)!}

_5 P _3 = 5 \times 4 \times 3 (←5から始めて3個かけた)
公式を分解していくと下記のようになります。
=\displaystyle \frac{5!}{(5-3)!}
=\displaystyle \frac{5!}{2!}
=\displaystyle \frac{5 \times 4 \times 3 \times 2 \times 1}{2 \times 1}
=5 \times 4 \times 3 (←分母分子の 2×1 を消した)

n=rの場合も、_3 P _3となります。これは 3!と同じことになります。

重複順列

最初に重複順列の説明をしましたが、もう少し説明を追加してみます。
yaju3d.hatenablog.jp

問題と解説

5題の問題に○、×で答える答え方は何通りあるか。

この例では、「1問目」「2問目」・・「5問目」を「席」と考えます。
このように、要素を何度使ってもよい問題では、「席」の考え方が便利です。

f:id:Yaju3D:20160711002227p:plain

積の法則で、 2 \times 2 \times 2 \times 2 \times 2 = 32通りとなります。
重複順列の公式  n^r を用いて  2^5 = 32 でもいいです。

1問目の答え方は、○か×の2通り。
2問目の答え方も、○か×の2通り。これは1問目の答え方に影響されません。
同じようにして、3、4、5問目の答え方もそれぞれ2通りずつとなります。

順列と重複順列の違い

  • 順列は並び方を考慮する。
  • 重複順列は並び方を考慮せず、選び方のみ。

順列と和の法則

事象の数がいくつあっても、それが同時に起こらない場合は和の法則を使って場合の数を求めます。
今回、順列と和の法則を組合せて場合の数を求めます。

問題と解説

0 から 6 までの7個の数字を取り出して並べるとき、5で割り切れる4けたの整数の個数を求めなさい。

ヒント:5の倍数は一の位が必ず、0か5になることに注意します。

一の位が0の場合と5の場合を別々に考えます。

一の位が0の場合

千の位、百の位、十の位は1から6までの数字を1回づつ使うことができるので、6個の中から3個を取り出し並べる順列の数を求めます。
_6 P _3 = 6 \times 5 \times 4 = 120 通りとなります。

f:id:Yaju3D:20160716164303p:plain

一の位が5の場合

千の位に0が使えないので、千の位は0、5以外の5通り、百と十の位は一と千の位で用いた数字以外どれでも1回づつ使える順列の数を求めます。
5 \times  _5 P _2 = 5 \times 5 \times 4 = 100 通りとなります。

f:id:Yaju3D:20160716164238p:plain

和の法則を使う

ここで、一の位が0の場合と5の場合は同時にはおきないので、和の法則を使用します。
全部で 120 + 100 = 220 通りとなります。

円順列

順列には円順列というのもあります。

問題と解説

4人の生徒が円形のテーブルのまわりに座るとき、座り方は何通りあるか?

順列と同様に並び方だけなら、4! = 24 通りになります。順列と円順列の違いはここからです。

f:id:Yaju3D:20160716170514p:plain

これら4つの並び方は、回転させることによって重なるので、どれも同じ1つの並び方だと考えられる。
つまり、上図の①,②,③,④のように順送りに並ぶ4つの順列は、円形に並べた場合には同一視とします。
よって、この4人の座り方は \displaystyle \frac{4!}{4} = 3! = 6 通りとなります。

\displaystyle \frac{4!}{4} = (4 - 1)!と変換できますので、円順列の公式は (n - 1)!で表します。

数珠順列

数珠順列は「じゅず順列」と読みます。回転したりひっくり返しても一致しない円状の配列を数珠順列といいます。

問題と解説

A・B・C・Dに紐を通してネックレスを作るとき、作り方の場合の数を求めよ

並び方だけなら円順列と同じなので、(4 - 1)! = 3! = 6 通りとなります。円順列と数珠順列の違いはここからです。

f:id:Yaju3D:20160716173715p:plain

上図のようにネックレスなので裏返しても同じになることがあります。
このように表裏をひっくり返すことができる場合には、同一視とします。
よって、2で割るため、\displaystyle \frac{ (4 - 1)! }{2} = 3 通りとなります。

参考

順列と組合せを理解してみる-場合の数

はじめに

前回、重複順列をやりましたので今回は順列と行きたいところですが、順列に入る前に「場合の数」として「積の法則」と「和の法則」について説明します。 yaju3d.hatenablog.jp

場合の数とは

ある事柄の起こりうる場合の総数のことです。
場合の数を数える重要な考え方として「積の法則」と「和の法則」があります。

積の法則

事柄Aの起こり方が m 通りあり、その各々に対して事柄Bの起こり方が n 通りあるとき、AとBがともに起こる場合の数は( m × n )通りである。

問題

例えばお絵かきソフトのオプションボタンで、ペンの色が「赤・黄・青」、線の種類が「実践・点線」、図形の種類が「直線・四角形・円」とあった場合、このオプションボタンの組合せで描くことができる図形は何種類あるか?

3 \times 2 \times 3 = 18通りとなります。

解説

ペンの色、線の種類、図形の種類は、それぞれの中から必ず1つを選択するようになっています。つまり、この3つは同時に起こる事象です。事象の数がいくつあっても、それが同時に起こる場合は積の法則で場合の数を求めます。

和の法則

事柄A、Bが同時には起こらないとき、Aの起こり方が m 通り、Bの起こり方が n 通りとすると、AまたはBのどちらかが起こる場合の数は( m + n )通りである。

問題

まったく同じ形の2つのサイコロを同時に投げて、出た目の合計が「5」または「10」になる組合せはいくつあるでしょう?

2 + 2 = 4通りとなります。

解説

出た目の合計が「5」になるのは「1+4」と「2+3」の2通り、出た目の合計が「10」になるのは「4+6」と「5+5」の2通りです。 事象の数がいくつあっても、それが同時に起こらない場合は和の法則を使って場合の数を求めます。

和の法則と積の法則の使い分け

簡単な考え方
和の法則=「または」のとき
積の法則=「かつ」のとき
参照:【場合の数と確率】和の法則と積の法則の使い分け

スポンサーリンク