首先从贝叶斯公式开始:
给定某些样本D,在这些样本中计算某结论A1,A2…An出现的概率,即P(Ai|D),若求maxP(Ai|D),则有以下式子:
– 当样本给定时,P(D)是常数,可以忽略
m
a
x
P
(
A
i
∣
D
)
=
m
a
x
P
(
D
∣
A
i
)
P
(
A
i
)
P
(
D
)
=
m
a
x
(
P
(
D
∣
A
i
)
P
(
A
i
)
)
maxP(A_i|D)=max\frac{P(D|A_i)P(A_i)}{P(D)}=max(P(D|A_i)P(A_i))
maxP(Ai∣D)=maxP(D)P(D∣Ai)P(Ai)=max(P(D∣Ai)P(Ai))
– 若A1,A2,…An的先验概率相等(或者近似),则得到以下结论:
m
a
x
P
(
A
i
∣
D
)
→
m
a
x
P
(
D
∣
A
i
)
maxP(A_i|D)→maxP(D|A_i)
maxP(Ai∣D)→maxP(D∣Ai)
–也就是说,问题从在求给定样本D下,
A
1
,
A
2
,
.
.
.
A
i
A_1,A_2,...A_i
A1,A2,...Ai中哪一个结论的发生的可能性最大,转变为给定一个结论
A
i
A_i
Ai,该样本D产生的概率最大(最大似然估计)。
甲球队 | 乙球队 | |
---|---|---|
败率( Y ) | 0.8 | 0.2 |
赔率( P ) | 1.25 | 5 |
假设票价为一元,所有人中,有a人买甲球队赢,b人买乙球队赢,则庄家在比赛前收入为(a+b)元,同时,庄家的赔付期望为:
E
(
y
)
=
∑
Y
i
P
i
=
0.8
×
1.25
×
a
+
0.2
×
5
×
b
=
a
+
b
E(y)=\sum{Y_i}{P_i}=0.8×1.25×a+0.2×5×b=a+b
E(y)=∑YiPi=0.8×1.25×a+0.2×5×b=a+b
由此可见,庄家不亏不赚,故当赔率为
P
=
1
Y
P=\frac{1}{Y}
P=Y1时,为公平赔率
–在实际中,庄家会将公平赔率乘以某一个小于1的系数
α
\alpha
α,即得到真实赔率:
y
=
α
⋅
P
f
a
i
r
y=\alpha \cdot P_{fair}
y=α⋅Pfair
API:Fuzzywuzzy
参考视频:用最直观的方式告诉你:什么是主成分分析PCA
参考文章:github
性别 | 财富 | |
---|---|---|
样本一 | 1 | 4 |
样本二 | 2 | 2 |
样本三 | 1 | 1 |
样本四 | 2 | 3 |
–如果转换成用one-hot编码,则有下图:
性别男 | 性别女 | 贫穷 | 温饱 | 小康 | 富裕 | |
---|---|---|---|---|---|---|
样本一 | 1 | 0 | 0 | 0 | 0 | 1 |
样本二 | 0 | 1 | 0 | 1 | 0 | 0 |
样本三 | 1 | 0 | 1 | 0 | 0 | 0 |
样本四 | 0 | 1 | 0 | 0 | 1 | 0 |