蒙特卡洛算法是AlphaGo的核心之一 当要求问题在有限的采样步骤以内,必须给出一个解的时候,不要求最优性,就是蒙卡特罗算法 两个小实验
蒙特卡洛算法的两个小实验。
1.计算圆周率pi。
原理:先画一个正方形,画出其内切圆,然后这个正方形内随机的画点,设点落在圆内的概为P,则P=圆面积/正方形面积。
P=(Pi*R*R)/(2R*2R)= Pi/4 ,即 Pi=4P
步骤:
1.将圆心设在原点,以R为半径做圆,则第一象限的1/4圆面积为Pi*R*R/4
2.做该1/4圆的外接正方形, 坐标为(0,0)(0,R)(R,0)(R,R),则该正方形面积为R*R
3.随即取点(X,Y),使得0<=X<=R并且0<=Y<=R,即点在正方形内
4.通过公式 X*X+Y*Y<R*R判断点是否在1/4圆周内。
5.设所有点(也就是实验次数)的个数为N,落在1/4圆内的点(满足步骤4的点)的个数为M,则
P=M/N 于是Pi=4*N/M
import random def M_C(num): count = 0; for i in range(1,num+1): x = random.uniform(0,1) y = random.unifrom(0,1) if x**2+y**2<1: count+=1 return 4.0*count/num;
M_C(10000)运行结果为3.1424
2.蒙特卡洛模拟求函数极值,可避免陷入局部极值
#在区间[-2,2]上随机生成一个数,求出其对应的y,找出里面最大的认为是函数在[-2,2]上的极大值
模拟1000次后发现极大值为 185.12292832389875(非常准确)