1419: Red is good
Time Limit: 10 Sec Memory Limit: 64 MBSubmit: 660 Solved: 257
[Submit][Status][Discuss]
Description
桌面上有R张红牌和B张黑牌,随机打乱顺序后放在桌面上,开始一张一张地翻牌,翻到红牌得到1美元,黑牌则付出1美元。可以随时停止翻牌,在最优策略下平均能得到多少钱。
Input
一行输入两个数R,B,其值在0到5000之间
Output
在最优策略下平均能得到多少钱。
Sample Input
5 1
Sample Output
4.166666
HINT
输出答案时,小数点后第六位后的全部去掉,不要四舍五入.
Source
Solution
概率期望DP
$f[i][j]$表示选$i$张红和$j$张黑的答案
转移就是期望*概率
$f[i][j]=max(0,frac{i}{i+j}*(f[i-1][j]+1)+frac{j}{i+j}*(f[i][j-1]-1))$
卡内存需要滚动数组
Code
#include<iostream> #include<cstdio> #include<cstring> #include<cmath> #include<algorithm> using namespace std; int R,B,now; double f[2][5001]; int main() { scanf("%d%d",&R,&B); for (int i=0; i<=R; i++,now^=1,f[now][0]=i) for (int j=1; j<=B; j++) f[now][j]=max(0*1.0,1.0*i/(i+j)*(f[now^1][j]+1)+1.0*j/(i+j)*(f[now][j-1]-1)); long long ans=f[R&1][B]*1000000; printf("%lf",(double)ans/1000000); return 0; }