• uva 10900 So you want to be a 2n-aire?


    https://vjudge.net/problem/UVA-10900

         在一个电视娱乐节目中,你一开始有1元钱。主持人会问你n个问题,每次你听到问题后有两个选择:一是放弃回答该问题,退出游戏,拿走奖金;二是回答问题。如果回答正确,奖金加倍;如果回答错误,游戏结束,你一分钱也拿不到。如果正确地回答完所有n个问题,你将拿走所有的2 n 元钱,成为2 n 元富翁。当然,回答问题是有风险的。每次听到问题后,你可以立刻估计出答对的概率。由于主持人会随机问问题,你可以认为每个问题的答对概率在t和1之间均匀分布。输入整数n和实数t(1≤n≤30,0≤t≤1),你的任务是求出在最优策略下,拿走的奖金金额的期望值。这里的最优策略是指让奖金的期望值尽量大。

    最优策略,说明一定只答对题

    dp[i]表示答对i道题,获得奖金的期望最大值

    假设当前已经答对了i道题,得到了2^i元

    如果 p*dp[i+1]>2^i,那么他一定会选择答题

    所以首先算出这个分界p

    如果t>=p, 那就答题,dp[i]=(1+t)/2 * dp[i+1]

    否则,分(t——p,停止答题)和(p——1继续答题)讨论

    ∴dp[i]=(p-t)/(1-t)*2^i + (1-p)/(1-t)*(1+p)/2*dp[i+1]

    (1+t)/2、(1+p)/2 :答对的概率均匀分布,取平均值

    #include<cstdio>
    using namespace std;
    double dp[31],p;
    int bit[31];
    int main()
    {
        bit[0]=1;
        for(int i=1;i<=30;i++) bit[i]=bit[i-1]*2;
        int n;double t;
        while(scanf("%d",&n)!=EOF)
        {
            if(!n) return 0;
            scanf("%lf",&t);
            dp[n]=bit[n];
            for(int i=n-1;i>=0;i--)
            {
                p=bit[i]/dp[i+1];
                if(t>=p) dp[i]=(1+t)/2*dp[i+1];
                else dp[i]=(p-t)/(1-t)*bit[i]+(1-p)/(1-t)*(1+p)/2*dp[i+1];
            }
            printf("%.3lf
    ",dp[0]);
        }
    }
  • 相关阅读:
    Hsqldb中设置主键,并让主键自增
    解决Hsqldb指针只能单向移动,不能回滚问题(.first())
    MySql服务的启动和停止
    jetty和tomcat比较
    查看某一端口被什么程序占用
    小程序修改swiper小圆点
    小程序返回上一页。或者某一页上刷新返回页
    小程序或者vue商品秒杀倒计时
    小程序 wx.switchTab 不能带参数的解决办法
    微信小程序倒计时60S
  • 原文地址:https://www.cnblogs.com/TheRoadToTheGold/p/6941350.html
Copyright © 2020-2023  润新知