假设已经求出了在每个点的最优期望收益,显然最优策略是仅当移动一次后的期望收益>当前点收益时移动。对于初始点,其两边各存在一个最近的不满足上述条件的位置,因此从初始点开始随机游走,直到移动到这两个点之一时停止即为最优方案。
设当前点为i,左边的停止点为x,右边的停止点为y,考虑在x停止和在y停止的概率各是多少。设从i点出发在x停止的概率为f(i),显然有f(x)=1,f(y)=0,f(i)=[f(i-1)+f(i+1)]/2。解方程得f(i)=(y-i)/(y-x)。在y停止的概率同理。
再设f[i]为从i点出发的最优期望收益,则f[i]=(y-i)/(y-x)*a[x]+(i-x)/(y-x)*a[y]。注意到这个式子实际上是(x,a[x])和(y,a[y])的连线在i点的值。所以如果任意两点间的连线都不高于在该点停止的收益,该点即为停止点。求出凸包即可。
#include<iostream> #include<cstdio> #include<cstdlib> #include<cmath> #include<cstring> #include<algorithm> using namespace std; #define ll long long #define N 100010 int gcd(int n,int m){return m==0?n:gcd(m,n%m);} int read() { int x=0,f=1;char c=getchar(); while (c<'0'||c>'9') {if (c=='-') f=-1;c=getchar();} while (c>='0'&&c<='9') x=(x<<1)+(x<<3)+(c^48),c=getchar(); return x*f; } int n,a[N],q[N],m; int main() { #ifndef ONLINE_JUDGE freopen("a.in","r",stdin); freopen("a.out","w",stdout); const char LL[]="%I64d "; #else const char LL[]="%lld "; #endif n=read(); for (int i=1;i<=n;i++) a[i]=read(); q[++m]=0; for (int i=1;i<=n+1;i++) { while (m>1&&1ll*(a[i]-a[q[m]])*(q[m]-q[m-1])>1ll*(a[q[m]]-a[q[m-1]])*(i-q[m])) m--; q[++m]=i; } for (int i=1;i<m;i++) for (int j=q[i]+1;j<=q[i+1];j++) if (j<=n) printf(LL,(1ll*a[q[i]]*(q[i+1]-j)+1ll*a[q[i+1]]*(j-q[i]))*100000/(q[i+1]-q[i])); return 0; }