传送门
我们用递推的思想, 用d[i]表示“答对i题后的最大期望奖金”,再加上“不回答”时的情况,可以得到:若第1题答对 概率为p,期望奖金的最大值 =
上述分析可以推广到一般情况,但是要注意一点:到目前为止,一直假定p是已知的, 而p实际上并不固定,而是在内均匀分布。根据连续概率的定义,d[i]在概念上等于 在上的积分.
因为有max函数的存在,需要分两种情况讨论,即和两种情况。 令(加了一个max是因为根据题目,),则:
-
时,,因此“不回答”比较好,期望奖金等于。
-
时,“回答”比较好,期望奖金等于d[i]乘以p的平均值(d[i]作为常数被“提出
来”了),即。
在第一种情况中,p的实际范围是,因此概率为。根据全期望公 式,。
边界是,逆向递推出就是本题的答案。
#include<iostream>
using namespace std;
const int N=50;
double d[N];
int n;
double t;
int main(){
while(cin>>n>>t,n||t){
d[n]=(1<<n);
for(int i=n-1;i>=0;i--){
double p0=(double)(1<<i)/d[i+1];
if(p0<t) p0=t;
double p1=(p0-t)/(1-t);
d[i]=(1<<i)*p1+(1+p0)/2*d[i+1]*(1-p1);
}
printf("%.3lf\n",d[0]);
}
}
来源:CSDN
作者:~lxh
链接:https://blog.csdn.net/weixin_43601905/article/details/103239654