一名参赛者有一个能装下 k k k份奖金的袋子。有 n n n场比赛,每场比赛中的胜者会被奖励一个大小为 a i a_{i} ai的袋子或者是一份奖金。当参赛者赢得至少 l l l场比赛会被认为是发挥良好。参赛者每次赢的一场比赛后赢的得奖金不必立刻放入他的背包,它可以完成所有比赛后带着所有背包回来装奖金,每场比赛获胜的概率是 p [ i ] p[i] p[i],问最后发挥良好并且能够带走他赢下的所有奖金的概率是多少?
显然是一个 d p dp dp:
一开始的思路,设 d p [ i ] [ j ] [ k ] dp[i][j][k] dp[i][j][k]为前 i i i场,赢了 j j j场,并且此时总容量为 k k k的概率是多少。注意到最多装下 n n n份奖金,于是 k > = n + 1 k>=n+1 k>=n+1的部分选择累加在 d p [ i ] [ j ] [ n + 1 ] dp[i][j][n+1] dp[i][j][n+1]上。最后的答案应该是所有 ∑ j = l n ∑ k = 赢下的奖金场数 n + 1 d p [ n ] [ j ] [ k ] \sum_{j=l}^{n} \sum_{k=赢下的奖金场数}^{n+1}dp[n][j][k] ∑j=ln∑k=赢下的奖金场数n+1dp[n][j][k]
我们维护的状态并不能反映赢下的奖金场数这一个概念,于是考虑这样写状态:
设 d p [ i ] [ j ] [ k ] [ l ] dp[i][j][k][l] dp[i][j][k][l]为前 i i i场,赢了 j j j场奖金场, k k k场背包场,容量为 l l l,最后答案为 d p [ n ] [ j ] [ k ] [ l ] ( l ≥ i ) dp[n][j][k][l](l\geq i) dp[n][j][k][l](l≥i)之和,这样时间复杂度和空间复杂度都是 O ( n 4 ) O(n^4) O(n4)的,空间可以滚动压缩成 O ( n 3 ) O(n^3) O(n3),可惜时间复杂度不能优化了。
正解思路是这样,设 d p [ i ] [ j ] [ k ] dp[i][j][k] dp[i][j][k]为前 i i i场,赢了 j j j场,此时容量剩余 k k k,这样每次我们赢了一场奖金场,我们就可以在 k k k上体现出来,由于 k k k可能为负数,那么我们需要加上一个偏移量 m a x n = 200 maxn=200 maxn=200,这样时间复杂度也为 O ( n 3 ) O(n^3) O(n3)的
at all,设置状态可以选择设两个相互联系的变量来代替三个具体的变量,但并非是无用设置,无用设置比如说将 i i i与 n − i n-i n−i设为两个状态,这显然是没必要的。
#include
#define ll long long
using namespace std;
int n,l,kk,a[205];
double p[205],dp[205][205][405];
int main()
{
cin>>n>>l>>kk; //一开始的只能装下k
kk=min(kk,n);
for(int i=1;i<=n;i++)
{
int tmp; cin>>tmp;
p[i]=tmp*0.01;
}
for(int i=1;i<=n;i++) cin>>a[i];
//最后表现良好,并且赢的奖品每次都有机会
//dp[i][j][k] -> 前i场赢了j场。剩余空间为k
dp[0][0][kk+200]=1;
for(int i=0;i<n;i++)
{
for(int j=0;j<=i;j++)
{
for(int k=0;k<=401;k++)
{
if(a[i+1]==-1)
{
if(k>=1) dp[i+1][j+1][k-1]+=dp[i][j][k]*p[i+1];
dp[i+1][j][k]+=dp[i][j][k]*(1-p[i+1]);
}
else
{
dp[i+1][j+1][min(401,k+a[i+1])]+=dp[i][j][k]*p[i+1];
dp[i+1][j][k]+=dp[i][j][k]*(1-p[i+1]);
}
}
}
}
double ans=0;
for(int i=l;i<=n;i++)
for(int j=200;j<=401;j++) ans+=dp[n][i][j];
printf("%.10lf",ans);
return 0;
}