一个整数数列,每个元素在 [1,m] 上取值,共有 mn 种可能的数列。
对每个数列,分别求出其中本质不同的子序列个数,然后求和,包括空序列。
对 109+7 取模,1≤n,m≤106.
首先考虑空序列,每种数列均有 1 个,共有 Ans1=mn 个。
对于非空子序列。考虑固定一个非空子序列,统计包含它的原串个数。
不妨设其在原序列中的出现位置为 p1,p2,⋯,pi,每个位置上的数值为 x1,x2,⋯,xi.
为了避免重复,若子序列在原序列中出现多次,则钦定 p1⋯pi 为第一次出现的位置,也就是说,钦定 p1⋯pi 的字典序最小。
这意味着,1∼p1−1 不能出现 x1,p1+1∼p2−1 中不能出现 x2,依次类推,每个 p 都是最靠前的位置。
开始组合方法推式子,容易得到:
Ans2=i=1∑nmij=i∑nCj−1i−1(m−1)j−imn−j
其中 i 枚举子序列长度,j 枚举子序列最后一个元素的出现位置;
mi 为子序列可能的取值数量;Cj−1i−1 统计 p1⋯pn 的可能情况数量;
(m−1)j−i 是填子序列之间的空隙的方法数量;mn−j 代表最后的 n−j 位可以任取。
现在我们要在 O(n) 或 O(nlogn) 的复杂度求出 Ans 的值,考虑下面的转化。
合并同类项,
Ans2=i=1∑nj=i∑nCj−1i−1(m−1)j−imn−j+i
组合数 Cj−1i−1 很难处理,考虑二项式定理的形式 (a+b)n=i=0∑nCni⋅aibn−i 中,组合数下面的 n 要和 ∑ 相同。
因此,变化 ∑ 的形式,并交换两个求和符号,往二项式定理方向转化:
Ans2=i=1∑nj=i∑nCj−1i−1(m−1)j−imn−j+i=i=0∑n−1j=0∑n−1Cji(m−1)j−imn−j+i=j=0∑n−1i=0∑jCji(m−1)j−imn+i−j
二项式定理中,两个指数的和为定值,所以:
Ans2=j=0∑n−1i=0∑jCji(m−1)j−imn+i−j=j=0∑n−1mn−ji=0∑jCji(m−1)j−imi=j=0∑n−1mn−j[(m−1)+m]j=j=0∑n−1mn−j(2m−1)j
这个可以在 O(n) 时间复杂度内求出,最终答案的形式为:
Ans=Ans1+Ans2=mn+j=0∑n−1mn−j(2m−1)j
#include <bits/stdc++.h>
#define int long long
using namespace std;
const int MAXN = 1e6 + 10, mod = 1e9 + 7;
int n, m, ans, Pow1[MAXN] = {1}, Pow2[MAXN] = {1};
signed main() {
scanf("%lld%lld", &n, &m);
for(int i = 1; i <= n; i++)
Pow1[i] = Pow1[i - 1] * m % mod, Pow2[i] = Pow2[i - 1] * (2 * m - 1) % mod;
for(int i = 0; i < n; i++)
ans = (ans + Pow1[n - i] * Pow2[i] % mod) % mod;
printf("%lld\n", (ans + Pow1[n]) % mod) ;
return 0;
}
cpp