含义
康托展开是一个全排列到一个自然数的双射,常用于构建哈希表时的空间压缩。 康托展开的实质是计算当前排列在所有由小到大全排列中的顺序,因此是可逆的。
原理
X = s1(n-1)! + s2(n-2)! + s3(n-3)! + …… + sn-1 * 1! + sn * 0!
其中si表示在第i位右边比ai小的数的个数。
我们现在用sl表示第i位左边比ai小的数的个数,sr表示第i位右边比ai小的数的个数,显然可以得到如下等式:
ai = sl + sr + 1故公式中的si可以用上述等式计算:sr = ai - sl -1
依照上述原理,则{1,2,3,4,5}的一种全排列{3,4,1,5,2}可以映射为{2,2,0,1,0}
根据公式,该集合实际上表示的就是一个变进制数。
简便计算:X = ((s1 * (n-1) + s2) * (n-3) + s3) * (n-3) + ……
康托展开
暴力 O(n2):
为了便于讲解下面的线段树优化,此处选择维护vis数组的方式(当然直接比大小也是一样的)。
vis[j]用以记录j是否已出现,未出现为0,已出现为1。故a[i]左边比其小的数的个数就是vis[j]的和(j<a[i])。
计算ans时,由于最后一位固定是0,故只需计算到n-1位即可。
而所有全排列中比该序列小的有ans个,故该序列排在第ans+1位。
代码如下:
int Power_Cantor()
{
int ans=0;
for(int i=1;i<=n-1;i++)
{
scanf("%d",&a[i]);
int sum=0;
for(int j=1;j<=a[i];j++)sum+=vis[j];
vis[a[i]]=1;
a[i]-=sum+1;
ans=(ans+a[i])*(n-i);
}
return ans+1;
}
线段树优化 O(nlogn):
我们用线段树结构存储vis数组,即可实现logn时间复杂度内求出结果。
代码如下:
int Cantor()
{
int ans=0;
for(int i=1;i<=n-1;i++)
{
int now=a[i];
now-=query(1,1,n,1,a[i])+1;
update(1,1,n,a[i],1);
ans=(ans+now)*(n-i);
}
return ans+1;
}
逆康托展开
首先是将所给的排列位数转变为我们所需的变进制数:
仍以{3,4,1,5,2}为例,其康托展开值为61:
用 61 / 4! = 2余13,则a[1] = 2,即首位右边比首位小的数有2个,所以首位为3。
用 13 / 3! = 2余1,则a[2] = 2,即在第二位之后小于第二位的数有2个,所以第二位为4。
用 1 / 2! = 0余1,则a[3] = 0,即在第三位之后没有小于第三位的数,所以第三位为1。
用 1 / 1! = 1余0,则a[4] = 1,即在第四位之后小于第四位的数有1个,所以第四位为5。
最后一位自然就是剩下的数2。
通过以上分析,所求排列组合为 34152。
依然是用线段树维护vis数组,建树时每一位都先赋值为1,表示所有数均未出现。
设对于当前这一位i,变进制数为a[i],要求的数为x。目标是要在未出现的数中找比x小的数的个数为a[i]个的数的位置,相当于在区间[1,x]中找a[i]+1。
此处将a[i]+1记为s[i]。用二分查找x的位置:对于每一位s[i],先求出左子树比x小的数的个数为sum,再看s是否有s[i]个:若有,说明结果在左子树,则继续往左子树找s[i];若没有,则往右子树找s[i] - sum。
查找完后将vis[x]的值修改为0。
代码如下:
int search(int num)
{
int l=1,r=n;
while(l<r)
{
int mid=l+r>>1;
int find=query(1,1,n,l,mid);
if(find>=num) r=mid;
else{
l=mid+1;
num-=find;
}
}
return r;
}
void R_Cantor(int num)
{
num--;
memset(a,0,sizeof a);
build_tree(1,1,n);
for(int i=1;i<=n;i++)
{
a[i]=num/(jc[n-i]);
a[i]=search(a[i]+1);
update(1,1,n,a[i],0);
num%=jc[n-i];
}
for(int i=1;i<=n;i++)printf("%d ",a[i]);
puts("");
}
附完整代码
#include <algorithm>
#include <cstring>
#include <cstdio>
#include <iostream>
using namespace std;
const int N = 1e5+10;
int n;
int a[N],tree[3*N];
int jc[10]={1,1,2,6,24,120,720,5040,40320,362880};
void out()
{
for(int i=1;i<=14;i++)
{
printf("tree[%d] = %d\n",i,tree[i]);
}
puts("");
}
void build_tree(int node,int start,int end)
{
if(start==end)
{
tree[node]=1;
return;
}
int mid=start+end>>1;
int left=2*node;
int right=2*node+1;
build_tree(left,start,mid);
build_tree(right,mid+1,end);
tree[node]=tree[left]+tree[right];
}
void update(int node,int start,int end,int idx,int val)
{
if(start==end)
{
tree[node]=val;
return;
}
int mid=start+end>>1;
int left=2*node;
int right=2*node+1;
if(idx<=mid)update(left,start,mid,idx,val);
else update(right,mid+1,end,idx,val);
tree[node]=tree[left]+tree[right];
}
int query(int node,int start,int end,int l,int r)
{
if(end<l || start>r)return 0;
else if(start>=l && end<=r)return tree[node];
int mid=start+end>>1;
int left=2*node;
int right=2*node+1;
return query(left,start,mid,l,r) + query(right,mid+1,end,l,r);
}
int Cantor()
{
int ans=0;
for(int i=1;i<=n-1;i++)
{
int now=a[i];
now-=query(1,1,n,1,a[i])+1;
update(1,1,n,a[i],1);
ans=(ans+now)*(n-i);
}
return ans+1; //所有全排列中比该序列小的有ans个,故该序列排在第ans+1位
}
int search(int num)
{
int l=1,r=n;
while(l<r)
{
int mid=l+r>>1;
int find=query(1,1,n,l,mid);
// 先看左子树中未出现的比要求的数小的数的个数够不够num个
// 若足够,则继续往左子树找num
// 若不够,则继续往右子树找 (num-已找到的个数)
if(find>=num) r=mid;
else{
l=mid+1;
num-=find;
}
}
return r;
}
void R_Cantor(int num)
{
num--; //该序列排在第num位,故比其小的全排列有num-1个。
memset(a,0,sizeof a);
build_tree(1,1,n);
for(int i=1;i<=n;i++)
{
a[i]=num/(jc[n-i]);
a[i]=search(a[i]+1);
update(1,1,n,a[i],0);
num%=jc[n-i];
}
for(int i=1;i<=n;i++)printf("%d ",a[i]);
puts("");
}
int main()
{
scanf("%d",&n);
for(int i=1;i<=n;i++)scanf("%d",&a[i]);
memset(tree,0,sizeof tree);
int ans=Cantor();
// R_Cantor(62);
printf("%d\n",ans);
return 0;
}