记得@老赵之前在微博上吐槽说,“有的人真是毫无长进,六年前某同事不会写程序输出全排列,昨天发邮件还是问我该怎么写,这时间浪费到我都看不下去了。” 那时候就很好奇全排列到底是什么东西,到底有多难?
今天复习的时候终于碰到这题了,结果果然自己太渣,看了好久都没明白,代码实现又是磕磕碰碰的。所以,就把它整理成笔记加深记忆,也希望能帮到和我一样的人。
所谓全排列,就是打印出字符串中所有字符的所有排列。例如输入字符串abc
,则打印出 a、b、c 所能排列出来的所有字符串 abc
、acb
、bac
、bca
、cab
和 cba
。
一般最先想到的方法是暴力循环法,即对于每一位,遍历集合中可能的元素,如果在这一位之前出现过了该元素,跳过该元素。例如对于abc
,第一位可以是 a 或 b 或 c 。当第一位为 a 时,第二位再遍历集合,发现 a 不行,因为前面已经出现 a 了,而 b 和 c 可以。当第二位为 b 时 , 再遍历集合,发现 a 和 b 都不行,c 可以。可以用递归或循环来实现,但是复杂度为 $O(n^n)$ 。有没有更优雅的解法呢。
首先考虑bac
和cba
这二个字符串是如何得出的。显然这二个都是abc
中的 a 与后面两字符交换得到的。然后可以将abc
的第二个字符和第三个字符交换得到acb
。同理可以根据bac
和cba
来得bca
和cab
。
因此可以知道 全排列就是从第一个数字起每个数分别与它后面的数字交换,也可以得出这种解法每次得到的结果都是正确结果,所以复杂度为 O(n!)。找到这个规律后,递归的代码就很容易写出来了:1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42#include
#include
//交换两个字符
void Swap(char *a ,char *b)
{
char temp = *a;
*a = *b;
*b = temp;
}
//递归全排列,start 为全排列开始的下标, length 为str数组的长度
void AllRange(char* str,int start,int length)
{
if(start == length-1)
{
printf("%s\n",str);
}
else
{
for(int i=start;i<=length-1;i++)
{ //从下标为start的数开始,分别与它后面的数字交换
Swap(&str;[start],&str;[i]);
AllRange(str,start+1,length);
Swap(&str;[start],&str;[i]);
}
}
}
void Permutation(char* str)
{
if(str == NULL)
return;
AllRange(str,0,strlen(str));
}
void main()
{
char str[] = "abc";
Permutation(str);
}
为了得到不一样的排列,可能我们最先想到的方法是当遇到和自己相同的就不交换了。如果我们输入的是abb
,那么第一个字符与后面的交换后得到 bab
、bba
。然后abb
中,第二个字符和第三个就不用交换了。但是对于bab
,它的第二个字符和第三个是不同的,交换后得到bba
,和之前的重复了。因此,这种方法不行。
因为abb
能得到bab
和bba
,而bab
又能得到bba
,那我们能不能第一个bba
不求呢? 我们有了这种思路,第一个字符a
与第二个字符b
交换得到bab
,然后考虑第一个字符a
与第三个字符b
交换,此时由于第三个字符等于第二个字符,所以它们不再交换。再考虑bab
,它的第二个与第三个字符交换可以得到bba
。此时全排列生成完毕,即abb
、bab
、bba
三个。
这样我们也得到了在全排列中去掉重复的规则:去重的全排列就是从第一个数字起每个数分别与它后面非重复出现的数字交换。用编程的话描述就是第i个数与第j个数交换时,要求[i,j)中没有与第j个数相等的数。下面给出完整代码:
1 | #include |
如果不是求字符的所有排列,而是求字符的所有组合应该怎么办呢?还是输入三个字符 a、b、c,则它们的组合有a
b
c
ab
ac
bc
abc
。当然我们还是可以借鉴全排列的思路,利用问题分解的思路,最终用递归解决。不过这里介绍一种比较巧妙的思路 —— 基于位图。
假设原有元素 n 个,则最终组合结果是 $2^n-1$ 个。我们可以用位操作方法:假设元素原本有:a,b,c 三个,则 1 表示取该元素,0 表示不取。故取a
则是001
,取ab
则是011
。所以一共三位,每个位上有两个选择 0 和 1。而000
没有意义,所以是$2^n-1$个结果。
这些结果的位图值都是 1,2…2^n-1。所以从值 1 到值 $2^n-1$ 依次输出结果:
001
,010
,011
,100
,101
,110
,111
。对应输出组合结果为:a
,b
,ab
,c
,ac
,bc
,abc
。
因此可以循环 1~2^n-1,然后输出对应代表的组合即可。有代码如下:
1 | #include |
-EOF-