开发之排序算法1


第 1 章 一大波数正在靠近——排序 1 一大波数正在靠近 排序 第1章 啊哈!算法 2 第 1 节 最快最简单的排序——桶排序 在我们生活的这个世界中到处都是被排序过的东东。站队的时候会按照身高排序,考试 的名次需要按照分数排序,网上购物的时候会按照价格排序,电子邮箱中的邮件按照时间排 序……总之很多东东都需要排序,可以说排序是无处不在。现在我们举个具体的例子来介绍 一下排序算法。 首先出场的是我们的主人公小哼,上面这个可爱的娃就是啦。期末考试完了老师要将同 学们的分数按照从高到低排序。小哼的班上只有 5 个同学,这 5 个同学分别考了 5 分、3 分、 5 分、2 分和 8 分,哎,考得真是惨不忍睹(满分是 10 分)。接下来将分数进行从大到小排 序,排序后是 8 5 5 3 2。你有没有什么好方法编写一段程序,让计算机随机读入 5 个数然后 将这 5 个数从大到小输出?请先想一想,至少想 15 分钟再往下看吧(*^__^*)。 第 1 章 一大波数正在靠近——排序 3 我们这里只需借助一个一维数组就可以解决这个问题。请确定你真的仔细想过再往下 看哦。 首先我们需要申请一个大小为 11 的数组 int a[11]。OK,现在你已经有了 11 个变量,编 号从 a[0]~a[10]。刚开始的时候,我们将 a[0]~a[10]都初始化为 0,表示这些分数还都没有人 得过。例如 a[0]等于 0 就表示目前还没有人得过 0 分,同理 a[1]等于 0 就表示目前还没有人 得过 1 分……a[10]等于 0 就表示目前还没有人得过 10 分。 下面开始处理每一个人的分数,第一个人的分数是 5 分,我们就将相对应的 a[5]的值在 原来的基础增加 1,即将 a[5]的值从 0 改为 1,表示 5 分出现过了一次。 第二个人的分数是 3 分,我们就把相对应的 a[3]的值在原来的基础上增加 1,即将 a[3] 的值从 0 改为 1,表示 3 分出现过了一次。 啊哈!算法 4 注意啦!第三个人的分数也是 5 分,所以 a[5]的值需要在此基础上再增加 1,即将 a[5] 的值从 1 改为 2,表示 5 分出现过了两次。 按照刚才的方法处理第四个和第五个人的分数。最终结果就是下面这个图啦。 你发现没有,a[0]~a[10]中的数值其实就是 0 分到 10 分每个分数出现的次数。接下来, 我们只需要将出现过的分数打印出来就可以了,出现几次就打印几次,具体如下。 a[0]为 0,表示“0”没有出现过,不打印。 a[1]为 0,表示“1”没有出现过,不打印。 a[2]为 1,表示“2”出现过 1 次,打印 2。 a[3]为 1,表示“3”出现过 1 次,打印 3。 a[4]为 0,表示“4”没有出现过,不打印。 a[5]为 2,表示“5”出现过 2 次,打印 5 5。 a[6]为 0,表示“6”没有出现过,不打印。 a[7]为 0,表示“7”没有出现过,不打印。 a[8]为 1,表示“8”出现过 1 次,打印 8。 a[9]为 0,表示“9”没有出现过,不打印。 a[10]为 0,表示“10”没有出现过,不打印。 最终屏幕输出“2 3 5 5 8”,完整的代码如下。 #include int main() { int a[11],i,j,t; for(i=0;i<=10;i++) a[i]=0; //初始化为0 for(i=1;i<=5;i++) //循环读入5个数 { 第 1 章 一大波数正在靠近——排序 5 scanf("%d",&t); //把每一个数读到变量t中 a[t]++; //进行计数 } for(i=0;i<=10;i++) //依次判断a[0]~a[10] for(j=1;j<=a[i];j++) //出现了几次就打印几次 printf("%d ",i); getchar();getchar(); //这里的getchar();用来暂停程序,以便查看程序输出的内容 //也可以用system("pause");等来代替 return 0; } 输入数据为: 5 3 5 2 8 仔细观察的同学会发现,刚才实现的是从小到大排序。但是我们要求是从大到小排序, 这该怎么办呢?还是先自己想一想再往下看哦。 其实很简单。只需要将 for(i=0;i<=10;i++)改为 for(i=10;i>=0;i--)就 OK 啦,快去试一试吧。 这种排序方法我们暂且叫它“桶排序”。因为其实真正的桶排序要比这个复杂一些,以 后再详细讨论,目前此算法已经能够满足我们的需求了。 这个算法就好比有 11 个桶,编号从 0~10。每出现一个数,就在对应编号的桶中放一个 小旗子,最后只要数数每个桶中有几个小旗子就 OK 了。例如 2 号桶中有 1 个小旗子,表示 2 出现了一次;3 号桶中有 1 个小旗子,表示 3 出现了一次;5 号桶中有 2 个小旗子,表示 5 出现了两次;8 号桶中有 1 个小旗子,表示 8 出现了一次。 现在你可以尝试一下输入 n 个 0~1000 之间的整数,将它们从大到小排序。提醒一下, 啊哈!算法 6 如果需要对数据范围在 0~1000 的整数进行排序,我们需要 1001 个桶,来表示 0~1000 之间 每一个数出现的次数,这一点一定要注意。另外,此处的每一个桶的作用其实就是“标记” 每个数出现的次数,因此我喜欢将之前的数组 a 换个更贴切的名字 book(book 这个单词有 记录、标记的意思),代码实现如下。 #include int main() { int book[1001],i,j,t,n; for(i=0;i<=1000;i++) book[i]=0; scanf("%d",&n);//输入一个数n,表示接下来有n个数 for(i=1;i<=n;i++)//循环读入n个数,并进行桶排序 { scanf("%d",&t); //把每一个数读到变量t中 book[t]++; //进行计数,对编号为t的桶放一个小旗子 } for(i=1000;i>=0;i--) //依次判断编号1000~0的桶 for(j=1;j<=book[i];j++) //出现了几次就将桶的编号打印几次 printf("%d ",i); getchar();getchar(); return 0; } 可以输入以下数据进行验证。 10 8 100 50 22 15 6 1 1000 999 0 运行结果是: 1000 999 100 50 22 15 8 6 1 0 最后来说下时间复杂度的问题。代码中第 6 行的循环一共循环了 m 次( m 为桶的个数), 第 9 行的代码循环了 n 次(n 为待排序数的个数),第 14 行和第 15 行一共循环了 m+n 次。 所以整个排序算法一共执行了 m+n+m+n 次。我们用大写字母 O 来表示时间复杂度,因此该 第 1 章 一大波数正在靠近——排序 7 算法的时间复杂度是 O(m+n+m+n)即 O(2*(m+n))。我们在说时间复杂度的时候可以忽略较小 的常数,最终桶排序的时间复杂度为 O(m+n)。还有一点,在表示时间复杂度的时候,n 和 m 通常用大写字母即 O(M+N)。 这是一个非常快的排序算法。桶排序从 1956 年就开始被使用,该算法的基本思想是由 E.J. Issac 和 R.C. Singleton 提出来的。之前我说过,其实这并不是真正的桶排序算法,真正 的桶排序算法要比这个更加复杂。但是考虑到此处是算法讲解的第一篇,我想还是越简单易 懂越好,真正的桶排序留在以后再聊吧。需要说明一点的是:我们目前学习的简化版桶排序 算法,其本质上还不能算是一个真正意义上的排序算法。为什么呢?例如遇到下面这个例子 就没辙了。 现在分别有 5 个人的名字和分数:huhu 5 分、haha 3 分、xixi 5 分、hengheng 2 分和 gaoshou 8 分。请按照分数从高到低,输出他们的名字。即应该输出 gaoshou、huhu、xixi、haha、hengheng。 发现问题了没有?如果使用我们刚才简化版的桶排序算法仅仅是把分数进行了排序。最终输 出的也仅仅是分数,但没有对人本身进行排序。也就是说,我们现在并不知道排序后的分数 原本对应着哪一个人!这该怎么办呢?不要着急,请看下节——冒泡排序。 第 2 节 邻居好说话——冒泡排序 简化版的桶排序不仅仅有上一节所遗留的问题,更要命的是:它非常浪费空间!例如需 要排序数的范围是 0~2100000000,那你则需要申请 2100000001 个变量,也就是说要写成 int a[2100000001]。因为我们需要用 2100000001 个“桶”来存储 0~2100000000 每一个数出现的 次数。即便只给你 5 个数进行排序(例如这 5 个数是 1、1912345678、2100000000、18000000 和 912345678),你也仍然需要 2100000001 个“桶”,这真是太浪费空间了!还有,如果现 在需要排序的不再是整数而是一些小数,比如将 5.56789、2.12、1.1、3.123、4.1234 这五个 数进行从小到大排序又该怎么办呢?现在我们来学习另一种新的排序算法:冒泡排序。它可 以很好地解决这两个问题。 冒泡排序的基本思想是:每次比较两个相邻的元素,如果它们的顺序错误就把它们交换 过来。 例如我们需要将 12 35 99 18 76 这 5 个数进行从大到小的排序。既然是从大到小排序, 也就是说越小的越靠后,你是不是觉得我在说废话,但是这句话很关键(∩_∩)。 首先比较第 1 位和第 2 位的大小,现在第 1 位是 12,第 2 位是 35。发现 12 比 35 要小, 啊哈!算法 8 因为我们希望越小越靠后嘛,因此需要交换这两个数的位置。交换之后这 5 个数的顺序是 35 12 99 18 76。 按照刚才的方法,继续比较第 2 位和第 3 位的大小,第 2 位是 12,第 3 位是 99。12 比 99 要小,因此需要交换这两个数的位置。交换之后这 5 个数的顺序是 35 99 12 18 76。 根据刚才的规则,继续比较第 3 位和第 4 位的大小,如果第 3 位比第 4 位小,则交换位 置。交换之后这 5 个数的顺序是 35 99 18 12 76。 最后,比较第 4 位和第 5 位。4 次比较之后 5 个数的顺序是 35 99 18 76 12。 经过 4 次比较后我们发现最小的一个数已经就位(已经在最后一位,请注意 12 这个数 的移动过程),是不是很神奇。现在再来回忆一下刚才比较的过程。每次都是比较相邻的两 个数,如果后面的数比前面的数大,则交换这两个数的位置。一直比较下去直到最后两个数 比较完毕后,最小的数就在最后一个了。就如同是一个气泡,一步一步往后“翻滚”,直到 最后一位。所以这个排序的方法有一个很好听的名字“冒泡排序”。 说到这里其实我们的排序只将 5 个数中最小的一个归位了。每将一个数归位我们将其称 第 1 章 一大波数正在靠近——排序 9 为“一趟”。下面我们将继续重复刚才的过程,将剩下的 4 个数一一归位。 好,现在开始“第二趟”,目标是将第 2 小的数归位。首先还是先比较第 1 位和第 2 位, 如果第 1 位比第 2 位小,则交换位置。交换之后这 5 个数的顺序是 99 35 18 76 12。接下来你 应该都会了,依次比较第 2 位和第 3 位,第 3 位和第 4 位。注意此时已经不需要再比较第 4 位和第 5 位。因为在第一趟结束后已经可以确定第 5 位上放的是最小的了。第二趟结束之后 这 5 个数的顺序是 99 35 76 18 12。 “第三趟”也是一样的。第三趟之后这 5 个数的顺序是 99 76 35 18 12。 现在到了最后一趟“第四趟”。有的同学又要问了,这不是已经排好了吗?还要继续? 当然,这里纯属巧合,你若用别的数试一试可能就不是了。你能找出这样的数据样例来吗? 请试一试。 “冒泡排序”的原理是:每一趟只能确定将一个数归位。即第一趟只能确定将末位上的 数(即第 5 位)归位,第二趟只能将倒数第 2 位上的数(即第 4 位)归位,第三趟只能将倒 数第 3 位上的数(即第 3 位)归位,而现在前面还有两个位置上的数没有归位,因此我们仍 然需要进行“第四趟”。 “第四趟”只需要比较第 1 位和第 2 位的大小。因为后面三个位置上的数归位了,现在 第 1 位是 99,第 2 位是 76,无需交换。这 5 个数的顺序不变仍然是 99 76 35 18 12。到此排 序完美结束了,5 个数已经有 4 个数归位,那最后一个数也只能放在第 1 位了。 最后我们总结一下:如果有 n 个数进行排序,只需将 n1 个数归位,也就是说要进行 n-1 趟操作。而“每一趟”都需要从第 1 位开始进行相邻两个数的比较,将较小的一个数放 在后面,比较完毕后向后挪一位继续比较下面两个相邻数的大小,重复此步骤,直到最后一 个尚未归位的数,已经归位的数则无需再进行比较(已经归位的数你还比较个啥,浪费表情)。 这个算法是不是很强悍?记得我每次拍集体照的时候就总是被别人换来换去的,当时特 别烦。不知道发明此算法的人当时的灵感是否来源于此。啰里吧嗦地说了这么多,下面是代 码。建议先自己尝试去实现一下看看,再来看我是如何实现的。 #include int main() { int a[100],i,j,t,n; scanf("%d",&n); //输入一个数n,表示接下来有n个数 for(i=1;i<=n;i++) //循环读入n个数到数组a中 scanf("%d",&a[i]); 啊哈!算法 10 //冒泡排序的核心部分 for(i=1;i<=n-1;i++) //n个数排序,只用进行n-1趟 { for(j=1;j<=n-i;j++) //从第1位开始比较直到最后一个尚未归位的数,想一想为什 么到n-i就可以了。 { if(a[j] struct student { char name[21]; char score; };//这里创建了一个结构体用来存储姓名和分数 int main() { struct student a[100],t; int i,j,n; scanf("%d",&n); //输入一个数n for(i=1;i<=n;i++) //循环读入n个人名和分数 scanf("%s %d",a[i].name,&a[i].score); 第 1 章 一大波数正在靠近——排序 11 //按分数从高到低进行排序 for(i=1;i<=n-1;i++) { for(j=1;j<=n-i;j++) { if(a[j].score int a[101],n;//定义全局变量,这两个变量需要在子函数中使用 void quicksort(int left,int right) { int i,j,t,temp; if(left>right) return; temp=a[left]; //temp中存的就是基准数 i=left; j=right; while(i!=j) { //顺序很重要,要先从右往左找 while(a[j]>=temp && i int main() { int a[1001],n,i,t; for(i=1;i<=1000;i++) a[i]=0; //初始化 scanf("%d",&n); //读入n for(i=1;i<=n;i++) //循环读入n个图书的ISBN号 { scanf("%d",&t); //把每一个ISBN号读到变量t中 a[t]=1; //标记出现过的ISBN号 } for(i=1;i<=1000;i++) //依次判断1~1000这个1000个桶 { if(a[i]==1)//如果这个ISBN号出现过则打印出来 printf("%d ",i); } getchar();getchar(); return 0; } 这种方法的时间复杂度就是桶排序的时间复杂度,为 O(N+M)。 第二种方法我们需要先排序再去重。排序我们可以用冒泡排序或者快速排序。 20 40 32 67 40 20 89 300 400 15 将这 10 个数从小到大排序之后为 15 20 20 32 40 40 67 89 300 400。 接下来,要在输出的时候去掉重复的。因为我们已经排好序,所以相同的数都会紧挨在 第 1 章 一大波数正在靠近——排序 23 一起。只要在输出的时候,预先判断一下当前这个数 a[i]与前面一个数 a[i1]是否相同。如 果相同则表示这个数之前已经输出过了,不用再次输出;不同则表示这个数是第一次出现, 需要输出这个数。 #include int main() { int a[101],n,i,j,t; scanf("%d",&n); //读入n for(i=1;i<=n;i++) //循环读入n个图书ISBN号 { scanf("%d",&a[i]); } //开始冒泡排序 for(i=1;i<=n-1;i++) { for(j=1;j<=n-i;j++) { if(a[j]>a[j+1]) { t=a[j]; a[j]=a[j+1]; a[j+1]=t; } } } printf("%d ",a[1]); //输出第1个数 for(i=2;i<=n;i++) //从2循环到n { if( a[i] != a[i-1] ) //如果当前这个数是第一次出现则输出 printf("%d ",a[i]); } getchar();getchar(); return 0; } 这种方法的时间复杂度由两部分组成,一部分是冒泡排序的时间复杂度,是 N (N2),另 一部分是读入和输出,都是 O(N),因此整个算法的时间复杂度是 O(2*N+N 2)。相对于 N2 来 说,2*N 可以忽略(我们通常忽略低阶),最终该方法的时间复杂度是 O(N2)。 啊哈!算法 24 接下来还需要看下数据范围。每个图书 ISBN 号都是 1~1000 的整数,并且参加调查的同 学人数不超过 100,即 n≤100。之前已经说过,在粗略计算时间复杂度的时候,我们通常认 为计算机每秒钟大约运行 10 亿次(当然实际情况要更快),因此以上两种方法都可以在 1 秒 钟内计算出解。如果题目中图书的 ISBN 号范围不是在 1~1000,而是2147483648~2147483647 的话,那么第一种方法就不可行了,因为你无法申请出这么大的数组来标记每一个 ISBN 号 是否出现过。另外如果 n 的范围不是小于等于 100,而是小于等于 10 万,那么第二种方法的 排序部分也不能使用冒泡排序。因为题目要求的时间限制是 1 秒,使用冒泡排序对 10 万个 数进行排序,计算机要运行 100 亿次,需要 10 秒钟,因此要替换为快速排序,快速排序只 需要 100000×log2100000≈100000×17≈170 万次,这还不到 0.0017 秒。是不是很神奇?同样的 问题使用不同的算法竟然有如此之大的时间差距,这就是算法的魅力! 我们来回顾一下本章三种排序算法的时间复杂度。桶排序是最快的,它的时间复杂度是 O(N+M);冒泡排序是 O(N 2);快速排序是 O(NlogN)。 最后,你可以到“添柴编程学习网”提交本题的代码,来验证一下你的解答是否完全 正确。《小哼买书》题目的地址如下: www.tianchai.org/problem-12001.html 接下来,本书中的所有算法都可以去“添柴编程学习网”一一验证。如果你从来没有 使用过类似“添柴编程学习网”这样的在线自动评测系统(online judge),那么我推荐你可 以先尝试提交下这道题:A+B=? 地址如下: www.tianchai.org/problem-10000.html
还剩23页未读

继续阅读

下载pdf到电脑,查找使用更方便

pdf的实际排版效果,会与网站的显示效果略有不同!!

需要 10 金币 [ 分享pdf获得金币 ] 0 人已下载

下载pdf

pdf贡献者

wo00le

贡献于2017-02-03

下载需要 10 金币 [金币充值 ]
亲,您也可以通过 分享原创pdf 来获得金币奖励!
下载pdf