第3章_数组和字符串

jklee 贡献于2016-10-14

作者 yyw  创建于2010-03-11 11:07:00   修改者yyw  修改于2011-09-01 08:31:00字数26149

文档摘要:本章介绍数组和字符串,二者都能保存大量的数据。字符串是一种数组(字符数组),但由于其应用的特殊性,适用一些特别的处理方式。
关键词:

第3章 数组和字符串 第3章 数组和字符串 【教学内容相关章节】 3.1数组 3.2字符数组 3.3最长回文子串 3.4小结与习题 【教学目标】 (1)掌握一维数组的声明和使用方法; (2)掌握二维数组的声明和使用方法; (3)掌握字符串的声明、赋值、比较和连接方法; (4)熟悉字符的ASCII码和ctype.h; (5)正确认识++、+=等能修改变量的运算符; (6)学会编译选项-Wall获得更多的警告信息; (7)掌握fgetc和getchar的使用方法; (8)了解不同操作系统中换行符的表示方法; (9)掌握fgets的使用方法并了解gets的“缓冲区溢出”的漏洞; (10)理解预处理和迭代开发的技巧。 【教学要求】 (1)掌握一维数组和二维数组的声明和使用方法; (2)掌握字符串的声明、相关的操作; (3)掌握fgetc和getchar的使用方法; (3)掌握fgets和gets的使用方法。 【教学内容提要】 通过对第2章的学习,了解了计算机的计算优势,但没有发挥出计算机的存储优势——只用了屈指可数的变量。尽管有的程序也处理了大量的数据,但这些数据都只是“过客”,只参与了计算、并没有被保存下来。 本章介绍数组和字符串,二者都能保存大量的数据。字符串是一种数组(字符数组),但由于其应用的特殊性,适用一些特别的处理方式。 【教学重点、难点】 教学重点: (1)掌握一维数组和二维数组的声明和使用方法; (2)掌握字符串的声明、相关的操作; (3)掌握fgetc和getchar的使用方法; (3)掌握fgets和gets的使用方法。 教学难点: (1)掌握一维数组和二维数组的声明和使用方法; (2)掌握字符串的声明、相关的操作及字符串处理函数的使用。 【课时安排(共5学时)】 3.1数组 3.2字符数组 3.3最长回文子串 3.4小结与习题 (1学时) 第 页 第3章 数组和字符串 3.1 数 组 下面从一个问题出发,说明一下为何使用数组。 问题:读入一些整数,逆序输出到一行中,已知整数不超过100个。 【分析】 首先通过循环来读取100个整数的输入,然后把每个数都存下来,存放在数组中,最后输出。 程序3-1 逆序输出 #include #define MAXN 100 + 10 int a[MAXN]; int main(){ int i, x, n = 0; while(scanf("%d", &x) == 1) a[n++] = x; for(i = n-1; i >= 1; i--) printf("%d ", a[i]); printf("%d\n", a[0]); return 0; } 说明:语句int a[100]声明了一个包含100个整型变量的数组,它们是:a[0],a[1],a[2] ,…,a[99]。注意,没有a[100]。 提示3-1:语句int a[MAXN]声明了一个包含MAXN个整型变量的数组,即a[0],a[1],a[2] ,…,a[MAXN-1],但不包含a[MAXN]。MAXN必须是常数,不能是变量。 在本程序中,声明MAXN为100+10而不是100,主要是为了保险起见。 提示3-2:在算法竞赛中,常常难以精确计算出需要的数组大小,数组一般会声明得稍大些。在空间够用的前提下,浪费一点不要紧。 语句a[n++]=x;的等价于两条语句a[n]=x; n++;,循环结束后,数据被存在了a[0],a[1] ,…,a[n-1],其中变量n个整数的个数。 在数组中存放整数后,依次输出a[n-1],a[n],…,a[1]和a[0]。一般要求输出的行首行尾均无空格,相邻两个数据间用单个空格隔开,一共需要输出n个整数,但只有n-1个空格,所以只好分两条语句输出。 在上述程序中,数组a被声明在main函数的外面。简单地说,只有在放外面时,数组a才可以开得很大;放在main函数内时,数组稍大就会异常退出。 提示3-3:比较大的数组应尽量声明在main函数外。 C语言数组中使用过程中,有一些特殊的情况。例如,数组不能够进行赋值操作,即不能将一个整体赋值给另外一个数组。如果从数组a复制到k个元素到数组b,可以这个语句: memcpy(b,a,sizeof(int)*k)。如果数组a和b都是浮点型的,复制时要写成memcpy(b,a, sizeof(double)*k)。另外需要注意的是,使用memcpy函数要包含头文件string.h。如果需要把数组a全部复制到数组b中,可以写成:memcpy(b,a,sizeof(a))。 说明:memcpy函数原型如下: void *memcpy(void *dest, void *src, unsigned int count); 它的功能是由src所指内存区域复制count个字节到dest所指内存区域,src和dest所指内存区域不能重叠,函数返回指向dest的指针。主要功能是对字符串进行拷贝,也可以对数组进行操作。在程序中需包含头文件:#include 。 例3-1 开灯问题。 有n盏灯,编号为1~n,第1个人把所有灯打开,第2个人按下所有编号为2的倍数的开关(这些灯将被关掉),第3个人按下所有编号为3的倍数的开关(其中关掉的灯被打开,开着灯将被关闭),依此类推。一共有k个人,问最后有哪些灯开着? 输入:n和k,输出开着的灯编号。k≤n≤1000。 样例输入:7 3 样例输出:1 5 6 7 第 页 第3章 数组和字符串 【分析】 用a[1],a[2],…,a[n]表示编号为1,2,3,…,n的灯是否开着,模拟这些操作即可。 代码如下: 程序3-2 开灯问题逆序输出 #include #include #define MAXN 1000 + 10 int a[MAXN]; /* 一维数组存储n盏电灯 */ int main() { int i, j, n, k, first = 1; memset(a, 0, sizeof(a)); /* 初始化电灯状态 */ scanf("%d%d", &n, &k); /* 模拟活动过程 */ for(i = 1; i <= k; i++) /* 第i个人参与活动 */ for(j = 1; j <= n; j++) /* 对第i盏灯进行操作 */ if(j % i == 0) a[j] = !a[j]; /* 输出活动结果 */ for(i = 1; i <= n; i++) if(a[i]) { if(first) first = 0; else printf(" "); printf("%d", i); } printf("\n"); return 0; } 说明:(1)memset(a,0,sizeof(a))的作用是把数组a清零,它也在string.h中定义。使用memset比for循环更方便、快捷。 memset函数原型如下: void *memset(void *buffer, char c, int count); 它的功能是把buffer所指内存区域的前count个字节设置成字符c,第三个参数指的是字节的个数,返回指向buffer的指针,在程序中需包含头文件:#include 。由memset函数的头文件可以知道,其主要是对字符数组进行设置,当然也可以对数组进行初始赋值(一般是0,-1)。 (2)有一个技巧是在输出:为了避免输出多余空格,设置了一个标志变量first,可以表示当前要输出的变量是否为第一个。第一个变量前不应有空格,但其他都有。 例3-2 蛇形填数。 在n*n方阵里填入1,2,…,n*n,要求填成蛇形。例如n=4时方阵为 10 11 12 1 9 16 13 2 8 15 14 3 7 6 5 4 上面的方阵中,多余的空格只是为了便于观察规律,不必严格输出。n≤8。 【分析】 与数学的矩相比,可以用一个所谓的二维数组来存储题目中的方阵。只需声明一个int a[MAXN][MAXN],就可以获得一个大小为MAXN×MAXN的方阵。在声明时,两维的大小不必相同。 提示3-4:用int a[MAXN][MAXN]生成一个整型的二维数组,其中MAXN和MAXN不必相等。这个数组共有MAXN×MAXN个元素,分别为a[0][0],a[0][1],…,a[0][MAXN-1],a[1][0] ,a[1][1],…,a[1][MAXN-1],…,a[MAXN-1][0],a[MAXN-1][1],…, a[MAXN-1][MAXN-1]。 第 页 第3章 数组和字符串 假设从1开始依次填这写。设“笔”的坐标为(x,y),则一开始x=0,y=n-1,即第0行第n-1列(注意行列的范围是0~n-1,没有第n列)。“笔”的移动轨迹是:下、下、下、左、左、左、上、上、上、右、右、下、下、左、上。总之,先是下,到不能填了为止,然后是左,接着是上,最后是右。“不能填”是指再走就出界(例如4→5)或者再走就要走到以前填过的格子(例如12→13)。如果把所有格式初始化为0,就能很方便地加以判断。 程序3-3 蛇形填数 #include #include #define MAXN 10 int a[MAXN][MAXN]; int main(){ int n, x, y, tot = 0; scanf("%d", &n); memset(a, 0, sizeof(a)); tot = a[x=0][y=n-1] = 1; while(tot < n*n) { while(x+1=0 && !a[x][y-1]) a[x][--y] = ++tot; /* 向左走 */ while(x-1>=0 && !a[x-1][y]) a[--x][y] = ++tot; /* 向上走 */ while(y+1 ..775 x..33 ----- 第 页 第3章 数组和字符串 .2325 2325. ----- 25575 The number of solutions=1 【分析】 本题的解题策略是尝试所有的abc和de,判断是否满足条件。写出如下的伪代码: char s[20]; int count = 0; scanf("%s", s); for(abc = 111; abc <= 999; abc++) for(de = 11; de <= 99; de++) if(“abc*de”是个合法的竖式) { printf("<%d>\n", ++count); 打印abc*de的竖式和其后的空行 count++; } printf("The number of solutions = %d\n", count); 说明:(1)char s[20]是一个定义字符数组的语句,scanf("%s",s)表示从键盘输入一个字符串给字符数组s。 (2)char是“字符型”的意思,而字符是一种特殊的整数。每一个字符都有一个整数编码,称为ASCII码。C语言中允许用直接的方法表示字符,还有以反斜线开头的字符(转义序列,Escape Sequence)。 (3)在stdlib.h中有一个函数atoi,它的函数原型如下: int atoi(char *s) 它表示将字符串s中的内容转换成一个整型数返回,如字符串“1234”,则函数返回值是1234。 (4)在stdlib.h中有一个函数itoa,它的函数原型如下: char *itoa(int value,char *string,int radix) 它表示将整数value转换成字符串存入string, radix为转换时所用基数(保存到字符串中的数据的进制基数 2 8 10 16),返回指向转换后的字符串的指针 。 例如,itoa(32,string,10)是将32变成十进制数一个字符串“32”,并返回指向这个字符串的指针;itoa(32,string,16)是将32变成十进制数一个字符串“20”,并返回指向这个字符串的指针。 提示3-7:C语言中的字符型用char表示,它实际存储的是字符的ASCII码。字符常量可以用单引号法表示。在语法上可以把字符当作int型使用。 语句scanf("%s", s);表示读入一个不含空格、TAB和回车符的字符串,存入字符数组s中,s前面没有&符号。 提示3-8:在scanf("%s",s)中,不要在s前面加上&符号。如果是字符数组char s[MAXN] [MAXL],可以用scanf("%s",s[i])读取第i个字符串。 接下来有两个问题:判断和输出。先考虑输出。首先计算第一行乘积x=abc*e,然后是第二行y=abc*d,最后是总乘积z=abc*de,然后一次性打印出来: printf("%5d\nX%4d\n-----\n%5d\n%4d\n-----\n%5d\n\n",abc,de,x,y,z); 完整程序如下: 程序3-4 竖式问题 #include #include int main(){ int i, ok, abc, de, x, y, z, count = 0; char s[20], buf[99]; scanf("%s", s); for(abc = 111; abc <= 999; abc++) 第 页 第3章 数组和字符串 for(de = 11; de <= 99; de++) { x = abc*(de%10); y = abc*(de/10); z = abc*de; sprintf(buf, "%d%d%d%d%d", abc, de, x, y, z); ok = 1; for(i = 0; i < strlen(buf); i++) if(strchr(s, buf[i]) == NULL) ok = 0; if(ok) { printf("<%d>\n", ++count); printf("%5d\nX%4d\n-----\n%5d\n%4d\n-----\n%5d\n\n",abc,de,x,y,z); } } printf("The number of solutions = %d\n", count); return 0; } 说明:(1)sprintf函数 sprintf是个变参函数,定义如下: int sprintf( char *buffer, const char *format [, argument] ... ); 除了前两个参数类型固定外,后面可以接任意多个参数。而它的精华,显然就在第二个参数格式化字符串上。 此函数的功能是把格式化的数据写入某个字符串,它的返回值是字符串长度。包含此函数的头文件是stdio.h。 例如,本程序中的sprintf(buf,"%d%d%d%d%d",abc,de,x,y,z);语句的功能是将整数abcdexyx打印成字符串存储在串buff中。 (2)strchr函数 strchr函数定义如下: char *strchr(const char *s,char c); 此函数的功能是查找字符串s中首次出现字符c的位置。它的返回值是返回首次出现c的位置的指针,如果s中不存在c则返回NULL。包含此函数的头文件是string.h。 例如,本程序的if语句中strchr(s, buf[i])的功能是查找字符串s中首次出字符buf[i]的位置。如果strchr(s, buf[i])==NULL,则表明字符串s中没有buf[i]的字符。 (3)sprintf函数、printf函数、fprintf函数的区别 printf输出到屏幕,fprintf输出到文件,而sprintf输出到字符串。需要注意是应该保证写入的字符串有足够的空间。 提示3-9:可以用sprintf把信息输出到字符串,用法和printf、fprintf类似。但你应当保证字符串足够大,可以容纳输出信息。 字符串的空间应为字符个数加1,这是因为C语言的字符串是以空字符'\0'结尾的。 函数strlen(s)的作用是获取字符串s的实际长度,即函数strlen(s)返回的是结束标记之前的字符个数。因此这个字符串中的各个字符依次是s[0],s[1],…,s[strlen(s)-1],而s[strlen(s)]正是结束标记'\0'。 提示3-10:C语言中的字符串是'\0'结尾的字符数组,可以用strlen(s)返回字符串s中结束标记之前的字符个数。字符串中的各个字符是:s[0],s[1],…,s[strlen(s)-1]。 提示3-11:由于字符串的本质是数组,它也不是“一等公民”,只能用strcpy(a,b)、strcmp(a,b)、strcat(a,b)来执行“赋值”、“比较”和“连接”操作。而不能用=、==、<=、+等运算符。上述函数都在string.h中声明。 除了字符串之外,还要注意++count和count++的用法。++count本身的值是加1以后的,但count++的值是加1之前的(原来的值)。 注意:滥用++count和count++会带来很多隐蔽的错误,所以最好的方法是避开它们。 提示3-12:滥用++、--、+=等可以修改变量值的运算符很容易带来隐蔽的错误。建议每条语句最多只用一次这种运算符,并且它所修改的变量在整条语句中只出现一次。 第 页 第3章 数组和字符串 提示3-13:但编译选项-Wall编译程序时,会给出很多(但不是所有)警告信息,以帮助程序员查错。但并不能解决所有的问题:有些“错误”程序是合法的,只是这些动作不是你所期望的。 3.3 最长回文子串 例3-4 回文串。 输入一个字符串,求出其中最长的回文子串。子串的含义是:在原串中连续出现的字符串片段。回文的含义是:正着看和倒着看相同。如abba和yyxyy。在判断时,应该忽略所有标点符号和空格,且忽略大小写,但输出应保持原样(在回文串的首部和尾部不要输出多余字符)。输入字符串长度不超过5000,且占据单独的一行。应该输出最长的回文串,如果有多个,输出起始位置最靠左的。 样例输入:Confuciuss say:Madam,I'm Adam. 样例输出:Madam,I'm Adam 【分析】 由于输入的字符比较复杂,首先,不能用scanf("%s")输入字符串,可用下述两种方法解决下列问题: 第1种方法是使用fgetc(fin),它读取一个打开的文件fin,读取一个字符,然后返回一个int值。因为如果文件结束,fgetc将返回一个特殊标记EOF,它并不是一个char。如果要从标准输入读取一个字符,可以用getchar(),它等价于fgetc(stdin)。 提示3-14:使用fgetc(fin)可以打开的文件fin中读取一个字符。一般情况下应当在检查它不是EOF后再将其转换成char值。从标准输入读取一个字符可以用getchar(),它等价于fgetc(stdin)。 fgetc()和getchar()将读取“下一个字符”,如果是空格,会正常读取;若是换行,读取到的将是回车符'\n'。 潜在的陷阱:不同操作系统的回车换行符是不一致的。Windows是'\r'和'\n'两个字符,Linux是'\n',而MacOS是'\r'。如果在Windows下读到Windows文件,fgetc()和getchar()会把'\r'吃掉,只剩下'\n';但如要要在Linux下读取同样一个文件,它们会先读到'\r',然后才是'\n'。这个问题在竞赛时一定要注意。 提示3-15:在使用fgetc和getchar时,应该避免写出和操作系统相关的程序。 第2种方法是使用fgets(buf,MAXN,fin)读了完整的一行,其中buf的声明为char buf[MAXN]。这个函数读取不超过MAXN-1个字符,然后在末尾上结束符'\0',因此不会出现越界的情况。之所以说可以用这个函数读取完整的一行,是因为一旦读到回车符'\n',读取工作将会停止,而这个'\n'也会是buf字符串中最后一个有效字符(再往后就是字符串的结束符'\0'了)。只有一种情况下,buf不会以'\n'结尾:读到文件结束符,并且文件的最后一个不是以'\n'结尾。 提示3-16:fgets(buf,MAXN,fin)将读取完整的一行放在字符数组buf中。你应当保证buf足够存放下文件的一行内容。除了在文件结束符前没有遇到'\n'这种特殊情况外,buf总是以'\n'结尾。当一个字符都没有读到时,fgets返回NULL。 gets(s)表示从标准输入设备读取字符串存入s所指向的数组中,成功时返回指针s,否则返回NULL。但是gets(s)没有指明读到的最大字符数,gets函数也不管s的可用空间有多大。 提示3-17:C语言并不禁止程序读写“非法内存”。例如你声明的是char s[100],你完全可以赋值s[10000]='a'(甚至-Wall也不会警告),但后果自负。 提示3-18:C语言中的gets(s)存在缓冲区溢出漏洞,不推荐使用。 选择fgets函数可以解决“输入有空格”的问题,它可以一次性读取一行,最为方便。 接下来,解决“判断时忽略标点,输出进却要按原样”的问题,可以用一个通用的方案:预处理。构造一个新字符串,不包含原来的标点符号,而且所有字符变成大写(顺便解决了大小写的问题): n = strlen(buf); m=0; 第 页 第3章 数组和字符串 for(i = 0; i < n; i++) if(isalpha(buf[i])) s[m++] = toupper(buf[i]); 说明:isalpha(c)的原型包含在ctype.h中,它用于判断字符c是否为字母(大写或小写)。用toupper(c)返回c的大写形式。这样处理之后,buf保存的就是原串的所有字母了。 提示3-19:当任务比较复杂时,可以用预处理的方式简化输入,并提供更多的数据供使用复杂的字符串处理题目往往可以通过合理的预处理简化任务,便于调试。 提示3-20:头文件ctype.h中定义的isalpha、isdigit、isprint等工具可以用来判断字符的属性,而toupper、tolower等工具可以用来转换大小写。 说明:(1)isalpha(c)用来检查c是否为字母,如果是字母,则返回1;否则返回0。 (2)isdigit(c)用来检查c是否为数字(0~9),如果是数字,则返回1;否则返回0。 (3)isprint(c)用来检查c是否为可打印字符(不包括空格),其ASCII码值在0x21~0x7e之间,如果是可打印字符,则返回1;否则返回0。 (4)toupper(c)用来将c字符转换为大写字母,返回c对应的大写字母。 (5)tolower(c)用来将c字符转换为小写字母,返回c对应的小写字母。 下面来枚举回文串的起点和终点,然后判断它是否真的是回文串。 int max=0; for(i = 0; i < m; i++) for(j = i; j < m; j++) if(s[i..j]是回文串 && j-i+1 > max) max = j-i+1; “当前最大值”变量max,它保存的是目前为止发现的最长回文子串的长度。如果串s的第i个字符到第j个字符(记为s[i..j])是回文串,则检查长度j-i+1是否超过max。 最后,判断s[i..j]是否为回文串的方法如下: int ok = 1; for(k = i; k <= j; k++) if(s[k] != s[i+j-k]) ok = 0; s[k]的“对称”位置是s[i+j-k],因为只要一次比较失败,就应把标记变量ok置为0。 完整的程序如下: 程序3-5 最长回文子串(1) #include #include #include #define MAXN 5000 + 10 char buf[MAXN], s[MAXN]; int main(){ int n, m = 0, max = 0; int i, j, k; fgets(buf, sizeof(s), stdin); n = strlen(buf); for(i = 0; i < n; i++) if(isalpha(buf[i])) s[m++] = toupper(buf[i]); for(i = 0; i < m; i++) for(j = i; j < m; j++) { int ok = 1; for(k = i; k <= j; k++) if(s[k] != s[i+j-k]) ok = 0; if(ok && j-i+1 > max) max = j-i+1; } printf("max = %d\n", max); return 0; } 第 页 第3章 数组和字符串 在实际编程时,经常先编写一个具备主要功能的程序,再加以完善。甚至可以先写一个只有输入输出功能的“骨架”,但是要确保它正确。这样,每次只添加一点点功能,而且写一点就测试一点,和一次写整个程序相比,更加不容易出错。这种方法称为迭代式开发。 提示3-21:在程序比较复杂时,除了在设计阶段可以用伪代码理清思路外,编码阶段可以采用迭代时开发——每次只实现一点小功能,但要充分测试,确保它工作正常。 程序3-5能顺利求出样例数据中最长回文串的长度。现在接下来的任务是输出这个回文串:要求原样输出,并且尽量靠左。由于是从左到右枚举的,所以现在只剩下唯一的问题:原样输出。 由于在求max值时,不知道s[i]和s[j]在原串buf中的位置。因此,必须增加一个数组p,用p[i]保存s[i]在buf中的位置。在预处理得到,然后在更新max的同时把p[i]和p[j]保存到x和y,最后输出buf[x]到buf[y]中的所有字符。 但是上面的方法发现速度很慢,所以换一种方式:枚举回文串的“中间”位置i,然后不断往外扩展,直到有字符不同。提示:长度为奇数和偶数的处理方式是不一样的。 完整的程序如下: 程序3-6 最长回文子串(2) #include #include #include #define MAXN 5000 + 10 char buf[MAXN], s[MAXN]; int p[MAXN]; int main(){ int n, m = 0, max = 0, x, y; int i, j; fgets(buf, sizeof(s), stdin); n = strlen(buf); for(i = 0; i < n; i++) if(isalpha(buf[i])) { p[m] = i; s[m++] = toupper(buf[i]); } for(i = 0; i < m; i++) { for(j = 0; i-j >= 0 && i+j < m; j++) { if(s[i-j] != s[i+j]) break; if(j*2+1 > max) { max = j*2+1; x = p[i-j]; y = p[i+j]; } } for(j = 0; i-j >= 0 && i-j+1 < m; j++) { if(s[i-j] != s[i-j+1]) break; if(j*2+2 > max) { max = j*2+2; x = p[i-j]; y = p[i+j+1]; } } } for(i = x; i <= y; i++) printf("%c", buf[i]); printf("\n"); return 0; } 3.4 小结与习题 到目前为止,C语言的核心内容已经全部讲完了。理论上,运用算法前3章的知识足以编写大部分算法竞赛程序了。 3.4.1 必要的存储量 第 页 第3章 数组和字符串 3.4.2 用ASCII编码表示字符 在C语言除了字符常量,还有一种特殊形式的字符常量,就是以一个字符“\”开头的字符序列。在转义符中还可以用一个ASCII码(八进制数或十六进制数)来表示字符。 提示3-22:字符还可以直接用ASCII码表示。如果八进制,应该写成\ddd,它表示1到3位八进制所代表的字符;如果用十六进制,应该写成\xhh,它表示1到2位十六进制所代表的字符。 3.4.3 补码表示法 计算机中的二进制是没有符号的,但是对于正号和负号可以一个二进制位就可以了。一个带符号32位整数,在计算机内部采用“补码的表示法”(Complement Representation)。 例如,语句printf("%u\n",-1)的输出是4294967295=232-1。把-1换成-2、-3、-4、…后,可总结一个规律:-n的内部表示是232-n。 提示3-23:在多数计算机内部,整数采用的是补码表示法。 采用补码表示法的主要原因是可以将符号位和其它位统一处理;同时,减法也可按加法来处理。另外,两个用补码表示的数相加时,如果最高位(符号位)有进位,则进位被舍弃。 在通常情况下,int是32位(4字节)的。 3.4.4 重新实现库函数 在学习字符串时,重新实现一些库函数的功能是有益的。 练习1:只用getchar函数读入一个整数。假设它占据单独的一行,读到行末为止,包括换行符。输入保证读入的整数可以保存在int中。 练习2:只用fgets函数读入一个整数。假设它占据单独的一行,读到行末为止,包括换行符。输入保证读入的整数可以保存在int中。 练习3:只用getchar实现fgets的功能,即用每次一个字符的方式读取整行。 练习4:实现strchr的功能,即在一个字符串中查找一个字符。 解答:下面编写一个函数strchr1实现strchr的功能: char *strchr1(char *str,int  ch) { int i; for(i=0;str[i] != '\0'; i++) if(str[i] == ch) return str+i; return NULL; } 练习5:实现isalpha和isdigit的功能,即判断字符是否为字母/数字。 解答:(1)下面编写一个函数isapha1实现isalpha的功能: int isalpha1(char ch) { if((ch>='a' && ch<='z') ||(ch>='A' && ch<='Z')) return 1; else return 0; } (2)下面编写一个函数isdigit1实现isdigit的功能: int isdigit1(char ch) { if(ch>='0' && ch<='9') return 1; else return 0; } 3.4.5 字符串处理的常见问题 tot=1; 第 页 第3章 数组和字符串 for(i = 0; i < strlen(s); i++) if(s[i] == 1) tot++; printf("There are %d character(s) '1' in the string.\n",tot); 本程序的功能是统计字符串中字符1的个数。 实验1:添加字符串s的声明语句,长度不小于107。提示:放在main函数内还是外? 解答:添加字符串s的声明语句如下: #define MAXN 10000000 char s[MAXN]; 应放在main函数外。 实验2:添加读取语句,测试上述程序是否输出了期望的结果。如果不是,请改正。 解答:得不到期望的结果,改正如下: if(s[i] == 1) tot++; 改为if(s[i] == '1') tot++; 实验3:把输入语句注释掉,添加语句,用程序生成一个长度至少为105的字符串,并用程序验证字符串长度确实不小于105。 解答:程序如下: #include #include #define MAXN 10000000 char s[MAXN]; int main() { int i,tot=0; /* gets(s); 从键盘输入一个字符串给s */ for(i = 0; i < 100000; i++) /* 用程序生成一个长度至少为105的字符串 */ s[i] = '1'; for(i = 0; i < strlen(s); i++) if(s[i] == '1') tot++; printf("There are %d character(s) '1' in the string.\n",tot); return 0; } 实验4:用计时函数测试这段程序的运行时间随着字符串长度的变化规律。如何改进? 解答:程序如下: #include #include #include #define MAXN 10000000 char s[MAXN]; int main() { int i,tot=0; clock_t start, finish; start=clock(); for(i = 0; i < 1000000; i++) s[i] = '1'; for(i = 0; i < strlen(s); i++) if(s[i] == '1') tot++; printf("There are %d character(s) '1' in the string.\n",tot); finish=clock(); printf("Time used=%.5lf seconds\n",(finish-start) 第 页 第3章 数组和字符串 /(double)CLOCKS_PER_SEC); return 0; } 这段程序的运行时间是当字符串的长度为10000时,运行时间为0.05秒;当字符串的长度为100000时,运行时间为5.32秒;当字符串的长度为1000000时,运行时间为558.56秒。所以这段程序的运行时间的规律是当字符串的长度增长到原来的10倍,则运行时间增长到原来的近100倍。 说明:(1)clock函数是C/C++中的计时函数,而与其相关的数据类型是clock_t。在MSDN中,查得对clock函数定义如下: clock_t clock(void); (2)clock函数返回从“开启这个程序进程”到“程序中调用clock()函数”时之间的CPU时钟计时单元(clock tick)数,在MSDN中称之为挂钟时间(wal-clock);若挂钟时间不可取,则返回-1。其中clock_t是用来保存时间的数据类型,在头文件time.h中,可以找到对它的定义: #ifndef _CLOCK_T_DEFINED typedef long clock_t; #define _CLOCK_T_DEFINED #endif 说明clock_t是一个长整形数。 (3)在头文件time.h文件中,还定义了一个常量CLOCKS_PER_SEC,它用来表示一秒钟会有多少个时钟计时单元,其定义如下: #define CLOCKS_PER_SEC ((clock_t)1000) 3.4.6 关于输入输出 1.getchar函数 当程序请求键盘输入时,getchar()函数只要用户回车键时,就可以返回。不一定是输入第一字符,就按回车键,也可以是输入许多字符,最后按回车键。 如果直接输入文件结束符(Windows是Ctrl+Z键),getchar()读到的是ASCII码中不可显示的控制字符(ASCII码值为10,LF表示行满,需要换行)。 说明:(1)getchar有一个int型的返回值。当程序调用getchar时,程序就等着用户按键,用户输入的字符被存放在键盘缓冲区中,直到用户按回车为止(回车字符也放在缓冲区中)。当用户键入回车之后,getchar才开始从stdio流中每次读入一个字符。 (2)getchar函数的返回值是用户输入的第一个字符的ASCII码,如出错返回-1,且将用户输入的字符回显到屏幕。 (3)如用户在按回车之前输入了不止一个字符,其他字符会保留在键盘缓存区中,等待后续getchar调用读取。也就是说,后续的getchar调用不会等待用户按键,而直接读取缓冲区中的字符,直到缓冲区中的字符读完为后,才等待用户按键。 如果把getchar函数放在循环里,也能实现读入一串字符。例如“要读入一串字符,直到按下回车键表示结束”,可以使用下面的结构: char ch; while((ch = getchar()) != '\n') { … /* 处理该字符ch */ } 上述循环的执行过程是:先从键盘上读入一个字符,把字符赋值给ch,然后判断ch是否为换行符'\n',如果是,循环就结束了;如果不是,则执行循环体。因此该结构可以读入多个字符,一直到按下回车键为止(按下回车键实际上输入了两个字符:“回车”字符和“换行”字符,ASCII编码分别为13和10。 2.sscanf函数 (1)sscanf()表示从一个字符串中读取与指定格式相符的数据。它的函数原型如下: 第 页 第3章 数组和字符串 int sscanf( const char *, const char *, …) 需要的头文件是stdio.h。 (2)sscanf与scanf类似,都是用于输入的,只是后者以键盘(stdin)为输入源,前者以固定字符串为输入源。 如果有一个格式为HH:MM:SS的字符串s(例如,"12:34:56"),用一条sscanf语句得到HH、MM、SS的值如下: sscanf(s,"%d:%d:%",&HH,&MM,&SS); 将s替换成"12:34:56",可以得到HH的值为12,MM的值为34,SS的值为56。 3.4.7 I/O的效率 题目是“直接输出”:输入不超过1000行字符串,然后直接输出。每行都是长度不超过10000的字符串,包含大写字母和小写字母,不包含任意空白(如空格、TAB)。 第1种方法是用C++中的流和字符串对象。 #include #include using namespace std; int main() { string s; while(cin >> s) count << s << "\n"; return 0; } 注意:(1)这里声明的是C++中的字符串,否则无法使用输入输出流。 (2)C++字符串和C语言的字符数组是可以相互转换的:如果s是一个字符数组,那么string(s)就是相应的字符串;如果s是一个字符串,则s.c_str()就是相应的字符数组。 (3)c_str()返回的内容是只读的。例如,可以用printf("%s",s.c_str())来输出,但不能用scanf("%s",s.c_str())来输入。 第2种方法是用getchar。 #include using namespace std; int main() { int ch; while((ch=getchar()) != EOF) putchar(ch); return 0; } 注意:赋值语句自身也是有值的,所以读取一个字符的同时可以立刻判断它是否为EOF。 第3种方法是用fgets。 #include using namespace std; #define MAXN 100010 int main() { int ch; while(fgets(s,MAXN,stdin) != NULL) puts(s); return 0; } C++中还有一种“字符串流”,可以实现类似sscanf和sprintf的功能: #include #include using namespace std; 第 页 第3章 数组和字符串 #define MAXN 100010 int main() { char s[1000]; cin.getline(s, 1000, '\n'); stringstream ss(s); int a, b; ss >> a >> b; count << a+b << "\n"; return 0; } 上面的函数先从cin读取一行。Getline函数的第3个参数是行分隔符。它的默认值就是'\n',因此可以简化为cin.getline(s,1000),其中1000的含义和fgets中的类似。 3.4.8 小结 数组和字符串意味着大数据量,而处理大数据量时通常给遇到“访问非法内存”的错误。在语法上,C语言并不禁止程序访问非法内存,但后果难料。可以采取两种方法来解决,通过在访问数组前检查下标是否合法来缓解;适当把数组开大。对于gets函数,存在缓冲区溢出漏洞。对于strcpy也有类似问题——如源字符串并不是以'\0'结尾的,复制工作将可能覆盖到缓冲区之外的内存。 在数组和字符串处理程序中,下标的计算是极为重要的。 理解字符编码对于正确地使用字符串是至关重要的。算法竞赛中涉及的字符一般是ASCII表中的可打印字符。对于中文的GBK编码,如果char值为正,则是西文字符;如果为负,则汉字的前一半(这时需要再读一个char)。 3.4.9 上机练习 习题3-1 分数统计(stat) 输入一些学生的分数,哪个分数出现的次数最多?如果有多个并列,从小到大输出。 说明:(1)假设输入分数的个数不超过10000;如果没有这个假设,这个问题就不好办了。 (2)如果有多个并列,从小到大输出。(注意,书中这里有个定义模糊的地方,我把它明确一下:对于相同的分数,只要输出一次。 任务1:分数均为不超过100的非负整数。 输入文件:习题3-1,分数统计(stat)a.in 输出到屏幕 【分析】 解题所用的数据结构: (1)用一个数组marks存储输入的分数 (2)用另一个数组counts存储对应分数出现的次数 解题思路和步骤: (1)输入数据,并处理好marks和counts数组中的数据; (2)扫描一遍counts,看看出现次数最多的,是多少?记为maxTimes (3)将出现次数为maxTimes的分数,从小到大输出。 由于学生到此为止,还没有学习过排序的算法,所以这一步就比较麻烦了。 具体的做法如下: (1)扫描counts数组,找到次数为maxTimes的、最小的分数,将其输出 (2)将刚刚输出的那个分数所对应的maxTimes值减量1(为的是下一次不再输出这个值了)。 (3)重复(1)、(2)两步,直至再也找不到次数为maxTimes的分数了。 完整的程序如下: #include #define MAX 10000 /* 最多有几个输入数据 */ #define NOMARK -1 /* 表示“无效”的分数;或者也可以理解成“没有分数” */ 第 页 第3章 数组和字符串 int main() { int newData, /*新输入的数据*/ i,j, /*辅助变量*/ exists, /*输出结果时所用的辅助变量*/ maxTimes, /*最大的出现次数*/ min; int marks[MAX], /*存储输入的数据*/ counts[MAX]; /*存储数据的计数*/ freopen("习题3-1,分数统计(stat)a.in","r",stdin); for (i=0; imaxTimes) maxTimes=counts[i]; i=i+1; } /*printf("最大的出现次数 maxTimes=%d\n",maxTimes);*/ /*======= 将拥有最大出现次数的那些分数,由小到大输出 ============*/ exists=1; /*假设存在某个分数,他的出现次数为maxTimes*/ while (exists) { exists=0; i=0; min=101; /*出现次数为maxTimes的众多分数中,最小的那个分数就是min;一开始,我们假设min为101,为的是确保所有出现次数为maxTimes的分数都会比一开始的min小。*/ while (counts[i]!=0) { /*扫描counts数组,在其中寻找出现次数为maxTimes的、最小的那个分数*/ if (counts[i]==maxTimes) { exists=1; /*表明在此次扫描中,又找到了出现次数为 maxTimes 的分数*/ if (marks[i] #define MAX 10000 /*最多有几个输入数据*/ #define NOMARK -1 /*表示“无效”的分数;或者也可以理解成“没有分数”*/ int main() { int i,j, /*辅助变量*/ exists, /*输出结果时所用的辅助变量*/ maxTimes; /*最大的出现次数*/ float min, newData; /*新输入的数据*/ float marks[MAX]; /*存储输入的数据*/ int counts[MAX]; /*存储数据的计数*/ freopen("习题3-1,分数统计(stat)b.in","r",stdin); for (i=0; imaxTimes) maxTimes=counts[i]; i=i+1; } /*printf("最大的出现次数 maxTimes=%d\n",maxTimes);*/ /*======= 将拥有最大出现次数的那些分数,由小到大输出 ============*/ exists=1; /*假设存在某个分数,他的出现次数为maxTimes*/ while (exists) { exists=0; i=0; min=101; /*出现次数为maxTimes的众多分数中,最小的那个分数就是min;一开始,我们假设min为101,为的是确保所有出现次数为maxTimes的分数都会比一开始的min小。*/ while (counts[i]!=0) { /*扫描counts数组,在其中寻找出现次数为maxTimes的、最小的那个分数*/ 第 页 第3章 数组和字符串 if (counts[i]==maxTimes) { exists=1; /*表明在此次扫描中,又找到了出现次数为 maxTimes 的分数*/ if (marks[i]平均长度。 完整的程序如下: #include #define MAXLENGTH 189819 /*最长的单词有多长?请看:http://en.wikipedia.org/ wiki/Longest_word_in_English*/ int main() { char word[MAXLENGTH]; /*单词*/ int lengthSum=0, /*单词长度总和*/ count=0; while(scanf("%s",word)!=0) { /*表示有数据输入*/ count=count+1; lengthSum=lengthSum+strlen(word); } if (count==0) printf("没有单词输入"); else printf("输入的单词平均长度为:%f",lengthSum/(count*1.0)); return 0; } 习题3-3 乘积的末3位(product) 第 页 第3章 数组和字符串 输入若干个整数(可以是正整数、负数或者零),输出它们的乘积的末3位。这些整数中会混入一些由大写字母组成的字符串,你的程序应当忽略它们。提示:试试看,在执行scanf("%d")时输入一个字符串会怎样? 【分析】 每个输入的数据(无论是整数还是字符串)之间,都用回车或空格来分隔。对于乘积不足3位的情况,就输出完整的乘积,左侧不用补0。对于乘积为负数的情况,左侧不必加上-。输入的整数可能有很多个,所以最后的乘积可能会很大。“由大写字母组成的字符串”指的是字符串中全部都是大写字母。输入数据,以“Ctrl+Z,回车,回车”结束。 假设输入的整数不会超过int的表示范围,如果没有任何输入数据,则输出0。 采取的策略如下: (1)对于输入的数据都要做为字符串来看待。 (2)对于每一个输入的数据,要判断其是否为数字。若是,要将“数字字符串”转为“整型数据”;否则,忽略这个数据。 (3)为了计算(x*y)的末三位,其实只要计算(x的末三位)*(y的末三位),看其结果的末三位即可。 完整的程序如下: #include #inlcude int main() { int newData, /*新输入数据的后三位*/ result=0, /*得到的结果。之所以初始化为0,而非1;是要考虑到用户可能没有输入任何整数的情况。*/ p,counts=0; /*count为计数器,用于统计用户输入的数字个数*/ char inStr[100]; /*输入的字符串数据*/ while(scanf("%s",inStr)!=0) { if (inStr[0]>='A' && inStr[0]<='Z') /*说明读到的数据是“由大写字母组成的字符串”*/ continue; /*有数字字符串输入*/ counts=counts+1; if (counts==1) result=1; /*printf("字符串:%s\t",inStr);*/ /*将“数字字符串”的后3位转为整数*/ p=strlen(inStr)-1; newData=0; if (p>=0 && inStr[p]>='0' && inStr[p]<='9') newData=inStr[p]-'0'; p=p-1; if (p>=0 && inStr[p]>='0' && inStr[p]<='9') newData=newData+(inStr[p]-'0')*10; p=p-1; if (p>=0 && inStr[p]>='0' && inStr[p]<='9') newData=newData+(inStr[p]-'0')*100; /*printf("后三位转为整数:=%d\n",newData);*/ result=(result*newData)%1000; /*乘积取最后三位*/ /*printf("....%d\n",result);*/ /*调试信息*/ } printf("%d",result); return 0; } 习题3-4 计算器(calculator) 第 页 第3章 数组和字符串 编写程序,读入一行恰好包含一个加号、减号或乘号的表达式,输出它的值。这个运算符保证是二元运算符,且两个运算数均为不超过100的非负整数。运算数和运算符可以紧挨着,也可以用一个或多个空格、TAB隔开。行首末为均可以有空格。提示:选择合适的输入方法可以将问题简化。 样例输入:1+1 样例输出:2 样例输入:2- 5 样例输出:-3 样例输入:0 *1982 样例输出:0 【分析】 使用的策略如下: (1)读取一行str (2)扫描str,忽视其中的“空格,\t, \n”,生成strX, strY, 和 operator (3)把 strX 转为 x, strY 转为 y (4)根据 operator,计算 x operator y (5)输出结果 说明:(1)使用gets()读取字符串,可以将输入字符串中的 空格, \t 一起读入;但不会读入字符串最后的回车; (2)x, y 位于[0,100]之间; (3)假设输入的字符串总长度不超过MAXLEN=10000(题目没有说明空格等字符的上限); (4)假设用户输入的数据总是合法的。 完整的程序如下: #include #define MAXLEN (10000) int main() { int x,y, /*用于计算*/ i,j, /*临时变量*/ p, /*指针*/ power; /*位权*/ char str[MAXLEN], /*输入的字符串*/ strX[4], /*x,位于[0,100],所以长度4就足够了*/ strY[4], /*y,位于[0,100],所以长度4就足够了*/ operator; gets(str); /*printf("strlen(str)=%d\n",strlen(str));*//*调试代码*/ /*============ 解析出str中的 strX ===============*/ p=0; for (i=0; str[i]!='+' && str[i]!='-' && str[i]!='*'; i=i+1) { if (str[i]>='0' && str[i]<='9') { strX[p]=str[i]; p=p+1; } } strX[p]=0; /*给字符串的末尾加上结束标记*/ /*printf("%s\t%d\n",strX,strlen(strX));*//*调试代码*/ /*============ 解析出str中的 operator ===============*/ operator=str[i]; /*============ 解析出str中的 strY ===============*/ p=0; while (i<=strlen(str)-1){ 第 页 第3章 数组和字符串 if (str[i]>='0' && str[i]<='9') { strY[p]=str[i]; p=p+1; } i=i+1; } strY[p]=0; /*给字符串的末尾加上结束标记*/ /*printf("%s\t%d\n",strY,strlen(strY));*/ /*调试代码*/ /*========== 将strX转为x,strY转为y ============*/ x=0; for(i=strlen(strX)-1; i>=0; i=i-1) { power=1; for(j=1; j<=(strlen(strX)-1)-i; j=j+1) power=power*10; x=x+(strX[i]-'0')*power; } y=0; for(i=strlen(strY)-1; i>=0; i=i-1) { power=1; for(j=1; j<=(strlen(strY)-1)-i; j=j+1) power=power*10; y=y+(strY[i]-'0')*power; } /*printf("x=%d\ty=%d\n",x,y);*/ /*调试代码*/ if (operator=='+') printf("%d",x+y); if (operator=='-') printf("%d",x-y); if (operator=='*') printf("%d",x*y); return 0; } 习题3-5 旋转(rotate) 输入一个n*n字符矩阵,把它左转900后输出。 【分析】 本题描述存在一个问题:没有明确指出n*n字符矩阵是以何种格式输入的。在解决问题的时候,程序员需要自己定义输入数据的格式。在此,我们定义输入数据的格式如下: (1)先输入一个整数n,表示n*n字符矩阵; (2)再输入n*n个字符,表示矩阵中的数据; (3)假设用户输入的数据都是合法的,设 0<=n<=100。 输出数据:逆时针转90度后的n*n矩阵 举例说明: 输入: 4 a b c d e f g h i j k l m n o p 输出: d h l p c g k o b f j n a e i m 采用的数据结构是用100*100的二维数组来存储数据。 使用的策略是仔细观察输入和输出的样例。和输入矩阵对比,输出矩阵是以行为单位输出,对于n个输出行而言,是从右向左按列输出“输入矩阵”。 第 页 第3章 数组和字符串 完整的程序如下: #include int main() { char m[100][100]; /* n*n矩阵 */ int n, /* 矩阵每行的元素个数 */ x, /* 行 */ y; /* 列 */ /*=============== 数据输入 =================*/ scanf("%d",&n); for (x=0; x<=n-1; x=x+1) { for (y=0; y<=n-1; y=y+1) { scanf("%c",&m[x][y]); /* 由于输入的是字符数据,所以要跳过可能存在回车、换行、空格、制 表符等不可见字符 */ while (m[x][y]=='\n' || m[x][y]=='\t' || m[x][y]==' ') scanf("%c",&m[x][y]); } } /*调试代码:打印刚刚输入的用户数据*/ /* for (x=0; x<=n-1; x=x+1) { for (y=0; y<=n-1; y=y+1) { printf("%c ",m[x][y]); } printf("\n"); } */ /*=============== 输出数据 ================*/ for (y=n-1; y>=0; y=y-1) { for (x=0; x<=n-1; x=x+1) { printf("%c ",m[x][y]); } printf("\n"); } return 0; } 说明:使用输入输出重定向的办法,可以更方便地测试更大规模的数据。 习题3-6 进制转换1(base1) 输入基数b(2<=b<=10)和正整数n(十进制),输出n的b进制表示。 【分析】 假设0 int main() { int b, /*基数*/ n, /*正整数*/ 第 页 第3章 数组和字符串 i; int ans[100]; /*结果*/ scanf("%d%d",&b,&n); i=0; while (n!=0) { ans[i]=n%b; n=n/b; i=i+1; } for (i=i-1;i>=0;i=i-1) { printf("%d",ans[i]); } return 0; } 习题3-7 进制转换2(base2) 输入基数b(2<=b<=10)和正整数n(b进制),输出n的十进制表示。 【分析】 假设用户输入的数据都是合法的,假设n作为十进制来看待的时候,位数不超过19位。这时候,就需要用64位整数来存储n。例如, 输入:3 212 输出:23 输入:2 101 输出:5 采用的策略是模拟手工计算的过程。采取的数据结构是本题的解决可以不采用数组的数据结构的,这样做似乎更加方便,代码更加简洁明了。但是由于本章讲的是数组。所以我使用一个一维数组,来存储输入的正整数n中的每一位。n的最低位,存放在数组下标为0的元素上,以此类推。 完整的程序如下: #include int main() { int b, /*基数(2<=b<=10)*/ i,j,k; long long m, /*位权*/ n, /*b进制的正整数n*/ result; /*结果*/ int s[20]; scanf("%d%I64d",&b,&n); /*printf("%d% I64d\n",b,n);*/ /*测试代码*/ /*======= 把n的每一位存入一维数组 =================================*/ /*======= n的最低位,存放在数组下标为0的元素上,以此类推。 ========*/ i=0; while (n!=0) { s[i]=n%10; n=n/10; i=i+1; } result=0; m=1; for (k=0; k<=(i-1); k=k+1) { /*从下标0开始,向高位计算,可以节省计算位 权的时间*/ result=result+s[k]*m; 第 页 第3章 数组和字符串 m=m*b; /*计算更高一位的位权*/ } printf("%I64d",result); return 0; } 习题3-8 手机键盘(keyboard) 输入一个由小写字母组成的英文单词,输出用手机的默认英文输入法的敲键序列。例如要打出pig这个单词,需要按1次p,3次i,(稍作停顿后)1次g,记为p1i3g1(显然,书中这部分描述存在明显的错误,应以这里的描述为准)。 【分析】 假设用户总是能输入合法的英文单词(不包括空格、数字等);单词的字符个数不超过300。 解题的策略是用一个一维数组的数据结构,来表示手机键盘。 解题的步骤是: (1)读入单词, (2)从左至右其中的每一个字符,查询之前存储的“手机键盘”,输出查询的结果。 完整的程序如下: #include int main() { char pad[]={'a','d','g','j','m','p','t','w',127}, /*手机键盘布局*/ word[300]; int i, /*用于指向输入单词中的字符*/ j; /*用于指向键盘上的按键*/ gets(word); for (i=0; i

下载文档到电脑,查找使用更方便

文档的实际排版效果,会与网站的显示效果略有不同!!

需要 10 金币 [ 分享文档获得金币 ] 0 人已下载

下载文档