第 2 章 C语言基本概念
某个人的常量可能是其他人的变量。
本章介绍了C语言的一些基本概念,包括预处理指令、函数、变量和语句。即使是编写最简单的C程序,也会用到这些基本概念。后续几章会更详细地描述这些概念。
首先,2.1节给出一个简单的C程序,并且描述了如何对这个程序进行编译和链接。接着,2.2节讨论如何使程序通用。2.3节介绍如何添加说明性解释,即通常所说的注释。2.4节介绍变量,变量用来存储程序执行过程中可能发生改变的数据。2.5节说明利用scanf函数把数据读入变量的方法。就如2.6节介绍的那样,常量是程序执行过程中不会发生改变的数据,用户可以对其进行命名。最后,2.7节解释C语言的命名(标识符)规则,2.8节给出C程序的布局规范。
2.1 编写一个简单的C程序
与用其他语言编写的程序相比,C程序较少要求“形式化的东西”。一个完整的C程序可以只有寥寥数行。
程序 显示双关语
在Kernighan和Ritchie编写的经典C语言著作《C程序设计语言》中,第一个程序是极其简短的。它仅仅输出了一条hello, world消息。与大多数C语言书的作者不同,我不打算用这个程序作为第一个C程序示例,而更愿意尊重C语言的另一个传统:显示双关语。下面是一条双关语:
To C, or not to C: that is the question.
下面这个名为pun.c的程序会在每次运行时显示上述消息。
pun.c
#include <stdio.h> int main(void) { printf("To C, or not to C: that is the question.\n"); return 0; }
2.2节会对这段程序中的一些格式进行详尽的说明,这里仅做简要介绍。对本程序所要完成的操作来说,它的第一行
#include <stdio.h>
是必不可少的,它“包含”了C语言标准输入/输出库的相关信息。程序的可执行代码都在main函数中,这个函数代表“主”程序。main函数中的第一行代码是用来显示期望信息的。printf函数来自标准输入/输出库,可以产生完美的格式化输出。代码\n告诉printf函数执行完消息显示后要进行换行操作。第二行代码
return 0;
表明程序终止时会向操作系统返回值0。
2.1.1 编译和链接
尽管pun.c程序十分简短,但是为运行这个程序而包含的内容可能比想象的要多。首先,需要生成一个含有上述程序代码的名为pun.c的文件(使用任何文本编辑器都可以创建该文件)。文件的名字无关紧要,但是编译器通常要求带上文件的扩展名.c。
接下来需要把程序转化为机器可以执行的形式。对于C程序来说,转化通常包含下列3个步骤。
- 预处理。首先程序会被交给预处理器(preprocessor)。预处理器执行以#开头的命令(通常称为指令)。预处理器有点类似于编辑器,它可以给程序添加内容,也可以修改程序。
- 编译。修改后的程序现在可以进入编译器(compiler)了。编译器会把程序翻译成机器指令(即目标代码)。然而,这样的程序还是不可以运行的。
- 链接。在最后一个步骤中,链接器(linker)把由编译器产生的目标代码和所需的其他附加代码整合在一起,这样才最终产生了完全可执行的程序。这些附加代码包括程序中用到的库函数(如printf函数)。
幸运的是,上述过程往往是自动实现的,因此人们会发现这项工作不是太艰巨。事实上,因为预处理器通常会和编译器集成在一起,所以人们甚至可能不会注意到它在工作。
根据不同的编译器和操作系统,编译和链接所需的命令也是多种多样的。在UNIX系统环境下,通常把C编译器命名为cc。为了编译和链接pun.c程序,需要在终端或命令行窗口输入如下命令:
% cc pun.c
(字符%是UNIX系统的提示符,不需要输入。)在使用编译器cc时,系统自动进行链接操作,无须单独的链接命令。
在编译和链接好程序后,编译器cc会把可执行程序放到默认名为a.out的文件中。编译器cc有许多选项,其中一个选项(-o)允许为含有可执行程序的文件选择名字。例如,假设要把文件pun.c生成的可执行文件命名为pun,那么只需输入下列命令:
% cc –o pun pun.c
GCC
GCC是最流行的C编译器之一,它随Linux发行,但也有面向其他很多平台的版本。这种编译器的使用与传统的UNIX cc编译器相似。例如,编译程序pun.c可以使用以下命令:
% gcc –o pun pun.c
本章最后的“问与答”部分将提供更多关于GCC的信息。
2.1.2 集成开发环境
到目前为止,我们一直通过在操作系统提供的特殊窗口中输入命令的方式来调用“命令行”编译器。事实上,还可以使用集成开发环境(integrated development environment, IDE)来编译。集成开发环境是一个软件包,我们可以在其中编辑、编译、链接、执行甚至调试程序。组成集成开发环境的各个部分可以协调工作。例如,当编译器发现程序中有错误时,它会让编辑器把包含出错代码的行突出显示。集成开发环境有很多种,本书不打算一一讨论它们,但我建议读者了解一下自己的平台上可以运行哪些集成开发环境。
2.2 简单程序的一般形式
下面一起来仔细研究一下pun.c程序,并且由此归纳出一些通用的程序格式。简单的C程序一般具有如下形式:
指令 int main(void) { 语句 }
在这个模板以及本书的其他类似模板中,所有以等宽(Courier)字体显示的语句都代表实际的C语言程序代码,所有以中文楷体 + 斜体显示的部分则表示需要由程序员提供的内容。
注意如何使用花括号来标出main函数的起始和结束。C语言使用{和}的方式非常类似于其他语言中begin和end的用法。 这也说明了有关C语言一个共识:C语言极其依赖缩写词和特殊符号,这是C程序非常简洁(或者不客气地说含义模糊)的一个原因。
即使是最简单的C程序也依赖3个关键的语言特性:指令(在编译前修改程序的编辑命令)、函数(被命名的可执行代码块,如main函数)和语句(程序运行时执行的命令)。下面将详细讨论这些特性。
2.2.1 指令
在编译C程序之前,预处理器会首先对其进行编辑。我们把预处理器执行的命令称为指令。第14章和第15章会详细讨论指令,这里只关注#include指令。
程序pun.c由下面这行指令开始:
#include <stdio.h>
这条指令说明,在编译前把<stdio.h>中的信息“包含”到程序中。<stdio.h>包含C标准输入/输出库的信息。C语言拥有大量类似于<stdio.h>的头(header,➤15.2节),每个头都包含一些标准库的内容。这段程序中包含<stdio.h>的原因是C语言不同于其他的编程语言,它没有内置的“读”和“写”命令。输入/输出功能由标准库中的函数实现。
所有指令都是以字符#开始的。这个字符可以把C程序中的指令和其他代码区分开来。指令默认只占一行,每条指令的结尾没有分号或其他特殊标记。
2.2.2 函数
函数类似于其他编程语言中的“过程”或“子例程”,它们是用来构建程序的构建块。事实上,C程序就是函数的集合。函数分为两大类:一类是程序员编写的函数,另一类则是作为C语言实现的一部分提供的函数。我们把后者称为库函数(library function),因为它们属于一个由编译器提供的函数“库”。
术语“函数”来源于数学。在数学中,函数是指根据一个或多个给定参数进行数值计算的规则:
C语言对“函数”这个术语的使用则更加宽松。在C语言中,函数仅仅是一系列组合在一起并且被赋予了名字的语句。某些函数计算数值,某些函数则不是这样。计算数值的函数用return语句来指定所“返回”的值。例如,对参数进行加1操作的函数可以执行语句
return x + 1;
而当函数要计算参数的平方差时,则可以执行语句
return y * y – z * z;
虽然一个C程序可以包含多个函数,但只有main函数是必须有的。main函数是非常特殊的:在执行程序时系统会自动调用main函数。在第9章,我们将学习如何编写其他函数,在此之前的所有程序都只包含一个main函数。
main函数的名字是至关重要的,绝对不能改写成begin或者start,甚至写成MAIN也不行。
如果main是一个函数,那么它会返回一个值吗?是的。它会在程序终止时向操作系统返回一个状态码。我们再来看看pun.c程序:
#include <stdio.h> int main(void) { printf("To C, or not to C: that is the question.\n"); return 0; }
main前面的int表明该函数将返回一个整数值。圆括号中的void表明main函数没有参数。语句
return 0;
有两个作用:一是使main函数终止(从而结束程序),二是指出main函数的返回值是0。后面还将详细论述main函数的返回值(➤9.5节)。 但是现在我们始终让main函数的返回值为0,这个值表明程序正常终止。
如果main函数的末尾没有return语句,程序仍然能终止。但是,许多编译器会产生一条警告信息(因为函数应该返回一个整数,却没有这么做)。
2.2.3 语句
语句是程序运行时执行的命令。本书后面的几章(主要集中在第5章和第6章)将进一步探讨语句。程序pun.c只用到两种语句:一种是返回(return)语句,另一种是函数调用(function call)语句。要求某个函数执行分派给它的任务称为调用这个函数。例如,程序pun.c为了在屏幕上显示一条字符串就调用了printf函数:
printf("To C, or not to C: that is the question.\n");
C语言规定每条语句都要以分号结尾。[就像任何好的规则一样,这条规则也有一个例外:后面会遇到的复合语句(➤5.2节)就不以分号结尾。]由于语句可以连续占用多行,有时很难确定它的结束位置,因此用分号来向编译器显示语句的结束位置。但指令通常只占一行,因此不需要用分号结尾。
2.2.4 显示字符串
printf是一个功能强大的函数,第3章会进一步介绍。到目前为止,我们只是用printf函数显示了一条字面串(string literal)——用一对双引号包围的一系列字符。当用printf函数显示字面串时,最外层的双引号不会出现。
当显示结束时,printf函数不会自动跳转到下一输出行。为了让printf跳转到下一行,必须在要显示的字符串中包含\n(换行符)。写换行符就意味着终止当前行,然后把后续的输出转到下一行。为了说明这一点,请思考把语句
printf("To C, or not to C: that is the question.\n");
替换成下面两个对printf函数的调用后所产生的效果:
printf("To C, or not to C: "); printf("that is the question.\n");
第一条printf函数的调用语句显示出To C, or not to C:,第二条调用语句显示出that is the question.并且跳转到下一行。最终的效果和前一个版本的printf语句完全一样,用户不会发现什么差异。
换行符可以在一个字面串中出现多次。为了显示下列信息:
Brevity is the soul of wit. --Shakespeare
可以这样写:
printf("Brevity is the soul of wit.\n --Shakespeare\n");
2.3 注释
我们的pun.c程序仍然缺乏某些重要内容:文档说明。每一个程序都应该包含识别信息,即程序名、编写日期、作者、程序的用途以及其他相关信息。C语言把这类信息放在注释(comment)中。符号/*标记注释的开始,符号*/标记注释的结束。例如:
/* This is a comment */
注释几乎可以出现在程序的任何位置上。它既可以独占一行,也可以和其他程序文本出现在同一行中。下面展示的程序pun.c就把注释加在了程序开始的地方:
/* Name: pun.c */ /* Purpose: Prints a bad pun. */ /* Author: K. N. King */ #include <stdio.h> int main(void) { printf("To C, or not to C: that is the question.\n"); return 0; }
注释还可以占用多行。如果遇到符号/*,那么编译器读入(并且忽略)随后的内容直到遇到符号*/为止。如果愿意,还可以把一串短注释合并成为一条长注释:
/* Name: pun.c Purpose: Prints a bad pun. Author: K. N. King */
但是,上面这样的注释可能难以阅读,因为人们阅读程序时可能不易发现注释的结束位置。因此,单独把*/符号放在一行会很有帮助:
/* Name: pun.c Purpose: Prints a bad pun. Author: K. N. King */
更好的方法是用一个“盒形”格式把注释单独标记出来:
/********************************************************** * Name: pun.c * * Purpose: Prints a bad pun. * * Author: K. N. King * **********************************************************/
有些程序员通过忽略3条边框的方法来简化盒形注释:
/* * Name: pun.c * Purpose: Prints a bad pun. * Author: K. N. King */
简短的注释还可以与程序中的其他代码放在同一行:
int main(void) /* Beginning of main program */
这类注释有时也称作“翼型注释”。
如果忘记终止注释,则可能会导致编译器忽略程序的一部分。请思考一下下面的示例:
printf("My "); /* forgot to close this comment... printf("car "); printf("has "); /* so it ends here */ printf("fleas");
因为在第一条注释中遗漏了结束标志,所以编译器忽略了中间的两条语句,因此程序最终只打印了My fleas。
C99提供了另一种类型的注释,以//(两个相邻的斜杠)开始:
// This is a comment
这种风格的注释会在行末自动终止。如果要创建多于一行的注释,既可以使用以前的注释风格(/* ... */),也可以在每一行的前面加上//:
// Name: pun.c // Purpose: Prints a bad pun. // Author: K. N. King
新的注释风格有两个主要优点:首先,因为注释会在行末自动终止,所以不会出现未终止的注释意外吞噬部分程序的情况;其次,因为每行注释前面都必须有//,所以多行注释看上去更加醒目。
2.4 变量和赋值
很少有程序会像2.1节中的示例那样简单。大多数程序在产生输出之前往往需要执行一系列的计算,因此需要在程序执行过程中有一种临时存储数据的方法。和大多数编程语言一样,C语言中的这类存储单元被称为变量(variable)。
2.4.1 类型
每一个变量都必须有一个类