C核心技术手册(五)

1.1  字符集

  C将编译器编译源代码的环境(:编译环境)和编译好的程序运行所依赖的环境(即:运行环境)区别对待,所以,C定义了两种类型的字符集,源文件中使用的称做源字符集,执行程序使用的称做执行时字符集。在一些C的实现的,两种类型是一样的,如果不同,编译器会将其转化为执行时字符集。

  每种字符集均包含基本字符集和扩展字符。C没有指定扩展字符,这些通常由本地语言来决定,扩展字符和基本字符集一起构成了扩展字符集。

  基本字符集和扩展字符集都包括下面的字符类型:

  拉丁字母:

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

a b c d e f g h i j k l m n o p q r s t u v w x y z

  数字

     0 1 2 3 4 5 6 7 8 9

   29个标点符号

! " # % & ' ( ) * + , - . / : ; < = > ? [ / ] ^ _ { | } ~

   五种空白字符

空格、水平TAB,垂直TAB,新行,分页

 

基本的执行时字符集包四种非打印字符:

     Null: 表识字符串结束;

    警报(alter)

    退格(backspace)

    回车(carriage return)

  为了表示这些字符,需要以一个反斜杠(/)进行转义,

    /0 表示null;

    /a 表示警报(alter)

    /b 表示退格(backspace);

    /r 表示回车(carriage return)

  每个字符实际的值因程序不同而各异,C语言仅做以下规定:

l  基本字符集中的每个字符占一个字节;

l  字符Null为所有位均为0的一个字节;

l  十进制正数由小到大排列;

你可能感兴趣的:(C核心技术手册(五))