过去C语⾔并不适合⾮英语国家(地区)使⽤。 C语⾔最初假定字符都是单字节的。但是这些假定并不是在世界的任何地⽅都适⽤。
C语⾔字符默认是采⽤ASCII编码的,ASCII字符集采⽤的是单字节编码,且只使⽤了单字节中的低7 位,最⾼位是没有使⽤的,可表⽰为0xxxxxxxx;可以看到,ASCII字符集共包含128个字符,在英语 国家中,128个字符是基本够⽤的,但是,在其他国家语⾔中,⽐如,在法语中,字⺟上⽅有注⾳符 号,它就⽆法⽤ ASCII 码表⽰。
于是,⼀些欧洲国家就决定,利⽤字节中闲置的最⾼位编⼊新的符 号。⽐如,法语中的é的编码为130(⼆进制10000010)。这样⼀来,这些欧洲国家使⽤的编码体 系,可以表⽰最多256个符号。但是,这⾥⼜出现了新的问题。不同的国家有不同的字⺟,因此,哪 怕它们都使⽤256个符号的编码⽅式,代表的字⺟却不⼀样。
比如,亚洲国家的⽂字,使⽤的符号就更多了,汉字就多达10万左右。⼀个字节只能表⽰256种符号, 肯定是不够的,就必须使⽤多个字节表达⼀个符号。⽐如,简体中⽂常⻅的编码⽅式是 GB2312,使 ⽤两个字节表⽰⼀个汉字,所以理论上最多可以表⽰ 256 x 256 = 65536 个符号。 后来为了使C语⾔适应国际化,C语⾔的标准中不断加⼊了国际化的⽀持。
功能:提供的函数⽤于控制C标准库中对于不同的地区会产⽣不⼀样⾏为的部分。
当然,当我们进行地区的修改后,
char* setlocale (int category, const char* locale);
- int main()
- {
-
- setlocale(LC_ALL,"c");
-
- return 0;
-
- }
和普通字符相比,普通字符在控制台中占据的是一个字节,而宽字符则占据了两个字节。
- #include <stdio.h>
- #include<locale.h>
- int main()
- {
- setlocale(LC_ALL, "");
- wchar_t ch1 = L'●';
- wchar_t ch2 = L'★';
-
-
- wprintf(L"%lc\n", ch1);
- wprintf(L"%lc\n", ch2);
-
- return 0;
- }