精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

UTF-8 中文man頁面

系統
The Unicode 字符集使用的是 16 位(雙字節)碼。最普遍的 Unicode 編碼方法( UCS-2) 由一個 16 位雙字序列組成。這樣的字符串中包括了的一些如‘\0’或‘/’這樣的在文件名中或者是在 C 庫函數中具有特殊意義的字符。另外,如果沒有做重大的修正的話,大部分操作 ASCII 碼文件的 UNIX 工具不能夠正確識別 16 位的字符。因此, UCS-2 對于 Unicode 的文件名、文本文件、環境變量等等來說并不是一種合適的外部編碼方式。 ISO 10646 Universal Character Set (UCS), 是 Unicode 的超集,甚至使用了 31 位編碼方式,另外還有使用 32 編碼的

NAME

UTF-8 - ASCII 兼容的多字節 Unicode 編碼  

描述

The Unicode 字符集使用的是 16 位(雙字節)碼。最普遍的 Unicode 編碼方法( UCS-2) 由一個 16 位雙字序列組成。這樣的字符串中包括了的一些如‘\0’或‘/’這樣的在文件名中或者是在 C 庫函數中具有特殊意義的字符。另外,如果沒有做重大的修正的話,大部分操作 ASCII 碼文件的 UNIX 工具不能夠正確識別 16 位的字符。因此, UCS-2 對于 Unicode 的文件名、文本文件、環境變量等等來說并不是一種合適的外部編碼方式。 ISO 10646 Universal Character Set (UCS), 是 Unicode 的超集,甚至使用了 31 位編碼方式,另外還有使用 32 編碼的 UCS-4 也有同樣上述的問題。 UCS-4 而用 UTF-8Unicode UCS 編碼就不會存在這樣的問題。所以,UTF-8 很明顯的是在 UNIX 類操作系統下的 Unicode 字符集的解決方案。  

屬性

UTF-8 編碼具有以下優良屬性:

*
UCS 字符從 0x00000000 到 0x0000007f (傳統的 US-ASCII 字符)簡單地編碼為字節 0x00 到 0x7f (與 ASCII 碼兼容)。這意味著只包含 7 位 ASCII 字符的文件和字符串在 ASCIIUTF-8. 編碼方式下是完全一樣的。
*
所有大于 0x7f 的 UCS 字符被編碼成為多字節序列。該序列全部是由 0x80 到 0fd 的字符組成,這樣就不會有標準 ASCII 字符會被作為某個字的一個部分這種現象出現,對于‘\0’和‘’這樣的特殊字符來說也就不會有問題了。
*
保留了 UCS-4 字典中的字節串的排列順序。
*
所有 2^32 次方的 UCS 碼都能夠使用 UTF-8 來進行編碼。
*
0xfe 和 0xff 兩個字符在 UTF-8 中不會被用到。
*
表示非 ASCII 碼的 UCS 多字節串的開始字符總是 0xc0 到 0xfd 之間的字符,并會指出該串的長度。多字節串的其他字符都是 0x80 到 0xbf 之間的字符。這使得再同步非常簡單,并令編碼是無態的,丟字節現象也不容易發生。
*
UTF-8 編碼的 UCS 字符可以增加到 6 個字節的長度。而 Unicode 只能增加到 3 個字節長。由于 Linux 只使用 16 位的 UnicodeUCS 的子集。所以在 Linux 下, UTF-8 多字節串長度最多不會超過三個字節。

編碼方式

下面的字節串用來表示一個字符。用什么串依照該字符在 UCS 編碼中的序號來定:

0x00000000 - 0x0000007F:
0xxxxxxx
0x00000080 - 0x000007FF:
110xxxxx 10xxxxxx
0x00000800 - 0x0000FFFF:
1110xxxx 10xxxxxx 10xxxxxx
0x00010000 - 0x001FFFFF:
11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
0x00200000 - 0x03FFFFFF:
111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
0x04000000 - 0x7FFFFFFF:
1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx

這里 xxx 的位置二進制位形式的字符編碼填入。只用最短的那個足夠表達一個字符編碼數的多字節串。  

舉例說明

Unicode 字符 0xa9 = 1010 1001 (版權所有的符號) 在 UTF-8 中被編碼為:

11000010 10101001 = 0xc2 0xa9

字符0x2260 = 0010 0010 0110 0000 (“不等于”符號)被編碼為:

11100010 10001001 10100000 = 0xe2 0x89 0xa0

遵循標準

ISO 10646, Unicode 1.1, XPG4, Plan 9.  

作者

Markus Kuhn  

參考

unicode(7)

#p#

NAME

UTF-8 - an ASCII compatible multi-byte Unicode encoding  

DESCRIPTION

The Unicode 3.0 character set occupies a 16-bit code space. The most obvious Unicode encoding (known as UCS-2) consists of a sequence of 16-bit words. Such strings can contain as parts of many 16-bit characters bytes like '\0' or '/' which have a special meaning in filenames and other C library function parameters. In addition, the majority of UNIX tools expects ASCII files and can't read 16-bit words as characters without major modifications. For these reasons, UCS-2 is not a suitable external encoding of Unicode in filenames, text files, environment variables, etc. The ISO 10646 Universal Character Set (UCS), a superset of Unicode, occupies even a 31-bit code space and the obvious UCS-4 encoding for it (a sequence of 32-bit words) has the same problems.

The UTF-8 encoding of Unicode and UCS does not have these problems and is the common way in which Unicode is used on Unix-style operating systems.  

PROPERTIES

The UTF-8 encoding has the following nice properties:

*
UCS characters 0x00000000 to 0x0000007f (the classic US-ASCII characters) are encoded simply as bytes 0x00 to 0x7f (ASCII compatibility). This means that files and strings which contain only 7-bit ASCII characters have the same encoding under both ASCII and UTF-8.
*
All UCS characters > 0x7f are encoded as a multi-byte sequence consisting only of bytes in the range 0x80 to 0xfd, so no ASCII byte can appear as part of another character and there are no problems with e.g. '\0' or '/'.
*
The lexicographic sorting order of UCS-4 strings is preserved.
*
All possible 2^31 UCS codes can be encoded using UTF-8.
*
The bytes 0xfe and 0xff are never used in the UTF-8 encoding.
*
The first byte of a multi-byte sequence which represents a single non-ASCII UCS character is always in the range 0xc0 to 0xfd and indicates how long this multi-byte sequence is. All further bytes in a multi-byte sequence are in the range 0x80 to 0xbf. This allows easy resynchronization and makes the encoding stateless and robust against missing bytes.
*
UTF-8 encoded UCS characters may be up to six bytes long, however the Unicode standard specifies no characters above 0x10ffff, so Unicode characters can only be up to four bytes long in UTF-8.

ENCODING

The following byte sequences are used to represent a character. The sequence to be used depends on the UCS code number of the character:

0x00000000 - 0x0000007F:
0xxxxxxx
0x00000080 - 0x000007FF:
110xxxxx 10xxxxxx
0x00000800 - 0x0000FFFF:
1110xxxx 10xxxxxx 10xxxxxx
0x00010000 - 0x001FFFFF:
11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
0x00200000 - 0x03FFFFFF:
111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
0x04000000 - 0x7FFFFFFF:
1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx

The xxx bit positions are filled with the bits of the character code number in binary representation. Only the shortest possible multi-byte sequence which can represent the code number of the character can be used.

The UCS code values 0xd800-0xdfff (UTF-16 surrogates) as well as 0xfffe and 0xffff (UCS non-characters) should not appear in conforming UTF-8 streams.  

EXAMPLES

The Unicode character 0xa9 = 1010 1001 (the copyright sign) is encoded in UTF-8 as

11000010 10101001 = 0xc2 0xa9

and character 0x2260 = 0010 0010 0110 0000 (the "not equal" symbol) is encoded as:

11100010 10001001 10100000 = 0xe2 0x89 0xa0

APPLICATION NOTES

Users have to select a UTF-8 locale, for example with

export LANG=en_GB.UTF-8

in order to activate the UTF-8 support in applications.

Application software that has to be aware of the used character encoding should always set the locale with for example

setlocale(LC_CTYPE, "")

and programmers can then test the expression

strcmp(nl_langinfo(CODESET), "UTF-8") == 0

to determine whether a UTF-8 locale has been selected and whether therefore all plaintext standard input and output, terminal communication, plaintext file content, filenames and environment variables are encoded in UTF-8.

Programmers accustomed to single-byte encodings such as US-ASCII or ISO 8859 have to be aware that two assumptions made so far are no longer valid in UTF-8 locales. Firstly, a single byte does not necessarily correspond any more to a single character. Secondly, since modern terminal emulators in UTF-8 mode also support Chinese, Japanese, and Korean double-width characters as well as non-spacing combining characters, outputting a single character does not necessarily advance the cursor by one position as it did in ASCII. Library functions such as mbsrtowcs(3) and wcswidth(3) should be used today to count characters and cursor positions.

The official ESC sequence to switch from an ISO 2022 encoding scheme (as used for instance by VT100 terminals) to UTF-8 is ESC % G ("\x1b%G"). The corresponding return sequence from UTF-8 to ISO 2022 is ESC % @ ("\x1b%@"). Other ISO 2022 sequences (such as for switching the G0 and G1 sets) are not applicable in UTF-8 mode.

It can be hoped that in the foreseeable future, UTF-8 will replace ASCII and ISO 8859 at all levels as the common character encoding on POSIX systems, leading to a significantly richer environment for handling plain text.  

SECURITY

The Unicode and UCS standards require that producers of UTF-8 shall use the shortest form possible, e.g., producing a two-byte sequence with first byte 0xc0 is non-conforming. Unicode 3.1 has added the requirement that conforming programs must not accept non-shortest forms in their input. This is for security reasons: if user input is checked for possible security violations, a program might check only for the ASCII version of "/../" or ";" or NUL and overlook that there are many non-ASCII ways to represent these things in a non-shortest UTF-8 encoding.  

STANDARDS

ISO/IEC 10646-1:2000, Unicode 3.1, RFC 2279, Plan 9.  

AUTHOR

Markus Kuhn <mgk25@cl.cam.ac.uk>  

SEE ALSO

nl_langinfo(3), setlocale(3), charsets(7), unicode(7)

責任編輯:韓亞珊 來源: CMPP.net
相關推薦

2011-08-24 16:48:36

man中文man

2011-08-15 10:21:09

man中文man

2011-08-11 16:11:49

at中文man

2011-08-25 10:21:56

man.conf中文man

2011-08-16 10:21:13

setconsole中文man

2011-08-24 17:06:42

NOTIFY中文man

2011-08-16 09:32:01

quotaoff中文man

2011-08-23 18:05:21

ABORT中文man

2011-08-25 18:14:26

tcflow中文man

2011-08-25 16:55:26

gets中文man

2011-08-12 11:07:19

git中文man

2011-08-25 17:30:26

setbuf中文man

2011-08-15 13:14:44

rmdir中文man

2011-08-24 17:00:04

netdevice中文man

2011-11-01 13:46:50

中文mantac

2011-08-15 09:55:01

ls中文man

2011-08-24 16:20:09

load中文man

2011-08-25 15:47:06

fopen中文man

2011-08-25 16:25:30

fputs中文man

2011-08-25 10:49:28

rpc中文man
點贊
收藏

51CTO技術棧公眾號

亚洲精品一区二区三区樱花| 668精品在线视频| 性欧美在线视频| 欧美高清另类hdvideosexjaⅴ| 成人网男人的天堂| 国产国语刺激对白av不卡| 91香蕉一区二区三区在线观看| 亚洲乱码一区| 在线观看av一区| 国产精品一二三在线观看| 偷拍精品一区二区三区| 奇米精品一区二区三区四区| 欧美日本高清视频| 五月天精品视频| 日韩高清在线观看一区二区| 色诱亚洲精品久久久久久| 穿情趣内衣被c到高潮视频| 日本一级在线观看| 国产电影精品久久禁18| 国产精品国模在线| 91蜜桃视频在线观看| 亚洲国产精品成人| 亚洲性视频网址| 国产高潮视频在线观看| 亚洲欧洲专区| 欧美午夜视频一区二区| 久久www视频| 午夜看片在线免费| 久久亚洲综合色一区二区三区| 亚洲字幕一区二区| 中文字幕一区二区人妻| 久久久久久久波多野高潮日日| 欧美日本高清视频| 日韩高清dvd碟片| 精品视频亚洲| 精品香蕉在线观看视频一| 久久久久国产免费| 欧美一区一区| 欧美日韩国产片| 别急慢慢来1978如如2| 欧美极品videos大乳护士| 亚洲国产日韩精品| h无码动漫在线观看| 蜜桃av在线免费观看| 国产精品免费视频观看| 日本不卡一区| 成年人视频免费在线观看| 久久夜色精品国产欧美乱极品| 精品日本一区二区| 天堂av2024| 成人av电影免费在线播放| 99久久99久久精品国产片| 97在线公开视频| 韩国女主播成人在线观看| 国产在线观看精品一区二区三区| 精品国产青草久久久久96| 日韩av中文字幕一区二区三区| 欧美亚洲视频在线看网址| 二区视频在线观看| 久久成人在线| 国产精品免费福利| ,一级淫片a看免费| 国产在线精品一区二区三区不卡| 亚洲va男人天堂| 亚洲免费成人网| 不卡视频在线观看| 欧美日韩一区综合| wwwxxx在线观看| 亚洲天堂免费看| 肉大捧一出免费观看网站在线播放 | 色香蕉成人二区免费| 人妻内射一区二区在线视频| 亚洲日本在线观看视频| 欧美另类久久久品| 日本在线视频播放| 日韩激情毛片| 中文字幕视频一区二区在线有码| 糖心vlog免费在线观看| 欧美三级午夜理伦三级中文幕| 97视频在线免费观看| www.com亚洲| 狠狠色综合色综合网络| 成人片在线免费看| 青梅竹马是消防员在线| 国产精品国产三级国产aⅴ中文| 久久免费一级片| 美女露胸视频在线观看| 在线视频观看一区| 无人码人妻一区二区三区免费| 久久久久97| 国产小视频国产精品| 欧美 日韩 国产 一区二区三区| 激情久久久久| 国产精品综合不卡av| 亚洲av无码国产精品久久不卡| 91免费看`日韩一区二区| 午夜一区二区三视频在线观看| 成人短视频在线| 一本一本大道香蕉久在线精品 | 电影一区二区三区久久免费观看| 精品精品国产高清a毛片牛牛 | 国产成人精品一区二区在线| 国产麻豆免费观看| 久久一日本道色综合| 成人黄色片免费| 国产综合色区在线观看| 精品免费一区二区三区| 一级在线观看视频| 国产欧美成人| 97se国产在线视频| 狠狠色伊人亚洲综合网站l| 亚洲欧美日韩国产手机在线| 超碰网在线观看| 97久久亚洲| 精品国产美女在线| 精品欧美一区二区三区免费观看 | 波多野结衣视频播放| 久久网站免费观看| 日韩av不卡电影| 少妇一级淫片免费看| 一区在线中文字幕| 一级黄色香蕉视频| 日韩精品丝袜美腿| 欧美激情免费看| 99久久99久久久精品棕色圆| 欧美高清在线一区| 妞干网在线免费视频| 欧美精品中文| 久久久久中文字幕2018| 国产男男gay网站| 国产精品电影院| 91色国产在线| 精品精品99| 国产97在线|日韩| 青青国产在线| 疯狂欧美牲乱大交777| 99久久免费看精品国产一区| 国产精品二区影院| 不卡日韩av| 中文在线观看免费| 日韩一级视频免费观看在线| 黄色录像二级片| 蜜臀av性久久久久av蜜臀妖精| 欧美一区1区三区3区公司| 蜜桃麻豆av在线| 亚洲激情在线观看| 欧美精品亚洲精品日韩精品| 99麻豆久久久国产精品免费| 极品美女扒开粉嫩小泬| 欧美freesex8一10精品| 91国产一区在线| 亚洲av片一区二区三区| 欧美日韩精品中文字幕| 午夜一区二区三区免费| 国产精品日韩欧美一区| 蜜桃成人在线| 吞精囗交69激情欧美| 亚洲图片在线综合| 中文字幕在线观看视频一区| 中文字幕亚洲区| 污污网站在线观看视频| 欧美一区不卡| 国产精品一区二区免费看| 岛国av在线网站| 亚洲品质视频自拍网| 真实新婚偷拍xxxxx| 国产精品久久久久一区二区三区 | 无码人妻丰满熟妇区五十路百度| 综合亚洲自拍| 国产精品视频最多的网站| 日韩精品黄色| 日韩欧美第一区| www.国产高清| 中文字幕av一区 二区| 精品亚洲视频在线| 亚洲成人原创| 日韩久久久久久久| 国产精品一区二区美女视频免费看 | 亚洲av无码一区二区三区在线| 国产精品一品二品| 少妇人妻在线视频| 欧美日韩中字| 成人av影视在线| 中文字幕人成乱码在线观看 | 在线视频这里只有精品| 国产精品综合在线视频| 国产成人无码精品久久久性色| 精品一区二区三区中文字幕老牛| 91夜夜揉人人捏人人添红杏| 僵尸再翻生在线观看免费国语| 自拍偷拍免费精品| 欧美一区二区黄片| 欧美日韩国产系列| 九一国产在线观看| 亚洲欧美日韩电影| 色婷婷在线影院| 国产精品自拍在线| 欧美日韩亚洲一二三| 欧美欧美天天天天操| 日本一区二区三区四区高清视频 | 无码人妻精品一区二区蜜桃百度| 色婷婷综合久久久久久| 91沈先生在线观看| 香蕉成人av| 欧美激情精品久久久久久久变态| 成人免费高清在线播放| 精品国产免费一区二区三区香蕉| 中文字幕+乱码+中文乱码www| 午夜不卡av在线| 久久人妻无码aⅴ毛片a片app| xf在线a精品一区二区视频网站| 国产永久免费网站| 久久中文精品| 欧美 日韩 国产在线观看| 亚洲九九视频| 亚洲欧洲久久| 精品72久久久久中文字幕| 国产精品日韩一区二区三区| 成人免费观看49www在线观看| 国产精品av电影| 女人高潮被爽到呻吟在线观看| 欧美裸体男粗大视频在线观看| 91福利在线视频| 亚洲欧美成人精品| 亚洲av成人无码网天堂| 欧美mv日韩mv国产| 国产a级免费视频| 欧美日韩三级视频| 波多野结衣一本一道| 欧美性xxxxx极品娇小| 日本少妇激情视频| 亚洲一级二级在线| 久久久久久久蜜桃| 伊人色综合久久天天人手人婷| 人人澡人人澡人人看| 欧美高清在线一区| 色噜噜噜噜噜噜| 国产欧美日韩视频一区二区| 精品无人区无码乱码毛片国产| 99国内精品久久| 污污内射在线观看一区二区少妇| 色呦呦网站在线观看| 国产在线一区二区| 精品亚洲视频在线| 九九视频精品免费| www.51色.com| 国产美女精品人人做人人爽| 日本高清免费观看| 国产成人亚洲精品青草天美| 亚洲av综合色区无码另类小说| 国产一区二区三区蝌蚪| 精品人妻人人做人人爽夜夜爽| 国产一区在线观看视频| 黄色片子免费看| 粉嫩aⅴ一区二区三区四区| 中文字幕天堂网| 92国产精品观看| 国产人妻一区二区| 国产精品无人区| 免费看特级毛片| 亚洲尤物视频在线| 国产成年人免费视频| 富二代精品短视频| 瑟瑟视频在线免费观看| 91 com成人网| 动漫av一区二区三区| 亚洲第一页中文字幕| 日韩一二三四| 中文字幕综合在线| 婷婷色在线播放| 欧美一级黄色网| 福利精品一区| 97在线资源站| 日韩高清电影免费| 亚洲黄色成人久久久| 女人天堂亚洲aⅴ在线观看| av在线播放天堂| 日韩黄色小视频| 三级黄色片播放| 成人精品国产一区二区4080| v8888av| 成人免费一区二区三区在线观看 | 亚洲一区二区三区四区在线免费观看| 亚洲一区 视频| 在线免费观看不卡av| 国产www免费观看| 亚洲欧洲在线看| а√天堂在线官网| 日本成人激情视频| 久久综合给合| 欧美性大战久久久久| 91精品啪在线观看国产18| 无码专区aaaaaa免费视频| 免费看欧美美女黄的网站| 农村末发育av片一区二区| 久久精品一区二区| 免费一级全黄少妇性色生活片| 91九色02白丝porn| www.色视频| 中文字幕日韩欧美| 密臀av在线播放| 91久久偷偷做嫩草影院| 国产一区二区三区四区大秀| 男人j进女人j| 日av在线不卡| 大地资源二中文在线影视观看| 日韩一区有码在线| 伊人中文字幕在线观看| 欧美成人一级视频| 日本视频不卡| 国产999在线| 噜噜噜狠狠夜夜躁精品仙踪林| 中文网丁香综合网| 日韩激情一二三区| 中文字幕在线观看网址| 亚洲在线视频网站| 国产免费高清av| 深夜成人在线观看| 成人天堂yy6080亚洲高清| 久久国产精品久久| 欧美日韩国产探花| 午夜不卡福利视频| 国产精品视频免费| 国产性生活视频| 国产视频精品xxxx| 91九色美女在线视频| 91青青草免费观看| 亚洲九九视频| 91插插插影院| 国产精品久久久久精k8| 中文字幕日产av| 一区二区中文字幕| 88xx成人永久免费观看| 久久精品女人的天堂av| 亚洲经典在线看| 深田咏美中文字幕| 午夜精品一区二区三区三上悠亚| 国产高清免费观看| 久久综合国产精品台湾中文娱乐网| 91欧美精品| 亚洲一区二区三区精品在线观看| 美女脱光内衣内裤视频久久影院| 亚洲一区二区三区日韩| 日本韩国精品在线| 国产三级电影在线观看| 国产精品www色诱视频| 欧美综合视频| 九九九在线观看视频| 国产精品日产欧美久久久久| 亚洲网站免费观看| 精品久久久av| 欧美9999| 亚洲理论电影在线观看| 不卡影院免费观看| 五月天激情国产综合婷婷婷| 亚洲免费小视频| 亚洲电影有码| 亚洲一卡二卡三卡| 国内精品不卡在线| 国产在线一二区| 亚洲九九九在线观看| 456亚洲精品成人影院| 亚洲精品一区二区三区av| 国内成人免费视频| 国产乡下妇女做爰毛片| 日韩成人在线网站| 成人自拍视频网| 天天干天天色天天爽| 成人小视频免费观看| 久久国产视频一区| 色悠悠久久久久| 亚洲一区网址| 国模杨依粉嫩蝴蝶150p| 综合色天天鬼久久鬼色| 人妻精品无码一区二区| 日本最新高清不卡中文字幕| 日韩系列欧美系列| 欧美一级大片免费看| 精品欧美aⅴ在线网站| 国产福利小视频在线| 91亚洲一区精品| 国产日韩亚洲| 亚洲av无一区二区三区| 欧美精品一区二区不卡| 台湾成人免费视频| 成年女人18级毛片毛片免费| 国产欧美视频一区二区| 亚洲精品国产精品乱码不卡| 国产成人aa精品一区在线播放| 99精品综合| 国产精品无码网站| 欧美日韩国产一区二区三区地区| 欧美女同一区| 午夜精品美女久久久久av福利| 国产高清在线观看免费不卡| 五月婷婷激情视频| 欧美成aaa人片在线观看蜜臀| 一道在线中文一区二区三区| 久草福利在线观看| 欧美综合色免费|