utf 8和gb2312有什麼區別啊

時間 2021-09-07 06:11:34

1樓:

不同的編碼。

各個國家和地區所制定的不同 ansi 編碼標準中,都只規定了各自語言所需的「字元」。比如:漢字標準(gb2312)中沒有規定南韓語字元怎樣儲存。

這些 ansi 編碼標準所規定的內容包含兩層含義:

1. 使用哪些字元。也就是說哪些漢字,字母和符號會被收入標準中。所包含「字元」的集合就叫做「字符集」。

2. 規定每個「字元」分別用乙個位元組還是多個位元組儲存,用哪些位元組來儲存,這個規定就叫做「編碼」。

各個國家和地區在制定編碼標準的時候,「字元的集合」和「編碼」一般都是同時制定的。因此,平常我們所說的「字符集」,比如:gb2312, gbk, jis 等,除了有「字元的集合」這層含義外,同時也包含了「編碼」的含義。

「unicode 字符集」包含了各種語言中使用到的所有「字元」。用來給 unicode 字符集編碼的標準有很多種,比如:utf-8, utf-7, utf-16, unicodelittle, unicodebig 等。

1、iso-8859-1:

最簡單的編碼規則,每乙個位元組直接作為乙個 unicode 字元。比如,[0xd6, 0xd0] 這兩個位元組,通過 iso-8859-1 轉化為字串時,將直接得到 [0x00d6, 0x00d0] 兩個 unicode 字元,即 "öð"。

反之,將 unicode 字串通過 iso-8859-1 轉化為位元組串時,只能正常轉化 0~255 範圍的字元。

2、gb2312,big5,shift_jis,iso-8859-2

把 unicode 字串通過 ansi 編碼轉化為「位元組串」時,根據各自編碼的規定,乙個 unicode 字元可能轉化成乙個位元組或多個位元組。

反之,將位元組串轉化成字串時,也可能多個位元組轉化成乙個字元。比如,[0xd6, 0xd0] 這兩個位元組,通過 gb2312 轉化為字串時,將得到 [0x4e2d] 乙個字元,即 '中' 字。

「ansi 編碼」的特點:

1. 這些「ansi 編碼標準」都只能處理各自語言範圍之內的 unicode 字元。

2. 「unicode 字元」與「轉換出來的位元組」之間的關係是人為規定的。

3、utf-8,utf-16,unicodebig

與「ansi 編碼」類似的,把字串通過 unicode 編碼轉化成「位元組串」時,乙個 unicode 字元可能轉化成乙個位元組或多個位元組。

與「ansi 編碼」不同的是:

1. 這些「unicode 編碼」能夠處理所有的 unicode 字元。

2. 「unicode 字元」與「轉換出來的位元組」之間是可以通過計算得到的。

2樓:範恕節風

只修改charset是不夠的,你還要把檔案重新儲存為對應的編碼才可以

utf-8和gb2312的區別,簡單點說,utf-8是用三個位元組來儲存乙個漢字,而gb2312是用兩個位元組儲存乙個漢字.

用記事本開啟你要轉換的檔案,修改charset,然後另存為,在另存為對話方塊下面編碼處選ansi即可.

3樓:碧思思**導航

是兩種不同的編碼,我們的導航**上面有哦。。。

utf-8 gbk utf8 gb2312 unicode 之間的區別和關係

4樓:匿名使用者

一、主體不同

1、utf-8 gbk :中華人民共和國全國資訊科技標準化技術委員會2023年12月1日制訂,國家技術監督局標準化司、電子工業部科技與質量監督司2023年12月15日聯合以技監標函1995 229號檔案的形式。

2、utf8 gb2312: 是基於 1980 年發布的《資訊交換用漢字編碼字符集基本集》,是中文資訊處理的中國國家標準,是強制執行的中文編碼。

二、特點不同

1、utf-8 gbk :向下與 gb 2312 編碼相容,向上支援 iso 10646.1國際標準,是前者向後者過渡過程中的乙個承上啟下的產物。

2、utf8 gb2312:共收錄 6763 個簡體漢字、682 個符號,其中漢字部分:一級字 3755 個,以拼音排序,二級字 3008 個,以偏旁部首排序。

該標準的制定和應用為規範、推動中文資訊化程序起了很大作用。

三、位元組數不同

1、utf-8 gbk :是在gb2312-80標準基礎上的內碼擴充套件規範,使用了雙位元組編碼方案,其編碼範圍從8140至fefe(剔除xx7f),共23940個碼位,共收錄了21003個漢字,完全相容gb2312-80標準。

2、utf8 gb2312:標準涵蓋了單位元組、雙位元組、四位元組的字元和漢字,共計約 28,000 多個。

5樓:騎毛驢闖紅燈

搞定ascii、ansi、gbk、unicode、utf-8

6樓:匿名使用者

標記收藏,望樓主理解

仿宋和仿宋 gb2312有什麼區別

for鮑小丹 都是宋體,字型有一點不同。仿宋是乙個大類,仿宋gb 2312是其中的一類。仿宋是字型名稱,而gb2312是字元編碼名稱,它是簡體中文編碼的一種,簡體中文自1980年代以來通常使用中華人民共和國國家標準總局公布的gb 2312,以及其後繼的gbk和gb 18030中文編碼。所以通常說的仿...

仿宋和仿宋 gb2312有什麼區別?我的裡面只有仿宋

戀著多喜歡 1.仿宋 包含的漢字數量要比 仿宋gb2312 包含的漢字數量多得多。2.使用 仿宋 字型可以顯示很多生僻的字,比如犇 犇 猋 驫 麤等。仿宋gb2312 只能 顯示為宋體 黑體等其他字型。3.仿宋 字型因為出現的較晚,字型形態經過優化,比 仿宋gb2312 字型更纖細 字跡更清 晰,特...

8K電視是什麼電視?電視4k和8k有什麼區別

8k電視是可以 8k電影資源的電視,他的解析度很高的但是8k電視 很貴,不建議購買8k電視,現在4k都還沒有普及就不要考慮了,8k片源都找不到,電視4k和8k有什麼區別 什麼是8k電視 8k電視是指它的解析度為7680 4320的電視,目前各大家電賣場還沒看到有相關的產品在售,在4k節目源還嚴重不足...