iso8859和gbk，iso8859轉換成gbk

中證集團ISO認證 2023-03-30 07:43

【摘要】小編為您整理GB和GBK的區(qū)別、文本ansi和gbk編碼有什么區(qū)別、文本ansi和gbk編碼有什么區(qū)別、gbk編碼是什么、什么是GBK字庫相關iso體系認證知識，詳情可查看下方正文！

GB 和 GBK 的區(qū)別？

簡單的說就是GB可以輸出簡體中文,GBK則可以輸出簡/繁體中文!
一、GB字庫：全稱GB2312或GB2312-80是一個簡體中文字符集的中國國家標準，全稱為《信息交換用漢字編碼字符集--基本集》，由中國國家標準總局發(fā)布，1981年5月1日實施。GB2312編碼通行于大陸；新加坡等地也采用此編碼。幾乎所有的中文系統(tǒng)和國際化的軟件都支持GB2312。GB2312標準共收錄6763個漢字， GB2312中對所收漢字進行了“分區(qū)”處理，每區(qū)含有94個漢字/符號。這種表示方式也稱為區(qū)位碼。01-09區(qū)為特殊符號。16-55區(qū)為一級漢字共有漢字3755個，按拼音排序；56-87區(qū)為二級漢字共有漢字3008個，按部首/筆畫排序；10-15區(qū)及88-94區(qū)則未有編碼。
二、GBK字庫：GBK全名為漢字內碼擴展規(guī)范，英文名Chinese Internal Code Specification。K 即是“擴展”所對應的漢語拼音（KuoZhan）中“擴”字的聲母。 1993年，Unicode
1.1版本推出，收錄了中國大陸、臺灣、日本及韓國通用字符集的漢字，總共有20,912個。中國大陸訂定了等同于Unicode
1.1版本的“GB13000.1-93”“信息技術 通用多八位編碼字符集（UCS）第一部分：體系結構與基本多文種平面”。由于GB2312-80只收錄了6763個漢字，有不少漢字，如部分于GB2312-80推出后才簡化的漢字（如“啰”），部分人名用字（如中國前總理朱镕基的“镕”字），臺灣及香港使用的繁體字，日語及朝鮮語漢字等，并未有收錄在內。中國大陸于是利用了GB2312-80未有使用的編碼空間，收錄了所有出現(xiàn)于Unicode
1.1及GB13000.1-93之中的漢字，制定了GBK編碼。微軟在它出品的Windows 98中，即采用了GBK編碼。在微軟的系統(tǒng)內稱為CP936字碼表。

關于GB與BIG5碼的判別，沒有100%可靠的方法。但是從兩個編碼系統(tǒng)漢字的分布來看，還有可以作一定的判斷的。GB碼的編碼范圍是首字節(jié)A1-F7，尾字節(jié)A1-FE，而且首字節(jié)A1-A9是符號區(qū)，AA-AF這一段沒有定義。BIG5碼的編碼范圍是首字節(jié)A1-F9，尾字節(jié)分兩段，分別是40-7E及A1-FE，首字節(jié)A1-A3是符號區(qū)，A4-C5是常用漢字區(qū)。這樣我們可以找到幾個依據：1)尾字節(jié)40-7E是BIG5碼特有的，可以以此來判別，但是現(xiàn)在GBK在這個碼區(qū)也定義了字符，不過這些漢字的使用頻度不高，所以仍然可以作為一條依據，但無法保證100%正確；2)首字節(jié)A4-A9在GB中為日文假名、希臘字母、俄文字母和制表符，正常文本中很少出現(xiàn)，AA-AF則根本沒有定義，但這個范圍卻是BIG5碼的常用漢字，所以如果文本中頻繁出現(xiàn)這個范圍的碼，也可以認為是BIG5碼。尤其是首字節(jié)位于AA-AF之間，尾字節(jié)位于A1-FE的，幾乎100%是BIG5碼無疑，因為即使在GBK中，這個范圍也是沒有定義的。為了提高識別的正確率，最好多種判據同時使用。另外還可以通過分析漢字出現(xiàn)的頻率，或查找某些常用的詞組來判別。因為做起來比較復雜，就不多說了。首字節(jié)C6-D7，尾字節(jié)A1-FE在GB中屬于一級字庫，是常用漢字，而在BIG5中,C6-C7沒有明確定義，但通常用來放日文假名和序號，C8-D7屬于罕用漢字區(qū)。所以如果這個范圍的碼出現(xiàn)較多，可以判別為GB碼。

問題不是很清楚呀，麻煩說清楚點。

文本ansi和gbk編碼有什么區(qū)別？

不知道你具體啥意思還有ISO國際標準化組織經常發(fā)布標準，被稱作ISO標準。編碼？純文本的編碼標準： ANSI GBK、Unicode、Unicode big endian和UTF-8這幾種編碼 UTF-3
2、UTF-16和UTF-8 UCS2 中國常用GBK 和gb2312 國際化最好的是utf8

文本ansi和gbk編碼有什么區(qū)別？

gbk編碼是什么？

GBK即漢字內碼擴展規(guī)范，英文名稱為Chinese Internal Code Specification。GBK的相關縮寫：
1、原gb2312 HTML編碼標簽代碼如下：；
2、可以縮寫為或；
3、縮寫兼容性：所有瀏覽器均兼容，無論新舊版本IE還是不同品牌瀏覽器均兼容。至于GBK編碼簡寫時候編碼填寫為gb2312還是填寫為gbk，DIVCSS認為沒有什么區(qū)別，均可。為了符合大家都使用gbk字符編碼，大家可以寫為“gb2312”。擴展資料：GBK的特點：GBK編碼是GB2312編碼的超集，向下完全兼容GB2312。GB18030編碼向下兼容GBK和GB2312。GBK、GB2312等與UTF8之間都必須通過Unicode編碼才能相互轉換。GBK,GB2312以及Unicode都既是字符集，也是編碼方式，而UTF-8只是編碼方式，并不是字符集。參考資料來源：

GBK編碼，是對GB2312編碼的擴展，因此完全兼容GB2312-80標準。GBK編碼依然采用雙字節(jié)編碼方案，其編碼范圍：8140－FEFE（高字節(jié)從81到FE，低字節(jié)從40到FE），剔除xx7F碼位，共23940個碼位。GBK編碼共收錄漢字和圖形符號21886個，其中漢字（包括部首和構件）21003個，圖形符號883個。GBK編碼支持國際標準ISO/IEC10646-1和國家標準GB13000-1中的全部中日韓漢字，并包含了BIG5編碼中的所有漢字。GBK編碼方案于1995年12月15日正式發(fā)布，這一版的GBK規(guī)范為
1.0版。擴展資料：全部編碼分為三大部分：
1、漢字區(qū)。包括：a. GB 2312 漢字區(qū)。即 GBK/2: B0A1-F7FE。收錄 GB 2312 漢字 6763 個，按原順序排列。b. GB 13000.1 擴充漢字區(qū)。包括：(1)、 GBK/3: 8140-A0FE。收錄 GB 13000.1 中的 CJK 漢字 6080 個。(2) 、GBK/4: AA40-FEA0。收錄 CJK 漢字和增補的漢字 8160 個。CJK 漢字在前，按 UCS 代碼大小排列；增補的漢字（包括部首和構件）在后，按《康熙字典》的頁碼/字位排列。(3) 、漢字“〇”安排在圖形符號區(qū)GBK/5：A996。
2、圖形符號區(qū)。包括：a. GB 2312 非漢字符號區(qū)。即 GBK/1: A1A1-A9FE。其中除 GB 2312 的符號外，還有 10 個小寫羅馬數字和 GB 12345 增補的符號。計符號 717 個。b. GB 13000.1 擴充非漢字區(qū)。即 GBK/5: A840-A9A0。BIG-5 非漢字符號、結構符和“〇”排列在此區(qū)。計符號 166 個。
3、用戶自定義區(qū)：分為(1)(2)(3)三個小區(qū)。(1)、 AAA1-AFFE，碼位 564 個。(2) 、F8A1-FEFE，碼位 658 個。(3) 、A140-A7A0，碼位 672 個。第(3)區(qū)盡管對用戶開放，但限制使用，因為不排除未來在此區(qū)域增補新字符的可能性。

什么是GBK字庫？

GBK是系統(tǒng)的一種字符編碼，通常是在國內使用的，能夠完善支持簡體中文，但是如果在國外的瀏覽器上則會出現(xiàn)亂碼的現(xiàn)象，國外一般使用UTF8，它的通用性比較好，幾乎全球通用。關于GBK、GIF
5、和UTF-8這些編碼，詳細可以到我這里看一下。

GBK編碼，是在GB2312-80標準基礎上的內碼擴展規(guī)范，使用了雙字節(jié)編碼方案，其編碼范圍從8140至FEFE（剔除xx7F），共23940個碼位，共收錄了21003個漢字，完全兼容GB2312-80標準，支持國際標準ISO/IEC10646-1和國家標準GB13000-1中的全部中日韓漢字，并包含了BIG5編碼中的所有漢字。GBK編碼方案于1995年10月制定， 1995年12月正式發(fā)布，目前中文版的WIN9
5、WIN9
8、WINDOWS NT以及WINDOWS 2000、WINDOWS XP等都支持GBK編碼方案。