iso8859和gbk,iso8859轉換成gbk

中證集團ISO認證 2023-03-30 07:43
【摘要】小編為您整理GB和GBK的區(qū)別、文本ansi和gbk編碼有什么區(qū)別、文本ansi和gbk編碼有什么區(qū)別、gbk編碼是什么、什么是GBK字庫相關iso體系認證知識,詳情可查看下方正文!

GB 和 GBK 的區(qū)別?

簡單的說就是GB可以輸出簡體中文,GBK則可以輸出簡/繁體中文!
一、GB字庫:全稱GB2312或GB2312-80是一個簡體中文字符集的中國國家標準,全稱為《信息交換用漢字編碼字符集--基本集》,由中國國家標準總局 發(fā)布,1981年5月1日實施。GB2312編碼通行于大陸;新加坡等地也采用此編碼。幾乎所有的中文系統(tǒng)和國際化的軟件都支持GB2312。GB2312標準共收錄6763個漢字, GB2312中對所收漢字進行了“分區(qū)”處理,每區(qū)含有94個漢字/符號。這種表示方式也稱為區(qū)位碼。01-09區(qū)為特殊符號。16-55區(qū)為一級漢字共有漢字3755個,按拼音排序;56-87區(qū)為二級漢字共有漢字3008個,按部首/筆畫排序;10-15區(qū)及88-94區(qū)則未有編碼。
二、GBK字庫:GBK全名為漢字內碼擴展規(guī)范,英文名Chinese Internal Code Specification。K 即是“擴展”所對應的漢語拼音(KuoZhan)中“擴”字的聲母。 1993年,Unicode
1.1版本推出,收錄了中國大陸、臺灣、日本及韓國通用字符集的漢字,總共有20,912個。中國大陸訂定了等同于Unicode
1.1版本的“GB13000.1-93”“信息技術 通用多八位編碼字符集(UCS) 第一部分:體系結構與基本多文種平面”。由于GB2312-80只收錄了6763個漢字,有不少漢字,如部分于GB2312-80推出后才簡化的漢字(如“啰”),部分人名用字(如中國前總理朱镕基的“镕”字),臺灣及香港使用的繁體字,日語及朝鮮語漢字等,并未有收錄在內。 中國大陸于是利用了GB2312-80未有使用的編碼空間,收錄了所有出現(xiàn)于Unicode
1.1及GB13000.1-93之中的漢字,制定了GBK編碼。微軟在它出品的Windows 98中,即采用了GBK編碼。在微軟的系統(tǒng)內稱為CP936字碼表。

關于GB與BIG5碼的判別,沒有100%可靠的方法。但是從兩個編碼系統(tǒng)漢字的分布來看,還有可以作一定的判斷的。GB碼的編碼范圍是首字節(jié)A1-F7,尾字節(jié)A1-FE,而且首字節(jié)A1-A9是符號區(qū),AA-AF這一段沒有定義。BIG5碼的編碼范圍是首字節(jié)A1-F9,尾字節(jié)分兩段,分別是40-7E及A1-FE,首字節(jié)A1-A3是符號區(qū),A4-C5是常用漢字區(qū)。這樣我們可以找到幾個依據:1)尾字節(jié)40-7E是BIG5碼特有的,可以以此來判別,但是現(xiàn)在GBK在這個碼區(qū)也定義了字符,不過這些漢字的使用頻度不高,所以仍然可以作為一條依據,但無法保證100%正確;2)首字節(jié)A4-A9在GB中為日文假名、希臘字母、俄文字母和制表符,正常文本中很少出現(xiàn),AA-AF則根本沒有定義,但這個范圍卻是BIG5碼的常用漢字,所以如果文本中頻繁出現(xiàn)這個范圍的碼,也可以認為是BIG5碼。尤其是首字節(jié)位于AA-AF之間,尾字節(jié)位于A1-FE的,幾乎100%是BIG5碼無疑,因為即使在GBK中,這個范圍也是沒有定義的。為了提高識別的正確率,最好多種判據同時使用。另外還可以通過分析漢字出現(xiàn)的頻率,或查找某些常用的詞組來判別。因為做起來比較復雜,就不多說了。首字節(jié)C6-D7,尾字節(jié)A1-FE在GB中屬于一級字庫,是常用漢字,而在BIG5中,C6-C7沒有明確定義,但通常用來放日文假名和序號,C8-D7屬于罕用漢字區(qū)。所以如果這個范圍的碼出現(xiàn)較多,可以判別為GB碼。

問題不是很清楚呀,麻煩說清楚點。


文本ansi和gbk編碼有什么區(qū)別?

不知道你具體啥意思 還有ISO國際標準化組織經常發(fā)布標準,被稱作ISO標準。 編碼?純文本的編碼標準: ANSI GBK、Unicode、Unicode big endian和UTF-8這幾種編碼 UTF-3
2、UTF-16和UTF-8 UCS2 中國常用GBK 和gb2312 國際化最好的是utf8


文本ansi和gbk編碼有什么區(qū)別?

不知道你具體啥意思 還有ISO國際標準化組織經常發(fā)布標準,被稱作ISO標準。 編碼?純文本的編碼標準: ANSI GBK、Unicode、Unicode big endian和UTF-8這幾種編碼 UTF-3
2、UTF-16和UTF-8 UCS2 中國常用GBK 和gb2312 國際化最好的是utf8


gbk編碼是什么?

GBK即漢字內碼擴展規(guī)范,英文名稱為Chinese Internal Code Specification。GBK的相關縮寫:
1、原gb2312 HTML編碼標簽代碼如下:;
2、可以縮寫為或;
3、縮寫兼容性:所有瀏覽器均兼容,無論新舊版本IE還是不同品牌瀏覽器均兼容。至于GBK編碼簡寫時候編碼填寫為gb2312還是填寫為gbk,DIVCSS認為沒有什么區(qū)別,均可。為了符合大家都使用gbk字符編碼,大家可以寫為“gb2312”。擴展資料:GBK的特點:GBK編碼是GB2312編碼的超集,向下完全兼容GB2312。GB18030編碼向下兼容GBK和GB2312。GBK、GB2312等與UTF8之間都必須通過Unicode編碼才能相互轉換。GBK,GB2312以及Unicode都既是字符集,也是編碼方式,而UTF-8只是編碼方式,并不是字符集。參考資料來源:

GBK編碼,是對GB2312編碼的擴展,因此完全兼容GB2312-80標準。GBK編碼依然采用雙字節(jié)編碼方案,其編碼范圍:8140-FEFE(高字節(jié)從81到FE,低字節(jié)從40到FE),剔除xx7F碼位,共23940個碼位。GBK編碼共收錄漢字和圖形符號21886個,其中漢字(包括部首和構件)21003個,圖形符號883個。GBK編碼支持國際標準ISO/IEC10646-1和國家標準GB13000-1中的全部中日韓漢字,并包含了BIG5編碼中的所有漢字。GBK編碼方案于1995年12月15日正式發(fā)布,這一版的GBK規(guī)范為
1.0版。擴展資料:全部編碼分為三大部分:
1、漢字區(qū)。包括:a. GB 2312 漢字區(qū)。即 GBK/2: B0A1-F7FE。收錄 GB 2312 漢字 6763 個,按原順序排列。b. GB 13000.1 擴充漢字區(qū)。包括:(1)、 GBK/3: 8140-A0FE。收錄 GB 13000.1 中的 CJK 漢字 6080 個。(2) 、GBK/4: AA40-FEA0。收錄 CJK 漢字和增補的漢字 8160 個。CJK 漢字在前,按 UCS 代碼大小排列;增補的漢字(包括部首和構件)在后,按《康熙字典》的頁碼/字位排列。(3) 、漢字“〇”安排在圖形符號區(qū)GBK/5:A996。
2、圖形符號區(qū)。包括:a. GB 2312 非漢字符號區(qū)。即 GBK/1: A1A1-A9FE。其中除 GB 2312 的符號外,還有 10 個小寫羅馬數字和 GB 12345 增補的符號。計符號 717 個。b. GB 13000.1 擴充非漢字區(qū)。即 GBK/5: A840-A9A0。BIG-5 非漢字符號、結構符和“〇”排列在此區(qū)。計符號 166 個。
3、 用戶自定義區(qū):分為(1)(2)(3)三個小區(qū)。(1)、 AAA1-AFFE,碼位 564 個。(2) 、F8A1-FEFE,碼位 658 個。(3) 、A140-A7A0,碼位 672 個。第(3)區(qū)盡管對用戶開放,但限制使用,因為不排除未來在此區(qū)域增補新字符的可能性。


什么是GBK字庫?

GBK是系統(tǒng)的一種字符編碼,通常是在國內使用的,能夠完善支持簡體中文,但是如果在國外的瀏覽器上則會出現(xiàn)亂碼的現(xiàn)象,國外一般使用UTF8,它的通用性比較好,幾乎全球通用。關于GBK、GIF
5、和UTF-8這些編碼,詳細可以到我這里看一下。

GBK編碼,是在GB2312-80標準基礎上的內碼擴展規(guī)范,使用了雙字節(jié)編碼方案,其編碼范圍從8140至FEFE(剔除xx7F),共23940個碼位,共收錄了21003個漢字,完全兼容GB2312-80標準,支持國際標準ISO/IEC10646-1和國家標準GB13000-1中的全部中日韓漢字,并包含了BIG5編碼中的所有漢字。GBK編碼方案于1995年10月制定, 1995年12月正式發(fā)布,目前中文版的WIN9
5、WIN9
8、WINDOWS NT以及WINDOWS 2000、WINDOWS XP等都支持GBK編碼方案。


上一篇 :麗江iso14001認證公司,麗江iso14001 認證公司

下一篇:儀征iso9001認證機構周期多長,儀征iso27001認證機構周期多長