① ASCII編碼和漢字編碼的關系
一、ASCII碼1、什麼叫ASCII碼?計算機中用二進制數表示字母、數字、符號以及控制符號,目前主要用ASCII碼(美國標准信息交換碼的縮寫)。1)常用字元有128個,編碼從0到127。2)控制字元:0~31、127,共33個,不可顯示;3)普通字元:95個,包括10個阿拉伯數字、52個英文大小寫字母、33個運算符。4)每個字元佔一個位元組,7位,最高位為0。 常見ASCII碼的大小規則,0-9<A-Z<a-z:1)數字比字母要小。如 「7」<「F」2)數字0比數字9要小,並按0到9順序遞增。如 「3」<「8」3)字母A比字母Z要小,並按A到Z順序遞增。如「A」<「Z」4)同個字母的大寫字母比小寫字母要小32。如「A」<「a」記住幾個常見字母的ASCII碼大小:「A」為65;「a」為97;「0」為48;2、ASCII碼表如下:字元范圍十六進制十進制空格20H320~930H~39H48~57A~Z41H~5AH65~90a~z61H~7AH97~122二、漢字編碼1、漢字編碼分類漢字在不同的處理階段有不同的編碼。(1)漢字的輸入:輸入碼(2)漢字的機內表示:機內碼(3)漢字的輸出:字形碼(字型檔 Font)
輸入碼
國標碼
機內碼
輸出碼
各種編碼之間的關系: 2、漢字的機內表示:機內碼計算機在信息處理時表示漢字的編碼,稱作機內碼。現在我國都用國標碼(GB2312)作為機內碼,GB2312-80規定了:(1)一個漢字由兩個位元組組成,為了與ASCII碼區別,最高位均為「1」。(2)漢字6763個:一級漢字3755個,按漢字拼音字母順序排列;二級漢字3008個,按部首筆畫漢字排列。(3)漢字分區:94行(區),94列(位)(區位碼) 3、漢字的輸入:漢字輸入碼(1)數字碼(或流水碼)如:電報碼、區位碼、縱橫碼優點:無重碼,不僅能對漢字編碼,還能對各種字母、數字元號進行編碼。缺點:是人為規定的編碼,屬於無理碼,只能作為專業人員使用。(2)字音碼如:全拼、雙拼、微軟拼音優點:簡單易學。缺點:漢字同音多,所以重碼很多,輸入漢字時要選字。(3)字形碼如:五筆字型、表形碼、大眾碼、四角碼優點:見字識碼,一般重碼率較低,經強化訓練後可實現盲打。 缺點:拆字法沒有統一的國家標准,拆字難,編碼規則繁,記憶量大。(4)音形碼如:聲形、自然碼、錢碼 優點:利用音碼的易學性和形碼可有效減少重碼。缺點:既要考慮字音,又要考慮字形,比較麻煩。4、漢字的輸出:字形碼(字型檔 Font)(1)點陣字形A)16?16、24×24、48×48B)每一個點在存儲器中用一個二進制位(bit)存儲,所以一個16×16點陣漢字需要32(16×16/8=32)個位元組存儲空間。(2)輪廓字形把漢字筆畫的輪廓用一組直線和曲線勾畫,記錄的是這些幾何形狀之間的關系,精度高,Windows的TrueType字型檔採用此法。5、區位碼、國標碼與機內碼的轉換關系方法(1)區位碼先轉換成十六進制數表示(2)(區位碼的十六進製表示)+2020H=國標碼;(3)國標碼+8080H=機內碼舉例:以漢字「大」為例,「大」字的區內碼為2083解:1、區號為20,位號為832、將區20,位號83分別轉換為十六進製表示為1453H3、1453H+2020H=3473H,得到國標碼3473H4、3473H+8080H=B4F3H,得到機內碼為B4F3H來源:◆網界網論壇◆
② 簡答一個中文漢字的外碼、國標碼、機內碼、字形碼之間的關系
簡答一個中文漢字的外碼、國標碼、機內碼、字形碼之間的關系。這個具體的關系不是很了解。