查詢

為什麼計算機能輸入漢字?

計算機的資料全部採用二進位制數來表示。當我們輸入數字、字母以及各種符號的時候,電腦並非直接識別它們的,而是先把它們變成二進位制數碼,然後才能對它們進行處理。因此,人們必須首先按一定的規則編碼,使每個符號或字元對應一個二進位制數。編碼的方法有各種各樣,為了統一起見需要標準的編碼。當今,國際上採用的是ASCⅡ碼。在輸入符號時,資訊經過部件變為相應的ASCⅡ二進位制碼,然後才輸入主機。在輸出資訊(如在顯示器上顯示)時,由主機處理後再將二進位制程式碼轉換成與之相應字元或符號輸出。這種過程簡直是把電報碼翻譯成報文的過程。


那么,漢字編碼又是如何的呢?漢字與西文的特點是有區別的。英文是表音文字,由字母組成單詞,而漢字是表意文字,每個字是由基本筆劃經過排列組合而成,字形變式多樣,所以,漢字只能作為字元資訊來處理,這就需要由程式碼系統來表示。


根據ASCⅡ碼,我國已經研製出了幾百種漢字編碼,可以歸結為字形、字音和音形結合的輸入碼。不同的輸入碼可以找到同一個漢字,這是由於它們都參照一個標準,輸入碼都參照了這個漢字“內碼”。目前,大陸用的標準內碼是GB碼,而臺灣通用的是BIG5碼,這就是我們上臺灣的網站上看到怪字元的緣故了。


漢字的內碼與ASCⅡ碼不同,一個ASCⅡ構成西文字元,一個字元佔一個位元組,而一個位元組是二進位制的8倍,而兩個位元組構成一個漢字字元。


漢字顯示不僅需要內碼,而且還需要漢字字形碼。字形碼由點形成,點構成了圖形,以二進位制的形式輸入於字型檔中。利用漢字的機內碼找到字形碼的地址,根據字形碼就能把字清楚地顯示在螢幕上了,用印表機也要用到字形碼。


漢字比英文的輸入要快得多,這對於一度吹捧漢字落後於資訊時代的人來說,是一個十分有力的打擊。

補充糾錯