彼此之間交換檔案的時候,會發生亂碼現象。
解決方法就是交換檔案之前,檔案提供者先將由內碼形式儲存的檔案,轉換成交換碼形式後再做交換。檔案接收者在接收檔案後,再由交換碼轉成內碼。
同樣,交換碼主要面對的使用者,是cpu、程式以及開發人員。
而外碼面對的使用者,則是非技術專業的普通使用者,比如拼音碼、注音碼等各種中文輸入法。
像英語這樣的表音文字,只有26個字母。處理起來相對簡單,內碼、交換碼、外碼三者相同即可;但像漢字這樣的表語文字就不行了。光是常用字就有好幾千,外碼方面,沒有鍵盤能夠容納得下,內碼方面也需要考慮儲存器容量的問題,這就客觀上給漢字的資訊化帶來了難度。
此外,資訊化編碼是非常考驗技巧的,說是一門藝術也不為過。
比如阿拉伯數字“0”到“9”的序號編碼為48到57,對應的十六進位制數字是30到39,只需一步簡單的邏輯操作,就可以在序號編碼和真實數字之間相互轉換。
再如英文大寫字母“a”的序號編碼為97,小寫字母“a”的序號編碼為65,相減的差是32,所有大小寫字母都是這個差距,這並非偶然,同樣只需一步簡單的邏輯操作,就可以在大小寫之間方便轉換。
繁體中文當中的異形字,也有類似英文大小寫來回轉換的需求,但異形字數目往往並非只有兩個那麼簡單。
顯然,漢字資訊化編碼除了技巧之外,還要考慮到中華文化自身的特性。
以前,朱邦復的研究是內碼、外碼一起抓,對於非技術人士來講,顯然難度太高,而在唐煥介入後,直接讓其把精力放在交換碼和外碼上,按照中�