查看: 355|回复: 0
|
有關辭輸入的迷思--從如何選用輸入法看
[复制链接]
|
|
本帖最后由 lunglung 于 24-7-2020 11:21 PM 编辑
在鍵盤打字取代了筆寫後,中文輸入是一個嚴肅的課題。筆寫(不論毛筆或圓珠筆)要求以技巧將墨塗在紙上使字體工整地顯現,打字要求如何利用鍵盤按鍵拼湊出字的輸入碼以利電腦取字型數據來顯示或打印。兩者要求雖有不同,但共同目的是一樣--用工具把要代表我們意思的字/符表示出來。它不是單純的科技,科技祇涉及輸入碼對應字/符及取字型數據;它是文化議題--能正確得到我們要的字/符使要表達的意思充份明確地表示出來。發明中文電腦的臺灣朱邦復先生便直接指出,中文電腦不光是科技而是文化。西元一九七九,在宏碁技術團隊和資金支持下,朱邦復發明了世界第一部商用、上市的中文電腦(天龍中文電腦),其中文系統名倉頡系統,所附倉頡輸入法提供用戶直接輸入中文。朱先生並於西元一九八三年登報放棄倉頡輸入法專利,讓全球華人共同享用這一世紀偉大發明(如沒有這一中文電腦化的發明,今天我們要用任何電腦、上網、手機等三伺3C,就祗能先學好英文再算了。當然,你也可以如印尼華人,直接用巫文。總之,凡直接用挨屄吸字母的,都可做到,祗是你必先犧牲你自己的中華文漢字,把它扔到一旁。即是,如大陸在早期所走的路--文字改革(此路,今日仍有些沉迷其中而不能自拔者還在努力中,動不動藉機批評中華文漢字的不是),改用英文字母挨屄吸來拼中文字之音得漢語,即今之漢語拼音,升級作爲拉丁化中文來使用。當然,從此中華文漢字就得消失在歷史的時空之中。
可見,好的輸入法實關係到華文的傳承和廣播的品質;若品質極端低劣,甚至會成爲無以爲繼的生死關頭。
《有關辭輸入的迷思(從如何選輸入法看快打迷思的辭輸入》--選輸入法的特性優先順序
有人讚揚辭輸入,說是比單字輸入(逐字輸入)理想,重點是強調「快」。工商時代,一般人聽說「快」,便認爲「好、利、便」。
這是有關輸入法的理念需求。從整體上思量,應由文化角度來看,文字是文化的基石,不是單純的物質工具,不能光是以工商經濟的「快」來看事情。
選擇輸入法應秉持如下理念,依序應爲:
首重要:
1. 不要電腦病。諸如認字退化(網上同音錯字最大宗)、提筆忘字(百分九五北京民眾患此文化症)等副作用,這尤其是音碼的最大弊病。
2. 全漢字。全部有史十萬多漢字都可輸入。有見英文,會有某些單字word(不管多麼生癖罕用)不能打的?
3. 易得。全球電腦三伺3C都備有(內建或有軟體供安裝,以內建爲優因不受系統升版影響,不必也跟著升版,這有關系統安定性),而且還有網上輸入法。去到哪兒都有機器可用。不需顧慮可攜性。
4. 無重碼/排序(無或極低重碼,不祗有利提速效率,更可使中文有序可排,可如英文般直接憑目視排序,有利檢索)。
5. 祗使用廿六文字鍵,不使用數符鍵,免中文/數符切換。這樣,標點符號可直接輸入。
6. 字根以形、義歸類組。注重字形特徵,可掌握字的結構部件,有利記憶及字源了解。並有助學字認字記字,尤對小兒/外人學中文有助。在傳承及傳播中華文化上有利。
次重要:
7. 字根(組員)及字碼(組長,對應鍵)不借用英文字母,能不靠英文而可自己完成認知機制。
8. 免費。內建的內含於系統內最好,免因版本、繳費逾期等等不必要問題。
9. 易學。規則少和字根少不畸型。鄭碼講求字根設計時之條理,名爲科學。但打字按鈕在瞬間,又誰理字根設計之層層級級?
10. 易記。規則簡易,不能太多(更不要暗規則)。尤其,字根不要有畸怪形狀,跟常見部件不合,不便於記憶。如行列有<徵-壬攵><重-田><酉-一>等字根、五筆有<亞-二><齊-丿二丨><魚-灬>等字根、鄭碼有<婁-女><巠-工><爭-爫><黑-土灬>等字根....
11. 難忘。字根數應以100爲限,不應超越太多,這是研究指出人的記憶對一事項的元素量記憶能力上限。
12. 易用。規則簡易。直接依結構有固定格式,或所謂筆順。有款名鄭碼的,有「次末根」(取末根之前一根),實在令人操作起來思路很不直接,常令打結。五筆有末笔字型识別码,爲判別異結構而同碼者(如暈暉)及作清空一碼至三碼空間作簡碼來提速的手段,在操作上令人很不順暢。
13.網上有眾多網站提供輸入碼查詢
14.設置彈性高。軟入法軟體提供,可自行設置及修改(單字)簡碼、辭庫、聯想、自動/人工調字頻、調字集等。
15.繁簡不拘。基本工具完整性及現實,不論簡化、正體(繁),甚至日、韓、越自製仿漢字,都來者不拘,可以應付。也能專設打繁出簡,或打簡出繁。
16.支援軟鍵盤,方便各種特殊符號輸入(也可以設置辭庫方式應付)。
第三重要
17. 不需另行鍵盤標示字碼(熟悉字根表後也不必要)
18. 網上有豐富學習軟體或網站等資源。
以上,倉頡比起任何一種其他輸入法,絶對有優勢。還有一點,是其他任何輸入法所沒有的是,倉頡目標要一舉完成中文處理的六大功能(字碼、字序、字形、字辨、字音、字義),配合漢字基因工程,由單純中文輸入法的「中文電腦化」階層,進入到要讓「中文電腦中文化」甚至「中文電腦智能化」,給電腦「懂、了解」中文。其他專講輸入的輸入法,就單純是輸入,要求快,但不再思及對字的字形筆劃的整體學習認辨記憶寫打識,尤其使用儘量少的碼以代表儘量多的字(如辭輸入)或不斷找選(如音碼)。
最後纔是講快。--談談簡碼(單字)和辭輸入
鍵盤打字,本來就快。人的思緒,在鍵盤打字代替筆寫後,人思緒要表達出來還需經一定的整理,纔能見諸文字或說話,不管輸入法號稱的多方便,祗要一分鐘能有三十字的輸入法就能應付。換言之,所有輸入法,不管好壞,都可應付這樣的速度需求(一般人使用倉頡每分鐘都在六十字,西元一九八○年代的呼叫器(call機)時期,香港呼叫器電臺的電子秘書使用倉頡輸入法每分鐘至少一百二十字以上。所以,研究選擇一款自己喜歡的輸入法,「快」不是最重要、唯一的特性項目。但,爲了廣告宣傳,在大陸影響下的氣氛,就講究快——有單字簡碼(高頻字的一或二鍵輸入)、多字的辭以單字之較大碼數輸入(依所訂規則一般四或五碼/鍵)(辭輸入是依規預設好辭的編碼)、較智能的辭輸入方式(有數種:聯想辭=第一字打完自動顯示辭之第二字待選(辭從預設好的辭庫內找出)、自動聯想辭=從統計中在蒐集的高頻辭中依所打首字找出次字自動顯示供選、記憶辭=最近用過的辭中同第一字的辭之第二字顯示供選、人工智能辭輸入(打第一字後,以人工智能巡視上下文所需用辭而顯示辭之第二字供用,這是最晚近的作法))
單字簡碼和辭輸入,在技術層面看是同一種東西。一個是應付單字,一個是應付多字。在單字簡碼方面,若比對大陸的五筆王碼、鄭碼、及衍生自五筆的和碼,其所列的一級簡碼(即一字一碼的高頻字),能有一半重疊就不錯。各家不同,也同時宣稱他們各自所訂的一級高頻字簡碼是最符合現實。到底誰是誰非?由此可見,這是見仁見智的。
言歸正傳,在上述排序上,辭輸入排第14.
辭庫是極具個人需求特質,不是單憑借用報章雜誌作統計出的辭,便滿足個人需求。一般人在每分鐘三十字速度下已經活得很好,辭輸入的提速已沒有必要。唯一有需求的是專業快打速錄人員,辭庫功能提供了很好提速效果。但輸入法設計人員自行憑報章雜誌或一些研究資料的統計得來的辭資料,不能符合需求。是越俎代庖。
辭輸入在提速上很有效,問題是:使重碼率提升(又掉入音碼的找字選字陷阱去),不利中文排序(每字唯一碼纔能有效排),脫離對單字/逐字的筆劃認知(造成音碼弊病等電腦病)。
隨著社會變化,流行用的辭就會變,西元二○○八年前幾年,「申奧」是熱門辭。西元二○○八年,北京奧運過後,「申奧」這個辭沒有人用了。所以,辭庫面臨隨時更新的需求。一段時期沒有更新,辭庫可能就不適用。當按鍵想輸入想像中的辭,但辭庫內又沒有,於是又重新再來,逐字輸入。前面打辭輸入等於浪費時間。輸入單字永遠不會有這種問題。
對於辭庫的需求,應該是開放一個功能鍵,由用戶憑自己需求來設置,這樣客製化,纔是百分百的好用。對專業用戶使用專業辭庫,尤其自建辭庫者,自然會得到相當好處。
有大陸網民指出,不斷追求新版辭庫,其實沒有甚麼效果。找不到辭又重來,根本不會比單字輸入快,或快多少。
好的輸入法能助人對單字的結構字形筆劃有深入了解,有助於對字的學習認辨記憶寫打識,不輸於筆寫對人腦、意念的作用和訓練。但,辭輸入因爲把多字看成一字,而給予一字之編碼數,其讓人對字形筆劃的憶起作用接近於零,若該法之字碼對字根的代表性不足(在描述形的意義上),便跟注音尤其漢拼缺點類似。就是,見不到筆劃字形,以音作思考媒介,違反中華文漢字特性,與之脫鉤了。這是辭輸入最要害的地方。所以,在已知辭庫有設定而打辭輸入確是提速,但不知辭庫有沒有設定而用打辭輸入就碰運氣,沒有的話就轉而改用單字輸入,效果不彰,既是費時又傷神。整體上,沒有得到好處。
結論:辭輸入是特例、特別需求、個人需求,逐字輸入纔是基本常態。不能以特例當成常態,那就變成病態了。
|
|
|
|
|
|
|
| |
本周最热论坛帖子
|