可能有一億名以上的中文使用者,遇到了一種奇怪的新型「認知障礙」的困擾。
他們正在忘記如何「寫」中文。
至少,已經有這樣的傳言出現。
這些報導開始於二十一世紀初,每則報導都有著驚人相似的敘述脈絡。一個人在突然之間,從一個能幹、有成就、通常受過高等教育的狀態,例如一位科學家、一位企業家、一位作家,轉變成了像學童一樣,甚至必須努力回憶最基本的中文字。
因為他們一提起筆卻忘了字怎麼寫:也就是傳言所說的「提筆忘字」[1]。
有些人稱之為「失語症」(Aphasia),一種導致無法說話的嚴重疾病。另外一些人則稱之為「書寫障礙」(Dysgraphia),這是失語症的姊妹疾病,不過它是針對書寫而非說話方面。還有人提議這是一種「奇怪的新文盲形式」[2]。沒有人能理解這種流行病,其病理與傳統醫學大相逕庭。它的發病如此突然,以至於整個故事就像是直接從科幻小說頁面裡抄來的一樣。
「失寫症」(Character amnesia)——這是它被貼上的標籤[3]。
傳言逐漸演變成了令人警醒的統計數據:根據二○一三年的一項調查,百分之九十八.八的受訪者宣稱自己有提筆忘字的經歷,其中有許多人每天都會發生[4]。整個國家似乎陷入了一場奇怪的「漢字危機」中[5]。
「失寫症」的龐大影響以及如此令人困惑的行為,都讓情況變得更糟糕。不過,就像許多公共衛生危機一樣,它並未嚴重影響到生活在社會邊緣的人——也就是那些被邊緣化和貧困的人。被這種病無情困擾著的反而是中國的精英階層,一個人越富有、越城市化,就越容易發生提筆忘字的情況;可支配收入越多的人,失去書寫能力的風險就越高。
罪魁禍首終於浮出水面:數位書寫。「失寫症」最常見於那些使用電腦、智慧型手機和平板電腦的人,也就是由任何使用QWERTY標準鍵盤或觸控板來書寫中文的電子設備所造成。這個人可能前一刻還在筆記型電腦或行動裝置上,穩定輸入長串的文字,然而一旦設備關閉後,他們的思維好像也跟著關閉了。
我們該如何理解這些驚人的報告呢?這是數位時代的又一個道德恐慌案例嗎?——例如對於文本語言、表情符號、手寫能力下降或其他「語言衛生」問題的擔憂?抑或是二十一世紀的中國,已經成為數以億計的新文盲失寫症患者(illiterate aphasics)以及書寫障礙失憶症者(dysgraphic amnesiacs)的家呢?[6]如果是這樣,為什麼我們在任何地方都找不到這種危機的證據呢?是經濟上出現了缺口?又或許是高等教育的崩潰?果真如此,中國又怎麼可能成為世界上最活躍、最富有的數位經濟體之一呢?[7]此外,中文網路上的活動如此興盛,僅在中國大陸估計就有九億網路用戶參與著狂熱、不間斷的中文內容交流。如果中國最懂上網、最懂技術的人都「無法書寫」(前面提過書寫障礙的基本定義)了,那麼到底是誰在進行這些中文書寫呢?
《中文數位探索》是第一本探討數位時代中文發展史的書籍,以跨越十五年以上的研究為基礎,追溯了電子化中文從二戰結束誕生後,直至今日的繁榮發展過程。這部作品基於口述歷史、實體文物及來自亞洲、歐洲和北美幾十家館藏檔案。描述了包括IBM、中國中央新聞社、RCA、麻省理工學院、中央情報局、美國空軍、美國陸軍、五角大廈、蘭德公司、英國電信巨頭Cable and Wireless(大東電報局)、矽谷、臺灣軍方、日本工業界,以及中國大陸的高層智庫、工業和軍事機構中,那些古怪且精彩的人物故事。
然而這本書不僅為了展示形形色色的一群失敗者,也致力於解釋中文電腦處理的六個核心維度——理解數位時代中文必須掌握的六個公理。
為了探索這些公理,我們打算從中國河南省一個寒冷冬日下的禮堂,展開這趟旅程。二○一三年十二月,也就是「提筆忘字」危機最嚴重的時候,五十五位才華橫溢的數位達人聚集此地。他們聚集的目的並非為了悲嘆「提筆忘字」這件事,而是為了在正面對抗中擊敗對手:亦即在打字比賽中贏得第一名,獲得吹噓自己是中國乃至全世界最快的電腦鍵盤手的權利。
ymiw2
klt4
pwyy1
wdy6
o1
dfb2
wdv2
fypw3
uet5
dm2
dlu1 ...
一位年輕的中國男子坐在他的QWERTY鍵盤前,迅速敲打出一串神祕的字母和數字。
這是密碼嗎?是兒戲還是一團混亂?……這其實就是中文。
應該說至少是中文的來源。這四十四個鍵盤的敲擊,代表一種「輸入」過程的第一步驟:也就是使用QWERTY鍵盤或觸控板,在電腦顯示器或其他數位裝置上顯示中文字元的行為(圖0.1)。
在所有電腦和數位媒體裝置中,中文文字的輸入都依賴稱為「輸入法編輯器」的軟體程式——更廣為人知的名稱是「IME」(input method editor,輸入法編輯器,以下簡稱為「輸入法」)。輸入法是一種「中介軟體」,因為它們是在用戶設備的硬體與軟體或應用程式之間運行而得名。無論你是在微軟Word中編寫中文文件、在網路搜尋、發送簡訊或其他操作,輸入法都在運作,截取用戶的所有按鍵操作,並嘗試確定用戶想要產生哪些中文字元。簡單來說就是輸入ymiw2klt4pwyy……結果就會得到一串中文字。[8]
輸入法就像是一種不安分的生物。從使用者按下按鍵或滑動筆畫的那一刻起,它們就開始了一個動態的、反覆的過程,不斷捕捉用戶輸入的資料,並在電腦記憶體中搜尋可能匹配的中文字。目前最常用的輸入法是基於「漢語拼音」——也就是使用拉丁字母來描述中文字的發音。中國大陸的使用者最常使用的就是這種官方的羅馬拼音系統(拼音輸入並非一直都是最受歡迎的中文輸入方式,我們很快就會談到這一點。)。【1】
當第一個按鍵被按下(也許是「C」)時,像搜狗拼音、Q Q拼音和谷歌拼音這樣的輸入法,就會開始向使用者提供選項。這些「候選字」會出現在螢幕邊緣的彈出式選單中,它們的發音都是以「C」開頭的字,例如「吃」(chi)、「才」(cai) 以及其他上百種可能性。
當使用者按下第二個鍵(假設為「H」)時,輸入法會調整候選字列表。它開始只顯示發音是以「CH」開頭的中文字元(「才」的可能性被排除了,但「吃」的可能性依舊保留)。一旦使用者在彈出式選單中看到他們想要的字,只需要再按最後一個按鍵——空格鍵、輸入鍵或數字鍵,就可以選到該字,將字添加到主要的文字編輯視窗內(也許使用者想輸入的詞是「chaoxi」,即「抄襲」)(圖0.2)。這種一個接一個按鍵的操作,就是輸入法編輯器如何透過字母、數字與符號,用QWERTY鍵盤產生中文字的過程。[9]
剛剛提到的這位年輕人,他的名字叫做黃振宇(以他的別名「宇師」而聞名)。他是當天大約六十名參賽者中的一員,每位參賽者都佩戴一個鮮紅色的臂章,就像以前的繽紛紙帶遊行或選美比賽一樣[10]。在大廳前面的海報上,用了鮮豔的金黃色印著「愛漢字」的字樣。參賽者的任務是盡可能快速且準確地打出即將卸任的中國國家主席胡錦濤的談話:「高舉中國特色社會主義偉大旗幟為奪取全面建設小康社會新勝利而奮鬥……」,這是該段比賽文章開頭的話,比賽用的簡體中文為:「高舉中國特色社會主義偉大旗幟為奪取全面建設小康社會新勝利而奮鬥……」[11]。然而,黃振宇的QWERTY鍵盤(即一般使用的標準鍵盤)並不能直接輸入這些字,他只能輸入看起來毫無意義的字母和數字串:ymiw2klt4pwyy1wdy6……
透過這四十幾個按鍵,黃振宇不僅贏得了二○一三年全國漢字打字比賽冠軍,還創下了世界範圍內,有史以來最快的打字速度之一[12] 【2】。
在本書第一章裡,我們將面對中文電腦最基本、但也影響最深的公理:「ymiw2klt4pwyy1wdy6」不等於「高舉中國特色社會主義」。黃振宇在QWERTY鍵盤上實際按下的按鍵,我們可以稱之為他的「主要紀錄」,跟最終出現在他的電腦螢幕上的字元,也就是胡錦濤演講的「次要紀錄」,兩者完全不同。這點對於全球十多億華語圈電腦用戶都是如此。因為在中文電腦中,你所輸入的永遠不是你所得到的。
對於習慣使用英語文字處理軟體和電腦的讀者來說,這可能令人感到驚訝。舉例來說,如果你把你正在閱讀的這段文字,與我如何產生這段文字的按鍵紀錄進行比對,其內容可能相當沒有意義(客氣的說法)。這段紀錄會是「F-o-r-r-e-a-d-e-r-s-a-c-c-u-s-t-o-m-e-d-t-o-E-n-g-l-i-s-h」(請原諒拼寫錯誤或編輯的部分)。在英語文字打字和電腦處理的輸入中,打字者的主要紀錄和次要紀錄原則上是相同的。鍵盤上按下的字元和螢幕上得到的字元是一樣的。
但中文電腦並非如此。輸入中文時,人們在他們的QWERTY鍵盤上看到的符號,總是與最終出現在顯示器或印在紙上的符號不同。華語圈中的每位電腦與新媒體裝置的使用者,無論他們的打字速度快如閃電或慢如糖蜜,都跟黃振宇一樣,持續進行這種反覆的過程。亦即透過某種輸入法,進行同樣的某種「標準——候選——確認」字詞的輸入方式。值得注意的是,不只會說中文的使用者如此,而是全世界所有使用者在打中文字時都是如此。因為這是中文電腦的第一個也是最基本的特點:中文電腦的人機互動,要求用戶完全使用代碼來操作[13]。
這怎麼可能?中文字數以萬計,加上許多(就算不是絕大多數)獨特字元的數字代碼,黃振宇——或者更重要的是數以億計的其他中文電腦用戶——如何能夠記住並即時用上這些字元的代碼呢?為了回答這個問題,我將在第一章回溯的並非二○一○年代,而是回到最早努力對開發中文打字機的一九四○年代:中國工程師高仲芹發明的IBM「電華打字機」(中文電報打字機),由IBM(國際商業機器公司)進行原型機的製作。正如我們將看到的,這台前所未有的機器在鍵盤上根本沒有中文字元。取而代之的是打字員必須另外透過一個單獨的「主要紀錄」來輸入中文字,就像黃振宇做的一樣。不過電華打字機用的是一系列獨特的四位數字代碼,每組代碼可以對應到該機器所能印出的六千多個字元之一。在本章中,我們將會看到第一批掌控這台設備的人之一:一位名叫劉淑蓮(Lois Lew)的非凡女性。經過近十年的追尋,我有幸採訪到她的故事。
如果說黃振宇對複雜的字母數字代碼的掌握,還不夠令人印象深刻的話,那麼請想想他在比賽時表現出來的驚人速度。他在大約五秒內就打出了胡錦濤演講的前三十一個中文字,算起來就是每分鐘三百七十二個中文字的超級速度。在艱苦的二十分鐘比賽結束時,已經打出了幾千個中文字元。他在比賽結束時的平均打字速度,令人難以置信地達到了每分鐘兩百二十一點九個字元。
相當於每秒鐘三.七個中文字。
如果換成英文環境下,黃振宇開場前五秒的打字速度,相當於每分鐘可以打出大約三七五個英文單字,而他整場比賽的平均速度也輕鬆超過每分鐘兩百個單字,這是任何使用QWERTY鍵盤的英語系國家,在使用QWERTY鍵盤的情況下,無法媲美的速度[14]。一九八五年,芭芭拉.布萊克班( Barbara Blackburn)以每分鐘一七○個英文單字的速度,創下一項被《金氏世界紀錄大全》認證的紀錄(以打字機完成)。速度鬼才尚恩.羅納(Sean Wrona)後來以每分鐘一七四個單字的速度(必須註明他是用電腦鍵盤完成)[15],超越了布萊克班的紀錄。儘管這些里程碑令人印象深刻,但事實依舊是:如果黃振宇的表現發生在英語系國家的話,他的名字將被寫入《金氏世界紀錄大全》,成為新的紀錄。
而且,黃振宇的速度還具有特殊的歷史意義。[16]
對於生活在一八五○年至一九五○年之間的人來說,也就是本書的前傳《中文打字機》中考證的時期。用電報打字機生成中文,而且每分鐘要超過兩百個字,在當時完全是難以想像的速度。從一八七○年代開始的中文電報歷史上,操作員的最大速度可能達到每分鐘幾十個字。到了機械中文打字的全盛時期,大約從一九二○到一九七○年代,已知的最快速度僅接近每分鐘八十個字(大多數打字員的速度遠低於此)。從現代資訊技術的角度來看,也就是說,中文一直是世界上書寫速度最慢的系統之一。[17]
究竟發生了什麼變化?一個被長期譏笑為繁瑣和無助的複雜書寫系統,為何突然能與全球其他地區的電腦打字速度競爭,甚至超越呢?即使我們接受中文電腦用戶在某種程度上能夠進行「即時」輸入代碼,但中文輸入法不是應該會導致中文文本處理的整體「上限」低於英文嗎?畢竟在冗長的多步驟過程中,中文電腦用戶必須跨越更多障礙:例如輸入法必須先截取用戶的按鍵,搜索記憶體中的匹配選項,提供潛在的候選字清單,並等待用戶選字確認。與此同時,英文電腦用戶只需按下希望出現在螢幕上的文字按鍵即可。有什麼會比「即時性」更簡單快速呢?「Q就是Q、W就是W」,依此類推。
在第二章中,我將透過探索中文電腦的第二個公理來回答這個問題:即使中文電腦的人機互動依賴於主流英語電腦所看不到的「中介」形式(mediation),但這些額外的中介層,卻可以產生速度等於甚至超越看似「無中介、所打即所得」的英語世界。所以很違反直覺的,中介層的添加可能讓花費的時間減少了。
為了解開這個看似矛盾的現象,我們將檢視史上第一部中文電腦:Sinotype,也被稱為「表意組字機」(Ideographic Composing Machine。)【3】。這台機器於一九五九年由麻省理工學院教授山繆.霍克斯.考德威爾(Samuel Hawks Caldwell)和圖形藝術研究基金會(Graphic Arts Research Foundation)首次推出。該機器配備了一個QWERTY鍵盤,操作者用來輸入中文字的並非該字的語音,而是組成中文字的「筆畫」。然而Sinotype的目的並不是像用字母拼出單字,然後在頁面上「組合」出中文字元的那種方式。相反的,每個筆畫的「拼寫」,都是作為Sinotype邏輯電路用來從記憶體中「檢索」中文字的電子位址。換句話說,歷史上第一台中文電腦的輸入方式,用的是類似於黃振宇在二○一三年獲勝表現中所看到的,相同類型的「附加步驟」(選擇候選字)。
正如我們將在考德威爾的研究中所見,他發現了這些附加步驟在預期之外的優點,這些優點在當時的英語人機互動背景下完全沒人發現過。他的新發現就是,與正常寫出一個中文字元相比,Sinotype只需更少的按鍵操作,就能在記憶體中找到該中文字元。以英文單字為例,要「拼寫」一個像「c-r-o-c-o-d-i-l-e」(鱷魚)這樣九個字母的單字,會比從記憶體中檢索相同單字,花費更多的時間(對電腦來說,只要拼寫到「c-r-o-c-o-d」就夠了,因為沒有其他具有相同或類似拼寫的單字)。考德威爾將他的發現稱為「最小拼寫」(minimum spelling),並讓它成為史上第一台中文電腦的核心成分。現在我們是用一個不同的名字來指稱這種技術:自動完成(autocompletion)。這是一種人機互動策略,因為在輸入時額外添加的「中介層」,反而比無中介的打字有更快的文字輸入速度。因此,早在英語世界重新發明「自動完成」這項功能的幾十年前,中文電腦領域就已經發明過了。
為什麼黃振宇一開始要使用QWERTY鍵盤呢?考慮到把成千上萬的中文字元「塞進」QWERTY鍵盤的重大挑戰,為何這些電腦工程師不干脆放棄QWERTY鍵盤,直接專注於設計一個更獨特的「中文」介面,也就是設計一種讓中文電腦用戶完全可以避開輸入困難,享受與英語對手同樣「無中介」的人機互動方式呢?
我們將在第三章看到,這點正是一九六○年代晚期至一九七○年代初期的工程師們所嘗試完成的——而且曾經在某段時期裡,他們真的做出來了。當時電腦處理技術的迅速進步,為整個亞洲、美國和英國的工程師開拓了新的前景。他們不再試圖建立在Sinotype和基於QWERTY鍵盤的早期努力上,而是完全放棄了QWERTY鍵盤,尋求可以稱之為「即時中文」的解決方案。
這個時期設計的系統在多樣性方面令人驚嘆。例如我們將會看到一個為用戶提供一百二十個SHIFT層級的特製介面(輸入裝置),而一般標準QWERTY設備上只有兩層(即小寫和大寫)。另一種介面則有二五六個按鍵,而非典型西方設備人機介面約八十到一百個按鍵。這個時期甚至還有另一個介面設計提供了超過兩千個鍵。也有一個是使用觸控筆和觸控板,讓用戶可以直接在輸入介面選擇字元。還有一個完全放棄了平面形式的輸入介面裝置,而把一個中文字元矩陣,包在一個旋轉的滾筒介面裝置上。
除了梳理中文電腦發展史裡這個關鍵但鮮為人知的部分之外,本章還提醒我們一個重要的事實:無論輸入法的潛力或實證紀錄如何,它一直都不是受人尊敬的一項技術。從起源到現在,輸入法往往被認為是一種本質上的補強技術,目的在協助或「解決」中文文本在電腦處理時所面臨的挑戰。儘管我們在這段歷史裡標出了多項重要成就,包括驚人的速度和效率等,但我們仍然必須小心,永遠不要把輸入法想像成曾被尊奉為「另類的現代性」,或想像成是可與西式人機互動相抗衡的「競爭對手」。恰好相反的是,我們會在這段時期裡發現——有時很微妙,有時又很明確的——一種渴望與英語世界中備受推崇的「即時」介面相符,或至少很接近的中文人機互動形式。也就是說,輸入法在當時幾乎都不是任何工程師的「首選」目標。[18]
從一九七○年代末期開始,亦即第四章所探討的時期裡,自製中文介面逐漸從市場和實驗室中消失,被一波波西方製造的個人電腦所取代,因為這些電腦大量湧入了「改革開放」(Reform Era China,一九七八年至一九八九年)時期的中國。然而QWERTY鍵盤的復興以及隨之而來的輸入法,並非依循過去的老路。如果中文電腦在曙光初現時只有兩種輸入系統(高仲芹四位數代碼和考德威爾的Sinotype拼寫代碼),那麼一九七○年代末期到一九八○年代,就是輸入法競爭式的大爆發時期,當時出現了幾十、幾百,最後甚至超過一千種以上的不同輸入法。二○一三年的黃振宇和同場競爭的對手們,都屬於這個年代的後代子孫,他們出生在一個擁有眾多輸入法的世界,對他們來說,一切就像理所當然。事實上,就在黃當時輸入那組神祕的字母數字序列ymiw2klt4pwyy……到他的電腦中時,其他五十多位競爭對手的按鍵紀錄,看起來應該也會截然不同。
這點帶我們來到了中文電腦的第四個公理,也許是最難理解的:中文輸入法是無窮盡的。對每個中文字元而言,都存在著無限多的輸入序列可以產生該字元(至少在理論上如此)。
要理解這種「無限多對一」的奇特關係,我們必須回到黃振宇那串看似毫無意義的字母數字序列ymiw2klt4pwyy……。不僅要了解它如何運作,更重要的是要了解到這個數字字母序列,只是他在QWERTY鍵盤輸入時可以選擇的無數種可能之一,它們都可以打出完全相同的文字。亦即有無窮多的方法,可以產生出與胡錦濤演講完全相同的文字。
讓我們深入解釋為何「y-m-i-w-2」對應於「高举」(高舉)二字。這是因為在黃振宇使用的特定輸入法——一種被稱為「五筆」的輸入法中——按鍵「Y」、「M」、「I」和「W」分別對應於一組特定的圖形形狀,也就是中文字的某個部分。在五筆輸入法中,「Y」分配給特定的十一個形狀,其中之一的(亠),就是黃振宇打算輸入的字「高」的最上面部分。因此,按下「Y」鍵時,黃振宇就是在告訴五筆輸入法,找出「包含」該組特定形狀的中文字。一旦他按下「Y」鍵,輸入法便開始在彈出式選單中顯示可能匹配的字元。
由於字母「Y」也同時對應其他十個形狀,所以這個初始的字元匹配集合中,將包含大量的非正確選項。為了進一步確認正確的形狀,黃振宇又按下了鍵盤上的「M」鍵——這個鍵本身又對應另一組十四個形狀(其中包含了「冂」,這個形狀也出現在他打算輸入的「高」字中,這次是在該字底部)。此時,輸入法已經獲得大量訊息,將範圍限縮在可能的匹配組合裡,也就是只顯示那些包含了「Y」對應的十一個形狀和「M」對應的十四個形狀之一的中文字。隨著可能性的快速縮減,輸入法不斷刷新彈出式選單,並「建議」了包含「高」這個字的候選字給他,等待確認。這就是黃振宇在比賽時間內,不斷進行的相同過程(見圖0.3)。
對於對黃振宇輸入字串的複雜性感到震驚的讀者,請做好心理準備迎接真正的震驚:黃振宇可以使用完全不同的字母數字輸入序列,來獲得完全相同的文字輸出。在五筆輸入法中,有不止一種方式可以得到相同的中文字元。同時,如果黃振宇選擇使用完全不同的輸入法(就像他的許多比賽對手所用的),他的輸入序列將完全不同。而且,如果假設黃振宇本身恰好是一位發明家,想從頭開始設計他自己的中文輸入法,他還可以構建出理論上無限多的輸入法,把給定的胡錦濤總理演講「原始文本」與不同的字母數字序列產生的「次級文本」相互關聯。
要理解為何任何中文字元都可以有無限多種輸入方式,我們只需進一步研究五筆輸入的邏輯即可。你很快就會發現,雖然五筆輸入法的發明者王永民,選擇將拉丁字母「Y」與中文字元組件「亠」畫上等號,但並不存在一個恆定的限制法則告訴我們必須永遠如此。同樣地,也沒有任何法則告訴我們「M」應該等於冂。所有這些拉丁字母和中文字元部件之間的配對,都是發明者的主觀決定。人們可以想像出完全不同的方式,用來管理輸入序列對於「主要紀錄」與中文字元的「次要紀錄」之間的對應關係。
對比電腦輸入英文單字的方式,傳統上只有一種正確且被接受的方式,可以達到預期的輸出結果。例如要輸入「electricity」這個字,我們知道要輸入「e-l-e-c-t-r-i-c-i-t-y」。如果我輸入「elctricity」、「elec-trcty」、「elec」或其他拼法,一定就是打錯字或縮寫之類。相較之下,從一九五○年代以來的中文輸入系統設計者,已經開發出一千多種輸入單一中文字「電」的方式。舉例來說,使用「區位碼」輸入時,正確的輸入序列是「2171」;而在「太極碼」輸入系統中,正確的輸入序列將會是「N Y」;在「支碼」輸入系統中則會是「D79」等……,這張輸入法名單可以一直延續下去(見表0.1)。
我們還會在第四章介紹一位工程師支秉彝的故事,他的輸入系統是在文革時期裡的一個監獄牢房中構思出來的。我們將藉此檢視當時的發明家們,到底如何設計出幾百種不同的中文輸入法。
撇開黃振宇的QWERTY鍵盤暫時不談,到底他的電腦還有什麼特點,使其與英語世界使用的電腦有所不同?究竟是什麼東西讓一台電腦成為「中文電腦」?是否「中文電腦」指的就是在中國或華語圈的政治範圍內製造的任何電腦?中文電腦是否依照某種邏輯運作,讓它們與其他地方製造的電腦有所不同?是否只有具有中國血統的工程師開發的電腦,才算是「中文電腦」?黃振宇的電腦是否有某種無法從外觀上辨識的獨特「中國特性」?
表 0.1二十幾種不同的中文輸入法,在輸入「电」(電)這個中文字的字元數字輸入序列。
在電腦上輸入「电」這個字 | |
使用的輸入法 | 輸入的字元數字序列 |
汉语拼音(漢語拼音) | d i a n t m v v |
郑码(鄭碼) | k z v v |
五笔输入法(五筆輸入法) | j n v |
仓颉编码(倉頡編碼) | l w u |
首尾音形输入法(首尾音形輸入法) | d j f z |
双笔音形输入法(雙筆音形輸入法) | d j j m |
拼音 | d i a n # |
笔形编码(筆形編碼) | 6 0 1{1} |
四角附音(四角附音) | 5 0 7 1 6 d{2} |
双拼双部编码法(雙拼雙部編碼法) | d q t k |
易输入法(易輸入法) | r g d |
双拼(雙拼) | d m # |
区位码(區位碼) | 2 1 7 1 |
国标(GB Code,國標碼) | 3 5 6 7 |
形意三码(形意三碼) | b 1 |
唯物码(唯物碼) | 亅 4 7 |
五十字元输入法(五十字元輸入法) | l j d |
汉字笔形查字法编码法(漢字筆形查字法編碼法) | 6 0 |
见字识码(見字識碼) | D D D D |
钱码(錢碼) | d j m |
五笔字型(五筆字型) | j n |
自然码(自然碼) | d m l o / |
表形码(表形碼) | l k k d |
大众码(大眾碼) | d o w w |
华码(華碼) | d r z |
太极码(太極碼) | n y |
3F码(3F碼) | ; d |
仓颉(倉頡) | m b w u |
五笔型(五筆型) | j t w |
层次四角{3}(層次四角) | x e |
内码(內碼) | B5E7{4} |
安氏編碼系統 | 106071{5} |
基本笔画(基本筆畫) | 1 0 4 6{6} |
笔顺码(筆順碼) | 0 1 6{7} |
從外觀來看,黃振宇使用的電腦看起來和世界各地的桌機並沒有什麼不同。會不會是有什麼內部的東西,可能是CPU之類,讓它有特殊能力,可以處理這種高度複雜的文字輸入?
我們將在第五章看到這個問題的答案,答案既是否定也是肯定。
否定的答案是,這場比賽所使用的電腦,與世界各地家庭、辦公室和學校中的Windows相容電腦並無差異,從內到外都沒有什麼特別「中文化」之處。
然而,從歷史的角度來看,答案卻是肯定的。在二十一世紀裡,全球每部大規模生產的個人電腦,都已具備本文所討論的處理中文輸入的能力。事實上,中文輸入法已經預先加載,其他輸入法則可供下載(通常是免費的)。大約在二○一三年左右,你在電腦商店裡買到的每台桌上型電腦、筆記型電腦和智慧型手機都已經「中文化」了,也就是它們都有能力處理中文的輸入和輸出。
然而,情況並非一直都是如此。事實上,這很明顯是最近才有的現象。在一九八○年代初期,消費型個人電腦剛興起時,西方設計的中央處理器、印表機、顯示器、作業系統或程式語言等,都無法直接處理中文字的輸入或輸出(至少無法「開箱即用」)。在電腦歷史的大部分時間裡,電腦技術的發展一直偏向某些字母文字,尤其是拉丁字母。舉例來說,在二十世紀中葉,西方的電腦工程師確定五乘七的點陣網格就能提供足夠解析度,可以在顯示器和點陣印表機上呈現或列印出清晰的拉丁字母。然而,若要讓中文字做到相同的事,工程師必須將這個點陣網格擴展到至少十六乘十六以上。一九六○年代,ASCII(American Standard Code for Information Interchange,美國資訊交換標準碼)背後的開發團隊確立了七位元編碼架構及其一二八個位址組合,便可為拉丁字母表中的所有字母和數字,以及非字母符號和功能鍵提供足夠的空間。相較之下,中文字需要至少十六位元編碼架構才能處理超過六萬個字元。當然也包括在很久以前,西方工程師已經在現有的打字機鍵盤上使用Shift鍵來切換小寫和大寫字母(中文沒有字母,也沒分大小寫)[19]。因此,無論在字元編碼、電腦顯示器、點陣印表機、程式語言、光碟作業系統、輸入介面、光學字元辨識演算法或其他方面,電腦的早期歷史從許多層面看來,都像是一個接一個的數位版「排華法案」[20]。【4】
正如我們將在第五章看到的,到了一九八○年代,隨之而來的是一段竄改和修整的時期,用工程師圈的常用術語來說就是「改裝」(modding)。西方製造的點陣印表機被改裝了,西方設計的磁碟作業系統和基本輸入輸出軟體(BIOS)也被改裝了。中國和其他各地的工程師,一點一滴地讓西方製造的電腦硬體和軟體都能與中文相容。那是個混亂的、分散式的,而且是輝煌的實驗和創新年代,所有這一切都使得在二○一三年當時,以及目前中國在電腦和新媒體領域的地位成為可能。[21]
黃振宇一開始為何不厭其煩地使用ymiw2klt4pwyy1wdy6來輸入中文呢?即使我們承認QWERTY介面在中文電腦上普遍存在,即使我們承認輸入法的核心重要性,但還是留下了一個懸而未決的問題:黃振宇為什麼不選擇根據胡錦濤演講的「語音」來輸入,而是選擇根據印刷頁面上構成它的中文「字元結構」特徵來輸入呢?舉例來說,輸入「高舉」這兩個字時,為什麼他不是輸入「g-a-o-j-u」,就像人們期望的、發音為「高舉」的組合呢?他在輸入「中國特色」時,為何不輸入「z-h-o-n-g-g-u-o-t-e-s-e」,為何要費心使用基於字元結構的輸入法?像他打出的ymiw2klt4pwyy1wdy6這樣的序列字母,與中文發音根本沒有任何關聯。
這個問題的部分解答是:目前大多數中文電腦使用者,的確是使用「拼音」的輸入方式(至少在中國大陸如此)。然而在二○一三年這場勝利中,黃振宇選擇使用的「五筆輸入法」,雖然在一九八○到九○年代曾經廣為流行,但在他這個年紀或時代裡已經很少人使用了。二十一世紀的中國大陸電腦使用者大多使用搜狗拼音、Q Q拼音、騰訊拼音、Google拼音等輸入法,以及其他各種以羅馬字拼音為基礎的拼音輸入系統。
有鑑於此,我們很自然的想問:如果二○一三年的那一天,黃振宇使用的是拼音輸入系統,亦即輸入了更「肉眼可辨」的拼音字串,例如「gaojuzhongguoteseshehuizhuyi……」(高舉中國特色社會主義), 而非神祕的字串「ymiw2klt4pwyy……」的話,也許中文和英文電腦之間的懸殊差別,看起來就不會如此僵化?畢竟拼音輸入的底層系統——中華人民共和國的官方羅馬化標準,也就是所謂的「漢語拼音」——其前提便是完整「拼出」每個中文字的發音,就像我們拼出英文單字一樣。
我們還可以更進一步問:既然拼音輸入是基於漢語拼音,而漢語拼音屬於羅馬拼音系統,這是否意味著使用QWERTY鍵盤輸入中文時,基於拼音的輸入系統是較有效率的「拼寫」方式呢?拼音輸入法的崛起,不就應該象徵著中文電腦領域的一種「歷史終結」,並將自己融入全球長期主導的人機互動模式嗎?換句話說,拼音輸入法難道不能算是中國版的「所打即所得」嗎?
答案是「不能」。我們將會在第六章檢視從一九九○年代迄今,基於拼音的各種語音輸入法的崛起過程。然而儘管拼音輸入與傳統意義上的「拼字」有著驚人的相似之處,但它實際上仍然是一種「輸入」形式——我的意思是,它仍然屬於前面幾章探討過的,中文電腦半個世紀歷史軌跡裡的核心部分。從歷史上看,基於文字結構的輸入法已經占主導地位四十年,而拼音輸入開始流行也不過是最近的事情,一旦拼音輸入流行之後,實際上也已不再是一種單純以拉丁字母、透過拼音「讀出」中文字發音的技術。簡而言之,即使「拼音輸入」是建立在「漢語拼音」的基礎上,但兩者是完全不同的系統。
請看一下中國首都「北京」的漢語拼音羅馬化:「Beijing」或「Bĕijīng」(包含聲調標記)。除了上述兩種拼法之外,任何其他拼法(beij、bj、bjing)都可以說是錯字或拼寫錯誤,判斷起來一目瞭然。相較之下,在基於拼音的輸入系統中,這些拼法(以及其他衍生拼法)都是完全有效的選項;原因是這些拼音中的任何一種,都可以「實現目的」,亦即它們都可以從字庫中喚出二字詞語,再讓用戶從彈出式選單中選擇所需的「北京」。漢語拼音是羅馬化系統,「拼音輸入」則是基於我們到目前為止介紹過的所有原理的一種「電腦化」輸入方式,我們將深入探討以下議題:輸出同一中文字的多種輸入方式、「所打非所得」和更多內容等。事實上,與基於文字結構的輸入系統相比,拼音輸入嵌入了各種先進技術與技巧,造就了中文書寫歷史上的滔天變革:包括自動完成、預測文字、上下文分析,以及最近的人工智慧等。
在本書我要講述的是中文在數位時代下的歷史,但我也超越中國的範疇,探索過去半個世紀中,一種新的寫作模式——亦即一種新的「知識技術」(technology of the intellect)如何形成。[22]這種書寫模式與我們已知的文字書寫,有著深刻但往往難以察覺的距離。我把這種新的書寫模式稱為「超書寫」(hypography)——hypo的意思是「在……下面」或「在……下方」,而graphy的意思則是「書寫」。中文輸入便是一種超書寫形式,也就是在傳統書寫或文字之下運作的一種方式。[23]
「正字法」(orthography)亦即我們對傳統書寫或文字的稱呼,是指你在寫生日卡片、提交工作申請或在社群媒體上發表評論時用來產生文字的「書寫形式」,「正字元」(Orthographs)則是指出現在街道標誌、餐廳菜單、電腦螢幕或詩歌頁面上的「呈現」方式。它是一種自書寫本身出現以來就存在的形式:包括象形文字、甲骨文、楔形文字、版畫、手稿、銅版畫、活字印刷術等[24]。無論透過黏土或蠟的置換,石頭或木頭的刻畫,皮膚或紙張的染色等,都代表了表達概念的符號。
相較之下,「超書寫」則是一種新的特殊書寫形式,其唯一的作用就是協助你從字庫中搜尋和檢索正字字元。讓我們回顧前面提過的例子,diantmvv是一個超書寫詞,kzvv、jnv、lwu、djfz、djjm和dian也是。這些超書寫詞的目的並非用來「代表」任何特定概念,亦即不是像「貓」一詞,可以表示或「代表」一種特定的四足哺乳動物。超書寫詞(字符,signifier)的唯一目的便是協助檢索其他正字(意符,signified),然後讓這些正字意符完成創造意義的符號學工作。換句話說:雖然印刷術從根本上改變了「書寫文字」的方式(用印的而不是用寫的),但印刷術並沒有(也不會)從根本上改變「書寫」(因為都是表達相同的意思)。
到底超書寫該算是一種什麼樣的文字呢?為了回答這個問題,我們可以先檢視一下它的一些核心特徵。對於中華人民共和國(PRC)九億電腦和網路用戶中的每一位,以及更廣泛的華語圈和中文電腦世界裡數以億計的其他用戶,體驗到的超書寫與特點如下:
—用戶實際操作的符號——無論透過按下鍵盤上的按鍵,或用手指或觸控筆點擊——永遠不會與螢幕上顯示的中文符號相同;
—理論上存在無數種方法(輸入法),可以對應輸入和輸出符號之間的轉換關係;
—書寫行為依賴於一個重複出現的遞歸過程,使用者在輸入的過程中不斷地、而且是一次又一次地持續呈現一組不斷變化的「候選字」;
—任何文字的成功完成(無論單一字元或更多字元),並不一定要依賴於跟輸入序列對應的完整「拼字」(不必拼完就會出現應選字);
—每個人在輸入時直接操作的符號——「主要字元輸入」(例如你打的是bj),會在所需的「次要字元」(北京)被確認並添加到寫作視窗的瞬間,立刻破壞掉(輸入的主要字元bj在選完字後立刻消失)。[25]
這最後一個特性——超書寫的刻意短暫性——或許是最令人驚訝的特點。跟紙上的墨水、木頭上的雕刻或地鐵車廂的塗鴉不同的是,這些超書寫字元的存在時間,不會超過實現其目的所需的時間。它們只是協助檢索其他東西,然後就被遺忘了——這就是它們的命運。我們可以看看diantmvv、kzvv、jnv、lwu、djfz、djjm、dian、601、50716d、dqtk、rgd、7193、dm、2171、3567、b1、J47以及所有其他形成中文字「电」的輸入序列情況。一旦「电」(電)被添加到編輯螢幕上,這些超書寫符就不再需要保留,因為現在已經由「电」來完成表達意思的工作了。超書寫符只存在於輸入法編輯器跳出窗口的範圍內,而且只存在一瞬間,一旦它們成功協助用戶檢索到所需的字,就會迅速消失。因此,超書寫符並不是為了「代表」什麼,它們在完成檢索的目的後,注定要消失。
超書寫符的規模和節奏令人驚嘆。在二○一三年的比賽中,黃振宇在他的QWERTY鍵盤上按下了大約四萬次按鍵。然而,他按下的這些字母和數字,完全沒出現在最終文本中。它們全部在完成原始目的:協助輸入法從記憶體中檢索到他想要的中文字元後便立刻消失了。
對於中華人民共和國各地估計約九億的電腦和網路用戶來說,這種現象都是相同的。每天都有幾十億甚至幾千億的按鍵和手指點擊,產生了一個龐大而短暫的超書寫符組,然後才出現他們要的中文文字。每一份數位中文文本都是這樣產生的——從學生的功課、微博的網誌、最近在阿里巴巴購物填寫的郵寄地址,到熱戀青少年之間所傳的文字訊息等。換句話說,每年都會有一個難以想像的巨大超書寫符庫,規模可能有幾千億個字母數字,在眨眼瞬間被一次又一次地創建和刪除。[26]
超書寫符刻意形成的短暫性,使其有別於乍看之下似乎相同的各式各樣書寫形式。考慮一下首字母縮寫(acronyms)、字首縮寫(initialisms)和一般縮寫(abbreviations)三種情況,例如NASA、PRC與congrats以及類似例子【5】。這三種書寫技巧都使用了縮寫;但縮寫並不是我們所說的超書寫符。假設PRC或NASA等縮寫只是超書寫符的話,它們就永遠不會出現在印刷頁面上,也不會出現在任何最終的作品中。這些縮寫將轉換為原先設計從記憶體檢索出來的正字,還原成「美國國家航空暨太空總署」或「中華人民共和國」,然後就會像diantmvv、kzvv、jnv、lwu、djfz、djjm和dian一樣被遺棄掉,再也不會出現。
超書寫的短暫性,也使其與俚語、駭客語言、表情符號、顏文字、人工語言(constructed language)、輔助腳本(assistive script)、跨語言(translanguage)、語碼轉換(code-switching)、雙層語言(diglossia)、語碼混用(code-mixing)、中式英語(Chinglish)、跨語言雙關語(interlingual punning)、替換字母(tranßcripting)、簡訊拼寫、網路用語、文字遊戲和謎語等寫作形式區別開來。不過,我們很快就會看到,超書寫即使沒有全部用到這些形式,但也確實借用了許多書寫形式的技巧和訣竅。[27]
中文電腦雖然是這個新時代的重要起點,但並不是發源地。亦即超書寫並不是中文獨創的發明。英語速記和速記打字是十九世紀就已存在的超書寫形式。例如在美國的法庭和會議室裡,速記打字員所用的不是傳統打字機,而是依靠與中文輸入完全相同的非同字策略專業設備,以聲音來快速紀錄法庭證詞和證言[28]【6】。這種速記機有二十二個按鍵,但並不是每個按鍵都代表拉丁字母中的某個字母。舉例來說,這台機器上並沒有拉丁字母N,若要輸入N,速記打字員必須同時按下三個其他字母:T、P和H(鍵盤上有這三個字母)。同樣地,為了輸入字母B、C、G、J,速記員會按下字母組合P-W、K-R、T-K-P-W和S-K-W-R。速記員會在稍後查看這個神祕的原始文字紀錄,然後將T-P-H之類的字元組替換為對應的字母「N」之類。換句話說,就像中文輸入一樣,英語速記打字的「原始文本」從來不是書寫過程的最終目的。原始文本只是為了協助實現下一個文本:次級的自然語言文本。一旦獲得次級文本時,原始文本便會被丟棄,就像中文輸入的情況一樣(圖 0.4)。[29]
雖然這些內容對某些讀者可能很複雜,但英語速記打字員通常只需高中教育的程度即可,而且可以在相對簡短的培訓計畫裡習得此項技能。然而他們能夠實現的打字速度,遠遠超過傳統打字機的最快速度。簡而言之:無論英文打字員打字速度有多快,永遠不可能快過速記員。
此外,在電腦和新媒體時代,英語的超書寫符也後繼有人。「Graffiti」(原意為塗鴉)是一種在以前相當受歡迎的PalmPilot個人數位助理上所使用的專屬輸入系統,同樣也是一種超書寫的形式。Palm的每個塗鴉字母,會在成功辨識為記憶體中的某一個「真實」字元後立刻消失(見圖0.4)。T 9輸入法也是類似的情況,它能讓用戶使用手機的十個數字進行打字。
表0.2英文字母及其對應的速記字母
因此,超書寫時代的特徵並不是新奇,而是規模和心態。在數位時代裡,每位中文電腦用戶都是超書寫者。事實上,在華語電腦世界中,每個人都像是速記員、PalmPilot用戶或是T9輸入者,而非「打字員」。更清楚的說,我的意思並不是在說一般中文電腦用戶的打字速度都接近黃振宇,或英語世界的一般人打字速度都接近前面說過的布萊克班或羅納一樣。但我們可以說每個在電腦、智慧型手機或其他數位裝置上輸入中文字的人,都是透過本質上與黃振宇和其他參賽者相同的技術來實現。
當我們將視野擴展到範圍更廣的華語世界,以及會使用中文字元書寫的國家(例如日本和韓國)時,超書寫的規模便進一步擴大了。接著要談的就是非拉丁文電腦和新媒體裝置的更廣大世界,這些國家的使用方式在本書的結尾部分也會提到。例如當班加羅爾、利雅德和金邊的人們坐在筆記型電腦或智慧型手機前時,他們使用這些設備時所做的相關事情,看起來會更像是上海、京都和首爾,而非紐約、倫敦和巴黎,因為他們輸入的字同樣不等於得到的字。總之,我們發現在中國形成的這種數位書寫模式,已經悄然且迅速地成為了全球的主要書寫模式。
雖然超書寫本身並非全新的想法,但它現在的運作規模是全新的。事實上,超書寫文字的實踐如此普遍,以至於我們必須在人類有歷史紀錄的生活裡,從楔形文字和甲骨文到銅版畫和打字機等,進行回溯式的時代命名——這是一個到目前為止我們從未需要給出名稱的時代,因為它直到現在都一直存在著。我會將其稱為「書寫建構」(writing as composing)時代,或者更簡單地稱為「正字術」時代;以便與一個正在出現的「書寫檢索」(writing as retrieving)時代,或者說「超書寫」時代作為對比。
回到一開始討論過的所謂的漢字危機。我將在本書中論證,有些人所談到的「提筆忘字」,既非書寫障礙,也不是文盲或健忘症。相反地,這是因為中國的書寫正在發生根本性的變化。世界上有許多地區的書寫也正在改變。但我們用來理解「何謂書寫,書寫應該是什麼」的理論框架並未改變。[30]我們在二○一三年黃振宇的表現中所看到的,或是從中國龐大且不斷增長的電腦用戶活動中所看到的,並不是關於「文盲」的問題。我們正在見證一種全新的中文,甚至可以說是一種全新的書寫模式——這種模式仍處於萌芽階段,人們對它知之甚少。
本書所談的是中文電腦史。然而更重要的是,它是通往書寫歷史新時代的初步路線圖。
歡迎來到超書寫的時代。
1.譯註:本書以下依時間、地點的不同,會有翻成「漢語」或「中文」的不同情況,特此說明。↺
2.譯註:不論線上線下比賽,宇師無疑是大陸打字界第一名快手。不過當時官方公布的冠軍卻是一七五字的王士輝。這件事也成為大陸打字界有名的黑箱事件。↺
3.譯註:Sino為東方之意,亦可指中國。由於該機發展為一至三代,故以下均以Sinotype原名稱之,以利後續Sinotype II、SinotypeIII名稱的使用。↺
4.譯註:Chinese exclusion act,美國歷史上排斥華人所通過的真實法案。↺
5.譯註:三者都是縮寫,差別在於NASA為National Aeronautics and Space Administration的首字縮寫,其縮寫NASA可「合併發音」。PRC是People’s Republic of China的字首縮寫,但縮寫字母「分開發音」。congrats是Congratulations的縮寫,用意在「簡化」該字。↺
6.譯註:類似臺灣法院書記員用的「追音輸入法」與「追音鍵盤」,可同時按下三個鍵。↺
1.提筆忘字。↺
2.Barbara Demick, “China Worries about Losing its Character(s),” Los Angeles Times, July 12, 2010, http://articles.latimes.com/2010/jul/12/world/la-fg-china-characters- 20100712 (accessed September 2, 2014).↺
3.Victor Mair,“CharacterAmnesia,” Language Log, July 22, 2010, https://languagelog.ldc.upenn.edu/nll/?p=2473; Jennifer 8. Lee, “In China, Computer Use Erodes Traditional Handwriting, Stirring a Cultural Debate,” New York Times, February 1, 2001; Demick, “China Worries.”↺
4.「『提筆忘字』我們究竟忘掉了什麼?」,新華網,2013年11月4日,http://edu.qq.com/a/20131104/002402.htm(2019年3月1日瀏覽)↺
5.漢字危機;「『提筆忘字』:是信息化造成了漢字危機嗎?」,《中國青年報》,2013年9月16日,http://www.cernet.edu.cn/zhong_guo_jiao_yu/yiwujiaoyu/201309/t20130916_1017489.shtml.↺
6.Deborah Cameron, Verbal Hygiene (London: Routledge, 1995); Crispin Thurlow, “Generation Txt? The Sociolinguistics of Young People’s Text-Messaging,” Discourse Analysis Online 1, no. 1 (2003), https://extra.shu.ac.uk/daol/articles/v1/n1/a3/thurlow 2002003-paper.html; Victoria Carrington. “Txting: The End of Civilization (Again)?” Cambridge Journal of Education 35 (2004): 161-175; Jannis Androutsopoulos, “Introduction: Sociolinguistics and Computer-Mediated Communication,” Journal of Sociolinguistics 10, no. 4 (2006): 419-438; Tim Shortis, “‘Gr8 Txtpectations’: The Creativity of Text Spelling,” English Drama Media 8 (June 2007): 21-26; David Crystal, Txtng: The Gr8 Db8 (Oxford: Oxford University Press, 2008); Tamara Plakins Thorn- ton, Handwriting in America (New Haven, CT: Yale University Press, 1996).↺
7.曹雪楠,“Bullet Screens (彈幕): Texting, Online Streaming, and the Spectacle of Social Inequality on Chinese Social Networks,” Theory, Culture and Society 38, no. 3 (2019): 29–49.↺
8.從某種意義上說,本書對輸入法編輯器的關注,使其與軟體研究的子領域和軟體的歷史間,進行了某種對話。然而輸入法作為「中介層」而言,與這些子領域之間有點無法協調,因為輸入法是一種在用戶和其他軟體應用程式之間(例如用戶和微軟Word、資料庫程式、網路瀏覽器或其他應用程式之間)運作的軟體形式,情況就是如此。見Martin Campbell—Kelly, “The History of the History of Software,” IEEE Annals of the History of Computing (December 18, 2007): 40–51. 另見Matthew Fuller, Behind the Blip: Essays on the Culture of Software (Brooklyn, NY: Automedia, 2003).↺
9.也有基於手指滑動的輸入法,也就是使用智慧型手機、平板電腦或電腦觸控板,透過繪製中文字來檢索。在這種情況下,輸入法會根據此資料(而非按鍵)不斷更新其潛在漢字匹配清單。↺
10.「2013年全國漢字輸入大賽總決賽在信陽平橋區舉行」,河南新聞(2013年12月12日晚間7:11分播出),https://zhuanlan.zhihu.com/p/37361698。↺
11.完整官方內容為「高舉中國特色社會主義偉大旗幟,為奪取全面建設小康社會新勝利而奮鬥。」見胡錦濤《在中國共產黨第十七次全國代表大會上的報告》,2007年10月15日,https://www.chinadaily.com.cn/china /2007-10/25/content_ 620 4663.htm。↺
12.該比賽由中國主要報紙《光明日報》共同主辦,與1980年代以來在中國和華語世界各地舉辦的數百場比賽類似。在這樣的比賽中,可能有幾十到幾百名參與者使用電腦和QWERTY鍵盤,盡可能快速、準確地轉錄一篇中文文章。就像黃振宇一樣,他們不斷地打出長長的字母數字串,而這些字母數字串就像變魔術一樣,變成了螢幕上的文字段落。另一個共同發起者是中國發明協會。↺
13.為了偵測黃按下的按鍵,尤其必須考慮到他驚人的打字速度,因此有必要暫停影片,一格格移動觀看。↺
14.每分鐘多少個漢字和每分鐘多少個英文單字之間的「翻譯」比較,不僅要仔細考慮中文「字元」和英文「單字」之間的差異,而且還要考慮英文打字比賽中,定義「單字」概念的特殊方式。讓我們先考慮第二個問題:給定段落中的「字數」在打字比賽評審的計算上,會與一般人的計算方式不同。首先,評審們統計出文章中的字母數字字元總數(包括空格和標點符號),然後將這個數字除以五(這是由「打字比賽聯盟」考慮過的英文單字「平均長度」)。這就帶來了一個公認的棘手問題:如何量化和比較漢字與英文單字。比較合理的技術就是將中文原文翻譯成英文,然後計算出一個比率。根據中華人民共和國國家官方認可的英文翻譯,這31個中文字的段落:「高舉中國特色社會……」翻譯成英文就是「Hold High the Great Banner of Socialism with Chinese Characteristics and Strive for New Victories in Building a Moderately Prosperous Society in All Respects.」雖然原來的段落是24個字,不過用英語打字比賽規則來換算,實際總數就是31.4個字(157個字母數字字元、空格和標點符號,除以五)。更多有關中文翻譯者的「經驗法則」訊息,見郭凱澤在Quora上的精彩討論:「翻譯一個英文單字平均需要多少個漢字?」https://www.quora.com/On-average-how-many-Chinese-characters-does-it-take-to-translate-an-English-word(2019年8月3日檢索)。↺
15.還有一些打字愛好者的打字速度驚人,達到每分鐘200、242、甚至256個字。雖然這種打字「衝刺」只能持續幾秒鐘,但整體而言,這種「衝刺」競賽讓打字員能夠達到在任何時間段落下都無法追上的速度。↺
16.黃振宇的「衝刺」速度也超過了英文打字界所見過的速度。Sean Wrona的表演在打字比賽中名垂青史,他曾在不到6秒的時間內轉錄(按稿輸入)了21個單字(每個單字再次被定義為「平均5個字母,包括所有空格和符號」,依據北美打字比賽標準)。所以他的表演速度為每分鐘256個單字,這表示他在大約5.25秒內就完成了21個單字的轉錄。儘管Wrona的表現快如閃電,但2013年比賽中黃振宇開場幾秒鐘的「衝刺」仍然更快。請見https://www.youtube.com/watch?v=IozhMc6lPTU。這個比賽梯次中的其他人包括 Jelani Nelson、Guilherme Sandrini、Yifei Chen、Nate Bowen和一位名叫Kathy的Youtuber,https://www.youtube.com/watch?v=IFuMEnLthHs。另見https://seanwrona.com/typing.php。在SXSW的打字比賽上,Wrona以每分鐘124個字的速度贏得了冠軍。https://www.youtube.com/watch?v=m9EXEpjSDEw。↺
17.在其他情況下,中國人根本無法加入這個大家庭的行列,就像熱金屬排版(更廣為人知的名字是Linotype和Monotype機器)一樣,工程師們試圖調整機器來適應中國基於漢字的文字,但未能成功。有關對於中國資訊科技偏見的深入調查,見Thomas S. Mullaney,《中文打字機:機械書寫時代的漢字輸入進化史》(劍橋,麻薩諸塞州:麻省理工學院出版社,2017年)。↺
18.一本有關文化邏輯和「即時性」持久吸引力的基礎著作,重點關注於西方世界,見Jay David Bolter and Richard Grusin, Remediation: Understanding New Media (Cambridge, MA: MIT Press, 1998).↺
19.Michael H. Adler, The Writing Machine: A History of the Typewriter (London: Allen and Unwin, 1973); Wilfred A. Beeching, Century of the Typewriter (New York: St. Mar— tin’s Press, 1974).↺
20.我在這裡的觀點是從尼克.蒙特福特、諾亞.沃德里普—弗魯因、馬修.基申鮑姆、雅各布.加布里等學者處汲取靈感,並加入他們的行列。他們敦促我們應該超越蒙特福特所說的「螢幕本質主義」(screen essentialism):亦即對視覺輸出執著的電腦設備。「電腦不是視覺媒介,」雅各.加布里提醒我們。「我們可能會說它主要是數學的,或者可能是電學的,但它最初並不涉及視覺或圖像問題。然而,我們與電腦技術的接觸越來越常透過螢幕介面進行引導。因此,絕大多數電腦媒體學術研究,都致力於分析電腦的視覺輸出(如文字、圖像和互動),很少會考慮產生這些圖像的實質過程,也不會令人覺得奇怪。然而對於中文電腦和新媒體的學者來說,卻是特別急切的事,因為對輸出的關注,轉移了對拉丁字母占主導地位的無數重點注意力,包括編碼系統、印表機撞針的冶金特性、BIOS中斷、點陣圖網格大小等。見Nick Montfort, “Continuous Paper: The Early Materiality and Workings of Electronic Literature,” MLA Annual Conference, Philadelphia. December 2004. 該說法的完整文字見https://nickm.com/writing/essays/continuous_paper_mla.html; Noah Wardrip—Fruin, Expressive Processing: Digi-tal Fictions, Computer Games, and Software Studies (Cambridge, MA: MIT Press, 2009); Matthew Kirschenbaum, Mechanisms: New Media and the Forensic Imagination (Cambridge, MA: MIT Press, 2012); and Jacob Gaboury, “Hidden Surface Problems: On the Digital Image as Material Object,” Journal of Visual Culture 14, no. 1 (2015): 40–60.↺
21.第五章加入了克萊恩(Ronald Kline)和平奇(Trevor Pinch)在經典著作中所提關於使用者主導創新的對話。Ronald Kline and Trevor Pinch, “Users as Agents of Technological Change: The Social Construction of the Automobile in the Rural United States,” Technology and Culture 37 (1996): 763–795.↺
22.Jack Goody, “Technologies of the Intellect: Writing and the Written Word,” in The Power of the Written Tradition (Washington, DC: Smithsonian Institution Press, 2000), 133-138.↺
23.跟任何新造詞一樣,其他可能性也會隨之出現。我想到了Subtext(潛台詞)和subverse(顛覆),但把它們排除了,因為可能會跟「潛在主題」、「隱含意義」或「反傳統」等概念混淆。而術語如infrasonic(次聲波),代表的是「低於人類聽覺範圍」。然而超書寫這個詞的意思,並不是指人類感知的「下方」或「之下」,而是寫作過程中短暫且最終可拋棄的步驟。Underwriting(承保)是另一種可能性,但它有與金融和銀行業術語混淆的風險。hypotext(假文本)也許是最接近的競爭者,它也跟眾所周知的術語hypertext(超文本)提供了一個潛在的有效對立,可以被認為是僅連結到自己的文本(亦即它要表示和檢索的內容)。然而在我看來,後面的graph(書寫)的選擇,更能捕捉到關於寫作的潛在擴展性和多樣性。畢竟就前面說過的內容來看,hypography(超書寫)不一定是文字,它可以是手勢、眼球運動、各種符號和標記等等。任何可以紀錄的東西都可以作為超書寫的基礎。↺
24.W. A. Martin, The History of the Art of Writing (New York: Macmillan, 1920).↺
25.中國電腦和新媒體裝置中的超書寫規模和普遍性,使其有別於博爾特和格魯辛(Bolter and Grusin)的「超媒體」概念中,對於「即時性」的相反術語。整體而言,對博爾特和格魯辛來說,「超媒體」(hypermediacy)是藝術家、設計師或評論家的領域。這是一種帶有目的、通常具有明顯顛覆性的行為,人們可以透過它來吸引大家對媒體本身的關注——有的人可能會說這是數位時代的實體「詩」。但在中文語境中,超書寫是司空見慣的。雖然它與「超中介」(hypermediation)有某些共同特徵,但它絕對不是藝術家或評論家的舞台。超書寫是每個拿起數位裝置者的領域,博爾特和格魯辛的修正版。↺
26.跟Brian Rotman和Lydia Liu接觸過後,讓我的工作獲益匪淺,因為他們兩人都在我之前就探索過這些問題。羅特曼認為,語音文字的出現是人類「變得超越自身」的過程:一個認知自我異化的過程,創造了新的分析抽象空間,同時排除了其他認知可能性。雖然這個論點似乎與阿爾弗雷德.布魯姆(Alfred Bloom)和其他人的早期看法相互呼應,他們試圖尋找語言和認知樣式之間的關聯,但是羅特曼在避免將「拼音文字」和「中文」之間任何明顯或簡單化的二分法方面,完成了令人敬佩的工作。如果口說文字列印(呈現)出來是一種抽象行為,那麼超書寫似乎讓這種抽象更進一步。超書寫取決於抽象「抽象」本身的能力:可以說像一種脫離身體的體驗,或者說「瘋狂變得瘋狂」之類。
莉迪亞劉(Lydia Liu)說英語印刻在數位時代是表意文字式的英語,變成字母的「後語音」轉變。「什麼是數位寫作?」劉在接受採訪時談到了她的作品主題。「它是一個由離散的表意符號組成的系統——可以被電腦識別和處理的數字或字母。」透過中文語法,這些字母過去主要用於以語音為中心的書寫,現在則呈現出曾經被認為幾乎獨有的「表意」品質。見Brian Rotman, Becoming Beside Ourselves: The Alphabet, Ghosts, and Distributed Human Being (Durham, NC: Duke University Press, 2008); Lydia H. Liu, The Freudian Robot: Digital Media and the Future of the Unconscious (Chicago: University of Chicago Press, 2011); and “Interview with Lydia Liu,” http:// rorotoko.com/interview/20110615_liu_lydia_freudian_robot_digital_media_future _unconscious/?page=2. 另見Alfred H. Bloom, “The Impact of Chinese Linguistic Structure on Cognitive Style,” Current Anthropology 20, no. 3 (1979): 585–601; and Alfred H. Bloom, The Linguistic Shaping of Thought: A Study in the Impact of Language on Thinking in China and the West (Hillsdale, NJ: L. Erlbaum, 1981). 歐美脈絡下的數位書寫主要著作 ,參見Richard A. Lanham, The Electronic Word (Chicago: University of Chicago Press, 1993); Matthew G. Kirschen-baum, Track Changes: A Literary History of Word Processing (Cambridge, MA: Harvard University Press, 2016); N. Katherine Hayles, Writing Machines (Cambridge, MA: MIT Press, 2002); and N. Katherine Hayles, How We Think: Digital Media and Contempo-rary Technogenesis (Chicago: University of Chicago Press, 2012).↺
27.創建語言的例子包括世界語或克林貢語,輔助腳本之一是日語注音假名(用於幫助讀者辨別漢字字符的正確發音)。縮寫和母音減少的例子包括「congrats」和「imedtly」(替換immediately)。字母數字同音詞包括諸如「r」代替are)、「b」代替be等例子。在其他語言中,「6」代替意大利語的sei(6或「是」)。Braj B. Kachru, “The Bilinguals’ Creativity,” Annual Review of Applied Linguistics 6 (1985): 20–33; Braj B. Kachru, “The Bilingual’s Creativity and Contact Literatures,” in The Alchemy of English: The Spread, Functions, and Models of Non-Native Englishes, ed. Braj B. Kachru (Oxford: Pergamon Press, 1986), 159–170; Yamuna Kachru, “Code-Mixing, Style Repertoire and Lan- guage Variation: English in Hindu Poetic Creativity,” World Englishes 8, no. 3 (1989): 311–319; Brenda Danet, Cyberpl@y: Communicating Online (Oxford: Berg Publish- ers, 2001); 蘇席瑤,「臺灣網路的多語言和多正字法:大學附屬BBS上書寫系統的創造性使用」,Journal of Computer-Mediated Communication 9, no. 1 (2003), JCMC912, https://doi.org/10.1111 /j.1083-6101.2003.tb00357.x; Larissa Hjorth, “Cute@keitai.com,” in Japanese Cyber- cultures, ed. Nanette Gottlieb and Mark J. McLelland (London: Routledge, 2003); David Crystal, A Glossary of Netspeak and Textspeak (Edinburgh: Edinburgh Univer- sity Press, 2004); Hirofumi Katsuno and Christine R. Yano, “Kaomoji and Expressivity in a Japanese Housewives’ Chat Room,” in The Multilingual Internet: Language, Culture, and Communication Online, ed. Brenda Danet and Susan C. Herring (New York: Oxford University Press, 2007), 278–302; Tim Shortis, “Revoicing Txt: Spell- ing, Vernacular Orthography and ‘Unregimented Writing,’” in The Texture of Inter- net: Netlinguistics in Progress, ed. Santiago Posteguillo, María José Esteve, and Lluïsa Gea-Valor( Cambridge: Cambridge Scholar Press, 2007); Tim Shortis, “‘Gr8 Txtpectations’”; Blake Sherblom-Woodward, “Hackers, Gamers and Lamers: The Use of l33t in the Computer Sub-Culture,” unpublished paper, Swarthmore College, Swarth- more, Pennsylvania, 2008, https://www.swarthmore.edu/sites/default/files/assets /documents/linguistics/2003_sherblom-woodward_blake.pdf; Suresh Canagarajah, “Codemeshing in Academic Writing: Identifying Teachable Strategies of Trans- languaging,” The Modern Language Journal 95, no. 3 (2011): 401–417; Zhang Wei, “Multilingual Creativity on China’s Internet,” World Englishes (May 2015): 231–246; Li Wei, “New Chinglish and the Post-Multilingualism Challenge: Translanguaging ELF in China,” Journal of English as a Lingua Franca 5, no. 1 (2016): 1–25; Li Wei and Zhu Hua, “Tranßcripting: Playful Subversion with Chinese Characters,” International Journal of Multilingualism 16, no. 2 (2019): 145–161; Elena Giannoulis and Lukas R. A. Wilde, eds., Emoticons, Kaomoji, and Emoji: The Transformation of Communication in the Digital Age (New York: Routledge, 2020). 在蘇席瑤關於臺灣的著作中,可以找到一系列引人入勝的語碼轉換和風格化範例,還有Carmel Vaisman對希伯來語及其用ASCII字符表示的精彩研究見Carmel Vaisman, “Performing Girlhood through Typographic Play in Hebrew Blogs,” in Digital Discourse: Language in the New Media, ed. Crispin Thurlow and Kristine Mroczek (Oxford: Oxford University Press, 2011), 177–196.↺
28.Greg Downey, “Constructing ‘Computer-Compatible’ Stenographers: The Transition to Real-Time Transcription in Courtroom Reporting,” Technology and Culture 47, no. 1 (January 2006): 1–26; Miyako Inoue, “Word for Word: Verbatim as Political Technologies,” Annual Review of Anthropology 47, no. 1 (2018): 217–232; Dongchen Hou, “Writing Sound: Stenography, Writing Technology, and National Modernity in China, 1890s,” Journal of Linguistic Anthropology 30, no. 1 (2019): 103–122.↺
29.有時即使出現在鍵盤上的字母,也不代表字母本身。例如,要紀錄聲母「F」(即出現在單字開頭的「F」),使用者實際上並沒有按下代表「F」的鍵(即使上面有一個),而是必須同時按下另外兩個鍵:「 T」和「P」。↺
30.換句話說,如果學者們長期以來如Jack Goody所形容的,誤解了書寫和口頭之間的「介面」,那麼我們現在似乎就誤解了各種書寫語域之間的關係。見Jack Goody, The Interface Between the Written and the Oral (Cambridge: Cambridge University Press, 1987). 借用班傑明.彼得斯(Benjamin Peters)的話,在我們嘗試理解和理論化數位科技時,必須注意「文字所做的工作」;在這種情況下,隨著整個世界發生巨大的變化,詞語的節奏也不會改變。見Benjamin Peters, “Introduction.” In Digital Keywords: A Vocabulary of Information Society and Culture, ed. Benjamin Peters (Princeton, NJ: Princeton University Press, 2016), xv.↺
閱讀時點擊工具列右上角即可新增書籤。
閱讀時滑鼠左鍵選取內容即可增加。