历史学者墨磊宁:中文打字机,“最重要却被误解最深的发明”

图片
林语堂和女儿林太乙正在使用他发明的明快打字机,这台打字机的内部结构堪称天才,最终却没能量产。 (受访者供图/图)
“哒哒,哒哒,哒哒哒……”说起打字机,也许它的声音比画面更能直观地唤起人们的记忆。美国恐怖片《闪灵》里有一幕,濒临发疯的作家在打字机上重复敲打着一句话,“只工作、不玩耍,聪明的孩子也变傻……”同时打字机单调的按键声“哒哒”入耳,加重了影片恐怖变态的气氛。
但是且慢,为什么打字机的声音是“哒哒哒”呢?以及中国人看这部电影的时候,为什么顺理成章地就接受了打字机发出的声音是“哒哒哒”的设定呢?
二手拍卖网上静静地躺着一台20世纪五六十年代常用的中文打字机。双鸽牌,定价2980元。“一共2450个铅字,保存完好、按键灵活,大约六七十斤重,物流200元。”卖家对这台中文打字机的介绍,远远偏离了我们脑海中对打字机的想象。
图片
双鸽牌打字机曾配有一个不常用字的字盒,当活字字盘里没有想用的汉字时,工人要用镊子从字盒里取字。如何将上万个字符放进如此小的机器中,一直是中文打字机的技术难关。 (受访者供图/图)
对于大多数基于拉丁字母的拼音文字来说,在打字机上按下一个字母按键,通过传动杆的传导,相应的字母就能被印到纸张上,几十个字母,一张小小的操作键盘就能容纳,所打即所得,于是打字机的声音便成了理所当然的“哒哒哒”。
而对于机械时代的中文打字机来说,这样的技术路线则完全行不通,工程师们只能找出中文里最常用的2450个汉字,按照利于查找的原则排列好,传动杆在密密麻麻的字盘上方来回扫荡。打字员每打一句话,就像在地图上寻宝:“只”在字盘的中间,“工”很幸运离“只”不远,“作”却在左上角……如果哪个发疯的作家用中文打字机写作,想必发出的声音就会变成“嘎—哒、嘎—哒……”(“嘎”代表挑中的金属活字被送到卡字杆,撞击滚筒;“哒”则是金属活字被送回字盘的声音。)
这就是汉字进入工业时代后所面临的命运。1876年,中国海关官员李圭参加了费城美国独立百年博览会,看到了当时的新发明——一台英文打字机,在被英文打字机的便利震惊的同时,他也敏感地意识到,这台机器“惜不能印华文”。
如今我们熟悉的英文打字机,以美国雷明顿公司生产的打字机最为流行,一个单切换键盘,还有传动杆,字母线性地敲打在纸面上。很显然,后来流行的类似双鸽牌的中文打字机,技术路线完全不同于雷明顿路线。当象形、块状的中文面对这种基于线性的拼音文字而发明出来的机器时,种种尴尬充斥着中文打字机的发明历程,这其中既有天才的思想火花,也有挫败的实验和短命的投资。
“中文打字机不但是现代信息技术史上最重要却被误解最深的发明之一,它(不论是作为实体还是隐喻)还是一面无比清晰的历史透镜,我们可以通过它来审视技术的社会建构、社会的技术建构,以及中文与全球现代性之间充满矛盾的关系。”斯坦福大学历史系教授墨磊宁(Thomas Mullaney)在他的新书《中文打字机》中写道。
图片
墨磊宁(Thomas S.Mullaney),斯坦福大学历史系教授,哥伦比亚大学历史学博士,研究领域为中国历史。 (受访者供图/图)
如何让一种象形文字机械化以及数字化,这吸引了几乎全世界的技术语言学的专家与业余爱好者。在过去15年的研究生涯里,墨磊宁在12个国家的几十个档案馆工作过,“最让我印象深刻的是,关于中文的信息技术之谜是如何吸引世界各地的天才、怪人和业余爱好者的。从IBM公司、麻省理工学院到中国的政府和学术机构,我采访了他们中的许多人。”墨磊宁对南方周末记者说。
这些人的事迹被收录进《中文打字机》以及即将出版的续作《中文计算机》里,“中文持续地吸引着天才们的兴趣,是因为中文的电报、打字机和计算机问题超出了有关‘技术转化’和‘技术扩散’的传统叙事,这种叙事长期以来都主导着我们关于如何将西方的工业、军事及其他设备和操作方式传播到非西方地区的理解。”通俗来说,如果西方发明的内燃机技术传到中国,它需要的是资本、人才、政策的配合,但一台打字机的传播,则多了一个维度的障碍——文明的维度。
作为研究者,墨磊宁当然曾经亲自设计过一款中文打字机,但他没有在书里、也没有在采访中分享,“它们是如此牵强,以至于我都不好意思分享”。要设计一台不像双鸽牌那样以肉眼搜索为技术路线的中文打字机,所要攻克的技术障碍实在太大了。
事实上,历史上曾经出现过一款技术路线完全不同的中文打字机。它的体积和雷明顿打字机类似,而它内部的结构则堪称天才,这就是林语堂的“明快打字机”。
明快打字机消耗了林语堂多年的积蓄和十几年的光阴,只有一台原型机在1947年被制造出来,尽管当时的新闻报道与目击证人都证明它确实可以打出汉字,但它最终没有量产,没有被市场接受。然而,林语堂天才般地提出了“输入法”的概念——输入法不是英文打字机般的所打即所得,也不是双鸽牌打字机那样的以肉眼搜索汉字,而是向机器输入某种编码,以编码带动机械运转,最后生成汉字。对于今天的中文计算机使用者来说,这一套“输入—选择”的流程再熟悉不过,而它的先声就是林语堂。
明快打字机的内部结构非常复杂,即使以最简化的语言来描述它,也可以想象其零件之精密繁复。它既带有整字的常用字,又带有拼合活字的汉字部件,为了将数千个字符以尽可能紧密的方式安装到打字机内部,林语堂选择了一种类似于行星运行系统的设计。
在这个结构里,充当卫星角色的是一系列八棱柱状金属棒,每一个侧面的表面都刻有汉字和部首,8个侧面则一共可以容纳232个汉字或部首。6根八棱柱金属棒固定在一个圆形旋转齿轮里,就像围绕同一行星轴旋转的6颗卫星。同时,这些金属棒也可以绕自己的中心轴自转。林语堂一共做了6组这样的“行星”,然后将其固定在一个更大的圆形旋转棍上,就像围绕中央恒星运转的6颗行星。36个金属棒的卫星轴、6个更高级别滚筒套件的行星轴、1个最高级别滚筒的恒星轴,这就是它整体的设计结构,总共包含了43个独立转轴。使用者在键盘上敲击下某个汉字的几个部件,内部滚轴就开始转动,林语堂设计的检字法将每次排列组合后出现的汉字控制在八个以内,这八个汉字就会出现在键盘上方的“显示器”上,使用者就能选择其中想要的汉字——和如今的电脑输入汉字极为相似。
根据当时的记载,这台机器几乎能打出所有的汉字。但仅有的这台原型机已经遗失了,现在只能看到当年使用它的打字视频片段。2023年,一位B站网友和几位朋友一道,根据当时专利文件上的技术说明和林语堂留下的几十张设计图,试图用现代机械技术复刻一台明快打字机,很遗憾的是,三个月后,这个复刻实验也以失败告终。“明快”的内部复杂程度超出了他们的想象。
尽管“明快”失败了,但“明快打字机标志着中文信息技术的转变,这种转变可能连其发明者林语堂本人都不曾预料到”,墨磊宁说。
计算机早期历史“排异中文”
南方周末:林语堂发明的中文打字机为何没有被商业化?你相信它是一款成功的中文打字机吗?
墨磊宁:明快打字机是一个天才之作。然而,尽管它很出色,却未能取得商业成功。它背后的投资者都是美国人,他们被那个时代的地缘政治局势,包括朝鲜战争吓跑了。默根特勒莱诺公司(Mergenthaler Linotype,明快打字机的专利拥有者)对局势给其专利权的影响感到紧张,1950年,随着朝鲜半岛局势的升级,“明快”项目这个梦想也结束了。然后,正如我们所知的,林语堂本人也破产了。
然而,“明快”所提出的原则继续存在,被美国、英国和中国的工程师所接受,可以说,明快打字机不在了,但“明快”所发明的输入法思想则继续存在。
南方周末:很明显你对当初主张汉字罗马化的学者观点不以为然,但是以当时的历史情境而言,汉字拼音化是否也存在一定的合理性?
墨磊宁:从19世纪初开始,中国被卷入了一个无法控制的全球新秩序之中。在这一时期,不同政治主张的改革者对中国文明进行了批判性的重新评估。批判的主要对象是儒家伦理体系和父权制家庭单位。一些改革者呼吁废除汉字,他们认为这是问题的根源。他们试图按照土耳其语或越南语的方式,将书写系统罗马化。
然而,汉字最终并没有被放弃,另一群不同的人开发了技术语言系统来管理中文的信息环境,包括索引、字典和中文的计算工具。具有讽刺意味的是,这些建立这种信息基础设施的“赢家”都是匿名的,只留下了零散的资料;而那些呼吁废除汉字的人,如钱玄同等,尽管他们是“输家”,他们的名字却在大众中耳熟能详。
南方周末:你在书中提到了日文的假名打字机,但是在东亚的文字中,韩文的字形结构似乎更像汉字——虽然是拼音文字,但在空间上,韩文并不是线性的排列,这和中文打字机好像是相似的难题。韩文打字机的技术路线是怎样的?
墨磊宁:韩文字母的大小和位置都会根据它所在某个字而改变,这是西方设计的打字机(以及后来的文字处理器和计算机)根本无法处理的问题。人们想了各种方法试图解决这个问题,最激进的方法是把韩文打碎为一个一个字母,再把这些碎片化了的字母线性排列!这是一种怪异的、最终失败了的“雷明顿化”韩语的方法。
南方周末:在众多的技术路线中,雷明顿打字机的技术路线最终占据了主流,你认为最主要的原因是什么?
墨磊宁:雷明顿打字机公司的全球成功得益于其在英语世界的主导地位,特别是美国制造业。从这个起点开始,这种打字机通过英美渠道(无论是非正式地通过美国经济帝国,还是正式地通过英帝国)传播到世界各地。从此,单切换键盘打字机成为衡量语言现代性的标准,并被全球广泛采用。然而,雷明顿使用的单切换键盘只是19世纪打字的一种方法,当时还有索引打字机和双键盘打字机器。这些方法没能在英语打字市场上占据主导地位。
雷明顿打字机公司最初是一家美国内战时期的武器制造商,它与打字机公司和发明家合作,在1873年首次推出了肖尔斯和格莱登打字机,其特点是采用单切换键盘系统。直到19世纪80年代和19世纪90年代初,由于有了驻扎在不同国家的销售机构和直接代表,该公司在全球市场的销售才有了显著增长。
南方周末:这样的现象似乎并不单单出现在打字机领域,很多领域都经历了类似的技术演化之路,在你未来的关于汉字与计算机的书里,是否也存在这样的现象?
墨磊宁:《中文打字机》中探讨过的由拉丁字母主导的技术路线,其“遗产”在计算机时代被重新“激活”了。计算机历史的大部分时间里,计算技术一直偏向于某些字母文字,当然这其中没有比拉丁字母更重要的了。
例如,在20世纪中期,西方工程师确定,5乘7的点阵网格提供了足够的分辨率,可以在显示器和点阵打印输出上呈现清晰的拉丁字母。而如果要对中文进行同样的处理,就需要工程师将这个网格扩大到不少于16乘16。在20世纪60年代,ASCII(美国信息交换标准代码)背后的开发团队确定,7比特的编码结构及其128个地址为所有拉丁字母以及数字、符号提供了足够的空间。相比之下,汉字需要不少于16比特的架构来处理其超过6万个字符。
无论是从字符编码、计算机显示器、点阵打印机、编程语言、光盘操作系统、光学字符识别算法,还是其他方面来看,计算机的早期历史在很多方面都是一个又一个“排异中文的行为”的故事。
图片
在过去15年的研究生涯里,墨磊宁在12个国家的几十个档案馆工作过,采访了从IBM公司、麻省理工学院到中国的政府和学术机构的许多人,了解中文打字机的发明历程。 (受访者供图/图)
全球50%以上人口的书写系统被排除在外
南方周末:你认为中文的打字机和计算机发展历史,超出了“技术扩散”的西方传统叙事,你会担心你的著作被拿来当做“例外”解读吗?
墨磊宁:乍一看,现代中文信息技术的历史似乎是“例外”的,但它实际上表明了许多非拉丁语系文字在机械化时代所面临的一个更大的问题。中文和其他非拉丁语系文字,不得不放弃传统的人机交互模式。这是因为拉丁字母长期以来在个人电脑、电报、打字和其他技术中享有特权地位,对大多数其他书写系统不利。为了使非拉丁字母与西方的文字处理程序兼容,必须开发各种计算上的变通方法。
例如,使用阿拉伯文的人需要一些变通方法,以使这种经常根据上下文改变形状的文字能够在西方的文字处理程序中使用,而这些程序假定字母不会接触或改变形状。印度的文字系统,如印地语和乌尔都语,也需要不同的计算解决方案,因为天城体文字的字母间的“连接点”会在不同的词组中有很大的不同,而早期的西方计算机无法处理。当然还有刚刚说到的韩文。
今天,为了使个人电脑与各种非拉丁文字兼容,至少有七种不同类型的此类“变通方法”是必要的。这个问题影响到全球50%以上的人口,他们的书写系统被排除在西方制造的打字机、个人电脑等的计算逻辑之外。换句话说,在一个相当长的时期内,世界上大多数人为了使用电脑,需要通过各种硬件或软件解决方案来“改造”它们。
南方周末:计算机时代输入法的变迁对语言本身会产生什么影响吗?为什么现在使用五笔输入法的人越来越少了?
墨磊宁:五笔和其他基于汉字结构的输入法的衰落,是由于拼音输入法的日益普及。然而,拼音输入法的兴起在1990年代,这比大多数人意识到的要晚得多。在此之前,从1950年代到1990年代初,基于汉字结构的中文输入法更受欢迎。拼音输入法姗姗来迟,并不是因为工程师、语言学家或政治家对此缺乏兴趣或努力,而是由于拼音本身的深层问题,包括同音词,这给消歧带来了深刻的挑战。与基于汉字结构的输入序列相比,拼出汉字的全部音值似乎是一个巨大的倒退,而且在许多方面,这是从计算机中检索汉字的最不有效的方法。
然而,拼音输入却并没有失败。正如我在即将出版的《中文计算机》(2024年推出英文版)一书中所解释的,在1990年代以后,预测性文字和其他强大的预测技术的日益成熟和广泛使用,很快就与拼音输入“联姻”了。克服同音字、缩短序列长度等等技术攻关,也为拼音输入法的最终流行提供了一线希望。最重要的是,为了让汉语拼音成为有效率的中文输入法,它需要像五笔和其他输入工具一样:成为一个检索汉字的系统,而不是简单地“拼”出来。所以拼音输入法和汉语拼音不是一回事,前者是一种字符检索系统(用于计算机)。拼音输入法与汉语拼音(一种语音正字法)不可分割,但有本质的区别。
技术不断地在改变语言。无论是黑客语言、emoji、日本的kaomoji(颜文字)、辅助文字、翻译语言、代码转换、双关语、代码混合、Chinglish,还是网络语言、游戏语言等等,语言和技术在今天这个时代相互形塑,其深度可与洞穴时代的绘画与泥板之间的关系相比拟。
南方周末:很多新一代的网民会用拼音首字母代替汉字词组,比如yyds、xs、wsl,你知道它们代表什么意思吗?你如何看待这种现象?
墨磊宁:这是一个广泛的现象,我知道wsl代表“我死了”,可以说是英语网络俚语中的“OMG”的对应词;yyds代表着“永远的神”,基本上相当于英语网络俚语中的“GOAT”。
这说明了一个更大、更重要的现象,也是我在前面提出的:拼音输入法与汉语拼音不是一回事。汉语拼音是一个用拉丁文字母拼写汉字读音的系统,而拼音输入法则是一个基于从记忆中检索汉字的输入系统,它允许一个人使用各种捷径和缩写,而这些方法在技术上是汉语拼音不允许的。如果你在小学的汉语拼音考试中写上wsl,你就是不及格,但如果你在键盘上输入,就会成功找到你想要的字符。很多人误以为拼音输入法和汉语拼音是一回事。但我认为,虽然拼音输入法是以汉语拼音为基础的,但两者有根本的不同。
南方周末:现在很多中国人抱怨打字变多之后,当他们手写汉字的时候,会忘记怎么写。我个人也有这种情况。而对于拼音文字而言,打字就是写字,并不存在这样的问题。你是如何看待汉字所面对的这个问题的?
墨磊宁:在我的新书《中文计算机》里,我认为这种所谓的“提笔忘字”现象,并不是许多人所描述的书写障碍、文盲或失忆症。而更像是,在计算机和新媒体时代,所谓的“写作”正在发生变化,而用来理解“语言”的理论框架和理论术语却没有随之改变。
毕竟,如果21世纪的中国真的有数以亿计的新文盲或失忆症患者,为什么我们没有发现这种危机的证据,比如经济萎缩,或者高等教育的崩溃,以及中国如何能成为世界上最有活力的数字经济体之一呢?中国大陆有约9亿互联网用户,在不间断地传播华语内容,这怎么可能呢?如果这些人真的“不会写字”(书写障碍的基本定义),那么到底是谁在书写中文?在我的工作中,我会试图建立一套新的词汇来解释进而理解数字时代的汉字。
南方周末记者 王华震