?html> 钱锺书与中国古典数字工程-清华校友M(x)

麻花影视免费观看电视剧琅琊榜,天美麻花星空视频,麻花星空MV,麻花影视在线看电视剧软件,麻花传媒MD034苏蜜清歌,2023麻花产精国品免费入口,麻花传MD034苏蜜清歌,麻花视频V3.2.2纯净版

癑ֹ清华

钱锺书与中国古典数字工程

2010-12-23 |

当年张艺谋设计奥q开q式Ӟ中国人“天人合一”的哲学观。栾贉|曾打?sh)话向张的秘书反映说Q“错了,中国没有‘天人合一’这U说法,只有孔夫子说的‘h天合一’。”秘书说Q“老先生,你就别绕了‘天人合一’和‘h天合一’,不都一P”栾贉|_(d)(x)“‘你该我钱’和‘我该你钱’能一L(fng)吗??span lang="EN-US">

本篇为纪念钱Z先生癑ֹ诞辰而作Q不得不略加说明?

四十多年前我由北京分配到沛_一所乡村中学教书Q闲来无事,偶然在简陋图书馆书架下寻觅到一册撕d面的《宋诗选注》,马上p序言对典c如数家珍的熟稔Q“风犹拍古”的评说Q以?qing)纵横捭阖,跨越中西的文风所吸引。赶紧翻阅版权页Q始发现钱锺书之名。也许正是那一刻,文学研究所作ؓ(f)一个可望而遥不可?qing)的梦想Q开始植入我的心田。更料不?qing)的是大U十q以后,我居然能从这所乡间中学考入文学研究所Q后来又~业师陈毓u先生鼓励Q有机缘d入室Q数ơ亲炙于钱先生,自谓荣宠。钱先生仙逝后Q情怀无由抒发Q曾写过一小文《高׃Ԓ止》以CZ人?zhn)念之情,先是由v外一个网l期刊发表,后来为《解攑ֆ艺术学院学报》辑录?

钱先生治学议论广博。古今中西,汪洋恣肆QO无际涯。曾令很多慕名而来Q擅于沿袭蹊径,乘势而上者不知所措。于是出CU种贬论Q如“钱Z不过是一部电(sh)脑数据库”,“《管锥编》实在没什么,来?sh)脑发达Q资料输q去都可以处理的”。最q还有说“互联网出现以后Q钱Z的学问就减半了。”有的是,q些说法q大多出于中国社?x)科学院的后辈学者之口?

看来即Z院内“扫盜y(此盲非文Ԍ而是偏见之“盲”)的需要,也得介绍一下钱先生与“中国古典数字工E”的兌。需要特别说明的是,q本来应该是p三十q全w心投nq一工作的栾贉|先生或田奕女士等来完成的。我曄受邀担Q“中国古典数字工E”评审h员,披露q些情况也是自己的责仅R义务,q感谢栾贉|先生、田奕女士提供的实资料?

“抗拒新事物到头来的p|Q也是历史常lh的教训?span lang="EN-US">

如果单指记忆力,钱锺书先生兴之所臻I打通中外,信手拈来的功夫,的确lh“电(sh)脑数据库”的感慨。但是数据库毕竟只能|列资料Q显C异同,却不能分证L析,触类旁通。而且毕竟要靠人来输入主题词语Q靠脑来爬梳。所以直C天,我们也没有读到电(sh)脑版的《管锥编》?

其实C计算中国ZUCؓ(f)“电(sh)脑”,gq有一点言q其实。但是它l时代、社?x)带来飞跃,却是不争的事实。尤其是个h计算机和应用E序的发明,把与Z日常生活中许多看似麻烦的问题一下子变得如此h便,又能推而广之,扩大到工作、生zȝҎ(gu)面面Q恐怕上个世U?span lang="EN-US">70q代中叶的乔布斯Q?span lang="EN-US">Steve JobsQ和盖茨Q?span lang="EN-US">William Henry GatesQ也没有充分估计刎ͼ他们的创造很快就被g伸到了文学研I域?

上世U?span lang="EN-US">80q代初叶Q钱Z奛_q教授有机?x)到英国q修Q回来后偶尔谈v英国学者用计算机研I莎士比亚戏剧,取得显著成果Q钱先生立刻受到启发Q从1984q便开始倡导把计机技术引入中国古典文献的搜集、疏证和整理中来Q那时还?span lang="EN-US">1981q?span lang="EN-US">9月中央发布《关于整理我国古c的指示》以后不久。中国文字创始ƈ且不间断使用的历史甚为?zhn)久,历史文化端赖契刻、手书、碑版,形成典籍传承。虽自唐代写l、宋代版M来,开始Ş成“经生体”或“宋体”较范的文字Q但传本印版中仍然大量存在ƈ不规范的俗体字、异体字{,加之转抄再版的增删改动,隑օ讹夺错漏Q造成后h辨析认知的困惑。即博闻如钱Z先生Q也曑֜《管锥编》增补版《再版识语》里慨叹_(d)(x)

“初版字句颇(zhn)讹夺,非尽排印校对之咎Q亦原稿失检错漏所致也。国内外学h眼明心热Q往往Z二字惠书订缪……应再版之需Q倩马蓉女士荟萃读者来教,芟复汰重Q复益以余所雠定者,都勘改五百余处。亦知校书如扫落Ӟ庶免传讹而滋蔓草耟뀂?

得到q个信息后,钱先生立LC“中国古c电(sh)子数据化”的NQƈ委托栾贵明、田奕等付诸实施。因Z与栾既是同事又是师徒搭挡?span lang="EN-US">1972q夏由“五七”干校回京后Q钱先生写作《管锥编》,?wi)ָ助搜集数据,借阅图书Q钱先生也兑现允诺,为其命题Q对《永乐大典》进行整理。研I工作行了十年。《四库辑本别集拾遗》和《永乐大典烦引》完成后Q钱先生审阅、修正文E序aq书写题{。烦引一书由于出版g误,书名由杨l先生书写?span lang="EN-US">1982q_(d)钱先生又他的《宋诗纪事补正》交栄钞。这些历E,实际上已l埋伏下日后势必?x)进行“中国古典文献工E”的先声了。我惌也是钱先生宅心仁厚,所以提议ƈ郑重委托栾贵明先生完成此Ҏ(gu)J工E的初衷之一Q俾得后之学人避免费力费的订谬勘改Q学术研究探讨能够从基上步入正途。尤其是采用的字库考虑周全Q能够对古今汉字q行“全覆盖”。嘉惠学界大矣!

当时对于个h计算Z息处理能否中文化q有争论Q何况中国古c汉字库Q包括众多异体字、俗体字Q数量远q超Z《康熙字典》收录的四万多字Q所以字库容量必d뀂工作之初,研究组搜求了当时所有的“中文系l”及(qing)相关资料Q其中包括近十个中文pȝ的汉字收字情c(din)输入方法、构成理论和论文著述{,请钱Z先生选定。经q深入了解之后,钱先生果断地军_采用“仓颉输入法”作机汉字工作q_Q这是台湾朱邦复先生发明的,当时q面市不久。它的优势一是录入方法符合中国传l规则,二是字数全,l不能让古文献削适。在有限几次ȝU院的机?x)中Q钱先生每次都亲临研I小l,q多ơ用自己的稿Ҏ(gu)|贴资助研I小l的h创业?

?span lang="EN-US">1985q开始,研究组首先q行了《论语》数据库的徏设,q利地出版了第一部用电(sh)脑编制的《论语数据库》一书,取得了一大批U学化的《论语》数据。钱先生曾ؓ(f)《论语数据库》题{,q在序言上增补了一D重要文字:(x)

“从理论上来_(d)计算器和人类使用q的其它工具没有甚么性质的不同。它在还未被人广泛用的时候,除自w尚待完善以外,M(x)遭到一些抵拒。惯用旧家什的h依然偏爱着他们熟?zhn)的工兗有了纸墨笔砚‘文房四宝’,准还有h用刀W和竹简Q有了汽车、飞机、电(sh)报电(sh)话,也还有不惜体力和旉的保守者。对C物的抗拒是历史上常有的现象,抗拒C物到头来的失败也是历史常lh的教训。?

据我所知,C院研Ih员普遍用计机q行写作研究Q大概比钱先生的“先见之明”晚了近十年?

“计机可以帮助Q但q不能代替h脑?/span>

如果说《论语检索》还只是利用计算的快捷Q算是牛刀试的话Q钱先生l研I小l布|的W二Q务,便瞄准了瀚如L(fng)《全唐诗》了。唐代可谓中国古代的诗歌hQ吟诗甚臛_以称作唐人的思维和竞争方式,不但以诗取士Q以诗干谒,杜牧甚至有“千首诗M户侯”之句,而且深入日常生活Q饮宴酬酢固不能免,新婚时例有“催妆诗”,q温柔敦促女Ҏ(gu)下遮住面孔的扇子Q新郎也要赋“却扇诗”。所以唐代诗作既多,作者分布又极广Q从来没有清理裒集。乾隆后期董诰等借《四库全书》编辑,奉诏~纂《全唐诗》,可谓集中国家力量之大成,但是否完全,亦无定论?

研究组着手这工作后Q得Z一pd重要成果。他们在妥善地解决了全汉字库以后Q花了近三年的时_(d)输入?span lang="EN-US">27册《全唐诗》的全部正文、异文和注文Qƈl?span lang="EN-US">11ơ校寏V目前在大量E序软g的控制下Q能?span lang="EN-US">2分钟以内解决全部唐诗的检索问题,辑ֈ了准和高速的目标。比如,他们通过单的q算Q便可准地判定全唐诗共?span lang="EN-US">53035首,作?span lang="EN-US">3276名,订正了传l的四万多首和两千多人等{说法,为彻底打开中国古典文献研究的数量化大门开辟了全新的途径。他在给当时中国C院新da人杨润时的信中写道:(x)

“作Z个对《全唐诗》有兴趣的hQ我l常感到L词句的困难,对于q个成果提供的绝大便利,更有p的欣(zhn)。这是h工知能在中国古典文学研究上的重要贡献。?

当初的研I小l此时已l在钱先生的倡议推动下,扩大Z国社U院的计器室。他们ƈ不满于唐诗索引的完成,Z解决“计机里的唐诗如何帮助里的唐诗”的问题Q他们又用三个月旉研制Z“全唐诗索引生成pȝ”,包括索引~制、数据统计、印刷底版生成三大部分,成功地解决了古典文献索引的一体化~辑和排版问题,qؓ(f)使用者提供了全面、准数字化成果。如以李Zؓ(f)例,董诰~纂的《全唐诗》中Q属名李贺的诗共?span lang="EN-US">183首,其中1ơ重出的47首,2ơ重出的1首。所谓重出,是在同一作者或不同作者名下,有两首以上相同或基本相同的诗。在q个q程中,关键在于原数据的取法和重出参数的讑֮。他们采取了三个q箋汉字作ؓ(f)源数据,以诗句周Ҏ(gu)的排列l合Q句N字及(qing)q仄字的位置{因素确定重出参敎ͼ但主要根据是汉字本nq个参数。通过计算机的索和分析Q生结果以匡正前人沿袭已久的讹误?

中外学h对于q套当时内外最庞大的古典文学数据库Q给予了高度评h(hun)Q这个项目也因此获得?span lang="EN-US">1990q国家科技q步奖。计机可以~小查找范围Q提高比勘速度Q对复杂的v量查找也L胜QQ甚至绝大多数能直接Ҏ(gu)和非加以判定。计机可以帮助Q但q不能代替h脑。像意境雷同的查Q尽有汉字象Ş、会(x)意、Ş声的优越性,但计机的距d遥远。我惻I作ؓ(f)一个认真用计机对中国古典进行研I的人,既不?x)?f)计算机的发展和进步而昏昏,认定计算代替Q有了计机有了一切;更不?x)?f)计算机的难于N而茫茫,攑ּ实实在在、长期艰苦的努力和奋斗?span lang="EN-US">

“能帮助人的计算机,需要h的更多的帮助?/span>

但是钱先生ƈ未以此ؓ(f)满Q他认ؓ(f)Q?

“把唐诗输入计算机,靠的是在汉字库支持下的中文操作系l。没有相应的汉字库,如同拿来一只纸p的鞋Q穿在有唐三癑ֹ诗歌的天上Q只能说是一U认真的滑稽……计机里的唐诗Q已l开始成功地代替了书桌上的唐诗。但q绝不是攑^鼄的句P因ؓ(f)计算机里的唐诗难题还多。?

他还特地在田奕文章里增添了这么一句:(x)

“实践证明,能帮助h的计机需要h的更多的帮助。?span lang="EN-US">

上世U直?span lang="EN-US">90q代前半Q个机操作pȝq是英文DOSpȝ当家。工E研发小l所需要的数据库Y件在市场上ƈ没有人开发。栾贉|、田奕ƈ非计机专业人士Q他们付出极大努力学?fn)掌握基本要领,亲自撰写数据库所需要的E序Q所需软g是一个一个独立开发出来的?span lang="EN-US">1989q我开始用计机初始Q就是田奕到安l我安装他们自己研发的中文系l我的研究工作得以hQ至今犹存感Ȁ之心?

Z中国文史学科能够方便地应用计机q行研究Q钱先生多年来曾反复多次地规划了目标和原则,有书面的Q有口头的,今天看v来仍然新鲜正。栾贉|、田奕曾摘要如下Q?

一、逐步实施Q长期奋斗?

二、采用仓颉输入法和华康全汉字字库?

三、以作品为基本单位,用作者统l作品?span lang="EN-US">(q是划时代的创D)

四、对《四库全书》及(qing)其系列的应用必须慎重Q不能直接采取经、史、子、集分类Ҏ(gu)?qing)旧~辑方式?

五、实现准全面对作者、作品标题和文本字句索?

六、慎用汉语现代标点,正文和后人注释不得؜淆?

七、计机只能作ؓ(f)工具Q推q改善提高文史研I科学化?

八、你是裁~,只能是量体裁衣,不能做外U医生?

늅钱先生的q些意思。研I小l克服各U困难,l箋汉文史数据库的徏设。从1993q到2000q_(d)先后成功出版的《全唐诗索引》(30U)Q《全唐文新编》(22大册Q;《十三经索引》(4大册Q以?qing)数以十计的学术专著Q都能按时、按质、按量在他们研发的电(sh)脑系l上完成Q受到国内外学术界的q泛好评?

应当_(d)自从他们的工E声名鹊P又随着“电(sh)脑时代”的兴vQ不断有内外h士慕名前来,希望他们参与商业性开发和~著工作Q有些开列的条gq相当优厚。但是钱先生认ؓ(f)q项工程的根本目的ƈ非仅仅标C着中文古籍的“数字化”,单提供检索引证的便利Q而是着重推动中国古c整理和研究的科学化和h文化。因?span lang="EN-US">1992q_(d)钱锺书先生曾以“特U评论员”名义,写了短评《纠正“市侩化”的短视和浅见》,发表在中国社?x)科学院的《h文计机》报W四期上。短评说Q?

“崇高的理想Q凝重的节操和博大精qU学、超凡脱俗的艺术Q均h非商化的特质。强求hcȝ文化_a(b)Q去W合某种市场价gh(hun)D则,那只?x)ɿU学和文艺都‘市侩化’,丧失ȝ正进步的可能和希望。历史上和现代的q类事例Nq少吗?我们必须提高觉?zhn)Q纠正‘市侩化’的短视和浅见。?

研究组也始l坚持了钱先生提出的原则Q专注踏实地推进古籍整理校订、去伪存真的辨析工作。就已经完成文史库的规模来说。宋代之前的作品22万g已基本入库。另有专著和说q千U。至于二十四Ԍ文史数据库收有一套精l扫描的百衲本原本图库,q且制作了对应的_校文字库,在文史库里主要作为工具书使用。与此同Ӟ他们把二十四史中从帝王到牛二全部人物数收入Q编成《h名大典》,已收?span lang="EN-US">41万hQ另有辅?span lang="EN-US">15万个Q远q超q通行的仅收有五、六万h的《h名大辞典》。另一个附件《中国历史日历》约2?span lang="EN-US">3000万字也基本制作完成。这部分资料数量巨大Q可d规范中历公历的复杂对照关pR传l日历制作的大忌Q是依年表推估计。而这部《日历》上起夏朝禹Q公元前2071.12.28Q,下迄清末帝(公元1912.02.17Q,p3983q_(d)1454111天。由于多元历法的存在Q同一天可能是不同朝代、不同帝王、不同年P甚至不同的纪历方式,实际日历单数多达5194662条。因是以日ؓ(f)单位Q用v来完整、准。制作时量所能得到的正确信息(zhn)数列入历表Q内容包括朝代、帝讟뀁帝受年受年数、年q支、月数、月q支、日期、日q支、公元年、月、日{。将来逐步扩充为大事纪略性质的历史日历?

传统研究理念的“危机制造者?/span>

1982q钱先生曑ְ《宋诗纪事补正》交栾贵明缮钞。经q十五年的努力,栾贵明终于利用计机辅助完成了这个艰巨Q务。栾先生认ؓ(f)Q这部著作的学术价D不待aQ但更ؓ(f)重要的是Q不出多久学术界面对用新Ҏ(gu)完成的十二大册新书,会(x)感到_上的“危机”,因ؓ(f)他们不得不告别传l研I理c(din)而这一“危机”的刉者便是钱Z先生?

以现已完成的?sh)子汉文史数据库资料的基本构{方式来_(d)有着自己鲜明的特艌Ӏ既不像清h~纂《全唐诗》、《全唐文》断代史料那样存在重复؜乱,有许多跨朝代、越文体的纷争和遗漏{问题;也没有采用《十三经》用后h量注疏WQ没经典文本的传统Ҏ(gu)Q甚x弃《四库全书》以l、史、子、集分目~排的方式。而以作者ؓ(f)中心Q诏彠Z以Zؓ(f)本”的原则Q作品回归作者,从而古文献资料的整理~辑和数字化q上合理、科学的台阶Q也可以说是首创了汉文化资料pȝ化的新格局。于此同Ӟ又特别注重对前h成果的甄别。比如《易l》经q了多h的注释解析,有的甚至已经q背了原书的旨意Q从而引起了“解意”的对立和纷争,q显然与《易l》本w无兟뀂ؓ(f)此他们充分利用电(sh)子化的优势,采取l典与注释合而分、分而合的慎重措施?

一个实例是田奕最q完成的《永乐大典本水经注》。自从东汉桑钦撰写《水l》,而北郦道元“考校怹Q以具闻见,今略辑综川流注沿之AQ虽今古异容Q本其流俗,_陈所由”,加以注解成ؓ(f)《水l注》,历来被研I中国历史地理者奉为瑰宝。也是中国最重要的历史地理著作。晚q胡适曾I二十年心力Q撰q?span lang="EN-US">200万字考证《水l注》。其~v也是因ؓ(f)撰写《四库全书》的史官戴震没有看到江采进之民间刊ȝ赵一清《水l注》校本,故而有D本《水l注》“袭赵”之说。民国初q又l王国维、孟等人推波助澜,于是“抄袭说”几成定谟뀂而胡适考证则认为此案原pL学内部“汉宋之争”,以汉学的考据训诂Q纠正宋学空疏博而致。有学h甚至以ؓ(f)q里面牵动现代学术史上的一桩大事因~:(x)整理国故与所谓“中国的文艺复兴”。胡适等清代考据学ؓ(f)“中国的文艺复兴”,而戴震则是这一“文艺复兴”运动的d和旗帜,所以ؓ(f)戴震辩诬L。实以此支持他一生所提倡的“科学精”。但是争论双斚w没有真正看到《永乐大典》收存的《水l注》全部原本。幸有张元济先生有心Q将分落两处的大典本裒集影印出来?

田奕늅钱先生早q指C精,以选择底本为突破口Q?span lang="EN-US">2005q开始利用自己创建的扫叶公司的古典数字文献馆。轻村֜大典本和目前通行的杨守敬著《水l注疏》(1999q江苏新印本Q在?sh)脑中字字对应比较,清晰准确到每一个字、每一个字的笔甅R结果就摆在面前Q结Z毫不用添油加醋,最l也有了《永乐大典本水经注》的出版。得出的l论令h吃惊Q仅说《水l》本文被通行本认d《水l注》中的就?span lang="EN-US">513条,5775个字Q几乎占《水l》原文的一半。如果把通行本不W合大典底本的差错全部加CP是?span lang="EN-US">772条,8806字,也是惊h的数目。ƈ且ȝ出引起错讹的三方面原因:(x)

一、把l文改到注中Q把注改到经文中Q增多内容,脱减内容Q全是校雠者与领导者的主观判断?

二、通行本在没有充分证据的情况下Q对l文和注文增?span lang="EN-US">190处,?span lang="EN-US">1716字。主要在注文Q但q未说明增补原因?qing)证据?

三、古历史地理通过文字描述Q这已经与实际地貌变q难以相W了。何况加有大量随意性很强的删改文字Q特别是后来各注释家的见解。谁是谁非,没有标尺?span lang="EN-US">

田奕在她的自序中曾介l说Q钱Z先生曾ȝ以前是“由于狭隘的民族偏见Q褊H的正统观点Q封建思想的严重束~和‘官h章’的草率敯Qɘq项艰巨的工作有很大的缺点”,而现在她们所以能够较村֜完成q一重要典籍的校订,是“因为有一条新路正在电(sh)脑前面展开”。可知不仅h们正在依靠电(sh)脑进行研IӞ更重要的是电(sh)脑也得听从有智慧之h的指挥。两者相辅相成,~Z不可?

不知道已l熟l写作,q依赖于?sh)脑索数据库的h士,正在q行一些国家特大或大型的文史研究目Ӟ是否曄虑及(qing)商业性数据库的缺失或局限?是否已经攑ּ了自q独立思考和辨析Q?

q部独特的文献数据库q有一些轶事可道。某q日本三菱委托北京大学广邀各领域的汉文化专Ӟ参加由日本首席汉学家L的学术会(x)议,讨论日本输出语对中国文化的媄响。日Ҏ(gu)出“问题”、“内容”、“全部”、“参加”、“国际”、“实现”这六个名词Q是日本在明ȝ新的时候,通过了某些名人,把这六个词汇ULC国,q对中国的政沅R经、文化、社?x)v重大影响。与?x)一位中方学者抽I甉|贉|Q请帮忙查查。不C十分钟栾贉|将多达12늚数据发送了q去Q证实“问题”原五代后周HA《条陈A(ch)举事例奏》之“凡寚w题、Q从同议”;“内容”出自唐代《瓮赋》之“内容乃体,外坚其质”;“全部”出自晋代葛z《抱朴子外篇·自叙L(fng)五十》“少得全部之书”,{等Q尽中国古籍。第二天提交大会(x)后,日方再也不吱C?

又如当年张艺谋设计奥q开q式Ӟ中国人“天人合一”的哲学观。栾贉|曾打?sh)话向张的秘书反映说Q“错了,中国没有‘天人合一’这U说法,只有孔夫子说的‘h天合一’。”秘书说Q“老先生,你就别绕了‘天人合一’和‘h天合一’,不都一P”栾贉|_(d)(x)“‘你该我钱’和‘我该你钱’能一L(fng)吗?”事实上现在误以为常的“天人合一”,反映了让天来q就人的鲁莽Q而孔子注《易》所说的“h天合一”,则表达了Z动融于自然的和谐。可知一字之差,贻误后学多矣。如果再不重视计机时代中国古文献的学术清理Q不知还?x)有有多以讹传讹的“流行”,以错错的“成果”,以及(qing)“无根之谈”的横行无阻Q“水货专家”的肆言无忌?span lang="EN-US">

我们今天隆重U念钱锺书先生百q诞辎ͼ不仅仅是对于他学问h品的景Ԓ怀念,最重要的是能够把他的智慧风骨传承发扬,把他生前x的事业l做大做ѝ相信这才是慰问他老h家在天之늚最好缅怀?span lang="EN-US">

Q胡伟Q?span lang="EN-US">

Q本文写作时曑֏考刘圣清、李士燕采写的《中华文明史上空前浩J系l搜集工E》,《h民日报?span lang="EN-US">2005q?span lang="EN-US">3?span lang="EN-US">9日。尤其是参考中国古典数字工E研发团队ؓ(f)评审l提供的原始资料。}此注明,q表谢意。)

转自?中华M??2010q?span lang="EN-US">12?span lang="EN-US">8?span lang="EN-US">

相关新闻

| Ľ| | | ½| ̶| | ̩| ˮ| | ԭ| ׷| | | ɽ| Ӣɳ| | Ʊ| ī񹤿| | | | | | | ƴ| | ˮ| ̫ԭ| ؼ| | | | ԭ| ̫| | | ϲ| | ָɽ| |