20世纪下半叶,人类跨入了以信息符号为载体的数字化时代。在文学艺术领域,数字化改变了文学艺术的生产方式,引发了文学观念的变革,极大地推动了包括古代小说在内的文学研究方法的更新,以及研究思路的拓展。数字化对中国古代小说研究的影响主要从三个层面反映出来,即管理数字化、传播数字化和研究手段及视野的数字化。
一
所谓古代小说管理的数字化,就是以电子文本取代传统纸介质文本,并综合与古典小说有关的地理、历史、文化信息,进行统一的编码处理,形成既保留传统纸介质图书的全部信息,又具有强大的检索、查注等功能的全新媒质。主要包括两层含义:一是小说信息资源存储的数字化,也就是将小说的文字内容输入计算机,读者通过“比特”这种虚拟形式而不是纸介质的形式阅读小说;二是古典小说及相关文献的综合处理,即在小说文本及与小说相关的文献实现数字化存储的基础上,借助软件管理系统,在小说文本上增添标引与检索工具,实现相关数据间的交互检索。
近年来,中国古代小说存储数字化的工程取得了较大进展。《三国演义》、《水浒传》、《西游记》、《金瓶梅》、《儒林外史》、《红楼梦》、《聊斋志异》等,因其知名度较高,甚至出现了不同的网络版。录入者还比较注意这些古典名著的续书,如陈忱的《后水浒传》、丁耀亢的《续金瓶梅》、陈少海的《红楼复梦》等,都有电子文本。才子佳人小说被视为古代言情小说,娱乐性较强,受关注程度也较高,如《玉娇梨》、《好逑传》、《定情人》等五六十部才子佳人小说都有电子版。《青楼梦》、《品花宝鉴》等狭邪小说,《肉蒲团》、《如意君传》、《痴婆子传》等部分香艳小说也实现了数字化存储。汉魏六朝的志人、志怪小说以及唐宋传奇,如《搜神记》、《游仙窟》、《太平广记》等,都有电子文本。据不完全统计,目前已有七百余种中国古典小说实现了数字化存储。
数字化存储的小说可分为文本型及仿纸介质型两种。文本型存储只需将小说文字内容输入或通过扫描录入计算机即可,没有太大的技术障碍。因此,文本型存储的小说数量较多,传播也较为广泛,极大地提高了古代小说的普及程度。但文本型小说只适合普通读者阅读,对于专业的研究者来说,简单的数字存储式的小说一般缺少版本情况说明,参考价值不大。由于汉字编码问题,制作者也无法补齐古籍中的生僻字、异体字,文本中错字、别字、漏字较多。
在电子文本的基础上,研发者推出了数字化图书。这种图书利用超大字库,解决了文献典籍的缺字问题,并对存储的信息进行重新排版、转换,将电子文本还原为纸介质书籍的原有版式,保留了纸介质图书的全部信息。借助于各种软件,这些电子书籍还附加了导航、自动导读等增值信息,可以根据作者、标题、主题、位置等检索确定所需要的资源。有些研发者甚至对整部著作进行详细、全面的分类,把信息按栏目或章节序化,读者可以根据字、词对文本内容进行精准检索。仿纸介质的数字化小说大多见于数字图书馆中,这些小说往往制作精细,在版权及文字内容上等同于纸介质小说,在检索功能方面又大大优于传统的图书,比较适合专业研究者使用。
但古代小说的数字化管理,不是简单的小说电子文本化或仿纸介质存储,而是一整套面向特定对象、包含了各种相关信息的数字化小说资源的综合。也就是说,实现了数字化管理后的中国古代小说,既包括所有数字形式的古代小说资源,也包括与中国古代小说有关的各种文化资源:从内容上说,有经过数字化转换的文史哲和历史地理资料;从资料类型上看,有期刊、参考工具书、专著、视频音频资料等,并且各种资料之间必须实现交互检索。
从这个层面上看,中国古典小说管理数字化尚处于起步阶段。虽然有些数字图书馆搜集了大量古代小说及相关研究资料,如超星图书馆收录了包括1975年人民文学出版社影印的嘉靖壬午刻本《三国志通俗演义》、1975年中华书局影印《第五才子书施耐庵水浒传》、1985年江苏古籍出版社排印《贯华堂第五才子书水浒传》、1981年中国书店影印《详注聊斋志异图咏》(但评本)等小说近300部以及《红楼梦》研究资料150种左右,《金瓶梅》研究专著约30种,其他小说研究专著近300种,但其收录的研究资料基本限于20世纪60年代至80年代期间出版的著作,远远没有跟上纸介质图书出版的步伐,不能满足研究者的需求。另一个令人遗憾的事实是,现有的检索系统大都是一些孤立的“子系统”,没有真正融会,形成全面、有序的管理信息系统。如在超星图书馆检索《醉醒石》这部小说,只能在该图书馆内部寻找与小说文本有关的信息,不可能搜索到与该作品相关的其他小说文本及其研究资料,更不可能链接到其他数据库。中国古代小说研究亟待形成有一定规模的、在内容或主题上相对独立并能实时互检的数字化资源。
目前,由首都师范大学周文业先生主持的“《三国演义》电子史料库”已完成了版本对比、图文对照及地图集制作工作;台湾元智工学院早在20世纪90年代即开始研发《红楼梦》的多媒体系统,力图将人物族谱、地图及物品等与数字化存储的《红楼梦》整合为一体;而其它中国古典小说的管理数字化工作尚无显著起色,更谈不上实现小说数据库间的交互检索。
就总体而言,中国古代小说的管理与数字化管理有很大的差距。一方面,数字化的小说资源不够丰富;另一方面,数字化管理智能性、集成性及动态开发性的优势在中国古典小说领域还没有得到发挥:在今后的研发过程中,不仅要注意资料的搜集,更要致力于打破诗、文、小说、戏曲的界限,打破文史哲分科的界限,在实现小说间交互检索的同时,探索小说中的诗词与其他诗人作品互检、小说与诗词中典故情况交互查询以及诗词、小说的历史、地理、文化背景实时检索的可能性。
近年来其他领域的开发经验表明,不可能用一个统一的系统或格式来管理古代小说典籍的全部信息,即使对于同领域的内容,也可能需要根据不同目的而应用不同的但可相互转换的软件系统。另外统一的、集中计划式的开发标准不适合Internet环境,不利于充分调动各方面力量。但是,在古代小说完成管理数字化的过程中,应尽量争取“标准化”,或妥善解决数据库间的互操作问题,实现古代小说数字化信息资源体系之间的透明检索,真正实现整个古代文学学科管理的数字化。
二
随着信息传播手段的多样化、全球化,在中国古代小说资源数字化存储的基础上,小说的数字化传播成为必然趋势。所谓数字化传播,即网络传播,主要是指小说资源转换成数字信息后,以信息流的形式,借助计算机通讯网络进行传播,小说资源的发布及阅读成为虚拟化的上传下载数据,读者只需手持鼠标上网点击,就可以浏览有关资源。数字化传播不仅极大地提高了信息传输的数量、速度和质量,而且大大增加了信息组合的可能性,使古代小说传播呈现出高速度、低成本、强互动性的特点。
小说的数字化传播以联机操作输入与输出为基本方式,以计算机中心文献库为其存在形式,信息在有线甚至无线的网络中流通,读者可以随时随地从网络中读取所需的数据。小说的网络传播改变了传统的资源传播方式,因其可重复性、同步性及低成本性,使中国古代小说的免费阅读成为可能。亦凡书库()是较早在网络上传播中国古代小说的网站,百万书库(www.bwsk.com)在网页上推出了120多部中国古典小说,北极星书库(www.ebook007.com)也上传了部分中国古典小说名著,并有便捷的下载功能。这些网站是免费的,一般只传播小说文本,缺乏综合性、系统性的小说研究资料;其小说资源大都为电子文本型,缺少附加功能。
针对这种情况,部分网站开始从专业性、大容量、资料的丰富性入手,建立中国古代小说专业网。这类网站针对特定的群体,并收取一定的费用。如中国古代小说百科全书网(http://xiaoshuo-book.db66.com)是搜集小说文本较为齐全的一个网站,有志怪小说、传奇小说、话本小说、历史演义、世情小说、狭邪艳情、才子佳人小说、侠义公案小说、谴责小说等近六百种,该站还上传了有关宋元明清小说批评理论的概述。明清小说研究网站(www.mqxs.com)专业性更强,它充分利用网络传播的优势,集图书上传、小说研究著录、资料选编、网上购书及有关明清小说的新闻于一体,有中国古代小说研究专家的基本情况介绍及学术会议的综述,还设立了交流社区,为古代小说研究者及爱好者提供了互动交流的园地。该网站于2002年7月开通,因时间短,信息收集未能齐备。其中有小说100多部,均为pdf格式,没有提供相应的检索功能,读者如免费注册为普通会员,可阅读其中部分小说,注册为VIP付费会员,即可阅读全部库存小说、有关研究资料,欣赏明清时期小说的版刻。国学网站(www.guoxue.com)辟有小说研究的页面,其中包括文本型的古典小说、现存通俗小说目录、小说史料目录、部分明清时期小说插图及今人的研究著作。
超星图书馆(www.ssreader.com)、中国数字图书馆(www.d-library.com.cn)、上海图书馆(www.digilib.sh.cn)、书生之家数字图书馆(www.21dmedia.com)等都是通过网络发布图书的大型网上图书馆。比如,读者登录超星图书馆,可以根据关键词检索该馆是否藏有自己所需要的小说,下载或在线浏览图书,还可以在线寻书,或就某个专题向专家咨询,图书馆还设有专门的书讯书评栏目,提供最新的图书信息,还有读书社区,供会员自由交流。
网络的出现不仅使中国古代小说的传播方式发生了变革,还保证了中国古代小说研究信息以低廉的传输成本高速传播。网络电子期刊将是今后小说研究资料传播的重要方式之一。网络电子期刊融编辑、存贮、传递、检索与服务等各项工作于一体,全部工作都在电子计算机系统和网络上完成,读者可以直接、快捷地查阅有关资料。中国古代小说研究期刊资料的研发起步较晚,但发展速度较快。目前虽尚无专业的小说研究期刊网站出现,但如中国科技信息研究所万方数据中心(www.chininfo.gov.cn)、CNKI知识创新网(www.cnki.net)、中国互联网信息中心(www.cnnic.net.cn)等电子期刊网站收录的有关古代小说的论文已比较齐备。其中,万方数据库提供了多种人文学科期刊,并提供分类检索、网上投稿、在线订阅、数字论坛、论文统计等服务。CNKI中国期刊网(www.chinajournal.net.cn)有期刊、报纸的全文型及题录型浏览数据库,也提供网上投稿、网上采编、期刊评价等服务。
在中国古典小说的数字化传播方面,网络互动功能有待进一步加强。各网站,尤其是小说研究的专业性网站除了增加小说的信息存储外,可提供信息增值服务。如推出“在线服务”,建立虚拟的参考咨询台,将资料库设计为一个在专业人员协助下为用户提供智能服务的透明知识载体,专业人员针对读者的讯问,给予主题解答和指示,提供有关目次、文摘和索引。也可提供专门的园地,使编者、评论者、读者之间可以通过计算机系统,在网络上进行即时对话,使传统的单向信息流通方式变成一种带有显著的交互性特征的双向或多向的信息流通方式。
要进一步研究小说资源超媒体化的可能。所谓超媒体即将数字化了的小说文本以及与小说相关的文字、图表、声音、图像、视频等多媒体信息发布于网络上,并对各类资源进行重新组合,提供多路径、多点向的不同链接。这种方式虽然在信息资源的组织及有序化方面存在较大的难度,但它避免了检索语言的复杂性,使人们可通过高度链接的网络在各种信息库中遨游。
要尽可能地提供免费的资源。在这方面,Microsoft公司window系统的成功与苹果公司Mac运行系统的失败,对古代小说资源数字化的开发商来说,是极好的鉴戒。事实上,前期提供免费资源可以进一步提高大众,尤其是专业研究人员对小说数字化的认同度,为开发者创造更大的盈利空间。在这方面,中国古代诗歌的研发者先人一步,他们将全唐诗的电子检索版分为公共浏览版和专业检索版,并在网络上提供免费资源,虽然检索速度较慢,功能不够完善,但能满足基本的检索需求,为专业研究者提供了极大的便利,也通过网络进一步扩大了该系统的影响。
三
古代小说研究的数字化以管理数字化以及传播数字化为前提。它所造成的若干重要影响已逐渐引起学术界的重视。主要有以下四个方面:
其一,极大地提高了工作效率。利用计算机可简化小说研究中的某些单纯的技术性工作。计算机具有超强的记忆功能,可以在几分钟之内完成一本巨著的字汇、词汇的统计工作,且失误几乎为零。在计算机出现之前,对小说进行数理统计要耗费大量的时日,且错误率较高。如1980年陈炳藻先生尝试运用计算机对《红楼梦》的字汇进行统计,以证明《红楼梦》前八十回和后四十回为同一人所著[1],比对《红楼梦》进行数理统计的瑞典汉学家高本汉(Bernhard Karlgren)的人工概算更加精密、准确,也更加快捷。数字化传播摆脱了传统图书流通的局限,数字保存的非物质化,大幅度地压缩了存储空间,降低了物质消耗,能有效地提高古籍珍本、善本阅读量,避免对纸质文本的磨损,对保护古籍起到了极好的效果。数字化传播的非线性、无界性,可保证资源高度共享,保证同一时间内多个用户查询、阅读资料,极大地提高了资源利用效率。在信息处理上,计算机可以自动生成摘要、条件查询,极大地简化了人工操作程序。目前,中国古代小说的检索方式由查阅书本、刊物、卡片转为利用网络搜索引擎、软件的搜索系统,可以快速、精准地查询有关内容。利用计算机可以更便利地对古典小说进行整理,勘定书中记事及文字异同,对小说进行深入的考订、校正。特别是小说研究成果实现数字化后,研究者可根据关键词、主题或篇目查找出某领域的相关研究文章、专著,宏观掌握该领域研究现状,及时调整研究方向。
其二,数字化的全面铺开有助于打破学术研究精英化的局面。数字化、网络化改变了以往媒介单向传播的特点,使小说的阅读呈现极强的互动性。以往读者阅读中国古典小说或有关论著,往往是单向地接收。由于传播媒介的限制,大部分读者只能私下表达个人对小说的观感或对论著的意见。随着中国古典小说全面实现数字化传播,读者将不仅掌握信息接收的主动权,更可以通过网络即时向公众表达个人态度和看法,甚至可与某论文的作者进行直接交流。由此,中国古典小说的传播就不再是单向式,而是平行的对话式,这种友善化、个性化的沟通,促使鉴赏群体、阅读群体进一步大众化、平民化,有助于打破研究精英化、阅读精英化的局面,一方面有利于扩展中国古典小说在民众中的影响,另一方面,也能够促使学术研究者扩展视野,发现新的研究视角和研究领地。
其三,数字化不仅带来研究群体的扩大,还极大地影响了研究者的思维方式,促使文学批评方法的更新。比如:网络可以让我们真实地体会到“非中心化”的现实性存在。网络以超级链接为其基本构成方式,所谓超级链接,即信息点与信息点之间的关联,通过超级链接,人们可以便捷地从一个网页转移到另一个网页。在网络上,由某个信息点出发,可以点击无限多的链接,直到最后,我们发现自己浏览的信息已经与当初的信息毫无关系。这种数字化带来的“非中心化”,可以说是对德里达的后结构主义的现实性注释,当研究者更多地在生活中体会到生活的“非中心化”本质时,无疑会更加自觉地吸收西方文学理论,以新方法、新观念介入古代小说研究。
对超级文本(hypertext)的理论性探讨让我们对中国古典小说及其续书有进一步的认识。所谓超文本,就是非顺序性写作(non-sequential writing)[2]。超文本小说的作者往往给情节发展设置多重路向,根据点击的链接不同,故事情节的走向也会发生变化。每一个链接都会形成不同的文本,从而产生不同的文本意义。如《金瓶梅》就是从《水浒传》“武松杀嫂”铺演开来,形成了一部与《水浒传》在内容、风格、表现手段方面完全不同的长篇巨著。一些研究超文本的理论工作者提出,从心理学上看,人的思维往往是非线性的,超文本结构是最适合人类本原状态的阅读文本。我们发现,在小说创作领域,中国古代作家充分发挥了思维的非线性、跳跃性、弥散性。正如超文本小说作者利用计算机“断裂”、“交错连结”、“非线”、“多向”等特质,打破了“诠释文本”和“使用文本”的界限[3],中国古代小说续书的作者也根据自己的喜好对小说进行重构,形成自己的一套文本体系,这既包含续书作者对原书著者的理解,也是作者个人的再创造。
数字化将极大地改变中国古典小说的研究方法,需要提请注意的是,由于技术上的限制,非西方文字的“数字化”比西方文字要困难,西方的“信息霸权”很容易对中国文学,尤其是古代文学研究造成新一轮的冲击,包括中国古典小说在内的中国古代文学如何在数字化时代真正跟世界文学研究交融互通也是我们面临的一个重要课题。
其四,数字化正逐渐造成若干盲点或薄弱环节。数字化的宗旨是充分发挥电脑的作用,但对电脑的习惯性依赖很可能导致真正意义的阅读和思考的匮乏。一个学者,如果忙于点击,而无心沉潜于文本中作反复的涵咏、体悟,他对文本将永远不可能有真正的了解,尽管他可以准确地统计出种种数据。这种真正意义上的阅读的匮乏,将使诸多学者逐渐丧失把握文本的能力。比这一情形更值得关注的是:一个学者,如果过分热衷于凭借技术而不是思想就能完成的课题,人文关怀的淡化和阐释能力的退化将不再是一个遥远的事实。人文学科的本质内容是技术所不能完成的,迷恋于技术操作而不是思考,其极端后果是人文学科的消失。这样立论,就目前而言,似有危言耸听之嫌,但是,就数字化所造成的盲点或薄弱环节的深远后果而言,对这一现象保持足够的警觉性是必要的。文学研究本质上是人的事情而不是计算机的事情。
[参考文献]
[1]陈炳藻从字汇上的统计论《红楼梦》作者问题[J]香港:中报月刊,1982,(27):46~51
[2]Theodoo Holm Nelson.A File Structure for the Complex,the changing and the Indeterminate[Z],Proceedings of the ACM National Conference,1965.
[3]吴伯凡超文本的力量[DB/OL]http://www.blogchina.com/new/member/_%CE%E2%B2%AE%B7%B2
(本文原载《东南大学学报(哲学社会科学版)》2005年第3期)