画架 2008-1-13 01:16
建立清人詩文別集數據庫的構想
作者:徐海燕
清代文獻, 浩如煙海, 清詩文別集更是卷帙浩繁。對清人詩文別集資料的整理﹐至今已有王重民先生《清人文集篇目分類索引》,張舜微先生《清人文集別錄》,袁行雲先生《清人詩集敘錄》,柯愈春先生《清人詩文集總目提要》,李靈年﹑ 楊忠先生《清人別集總目》等工具書﹑ 專著出版。這些著作的出版, 為學者們整理清人別集打下了良好的基礎。從他們的成果不難看出, 清別集的數量可觀,狀況複雜, 不易蒐集和整理, 工作十分艱巨。
中國社會科學院文學研究所在很有遠見的先輩學者的指導下,並經工作人員的若干年努力,以及許多文化義士的慷慨捐贈,使其圖書收藏的質量和數量比例,雄居圖書館界前列。由於筆者的工作性質, 有機會涉獵文學所圖書室所藏清人別集寶藏。經粗略統計, 文學研究所圖書館的清人詩文別集種類多達三千餘種﹐這在全國文學專業圖書館中首也是屈一指的。對這部份清人詩文別集,進行深入的整理和研究﹑合理開發以及建立快捷方便準確科學的治理數據庫﹐對清代詩文的整理研究,乃至對有清一代的文化總結,將發揮獨特的作用。 一、文學所清人詩文別集的特點1.典藏豐富數量巨大
清人詩文別集的著錄,以《清史稿藝文志》為最多,但存佚情況非常混亂。現僅舉以下幾部通行的相關書目中有關清代別集的著錄情況:《四庫全書》有59 種;《販書偶記》3945 種;《中國善本書目》5509 種;李靈年、楊忠先生《清人別集總目》著錄近兩萬名作家所撰寫的四萬部詩文集;柯愈春先生《清人詩文集總目提要》收清代詩文集四萬部, 作者19700 人。清別集散見於各大圖書館、大學圖書館、海外圖書館及個人收藏,像文學所這樣相對集中的情況,確不多見。我們從文學所藏清別集的刊刻年代統計,便可得到印證: 清順治1 種;清康熙82 種;清雍正20 種;清乾隆394 種;清嘉慶403 種;清同治305 種;清光緒944 種;清宣統99 種。未標明刊刻年代的近千種。這三千多種別集包括是稿本﹑鈔本﹑刻本﹑寫刻本﹑活字本﹑排印本﹑石印本﹑影印本。
2.質量上乘流傳稀見
文學所的清人詩文別集, 不僅數量可觀,質量也屬上乘。有不少彌足珍貴﹑傳世罕見的珍善本。還有一小部分是僅存於世的孤本。總之這是一批具有相當研究價值的珍貴資料。現選擇其一小部分,略舉如下, 可窺豹於一斑: 第三届汉文史资料库研讨会文传论丛郘亭先生手稿莫友芝撰稿本歸恆軒詩集歸莊著稿本(殘) 絆葭村詩稿杜韜聲著清乾隆十六年(1751) 稿本沉吟樓詩選金人瑞清乾隆初抄本微蘅齋詩稿何畋稿本吳汝典詩稿吳夔稿本鶴栖堂吟草詩草文李錫麟撰稿本念樓集‧蘊山樓詩集劉寶楠撰稿本紫亭詩草口口撰稿本鏡西漫稿四集岑振祖撰乾隆間手稿本陔南山館詩鈔魏秀仁著稿本青峰詩鈔石史章世法撰稿本枕經閣詩稿宋維庚著稿本勞薪集梁運昌撰手稿本約社初集詩二集詩三集詩李恢撰手稿本幸草亭詩稿楊文瑩撰手稿本王于一遺稿王猷定撰康熙六年(1622) 賴古堂精刻本頻伽園文集六卷鄧炅撰雍正間刻本蠶尾集十卷附五卷王士禎撰康熙三十五年(1696) 刊本帶經堂集七編九十二卷程哲校編康熙間程氏七略書堂刊校本愚菴小集十五集朱鶴齡撰康熙十年(1671) 刊本耕雲堂集施溥著康熙四十四年(1705) 刊本(寫刻初印) 石臼集前集九卷後集七卷邢昉撰康熙間刻本含章館詩集黃培撰抄本印川詩草初集二集張汝濟撰乾隆刻本履閣詩集二卷張坦撰乾隆刻本古香堂六種王初桐著乾隆五十八年(1793) 刊本小獨秀齋詩二卷喬億著乾隆六年(1741) 刻本(寫刻) 附窺圓吟稿二卷劍溪文略釣渭閒雜膾五種潘炤填詞嘉慶七年(1802) 刻本(袖珍本) 烏蘭誓傳奇二卷秋水齋詩十五卷張映斗撰清乾隆十三年刻本唐石嶺詩文集唐煥著清刊本看到文學所這些優秀的藏書, 不能不讓人憶起文學所成立之初﹐由錢鍾書先生負責﹐汪蔚林先生﹑范寧先生﹑吳曉鈴先生等專家組成的“圖書治理委員會”, 他們將文學史料的收集與整理視為建所之本,也是文學研究之本。為給研究人員提供盡可能全面的文獻資料, 他們從採購﹑進書﹑編目﹑典藏等方面,抓緊時間不斷磋商, 不嫌其煩親自指導,以他們的學識和眼光為今天的文學所留下了獨具特色的藏書。
關於這部分珍本圖書,我的同事顧紅在《文學所圖書館特色藏書資源調研報告》中說: “明末清初邢昉所撰《石臼集》(清康熙間精刻本)、明末清初南昌人士王獻定所撰《王于一集》(清康熙間精刻本)、清雍正元年刻本《頻伽園文集》等均屬於罕見稀少圖書。清康熙年間抄本《含章館詩集》,明末清初人黃培撰。黃培字孟堅,號封嶽,即墨人。明萬曆三十三年生。祖父黃嘉善為萬曆丁丑進士,官至兵部尚書。父早亡,隨祖父長大。年十六入朝班,嗜學。該書原有刻本問世,因歷經清初文字獄後, 已全然無存。該抄本計收詩290 首, 及黃培死後其後人在原刻基礎上增訂而成。抄工精細,字體勁秀工整, 書中有‘黃彥高’印(3 處)。‘ 尚德堂黃’印(一處),尚是黃培後人家藏秘書。”寶貴的財富應用於學人, 是前輩學者的初衷。如何用現代技術使這批財富發揮作用,實現前輩的規范, 是留給我們這一代人的新課題。
二、建立文學所清人詩文別集數據庫的構想珍善本的收藏治理,在各大圖書館都是极嚴格的,因為這些國寶已不只具有單純“圖書” 的屬性了。不輕易示人,恐怕是最基本的原則。圖書館和學者的矛盾,在各不相讓中出現了。那麼怎樣既嚴格遵守圖書館的制度,保護好這一大批國寶,又可以服務於科學文化研究,讓珍善本能為研究人員提供便利呢? 顯然,使用電腦,實現數字化是唯一正確的科學途徑。在電腦上實現文獻資料查找已不是新鮮話題,我祗是想就清人詩文別集這個非凡的課題談談我的幾點看法。
1.目錄及提要數據庫:建立文學所清人詩文別集數據庫﹐第一步應建立目錄及提要數據庫。文學所的三千多種清人詩文集是第一手資料﹐便於著錄。著錄可分兩步進行: A)簡要的目錄,其中包括全部書名、作者、刻印年月、流傳記載以及本館圖書治理著錄例項等。
B)詳細的提要。此部份可與其他諸多相關目錄提要核對﹐對不同之處則一一加以著錄﹐ 同一書籍的版本異同、芰藏處以及著作人﹑編篡人﹑刻印人的詳盡資料等。
2.全文檢索數據庫:在目錄及目錄提要數據庫的基礎上﹐還應建立珍善本全文數據庫。將文學所清人詩文別集全部納入全文檢索數據庫。這樣既可以永久保存這些古籍﹐使之不再損壞﹐又可以方便閱讀﹑檢索。問題是這一數字化成果,必須並行雙軌,即圖形和字符兩種方式,二者絕不能偏廢。僅掃描為圖形狀態,則實際上不能達到真正全面實用的目標,其結果並不及縮微技術。僅以字符方式輸入文字內容,則仍不可能達到尊善從善的目標。一但有漏校誤植之處,仍要查找原善本,也不能從根本上杜絕善本損失的惡果。最妥當有效的方法是, 先掃描再錄入字符,掃描後善本歸庫,使用復製件進行錄入字符及校正工作。掃描件必須采用逐頁加貼水印的保密安全措施。我們對此可稱為雙軌制。
3.老話題:漢字平臺的選擇。建立上面所提到的數據庫,首要問題是要選擇一個合適的漢字平臺。文獻中的漢字,因為有文獻的支持而成為有生命的漢字,以此種方法建立的漢字庫無疑是最好的,也是唯一的科學方法。目前通行的漢字庫,大都由字典而來,一涉及古典,問題就多了,多到無法解決。但我認為,建立漢字庫, 假如不加考究地將全部文獻的字都歸攏起來,形成一個大漢字庫,也會過猶不及。造成諸多異體字風行的電腦,與缺字少詞的結果一樣,殊途同歸。漢字平台的選擇是第一位的。
4.建立由我們自己的數據庫, 可以發揮充分的自主性和準確的科學性。建立數據庫必須從原書出發, 不能有中間的環節, 這是數據準確的基礎。像我們前面提到的工具書,限於學者當時的條件,無論是人力還是物力,都很難達到準確完整。前邊表中所舉杜韜聲的《絆葭村詩稿》,不見於任何公私目錄。柯遇春和李靈年、楊忠所著大型清代別集《總目》著錄總數已愈四萬種,但均告漏收。其實原因佷單純,就是他們不能上逼清天, 下落黃泉, 有所遺漏,情理難免。而現在我們有了電腦,再有了合適的漢字庫,用現代技術牽手古典文獻,加上圖書館領導的支持,實現數據庫的建立,並讓它準確發揮作用,指日可待。