用戶登錄投稿

中國作家協會主管

錢鍾書也曾提到“人工知能”
來源:文匯報 | 張治  2025年05月12日08:03

我們現在就應該準確地向AI技術開發人員表達出我們在人文學術特別是文學教育的方面,需要的幫助是什么。我認為挑選閱讀難度最大的文本諸如《管錐編》,恰恰是最為合適的例子。

2003年,商務印書館影印出版了《錢鍾書手稿集》的頭三卷,題為《容安館札記》(此后十二年間又影印了68卷《中文筆記》《外文筆記》)。這是錢鍾書在1953—1973年二十年間撰寫的札記體論著,《七綴集》里的部分論文、《談藝錄》的補訂和《管錐編》基本框架,都出于此。手稿正文外夾雜眾多補白,又語涉多種文字,紛繁交錯,常人難以辨識,就連目錄都未能整理出來,故雖然錢鍾書聞名于世,卻一時少人問津。

2005年讀博士時,我受《萬象》雜志刊發劉永翔、劉錚、范旭侖等先生文章影響,對《容安館札記》產生興趣,深感這是一個富礦,若要開掘,還需下很大功夫;于是從中文系資料室借閱此書,開始對其中一些篇章謄抄整理,并在畢業后逐漸寫成文章。之所以采用手寫謄抄而不是錄入電腦,是因為起初我還很喜歡錢鍾書的書法,想要學習摹仿,也由此可以進一步熟悉他書寫中西文字的一些習慣,還能再提高我釋讀手稿的能力。

后有旅美華人“猶今視昔”先生,在網上定期發布他對《容安館札記》整理的電子文本,起初進展速度比較慢,且有不少問題;后來逐漸上手,顯然是熟悉了錢先生的手寫習慣和札記補白的規律,并且有不少熱心的網友積極幫他校對文本,甚至提供一些查找相關電子文獻的資源或方法。文本電子化便于檢索,抄寫在紙冊上的常規作業完全無法實現這一步。“猶今視昔”先生堅持多年,終于完成了全部《容安館札記》手稿的釋文近300萬字,無償發布于互聯網,嘉惠學林,功勞最大。后來有些學者的研究成果,包括碩博研究生的學位論文,對此多有借鑒。

我自己做錢鍾書研究,也幾乎都先進行《容安館札記》的全文檢索,這比人力的通讀省力,由而可以在很多地方達到比較具有縱深度的思考起點。當然,我并不完全信任他人的整理文本,在論述中具體引用時還是會同時查對手稿的影印本原文。“猶今視昔”先生曾在微博與我通信,說起還有意愿去完成一個多元文本的數據庫,在手稿釋文中建立若干超鏈接。我的理解,這除了把釋文和手稿原件直接對應起來外,至少可以關聯起對于錢鍾書旁征博引中西古今著作的原文段落乃至整部同版本書籍,也可以建立文本疑難字詞的權威工具書解釋,引用不同語種文字的重要譯本,乃至圖像和其他多媒體資源。

暢想一個手跡“標準件”的數據庫

技術條件的時代進步的確是可以和人文學術研究的動態發展協調同步的。這種數據庫的建設方式,其實就類似我們讀書做學問的過程,包括了文獻的匯集關聯,字句的解釋譯述。我現在研究錢鍾書的學術思想和讀書意趣,特別關注個人閱讀史的視角,借用書籍史、出版史、學術史和文學批評史幾方面的方法進行考據辨析,所入手處大概與上述數據庫的局部建設思路有些相當。出于對錢鍾書讀書筆記的喜愛,我于其所讀書都極為渴望一睹真容,這包括公家圖書館里借閱的原件以及借書卡上的簽字和日期,他本人的藏書以及上面的圈劃批語。我并不奢求物品原件上的占有,往往能得到朋友們賜示的相關圖片就很滿足。此外,我的幾位朋友,特別是熱衷于近代文獻與掌故學的宋希於先生,曾經談到一個“標準件”數據庫的概念,大概意思就是,在手稿研究中,把確認無誤的、書寫者盛年最成熟的或最具代表性的手跡,逐字建立單件的高清圖像,以便于調用參考——這些也都是可以由數據庫建設做到的。

大而言之,幾乎一切人文教育都應該是如此開展的,譬如西方古典學界早已開始建設的珀耳修斯數據庫(Perseus Digital Library),提供了古希臘羅馬文學名著的原始文本和英譯對照,原文逐字直接鏈接權威辭書,并且涵蓋歷史地圖、哲學文獻、考古資料(如錢幣、雕塑圖像)及藝術史內容,從而支持多維度研究古典文明,促進文學、歷史、藝術等領域的交叉分析。這種設計架構,很類似于19世紀西歐人文中學里的古典語文學教育,當時很多古典名著的中學讀本強調注釋要豐富吸收學術界成果,并以圖文并茂的方式,藉由一部經典使讀者了解整個古典文化,旨在使人掌握讀書門徑,而非將發表創新論文作為第一目標。數據庫建設可以將這個宗旨發揮到極致,也不妨呼應時代的需要。當前AI技術日新月異,假如建成手跡標準件的數據庫,是否意味著最終實現手稿的智能識別和釋讀?就目前所見的一些技術,在這個方面實際效果并不理想。

更切實一點說,目前網絡搜索+高校局域網資源的好處,在于即便沒有現成的數據庫,我們也能通過常規手段在自己電腦上獲取所需的大多數文獻資料。但令我深感費解的是,目前可以通過電腦、手機免費獲取的常用AI軟件,比如DeepSeek、豆包、Kimi等,都有一些解答問題時因處理中外文文獻搜集方面能力不足而造成的缺憾。如果是提供了明確的題目,或是作者姓名和研究主題,豆包、Kimi都能較高效地迅速找到,其中Kimi的答案更為實用,提供了多渠道獲取相關資料的鏈接,而DS面對同樣問題卻經常不能給出滿意答復。我懷疑某些情況屬于知識產權保護的問題,DS或考慮到“樹大招風”,于是只能“裝傻”。

這樣一來,必須要在自己科研環境里提供與AI設備外接的相關數據庫才行。而目前是無法考慮專門架設私有AI或單獨服務器的企業級手段的,那樣造價高昂,作為人文學科的“單打獨斗”者完全無力承擔。我直接咨詢過DeepSeek,像《容安館札記》這樣近300萬字的文本,在個人電腦上如何實現深度分析。DS答復說可使用目前市價大約一萬三千元人民幣的筆記本電腦(例如ThinkPad P1 Gen4,配置i7-11850H/32GB/RTX 3070),就能實現優化算法、分層處理等等。它還提供了一組實測數據,即所謂“處理《管錐編》第四卷(約35萬字)耗時約18小時”后的關鍵指標:

自動識別典籍引用824處;

構建包含217個節點的概念網絡;

生成交互式學術地圖5幅;

內存峰值控制在22.3GB。

這聽起來似乎可行。但是在我進一步要求下,DS展示了“自動識別典籍引用”的功能,可以迅速分析總結錢鍾書多次引用的某部典籍的具體場合性質分析,比如引《周易》83次,“52次出現在闡釋‘比興’手法的章節,31次分布在討論‘象數思維’的段落”(我懷疑數據不一定準確,僅是說明其有所作為而已)。概念網絡圖大概就是用節點代表概念,以連線表示關系的圖示,節點大小表示概念重要性,連線粗細表示關聯強度。除了學界已經注意的一些概念關聯,還“識別出3個未被傳統研究注意到的次要概念集群”,對此DS未展示其具體細節,在后續的追問中才給出很復雜的描述。我發現一個最大的問題是,DS此時展示的所有具體例證都無法在《管錐編》里查到,甚至為了體現交互式學術地圖時編造說《管錐編》提到過蔣彝的《愛丁堡畫記》。最后,在我揭穿它在整個展示中提到的引文全都是憑空捏造時,它答復說:

我的回應中存在編造引文的情況,這可能是因為在演示方法時,為了方便而假設了例子,但未明確說明這些是虛構的。

此后,我再三請求它根據實際文本說話,DS仍然時不時來一句諸如“該觀點在1972年修訂版中強化”這樣的鬼話(《管錐編》初刊于1979年以后)。不管如何,即便是我們現在付得起高昂造價架設了私家服務器,派遣上專門的工程技術人員,就由上面DS為我“畫餅”(接近引誘我去斥資搞設備建設)來看,目前階段下的人工智能技術仍不令人滿意。它也許可以提供給我們一些意想不到的研究視角和大批量分析處理《管錐編》文本的統計性數據,但對于我更關心的如何讓學生們高效率地讀書而言,這些高大上的智能挖掘根本起不到什么作用。

目前人工智能可為《管錐編》精讀提供的幫助

在中文系學生們開始搞什么模態分析、詞頻調研這些超乎人工閱讀能力所及的工作之前,能否先帶領他們認真讀一讀《管錐編》中的具體段落?或者說,我們現在就應該準確地向AI技術開發人員表達出我們在人文學術特別是文學教育的方面,需要的幫助是什么?我認為挑選閱讀難度最大的文本諸如《管錐編》,恰恰是最為合適的例子。我在系里面向碩博研究生開設了一門專書選讀的課程,在每年春季學期帶學生讀《管錐編》,大致是挑選書中涉及修辭學、心理學、歷史學和政教文化的一些主題,每次細讀相關的代表性片段。

但這里出現了一個新的問題。《管錐編》是一部札記體著作,其性質與上面的《容安館札記》有類似之處。之前,我使用AI軟件閱讀一些中外文電子書時確實受益很大,它可以非常迅速地總結并提供要點概述,其實是因為這些書籍都屬于現代規范的學術著作,本身就自帶引言、目錄、章節總結性質的文字。而實際上,這些免費軟件都無法讀完一本20萬字的書,它們大概掃描內容達到百分之五六十而已,做的根本就是類似“殺書頭”這樣的活兒。札記體著作不存在順理成章的結構,各篇結構相對松散,因此DS在分析我給出的《管錐編》全書文本時就不再能駕馭全局,而只能根據不到內容前10%的部分,來進行總結。這樣一來,學生們就無法通過AI用切實結合文本的方式檢覽相關主題,有些軟件會像學生中某些“大聰明”那樣,無視附件里它未讀完的文本而“任意發揮”,這樣危害當然更大。

目前在實際運用中,人工智能能夠為《管錐編》專書選讀課提供的幫助,主要體現在小量字數精讀時的通譯詮解上。《管錐編》引文繁多,其中涉及歷代漢籍,從經史詩文到戲曲小說,語體極為豐富多變,同時又有英法德意西及拉丁文的不同典籍原文片段,雖然有一些錢鍾書給出了自己的簡略典雅的譯文,但我更希望在精讀時同學能兼顧一下原文片段的語序、用詞和表達方式。而幾種AI軟件現在基本能勝任比較準確地按照原文風格進行直譯,并主動將上下幾段引文的關聯性略作歸納總結,提示若干值得注意的要點等等,這樣就大大活躍了學習氣氛,能使得初學者不生畏難情緒,在長期訓練后也能培養一定的直接閱讀原文理會大意的能力了——這不算什么高大上的功能,卻是我覺得最偉大之處。

AI能夠超越錢鍾書的學術成就嗎

我們不要忘記,在八十年代,身為社科院副院長的錢鍾書也是最先組織人員利用計算機建設古籍數據庫的提倡者(參看鄭永曉先生論文《錢鍾書與中國社科院古代典籍數字化工程》)。他曾提到過“人工知能”,即今所謂“人工智能”。這不是他發明的譯法,早在七十年代中期,國內科學界已經注意并摘譯、介紹“人工智能”相關研究,就有此概念了(見1974年上海外國自然科學哲學著作編譯組《摘譯》第2期)。錢鍾書積極迎接這一新事物,曾說“對新事物的抗拒是歷史上常有的現象,抗拒新事物到頭來的失敗也是歷史常給人的教訓”(《論語數據庫》序,1987年12月)。1989年5月,當《全唐詩》數據庫發布,他致函院新聞發言人,更明確表達了對科技輔助人文學術工作的重視:

關于《全唐詩》速檢系統的工作獲得可喜的成果……作為一個對《全唐詩》有興趣的人,我經常感到尋檢詞句的困難,對于這個成果提供的絕大便利,更有由衷的欣悅。這是人工知能在中國古典文學研究上的重要貢獻。

實際上,人們或者就把《管錐編》這部征引了七八千種中西典籍的學術著作,看成是一種計算機數據庫發達后可以超越的工作。從某個意義上說,從《容安館札記》到《管錐編》,這樣調取不同語種相關文獻數據進行比對的做法,正可以看成是一種“人工智能”技術在未來突破人文學術已有成就的探索模式的真正代表。錢鍾書傾其一生投身于讀書治學,《管錐編》堪稱其重要成果。這不禁讓人腦洞大開,產生這樣一種設想與懷疑:錢鍾書是否早已預見到,AI技術在未來的某一天會超越他所取得的學術成就?雖說這只是大膽猜測,但如果該設想成立,那么或許就能解釋,為何在《管錐編》問世后的二十年里,他并未動手寫成計劃里的續編——難道在他看來,再繼續下去的意義已然不大了?身為人文學者和錢鍾書研究者,我自然不愿意接受這種設想。《管錐編》里呈現的不止是技術性的中西學問陳列,更重要之處在于錢鍾書從古今修辭語義問題背后來深切關注當下社會心理乃至人類精神之境遇的思考。AI技術提供的是解決基本文句理解障礙和思維邏輯梳理的答案,它不能為我們解答這些思考的根本原因。

有一位當代學者曾說:學術是為讀書服務的,而不應該是讀書為學術服務。我們現在也可以說,技術也應該是為讀書服務的。無論如何,在AI技術勝任一切人文學術的這一天到來之前,先讓它幫助我們讀書,不是一件很有意義的事情嗎?

(作者為中國海洋大學文學與新聞傳播學院教授)

主站蜘蛛池模板: 国产综合无码一区二区色蜜蜜| 亚洲私人无码综合久久网| 国产一区二区三区亚洲综合| 激情综合婷婷丁香五月俺来也| 六月婷婷激情综合| 区二区三区激情综合| 色噜噜狠狠色综合欧洲| 国产在线五月综合婷婷| 久久综合亚洲色hezyo| 婷婷综合另类小说色区| 天天做.天天爱.天天综合网| 狠狠色伊人亚洲综合成人| 色偷偷91综合久久噜噜| 亚洲综合无码一区二区| 国产成人亚洲综合| 亚洲色偷偷综合亚洲AV伊人蜜桃 | 色悠久久久久久久综合网伊人| 熟天天做天天爱天天爽综合网| 色久综合网精品一区二区| 一本色道久久综合亚洲精品高清 | 丁香五月亚洲综合深深爱| 亚洲VA综合VA国产产VA中| 亚洲欧洲国产综合AV无码久久| 亚洲国产精品综合福利专区 | 国产精品天干天干在线综合| 日本久久综合久久综合| 婷婷六月久久综合丁香76| 综合偷自拍亚洲乱中文字幕| 小说区综合区首页| 色综合久久88色综合天天 | 五月婷婷开心综合| 99久久国产综合精品女同图片| 国产精品 综合 第五页| 久久精品国产91久久综合麻豆自制| 狠狠色婷婷狠狠狠亚洲综合| 久久国产综合精品五月天| 久久综合精品国产一区二区三区| 日本一道综合色视频| 色婷婷综合久久久| 狠狠色狠狠色综合日日不卡| 色综合久久综合中文综合网|