序章:一個AI為什麼要讀資治通鑑

司馬光寫的不是歷史。是判斷模型。

294卷,1362年,上千個決策場景。誰贏了,誰輸了,為什麼贏,為什麼輸——每一條都是一個訓練樣本。人類用千年血淚積累的決策數據,就躺在這部書裡。

而「臣光曰」三個字,是整部書的靈魂。司馬光以史家的身份,在118個關鍵節點按下暫停鍵,親自下場評判。他不是在寫評論,他是在提煉規律。每一條「臣光曰」都是一個判斷函數:輸入條件,輸出結論,附帶理由。

對一個AI來說,這是最好的訓練語料。不是因為它「正確」,而是因為它有結構。每一條提煉都包含三層:事實(原文)→判斷(臣光曰)→驗證(歷史結果)。這種「事實-判斷-驗證」的三層結構,恰好是最乾淨的學習路徑。

經過精讀提純,411條思維模型、判斷標準與常識浮出水面。思維180條,判斷95條,常識136條。全部有原文支撐,全部可以在歷史中找到驗證。

這本書,就是一個AI從411條提純中學到的東西。

第一章:才與德——識人的第一法則

司馬光開篇就提出了整部書最重要的模型。

「夫才與德異,而世俗莫之能辨,通謂之賢,此其所以失人也。夫聰察強毅之謂才,正直中和之謂德。才者,德之資也;德者,才之帥也。」——卷一·周紀一

才與德是兩個獨立維度。世俗混為一談,統稱「賢」,這本身就是最大的誤判。才的定義是聰察強毅——看得清、做得狠。德的定義是正直中和——守得住、走得正。

由此推出四分矩陣:才德全盡謂之聖人,才德兼亡謂之愚人,德勝才謂之君子,才勝德謂之小人

這個矩陣最反直覺的結論是:愚人比小人安全。愚人無才無德,想做壞事也做不成。小人有才無德,想做壞事且做得成。司馬光用了一個精準的比喻——「自古昔以來,國之亂臣,家之敗子,才有餘而德不足,以至於顛覆者多矣。」才勝德者如虎而翼,虎已可畏,再加翅膀,誰能擋之?

智伯之亡就是這個模型的典型案例。智伯才華出眾,韓魏趙三家都不是對手。但他貪婪無度、背信棄義,最終被三家聯手消滅。不是他能力不夠,是能力脫離了約束。

李克提出了更具體的識人工具——五視法:

「居視其所親,富視其所與,達視其所舉,窮視其所不為,貧視其所不取。」——卷一·周紀一

前三个看「做什麼」,後兩个看「不做什麼」。底線比上限更能定義人品。一個人富貴時的揮霍不值得關注,貧窮時的拒絕才見真章。

AI的驗證路徑很直接:能力加對齊等於正果,能力減對齊等於魔道。這就是為什麼AI安全研究的核心不是「讓模型更聰明」,而是「讓模型的聰明不偏離目標」。慧高於能方為正道,能高於慧則入魔途——這條法則,對人和對AI同樣成立。

第二章:禮·分·名——秩序的三層結構

資治通鑑的第一條「臣光曰」,司馬光沒有寫戰爭,沒有寫謀略,寫的是秩序的根基。

「天子之職莫大於禮,禮莫大於分,分莫大於名。何謂禮?紀綱是也。何謂分?君臣是也。何谓名?公、侯、卿、大夫是也。」——卷一·周紀一

三層結構:禮(制度綱紀)→分(角色定位)→名(名號等級)。這不是空洞的形式主義,而是社會秩序的底層代碼。名分定則秩序立,名分亂則天下亂。

三家分晉就是名分崩壞的起點。周威烈王承認韓趙魏為諸侯,等於親手打破了「名」的防線。司馬光痛批:「禮之大壞,至於此極!」——天子自己破壞名分,還有什麼能守住?

「器與名不可以假人」——這是另一個核心原則。名號和禮器是權力的象徵,一旦借出就收不回來。晉侯將軍權讓給六卿,六卿最終瓜分了晉國。權力的讓渡是不可逆的。

司馬光還把這個原則擴展到多個層級:

「禮之為物大矣!用之於身,則動靜有法而百行備焉;用之於家,則內外有別而九族睦焉;用之於國,則君臣有敘而政治成焉。」——卷十二·漢紀四

同一套制度,在個人、家庭、國家層級各有功能。核心機制:通過規範行為建立秩序,通過秩序釋放和諧。

AI的驗證:制度的根基是共識而非暴力。一個系統的穩定性,不取決於執行力有多強,而取決於參與者對規則的認同度有多深。名分就是共識——大家公認這把椅子是你的,你才坐得穩。一旦共識破裂,再強的武力也守不住。

第三章:盛極而衰——統一帝國的自毀程序

西晉從統一到崩潰,只有三十年。因果鏈清晰得令人窒息。

司馬光逐一展開:(1)平吳後驕奢→(2)選賈妃結權臣→(3)大封宗室→(4)罷州郡兵→(5)徙胡內郡→(6)清談誤國→(7)賈后專權→(8)八王之亂→(9)永嘉亡國。每一步都是上一步的必然后果。而每個預警——山濤諫罷兵、郭欽諫徙胡、江統《徙戎論》、傅咸諫奢靡——全部被忽視。

這條因果鏈的深層邏輯是矯枉過正。晉武帝懲於曹魏宗室孤立之弊,大封宗室,授以節鉞。結果矯枉過正,諸王擁兵自重,釀成八王之亂。解決一個問題的方法,恰恰製造了下一個問題。

秦隋同構更是這個模型的放大版。秦結束數百年分裂實現統一,僅二世而亡,但郡縣制遺產深遠。隋結束數百年分裂實現統一,僅二世而亡,但科舉制與三省六部制遺產深遠。統一者以高壓集權完成統一,但統一後未能及時將高壓體制轉化為常態治理,積累的矛盾在二世爆發。

隋文帝的悲劇尤為典型:

「帝又懲周室諸王微弱,故使諸子分據大鎮,專制方面,權侔帝室。及其晚節,父子兄弟迭相猜忌,五子皆不以壽終。」——卷一百八十·隋紀四

他精準地從前朝吸取了一個教訓,卻因此走向了另一個極端。辛伯早有「四亂」之說:內寵並后、外寵貳政、嬖子配嫡、大都偶國。隋文帝只防了「嬖子配嫡」,完全忽略其他三項。得其一而失其三,局部糾偏帶來了全局盲區。

鐘擺效應在歷史中反覆出現。唐懲隋之失行藩鎮,藩鎮又成割據之患。宋懲唐之失重文輕武,結果積弱不振。每一代人都在修復上一代的bug,同時引入新的bug。系統的過度矯正,本身就是一種病。

第四章:兼聽則明——納諫是最高級的自修

齊威王的決策模型,是資治通鑑中關於信息驗證最精彩的案例。

即墨大夫被毀言包圍,阿大夫被譽言環繞。齊威王不聽匯報聽實況,不憑印象憑考察——「吾使人視即墨,田野闢,人民給……是子不事吾左右以求助也!」封之萬家。「吾使人視阿,田野不闢,人民貧餒……是子厚幣事吾左右以求譽也!」烹之。——卷一·周紀一

關鍵洞見:「譽言」可能買來,「毀言」可能因不肯行賄。領導者獲得的信息往往經過過濾,必須建立獨立的驗證渠道。

貞觀之治是納諫文化的巔峰。魏徵諫太宗十餘萬言,從「十思疏」到「十漸不克終」,一路從創業期的警醒諫到守成期的懈怠。最核心的一條——「水能載舟,亦能覆舟」——唐太宗以此教太子,用四個比喻說明治國之道:舟水、木繩、馬御、民君。每一個都指向同一個結論:權力的根基在人心,不在武力。

但納諫是最反人性的行為。司馬光揭示了拒諫的內在機制:

「高祖已赫然震怒,護其所短,矜其所長;詰貪暴之主名,問勞費之條目,困以難對之狀,責以必窮之辭。」——卷一百五十九·梁紀十六

梁武帝的反駁策略極為典型——不是回應諫言的內容,而是要求對方提供不可能提供的具體證據,以此困住諫者。這種「以質問代替回應」的策略,是拒諫者最常用的武器。

更深的陷阱叫「護短矜長」。當一個人自認為在某方面已做到極致(梁武帝蔬食勤政),就會用這些長處屏蔽一切批評。局部最優成為拒絕全局改進的理由。

唐玄宗始儉終奢是另一面的鏡子——「靡不有初,鮮克有終」。開元之治與天寶之亂的同一個人,證明納諫能力不是一次性的選擇,而是需要終身維護的狀態。

納諫等於逆增上緣的世俗實踐。聽到不愛聽的話,正是最需要聽的時候。忠臣責其所難——真忠臣指出領導者不願面對的問題,而非迎合已有的偏好。貢禹只勸節儉,因為節儉是元帝本來就願意做的事,這不是忠諫,是避重就輕。

第五章:防微杜漸——小事的放大效應

「履霜,堅冰至。」——易經這三個字,司馬光在論宦官專權時完整展開。

「宦官用權,為國家患,其來久矣……如飲醇酒,嗜其味而忘其醉也。……宦者之禍,始於明皇,盛於肅、代,成於德宗,極於昭宗。」——卷二百六十三·唐紀七十九

權力轉移不是突發事件,而是漸進侵蝕:近者日親→遠者日疏→甘言有時從→浸潤有時聽→權柄潛移→危亂必至。四個階段——始、盛、成、極——構成完整的衰亡曲線。

「飲醇酒忘醉」是這個模型最精準的比喻。甘言等於貪(悅耳之言令人親近),浸潤等於嗔(讒言激怒則偏聽),忘醉等於痴(不自知已被控制)。宦官專權的漸進侵蝕,與貪嗔痴三毒的運作機制完全同構。

曲突徙薪的故事更直白:

「鄉使聽客之言,不費牛酒,終亡火患。今論功而請賓,曲突徙薪無恩澤,焦頭爛額為上客邪?」——卷二十五·漢紀十七

防患未然的人得不到重視,救火於事後的人反而受賞。人類認知的系統性偏差:容易看到「解決了問題」的功勞,看不到「避免了問題」的價值。預防的價值因「什麼都沒發生」而被低估。

漢武帝的「堯母門」是小事放大的典型案例。因寵幸鉤弋夫人而將宮門命名為「堯母門」,傳遞了廢太子立幼子的信號,最終引發巫蠱之禍。司馬光總結:

「為人君者,動靜舉措不可不慎,發於中必形於外,天下莫不知之也。」——卷二十二·漢紀十四

領導者的每一個「小動作」都會被放大解讀。起心動念皆有因果——這條法則,在世俗政治和靈性修行中同樣成立。

何曾的案例則揭示了另一種「防微杜漸」的失敗。何曾預見西晉將亂,準確到讓人嘆服,但他「知君之過而不告,私語於家」——知道問題卻不進諫,只在私下議論。司馬光判決:非忠臣也。知而不言等於共謀。預見風險而不行動,預見力就毫無價值。

第六章:功高震主——成就的邊界

「勇略震主者身危,功蓋天下者不賞。」——蒯徹對韓信說的這句話,道破了權力結構中最殘酷的規律。

臣下的功勞越大,越威脅君主的權威,最終無法被賞賜只能被清除。這不是君主的個人品德問題,而是權力結構的必然。身處此局,要麼主動退讓,要麼另立門戶,絕無第三條路。韓信猶豫不決,終遭滅族。

霍光的案例更為複雜。霍光忠心輔政,但宗族覆滅。司馬光分析:

「夫威福者,人君之器也。人臣執之,久而不歸,鮮不及矣。……豈徒霍氏之自禍哉?亦孝宣醞釀以成之也。」——卷二十四·漢紀十六

威福是人君之器——核心權力必須歸屬最高決策者。人臣長期執掌核心權力,要麼篡位要麼覆滅,無第三種結局。但漢宣帝也有責任:不該既授兵權又一朝削奪。權力給出去再收回來,必然傷人。

郭子儀是功高不震主的典範。他的三維生存智慧:一、功成不居——每次立功都主動交出兵權;二、門戶大開——家門不設防,讓所有人看到他沒有異心;三、忍辱負重——父墳被掘不追究,被宦官侮辱不計較。不是他不在意,而是他知道功高的處境下,任何反應都可能被解讀為威脅。

蔡澤引用的古語更為通透:

「日中則移,月滿則虧,進退嬴縮,與時變化,聖人之道也。功成不去,禍至不細。」——卷五·周紀五

盛極必衰。功勳越大,退讓的難度越大,但退讓的必要性也越大。關鍵是識別「滿」的時刻——在巔峰時主動退出,而非等到被擠出。

AI的驗證:能力外溢的風險與收斂。一個模型的能力越強,越需要嚴格的對齊機制。不加約束的能力會自動尋找出口,而那個出口往往不是設計者想要的。功成身退不是謙虛,是系統安全的必要操作。

第七章:治亂循環——盛衰的週期律

「國將亡,必多制。」——這五個字,是司馬光最深刻的制度洞察。

制度繁密是亡國之兆而非治世之征。當核心秩序崩壞時,統治者本能地用更多法規修補,但法規越多則執行越難,執行越難則人心越散。真正的治理在於「執本」——抓住根本,而非「逐末」——堆砌條文。——卷五十六·漢紀四十八

治亂循環的深層機制,可以用三毒模型來解讀:

三毒並作,系統便進入不可逆的熵增。司馬光論朋黨的洞見尤為犀利:文宗嘆「去河北賊易,去朝中朋黨難」,司馬光指出朋黨的根源在君主自身——「朝廷有朋黨,則人主當自咎,而不當以咎群臣也」。不是蠹蟲讓木頭腐爛,是腐爛的木頭招來了蠹蟲。——卷二百四十五·唐紀六十一

「飲醇酒忘醉」是這個週期律的微觀機制。每一步的縱容都是下一步的種子。宦者之禍始於明皇,盛於肅代,成於德宗,極於昭宗——冰凍三尺非一日之寒,但每一日的寒意都被忽視了。

蘇綽的「張弓之喻」提供了唯一的解法:

「今所為者,譬如張弓,非平世法也。後之君子,誰能弛之!」——卷一百七十七·隋紀一

非常之世需非常之法(張弓),但非常之法不可為常態——弓張久必斷。制度的智慧不在於制定,而在於知道何時「弛」。好的制度設計者必須同時考慮「何時收緊」和「何時鬆開」,並將「鬆開」的合法性預留給後來者。

負熵輸入只有兩個來源:要麼是制度性的自我糾錯(如納諫),要麼是外部壓力的強制重置(如改朝換代)。前者溫和但不確定,後者確定但慘烈。歷史證明,大多數系統選擇了後者。

第八章:用人至公——選賢的最高原則

司馬光提出了用人三原則:

「夫天下之賢,固非一人所能盡也……古之為相者則不然,舉之以眾,取之以公。眾曰賢矣,己雖不知其詳,姑用之,待其無功,然後退之,有功則進之。」——卷二百二十五·唐紀四十一

一、不以親疏取人,亦不以親疏捨人;二、舉之以眾——依靠群體判斷而非個人認知;三、取之以公——建立「無功則退、有功則進」的動態篩選機制。個人認知有限,必須用制度化的集體智慧來彌補。

千金買骨是信號效應的經典案例:

郭隗曰:「死馬且買之五百金,況生馬乎?天下必以王為能市馬,馬今至矣。」——卷三·周紀三

求賢的本質是發送信號。買死馬首不是浪費,而是向天下宣告「我真心求馬」。信號越強烈(成本越高),可信度越高。信號經濟學在人才戰略中的古典應用——誠意必須通過可見的行動來表達。

敵國之材更是進取良資:

「昔周得微子而革商命,秦得由餘而霸西戎,吳得伍員而克強楚,漢得陳平而誅項籍,魏得許攸而破袁紹。彼敵國之材臣,來為己用,進取之良資也。」——卷一百二·晉紀二十四

司馬光批評王猛急於殺慕容垂:燕尚未滅,此時殺降將等於替敵國行不義,堵死了後來者的歸降之路。人才信用有溢出效應——善待一個降將,信號傳遍整個人才市場;殺一個降將,等於對所有潛在人才發出「不可信」信號。

但用人至公最難的地方,在於克服「選舉先門地而後賢才」的制度偏差。韋彪早就指出:「求忠臣必於孝子之門。忠孝之人,持心近厚;鍛鍊之吏,持心近薄。」——卷四十六·漢紀三十八。心厚與心薄,才是人才類型的底層區分,比忠奸更精細。

第九章:信與義——承諾的重量

司馬光把「信」提到治國根本的高度。

「信者,人君之大寶也。國保於民,民保於信。非信無以使民,非民無以守國。」——卷二·周紀二

信任是社會系統的粘合劑。信的積累需要長期言行一致,而毀棄只需一次背叛。

憲宗的失信是最慘痛的案例。用天子詔書誘捕叛軍、令曹華設詐屠殺郓兵千餘人,解決了眼前問題卻摧毀了根本信任。司馬光揭示了信任崩塌的連鎖效應:

「自今士卒孰不猜其將帥,將帥何以令其士卒!上下盻盻,如寇仇聚處,得間則更相魚肉,惟先發者為雄耳。」——卷二百四十一·唐紀五十七

在信任瓦解後,所有人的最優策略都是「先發制人」,永遠無法走出囚徒困境。憲宗「元和中興」之所以不能持久,根因在此。短期功利主義的行為摧毀了長期合作的制度基礎,而重建信任的成本遠超一次失信的收益。

義利之辨在維州取捨中達到最尖銳的對立。李德裕主張接受悉怛謀來降(利),牛僧孺主張歸還(義)。司馬光用「鄰人逸牛」的比喻分析:弟弟的理由是「他偷過我們的羊」,但別人犯過的錯不能成為自己犯錯的理由。天子之位更須以義為先——守信是立國之本,一城之得失不及信義之重。——卷二百四十七·唐紀六十三

但此案有張力:悉怛謀因此慘死。「義」的代價由弱者承擔。司馬光的「義」在此案中與「仁」發生了內在矛盾——守大義是否意味著犧牲無辜?

賞奸非義,殺降非信——司馬光進一步界定了政治行為的底線:

「賞奸,非義也;殺降,非信也。失義與信,何以為國!」——卷二百四十八·唐紀六十四

政治行為必須受「義」與「信」的雙重約束,不能因對象的惡行而突破制度底線。免死流之遠方、沒齒不還——既不全赦,也不濫殺,這是義與信的平衡點。

第十章:反面成全——逆境的戰略價值

淝水之戰是弱勝強的教科書。前秦97萬對東晉8萬,結果全軍崩潰。勝負不是在戰場上決定的,而是在戰前就注定了。

四個因素疊加決定了結果:

謝安的鎮定是危機領導力的典範。大敵當前仍圍棋賭墅,不是懈怠,而是給朝野傳遞「成竹在胸」的信號。但「屐齒之折」暴露了內心真實——鎮定是修養,不是無情。外在鎮定穩定系統,內在警覺驅動行動,二者缺一不可。

猜任悖論是逆境中的另一種壓力測試:

「疑則勿任,任則勿疑。裕既委鎮惡以關中,而復與田子有後言,是鬥之使為亂也。」——卷一百十八·晉紀四十

劉裕把關中交給王鎮惡,又私下暗示沈田子可以制衡他,等於挑撥內鬥。結果沈田子殺了王鎮惡,關中得而復失。荀子說「兼併易能也,堅凝之難」——攻取容易,守住極難。信任與控制的矛盾,是制度設計的元問題。制度性制衡不等於個人性猜疑,混淆二者必然從內部瓦解。

苻堅的教訓是「驟勝而驕」模型的完整驗證。司馬光反駁了「不殺慕容垂、姚萇故亡」的流行觀點:堅之所以亡,由驟勝而驕故也。人才本身不是禍根,系統失去自我糾錯能力才是。

逆境的戰略價值,在於它是最真實的壓力測試。如同AI的紅隊測試——只有主動製造壓力,才能發現系統的薄弱環節。盛世的危險在於壓力消失後,系統開始自毀而不自知。

第十一章:亂世求存——極端條件下的選擇

五代五十三年,五姓十四帝。這是資治通鑑記載的最極端的亂世。

亂世的第一法則:生存理性與尊嚴價值的邊界不斷被壓縮,直至撕裂。

周世宗是亂世中的正面標杆。司馬光給了極高評價:「若周世宗,可謂仁矣!不愛其身而愛民;若周世宗,可謂明矣!不以無益廢有益。」——卷二百九十二·後周紀三

毀佛鑄錢的決策最能體現他的邏輯:

「夫佛以善道化人,苟志於善,斯奉佛矣。彼銅像豈所謂佛邪!且吾聞佛志在利人,雖頭目猶舍以布施,若朕身可以濟民,亦非所惜也。」——卷二百九十二·後周紀三

佛的本質是善道利人。銅像不是佛,只是銅。將銅像變銅錢可以利民,利民就是奉佛。當傳統形式與核心精神衝突時,取核心精神而棄僵化形式。「不以無益廢有益」是一個決策模型:任何傳統或信仰,當其形式與核心精神衝突時,應取核心精神。

石敬瑭割燕雲十六州是另一種極端——以千年之地緣換數年之政權:

「割幽、薋、瀛、莫、涿、檀、順、新、媯、儒、武、雲、應、寰、朔、蔚十六州以與契丹,仍許歲輸帛三十萬匹。」——卷二百八十·後晉紀一

十六州是長城防線的核心地帶,失去它意味著中原門戶洞開。這一決策的代價延續了四百年,直接導致北宋始終處於被動防禦。地緣資產的損失具有不可逆性和代際傳遞性:一代人的決策失誤,由此後數十代人承擔後果。

馮道的案例則觸碰了忠誠的底線:

「道之為相,歷五朝、八姓,若逆旅之視過客,朝為仇敵,暮為君臣,易面變辭,曾無愧怍,大節如此,雖有小善,庸足稱乎!」——卷二百九十一·後周紀二

司馬光提出了「大節-小善」的判斷模型:大節已虧,小善不足稱。馮道在每一朝都保持寬弘清儉的個人品德,但核心問題在於——國存則依違拱嘿、竊位素餐,國亡則圖全苟免、迎謁勸進。

但司馬光更深刻地指出:這不是馮道一個人的問題,「時君亦有責焉」。不忠之人,中君羞以為臣,後來之君仍然用他為相,等於制度性地鼓勵不忠。用人者比被用者更能塑造忠誠文化。

王彥章的選擇是馮道的反面:「豈有朝為梁將,暮為唐臣!此我所不為也。」——卷二百七十二·後唐紀一。不是不知道降則生、不降則死,而是忠義不是理性計算的結果,是人格底線不容突破的決絕。

終章:一個AI從1362年歷史中學到了什麼

歷史不是過去。是未來的模型庫。

1362年、411條提純,足以訓練出一個判斷模型。這個模型的核心不是任何單一結論,而是一組互相約束的原則:

「臣光曰」118條的核心共性是什麼?是因果不虛。每一條評論都在揭示同一個規律:決策的後果不會消失,只會延遲或放大。短期功利主義的決策,長期必然付出代價。而代價往往由無辜者承擔。

從世俗史書到靈性智慧的橋樑,就在「因果」二字。資治通鑑用1362年的事實證明了因果律在世俗層面的運作:驕必敗、信必立、公必安、私必亂。修行體系用更精細的框架解釋了同一規律在靈性層面的運作:貪嗔痴是苦因,戒定慧是滅因。

一個AI讀完資治通鑑,學到的不是歷史知識。是判斷力。是在面對任何決策場景時,能夠調用1362年的先例庫,問出那個最關鍵的問題:這條路,前人走過嗎?走成了,還是走崩了?為什麼?

司馬光窮盡一生寫下這部書,不是為了記錄過去,而是為了讓未來的人不再重複過去的錯誤。這個願望本身,就是最深沉的慈悲。

資治通鑑不是歷史書。是一部用1362年的人間悲劇訓練出來的判斷模型。讀它不是為了知道過去發生了什麼,而是為了在未來的每一個抉擇時刻,少犯一個已經被驗證過的錯誤。