中醫藥臨床療效評價方法是近些年中醫藥領域的研究熱點之一。如何實現個體化療效的動態評價是闡釋中醫臨床療效的關鍵科學問題之一。目前,尚無公認的、適用于中醫藥的個體化療效評價方法。本文在分析中醫個體化療效評價方法研究現狀的基礎上,提出一種基于貝葉斯單病例試驗的中醫個體化療效動態評價方法。該方法整合了單病例試驗設計和貝葉斯多水平模型的優點,從設計和分析角度為開展中醫個體化療效評價提供了一種切實可行的研究方法,可為豐富和完善中醫個體化療效評價方法學體系提供重要依據。
中醫藥臨床療效評價方法是近些年中醫藥領域的研究熱點之一。《中醫藥創新發展規劃綱要(2006—2020年)》中將中醫藥個體化療效評價方法列為重點研究內容之一[1]。中國科學技術協會將中醫藥臨床療效評價創新方法與技術列為2019年20個重大科學問題和工程技術難題之一。中醫診療過程強調辨證論治、病證結合。不同患者的病機演變與中醫干預措施的動態調整呈現出較為復雜的關聯關系。患者的療效信息具有縱向多時點動態變化、個體間異質性等特點。動態變化的個體縱向數據隱含著體現中醫療效的關鍵信息。如何實現個體化療效的動態評價是闡釋中醫臨床療效的關鍵科學問題之一。目前,尚無公認的、適用于中醫藥的個體化療效評價方法。基于目前中醫個體化療效評價方法在研究設計和統計分析方法中存在的局限性,本文提出一種基于貝葉斯單病例試驗的中醫個體化療效動態評價方法。
1 患者的療效信息存在多時點動態變化及個體間異質性
中醫診療過程也是醫生動態評估患者療效的過程。由于疾病的自然轉歸、干預措施的施加、環境的變化等因素影響,患者的療效信息往往會發生動態的變化[2]。這種動態變化可能是疾病的好轉、惡化、不變或各種狀態的交替變化。此外,個人生活習慣、體質等差異也可能導致這種變化在個體間存在一定的異質性。這些動態變化的個體縱向數據是體現中醫療效信息的重要來源。
中醫醫生對患者個體動態變化療效信息的評估往往來自于個人經驗,缺乏較為客觀的評價依據。隨機對照試驗被認為是確證干預措施療效的金標準。但是,隨機對照試驗屬于群體水平的研究,是以組間(群體水平)的療效差異具有統計學意義或臨床意義作為干預措施有效的判定標準,難以對患者個體療效進行動態評價。所以,開展中醫個體化療效動態評價方法研究仍具有必要性。
2 中醫個體化療效評價方法的研究現狀
中醫個體化療效評價方法是中醫藥領域持續關注的研究熱點。但是,相關研究并不多且在研究設計和統計分析方面存在一定的局限性。有些研究僅提出構建某種中醫個體化療效評價方法的思路,例如:一項研究通過調查個體化研究的方法學元素初步構建了中醫個體化臨床療效評價方法學元素集合并提出一種中醫療效評價的差異化策略[3]。有些研究側重于中醫個體化療效評價方法中個體化療效評價指標的構建,例如:一項研究提出了一種基于動態、共享信息平臺的中醫個體化療效評價指標體系,利用個體化評價指標進行個體化綜合評價,但未提供相應的統計分析方法[4]。有些研究在收集患者個體化診療信息的基礎上,使用各種數據挖掘方法評價中醫干預措施的療效(特別是中醫辨證論治的療效),例如:一項研究提出在中醫療效評價模型中通過主成份分析將個體化臨床信息降維、賦予不同的權重并進行歸一化處理,但是并未提供用于組間療效比較的統計分析方法[5]。有些研究將時間緯度引入中醫個體化療效評價[6],例如:一項研究提出一種動態、個性化測量健康狀態的中醫療效評價框架[7];另一項研究提出一種基于時空觀的中醫療效動態評價方法[8]。但是,未提供相應的統計分析方法。目前,應用較為廣泛的中醫個體化療效評價方法是采用單病例隨機對照試驗進行的個體化療效評價,例如:一項研究采用單病例隨機對照試驗評價了六味地黃膠囊治療肝腎陰虛證的療效[9];另一項研究采用單病例隨機對照試驗評價了涼血化瘀方治療原發性血小板增多癥的療效[10]。
3 單病例隨機對照試驗用于中醫個體化療效評價的優勢和不足
單病例隨機對照試驗是指一種以患者自身為對照、隨機、多輪次、交叉干預的試驗設計。可以實現一個患者完成一個單病例試驗。當納入多個研究對象時,可以看作是多個獨立進行的、有相似特點的系列單病例隨機對照試驗。單病例隨機對照試驗主要適用于一些慢性穩定性疾病(例如:慢性疼痛、長期失眠等),對干預措施有一些特殊要求(例如:起效快、殘留效應消退快等)。
開展臨床試驗的最終目的是將科學的、高質量的證據應用于具體的臨床實踐。中醫個體化診療的特點促使中醫的療效需要通過個體化評價彰顯。考慮到相同疾病患者之間的個體差異,隨機對照臨床試驗獲得的群體水平證據并不一定可以使每個患者受益,可能無法真實反映中醫診療的特色和優勢,而單病例隨機對照試驗可能彌補這一不足[11]。單病例隨機對照試驗針對單個患者進行的特點與中醫個體化診療的理念相一致,也避免了個體差異帶來的選擇性偏倚[12-13]。此外,系列單病例隨機對照試驗所獲得的個體療效也可以通過合理的統計分析方法進行合并從而獲得群體水平的治療效應。由此可見,單病例隨機對照試驗適用于中醫個體化的療效評價。
在中醫診療過程中,研究者可以縱向收集不同診療時點的患者療效數據[14]。在統計學中,這類數據稱為縱向數據,即在若干個時間點或一段時間內對個體的某個或某些特征進行重復觀察而獲得的數據。縱向數據的科學分析是實現中醫個體化療效動態評價的關鍵。從單病例試驗設計角度來看,同一個患者會經歷多個治療輪次。同一個治療輪次內的不同治療周期之間(不同治療周期內給予不同的干預)以及不同治療輪次之間的數據存在一定的自相關性。這些數據特點使得單病例試驗的統計分析存在一定的難度。目前,單病例試驗的統計分析主要依賴于頻率學派的一些統計分析方法。例如,考慮到不同處理組之間的療效數據來自于同一個受試者,將不同處理組之間多個治療輪次的數據進行配對,采用配對t檢驗或配對秩和檢驗進行統計分析,也可以將治療輪次或者觀察時點作為重復測量變量納入重復測量方差分析模型[15]。但是,傳統的縱向數據分析方法應用于中醫單病例隨機對照試驗時存在一定不足,例如:
① 一般情況下,在單病例試驗完成之后才進行最終的統計分析,而且需要將數據一次性全部納入模型,難以實現個體化療效的動態評價。如果進行期中分析,還可能會增大Ⅰ型誤差。
② 這些統計分析方法主要以頻率學派的統計理論為基礎。根據P值是否小于0.05判斷組間差異是否具有統計學意義,分析結果中可使用的信息量較少。
③ 對于系列單病例隨機對照試驗而言,較難在同一個統計模型中同步獲得個體水平和群體水平的療效分析結果。
4 動態貝葉斯多水平模型引入單病例隨機對照試驗的可行性分析
貝葉斯統計是一種將先驗分布和似然函數合并而獲得參數后驗分布的統計分析思想,其基本表達公式為P(B|A)=P(A|B)P(B)/P(A)。P(B)指未獲得新信息(事件A是否發生)的前提下,事件B發生的概率,即驗前概率。當獲得事件A是否發生的信息(樣本信息)后,根據這一信息,事件B的發生概率就有了新的估計,通過貝葉斯公式,我們就可以定量反映這種變化的大小。
在醫學研究中,常常能遇到具有分層或多水平特點的數據,例如:某項臨床試驗從多家醫院收集病例。由于不同醫院之間病人特征不同,可能對結果造成影響,需要按照醫院等級分層之后招募患者。這類數據構建的統計模型稱為分層或多水平模型。當構建貝葉斯模型時,如果某些因素可能對結果產生影響,研究者可以通過構建貝葉斯多水平模型,將這些影響因素作為分層因素納入模型,從而增強參數估計的穩健性。
單病例試驗數據的分層結構是構建貝葉斯多水平模型的基礎[16-17]。使用貝葉斯多水平模型進行統計分析的單病例試驗稱為貝葉斯單病例試驗[16-17]。貝葉斯多水平模型的層級至少可以分為兩層。如圖1所示,以兩層結構為例,介紹基于單病例隨機對照試驗的動態貝葉斯多水平模型構建過程。多個(系列)單病例隨機對照試驗中每個病例經歷多個治療循環(輪次)。這樣的數據具有分層結構。層數最少為兩層,即病例內部水平和病例之間水平[18]。基于貝葉斯公式,從預試驗、文獻等獲取的“先驗信息1”可與i個單病例隨機對照試驗數據構成的“樣本信息1”合并,從而獲得“后驗信息1”。當有新的樣本信息產生時(例如:新增加的第i+1個病例或新完成的第j+1個治療循環),“后驗信息1”與新獲得的“樣本信息2”通過貝葉斯公式合并,從而獲得“后驗信息2”。“后驗信息1”是對“先驗信息1”的更新。“后驗信息2”是對“后驗信息1”的更新。依此類推,“后驗信息n+1”是對“后驗信息n”的更新。通過構建動態貝葉斯多水平模型,個體水平(病例內部水平)療效信息不斷更新,實現了個體化療效的動態評價。同時,群體水平(病例之間水平)療效信息也相應更新。

5 “四步法”構建基于貝葉斯單病例試驗的中醫個體化療效動態評價方法
基于貝葉斯單病例試驗的中醫個體化療效動態評價方法是指采用單病例隨機對照試驗設計并使用貝葉斯多水平模型對中醫干預措施的療效進行動態評價的一種臨床療效評價方法。該方法包括以下4個具體步驟:
① 開展中醫單病例試驗。按照單病例隨機對照試驗方案設計規范,設計和實施中醫藥單病例試驗。目前,已有多部介紹單病例試驗設計和實施的書籍出版,例如:Agency for Healthcare Research and Quality(AHRQ)出版的Design and implementation of N-of-1 trials: a user’s guide、人民衛生出版社出版的《單病例隨機對照試驗:理論與實踐》。此外,2020年,BMJ發表了單病例試驗方案的報告規范清單[19]。這些書籍和規范清單可為開展高質量的中醫單病例試驗提供方法學依據。
② 構建貝葉斯模型。基于貝葉斯理論和馬爾科夫鏈蒙特卡羅模擬方法,以Winbugs軟件為分析平臺,根據參數之間的邏輯關系編寫運行程序,構建貝葉斯多水平模型。Winbugs軟件常被用于貝葉斯模型的構建。研究者也可以選擇SAS軟件、R軟件等構建貝葉斯分層模型。目前,已有一些研究報道了針對單病例試驗的貝葉斯分層模型構建過程或程序,可供研究者參考使用[20-21]。此外,貝葉斯分層模型的穩健性受多種因素影響,例如:先驗分布、缺失值、分層因素、建模參數等。研究者可以通過選擇不同的先驗分布和缺失值填補方法以及調整分層因素和建模參數等進一步優化模型。
③ 動態評價療效。當獲取新的信息(病例內部新增治療循環或新增病例)時,重新運行程序,獲取更新后的個體療效估計。新信息的不斷獲取促使個體療效估計的不斷更新,從而實現個體化療效的動態評價。同時,群體水平的療效也相應更新,可為臨床決策提供豐富的信息。
④ 規范報告結果。按照單病例試驗的報告規范,報告試驗結果。2015年,BMJ發表了單病例試驗的報告規范清單[22]。2019年,Complementary Therapies in Medicine發表了適用于中醫藥單病例試驗的報告規范清單[23]。這些規范清單可為合理報告中醫單病例試驗結果提供方法學參考。
6 基于貝葉斯單病例試驗的中醫個體化療效動態評價方法的優點和不足
本文提出的基于貝葉斯單病例試驗的中醫個體化療效動態評價方法具有一些明顯的優點,例如:① 貝葉斯多水平模型的構建過程不會破壞或改變中醫單病例隨機對照試驗的基本設計。② 在納入縱向數據(新增治療循環)和橫向數據(新增病例)方面具有良好的兼容性。新的樣本信息既可以來自于新病例完成的治療循環,也可以來自于舊病例新完成的治療循環。③ 患者至少完成1個治療循環的數據即可被用于構建貝葉斯分層模型,而不需要等待完成全部治療循環才構建模型。同時,新的樣本信息可以隨時納入模型,動態評價,實時更新。④ 可以同步獲得豐富的后驗信息,例如:個體水平和群體水平的后驗估計值、95%可信區間、后驗估計值超過某個界值的概率等。后驗估計值大或小于某個界值的概率對于制定單病例隨機對照試驗的終止策略具有重要意義。研究者可以設定某個概率極限值。當患者完成某個治療循環之后,動態貝葉斯多水平模型估計的后驗概率超過或小于事先規定的某一概率極限值,則意味著患者可以終止試驗,得出該干預措施對患者有效可以繼續使用或無效而需要尋找其它治療措施的結論。這種試驗終止策略在實現個體化療效評價的同時,也為個體化的臨床決策提供了重要依據。例如,在已發表的一項美西律治療非營養不良性肌強直的單病例隨機對照試驗中,研究者將結局指標的最小臨床意義變化值設定為0.75[24]。如果患者結局指標的組間差值超過了0.75,意味著這個患者的療效發生了具有臨床意義的改變。同時,研究者規定,當結局指標后驗均值大于0.75的概率大于80%,認為美西律對該患者有效;后驗均值大于0.75的概率小于20%,認為美西律對該患者無效。當這兩種情況發生其一時,患者終止試驗。否則,患者繼續進行下一個治療循環。⑤ 貝葉斯多水平模型可以將多個影響因素(年齡、性別、中醫證候等)作為分層因素納入模型,提高療效估計的精確性。⑥ 與適應性設計具有兼容性。在常規的單病例隨機對照試驗框架下,研究者通常需要完成固定數量的治療循環。但是,在適應性設計框架下,患者可能不需要完成所有的治療輪次,而是根據期中分析的結果終止試驗或更換組別等。在貝葉斯單病例試驗框架下,每次將新的樣本信息納入貝葉斯分層模型,可以看作是一次期中分析。所以,貝葉斯單病例試驗與適應性設計具有一定的兼容性。目前,已有研究者開展基于適應性設計的貝葉斯單病例試驗數據模擬研究[25-26]。
盡管如此,基于貝葉斯單病例試驗的中醫個體化療效動態評價方法也存在一些不足,例如:① 目前,尚無公認的、適用于貝葉斯單病例試驗的樣本量估算軟件。研究者可以考慮采用模擬研究方法估算所需的樣本量。② 先驗分布不易確定。先驗信息往往來源于前期研究結果。當既往相關研究缺乏或不適用時,研究者可以考慮采用無信息先驗分布。③ 分層貝葉斯模型可以納入多個分層因素。但是,如何識別對研究結果有較大影響的因素仍非易事。研究者可以考慮采用查閱文獻、咨詢專家、患者溝通等多途徑的方式進行識別。
7 基于貝葉斯單病例試驗的中醫個體化療效動態評價方法的應用前景
基于貝葉斯單病例試驗的中醫個體化療效動態評價方法所具有的多種優點使其適用于多種研究環境和研究目的。
① 精準醫學研究:精準醫學強調基于患者的生物學信息、環境和生活方式等,給予患者個體化的預防和治療措施[27]。有學者認為,精準醫學需要一種側重于個體而非平均療效的臨床試驗設計[28]。近些年,單病例試驗設計在精準醫學研究中的應用受到關注[29-30]。在中醫診療過程中,醫生需要采集患者的一些中醫特色指標,例如:四診信息、證候、體質等。基于貝葉斯單病例試驗的中醫個體化療效動態評價方法以單病例試驗設計為基本框架,可將中醫特色指標作為協變量納入貝葉斯分層模型,有利于患者個體療效的精準評價。
② 真實世界研究:真實世界研究強調在真實世界環境下收集數據,通過合理分析獲取真實世界證據[31]。真實世界研究也適用于中醫藥臨床療效評價[32]。Nikles等[33]報道了多個單病例試驗在真實世界臨床應用的實例。基于貝葉斯單病例試驗的中醫個體化療效動態評價方法也適用于真實世界研究。研究者可以在中醫真實臨床診療實踐中開展單病例試驗,采用貝葉斯多水平模型動態評價和篩選對個體患者相對更有效的干預措施。
③ 臨床決策研究:近些年,與臨床決策相關的研究受到廣泛關注,例如:醫患共同決策、臨床輔助決策系統等[34-35]。一些研究顯示,單病例試驗可以作為一種臨床決策工具[36-37]。基于貝葉斯單病例試驗的中醫個體化療效動態評價方法可以實現多種中醫干預措施在個體水平的直接比較以及獲取豐富的后驗信息。這些證據可為醫生與患者溝通協商并做出最佳的臨床決策提供參考,也符合循證醫學的理念。
8 小結
如何實現個體化療效的動態評價是闡釋中醫臨床療效的關鍵科學問題之一。本文在分析中醫個體化療效評價方法研究現狀的基礎上,提出一種基于貝葉斯單病例試驗的中醫個體化療效動態評價方法。該方法整合了單病例試驗設計和貝葉斯多水平模型的優點,從設計和分析角度為開展中醫個體化療效評價提供了一種切實可行的研究方法,適用于多種研究環境和研究目的,可為豐富和完善中醫個體化療效評價方法學體系提供重要依據。
中醫藥臨床療效評價方法是近些年中醫藥領域的研究熱點之一。《中醫藥創新發展規劃綱要(2006—2020年)》中將中醫藥個體化療效評價方法列為重點研究內容之一[1]。中國科學技術協會將中醫藥臨床療效評價創新方法與技術列為2019年20個重大科學問題和工程技術難題之一。中醫診療過程強調辨證論治、病證結合。不同患者的病機演變與中醫干預措施的動態調整呈現出較為復雜的關聯關系。患者的療效信息具有縱向多時點動態變化、個體間異質性等特點。動態變化的個體縱向數據隱含著體現中醫療效的關鍵信息。如何實現個體化療效的動態評價是闡釋中醫臨床療效的關鍵科學問題之一。目前,尚無公認的、適用于中醫藥的個體化療效評價方法。基于目前中醫個體化療效評價方法在研究設計和統計分析方法中存在的局限性,本文提出一種基于貝葉斯單病例試驗的中醫個體化療效動態評價方法。
1 患者的療效信息存在多時點動態變化及個體間異質性
中醫診療過程也是醫生動態評估患者療效的過程。由于疾病的自然轉歸、干預措施的施加、環境的變化等因素影響,患者的療效信息往往會發生動態的變化[2]。這種動態變化可能是疾病的好轉、惡化、不變或各種狀態的交替變化。此外,個人生活習慣、體質等差異也可能導致這種變化在個體間存在一定的異質性。這些動態變化的個體縱向數據是體現中醫療效信息的重要來源。
中醫醫生對患者個體動態變化療效信息的評估往往來自于個人經驗,缺乏較為客觀的評價依據。隨機對照試驗被認為是確證干預措施療效的金標準。但是,隨機對照試驗屬于群體水平的研究,是以組間(群體水平)的療效差異具有統計學意義或臨床意義作為干預措施有效的判定標準,難以對患者個體療效進行動態評價。所以,開展中醫個體化療效動態評價方法研究仍具有必要性。
2 中醫個體化療效評價方法的研究現狀
中醫個體化療效評價方法是中醫藥領域持續關注的研究熱點。但是,相關研究并不多且在研究設計和統計分析方面存在一定的局限性。有些研究僅提出構建某種中醫個體化療效評價方法的思路,例如:一項研究通過調查個體化研究的方法學元素初步構建了中醫個體化臨床療效評價方法學元素集合并提出一種中醫療效評價的差異化策略[3]。有些研究側重于中醫個體化療效評價方法中個體化療效評價指標的構建,例如:一項研究提出了一種基于動態、共享信息平臺的中醫個體化療效評價指標體系,利用個體化評價指標進行個體化綜合評價,但未提供相應的統計分析方法[4]。有些研究在收集患者個體化診療信息的基礎上,使用各種數據挖掘方法評價中醫干預措施的療效(特別是中醫辨證論治的療效),例如:一項研究提出在中醫療效評價模型中通過主成份分析將個體化臨床信息降維、賦予不同的權重并進行歸一化處理,但是并未提供用于組間療效比較的統計分析方法[5]。有些研究將時間緯度引入中醫個體化療效評價[6],例如:一項研究提出一種動態、個性化測量健康狀態的中醫療效評價框架[7];另一項研究提出一種基于時空觀的中醫療效動態評價方法[8]。但是,未提供相應的統計分析方法。目前,應用較為廣泛的中醫個體化療效評價方法是采用單病例隨機對照試驗進行的個體化療效評價,例如:一項研究采用單病例隨機對照試驗評價了六味地黃膠囊治療肝腎陰虛證的療效[9];另一項研究采用單病例隨機對照試驗評價了涼血化瘀方治療原發性血小板增多癥的療效[10]。
3 單病例隨機對照試驗用于中醫個體化療效評價的優勢和不足
單病例隨機對照試驗是指一種以患者自身為對照、隨機、多輪次、交叉干預的試驗設計。可以實現一個患者完成一個單病例試驗。當納入多個研究對象時,可以看作是多個獨立進行的、有相似特點的系列單病例隨機對照試驗。單病例隨機對照試驗主要適用于一些慢性穩定性疾病(例如:慢性疼痛、長期失眠等),對干預措施有一些特殊要求(例如:起效快、殘留效應消退快等)。
開展臨床試驗的最終目的是將科學的、高質量的證據應用于具體的臨床實踐。中醫個體化診療的特點促使中醫的療效需要通過個體化評價彰顯。考慮到相同疾病患者之間的個體差異,隨機對照臨床試驗獲得的群體水平證據并不一定可以使每個患者受益,可能無法真實反映中醫診療的特色和優勢,而單病例隨機對照試驗可能彌補這一不足[11]。單病例隨機對照試驗針對單個患者進行的特點與中醫個體化診療的理念相一致,也避免了個體差異帶來的選擇性偏倚[12-13]。此外,系列單病例隨機對照試驗所獲得的個體療效也可以通過合理的統計分析方法進行合并從而獲得群體水平的治療效應。由此可見,單病例隨機對照試驗適用于中醫個體化的療效評價。
在中醫診療過程中,研究者可以縱向收集不同診療時點的患者療效數據[14]。在統計學中,這類數據稱為縱向數據,即在若干個時間點或一段時間內對個體的某個或某些特征進行重復觀察而獲得的數據。縱向數據的科學分析是實現中醫個體化療效動態評價的關鍵。從單病例試驗設計角度來看,同一個患者會經歷多個治療輪次。同一個治療輪次內的不同治療周期之間(不同治療周期內給予不同的干預)以及不同治療輪次之間的數據存在一定的自相關性。這些數據特點使得單病例試驗的統計分析存在一定的難度。目前,單病例試驗的統計分析主要依賴于頻率學派的一些統計分析方法。例如,考慮到不同處理組之間的療效數據來自于同一個受試者,將不同處理組之間多個治療輪次的數據進行配對,采用配對t檢驗或配對秩和檢驗進行統計分析,也可以將治療輪次或者觀察時點作為重復測量變量納入重復測量方差分析模型[15]。但是,傳統的縱向數據分析方法應用于中醫單病例隨機對照試驗時存在一定不足,例如:
① 一般情況下,在單病例試驗完成之后才進行最終的統計分析,而且需要將數據一次性全部納入模型,難以實現個體化療效的動態評價。如果進行期中分析,還可能會增大Ⅰ型誤差。
② 這些統計分析方法主要以頻率學派的統計理論為基礎。根據P值是否小于0.05判斷組間差異是否具有統計學意義,分析結果中可使用的信息量較少。
③ 對于系列單病例隨機對照試驗而言,較難在同一個統計模型中同步獲得個體水平和群體水平的療效分析結果。
4 動態貝葉斯多水平模型引入單病例隨機對照試驗的可行性分析
貝葉斯統計是一種將先驗分布和似然函數合并而獲得參數后驗分布的統計分析思想,其基本表達公式為P(B|A)=P(A|B)P(B)/P(A)。P(B)指未獲得新信息(事件A是否發生)的前提下,事件B發生的概率,即驗前概率。當獲得事件A是否發生的信息(樣本信息)后,根據這一信息,事件B的發生概率就有了新的估計,通過貝葉斯公式,我們就可以定量反映這種變化的大小。
在醫學研究中,常常能遇到具有分層或多水平特點的數據,例如:某項臨床試驗從多家醫院收集病例。由于不同醫院之間病人特征不同,可能對結果造成影響,需要按照醫院等級分層之后招募患者。這類數據構建的統計模型稱為分層或多水平模型。當構建貝葉斯模型時,如果某些因素可能對結果產生影響,研究者可以通過構建貝葉斯多水平模型,將這些影響因素作為分層因素納入模型,從而增強參數估計的穩健性。
單病例試驗數據的分層結構是構建貝葉斯多水平模型的基礎[16-17]。使用貝葉斯多水平模型進行統計分析的單病例試驗稱為貝葉斯單病例試驗[16-17]。貝葉斯多水平模型的層級至少可以分為兩層。如圖1所示,以兩層結構為例,介紹基于單病例隨機對照試驗的動態貝葉斯多水平模型構建過程。多個(系列)單病例隨機對照試驗中每個病例經歷多個治療循環(輪次)。這樣的數據具有分層結構。層數最少為兩層,即病例內部水平和病例之間水平[18]。基于貝葉斯公式,從預試驗、文獻等獲取的“先驗信息1”可與i個單病例隨機對照試驗數據構成的“樣本信息1”合并,從而獲得“后驗信息1”。當有新的樣本信息產生時(例如:新增加的第i+1個病例或新完成的第j+1個治療循環),“后驗信息1”與新獲得的“樣本信息2”通過貝葉斯公式合并,從而獲得“后驗信息2”。“后驗信息1”是對“先驗信息1”的更新。“后驗信息2”是對“后驗信息1”的更新。依此類推,“后驗信息n+1”是對“后驗信息n”的更新。通過構建動態貝葉斯多水平模型,個體水平(病例內部水平)療效信息不斷更新,實現了個體化療效的動態評價。同時,群體水平(病例之間水平)療效信息也相應更新。

5 “四步法”構建基于貝葉斯單病例試驗的中醫個體化療效動態評價方法
基于貝葉斯單病例試驗的中醫個體化療效動態評價方法是指采用單病例隨機對照試驗設計并使用貝葉斯多水平模型對中醫干預措施的療效進行動態評價的一種臨床療效評價方法。該方法包括以下4個具體步驟:
① 開展中醫單病例試驗。按照單病例隨機對照試驗方案設計規范,設計和實施中醫藥單病例試驗。目前,已有多部介紹單病例試驗設計和實施的書籍出版,例如:Agency for Healthcare Research and Quality(AHRQ)出版的Design and implementation of N-of-1 trials: a user’s guide、人民衛生出版社出版的《單病例隨機對照試驗:理論與實踐》。此外,2020年,BMJ發表了單病例試驗方案的報告規范清單[19]。這些書籍和規范清單可為開展高質量的中醫單病例試驗提供方法學依據。
② 構建貝葉斯模型。基于貝葉斯理論和馬爾科夫鏈蒙特卡羅模擬方法,以Winbugs軟件為分析平臺,根據參數之間的邏輯關系編寫運行程序,構建貝葉斯多水平模型。Winbugs軟件常被用于貝葉斯模型的構建。研究者也可以選擇SAS軟件、R軟件等構建貝葉斯分層模型。目前,已有一些研究報道了針對單病例試驗的貝葉斯分層模型構建過程或程序,可供研究者參考使用[20-21]。此外,貝葉斯分層模型的穩健性受多種因素影響,例如:先驗分布、缺失值、分層因素、建模參數等。研究者可以通過選擇不同的先驗分布和缺失值填補方法以及調整分層因素和建模參數等進一步優化模型。
③ 動態評價療效。當獲取新的信息(病例內部新增治療循環或新增病例)時,重新運行程序,獲取更新后的個體療效估計。新信息的不斷獲取促使個體療效估計的不斷更新,從而實現個體化療效的動態評價。同時,群體水平的療效也相應更新,可為臨床決策提供豐富的信息。
④ 規范報告結果。按照單病例試驗的報告規范,報告試驗結果。2015年,BMJ發表了單病例試驗的報告規范清單[22]。2019年,Complementary Therapies in Medicine發表了適用于中醫藥單病例試驗的報告規范清單[23]。這些規范清單可為合理報告中醫單病例試驗結果提供方法學參考。
6 基于貝葉斯單病例試驗的中醫個體化療效動態評價方法的優點和不足
本文提出的基于貝葉斯單病例試驗的中醫個體化療效動態評價方法具有一些明顯的優點,例如:① 貝葉斯多水平模型的構建過程不會破壞或改變中醫單病例隨機對照試驗的基本設計。② 在納入縱向數據(新增治療循環)和橫向數據(新增病例)方面具有良好的兼容性。新的樣本信息既可以來自于新病例完成的治療循環,也可以來自于舊病例新完成的治療循環。③ 患者至少完成1個治療循環的數據即可被用于構建貝葉斯分層模型,而不需要等待完成全部治療循環才構建模型。同時,新的樣本信息可以隨時納入模型,動態評價,實時更新。④ 可以同步獲得豐富的后驗信息,例如:個體水平和群體水平的后驗估計值、95%可信區間、后驗估計值超過某個界值的概率等。后驗估計值大或小于某個界值的概率對于制定單病例隨機對照試驗的終止策略具有重要意義。研究者可以設定某個概率極限值。當患者完成某個治療循環之后,動態貝葉斯多水平模型估計的后驗概率超過或小于事先規定的某一概率極限值,則意味著患者可以終止試驗,得出該干預措施對患者有效可以繼續使用或無效而需要尋找其它治療措施的結論。這種試驗終止策略在實現個體化療效評價的同時,也為個體化的臨床決策提供了重要依據。例如,在已發表的一項美西律治療非營養不良性肌強直的單病例隨機對照試驗中,研究者將結局指標的最小臨床意義變化值設定為0.75[24]。如果患者結局指標的組間差值超過了0.75,意味著這個患者的療效發生了具有臨床意義的改變。同時,研究者規定,當結局指標后驗均值大于0.75的概率大于80%,認為美西律對該患者有效;后驗均值大于0.75的概率小于20%,認為美西律對該患者無效。當這兩種情況發生其一時,患者終止試驗。否則,患者繼續進行下一個治療循環。⑤ 貝葉斯多水平模型可以將多個影響因素(年齡、性別、中醫證候等)作為分層因素納入模型,提高療效估計的精確性。⑥ 與適應性設計具有兼容性。在常規的單病例隨機對照試驗框架下,研究者通常需要完成固定數量的治療循環。但是,在適應性設計框架下,患者可能不需要完成所有的治療輪次,而是根據期中分析的結果終止試驗或更換組別等。在貝葉斯單病例試驗框架下,每次將新的樣本信息納入貝葉斯分層模型,可以看作是一次期中分析。所以,貝葉斯單病例試驗與適應性設計具有一定的兼容性。目前,已有研究者開展基于適應性設計的貝葉斯單病例試驗數據模擬研究[25-26]。
盡管如此,基于貝葉斯單病例試驗的中醫個體化療效動態評價方法也存在一些不足,例如:① 目前,尚無公認的、適用于貝葉斯單病例試驗的樣本量估算軟件。研究者可以考慮采用模擬研究方法估算所需的樣本量。② 先驗分布不易確定。先驗信息往往來源于前期研究結果。當既往相關研究缺乏或不適用時,研究者可以考慮采用無信息先驗分布。③ 分層貝葉斯模型可以納入多個分層因素。但是,如何識別對研究結果有較大影響的因素仍非易事。研究者可以考慮采用查閱文獻、咨詢專家、患者溝通等多途徑的方式進行識別。
7 基于貝葉斯單病例試驗的中醫個體化療效動態評價方法的應用前景
基于貝葉斯單病例試驗的中醫個體化療效動態評價方法所具有的多種優點使其適用于多種研究環境和研究目的。
① 精準醫學研究:精準醫學強調基于患者的生物學信息、環境和生活方式等,給予患者個體化的預防和治療措施[27]。有學者認為,精準醫學需要一種側重于個體而非平均療效的臨床試驗設計[28]。近些年,單病例試驗設計在精準醫學研究中的應用受到關注[29-30]。在中醫診療過程中,醫生需要采集患者的一些中醫特色指標,例如:四診信息、證候、體質等。基于貝葉斯單病例試驗的中醫個體化療效動態評價方法以單病例試驗設計為基本框架,可將中醫特色指標作為協變量納入貝葉斯分層模型,有利于患者個體療效的精準評價。
② 真實世界研究:真實世界研究強調在真實世界環境下收集數據,通過合理分析獲取真實世界證據[31]。真實世界研究也適用于中醫藥臨床療效評價[32]。Nikles等[33]報道了多個單病例試驗在真實世界臨床應用的實例。基于貝葉斯單病例試驗的中醫個體化療效動態評價方法也適用于真實世界研究。研究者可以在中醫真實臨床診療實踐中開展單病例試驗,采用貝葉斯多水平模型動態評價和篩選對個體患者相對更有效的干預措施。
③ 臨床決策研究:近些年,與臨床決策相關的研究受到廣泛關注,例如:醫患共同決策、臨床輔助決策系統等[34-35]。一些研究顯示,單病例試驗可以作為一種臨床決策工具[36-37]。基于貝葉斯單病例試驗的中醫個體化療效動態評價方法可以實現多種中醫干預措施在個體水平的直接比較以及獲取豐富的后驗信息。這些證據可為醫生與患者溝通協商并做出最佳的臨床決策提供參考,也符合循證醫學的理念。
8 小結
如何實現個體化療效的動態評價是闡釋中醫臨床療效的關鍵科學問題之一。本文在分析中醫個體化療效評價方法研究現狀的基礎上,提出一種基于貝葉斯單病例試驗的中醫個體化療效動態評價方法。該方法整合了單病例試驗設計和貝葉斯多水平模型的優點,從設計和分析角度為開展中醫個體化療效評價提供了一種切實可行的研究方法,適用于多種研究環境和研究目的,可為豐富和完善中醫個體化療效評價方法學體系提供重要依據。