聯系我們

濟南濼合醫藥技術有限公司

手機:15106968590  劉經理

手機:13156189502  張經理

電話:0531-68658065

傳真:0531-68658065

郵箱:jinanluohe@163.com

地址:山東省濟南市匯展西路88號1號樓1-844


技術指導

所在位置:首頁  > 學習園地技術指導

化學藥物和生物制品臨床試驗的生物統

更新時間:2017-03-29 點擊數:1952

化學藥物和生物制品臨床試驗的生物統計學

技術指導原則

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

二○○四年十一月

目      錄

一、概述...... 1

二、整個臨床試驗的基本考慮...... 1

(一)探索性試驗和確證性試驗. 1

(二)觀察指標. 2

(三)偏倚的控制. 4

三、試驗設計中的基本考慮...... 7

(一)試驗設計的類型. 7

(二)多中心試驗. 9

(三)比較的類型. 10

(四)樣本量. 11

(五)資料的收集. 11

四、試驗進行中的基本考慮...... 12

(一)期中分析. 12

(二)試驗方案的修改. 12

五、數據管理...... 13

六、統計分析...... 14

(一)統計分析計劃書. 14

(二)統計分析集. 15

(三)缺失值及離群值. 16

(四)數據變換. 16

(五)統計分析方法. 16

(六)安全性評價. 18

七、統計分析報告...... 19

八、名詞解釋...... 20

九、參考文獻...... 22

十、附錄...... 22

十一、著者...... 22

化學藥物和生物制品臨床試驗的生物統計學技術指導原則
起草說明...... 23


化學藥物和生物制品臨床試驗的生物統計學
技術指導原則

一、概述

新藥經臨床前研究后,其有效性和安全性的評價需要由臨床試驗加以確認。由于臨床試驗通常是根據研究的目的,通過足夠數量的受試者(樣本)來研究藥物對疾病進程、預后等方面的作用,因此,臨床試驗設計必須應用統計學原理對試驗相關的因素做出合理的、有效的安排,并最大限度

地控制試驗誤差、提高試驗質量以及對試驗結果進行科學合理的分析,在保證試驗結果科學、可信的同時,盡可能做到高效、快速、經濟。因此,統計學在臨床試驗中有著不可缺少的重要作用。

本指導原則以臨床試驗的基本要求和統計學原理為重點,包含了對臨床試驗的總體考慮以及試驗設計、試驗過程和結果分析時的統計學問題,旨在為藥品注冊申請人和臨床試驗的研究者在整個臨床試驗中如何進行設計、實施、分析和評價提供指導,以期保證藥物臨床試驗科學、嚴謹和規范。

本指導原則主要適用于臨床試驗的后期(確證性試驗),但應盡可能用于臨床試驗的各個階段。

二、整個臨床試驗的基本考慮

(一)探索性試驗和確證性試驗

藥物臨床試驗的主要目標是尋找是否存在其風險/效益比可接受的安全有效的藥物,同時也要確定可能由該藥受益的特定對象、使用適應癥及適宜的用法與用量。為達到以上總體目標,需要設計一系列的臨床試驗,而每一個臨床試驗都有其特定的目的,其設計、執行和擬采用的分析方法等細節均應在試驗方案中予以明確。

臨床試驗的早期,需要進行一系列的探索性試驗,這些試驗也應有清晰和明確的目標。探索性試驗有時需要更為靈活可變的方法進行設計并對數據進行分析,以便根據逐漸積累的結果對后期的確證性試驗設計提供相應的信息。雖然探索性試驗對有效性的確證有參考價值,但不能作為證明有效性的正式依據。

臨床試驗的后期,需要經過確證性試驗為評價藥物的有效性和安全性提供有力證據。確證性試驗是一種事先提出假設并對其進行檢驗的隨機對照試驗,以說明所開發的藥物對臨床是有益的。因此,對涉及藥物有效性和安全性的每一個關鍵性的問題都需要通過確證性試驗予以充分的回答。

(二)觀察指標

觀察指標是指能反映臨床試驗中藥物有效性和安全性的觀察項目。統計學中常將觀察指標稱為變量。觀察指標分為測量指標和分類指標。

觀察指標必須在設計方案中有明確的定義和可靠的依據,不允許隨意修改。

1、主要指標和次要指標

主要指標又稱主要終點,是與試驗目的有本質聯系的,能確切反映藥物有效性或安全性的觀察指標。通常主要指標只有一個,如果存在多個主要指標時,應該在設計方案中,考慮控制Ⅰ類錯誤的方法。主要指標應根據試驗目的選擇易于量化、客觀性強、重復性高,并在相關研究領域已有公認的標準。主要指標必須在臨床試驗前確定,并用于試驗樣本量的估計。

次要指標是指與試驗目的相關的輔助性指標。在試驗方案中,也需明確次要指標的定義,并對這些指標在解釋試驗結果時的作用以及相對重要性加以說明。次要指標數目也應當是有限的,并且能回答與試驗目的相關的問題。

2、復合指標

當難以確定單一的主要指標時,可按預先確定的計算方法,將多個指標組合構成一個復合指標。如臨床上采用的量表就是一種復合指標。復合指標被用作主要指標時,組成這個復合指標的單個指標如果有臨床意義,也可以同時單獨進行分析。

3、全局評價指標

全局評價指標是將客觀指標和研究者對受試者療效的總印象有機結合的綜合指標,它通常是有序等級指標。用全局評價指標來評價某個治療的總體有效性或安全性,一般都有一定的主觀成份。如果必須將其定義為主要指標時,應在試驗方案中有明確判斷等級的依據和理由。全局評價指標中的客觀指標一般應該同時單獨作為主要指標進行分析。

4、替代指標

替代指標是指在直接測定臨床效果不可能時,用于間接反映臨床效果的觀察指標。替代指標所提供的用于臨床效果評價的證據的強度取決于:1)替代指標與試驗目的在生物學上相關性的大??;2)在流行病學研究中替代指標對臨床試驗結果的預測價值;3)從臨床試驗中獲得的藥物對替代指標的影響程度與藥物對臨床試驗結果的影響程度相一致的證據。

5、測量指標轉換為分類指標

根據臨床評價的需要,有時需將測量指標轉換為二分類或多分類的分類指標,如:根據一個測量指標改變程度等于或超過某一數值時作為分類的定義。分類指標的定義應在試驗方案中明確規定。由測量指標轉換為分類指標通常會喪失部分信息,由此導致檢驗效能的降低應當在估計樣本量時加以考慮。

(三)偏倚的控制

偏倚又稱偏性,是指在設計臨床試驗方案、執行臨床試驗、分析評價臨床試驗結果時,有關影響因素所致的系統誤差,致使療效或安全性評價偏離真值。偏倚會干擾臨床試驗得出正確的結論,在臨床試驗的全過程中均須防范其發生。隨機化和盲法是控制偏倚的重要措施。

1、隨機化

隨機化是使臨床試驗中的受試者有同等的機會被分配到試驗組或對照組中,而不受研究者和/或受試者主觀意愿的影響,可以使各處理組的各種影響因素(包括已知和未知的因素)分布趨于相似。隨機化包括分組隨機和試驗順序隨機,與盲法合用,有助于避免因處理分配的可預測,在受試者的選擇和分組時可能導致的偏倚。

臨床試驗中可采用分層、區組隨機化方法。分層隨機化有助于保持層內的均衡性,特別在多中心臨床試驗中,中心就是一個分層因素。另外為了使各層趨于均衡,避免產生混雜偏倚,按照基線資料中的重要預后因素(如病癥的嚴重程度)等進行分層,對促使層內的均衡安排是很有價值的。區組隨機化有助于減少季節、疾病流行等因素對療效的影響。區組的大小要適當,太大易造成組間不均衡,太小則易造成同一區組內受試者分組的可猜測性。研究者及其有關人員應對區組的大小保持盲態。

當樣本量、分層因素及區組大小決定后,由試驗統計學專業人員在計算機上使用統計軟件產生隨機分配表。臨床試驗的隨機分配表就是用文件形式寫出對受試者的處理安排,即處理(或在交叉試驗中的處理順序)的序列表。隨機分配表必須有可以重新產生的能力,即當產生隨機數的初值、分層、區組決定后能使這組隨機數重新產生。

試驗用藥物應根據試驗統計學專業人員產生的隨機分配表進行編碼,以達到隨機化的要求,受試者應嚴格按照試驗用藥物編號的順序入組,不得隨意變動,否則會破壞隨機化效果。隨機化的方法和過程應在試驗方案中闡明,但使人容易猜測分組的隨機化的細節(如區組長度等)不應包含在試驗方案中。

2、盲法

盲法是為了控制臨床試驗過程中和解釋結果時產生偏倚的措施之一。這些偏倚可能來自于多個方面,如由于對治療的了解而對受試者的分組進行選擇、受試者對治療的態度、研究者對安全有效性的評價、對脫落病例的處理以及在結果分析中剔除的數據等。

根據設盲程度的不同,盲法分為雙盲、單盲和非盲。如條件許可,應盡可能采用雙盲試驗,尤其在試驗的主要變量易受主觀因素干擾時。如果雙盲不可行,則應優先考慮單盲試驗。在某些特殊情況下,由于一些原因而無法進行盲法試驗時,可考慮進行非盲的臨床試驗。無論是采用單盲或非盲的臨床試驗,均應制訂相應的控制試驗偏倚的措施,使已知的偏倚來源達到最小。例如,主要指標應盡可能客觀,采用信封隨機法入選受試者,參與療效與安全性評價的研究者在試驗過程中盡量處于盲態。采用不同設盲方法的理由,以及通過其它方法使偏倚達到最小的措施,均應在試驗方案中說明。

盲法的原則應自始至終地貫徹于整個試驗之中。雙盲臨床試驗中,從隨機數的產生、試驗用藥物的編碼、受試者入組用藥、試驗結果的記錄和評價、試驗過程的監查、數據管理直至統計分析,都必須保持盲態。監查員必須自始至終保持盲態。如果發生了任何非規定情況所致的盲底泄露,并影響了該試驗結果的客觀性,則該試驗將被視作無效。

為使雙盲臨床試驗得以順利實施,還必須注意以下幾個問題。

安慰劑: 在雙盲臨床試驗中,應保證所提供的安慰劑與所模擬的藥物在劑型、外觀、氣味等方面完全一致,并不含有任何有效成份。

雙模擬技術:臨床試驗中,當試驗藥和對照藥外觀不一致時,可為試驗藥和對照藥各準備一種安慰劑,以達到試驗組與對照組在用藥的外觀與給藥方法上的一致。這一技術有時也會使用藥計劃較難實施,以至影響受試者的依從性。

膠囊技術:為達到雙盲的目的,可將試驗用藥(包括試驗藥、對照藥、安慰劑)分別裝入外觀相同的膠囊。但應首先證明藥物在裝入膠囊后與原劑型藥物生物等效。

藥物編盲與盲底保存:由不參與臨床試驗的人員根據已產生的隨機分配表對試驗用藥物進行分配編碼的過程稱為藥物編盲。隨機數、產生隨機數的參數及試驗用藥物編碼統稱為雙盲臨床試驗的盲底。用于編盲的隨機數產生時間應盡量接近于藥物分配包裝的時間,編盲過程應有相應的監督措施和詳細的編盲記錄,完成編盲后的盲底應一式二份密封,交臨床試驗負責單位和藥品注冊申請人分別保存。

應急信件與緊急揭盲:從醫學倫理學方面考慮,雙盲試驗應為每一個編盲號設置一份應急信件,信件內容為該編號的受試者所分入的組別及用藥情況。應急信件應密封,隨相應編號的試驗用藥物發往各臨床試驗單位,由該單位負責保存,非必要時不得拆閱。在發生緊急情況或病人需要搶救必須知道該病人接受的是何種處理時,由研究人員按試驗方案規定的程序拆閱。一旦被拆閱,該編號病例將中止試驗,研究者應將中止原因記錄在病例報告表中。所有應急信件在試驗結束后隨病例報告表一起收回, 以便試驗結束后盲態審核。

試驗方案中要對嚴重不良事件以及意外情況的處理作出規定,包括如何緊急揭盲、如何報告等。試驗結束時應對破盲的原因、范圍和時間作出分析,作為對療效及安全性評價的參考。

揭盲規定:試驗方案中,當試驗組與對照組按1:1設計時,一般采用兩次揭盲法。兩次揭盲都由保存盲底的有關人員執行。數據文件經過盲態審核并認定可靠無誤后將被鎖定,進行第一次揭盲。此次揭盲只列出每個病例所屬的處理組別(如A組或B組)而并不標明哪一個為試驗組或對照組。第一次揭盲的結果交由試驗統計學專業人員輸入計算機,與數據文件進行聯接后,進行統計分析。當統計分析結束后進行第二次揭盲,以明確各組所接受的治療。

三、試驗設計中的基本考慮

(一)試驗設計的類型

1、平行組設計

平行組設計是最常用的臨床試驗設計類型,可為試驗藥設置一個或多個對照組,試驗藥也可設多個劑量組。對照組可分為陽性或陰性對照。陽性對照一般采用按所選適應癥的當前公認的有效藥物,陰性對照一般采用安慰劑,但必須符合倫理學要求。試驗藥設一個或多個劑量組完全取決于試驗方案。

2、交叉設計

交叉設計是按事先設計好的試驗次序,在各個時期對受試者逐一實施各種處理,以比較各處理組間的差異。交叉設計是將自身比較和組間比較設計思路綜合應用的一種設計方法,它可以控制個體間的差異,同時減少受試者人數。

最簡單的交叉設計是2′2形式,對每個受試者安排兩個試驗階段,分別接受兩種試驗用藥物,而第一階段接受何種試驗用藥物是隨機確定的,第二階段必須接受與第一階段不同的另一種試驗用藥物。每個受試者需經歷如下幾個試驗過程,即準備階段、第一試驗階段、洗脫期和第二試驗階段。

每個試驗階段的用藥對后一階段的延滯作用稱為延滯效應。采用交叉設計時應避免延滯效應,資料分析時需檢測是否有延滯效應存在。因此,每個試驗階段后需安排足夠長的洗脫期或有效的洗脫手段,以消除其延滯效應。

交叉設計應盡量避免受試者的失訪。

3、析因設計

析因設計是通過試驗用藥物劑量的不同組合,對兩個或多個試驗用藥物同時進行評價,不僅可檢驗每個試驗用藥物各劑量間的差異,而且可以檢驗各試驗用藥物間是否存在交互作用,或探索兩種藥物不同劑量的適當組合。

如果試驗的樣本量是基于檢驗主效應而計算的,則在估計交互作用時,檢驗效能將降低。

4、成組序貫設計

成組序貫設計常用于下列兩種情況:(1)試驗藥與對照藥的療效相差較大,但病例稀少且臨床觀察時間較長。 (2)懷疑試驗藥物有較高的不良反應發生率,采用成組序貫設計可以較早終止試驗。

成組序貫設計是把整個試驗分成若干個連貫的分析段,每個分析段病例數相等,且試驗組與對照組的病例數比例與總樣本中的比例相同。每完成一個分析段,即對主要指標(包括有效性和安全性)進行分析,一旦可以做出結論(拒絕無效假設,差異有統計學意義)即停止試驗,否則繼續進行。如果到最后一個分析段仍不拒絕無效假設,則作為差異無統計學意義而結束試驗。其優點是當處理間確實存在差異時,可較早地得到結論,從而縮短試驗周期。

成組序貫設計的盲底要求一次產生,分批揭盲。由于多次重復進行假設檢驗會使I類錯誤增加,故需對每次檢驗的名義水準進行調整,以控制總的I類錯誤不超過預先設定的水準(比如α=0.05)。試驗設計中需寫明α消耗函數的計算方法。

(二)多中心試驗

多中心試驗系指由一個單位的主要研究者總負責,多個單位的研究者合作,按同一個試驗方案同時進行的臨床試驗。多中心試驗可以在較短的時間內入選所需的病例數,且入選的病例范圍廣,臨床試驗的結果更具代表性。但影響因素亦隨之更趨復雜。

多中心試驗必須在統一的組織領導下,遵循一個共同制定的試驗方案完成整個試驗。各中心試驗組和對照組病例數的比例應與總樣本的比例相同,以保證各中心齊同可比。多中心試驗要求各中心的研究人員采用相同的試驗方法,試驗前對人員統一培訓,試驗過程要有監控措施。當主要指標可能受主觀影響時,需進行統一培訓和一致性檢驗。當主要指標在各中心的實驗室的檢驗結果有較大差異或參考值范圍不同時,應采取相應的措施,如:統一由中心實驗室檢驗。

在雙盲多中心臨床試驗中,盲底是一次產生的,應按中心分層隨機;當中心數較多且每個中心的病例數較少時,可統一進行隨機,不按中心分層。

(三)比較的類型

臨床試驗中比較的類型,按統計學中的假設檢驗可分為優效性檢驗、等效性檢驗和非劣效性檢驗。優效性檢驗的目的是顯示試驗藥的治療效果優于對照藥,包括:試驗藥是否優于安慰劑;試驗藥是否優于陽性對照藥;或劑量間效應的比較。等效性檢驗的目的是確認兩種或多種治療的效果差別大小在臨床上并無重要意義,即試驗藥與陽性對照藥在療效上相當。而非劣效性檢驗目的是顯示試驗藥的治療效果在臨床上不劣于陽性對照藥。在顯示后兩種目的試驗設計中,陽性對照藥的選擇要慎重。所選陽性對照藥需是已廣泛應用的、對相應適應癥的療效和用量已被證實,使用它可以有把握地期望在陽性對照試驗中表現出相似的效果;陽性對照藥原有的用法與用量不得任意改動。

進行等效性檢驗或非劣效性檢驗時,需預先確定一個等效界值(上限和下限)或非劣效界值(下限),這個界值應不超過臨床上能接受的最大差別范圍,并且應當小于陽性對照藥對安慰劑的優效性試驗所觀察到的差異。等效界值或非劣效界值的確定需要由主要研究者從臨床上認可,而不是依賴于試驗統計學專業人員。試驗中所選擇的比較類型,應從臨床角度考慮,并在制定試驗方案時確定下來。通常以陽性為對照的臨床試驗中,如果要說明試驗藥物的效果不低于陽性對照藥時,多傾向于進行非劣效性檢驗。

等效性或非劣效性的統計學檢驗常用可信區間法。等效性檢驗采用雙側可信區間,當可信區間完全落在等效界值之內,則推斷為等效;非劣效性檢驗應采用單側可信區間,如果可信區間的下界大于非劣效性檢驗的下限,則推斷為非劣效。

(四)樣本量

每個臨床試驗的樣本量應符合統計學要求。

臨床試驗中所需的樣本量應足夠大,以確保對所提出的問題給予一個可靠的回答。樣本的大小通常以試驗的主要指標來確定。同時應考慮試驗設計類型、比較類型等。

樣本量的確定與以下因素有關,即設計的類型、主要指標的性質(測量指標或分類指標)、臨床上認為有意義的差值、檢驗統計量、檢驗假設、Ⅰ類和Ⅱ類錯誤的概率等。樣本量的具體計算方法以及計算過程中所需用到的統計量的估計值及其依據應在臨床試驗方案中列出,同時需要提供這些估計值的來源依據。在確證性試驗中,樣本量的確定主要依據已發表的資料或預試驗的結果來估算。Ⅰ類錯誤概率常用0.05,Ⅱ類錯誤概率應不大于0.2。

(五)資料的收集

臨床試驗數據的收集和傳送,可采用多種形式,目前較為常用的形式為病例報告表。

從試驗數據的收集到數據庫的完成,均應符合《藥物臨床試驗質量管理規范》(GCP)的規定,尤其是及時的數據記錄、錯誤更正、補遺等。這些步驟均是建立高質量數據庫、完成試驗計劃并達到試驗目的所必需的。

四、試驗進行中的基本考慮

(一)期中分析

某些臨床試驗需要進行期中分析。期中分析是指正式完成臨床試驗前,按事先制訂的分析計劃,比較處理組間的有效性和安全性所作的分析。期中分析的日程、安排、所采用的α消耗函數等應當事先制訂計劃并在試驗方案中闡明。期中分析的結果可能會對后續試驗產生影響,因此,一個臨床試驗的期中分析次數應嚴格控制。如果一個期中分析是為了決定是否終止試驗而設計的,則常采用成組序貫設計。

期中分析包含了已揭盲的數據及結果,因此進行期中分析的人員應該是不直接參加臨床試驗的人員,分析結果必須保持盲態。研究者僅僅會被告知是否繼續試驗或需要對試驗方案進行修改。

設計不良的期中分析可能使結果有誤,所得結論缺乏可靠性。如進行了計劃外的期中分析,在研究報告中應解釋其必要性、破盲的必要性,提供可能導致的偏倚的嚴重程度以及對結果解釋的影響。

(二)試驗方案的修改

試驗方案確定并經倫理委員會批準后,其研究設計一般情況下不宜更改。但在以下兩種情況可以考慮修改:

在試驗進行過程中,如發現按原入選/排除標準難以選到合格的病例時,需分析原因并采取相應措施,在不破盲的條件下修改原入選/排除標準。

當原設計的樣本含量是在不確切信息的假設條件下估計的,而期中分析結果表明指標的估計與期望值不符時,應修改假設條件,重新計算樣本含量。

    對試驗方案的任何修改都應在修訂方案中寫明。修訂方案需重新得到倫理委員會的批準。

五、數據管理

數據的正確性對保證臨床試驗的質量極為重要,因此必須十分重視。認真進行監查及數據管理能及早地發現問題,并可盡量避免問題的發生和再現。

研究者應根據受試者的原始觀察記錄,保證將數據正確、完整、清晰、及時地載入病例報告表。監查員須監查試驗的進行是否遵循試驗方案(如檢查有無不符合入選/排除標準的病例等),確認所有病例報告表填寫正確完整,與原始資料一致,如有錯誤和遺漏,及時要求研究者改正。修改時需保持原有記錄清晰可見,改正處需經研究者簽名并注明日期。

經過監查員檢查后的病例報告表,需及時送交臨床試驗的數據管理員。對于完成的病例報告表在研究者、監查員、數據管理員之間的傳送應有專門的記錄并妥善保存。

應根據病例報告表和統計分析計劃書的要求制訂數據管理計劃,并在第一份病例報告表送到以前,由數據管理員建立數據庫,并保證其完整、正確和安全。數據管理員還應對每一份病例報告表進行初步審核,再交由兩名操作人員獨立地輸入數據庫中,并用軟件對兩份輸入結果進行比較。如果有不一致,需查出原因,加以更正。數據管理員按病例報告表中各指標數值的范圍和相互關系擬定數據檢查,如范圍檢查和邏輯檢查等。所有錯誤內容及修改結果應有詳細記錄并妥善保存。如有必要,可再次對數據庫中的指標(特別是主要指標)進行全部或抽樣的人工檢查,并與病例報告表進行核對。

數據管理中發現任何問題時,應及時通知監查員,要求研究者作出回答。他們之間的各種疑問及解答的交換應當使用疑問表,疑問表應保存備查。

上述工作完成后,由主要研究者、藥品注冊申請人、試驗統計學專業人員和數據管理員進行盲態審核。盲態審核中確定每個病例所屬分析集、缺失值的處理及離群值的判斷等。以上任何決定都需用文件形式記錄下來。盲態審核下所作的決定不應該在揭盲后被修改。經盲態審核認為所建立的數據庫正確無誤后,對數據庫進行鎖定。此后,對數據庫的任何改動只有在以上幾方人員均同意(可以書面形式)的情況下才能進行。

數據庫鎖定后需妥善保存備查,并進行第一次揭盲,同時將盲底和數據庫交試驗統計學專業人員進行統計分析。

六、統計分析

(一)統計分析計劃書

統計分析計劃書由試驗統計學專業人員起草,并與主要研究者商定,其內容應比試驗方案中所規定的要求更為具體。

統計分析計劃書上應列出統計分析集的選擇、主要指標、次要指標、統計分析方法、療效及安全性評價方法等,按預期的統計分析結果列出統計分析表備用。

統計分析計劃書應形成于試驗方案和病例報告表確定之后。在臨床試驗進行過程中,可以修改、補充和完善。但是在第一次揭盲之前必須以文件形式予以確認,此后不能再作變動。

(二)統計分析集

用于統計的分析集需在試驗方案的統計部分中明確定義,并在盲態審核時確認每位受試者所屬的分析集。在定義分析數據集時,需遵循以下兩個原則:①使偏倚達到最??;②控制I類錯誤的增加。

根據意向性分析(簡稱ITT)的基本原則,主要分析應包括所有隨機化的受試者。即需要完整地隨訪所有隨機化對象的研究結果,但實際操作中往往難以達到。因此,常采用全分析集進行分析。全分析集(簡稱FAS)是指盡可能接近符合意向性分析原則的理想的受試者集。該數據集是從所有隨機化的受試者中,以最少的和合理的方法剔除受試者后得出的。在選擇全分析集進行統計分析時,對主要指標缺失值的估計,可以采用最接近的一次觀察值進行結轉。

受試者的“符合方案集” (簡稱PPS),亦稱為 “可評價病例”樣本。它是全分析集的一個子集,這些受試者對方案更具依從性,依從性包括以下一些考慮,如所接受的治療、主要指標測量的可行性以及未對試驗方案有大的違反等。將受試者排除在符合方案集之外的理由應在盲態審核時闡明,并在揭盲之前用文件寫明。

在確證性試驗的藥物有效性評價時,宜同時用全分析集和符合方案集進行統計分析。當以上兩種數據集的分析結論一致時,可以增強試驗結果的可信性。當不一致時,應對其差異進行清楚的討論和解釋。如果符合方案集中被排除的受試者比例太大,則會影響試驗的有效性分析。

在很多的臨床試驗中,全分析集方法是保守的,但更接近藥物上市后的療效。應用符合方案集可以顯示試驗藥物按規定的方案使用的效果,但可能較以后實踐中的療效偏大。

對安全性評價的數據集選擇應在方案中明確定義,通常安全性數據集應包括所有隨機化后至少接受一次治療的受試者。

(三)缺失值及離群值

缺失值是臨床試驗中的一個潛在的偏倚來源,因此,病例報告表中原則上不應有缺失值,尤其是重要指標(如主要的療效和安全性指標)必須填寫清楚。對病例報告表中的基本數據,如性別、出生日期、入組日期和各種觀察日期等不得缺失。試驗中觀察的陰性結果、測得的結果為零和未能測出者,均應有相應的符號表示,不能空缺,以便與缺失值相區分。

離群值問題的處理,應當從醫學和統計學專業兩方面去判斷,尤其應當從醫學專業知識判斷。離群值的處理應在盲態檢查時進行,如果試驗方案未預先指定處理方法,則應在實際資料分析時,進行包括和不包括離群值的兩種結果比較,研究它們對結果是否不一致以及不一致的直接原因。

(四)數據變換

分析之前對關鍵變量是否要進行變換,最好根據以前的研究中類似資料的性質,在試驗設計時即做出決定。擬采用的變換(如對數、平方根等)及其依據需在試驗方案中說明,數據變換是為了確保資料滿足統計分析方法所基于的假設,變換方法的選擇原則應是公認常用的。一些特定變量的常用變換方法已在某些特定的臨床領域得到成功地應用。

(五)統計分析方法

臨床試驗中數據分析所采用的統計分析方法和統計分析軟件應是國內外公認的,統計分析應建立在正確、完整的數據基礎上,采用的統計模型應根據研究目的、試驗方案和觀察指標選擇,一般可概括為以下幾個方面:

1、描述性統計分析

一般多用于人口學資料、基線資料和安全性資料,包括對主要指標和次要指標的統計描述。

2、參數估計、可信區間和假設檢驗

參數估計、可信區間和假設檢驗是對主要指標及次要指標進行評價和估計的必不可少的手段。試驗方案中,應當說明要檢驗的假設和待估計的處理效應、統計分析方法以及所涉及的統計模型。處理效應的估計應同時給出可信區間,并說明估計方法。假設檢驗應明確說明所采用的是單側還是雙側,如果采用單側檢驗,應說明理由。

3、協變量分析

評價藥物有效性的主要指標除藥物作用以外,常常還有其它因素的影響,如受試者的基線情況、不同治療中心受試者之間差異等因素,這些因素在統計學中可作為協變量處理。在試驗前應認真識別可能對主要指標有重要影響的協變量及如何進行分析以提高估計的精度,補償處理組間由于協變量不均衡所產生的影響。

在多中心臨床試驗中,如果中心間處理效應是齊性的,則在模型中常規地包含交互作用項將會降低主效應檢驗的效能。因此對主要指標的分析如采用一個考慮到中心間差異的統計模型來研究處理的主效應時,不應包含中心與處理的交互作用項。如中心間處理效應是非齊性的,則對處理效應的解釋將很復雜。

(六)安全性評價

臨床試驗中,安全性評價是非常重要的一個方面。在臨床試驗的早期,這一評價主要是探索性的,且只能發現常見的不良反應;在后期,一般可通過較大的樣本進一步了解藥物的安全性。后期的對照試驗是一個重要的以無偏倚的方式探索任何新的潛在的藥物不良反應的方法。

為了說明在安全性和耐受性方面與其他藥物或該藥物的其他劑量比較的優效性或等效性,可設計某些試驗。這種評價需要相應的確證性試驗的支持,這與相應的有效性的評價要求是相同的。

藥物安全性評價的常用統計指標為不良事件發生率和不良反應發生率。當試驗時間較長、有較大的退出治療比例或死亡比例時,需用生存分析計算累計不良事件發生率。用于評價藥物安全性和耐受性的方法以及度量準則依賴于非臨床研究和早期臨床研究的信息、該藥物的藥效學和藥代動力學特性、服藥方法、受試者類型以及試驗的持續時間等。而構成安全性評價的資料則主要來源于不良事件的臨床表現、實驗室檢查等。

從受試者中收集的安全性和耐受性變量應盡可能全面,包括受試者出現的所有不良事件的類型、發生時間、嚴重程度、處理措施、持續的時間、轉歸以及藥物劑量與試驗用藥物的關系。

所有的安全性指標在評價中都需十分重視,其主要分析方法需在研究方案中指明。無論是否認為與處理有關,所有的不良事件均需列出。在安全性評價中,研究人群的所有可用資料均需考慮。實驗室應提供檢查指標的度量單位以及參考值范圍,毒性等級也必須事先確定,并說明其正確性。

在大多數的試驗中,對安全性與耐受性的評價常采用描述性統計方法對數據進行分析,必要時輔以可信區間以利于說明。

七、統計分析報告

試驗統計學專業人員寫出的統計分析報告是提供給主要研究者作為撰寫臨床試驗總結報告的素材。

試驗統計學專業人員根據確認的統計分析計劃書完成統計分析工作,在統計分析報告中首先簡單描述臨床試驗的目的、研究設計、隨機化、盲法及盲態審核過程、主要指標和次要指標的定義、統計分析集的規定等。其次對統計分析報告中涉及的統計模型,應準確而完整地予以描述,如選用的統計分析軟件、統計描述的內容、對檢驗水準的規定、以及進行假設檢驗和建立可信區間的統計學方法。如果統計分析過程中進行了數據變換,應同時提供數據變換的基本原理以及變換數據的理由和依據。統計分析結論應使用精確的統計學術語予以闡述。最后,應按照統計分析計劃書設計的統計分析格式詳細給出統計分析結果。

對藥物有效性評價應給出每個觀察時間點的統計描述結果。列出檢驗統計量、P值。例如,兩個樣本的t檢驗的結果中應包括每個樣本的數量、均值和標準差、中位數,最小和最大值、兩樣本比較的t值和P值;用方差分析進行主要指標有效性分析時,應考慮治療、中心和分析指標基線值的影響,進行協方差分析。對于交叉設計資料的分析,應包括治療順序資料、每個階段開始時的基線值、洗脫期及洗脫期長度、每個階段中的脫落情況、還有用于分析治療、階段、治療與階段的交互作用方差分析表。

藥物的安全性評價主要以統計描述為主,包括用藥情況(用藥持續時間、劑量、藥物濃度)、不良事件發生率及不良事件的具體描述(包括不良事件的類型、嚴重程度、發生及持續時間、與試驗藥物的關系);實驗室檢驗結果在試驗前后的變化情況;發生的異常改變及其與試驗用藥物的關系及隨訪結果。

八、名詞解釋

Ⅰ類錯誤(The Type Ⅰerror):錯誤的拒絕無效假設,常用α表示。

Ⅱ類錯誤(The Type Ⅱerror):錯誤的不拒絕無效假設,常用β表示。

安全性數據集:安全性與耐受性評價時,用于匯總的受試者集稱為安全性數據集。安全性數據集應包括所有隨機化后至少接受一次治療的受試者。

等效性試驗(Equivalence Trial):是確認兩種或多種治療效果的差別大小在臨床上并無重要意義的試驗。通常顯示真正的處理差異是在臨床上可以接受的等效性的上下限之間。

多中心試驗(Multicentre Trial):多中心試驗系指由一個單位的主要研究者總負責,多個單位的研究者合作,按同一個試驗方案同時進行的臨床試驗。

非劣效性試驗(Non-Inferiority Trial):是顯示試驗藥的治療效果在臨床上不劣于對照藥的試驗。

符合方案集(Per Protocol Set):又稱有效病例、有效樣本、可評價病例樣本。是由充分依從于試驗方案的病例子集所產生的數據集,是全分析集的一個子集。依從性包括以下一些考慮,如:所接受的治療、主要指標測量的可行性以及未對試驗方案有大的違反等。

交互作用(Interaction):是指處理間的對比(如研究產品與對照之間的差異)依賴于另一因素(如中心)的情況。定量的交互作用是指對比差異的大小在因素的不同水平時不同;定性交互作用是指對比差異的方向至少在因素的一個水平上不同。

結轉(last observation carried forward):是對臨床試驗中有效性指標缺失值的一種估計方法,即采用缺失值之前最接近一次的觀察數據來代替缺失值。

盲態審核(Blind Review):在最后一份病例報告表輸入數據庫后,第一次揭盲之前對數據保持盲態的預分析審核,以便對統計分析計劃作最后的決定。

偏倚(Bias):是指在設計臨床試驗方案、執行臨床試驗、分析評價臨床試驗結果時,有關影響因素所致的系統誤差,致使療效或安全性評價偏離真值。

期中分析(Interim Analysis):是指正式完成臨床試驗前,按事先制訂的分析計劃,比較處理組間的有效性和安全性所作的分析。

全分析集(Full Analysis Set):是指盡可能接近符合意向性治療原則的理想的受試者集。該數據集是從所有隨機化的受試者中以最少的和合理的方法剔除受試者后得出的。

全局評價指標(Global Assessment Variable):為單一變量,是將客觀指標和研究者對病人的病情及其改變總的印象綜合起來所設定的指標,它通常是有序分類指標(scale of ordered categorical ratings)。

試驗統計學專業人員(Trial Statistician):是指接受過專門培訓且有經驗,可以執行本指導原則的生物統計學專業人員。

雙模擬(Double-Dummy):是在臨床試驗中,當兩種處理(如藥物的劑型、給藥方法等)不能做到相同時,使試驗保持雙盲的一種技術。即為試驗藥與對照藥各準備一種安慰劑,以達到試驗組與對照組在用藥的外觀與給藥方法上的一致。

替代指標(Surrogate Variable): 是指在直接測定臨床效果不可能或不實際時,用于間接反映臨床效果的觀察指標。

統計分析計劃(Statistical Analysis Plan):是包括比方案中描述的主要分析特征更加技術性和更多詳細細節的文件,并且包括了對主要和次要變量及其他數據進行統計分析的詳細過程。

脫落(Drop out):是指由于任何原因不能繼續按試驗方案進行到所要求的最后一次隨訪的受試者。

意向性分析原則(Intention To Treat Principle):是指基于有治療意向的受試者(即計劃好的治療)而不是實際給予治療的受試者進行評價的處理策略。是可以對結果做出評定的最好原則。其結果是隨機到每一個處理組的病人即應作為該組的成員被隨訪、評價和分析,無論他們是否依從計劃的處理過程。

優效性試驗(Superiority Trial):是顯示試驗藥的治療效果優于對照藥(安慰劑或陽性對照藥)的試驗。

九、參考文獻

1.FDA:  Guideline for the Format and Content of The Clinical and Statistical Sections of an Application      1988 

2.EMEA:  Biostatistical Methodology in Clinical Trials       1993

3.MHLW: Guideline for the Statistical Analysis of Clinical Trial       1992

4.ICH E9:  STATISTICAL PRINCIPLES FOR CLINICAL TRIALS       1998

十、附錄

十一、著者

《化學藥物和生物制品臨床試驗的生物統計學技術指導原則》課題研究組


化學藥物和生物制品臨床試驗的生物統計學技術指導原則
起草說明

 

目前,我國正在執行的統計學指導原則為1999年開始起草,2001年正式頒布實施的。該指導原則是遵照1999年頒布的《新藥審批辦法》,并參照ICH E9文件起草制訂的,在指導我國藥物的臨床研究中發揮了重要作用。2002年,國家藥品監督管理局頒布了《藥品注冊管理辦法(試行)》,其中,對藥物臨床試驗的分期賦予了新的內涵,使我國對藥物臨床試驗的要求更符合新藥臨床研究的基本規律,體現出科學合理性。本次指導原則的修訂是在保持原版指導原則的先進性的同時,充分考慮了法規的變化以及我國藥物臨床研究的現狀,并參考了ICH E9文件以及美國、歐盟、日本等國的現行指導原則,力求符合中國國情,并使之具有可操作性。

本指導原則起草中需要說明的有關內容如下:

一、探索性試驗和確證性試驗

與2001年頒布的《化學藥品和生物制品臨床試驗的生物統計學指導原則》相比,本指導原則在“整個臨床試驗需考慮的問題”中,增加了“試驗內容”一節,并在課題研究組的討論中修改為“探索性試驗和確證性試驗”。其中主要對臨床試驗中的探索性試驗和確證性試驗從統計學的角度進行了解釋,并力求明確兩種不同性質的試驗在整個臨床試驗中的意義以及相互之間的關系,以期強化新的注冊管理辦法中對臨床試驗分期所賦予的新的內涵。同時,在本指導原則中,強調了統計學原理的應用與臨床試驗目的的密切相關。指出每個臨床試驗的目的不同,所需要采用的統計學原理也各不相同。

二、觀察指標與變量

與2001年頒布的指導原則相比,本指導原則中,首先說明了“統計學中常將觀察指標稱為變量”,而在其后的指導原則正文中,將“變量”全部改為“指標”,如主要指標、次要指標、復合指標、全局評價指標等,其原因主要是考慮到本指導原則的執行者除統計專業人員外,還包括了臨床試驗的研究者,使用“指標”則更符合臨床研究者的習慣。

三、觀察指標的內容

隨著臨床試驗目的和設計的多樣化,觀察指標的內容也越來越豐富,因此,需要在觀察指標中增加更多新的內容。與現有指導原則相比,本指導原則中增加了“替代指標”和“由測量指標轉化的分類指標”,并對其適用范圍和特點進行了說明。

四、關于主要指標

在目前的藥物臨床試驗中,有時會采用多個指標作為主要指標,在進行有效性分析時,將多個指標同時進行分析,選擇有意義的改變作為最終的療效評價指標。這種做法是不科學的。本指導原則中,結合ICH E9文件的內容,強調了通常在臨床試驗中,通常主要指標只有一個。主要指標應該與臨床試驗的目的有著本質的聯系,能確切反映藥物有效性或安全性,同時,應根據試驗目的選擇易于量化、客觀性強、可重復性高并在相關研究領域已有公認的準則或標準。

五、關于臨床試驗中的盲法

通過討論認為,在臨床試驗中,由于盲法是臨床試驗中控制偏倚的有效手段,因此,如果條件允許,應盡可能的采用雙盲試驗,尤其是試驗的主要指標易受主觀因素干擾時。如雙盲不可操作,也應該考慮采用單盲,即使是在不得不采用非盲開放的臨床試驗中,也應該在進行統計分析時保持盲態。

六、關于多中心臨床試驗中各中心的需完成的病例數

在《藥品注冊管理辦法(試行)》中,對多中心臨床試驗中各中心的最低病例數沒有明確的要求,也未要求各中心數相同。在本指導原則的起草中,一方面考慮到各中心間在病人的入組、處理和質控方面均會存在一定的差異,如果各個中心間病例數差異過大,在產生各中心間交互作用時,難以進行分析。另一方面,也考慮到作為指導原則,僅需將統計學原則給予說明,無須對具體的病例數做出規定,且硬性的病例數規定也缺乏科學依據。因此,在本指導原則中,僅規定多中心試驗必須在統一的組織領導下,遵循一個共同制定的試驗方案完成整個試驗。各中心試驗組和對照組病例數的比例應與總樣本的比例相同,以保證各中心齊同可比。部分專家認為由于各個中心間入組的速度不一致,因此,各個中心完成的病例數不同,是否需在指導原則中明確各中心必須完成的最低病例數。討論后認為,在我國進行的多中心臨床試驗實際并不是嚴格意義的多中心臨床試驗,但由于各中心間在病人的入組、處理和質控方面均存在一定的差異,因此,如果各個中心間病例數差異過大,在產生各中心間交互作用時,難以進行分析。但作為指導原則,也無須對各中心的具體病例數進行規定,僅需將統計學原則說明即可。

七、關于樣本量的問題

樣本量的確定是臨床試驗中極為重要的步驟,同時也是藥品注冊申請人、臨床試驗單位和審評部門十分關注的問題。按照《藥品注冊管理辦法(試行)》第二十七條的規定,藥物臨床試驗的受試例數應當根據臨床試驗的目的,符合相關統計學的要求和注冊管理辦法所規定的最低臨床試驗病例數的要求。其中最低病例數已經在《藥品注冊管理辦法(試行)》的附件中明確規定。而對于“統計學要求”則影響因素較多,計算復雜。在會上,部分專家認為需在本原則中列出最低研究病例數或者給出計算公式,經討論后認為,樣本含量的計算十分復雜,在不同的臨床試驗中,設定的α、β值不同,則計算出的樣本含量的差異會非常大,設定的Δ越大,需要的樣本量越少;反之,設定的Δ越小,需要的樣本量越大,因此,僅列出樣本量的計算公式沒有實際意義,且不具可操作性;另一方面,如果完全按照統計學原則進行計算,則在有的臨床試驗中,需要的樣本含量可能非常大,在實際操作中難以完成,為減少病例數,在有的臨床試驗中,原本應采用等效性檢驗,而采用了非劣效性檢驗。根據我國目前藥物研制的情況,針對藥物的臨床試驗,在法規中已采用了最低病例數的限制。因此,在本原則中則不再對病例數的計算進行具體的說明,只需對影響樣本含量的因素進行闡述。

八、關于期中分析

與2001年頒布的指導原則相比,本指導原則對“期中分析”進行了更為詳細的說明,旨在規范期中分析在臨床試驗中的作用,明確進行期中分析所承擔的風險,以避免因不恰當的期中分析而導致結果有誤。

九、關于統計分析集

針對統計分析集,本指導原則對意向性分析原則、全分析集、符合方案集、安全性評價數據集的定義參照ICH E9文件進行了完善和修訂,尤其是全分析集與意向性分析原則的關系,進行了明確。同時,對各種分析集的作用進行了說明,以指導臨床實際應用。

十、關于安全性評價

安全性評價是臨床試驗的主要目的之一,由于安全性評價的內涵、數據收集、處理、評價等與有效性評價在某些方面有所不同,因此,本指導原則參照ICH E9文件,在原版指導原則的基礎上,在上述幾個方面擴充了有關安全性評價的相關內容。

十一、關于膠囊技術

在本指導原則上網征求的意見中,提到為保證雙盲而采用雙盲雙模擬時,可能受試者服藥數量(或體積)過大,不方便臨床應用,因此提出可否采用將安慰劑或藥物裝入膠囊的辦法。經討論后認為,該辦法具有一定的可行性,但其前提是需要保證藥物在裝入膠囊后與原劑型生物等效,否則會增加試驗中的干擾因素,影響結果評價。鑒于此,在有關雙盲的部分增加了“膠囊技術”一段。


contact

聯系我們

聯系我們

濟南濼合醫藥技術有限公司

手機:15106968590  劉經理

手機:13156189502  張經理

電話:0531-68658065

傳真:0531-68658065

郵箱:jinanluohe@163.com

地址:山東省濟南市匯展西路88號1號樓1-844


掃一掃瀏覽手機站

濟南濼合醫藥技術有限公司

備案號: