【MIMICIII應用】(一)MIMICIII波型資料庫說明
- MIMIC-III資料庫
-
- MIMIC-III波形資料庫
-
- 資料檔案說明
- 使用說明
訊息整理自官網 https://physionet.org/content/mimic3wdb-matched/1.0/
MIMIC-III資料庫
多引數智慧監測資料庫(MIMIC-III)是一個免費開放的、公共資源的重症監護室研究資料庫。該資料庫於2006年由美國麻省理工學院計算生理學實驗室以及貝斯以色列迪康醫學中心(BIDMC)和飛利浦醫療共同釋出。
MIMIC-III資料集主要包括波形資料集( MIMIC-III Waveform Database)和臨床資料集( MIMIC-III Clinical Database)。
MIMIC-III波形資料庫
MIMIC-III Waveform Database(官網連結)
MIMIC-III波形資料庫匹配子集包含22,317條波形紀錄和22,247條數值紀錄,用於10,282個不同ICU病人。這些紀錄通常包括數值化訊號,例如心電圖, ABP,呼吸,和PPG,以及週期性測量,如心率、血氧飽和度、收縮壓、平均血壓和舒張壓。
此資料庫是MIMIC-III波形資料庫,表示病人已被識別的紀錄,其相應的臨床紀錄在MIMIC-III臨床資料庫。利用所有現有訊息,透過大多數自動匹配和一些人工校正的過程,共發現22 317條波形紀錄(34%)和22 247條數值紀錄(35%),可與臨床資料庫中的相應病人聯繫起來。
資料檔案說明
對於每個紀錄,建立了一個新的WFDB標頭檔,其中包含subject_ID以及紀錄的代理日期和時間。注意,原始訊號檔案(如3314767_0004.dat和3314767n.dat)和段標頭檔(例如3314767_0004.hea)與原始編號紀錄中的紀錄相同。
所有與特定病人相關的資料都被放置在一個子目錄中,該子目錄根據患者的 MIMIC-III 中的subject_ID命名。這些子目錄被進一步劃分為10個中間級別的目錄(matched/p00到matched/p09).
每個匹配波形紀錄的名稱為matched/pXX/pXXNNNN/pXXNNNN-YYYY-MM-DD-hh-mm,其中XXNNN是匹配的 MIMIC-III 臨床資料庫 subject_ID , YYYY-MM-DD-hh-mm 是替代性的年(如2196,以保護病人隱私)、月(01-12)和日(01-31),實際時間(00-23)和分鐘(00-59)從紀錄的開始日期和時間得出。替代性日期與相應的MIMIC-III臨床資料庫紀錄相匹配。
在大多數情況下,波形紀錄與與相關聯的波形紀錄同名的數值紀錄配對,並具有n加到最後。
通常有多個波形和數值紀錄對與給定的臨床紀錄相關聯;在這種情況下,所有的波形和數值紀錄對都會出現在同一個子目錄中,它們的名稱將顯示它們的年代順序。例如,模擬-III臨床資料庫紀錄p000079已匹配兩個波形和數值紀錄對,命名為:
各mimic3wdb/matched紀錄也是未註明日期的mimic3wdb紀錄(即,它也屬於完整的 MIMIC-III 波形資料庫)。衹有替代性日期mimic3wdb/matched標頭(.hea)檔案對匹配的子集是唯一的;其他檔案具有表單的名稱3*.hea和3*.dat,是完整資料庫中同名檔案的副本。
使用說明
以下範例說明了資料庫的組織:
-
中間目錄P04包含所有以名稱開頭的紀錄。p04(病人 subject_ID 在40000至49999間)
-
所有與病人44083相關的檔案都包含在P04/p 044083目錄中。該目錄包含兩個波形紀錄(p044083-2112-05-04-19-50和p 044083-2112-05-23-12-22)以及兩個相關的的數值紀錄(p044083-2112-05-04-19-50n和p044083-2112-05-05-23-12-22n),兩次單獨入住ICU的紀錄 。
-
第一次停留的主波形標頭檔(P044083-2112-05-04-19-50.hea)表示紀錄的長度為20342033個樣本間隔(約45小時),從212年5月4日19:50開始。這個日期,和 MIMIC-III 中的所有日期一樣,都是匿名的,因為它被隨機地移到了未來的幾天里。 header(5)有關此檔案格式的更多訊息,請參見WFDB應用程式指南。
-
該波形紀錄由41個段(3314767_0001到3314767_0041)組成,如主標頭檔所示。layout標頭檔(3314767_layout.hea)表示四個ECG紀錄訊號(II、AVR、V和MCL),並紀錄呼吸訊號、PPG和動脈血壓。並非所有這些訊號都同時可用。
-
第4段的標頭檔(3314767_0004.hea)向我們顯示,在這段時間內,有五個訊號可用:三個ECG引線(II,V和AVR),一個呼吸訊號(RESP)和一個PPG訊號。
-
數值標頭檔(P044083-2112-05-04-19-50n.hea)顯示,我們紀錄了各種測量,包括心率、侵入性和非侵入性血壓、呼吸頻率、ST段抬高、血氧飽和度和心律統計。就像波形一樣,並非所有這些測量都是可用的。
透過 MIMIC-III 臨床資料庫演示,我們可以得知這位病人是男性,他的匿名出生日期是2057年11月15日(在ICU住院時,他已經54歲了):
這個ICUSTAYS表顯示他曾一次進入SICU和兩次進入CCU:
第一個對應於上述波形紀錄,如日期(2112-05-04)所示。注意,波形紀錄的開始和結束日期和時間並不總是與精確的輸入或放電時間相匹配。
這個 hadm_id (125157)及 icustay_id (265615)連結到 MIMIC-III 中的其他表,這些表提供有關的進一步訊息,例如,生命體征,實驗室測試,藥物和診斷。
參考文獻
- Johnson, A. E. W., Pollard, T. J., Shen, L., Lehman, L. H., Feng, M., Ghassemi, M., Moody, B., Szolovits, P., Celi, L. A., & Mark, R. G. (2016). MIMIC-III, a freely accessible critical care database. Scientific Data, 3, 160035. https://dx.doi.org/10.1038/sdata.2016.35
- 陳靜,李保萍.MIMIC-Ⅲ電子病歷資料集及其挖掘研究[J].訊息資源管理學報,2017,7(04):29-37.