本書前半部分以重癥監護治療室患者的數據為例介紹如何進行醫學數據的預處理,如何使用機器學習模型預測患者的死亡率。本書前半部分的重點在于深度學習,內容包括神經網絡的基礎知識、利用卷積神經網絡分類誘發電位圖像、利用遞歸神經網絡預測疾病的復發以及利用自編碼算法去除圖像噪音以生成新的模擬圖像。本書還涉及基礎醫學中深度學習的應用以及如何解釋機器學習模型。然而,醫學實踐中往往不只需要預測某個患者的某項結局,更需要知道哪些治療能夠改善結局。本書在神經網絡模型之后將以膿毒癥患者的治療為例介紹強化學習的概念,從而為進入因果推斷搭建橋梁。
本書最后2個專題著重討論如何通過因果關系圖直觀地判斷因果關系中的混雜因素、如何使用回歸控制混雜因素、如何利用傾向得分控制混雜因素以及如何利用逆概率加權控制混雜因素。結合強化學習的概念,最后將討論如何評估隨時間變化的治療,以及如何建立治療策略。
本書可作為各級醫學研究者、醫學院學生和教師的參考用書。
1 機器學習基礎 / 1
1.1 數據概況 / 2
1.2 數據的預處理和特征選取 / 3
1.3 缺失值的處理與插補 / 8
1.4 交叉驗證 / 12
1.5 模型建立 / 13
1.6 模型比較 / 20
2 梯度提升決策樹 / 23
2.1 超參數 / 26
2.2 特征重要性 / 32
2.3 模型的臨床應用 / 33
2.4 模型集成 / 35
2.5 機器學習的報告要點 / 38
3 聚類算法 / 41
3.1 各種聚類算法 / 42
3.2 主成分分析 / 46
3.3 聚類算法的直觀顯示 / 48
4 神經網絡 / 51
4.1 感知器 / 52
4.2 全連接神經網絡的訓練 / 53
4.3 控制過擬合 / 58
4.4 公開數據來源 / 61
5 卷積神經網絡 / 67
5.1 卷積運算 / 68
5.2 池化運算 / 71
5.3 簡單卷積神經網絡的構建和訓練 / 71
5.4 圖像樣本量擴大 / 78
5.5 遷移學習 / 81
5.6 可解釋的卷積神經網絡 / 86
5.7 開放圖像數據庫 / 88
5.8 卷積神經網絡的意義與不足 / 89
6 自編碼和對抗生成神經網絡 / 91
6.1 自編碼算法基礎 / 92
6.2 自編碼算法降噪 / 97
6.3 變分自編碼算法 / 100
6.4 變分自編碼算法生成虛擬圖像 / 104
6.5 對抗生成神經網絡生成虛擬圖像 / 105
7 遞歸神經網絡 / 107
7.1 遞歸神經網絡原理 / 108
7.2 遞歸神經網絡構建 / 109
7.3 長短期記憶網絡 / 111
7.4 門控遞歸神經網絡 / 113
7.5 LSTM和GRU的構建 / 113
7.6 卷積神經網絡和遞歸神經網絡的疊加 / 115
8 自然語言處理和電子病歷 / 119
8.1 從單詞到向量 / 120
8.2 利用傳統自然語言處理尋找腦外傷患者 / 122
8.3 利用神經網絡尋找腦外傷患者 / 125
8.4 電子病歷系統中神經網絡的應用 / 131
9 可解釋的機器學習 / 133
9.1 預測蛋白-蛋白間結合 / 134
9.2 預測基因-蛋白間結合 / 139
9.3 機器學習的解釋 / 145