Ton J. Cleophas• Aeilko H. Zwinderman
Machine Learning in Medicine - Cookbook
Part I Cluster Models
1 Hierarchical Clustering and K-means Clustering to Identify
Subgroups in Surveys (50 Patients) . . . . . . . . . . . . . . . . . . . . . . . 3
General Purpose. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Specific Scientific Question . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Hierarchical Cluster Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
K-means Cluster Analysis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Note. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2 Density-Based Clustering to Identify Outlier Groups
in Otherwise Homogeneous Data (50 Patients). . . . . . . . . . . . . . . 9
General Purpose. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
Specific Scientific Question . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
Density-Based Cluster Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
Note. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
3 Two Step Clustering to Identify Subgroups and Predict
Subgroup Memberships in Individual Future
Patients (120 Patients) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
General Purpose. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
Specific Scientific Question . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
The Computer Teaches Itself to Make Predictions . . . . . . . . . . . . . . 14
Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Note. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Part II Linear Models
4 Linear, Logistic, and Cox Regression for Outcome Prediction
with Unpaired Data (20, 55, and 60 Patients). . . . . . . . . . . . . . . . 19
General Purpose. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19