TP = 3
低剂量 CT 使大量肺结节在早期被检出,但人工阅片工作量大、主观性强。
医学影像样本有限,直接训练深层网络易过拟合。预训练 CNN 提取特征 + SVM 是小样本场景的经典组合。
30 患者 DICOM + XML 标注,malignancy 均值 ≥ 3.0 为恶性
HU 肺窗归一化,按结节 centroid 裁剪中心层面
ImageNet 预训练,512 维深度特征,去掉分类头
5-fold CV,优化 F1;C × kernel × gamma 共 48 组
按患者分层划分 train/val/test = 70/15/15,避免数据泄漏
pylidc 解析 XML,加载 DICOM 3D 体积
ResNet18 输出 512 维向量
StandardScaler + 最大间隔分类
灵敏度 / 特异度 / F1 / AUC
从 CT 中心层面裁剪结节区域,HU 肺窗归一化至 [0,1];48 个 patch 全部提取成功,平均亮度 0.48,可见肺组织与结节形态
48 组参数 × 5 折 = 240 次训练;RBF 核 + C=10 在修复后的深度特征上 CV F1 最优。
PC1 解释 15.0% 方差,PC2 解释 8.5%,累计 23.6%;高维特征信息分散,二维投影仅呈现部分结构
流水线完整跑通,但需更大规模数据与 3D 信息才能具备临床价值。
ResNet18 + SVM GridSearch 流水线完整可复现,中间结果齐全
C=10, γ=0.001, RBF kernel, CV F1=0.61
测试 Acc=0.62、Spec=0.63;需 ≥200 结节 + 3D CNN 提升泛化