OPTIMIZATION HOMEWORK · TOPIC 6

支持向量机在
医学影像分类中的应用

基于 LIDC-IDRI 数据集的 ResNet18 深度特征 + SVM 肺结节良恶性分类实验

30 患者 · 48 结节 · 2026.0501 / 12
RESEARCH PROBLEM

背景与问题

CONTEXT02 / 12
EXPERIMENT FLOW

五阶段实验流水线

01 DICOM 加载

pylidc 解析 XML,重建 3D CT 体积

02 Patch 提取

64×64 中心裁剪,HU 肺窗归一化

03 ResNet18

ImageNet 预训练,512 维深度特征

04 SVM 调参

GridSearchCV,5-fold,优化 F1

PIPELINE03 / 12
METHOD

方法设计四个环节

数据:LIDC-IDRI

30 患者 DICOM + XML;malignancy 均值 ≥ 3.0 为恶性

预处理:64×64 Patch

HU 肺窗归一化;按 centroid (i,j,k) 在 (H,W,Z) 体积上居中裁剪

特征:ResNet18

去掉 FC 层,输出 512 维向量

分类:SVM GridSearch

C × kernel × gamma,48 组 × 5 折 = 240 次

METHOD04 / 12
DATASET

数据规模与划分

30

下载患者

48

有效结节

26

良性

22

恶性

下载 30 位患者 DICOM + XML;有效结节 48 个(21 位患者含标注)。按患者 ID 分层划分 train/val/test = 70% / 15% / 15%

DATASET05 / 12
ARCHITECTURE

CNN + SVM 架构

CT 体积重建 → ResNet18 深度特征 → StandardScaler → SVM 分类 → 临床指标评估

评估指标:灵敏度、特异度、F1 Score、ROC-AUC

ARCHITECTURE06 / 12
VISUAL · PATCHES

64×64 结节 Patch 样例

patch样例

48 个 patch 全部提取成功;patch 平均亮度 0.48,可见肺组织与结节形态

PREPROCESS07 / 12
TUNING

最优 SVM 超参数

rbf

kernel

10

C · γ=0.001

0.61

5-fold CV F1

48 组参数 × 5 折 = 240 次训练;RBF 核 + C=10 在修复后的深度特征上 CV F1 最优

GRIDSEARCH08 / 12
FEATURE · PCA

CNN 特征 PCA 可视化

PCA

PC1 解释 15.0%,PC2 解释 8.5%,累计 23.6%(高维特征需更多主成分)

FEATURE09 / 12
RESULTS · TEST · n=13

测试集评估指标

Accuracy
0.62
Specificity
0.63
Sensitivity
0.60
F1 Score
0.55
ROC-AUC
0.30
TEST METRICS10 / 12
EVALUATION

混淆矩阵与局限

预测良性预测恶性
实际良性5 (TN)3 (FP)
实际恶性2 (FN)3 (TP)
混淆矩阵 ROC

修复 patch 坐标轴后,良性不再被全部误判;测试集仅 13 样本,AUC 波动较大

CONFUSION / ROC11 / 12
CONCLUSION

迁移学习特征 + SVM
小样本场景可行

LIDC-IDRI · CNN + SVM · 2026.05 · 交互版12 / 12