卷积神经网络在生物医学图像上的应用进展(9)
2.2.6 皮肤医学影像
皮肤癌是最常见的皮肤病,具有较高的死亡率[61]。各种皮肤病变在外观上的相似性成为临床上实现皮肤癌准确分类的一大挑战。例如,皮肤癌中的黑色素瘤常被误诊为良性皮肤病变。因此,Lopez等[86]利用VGG-16结合迁移学习技术来解决皮肤病病变图像的良恶性分类问题,可以实现皮肤癌中黑色素瘤的早期检测。该方法在ISIC(/)的数据集上的准确度达到了81.33%,灵敏度达到了78.66%。Esteva等[87]使用由ISIC 皮肤镜图像库、爱丁堡Dermofi 库[88]和来自斯坦福医院的数据组成的129 450张临床图像数据集来训练在ImageNet 预训练过的Inceptionv3 模型。该方法能够对757类皮肤疾病进行分类,并归类为更常见的皮肤疾病类别。最后,用它检测三类病变(恶性单一病变、良性单一病变、非肿瘤性病变)的准确率达到72.1%,检测九类病变(恶性黑色素病变、恶性上皮病变、恶性真皮病变等)的准确率达到了55.4%。
3 总结与展望
深度学习,尤其是CNN模型的发展,给生物医学图像分析领域带来诸多突破性进展。在本文中,对近年来CNN模型在细胞生物学图像及医学图像中应用的最新研究成果进行了总结和梳理。
首先,CNN 模型较好的通用性使得在实现应用中往往不需要针对不同的图像数据从零开始设计模型结构,而是借用经典CNN模型作为基础骨架。例如,用于图像分类任务的经典模型有LeNet-5、VGG、Inception系列、ResNet 系列等,用于目标检测任务的经典模型有Faster R-CNN 和YOLO 系列等,用于图像分割任务的经典模型有的FCN和U-Net等。
其次,通过对基础骨架进行修改,可以进一步解决生物医学图像分析中的难点问题,包括目标与背景的相似度高、目标间的差异性小、类间不平衡、样本量偏少等。对于前两个问题,常见的处理方式包括多尺度卷积、多视图卷积等,以期获取更丰富的上下文信息,从而改进网络性能。另一种处理方法是构建级联网络,使各级网络聚焦于解决不同问题从而提高网络的整体性能。对于类间不平衡问题,常通过改进损失函数的方法来提高网络性能,比如使用带权重的交叉熵损失函数、focal loss 等。针对样本量稀缺的问题,常采用的解决方法是利用迁移学习技术来提高网络性能。
总的来讲,CNN 网络可以直接采用原始图像作为输入自动学习和提取特征,避免了传统算法的特征定义和参数设置的复杂过程,使其在各领域的表现相较于单纯使用传统算法更加优秀,有些甚至可以达到专业技术人员的水平。然而,CNN 在生物医学领域的应用也面临不同于以往的新问题和挑战。这里,对这些发展所带来的挑战以及可能的解决手段进行了梳理。
(1)引起广泛关注的问题是CNN的含义不够明确,针对每一卷积层提取到的特征没有明确的解释。这导致的一个重要问题就是无法对结果进行有效说明,这种过程中的不可解释性可能导致研究者和临床医生的接受度不高。模型结构可视化、模型参数解耦合等研究方向的发展有望逐渐改善这一问题。
(2)CNN网络对数据的依赖较重。一般地,数据量越大,标定越统一,结果往往越理想。然而,生物医学图像的许多特性都限制了CNN 模型优势的发挥。例如,公开数据量少、没有统一的数据集制作标准,数据质量参差不齐、标注不一致等,这使得不同方法间缺少对比性和参考性。在这方面,对数据、评价指标、运行平台、参数设定、边界条件等的公开以及图像标注标准制定将有助于解决这些问题。另一方面,对半监督或无监督方法以及人工在环的模型训练策略的探索也是解决这一问题的重要方向。
(3)如何在特定问题的解决能力及算法的泛化能力之间找到平衡点非常重要。目前工程领域基于CNN模型的算法开发往往是针对特定任务的(例如特定细胞检测、特定病变分割等),许多方法难以在实验数据之外的任务进行推广。另一方面,通用性的模型又往往在特定任务中表现不够理想。例如,在利用眼底彩照的眼底疾病筛查中,实现通用性病变筛查的模型在对具体疾病的识别中表现不够理想。在解决特定问题和通用问题间找到平衡点将极大推动CNN模型在实际场景中的应用。
(4)卷积神经网络“端对端”的特性虽然可以避免人为特征提取和复杂参数设定,但也一定程度上阻碍了领域先验知识对模型的贡献。在某些任务中,是存在相对明确的规则的,例如在OCT 图像上渗出液体的分割任务中,视网膜中液是指介于视网膜神经纤维层与外网层之间的渗出液体,而视网膜下液是指介于视网膜外节层与色素上皮层之间的渗出液体。通过在CNN模型的改进中融入这些相对明确的规则,对于特定任务的分析将非常有帮助。
文章来源:《生物医学工程学杂志》 网址: http://www.swyxgcxzzzz.cn/qikandaodu/2021/0619/606.html