文獻探討
本研究著重於進行人工智慧深度學習時的演算法效能,以提升乳房腫瘤X光影像之形狀辨識準確率為目標。故於文獻回顧部分,分為三個主軸,對於本計畫之研究方向影響深遠,分別為有效診斷出乳房腫瘤之模型、影像處理的方法、訓練資料的選擇及訓練模型的選擇。首先回顧有關有效診斷出乳房腫瘤之模型之研究論文,第二部分加以闡述圖像處理的相關理論,第三部分為訓練資料集的介紹與分析,最後一部分為影像分割常用模型的介紹與比較。
選擇有效診斷出乳癌的方法
Mobark, N.; Hamad, S.; Rida, S.Z. “CoroNet: Deep Neural Network-Based End-to-End Training for Breast Cancer Diagnosis.”
Appl. Sci. 2022, 12, 7080.
此篇論文中列出了五種進行人工智慧模型訓練時常用的演算法,並針對各演算法列出理論面的特性、優缺點及實作上的成效分析。
以下說明機器學習模型中各演算法的特性比較:
1. Artificial neural networks
-
接收與處理訊息的能力佳,容易訓練,只適用於少量數據
2. Deep belief networks
-
能自動對輸入的資料進行分類分群
3. Convolutional neural networks
-
最多人研究的方法、處理圖像的性能高,通常以越大量的圖像訓練準確率越高
4. Extreme learning machines
-
非常耗時且準確率比不上卷積神經網路
5. Generative adversial networks
-
訓練起來非常不穩定
圖像處理的方法
Mridha, M.F.; Hamid, M.A.; Monowar, M.M.; Keya, A.J.; Ohi, A.Q.; Islam, M.R.; Kim, J.-M. “A Comprehensive Survey on Deep-Learning-Based Breast Cancer Diagnosis.” Cancers 2021, 13, 6116.
此篇論文中列出了五種圖像處理的方法。
1. Augmentation
-
因許多醫學影像在圖中含有大量註釋固不可採用,因此藉由增加此方法以增加圖像數量
2. ROI extraction
-
提取所需要的資訊
3. Scaling
-
縮放,統一所有圖片大小
4. Image normalization
-
將圖片的像素質正規化至0-1的範圍中
5. Remove artifacts
-
去除醫學影像中的偽影、文字標籤、不透明處,如:胸肌
訓練資料的選擇
此文獻提出四組在進行乳房相關研究時常使用的X光影像資料集。
1. DDSM
-
最常被使用且為目前資料最多的公開資料集,共有695個無異常病例,1925個異常病例。
-
無腫瘤或鈣化點的無異常乳房影像
-
含腫瘤或鈣化點,經判定後為良性的乳房影像
-
含腫瘤或鈣化點,經判定後為惡性的乳房影像
2. MIAS
-
其中的資料年份最為久遠,共有 161個無分類病例和 322 張數字化的 MLO 圖像組成。
-
含腫瘤或鈣化點,經判定後為良性的乳房影像
-
含腫瘤或鈣化點,經判定後為惡性的乳房影像
3. CBIS-DDSM
-
簡化的DDSM,但資料量較DDSM少,共有753 個鈣化點病例和 891 個腫瘤病例。
-
無腫瘤或鈣化點的無異常乳房影像
-
含腫瘤或鈣化點,經判定後為良性的乳房影像
-
含腫瘤或鈣化點,經判定後為惡性的乳房影像
4. BancoWob LAPIMO
-
含320個病例共為1473 張。
-
含腫瘤或鈣化點,經判定後為良性的乳房影像
-
含腫瘤或鈣化點,經判定後為惡性的乳房影像正側拍的放大圖
訓練模型的選擇-MultiResUNet
Nabil Ibtehaz, M. Sohel Rahman “MultiResUNet : Rethinking the U-Net architecture for multimodal biomedical image segmentation”, Neural Networks, Volume 121, 2020
本篇文獻所提出之MultiResUnet為基於Unet架構改進,介紹了MultiResUnet的架構與應用,並對比兩者,針對模型架構與實際應用情況進行分析。
