研究動機

癌症通常為細胞突變而導致其不規則生長成為腫瘤,目前為全球第二大死因。其中分辨是否為癌症的指標為辨認其腫瘤為良性(非癌症)或惡性(癌症),良性腫瘤之細胞正常、生長速度緩慢,惡性腫瘤生長速度快,會主動攻擊附近組織傷害其他部位。衛生福利部109年癌症登記報告顯示,每天約有7.3人死於乳癌,死亡率在婦女癌症中排名第三,在108年時更攀居死亡率第一。由此可見乳癌嚴重威脅了婦女的健康,美國癌症研 究所指出有38%的乳癌可依靠平時養成的健康生活習慣預防,而依靠科學技術,乳房X光攝影檢查為最安全有效的基礎篩檢工具,乳房X光攝影可用來偵測乳房中的鈣化點及腫瘤,目前美國放射學院提出一套乳房報告數據系統(BI-RADS),將乳房X光攝影的檢查結果依乳房對稱性、鈣化點分布、結構是否異常及腫瘤種類分為0至6級。



研究流程圖
透過一組公開資料集,將資料區分為三個部分,分別為測試集、訓練集與驗證集,接著為各資料集中的圖片做資料處理,如加上各對應的標籤與統一圖片大小,再設定影像分割之模型架構,逐次放入資料(訓練集與驗證集)進行訓練,最後使用測試集進行模型準確率預測。藉由不斷地調整參數將準確率提升至最高。完成影像分割後,利用影像處理的方式,定義不同形狀之規則,歸類至相對應的形狀類別。

研究方法
本研究之研究方法可分為三個步驟,首先為資料預處理,在資料集中挑選出所有可用的影像,並為其加上標籤、重新命名與調整圖片大小等。接著為影像分割,利用機器學習中之監督式學習找出X光影像中之腫瘤位置。最後為影像處理,將分割出來之腫瘤利用邊緣檢測等技術,建立分類器,分類出腫瘤形狀。以下將針對此三步驟做詳細介紹:

01 資料預處理
02 影像分割
03 影像處理與辨識

資料預處理
在資料集DDSM中(包和正常與異常的乳房X光攝影圖),挑選出其中1510張為含有腫瘤的影像,其中20%為測試集資料、80%設為訓練集資料,再從訓練集中抽取10%作為驗證集資料。
-
調整圖片大小
因每張影像之大小皆不相同,為符合數據一致性,使影像被批量處理時效率更加以及需符合模型規定的影像輸入大小,因此對所有影像直接調整其長寬皆為512。

(a)
1226*2564

(c)
2564*2564

(b)
2564*2564

(d)
512*512
圖1. 資料處理過程
-
醫療影像畫質多為一般影像之十倍以上,但礙於模型限制,需將每張輸入影像之大小調整為相同尺寸。圖(a)至(b)之調整為在原圖後新增一黑色背景,為比例不變調整。
-
本研究使用之方式為直接對原圖縮放,如圖(a)至(c)之調整過程。接著,為加快模型訓練速度,又將圖(a)等比例調整至(d),使所有影像之大小長寬皆為512。

影像分割
-
將圖像劃分為具有語義意義的區域或像素的過程。其目標是將圖像中的每個像素分配到不同的類別或分割區域中,從而實現對圖像的細粒度分析和理解。而本研究運用了基於深度學習之方法以實現影像分割。近年來,深度學習在影像分割中取得了重大突破。基於深度學習的分割方法利用卷積神經網絡(CNN)等深度學習模型,學習圖像的語義信息和上下文關係,實現高精度的分割結果。
本研究使用MultiResUnet作為影像分割任務之模型,是U-Net架構的一個變體,能解決U-Net在處理不同解析度和不同大小的目標時可能遇到的問題。MultiResUNet透過加入多解析度結構與殘差連接實現更高精度的分割結果,且比傳統的 U-Net 更快、更穩定。其主要架構包含MultiRes Block、Residual Path與U-Net-like Architecture。

(a)
原X光影像圖

(b)
原腫瘤之病灶圖

(c)
利用模型之分割結果
圖2. U-Net影像分割過程
-
影像分割需輸入兩種互相對應的影像也就是原X光影像圖與腫瘤部分之病灶圖(mask),分別為圖(a), (b)。(a)為資料集中取得之原影像,圖(b)為醫師從原影像中利用工具分割出的腫瘤影像結果,其中白色部分為腫瘤,因此圖(b)上有兩個腫瘤。

(a)
原X光影像圖
(b)
原腫瘤之病灶圖
(c)
利用模型之分割結果
圖3. MultiResUnet影像分割過程-Net影像分割過程
-
圖(a)至(c)為使用MultiResUnet分割之結果,可看出與圖(b)之真實分割結果並無相差太多,準確率極佳,效能遠大於U-Net,因此選擇使用MultiResUnet模型。

影像處理與辨識
1. Canny 邊緣檢測
-
高斯模糊(Gaussian Smoothing)
-
梯度計算(Gradient Computation)
-
Sobel 運算子計算圖像的梯度幅值和方向
-
非極大值抑制(Non-Maximum Suppression)
-
雙閾值(Double Thresholding)
-
邊緣追踪(Edge Tracking)


(a)
經影像分割後之腫瘤圖
(b)
邊緣檢測
圖4. 利用邊緣檢測之效果呈現圖
2. 原輪廓面積與外接矩形面積比
利用輪廓檢測的方式,算出腫瘤的真實面積,接著計算腫瘤部分之外接矩形的面積,計算出面積比值,若比值越小代表腫瘤部分佔外接矩形面積越少,有較高的機率為不規則形。面積比值計算方式為:面積比值 = 腫瘤部分面積 / 外接矩形面積。

(a)

(b)
圖5. 原輪廓面積與外接矩形面積
-
圖5(a)中的白色部分為腫瘤,(b)之紅框部分為腫瘤的外接矩形。原輪廓面積為圖(a)中的白色面積,外接矩形面積為圖(b)中的紅色長方形面積。
圖4. 利用邊緣檢測之效果呈現圖
3. 長寬比
在影像處理後,即可獲得每張影像中腫瘤的長寬比(r),長為(h),寬為(w)。r = h / w
4. 橢圓度
當橢圓度(Circularity)接近1時,表示橢圓越接近圓形;當橢圓度遠離1時,表示橢圓的形狀越扁平。其中minor axis, major axis分別代表橢圓的短長軸。
Circularity = minor axis / major axis
在本研究中,利用邊緣檢測技術以去除不必要的邊緣,
並使用邊緣檢測後的成果找出腫瘤上的外接矩形。

結論與建議
本研究「基於MultiResUnet深度學習方法於乳房X光影像之腫瘤區域分割及辨識」,旨在促進乳房腫瘤辨識時的方便性,專注於乳房X光影像中腫瘤區域的精確分割和辨識形狀。為此進行了深入的探討。根據衛生福利部的報告,乳癌的死亡率在婦女癌症中排名第三,甚至在108年時成為死亡率最高的癌症。因此,對乳癌的早期診斷和治療具有至關重要的意義。基於美國放射學院提出的乳房報告數據系統(BI-RADS),對乳房X光攝影報告中的腫瘤形狀進行了細致的分析和分類,並可獲得80%之準確率。
本研究成功建立了一套腫瘤辨識系統,本系統有潛力作為現今醫療環境中的一個重要工具,尤其是在乳癌的早期診斷和預後評估方面。這不僅能提高診斷的準確性,也有助於醫生制定更有效的治療計劃。本研究結合了先進的深度學習技術和現有的醫學影像數據,為乳癌的早期診斷和治療提供了有力的科學支持。不僅提供了一個高效和準確的乳房腫瘤辨識方法,也為未來相關領域的研究和應用奠定了基礎。隨著深度學習和人工智能技術的不斷發展,這種基於影像分析的腫瘤辨識系統將在未來得到更廣泛的應用和改進。

圖6. 形狀分類結果