企業登錄
關注微信公衆號
下載APP

您是個人用戶,您可以認領企業號

深睿醫療科研成果又雙叒叕登上世界頂級會議,5篇論文入選ICCV 2019

2019-08-22 16:45 搶發第一評

7.jpg

近期ICCV 2019論文收錄工作已經結束,深睿研究院共有5篇論文被收錄,其中一篇更是被選爲口頭報告(Oral)。ICCV全稱是IEEE International Conference on Computer Vision,與計算機視覺模式識別會議(CVPR)和歐洲計算機視覺會議(ECCV)並稱計算機視覺方向的三大頂級會議。由于ICCV在世界範圍內每兩年召開一次,在論文投稿和錄用上競爭異常激烈,上一屆ICCV 2017,共收到2143篇論文投稿,其中僅621篇被收錄,接收比例爲28.9%。而就今年官方公布的數據來看,大會共計收到投稿4328篇,與上屆相比,整體稿件數量翻倍,優質論文的競爭更爲激烈,最終收錄1077篇,接收比例爲24.8%。

ICCV的論文集往往代表了國際計算機視覺領域最新的發展方向和趨勢。今年深睿醫療入選的5篇論文主要研究方向既包括醫學影像分析也包括計算機視覺基礎方法,其中2篇論文是人工智能醫療應用領域具有創新性突破的科研成果,將會進一步推動深睿醫療Dr.Wise®人工智能醫學輔助診斷産品的不斷創新和發展,促使人工智能技術更好地爲臨床服務。

其中一篇題目爲“Learning with Unsure Data for Medical Image Diagnosis”的論文,由深睿醫療與北京大學、首都醫科大學和微軟亞洲研究院共同進行研究。本文主要解決的是如何更好地利用非確定性醫療標注數據進行診斷模型訓練。

在臨床場景中,當疾病尚處于早期階段時,因爲缺乏足夠的信號和信息,僅基于圖像的疾病預測,難以對某些病例給出確定性的“疾病/正常”標簽,這類樣本被稱爲“不確定”數據。但“不確定”並不意味著數據是無效的,臨床上經常通過建議患者進行後續檢查,進而獲得最終的臨床診斷結果,這就避免了因爲不謹慎預測可能造成的不可逆轉的醫療事故或損失。然而,當前的機器學習方法大多忽略了“不確定”數據,主要針對“疾病和正常”兩類樣本數據進行建模,導致對“不確定”數據不能進行更好地識別。

爲了解決上述問題,本文提出了“學習不確定數據”問題,並將其建模爲序數回歸問題,從而提出了統一的端到端深度學習框架,同時從框架設計上還考慮了1)結合代價敏感參數來減輕數據不平衡問題,以及2)通過在訓練程序中引入兩個參數來執行保守和積極的策略。實驗表明,在阿爾茨海默病(AD)早期診斷和肺結節的疾病預測任務中,使用不確定數據進行學習具有非常明顯的優勢和很高的有效性。

8.png

不確定數據模型框架

另外一篇論文“Align, Attend and Locate: Chest X-ray Diagnosis via Contrast Induced Attention Network with Limited Supervision”是采用弱監督學習技術進行胸部X光病竈的檢測,衆所周知,由于胸部X光片在醫院的門診/急診檢查以及體檢篩查中非常普遍,所以基于胸片異常征象的自動檢測識別方法對胸腔疾病的早期診斷具有重要的臨床意義。而且對于醫療場景異常征象的分類以及定位相對于單純的征象分類具有更強的臨床價值和可解釋性,但是受限于數據標注成本過高的原因,目前可公開獲取的高質量標注數據集數量嚴重不足,使得征象定位的准確率目前還比較低。

本文正是主要聚焦在征象分類+定位這一問題上,利用胸片結構高度相似的特點,將陽性樣本和陰性樣本配對,在高層語義空間利用二者差異産生的注意力機制(Contrast Induced Attention)對病竈的潛在位置給予引導。同時,針對胸片尤其是床旁片拍攝角度、距離等不同造成的成像差異,借鑒風格遷移算法中常用的感知損失函數(Perceptual Loss),訓練了一個輸出校正參數的對齊模塊(Alignment Module),能夠將所有胸片對齊校正到統計意義上的標准結構胸片(Canonical Chest)。在位置標注非常有限的Chest X-ray 14數據集上,將征象分類和定位准確率帶來了顯著提升,超過當前最優算法。

9.png

算法流程:首先,對齊校正模塊通過仿射變換將配對的陽性陰性樣本統一對齊到標准胸片的視角;然後,陽性和陰性樣本二者差異産生的注意力機制施加在陽性樣本的高層特征空間;最後,識別和定位的主線輸出征象的類別和位置信息。

本次的入選論文中也有三篇是深睿研究院在基礎計算機視覺領域的科研成果,其中最值得一提的是作爲口頭宣講的論文“Dynamic Graph Attention for Referring Expression Comprehension”。Referring Expression Comprehension(指稱語句理解)旨在根據給定的自然語言描述在圖像中定位目標物體,其中,指稱語句不僅直接描述目標物體也可能描述其與其它物體的關系。本文作者從語言驅動視覺推理的角度去探索這一複雜的多模態問題,提出的動態圖注意力網絡同時建模指稱語句的語言結構和圖像物體之間的關系,並將語言結構作爲多步視覺推理的指導信息。實驗結果表明,動態圖注意力網絡不僅比現有方法擁有更高的預測精確度,還通過逐步定位複雜語句描述的目標物體,讓視覺推理過程更具可解釋性,更容易被可視化。另外兩篇論文則是在視頻顯著物體檢測和三維人體姿態估計方面的創新性研究。

ICCV 2019入選的五篇論文:

Jingyu Liu, Gangming Zhao, Yu Fei, Ming Zhang, Yizhou Wang, Yizhou Yu. “Align, Attend and Locate: Chest X-ray Diagnosis via Contrast Induced Attention Network with Limited Supervision.” IEEE International Conference on Computer Vision (ICCV), Seoul, October 2019.

Botong Wu, Xinwei Sun, Lingjing Hu, Yizhou Wang. “Learning with Unsure Data for Medical Image Diagnosis.” IEEE International Conference on Computer Vision (ICCV), Seoul, October 2019.

Hai Ci, Chunyu Wang, Xiaoxuan Ma, and Yizhou Wang. “Optimizing Network Structure for 3D Human Pose Estimation.” IEEE International Conference on Computer Vision (ICCV), Seoul, October 2019.

Haofeng Li, Guanqi Chen, Guanbin Li, Yizhou Yu. “Motion Guided Attention for Video Salient Object Detection.” IEEE International Conference on Computer Vision (ICCV), Seoul, October 2019.

Sibei Yang, Guanbin Li, Yizhou Yu. “Dynamic Graph Attention for Referring Expression Comprehension”(Oral Presentation).IEEE International Conference on Computer Vision (ICCV), Seoul, October 2019.


聲明:該文章版權歸原作者所有,轉載目的在于傳遞更多信息,並不代表本網贊同其觀點和對其真實性負責。如涉及作品內容、版權和其它問題,請在30日內與本網聯系。
喜歡這篇 (1)
評論一下
評論
登錄後發表評論

客服咨詢

關注微信公衆號

下載APP