【提要】
基于深度學(xué)習(xí)的人工智能已成為一種突破性的計(jì)算機(jī)技術(shù),并迅速應(yīng)用于醫(yī)學(xué)領(lǐng)域。其中,人工智能輔助系統(tǒng)能夠通過提高識(shí)別能力、監(jiān)測(cè)檢查時(shí)間、減少盲點(diǎn)、記錄圖片、進(jìn)行腸道準(zhǔn)備評(píng)分等方式提高胃腸鏡的質(zhì)量。
內(nèi)鏡檢查是胃腸病診斷和管理的有力工具,高質(zhì)量?jī)?nèi)鏡檢查能提供更準(zhǔn)確的健康結(jié)果和更好的患者體驗(yàn)。結(jié)腸鏡可以用來篩查結(jié)腸息肉和腺瘤,減少結(jié)直腸癌的發(fā)病率和致死率。然而,結(jié)腸鏡檢查中不乏一些漏診病例。一項(xiàng)系統(tǒng)性回顧研究顯示,結(jié)腸鏡檢查中息肉的漏診率為22%。一項(xiàng)Meta分析中26%的腺瘤被漏診,9%的晚期腺瘤被漏診,27%的鋸齒狀息肉被漏診。胃鏡是診斷上消化道病灶的重要工具,不僅能用于診斷各種胃食管疾病,也可以對(duì)某些早期胃癌進(jìn)行內(nèi)鏡下切除。但胃鏡檢查中也不乏漏診病例。在一項(xiàng)研究中,明確診斷為胃癌和食管癌的漏診患者中(7.2%,22/305),73%為內(nèi)鏡檢查操作不當(dāng)。因此,我們目前迫切需要提高胃腸鏡檢查的質(zhì)量。
歐洲胃腸內(nèi)鏡學(xué)會(huì)(ESGE)和歐洲胃腸病學(xué)聯(lián)合會(huì)(UEG)2016年已將內(nèi)鏡檢查質(zhì)量確定為主要優(yōu)先事項(xiàng)。然而,內(nèi)鏡醫(yī)師對(duì)內(nèi)鏡質(zhì)量的自我評(píng)估并不準(zhǔn)確,而人工智能輔助系統(tǒng)能夠客觀評(píng)估內(nèi)鏡醫(yī)師的內(nèi)鏡質(zhì)量,幫助內(nèi)鏡醫(yī)師認(rèn)識(shí)到不足,從而有針對(duì)性地改善內(nèi)鏡技術(shù)。
一、人工智能應(yīng)用于胃腸鏡能提高病變識(shí)別能力
1.提高ADR和PDR:ADR是間隔期結(jié)直腸癌的獨(dú)立影響因素,ADR越低,間隔期結(jié)直腸癌發(fā)生的風(fēng)險(xiǎn)越大。ESGE專家共識(shí)提出,ADR應(yīng)≥25%。內(nèi)鏡醫(yī)師在操作過程中可能難以發(fā)現(xiàn)某些較小的腺瘤,不同內(nèi)鏡醫(yī)師由于年資、經(jīng)驗(yàn)的不同,對(duì)腺瘤的識(shí)別能力也有差異。人工智能能夠有效提高內(nèi)鏡醫(yī)師的ADR和PDR。一項(xiàng)研究顯示,使用人工智能輔助系統(tǒng)的內(nèi)鏡醫(yī)師,ADR和PDR均顯著高于未使用人工智能輔助系統(tǒng)的內(nèi)鏡醫(yī)師[19]。一項(xiàng)雙盲隨機(jī)對(duì)照試驗(yàn)中,人工智能輔助內(nèi)鏡組的ADR和PDR均顯著高于對(duì)照組[34%(165/484)比28%(132/478),P<0.05;52%(252/484)比37%(176/478),P<0.01]。在一項(xiàng)包括4 354例患者的Meta分析中,人工智能輔助內(nèi)鏡組的ADR顯著高于對(duì)照組[36.6%(791/2 163)比25.5%(558/2 191),P<0.01],人工智能輔助內(nèi)鏡組的每結(jié)腸鏡無柄鋸齒狀息肉檢出數(shù)也顯著高于對(duì)照組[0.06(109/1 855)比0.04(73/1 876),P<0.01]。
2.提高早期胃癌檢出率:部分早期胃癌只有難以識(shí)別的胃黏膜細(xì)微變化,在胃鏡檢查中容易漏診。息肉樣和潰瘍型的早期胃癌較容易通過表面變化來檢測(cè),而類似胃炎的淺表黏膜病變,即使采用最佳設(shè)備和最佳技術(shù),也很難發(fā)現(xiàn)。胃鏡檢查時(shí),由于內(nèi)鏡醫(yī)師的經(jīng)驗(yàn)不同、個(gè)人狀態(tài)不同,也可能造成內(nèi)鏡質(zhì)量的差異。人工智能輔助系統(tǒng)用于檢測(cè)早期胃癌時(shí)有不亞于專家級(jí)內(nèi)鏡醫(yī)師的表現(xiàn)。一項(xiàng)研究使用深度卷積神經(jīng)網(wǎng)絡(luò)(deep convolutional neural network,DCNN)檢測(cè)早期胃癌,其靈敏度為92.2%,陽(yáng)性預(yù)測(cè)值為30.6%。另一項(xiàng)研究中,在200張有或無惡性病變的胃鏡圖像中,DCNN診斷惡性腫瘤的準(zhǔn)確率為92.5%,而6名專家、8名熟練醫(yī)師和7名新手對(duì)每張圖片的準(zhǔn)確率分別為(89.7±2.2)%、(86.7±5.6)%和(81.2±5.7)%。
二、人工智能應(yīng)用于胃腸鏡能進(jìn)行時(shí)間監(jiān)測(cè)
1.監(jiān)測(cè)結(jié)腸鏡退鏡時(shí)間和退鏡速度:充足的退鏡時(shí)間是全黏膜檢查的先決條件。一項(xiàng)納入76 810次篩查性結(jié)腸鏡檢查的研究顯示,平均退鏡時(shí)間越長(zhǎng),ADR越高。退鏡時(shí)間<6 min與≥6 min的間隔期結(jié)直腸癌發(fā)生率比率為2.3,因此建議退鏡時(shí)間≥6 min。一項(xiàng)納入550例篩查性結(jié)腸鏡的研究顯示,腺瘤檢出數(shù)量與退鏡時(shí)間之間存在顯著正相關(guān)(P=0.006),內(nèi)鏡醫(yī)師的退鏡時(shí)間為4.3~9.6 min,一半內(nèi)鏡醫(yī)師的退鏡時(shí)間小于標(biāo)準(zhǔn)。臨床上退鏡時(shí)間通常由護(hù)士或內(nèi)鏡醫(yī)師計(jì)時(shí),缺乏準(zhǔn)確性。人工智能輔助系統(tǒng)在識(shí)別結(jié)腸鏡到達(dá)回腸后開始退鏡計(jì)時(shí),識(shí)別到體外圖片時(shí)結(jié)束退鏡計(jì)時(shí),能夠及時(shí)準(zhǔn)確地記錄內(nèi)鏡醫(yī)師的退鏡時(shí)間。
一些內(nèi)鏡醫(yī)師在退鏡開始時(shí)速度較快,在退鏡后半段減速以達(dá)到6 min的退鏡時(shí)間,雖然總的退鏡時(shí)間達(dá)到了標(biāo)準(zhǔn),但退鏡質(zhì)量卻不高。實(shí)時(shí)內(nèi)鏡視頻顯示,Gong等構(gòu)建的內(nèi)鏡精靈系統(tǒng)測(cè)得的退鏡時(shí)間>6 min、5~6 min、<5 min的95%CI退鏡速度分別為36.15~40.14、40.24~44.46、44.54~49.96,故將<40設(shè)為安全退鏡速度、40~44設(shè)為警告退鏡速度、>44設(shè)為危險(xiǎn)退鏡速度,退鏡過程中,內(nèi)鏡精靈系統(tǒng)可實(shí)時(shí)檢測(cè)退鏡速度并將“安全”“警告”“危險(xiǎn)”字樣顯示在屏幕上,指導(dǎo)內(nèi)鏡醫(yī)師以穩(wěn)定的速度退鏡。
2.監(jiān)測(cè)胃鏡檢查時(shí)間:充足的檢查時(shí)間是提高內(nèi)鏡質(zhì)量的方法之一。2016年,ESGE提出首次診斷性上消化道內(nèi)鏡檢查和胃腸化生隨訪每次檢查至少7 min。內(nèi)鏡護(hù)士通常通過內(nèi)鏡室的時(shí)鐘記錄胃鏡程序的持續(xù)時(shí)間,這種計(jì)時(shí)方式往往不夠準(zhǔn)確。人工智能輔助系統(tǒng)則可以在胃鏡檢查期間自動(dòng)計(jì)時(shí)。在一項(xiàng)研究中,人工智能輔助系統(tǒng)在93.46%(100/107)個(gè)視頻中正確預(yù)測(cè)了開始時(shí)間,在97.20%(104/107)個(gè)視頻中正確預(yù)測(cè)了結(jié)束時(shí)間。且人工智能輔助組胃鏡程序的平均檢查時(shí)間顯著長(zhǎng)于對(duì)照組(5.03 min比4.24 min,P<0.001)。在另一項(xiàng)研究中,與對(duì)照組相比,人工智能輔助組胃鏡程序的平均檢查時(shí)間更長(zhǎng)[(5.40±3.82)min比(4.38±3.91)min,P<0.001]。
三、人工智能應(yīng)用于胃腸鏡能減少盲點(diǎn)
1.提高結(jié)腸鏡的盲腸插管率:盲腸插管能夠減少結(jié)腸鏡檢查的盲點(diǎn),是完成結(jié)直腸鏡的先決條件,低盲腸插管率會(huì)導(dǎo)致間隔期的遠(yuǎn)近端結(jié)直腸癌。一項(xiàng)回顧性研究顯示,早期重復(fù)結(jié)腸鏡檢查與盲腸插管失敗有關(guān)。ESGE專家共識(shí)提出,盲腸插管率要≥90%。Gong等構(gòu)建的內(nèi)鏡精靈系統(tǒng)能夠預(yù)測(cè)盲腸進(jìn)而監(jiān)測(cè)盲腸插管率,準(zhǔn)確率為95.6%,敏感度為93.2%,特異度為98.0%,假陽(yáng)性率為2.0%,假陰性率為6.8%。
2.結(jié)腸鏡檢查中監(jiān)測(cè)內(nèi)鏡滑動(dòng):結(jié)腸鏡檢查退鏡時(shí),有時(shí)候會(huì)出現(xiàn)內(nèi)鏡滑動(dòng),內(nèi)鏡在滑動(dòng)后若繼續(xù)退鏡而不能插回原位置將造成部分腸腔漏檢,尤其是在肝曲,這將造成盲點(diǎn)和漏診率的增加。然而,目前針對(duì)內(nèi)鏡滑動(dòng)造成盲點(diǎn)的干預(yù)措施的研究還很少。在實(shí)時(shí)內(nèi)鏡視頻中,Gong等構(gòu)建的內(nèi)鏡精靈系統(tǒng)在內(nèi)鏡滑動(dòng)后有提示(屏幕底部會(huì)顯示滑動(dòng)前的10幀,直至重新到達(dá)這10幀,警告消失),84次測(cè)試內(nèi)鏡中,168次內(nèi)鏡滑動(dòng)發(fā)生,56次成功重新插入,112次未能返回之前的位置,90%(152/168)內(nèi)鏡滑動(dòng)被監(jiān)測(cè)到,無假陽(yáng)性結(jié)果。
3.提高胃鏡檢查覆蓋數(shù):完整觀察整個(gè)胃是保證診斷性胃鏡的前提,ESGE提到胃鏡檢查至少要獲得10張胃圖像。然而,內(nèi)鏡檢查人員可能因?yàn)橹饔^因素或有限的手術(shù)水平而忽略胃的某些部位,導(dǎo)致早期胃癌的漏診。配備有CAM(class activation maps)和胃網(wǎng)格模型的DCNN可以覆蓋可疑的癌區(qū)并指示潛在盲點(diǎn)的存在,通過即時(shí)記錄觀察區(qū)域并在胃的網(wǎng)格模型中著色,可以指示檢查期間是否存在盲點(diǎn)。人工智能輔助系統(tǒng)能夠在屏幕上顯示胃模型,并標(biāo)記出已經(jīng)出現(xiàn)的部分,進(jìn)而提示內(nèi)鏡醫(yī)師盲點(diǎn)的存在,另外,可以將觀察部位的數(shù)量按百分比進(jìn)行轉(zhuǎn)換,在得分分別達(dá)到80、90和100分時(shí),記為“良好”“優(yōu)秀”和“完美”。在一項(xiàng)研究中,DCNN將胃鏡圖像識(shí)別為10個(gè)部分,準(zhǔn)確率為90%;將胃鏡圖像識(shí)別為26個(gè)部分,準(zhǔn)確率為65.9%,與任何級(jí)別的內(nèi)鏡醫(yī)師差異均無統(tǒng)計(jì)學(xué)意義。在一項(xiàng)隨機(jī)對(duì)照試驗(yàn)中,107個(gè)胃鏡檢查視頻中,人工智能輔助系統(tǒng)能以90.40%的準(zhǔn)確率監(jiān)測(cè)盲點(diǎn),人工智能輔助組和對(duì)照組分別分析了153例和150例患者,人工智能輔助組的盲點(diǎn)率低于對(duì)照組(5.86%比22.46%,P<0.001)。在另一項(xiàng)研究中,人工智能輔助系統(tǒng)組納入了498例患者,對(duì)照組納入了504例患者,人工智能輔助組盲點(diǎn)數(shù)少于對(duì)照組(5.38±4.32比9.82±4.98,P<0.001)。
四、人工智能應(yīng)用于胃腸鏡能進(jìn)行圖片記錄
ESGE提出解剖標(biāo)志和異常病灶的照片記錄能夠提高內(nèi)鏡質(zhì)量。人工智能輔助系統(tǒng)能夠在胃鏡檢查期間自動(dòng)提取并收集每個(gè)部位可信度最高的幀,其生成照片的完整度明顯高于內(nèi)鏡醫(yī)師。在一項(xiàng)研究中,人工智能輔助系統(tǒng)組生成照片的完整性顯著高于對(duì)照組中的內(nèi)鏡醫(yī)師(90.64%比79.14%,P<0.001)。此外,臨床上內(nèi)鏡醫(yī)師需要停下操作去獲得圖片,而人工智能輔助系統(tǒng)能自動(dòng)獲得圖片,讓內(nèi)鏡醫(yī)師能夠更專心地進(jìn)行檢查。
五、人工智能應(yīng)用于胃腸鏡能進(jìn)行腸道準(zhǔn)備評(píng)分
充足的腸道準(zhǔn)備是內(nèi)鏡醫(yī)師觀察腸道的前提,腸道準(zhǔn)備不充分會(huì)導(dǎo)致內(nèi)鏡醫(yī)師的視野受損,降低病灶檢出率。一項(xiàng)統(tǒng)計(jì)顯示,多達(dá)1/4的結(jié)腸鏡檢查腸道準(zhǔn)備不足,導(dǎo)致腺瘤漏診率增加了42%,進(jìn)而導(dǎo)致篩查不成功,重復(fù)手術(shù)的可能性增加。
目前臨床上腸道準(zhǔn)備評(píng)分使用最多的是波士頓腸道準(zhǔn)備評(píng)分(BBPS),內(nèi)鏡醫(yī)師一般都是在完成結(jié)直腸鏡后根據(jù)自己的記憶來進(jìn)行腸道準(zhǔn)備評(píng)分,偏倚的產(chǎn)生難以避免。此外,由于不同內(nèi)鏡醫(yī)師的個(gè)人理解有差異,評(píng)分還受內(nèi)鏡醫(yī)師的個(gè)人經(jīng)驗(yàn)等主觀因素影響。人工智能能夠?qū)崟r(shí)給出當(dāng)下視野的腸道準(zhǔn)備評(píng)分,并顯示退鏡時(shí)所有視野BBPS的累計(jì)百分比,讓內(nèi)鏡醫(yī)師實(shí)時(shí)了解到已完成部分的腸道準(zhǔn)備質(zhì)量。在一項(xiàng)隨機(jī)對(duì)照試驗(yàn)中,人工智能進(jìn)行腸道準(zhǔn)備評(píng)分的準(zhǔn)確率顯著高于內(nèi)鏡醫(yī)師(93.33%比75.91%,P<0.01),對(duì)有氣泡的圖片判斷時(shí),人工智能準(zhǔn)確率也達(dá)到了80%。此外,人工智能的穩(wěn)定性也顯著高于不同年限的內(nèi)鏡醫(yī)師,避免了主觀判斷造成的評(píng)分不穩(wěn)定。
六、人工智能在胃腸鏡中應(yīng)用的局限和前景
人工智能有望改變傳統(tǒng)的內(nèi)鏡檢查模式,為醫(yī)療領(lǐng)域帶來革命性的變化,然而,目前人工智能輔助系統(tǒng)應(yīng)用于內(nèi)鏡質(zhì)量控制時(shí)還存在一些不足。
首先,人工智能目前的應(yīng)用不夠廣泛,多局限于白光、窄帶光成像中,未來還需研究適用于染色內(nèi)鏡、光學(xué)增強(qiáng)內(nèi)鏡甚至光學(xué)相干層析成像的人工智能輔助系統(tǒng)。此外,構(gòu)建人工智能輔助系統(tǒng)的圖像多來自特定醫(yī)療機(jī)構(gòu),設(shè)備生產(chǎn)廠家、地域人群特點(diǎn)均有局限性,需要構(gòu)建多地區(qū)、多型號(hào)、多人群適用的人工智能輔助系統(tǒng)。
其次,用來訓(xùn)練DCNN的圖片在選擇過程中可能出現(xiàn)偏倚,比如選擇含有病灶的圖片時(shí)傾向于整塊切除的病灶,造成易切除的病灶更易入選;由于基于圖像的人工智能往往需要高質(zhì)量的圖片,許多研究排除了次優(yōu)質(zhì)量圖片。
再次,一些研究納入的病種不夠全面。例如在胃癌數(shù)據(jù)集的對(duì)照組中,一些研究?jī)H納入正常、淺表性胃炎和輕度糜爛性胃炎黏膜,未納入其他良性疾病。人工智能目前尚不能診斷未納入的病種,也不能發(fā)現(xiàn)新病種,未來如能納入更多病種,將進(jìn)一步提高人工智能輔助系統(tǒng)在胃腸鏡中檢出病灶的能力。
最后,在對(duì)病灶進(jìn)行識(shí)別時(shí),往往由內(nèi)鏡醫(yī)師先注意到胃腸道異常,將內(nèi)鏡靠攏過去后人工智能才對(duì)病灶給出提示。當(dāng)內(nèi)鏡醫(yī)師未靠攏較遠(yuǎn)距離的病灶時(shí),人工智能也未能提示病灶的存在,未來還需要繼續(xù)提高人工智能對(duì)遠(yuǎn)距離病灶的識(shí)別能力。
需要注意的是,人工智能在胃腸鏡中的應(yīng)用是為了克服觀察者之間的差異和人工學(xué)習(xí)曲線問題,但深度學(xué)習(xí)算法決策過程中的邏輯存在著人類難以理解的“黑箱”,因此使用人工智能進(jìn)行初步篩選、確定感興趣的區(qū)域和預(yù)測(cè)組織學(xué)可能是值得的,但最終需要人類做出最終決定,在實(shí)踐中實(shí)現(xiàn)人機(jī)協(xié)作。我們期待人工智能輔助系統(tǒng)在未來能夠普遍應(yīng)用于臨床內(nèi)鏡質(zhì)量控制,減少內(nèi)鏡醫(yī)師的學(xué)習(xí)時(shí)間,提高內(nèi)鏡醫(yī)師的操作質(zhì)量。