轉移學習讓深度學習更逼近人工智慧

長庚大學教授 林口長庚醫院 婦產部主治醫師 王子豪

 

 

人類智慧累積的通則是:從以前的經驗領略出規則,再應用於解決新的問題。在資訊科學裡,將轉移學習(transfer learning)的概念應用於以神經網路(neural networks)為骨幹的深度學習(deep learning),讓人工智慧(artificial intelligence, AI)更有效率。最近幾年在醫學影像的人工智慧判讀,已獲得重大成果。

 

轉移學習應用的原則 (延伸閱讀一),是從一個巨大但比較鬆散相關的數據集(datasets)-例如有1,200,000圖片、涵蓋1000個分類項目的ImageNet,找出特徵提取(feature extraction)的通則(圖一,上半部);再用所獲得的通則來訓練神經網路的上層(圖一,下半部),典型的例子就如2016年Szegedy發表的Inceptrion-v3 network (延伸閱讀二)。最近兩年被成功應用的分析流程(延伸閱讀三~),就先從一個超大型的數據集操作神經網路分析,以提取特徵,再將這些特徵以轉移學習應用於其他任務。用這個策畧獲得最大的好處是:可以應用於較小型的數據集,例如,大部分的醫學數據集都不可能大到上百萬筆數據。

1

Google團隊和醫學中心合作,用深度學習來偵測糖尿病視網膜病變,發表在2016年的JAMA (延伸閱讀三)。第一個EyePACS-1數據集包含4,997病人的9,963影像數據(圖二A),第二個Messidor-2數據集包含874病人的1,748影像數據(圖二A)。用ROC (receiver operating characteristics) curve評估分析的效率分別可以達到AUC (area under the curve, 此數值越高、越趨近於1越好) 0.991 和0.990。這篇論文的結果,提供了非常優異的原理驗證(proof of principle)。

2

 

運用一樣的轉移學習策略(圖三上半),史丹福大學團隊利用深度卷積神經網路(deep convolutional neural networks, deep CNNs),以影像來診斷皮膚疾病,發表在2017年的Nature。作者從頭到尾,直接以影像來訓練機器學習演算法,只喂以含2,032不同疾病的129,450臨床影像的像素(pixels)和疾病標誌(disease labels) (圖三下半) ;接下來和21位皮膚科專科醫師比較對下列兩種疾病的診斷率: 角質形成細胞癌 (keratinocyte carcinoma,最常見的皮膚癌)和惡性黑色素瘤(malignant melanoma,最惡性的皮膚癌)。結果電腦演算法和皮膚科專科醫師的診斷率一樣好,不分上下(延伸閱讀四)。

3

 

在疾病診斷和偵測上,將轉移學習策略發揮的淋漓盡致的(圖四),當屬2018年發表於Cell的論文(延伸閱讀五)。張康(Kang Zhang, MD., PhD.)教授領導的跨國團隊分析光學同調斷層掃描(optical coherence tomography)數據集,在偵測眼科急症轉診的適應症上,意即:出現脈絡膜新生血管(choroidal neovascularization, CNV)和糖尿病黃斑水腫(diabetic macular edema, DME),用ROC curve評估效率時,可達到AUC 0.999 (圖五A);而分析小兒肺炎胸部X光影像數據集,能夠鑑定出細菌性肺炎的效率也可達AUC 0.94 (圖五B)

4

 

 

5

延伸閱讀:

  1. Rampasek L and Goldenberg A. Learning from everyday images enables expert-like diagnosis of retinal diseases. Cell (2018) 172: 893-895.
  2. Szegedy C et al. Rethinking the inception architecture for computer vision. In 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), pp. 2818-2826.
  3. Gulshan V et al. Development and validation of a deep learning algorithm for detection of diabetic retinopathy in retinal fundus photographs. JAMA (2016) 316: 2401-2410.
  4. Esteva A et al. Dermatologist-level classification of skin cancer with deep neural networks. Nature (2017) 542: 115-118.
  5. Kermany DS et al. Identifying medical diagnoses and treatable diseases by image-based deep learning. Cell (2018) 172: 1122-1131.

 

英國生物資料庫領軍邁入精準醫學

長庚大學教授 林口長庚醫院 婦產部主治醫師 王子豪

 

 

 

2018年10月Nature刊登了兩篇指標性的文章,用大規模的英國生物資料庫(UK Biobank) 50萬人的數據,不但強調基因體學(genomics)和表型體學(phenomics)的結合, 更是整合人類生命資訊的大量、異質性數據,來獲得對疾病機制的了解。更值得一提的是,英國生物資料庫不僅提供給英國人,還公開給全世界學術人士使用,至今已有八千多位學者登錄使用,進行著796個登錄的研究計劃(延伸閱讀一)。英國展現這樣的學術實力和數據分享的慷慨義舉,堪稱足以領軍邁入精準醫學。

 

Bycroft et al. (延伸閱讀二) 整理了整個英國生物資料庫現有和計劃要收集的數據 (下圖):(1) 利用Affymetrix Axiom平台的基因晶片來獲得50萬人的基因型雖然數目龐大,但是比起獲得其他各種體學數據,獲得每個參與者SNP變異的數據可能還是整個前瞻型精準醫學計劃中最簡單的 (延伸閱讀三);(2)每個參與者都要填寫鉅細糜遺的問卷;(3)接受各種影像學的檢查,包括核磁共振和X光;(4)每個參與者的數據都要連結到電子健康紀錄(EHR)、死亡登錄和癌症登錄; (5)參與者的日常活動、體能鍛煉、和心肺功能都可以利用穿戴式器具來遠距收集;(6)分析各種體液可能產出基因體和生化的生物標記,尤其是利用蛋白質體學和代謝體學分析;和(7)其他人體的各種測量。上述這些不同來源的各項數據和資訊,正是精準醫學要整合分析的範疇。在Bycroft 的報告中,只有人體和微生物互動的總體基因體學(metagenomics)尚未被提到,雖然總體基因體學也是精準醫學的一個重要學門(請參見:2018-2-262018-3-12的新知分享)。

圖1

英國的生物資料庫不只是基因型資料庫,同時也整合各種表型(phenotypes)數據,例如大腦的影像學數據。有些影像學表型(image-derived phenotypes, IDPs)甚至包括了各層次的詳細核磁共振影像:結構核磁共振影像(structural MRI)、功能核磁共振影像(task-based functional MRI, fMRI)、可以用來顯示結構連接性(structural connectivity)的擴散核磁共振影像(diffusion MRI, dMRI)。Elliott et al.就是利用英國生物資料庫中3,144位有詳細核磁共振影像學資料的個案(延伸閱讀四),經由分析影像學的ICVF (intracellular volume fraction)參數,檢定出rs67827860 (位於VCAN基因的intron) 和大腦白質的軸突內水份有關(下圖a, b )。雖然這篇文章中, 有許多腦部MRI的專業知識,我們只能請教影像學專家才說得清楚;但這個研究對我們的啟發,在於它是把詳細、精密的腦部影像學資料納入全表型體學關連研究(Phenome-wide association study, PheWAS)的一個典範(下圖c),因為這些和前腦白質相關的dMRI IDPs和一群基因的SNP有高度相關, 而這群基因主要的功能在於建構細胞外間質(extracellular matrix, ECM)和上皮生長因子的訊息傳遞系統(EGF signaling);這群基因也和導致多發性硬化症、中風、憂鬱症、肌萎縮側索硬化症有關。

圖二

誠如Vanderbilt Genetics Institute的遺傳學家Nancy Cox有感而發:全世界的學術界慶幸能使用英國生物資料庫資料之餘,應該亟思分享自己單位的資料來努力趕上英國這樣的慷慨義舉 (延伸閱讀三)。

 

延伸閱讀:

  1. Crowd screen- Precision medicine relies on studies that track huge numbers of people. Nature (2018) 562: 163-164.
  2. Bycroft C et al. The UK Biobank resource with deep phenotyping and genomic data. Nature (2018) 562: 203-209.
  3. Cox N. Biobank for the masses. Nature (2018) 562: 194-195.
  4. Elliot LT et al. Genome-wide association studies of brain imaging phenotypes in UK Biobank. Nature (2018) 562: 210-216.

測量孕婦血中生物標記來預測早產的新進展

icon-16

長庚大學教授 林口長庚紀念醫院 王子豪醫師

早產(preterm delivery)定義為妊娠37週之前發生的分娩,是母胎醫學最常見的疾病,全世界每年約有1500萬早產兒出生。早產是新生兒死亡的首位原因,而存活的早產兒容易也有長期的併發症,例如慢性肺疾病、聽力和視力受損、神經發育異常等等,造成社會、醫療和經濟的重大傷害。因此醫學界致力於各種預測和預防早產的研究,也嘗試開發測量孕婦血液的生物標記就能預測早產的方法。

由美國11個研究中心合作的前瞻性蛋白質體學早產研究(Proteomic Assessment of Preterm Risk study, PAPR),在2016年發表於Am J Obstet Gynecol硏究論文(延伸閱讀一)顯示,用質譜儀分析了5501位孕婦的血液(下圖),

測量孕婦血中生物標記來預測早產的新進展_1

在無症狀孕婦群,以兩個蛋白質(IBP4/SHBG)的比值來預測早產的能力可達0.75靈敏度和0.74特異度(下圖),這些資料在ROC (receiver operating characteristic) curve分析上可得到AUC (area under the curve)值為0.75。開發一種檢測方法時,AUC值越趨近於1越好;而純粹用猜測、無須任何檢測方法,也可以達到AUC為0.5;所以AUC= 0.75,表示這個檢測方法有點用處,但仍大有改善空間。IBP4是insulin-like growth factor binding protein-4,IBP4在孕婦血中濃度增高時,一般認為是反映胎盤著床異常,因此數值升高和早產有關。懷孕時血中濃度SHBG (sex hormone-binding globulin) 會增加5-10倍;早產被認為和羊膜內感染與發炎有關,而這些發炎會導致一些發炎細胞素(inflammatory cytokines,例如TNF-alpha 和IL1-beta)的增加,這些細胞素會抑制肝臟製造SHBG,所以可能和早產孕婦的SHBG下降有關。

測量孕婦血中生物標記來預測早產的新進展_2

史坦福大學的Stephen Quake是研究孕婦血清中胎兒來源核酸(DNA, RNA)的專家,幾年前就發表了:只抽孕婦血就可得到胎兒的全基因體定序資料。他的團隊在2018年於Science的論文(延伸閱讀二) 發表:以次代定序方法(NGS)分析孕婦血液中細胞外RNA (cell-free RNA, cfRNA),最後開發出只要用反轉錄定量PCR測量7種孕婦血液cfRNA (CLCN3, DAPP1, MAP3K7CL, MOB1B, PPBP, RAB27B, RGS18),就可能找出會發生早產的孕婦族群(下圖)。

測量孕婦血中生物標記來預測早產的新進展_3

雖然他們的初步結果顯示,偵測早產孕婦的能力(AUC 值介於0.81-0.86之間)優於上述2016年的蛋白質體研究;但值得注意的是,此硏究的驗證族群太小了(只有23人,而其中5個早產所佔的比例為21.7%)。所以實際的應用性,還有待大規模的驗證。

測量孕婦血中生物標記來預測早產的新進展_4

延伸閱讀:

  1. Saade GR et al. Development and validation of a spontaneous preterm delivery predictor in asymptomatic women. Am J Obstet Gynecol (2016) 214: 633.e1-24.
  2. Ngo TTM et al. Noninvasive blood tests for fetal development predict gestational age and preterm delivery. Science (2018) 360: 1133-1136.

合併電子健康紀錄(EHR)和全基因體關聯研究(GWAS)獲得重大成功

icon-08

長庚大學教授 林口長庚紀念醫院 王子豪醫師

因為高通量的微陣列晶片(microarray gene chips)的普及應用,全基因體關聯研究(genome wide association study, GWAS) 在最近十幾年蓬勃發展,尤其在2007年發表的241篇論文中許多出現在Science和Nature系列期刊,接著GWAS相關論文發表就散布在各個專科和層級的期刊;從2011年到2017年之間,每年都有3000多篇的論文發表;截至2018年7月,用GWAS這個關鍵字可以在PubMed找到三萬多篇的論文。然而,利用電子健康紀錄(electronic health record, EHR)將病人的表現型(phenotypes)合併於GWAS,則至今只有36篇論文發表,第一篇是哈佛和麻省理工學院團隊發表於2011年Am J Human Genetics (延伸閱讀一)。而2018年UCSF和Kaiser Permanente醫療體系的合作團隊發表於Nature Genetics (延伸閱讀二) 的論文,則堪稱是合併EHR和GWAS的地標性研究。

現在GWAS硏究結果要能被學界接受的準則是:在發現族群(discovery group)中所找到的疾病關聯基因位點,都必須在獨立的驗證族群(validation groups)也可以看到一致的疾病關聯性。UCSF的這個硏究利用的發現族群是 GERA (genetic epidemiology resource on adult health and aging)研究的參與者,作者先從94,674人的Affymetrix gene chips基因體資料找出和血脂肪的相關性,而血脂肪檢驗數據則來自於Kaiser Permanente電子健康紀錄(EHR)中近48萬次的抽血資料;本研究的驗證族群有兩個:GLGC (global lipids genetics consortium) database的94,595歐洲人和UK Biobank的46萬人,本研究可以驗證17個血脂肪關聯基因位點。

除了提供我們了解那些基因調控血脂肪的學術價值以外,本研究的結果還能夠幫我們預測疾病和促進健康。因為這個研究分析族群涵蓋了多個種族,而每個種族的數量都大到足以有代表性,所以本研究可獲得不同種族對不同血脂肪昇高的遺傳風險評分 (genetic risk scores, GRS)。例如,東亞人(East Asians)就有最低的HDL 遺傳風險評分,但卻有最高的LDL、 triglyceride、total cholesterol 遺傳風險評分。本研究更進一步結合遺傳風險評分和記錄於EHR的藥物使用資訊,而可推算出某一種族的病人可能在多少歲時,會有必須使用降血脂藥物(statins)的機率。下圖ab 為白種女人和男人的機率圖:在此,如用兩個遺傳風險評分(LDL、TG)為例來看,在a的50歲女性,遺傳風險評分最高的五分之一(quintile) 服藥的機率是遺傳風險評分最低的五分之一之1.66倍; 女性到60歲時,此機率為1.8 倍;而在b的50歲和60歲男性,上述機率則分別為3.04和2.37倍。而下圖cd 為東亞女人和男人的機率圖。

合併電子健康紀錄(EHR)和全基因體關聯研究(GWAS)獲得重大成功_1

合併電子健康紀錄(EHR)和全基因體關聯研究(GWAS)獲得重大成功_2

延伸閱讀:

  1. Kurreeman F et al. Genetic basis of autoantibody positive and negative rheumatoid arthritis risk in a multi-ethnic cohort derived from electronic health records. Am J Hum Genet (2011) 88: 57-69.
  2. Hoffmann TJ et al. A large electronic-health-record-based genome-wide study of serum lipids. Nature Genetics (2018) 50: 401-413.

醫師特質影響乳癌病人接受基因診斷的比例

icon-08

長庚大學教授 林口長庚紀念醫院 王子豪醫師

台語有一句老話:「醫生郎,病人褔」,字面上的意思是:遇到什麼醫師決定於病人的福氣;更深一層的暗示是:醫師的特質(包括經驗和心態)可能決定病人疾病的預後。2018年七月份登載於美國醫學會期刊外科學(JAMA Surgery) 的一篇原著論文則揭露:乳癌病人如果是遇到一位較常轉介病人做基因檢測的外科醫師,這位病人較有機會做到癌症分子檢測。這個結論雖然非常淺顯直白,但是本硏究證明了這種可以預期的醫病模式,足以提醒醫師對精準醫學進展的自我學習。

 

這篇研究的受訪者採樣自美國喬治亞州和加州的洛杉磯郡,作者問卷調查7303位乳癌病人和488位乳房外科醫師,總共得到了可分析的5080位(69.6%)病人和377位(77.3%)醫師資料。NCCN (National Comprehensive Cancer Networks)的臨床指引建議評估乳癌病人的下列危險因子(下圖),將病人分類為可能帶異常基因的高危險(high risk)、和平均危險(average risk)群,而建議高危險群病人接受基因檢測。

醫師特質影響乳癌病人接受基因診斷的比例_1

下圖整理出受訪醫師對基因檢測和遺傳諮詢的心態。對於高危險病人(A)和平均危險群病人(F),大部分的醫師都會把她們轉介遺傳諮詢。5080位受訪病人總共有27%接受了癌症基因檢測,其中高危險病人有34%接受了癌症基因檢測,而平均危險群病人也有14%接受了癌症基因檢測;但是,即使對於高危險病人,醫師也不常立開癌症基因檢測- 不管是BRCA1/2(B )或是多基因檢測(C);相反的,一些平均危險群病人也被開立了癌症基因檢測(E),這個資料暗示著:不只是危險分群才決定病人接受癌症基因檢測的機率,醫師對基因檢測的態度也扮演很重要的角色。對高危險群病人接受癌症基因檢測時,大部分醫師會等到檢測資料出來才開刀(D)。大部分受訪醫師都很有信心和病人討論癌症基因檢查的優、缺點(G)。本研究並根據圖A到圖G的七項特質,建立出一個稱為手術醫師開立癌症基因檢測的趨勢量表(Surgeon Tendency to Order Genetic Testing Scale),將這個量表標準化後(H),可以看出受訪醫師大致分成兩群-左側的醫師較不開立基因檢測,右側那群是較傾向於開立癌症基因檢測的醫師。

醫師特質影響乳癌病人接受基因診斷的比例_2

外科醫師每年服務乳癌新病人的數量,也會影響她/他開立癌症基因檢測的比例。和每年有一百位以上乳癌新病人(高服務量)的醫師相比時,每年少於50位新病人(低服務量)的醫師最少開立癌症基因檢測,而每年有50到100位乳癌新病人(中服務量)的醫師則介於上述兩群之間(下圖),這結果顯示出:乳癌病人數低服務量和中服務量的醫師,較少開立乳癌相關癌症基因檢測。這個研究同時也顯示,經濟情況和保險狀態都顯著影響接受癌症基因檢測的可能性:經濟較為弱勢的黑人最少接受癌症基因檢測;而保險不給付時,接受癌症基因檢測的機會也最低(下圖)。

醫師特質影響乳癌病人接受基因診斷的比例_3

本研究最突顯的一個現象是:異常基因高危險群的乳癌病人,遇到一位最有開立癌症基因檢測傾向的醫師,例如落在95百分位(percentile) 的醫師時,她大概有72.3%的機率會接受癌症基因檢測;相反地,如果她遇到一位最不傾向開立基因檢測的醫師,例如落在5百分位(percentile) 的醫師時,她大概只有26%的機率會接受癌症基因檢測 (下圖橘黃色曲線)。而平均危險群的乳癌病人,遇到一位最有開立癌症基因檢測傾向的醫師時,她大概有24%的機率會接受癌症基因檢測;相反地,如果她遇到一位最不傾向開立基因檢測的醫師時,她大概只有4%的機率會接受癌症基因檢測 (下圖藍色曲線)。

醫師特質影響乳癌病人接受基因診斷的比例_4

延伸閱讀:

Katz SJ et al. Association of attending surgeon with variation in the receipt of genetic testing after diagnosis of breast cancer. JAMA Surgery (2018) July 3, doi:10.1001/jamasurg.2018.2001

 

美國FDA半年內核准的三個人工智慧醫療產品

icon-16

長庚大學教授 林口長庚紀念醫院 王子豪醫師

人工智慧(Artificial Intelligence,AI)是當代的熱門用語,其應用本質是:利用電腦的深度學習演算法,從大量的異質性數據中,萃取出可能有用的專業資訊;而在醫療應用上,這類資訊變成的可用知識,大部分是用來分類- 有/無疾病、高危險/低危險、需要馬上處理/可以持續觀察、適合/不適合某種治療、等等臨床情境。把這樣的電腦輔助工具說成人工智慧其實有點嘩眾取寵、危言聳聽,但社會大眾喜歡這種「令人期待又害怕」的說法,所以連各國政府單位也不能免俗,都直接用A I這個詞。AI在醫療應用上,最近在影像辨識和診斷分類上屢建奇功。

 

FDA在2018年2月13日通過一項臨床決策支援軟體(clinical decision support software),Viz.AI Contact application。Viz.AI是史丹佛大學人工智慧研究室(Stanford A.I. Research)衍生出來的一家舊金山的健康產業新創公司。透過協助分析電腦斷層攝影的圖像,VizLVO能自動偵測可疑的大血管阻塞(large vessel occlusion, LVO),並迅速通知醫師:病人可能有的中風危險 (下圖)。

美國FDA半年內核准的三個人工智慧醫療產品_1

 

而VizCTP則是用來分析電腦斷層攝影產出的造影劑影像,快速計算出大腦血液灌流的各種參數 (下圖),也有助於評估中風的嚴重度。

美國FDA半年內核准的三個人工智慧醫療產品_2

FDA在2018年4月11日通過第一個人工智慧醫療器具(AI-based device) – IDx-DR的上市,它利用人工智慧演算法分析由視網膜攝影機(Topcon NW400) 所獲得的影像,快速篩檢糖尿病病人是否有必須由專業眼科醫師治療的視網膜病變?IDx-DR可以在診療糖尿病人的一般醫療診所(primary care doctor’s office)擷取影像,將這些影像傳送到雲端分析,在1分鐘內就可以獲得判讀結果,陽性-指中度以上糖尿病視網膜病變(more than mild diabetic retinopathy, mtmDR),就必須轉給眼科專家診治;陰性-則在1年後追蹤即可(下圖)。

美國FDA半年內核准的三個人工智慧醫療產品_3

這套人工智慧醫療器具的賣點是,在預防糖尿病併發症的醫療過程中,視網膜健康的評估步驟還不需要勞動視網膜專家來篩檢病人,可以大幅增加病人篩檢率和降低專家醫療成本。對於偵測出糖尿病的視網膜病變,IDx-DR宣稱可達到87%的靈敏感度和90%的特異度(下圖)。

美國FDA半年內核准的三個人工智慧醫療產品_4

FDA在2018年5月24日又通過一套電腦輔助骨科偵測軟體Imagen OsteoDetect的上市許可。當病人懷疑有手腕骨折時,這套軟體分析兩張不同角度的X光片,協助偵測是否有手腕附近的遠端橈骨骨折? Imagen公司成立的宗旨是:利用機器學習來協助醫療診斷。截至2018年7月7日止,Imagen的網頁列出36位臨床醫師夥伴,有11位四肢關節專科醫師、10位放射診療科醫師、8位外傷科醫師,和7位小兒科醫師 (下圖) ,從這個招募的專科比例,也可以看出電腦輔助醫學影像辨識可用在那些臨床科別的發展趨勢。

美國FDA半年內核准的三個人工智慧醫療產品_5

延伸閱讀:

  1. FDA permits marketing of clinical decision support software for alerting providers of a potential stroke in patients. https://www.fda.gov/newsevents/newsroom/pressannouncements/ucm596575.htm
  2. FDA permits marketing of artificial intelligence-based device to detect certain diabetes-related eye problems https://www.fda.gov/NewsEvents/Newsroom/PressAnnouncements/ucm604357.htm
  3. FDA permits marketing of artificial intelligence algorithm for aiding providers in detecting wrist fractures https://www.fda.gov/newsevents/newsroom/pressannouncements/ucm608833.htm

經由子宮頸取得的液態切片PapSEEK有助於檢出各種婦癌

icon-08

長庚大學 教授 林口長庚醫院 主治醫師 王子豪

希臘裔美國醫師Georgios Papanikolaou從1920年代開始的研究,發展出已開發國家常用的子宮頸抹片檢查 (Papanicolaou test,或稱Pap smear),導致近年的子宮頸癌死亡率降低和新病例的逐年減少。相反地,子宮體癌則因為肥胖和平均壽命延長而逐年增加,已經變成最常見的婦科癌症。美國2017年,就有61,380新診斷的子宮體癌,而造成一年有11,000名死亡病例。卵巢癌是美國第二常見的婦科癌症,每年約有22,000名新病例,但造成更高的死亡率(每年約有14,000人死於卵巢癌)。台灣也是如此, 2017年5月4日公布的國人十大癌症中,女性生殖道癌症依序也是:子宮體癌、卵巢癌、子宮頸癌 (下圖)。

PapSEEK_1

國民健康署2017年出版的癌症登記報告(延伸閱讀一) 也顯示:2015年癌症個案數增加最多的前五名,子宮體癌就增加了7.73% (下圖)。雖然同一份報告記錄了,2015年的申報病例分別為:2,440位子宮體癌、1,485位子宮頸癌、1,434位卵巢/輸卵管/闊韌帶癌(現在認為這三種都屬於同一癌型)。

PapSEEK_2

 

針對美國日漸增多的子宮內膜癌,和數十年來毫無降低趨勢的卵巢癌,Johns Hopkins University團隊在2018-3-21的Science Translational Medicine期刋(延伸閱讀二) 發表了三種非侵入性檢查的偵測效果。他們比較了用兩種分子檢測方法(PapSEEK-延伸閱讀三 和CancerSEEK延伸閱讀四)來分析下列三種收集檢體的效果:子宮頸採檢刷(Pap brush)、子宮內膜採檢刷(Tao brush)、或是合併子宮頸採檢刷加上抽血檢查(Pap brush + Plasma)。由Pap brush和Tao brush採到的檢體用PapSEEK來分析基因和染色體的變異,而Plasma則以CancerSEEK分析 (下圖)。

 

PapSEEK_3

PapSEEK分析癌細胞中18個基因的突變和異常染色體數目(aneuploidy 非整倍體),而CancerSEEK則是合併DNA定序和蛋白質生物標記的抽血液態切片(參見本學會2018-1-22的「新知分享」專欄)。這個研究團隊發現Pap brush能夠在382位子宮內膜癌中偵測出81%,而Tao brush則可以在123位子宮內膜癌病人中得到93%的偵測率。相反地,Pap brush在245位卵巢癌中只能夠偵測出33%,而Tao brush則可以在51位卵巢癌病人中得到45%的偵測率。PapSEEK偵測的靈敏度,在早期或晚期子宮內膜癌症並沒有太大的差別(下圖左、中)。PapSEEK和CancerSEEK兩者對於早期卵巢癌的偵測率都明顯降低;而在83位卵巢癌病人中,Pap brush/PapSEEK、Plasma/CancerSEEK、和合併兩者則分別可獲得39% 、43% 、和63%的偵測靈敏度(下圖右)。

PapSEEK_4

 

雖然2018年1月,同一Johns Hopkins University團隊發表CancerSEEK可同時偵測八種癌症(卵巢癌、肝癌、胃癌、胰臟癌、食道癌、大腸直腸癌、肺癌、乳癌),在1,005位尚未轉移的八種癌症病人,總共可以獲得大約70% 的陽性率,而只有很低(<1%)的假陽性。在當時那個報告中,針對卵巢癌診斷的靈敏度高達98%,這樣的成績好的太神奇了;不過值得注意的是:在1,005位尚未轉移的八種癌症中,卵巢癌只佔54位,也許有採樣偏誤(sampling bias)。本硏究在83位卵巢癌病人中,Pap brush/PapSEEK、Tao brush/PapSEEK、和Pap brush/PapSEEK合併Plasma/CancerSEEK則分別可獲得33%、45%、和63%的偵測靈敏度(下圖),應該是比較接近實務的。

 

PapSEEK_5

 

延伸閱讀:

  1. 衛生福利部國民健康署(民國106年12月出版):中華民國104年癌症登記報告 (http://www.hpa.gov.tw/Pages/Detail.aspx?nodeid=269&pid=8084)
  2. Wang Y et al. Evaluation of liquid from the Papnicolaou test and other liquid biopsies for the detection of endometrial and ovarian cancers. Science Translational Medicine (2018) 10: eaap8793.
  3. Kinde I et al. Evaluation of DNA from the Papnicolaou test to detect ovarian and endometrial cancers. Science Translational Medicine (2013) 5(167): 16ra4.
  4. Cohen JD et al. Detection and localization of surgically resectable cancers with a multi-analyte blood test. Science (2018) 359: 926-930.

美國國家衛生院發表泛癌症圖譜(Pan-Cancer Atlas)最新進展

icon-08

長庚大學教授 林口長庚紀念醫院主治醫師 王子豪

美國國家衛生院(NIH)所屬的國立癌院(National Cancer Institute, NCI)和國立人類基因體研究院(National Human Genome Research Institute, NHGRI)在2006年開始執行癌症基因體圖譜(The Cancer Genome Atlas, TCGA)計劃,於2013年截止臨床收案;至今已經完成11,000個癌症病人的詳細分析,包括33種常見的癌症類型和10種比較罕見的癌症;全部的經費是3億美元,有北美20多所大學的150位研究者參與;累積的資訊量為2.5千兆兆位元組(petabytes)- 如果用DVD來儲存,必須用到53萬片(下圖)。累積了這麼多的癌症數據,讓生物醫學界才得以進行泛癌症圖譜(Pan-Cancer Atlas)的分析。

美國國家衛生院發表泛癌症圖譜_1

2018-4-5的細胞(Cell)期刊,就刊登三篇旗艦型的泛癌症圖譜論文,終結討論癌細胞來源樣式(cell-of-origin patterns)、致癌化進展 (oncogenic processes)、致癌訊息傳遞路徑(oncogenic signaling pathways) 三個重要層面。更值得一提的免費學術服務是:細胞(Cell)期刊出版社開闢了一個專門網頁(下圖) http://www.cell.com/pb-assets/consortium/pancanceratlas/pancani3/index.html,收錄了含這三篇總結型論文的三十篇論文PDF,供全世界的學者下載閱讀。

美國國家衛生院發表泛癌症圖譜_2

在第一個主題- 癌細胞來源樣式(cell-of-origin patterns) (見延伸閱讀一),研究者分析癌細胞的染色體非整倍體(aneuploidy)、DNA甲基化、mRNA和microRNA的表現量、與反相蛋白質陣列(reverse-phase protein arrays),結果顯示:上述各種量測值在10,000多個癌症檢體中的集羣度(clustering),主要和癌症檢體的組織分類或解剖位置來源有關(下圖),這些結果提供了聚焦式泛癌分析(focused pan-cancer analyses)的基礎,可用於進一步硏究泛消化道癌、泛婦癌、泛腎癌、泛鱗狀上皮癌,等等。

美國國家衛生院發表泛癌症圖譜_3

 

在第二個主題-致癌化進展 (oncogenic processes) (見延伸閱讀二),硏究者廣泛分析會導致癌症發展的過程。綜和了許多TCGA泛癌症圖譜的論文和硏究,致癌化進展主要涉及三個琢面(facets):(1)遺傳的或後天發生的突變,(2)腫瘤基因體和腫瘤表基因體(epigenome)對轉錄體(transcriptome)與蛋白質體的影響,和(3)腫瘤與微環境的互相影響 (下圖)。在發展精準癌治療上,我們對第三點的洞見尤其重要:藥物常以腫瘤的司機突變(driver mutations)為標靶,而免疫治療則針對微環境來開發。

美國國家衛生院發表泛癌症圖譜_4

 

致癌訊息傳遞路徑可發生於細胞週期調控、細胞凋亡、或細胞生長;但是這些異常訊息傳遞路徑的程度、機制、和共同發生的情況,則在不同癌症與不同癌種間差異很大。在這篇旗艦型綜論中(見延伸閱讀三),研究者將癌細胞的訊息傳遞路徑,歸納於10條典範路徑:細胞週期、Hippo、Myc、Notch、Nrf2、PI-3-Kinase/Akt、RTK-Ras、TGFβ、p53、和β-catenin/Wnt。在9125個癌症檢體的分析顯示:89%的癌症檢體至少有一個典範路徑產生了司機變化(driver alteration);57%的癌症檢體至少可找到一條有藥物來治療的異常典範路徑;更有30%癌症檢體有多條異常典範路徑可供藥物當標靶來治療(下圖)。

美國國家衛生院發表泛癌症圖譜_5

延伸閱讀:

  1. Hoadley KA et al. Cell-of-origin patterns dominate the molecular classification of 10,000 tumors from 33 types of cancer. Cell (2018) 173: 291-304.
  2. Ding L et al. Perspective on oncogenic processes at the end of the beginning of cancer genomics. Cell (2018) 173: 305-320.
  3. Sanchez-Vega F et al. Oncogenic signaling pathways in the cancer genome atlas. Cell (2018) 173: 321-337.

 

自律神經調節運動心率的基因新發現

icon-08

長庚大學教授 林口長庚醫院主治醫師 王子豪

運動時心率增加,休息時心率回復,一般認為受控於自律神經系統 (autonomic nervous system, ANS),而心律變異性(heart rate variability, HRV)是可用於監控健康和壓力的方法之一,本學會已於2018-2-12的新知分享專欄介紹過。然而,調控個體心率變化差異的機制仍不很清楚,最近荷蘭的學者利用Affymetrix SNP基因晶片的數據,以基因體關連研究(genome-wide association study, GWAS),在將近六萬個英國人,發現了25個單核酸異質性(single nucleotide polymorphism, SNP)變異點和心率增加與回復有密切相關(延伸閱讀)。

 

研究人員首先從英國生物銀行(UK Biobank) 的96,600志願者,挑選出58,818位至少做過一次心臟評估的基因資料。心臟評估是讓志願者接受6分鐘固定腳踏車運動,運動量須達到每個人極限負荷的30%到50%,而在運動前、運動中、運動後分別測量心電圖。這個研究團隊利用SNP pattern、定量性狀基因座(quantitative trait locus,QTL) 找到了25個和心率增加或回復有高度相關的SNPs (下表一)。


自律神經調節運動心率的基因新發現_1

下圖的Manhattan plot中,可看到許多基因都是與神經生理功能有關。例如,和心率回復最顯著關聯的SYT10基因編碼Ca2+ sensor Synaptotagmin,能刺激IGF-1分泌,而防止神經元退化。ACHE基因編碼一個酵素來降解神經遞質acetylcholine,也和神經元功能有關。NEGR1基因調控神經元型態,並決定神經突觸的數目。GRIK2基因編碼神經系統普遍存在的kainite glutamate receptor,與神經訊號的激發有關。CHRM2基因編碼在心臟高度表現的神經遞質受體muscarinic acetylcholine receptor M2。BCAT1基因雖然一開始偵測到高度關聯,但在調整了resting heart rate, heart rate variability, heart rate increase 之後,和心率回復的關聯就不顯著了。

自律神經調節運動心率的基因新發現_2

研究人員又根據相關係數,計算出上述和心率增加/回復有顯著關連的SNPs的polygenic scores,再用這個polygenic scores去迴歸分析另外422,947不曾用於GWAS discovery的Biobank志願者的臨床表型(下表二)。各種的迴歸分析(linear, logistic, cox regression analysis)的結果顯示,越高的polygenic scores,和較低的舒張壓(DBP)有顯著關連,連帶也會關連到較低的脈搏壓(pulse pressure)與平均動脈壓(mean arterial pressure);很有趣的是,越高的polygenic scores會與父親高齡有顯著關連(p=5.5 x 10-4, n=217,722),但和母親的高齡無關(p=0.202, n=179,281)。相反的,這個polygenic scores和冠狀動脈疾病(coronary artery disease)與心律不整疾病(包括atrial fibrillation和ventricular arrhythmia)都無相關(下表二)。

 

自律神經調節運動心率的基因新發現_3

延伸閱讀:

Verweij N et al. Genetic study links components of the autonomous nervous system to heart-rate profile during exercise. Nature Communications (2018) 9: 898.

 

 

人體微生物菌相硏究的新進展

icon-08

長庚大學教授 林口長庚醫院主治醫師 王子豪

人體腸道菌相與維護健康和發生疾病息息相關,甚至也能影響到癌症病人對免疫檢查點抑制劑(immune checkpoint inhibitors,又稱checkpoint blockade)的治療反應 (詳見2018-2-26的新知分享)。而最近幾年,腸道菌相影響各種慢性疾病(如第二型糖尿病、肥胖症、和高血壓)的論文,也一直在動物模式與人體硏究中提出。

人類基因組計劃(Human Genome Project,HGP)在2003年結束,所獲得的人類DNA序列提供了研究人類健康與疾病的基本藍圖。美國國家健康院(NIH)也於2008年啟動人類微生物組計劃(Human Microbiome Project,HMP),在2013完成第一階段HMP-1 (https://hmpdacc.org/hmp/),共分析了300個健康人的鼻腔、口腔、皮膚、消化道、泌尿生殖道的微生物菌相,不但用16S rRNA定序來鑒定微生物菌相的複雜度,也用混雜全基因組定序(metagenomic whole genome sequencing)來分析這些菌相的可能功能。現在進入第二階段的整合型人類微生物組計劃(integrative HMP, iHMPhttps://hmpdacc.org/ihmp/),首先瞄準三個疾病:早產、發炎腸道疾病、第二型糖尿病,其硏究架構見下三圖

 

人體微生物菌相硏究的新進展_1

人體微生物菌相硏究的新進展_2

 

人體微生物菌相硏究的新進展_3

一般研究人體腸道菌相都是分析各種細菌所佔的百分比,而以相對菌相剖析(relative microbiome profiling, RMP)呈現,然而最近比利時學者發表在自然(Nature)的研究,則強調用定量菌相剖析(quantitative microbiome profiling, QMP)分析總菌量(microbial load)的重要性(延伸閱讀一):在40個受試者的糞便菌相分析,除了用16S sRNA定序方式得到各種細菌的比例以外(下圖a),加上用流式細胞儀(flow cytometry)來計數每克糞便的細菌數目,可得到定量菌相剖析(下圖b)

 

人體微生物菌相硏究的新進展_4

而在66位健康受試者(control)和29位發炎腸道疾病(Crohn’s disease, CD)的菌相剖析中,發炎腸道疾病的糞便總菌數明顯比健康受試者少(下圖a),定量菌相剖析(QMP)比相對菌相剖析(RMP)更能清楚鑒定出Prevotella細菌數目的減少(下圖b),光是用相對菌相剖析,常會低估CD疾病相關的微生物菌相豐富性的降低。

 

人體微生物菌相硏究的新進展_5

我們一直知道高鹽的飲食和高血壓有關,但最近德國學者領導的跨國研究團隊更進一步發現:高鹽飲食會經由影響腸道菌相來刺激促進發炎反應的TH17淋巴細胞,進而造成自體免疫疾病和高血壓(延伸閱讀二)。首先他們在小鼠模式中顯示,和餵食正常鹽攝取量(normal salt diet, NSD) 的小鼠比較時,餵食高鹽食料(high salt diet, HSD) 的小鼠腸道菌相明顯降低(下圖A),變化最大的是乳酸菌Lactobacillus,在餵食高鹽食料一天就可看到明顯的下降(下圖B)。

 

人體微生物菌相硏究的新進展_6

 

接著,這個團隊對8位健康成年受試者測試:投與高鹽是否也可以看到在小鼠所呈現的變化?在此人體研究中,高鹽(High salt)是在每人的每天基礎飲食量(Baseline)外,加上6克的慢速釋出鹽錠,達到每人每天的平均鹽攝取量為13.8±2.6克。高鹽飲食很明顯的造成血壓上升(下圖a),也刺激促進發炎反應的CD4+IL-17A+TNF+TH17淋巴細胞的產生(下圖b),也很明顯地降低存在於腸道中的各種乳酸菌Lactobacilli (下圖c, d)。

人體微生物菌相硏究的新進展_7

最近幾年,糞便微生物移植(fecal microbiome transplantation)在一些特定疾病能產生特別優異的療效,而這些快速累積的腸道微生物菌相研究報告,正是提供解釋的機制。

 

延伸閱讀:

  1. Vandeputte D et al. Quantitative microbiome profiling links gut community variation to microbial load. Nature (2017) 551: 507-511.
  2. Wilck N et al. Salt-responsive gut commensal modulates TH17 axis and disease. Nature (2017) 551: 585-589.