人類腸道微生物相的發育

長庚大學教授 林口長庚醫院 婦產部主治醫師 王子豪

2018年10月28的Nature期刊發表了兩篇重要的人類腸道微生物基因體(gut microbiome)論文。Stewart等人代表一個國際合作團隊 (TEDDY, The Environmental Determinants of Diabetes in the Young),從903位三個月到46個月大的嬰兒收集了12,500支糞便檢體,詳細敘述了這些嬰兒腸道微生物基因體的發育變化。該期的Nature封面並將嬰兒的微生物體描述成嬰幼兒的安全防護毯 (security blanket) (下圖),來強調人體和微生物形成一個唇齒相依的密切互利關係。依照嬰幼兒的年紀來分,3個月到14個月大是屬於發育期 (developmental phase),15個月到30個月左右是屬於過渡期 (transitional phase),而大於30個月大則呈現穩定期 (stable phase) (延伸閱讀1)。在人類腸道微生物發育期以比菲德氏菌 (Bifidobacterium) 為主,而在穩定期則以厚壁菌門 (Firmicutes)為主。會影響腸道微生物基因體結構的因素包括:生產的方式(陰道生產或是剖腹產)、是否餵母奶、嬰幼兒是否有兄弟姐妹、或是家裡有是否養毛小孩 (furry pets)當寵物。

a

Dirichlet多項混合模型(Dirichlet multinomial mixtures modeling, DMM modeling) 是用來分析微生物總體基因體(microbial metagenomics)資料的概率模型分析法,可以將數據呈現為:在各個檢體中,某一分類單元 (taxa)出現次數的頻率矩陣。該研究利用DMM modeling將排在前25名的主要微生物叢列出,依群聚關係 (clustering)呈現為10個群聚 (clusters),畫出熱度圖 (heat map) (下圖a)。依可操作性分類單元 (OTUs)值和Shannon多樣性指數,進一步分析這十個群聚的同生態域多樣性 (alpha diversity) (見下列註解) (下圖b);而這十個群聚的alpha微生物多樣性,是隨著嬰幼兒的年紀而遞增 (下圖c)。儘管如此,在嬰幼兒的微生物基因體發育期(3個月到14個月大),5個微生物門 (phyla) 的改變會非常顯著 (P < 0.001) (下圖c棕色框); 在嬰幼兒的微生物基因體過渡期(15個月到30個月大) 仍有2個微生物門 (phyla) 的改變非常顯著(下圖c紫色框);而到了微生物基因體的穩定期時,儘管此時期的alpha微生物多樣性最高,但不會再有那幾個微生物門會發生顯著改變了。

b

(註) 依據DNA序列的相似度來分析,能夠鑒定出微生物的可操作性分類單元 (Operational Taxonomic Units, OTUs)。例如,在一群微生物中根據16S rRNA基因DNA的序列相似度可呈現各種OTUs,而形成的OTUs可能是在細菌的屬或種的層級。Shannon多樣性指數(Shannon’s diversity index)是用來估算群落多樣性高低的指標,例如,當群落中只有一個族群存在時,Shannon指數達最小值0;當群落中有兩個以上的族群存在,且每個族群的個體數量相等時,Shannon指數達到最大值。因為本研究都只有分析腸道(屬同一生態域)的微生物基因體,所以就用這兩個指數 (OTUs和Shannon diversity index)來呈現 Alpha diversity。如果要比較不同生態域 (例如在不同人,或同一人的不同身體部位)所含的微生物多樣性,那就是在描述 Beta diversity (應用於下一篇論文)。

 

第一型糖尿病是會攻擊胰腺小島貝他細胞 (pancreatic islet beta cells)的自體免疫疾病。第一型糖尿病多是早發的 (early-onset),而和病人的複雜遺傳體質、環境暴露史、和腸道微生物基因體都有相關,尤其病毒感染和嚴重腸道微生物生態失調 (gut dysbiosis)被認為是重要原因。在Vatanen等人為首的國際合作團隊 (也是TEDDY之一) 分析783位白人小孩的10,913糞便檢體的總體基因體學 (延伸閱讀2),其中415位小孩是正常對照組,267位是血清抗體轉換組 (seroconversion, 指已出現對抗胰腺小島的自體免疫抗體 islet autoimmunity但尚未達到第一型糖尿病的診斷),而101位是已確診為第一型糖尿病 (type 1 diabetes, T1D)的病童 (下圖a)。下圖b 則描述三個研究族群中,每一個個案的每次糞便檢體所呈現的Shannon’s alpha diversity:在血清抗體轉換組中每個案的最後檢體(如a的菱形符號)就是出現血清抗體轉換的時間點;而在第一型糖尿病族群則依照時間先後而出現菱形符號(血清轉換的時候)和正方形符號(確診為第一型糖尿病的時候)。

 c

用主要座標分析 (Principal coordinate analysis, PCoA)本研究收到的10,913糞便檢體的微生物,以Bray-Curtis dissimilarity方法依微生物DNA序列來檢定 Beta diversity (如上述:此指在不同人所含的微生物多樣性),可以看到不同嬰幼兒早期的beta微生物多樣性,而這beta微生物多樣性會隨著年紀而逐漸減少 (下圖, 藍色點往左下角移動)。而嬰兒早期的主要腸道微生物是比菲德氏菌 (Bifidobacterium longum, B breve, B bifidum) 和變形菌 (Proteobacteria)。

D

比較健康對照組和疾病組的腸道微生物差別,發現和血清抗體轉換組比較時,健康對照組有較高的 Lactobacillus rhamnosus,支持早期益生菌補充可保護嬰幼兒不產生對抗胰腺小島的自體免疫抗體 (islet autoimmunity)。而相較於第一型糖尿病人的腸道微生物,健康對照組有較高的 Streptococcus thermophilesLactococcus lactis; 而第一型糖尿病人則含較多的 Bifidobacterium pseudocatenulatum, Roseburia hominis, 和Alistipes shahii在功能上,健康對照組細菌的綜合發酵能力(fermentation)比較強,能夠增加短鏈脂肪酸 (short chain fatty acids, SCFAs)的產出:包括丁酸類 (butyrate)、乙酸類 (acetate)、和丙酸類 (propionate)。綜合先前許多動物實驗證據,和本研究的人體資料顯示:這些短鏈脂肪酸的產出,有助於減少第一型糖尿病的發生。

延伸閱讀:

  1. Stewart CJ et al. Temporal development of the gut microbiome in early childhood from the TEDDY study. Nature (2018) 562: 583-588.
  2. Vatanen T et al. The human gut microbiome in early-onset type 1 diabetes from the TEDDY study. Nature (2018) 562: 589-594.

生活方式比遺傳體質更能決定疾病的發生

 

長庚大學教授 林口長庚醫院 婦產部主治醫師 王子豪

人類基因體解碼18年了,現在大多數人都能接受「人類基因體數據可以影響疾病發生」的觀念,有些人甚至會認為:記載於生命之書(基因體)的遺傳體質決定了一切。因此,當接受了各種基因體檢測- 例如在美國很盛行的直接消費者基因檢測 (direct-to-consumer genetic tests),如果拿到的報告顯示體質良好的人,不免沾沾自喜;而報告若呈現好發多種重大疾病的人,則可能非常沮喪。然而今年的美國醫學會心臟學期刊 (JAMA Cardiology2018) 發表,對於糖尿病和多種心血管疾病,遺傳體質和生活方式 (lifestyle)是互相獨立又高度加成的因子。

 

Said等人分析英國生物資料庫 (UK Biobank)收集的339,003位無血源相關的白種人 (延伸閱讀1),將基因晶片獲得的單核酸多形性 (single nucleotide polymorphism, SNP)數據在各種心血管疾病和糖尿病中,根據現有的全基因體關聯研究 (genome-wide association study, GWAS) (參見TPMS網頁,新知分享2018-7-16)資料庫選出疾病特異相關的SNP,例如:冠狀動脈疾病就選用到169個SNP,心房顫動選用25個SNP,中風選用11個SNP,高血壓選用107個SNP,糖尿病則選用38個SNP。根據這些疾病特異相關的SNP,將受分析的人依照遺傳體質成三群: 低危險 (最低的五分之一, quintile 1)、中度危險 (位於中間的五分之二到四,quintiles 2-4)、和高危險群 (最高的五分之一, quintile 5);所以在不同疾病中,依遺傳體質分群所占的人數是不一樣的。本硏究再依照抽煙與否、身體質量指數 (body mass index, BMI)、和體力活動量 (physical activity)當指標,而分成理想 (ideal)、中間群 (intermediate)、和較差 (poor)的生活方式。值得注意的是,理想生活方式群的人數大約占20.3%,中間群大約占74.5%,而較差生活方式的則占5.2%。

 

首先,本研究並未偵測到遺傳體質和生活形態有特別的互動性 (specific interactions);意即,並未檢定出那種遺傳體質特別會導致不良的生活方式。接著,資料顯示遺傳體質決定發病機率的重要性,由高而低依序是: 心房顫動>冠狀動脈疾病>高血壓>中風 (下圖)。最有啟發意義的是,即使在高危險遺傳體質的人,只要保持良好的生活方式也可以大幅降低疾病的發生率。

a

 

生活方式影響疾病發生,在第二型糖尿病更是明顯 (下圖)。雖然高危險的遺傳體質大約會增加第二型糖尿病的兩倍發病率;但是即使在低危險和中危險遺傳體質的人,不良的生活方式更會增加高達10倍的發病機率。當然高危險遺傳體質和不良的生活方式會導致最高的發病率。

b

 

另一個發表於英國醫學期刊 (BMJ2018)的大規模族群研究,也顯示生活方式和遺傳體質可獨立地影響中風的發病率 (延伸閱讀2)。德國和英國的學者分析英國生物資料庫收集的306,473位40-73歲的歐洲白人,在追蹤七年中影響中風發生的因子。本硏究首先依據90個SNP所建構的多基因危險計分 (polygenic risk score)將30多萬受試者均分成三群:high、intermediate、low危險遺傳體質,每群約為102,200人 (下圖左)。再依照是否抽煙、規律運動、健康飲食當指標,而分成較差 (unfavorable)、中間群 (intermediate)、和較佳 (favorable)的生活方式 (下圖右)。分析結果顯示,高危險遺傳體質群發生了785位中風病人,高於低危險遺傳體質群所發生的589位中風病人。但是影響中風發生機率最大的還是生活方式,較差的生活方式會增加66%的中風發生率。

c

 

這些最新研究資料顯示,雖然從一誕生,遺傳就埋下了每個人對一些疾病的好發體質,但是決定最後是否真正發病,更重要的還是取決於我們的生活方式。傳統台語智慧所述的「隨(各)人顧生命」- 個人要管顧自己的健康,與精準醫學強調病人參與的重要性不謀而合 (參見TPMS網頁,新知分享2017-2-2)。


 

延伸閱讀:

  1. Said MA et al. Association of combined genetic and lifestyle risks with incident cardiovascular disease and diabetes in the UK Biobank study. JAMA Cardiology (2018) 3(8):1-10.
  2. Rutten-Jacobs LCA et al. Genetic risk, incident stroke, and the benefits of adhering to a healthy lifestyle: cohort study of 306473 UK Biobank participants. British Medical Journal (2018) 363: k4168.

 

轉移學習讓深度學習更逼近人工智慧

長庚大學教授 林口長庚醫院 婦產部主治醫師 王子豪

 

 

人類智慧累積的通則是:從以前的經驗領略出規則,再應用於解決新的問題。在資訊科學裡,將轉移學習(transfer learning)的概念應用於以神經網路(neural networks)為骨幹的深度學習(deep learning),讓人工智慧(artificial intelligence, AI)更有效率。最近幾年在醫學影像的人工智慧判讀,已獲得重大成果。

 

轉移學習應用的原則 (延伸閱讀一),是從一個巨大但比較鬆散相關的數據集(datasets)-例如有1,200,000圖片、涵蓋1000個分類項目的ImageNet,找出特徵提取(feature extraction)的通則(圖一,上半部);再用所獲得的通則來訓練神經網路的上層(圖一,下半部),典型的例子就如2016年Szegedy發表的Inceptrion-v3 network (延伸閱讀二)。最近兩年被成功應用的分析流程(延伸閱讀三~),就先從一個超大型的數據集操作神經網路分析,以提取特徵,再將這些特徵以轉移學習應用於其他任務。用這個策畧獲得最大的好處是:可以應用於較小型的數據集,例如,大部分的醫學數據集都不可能大到上百萬筆數據。

1

Google團隊和醫學中心合作,用深度學習來偵測糖尿病視網膜病變,發表在2016年的JAMA (延伸閱讀三)。第一個EyePACS-1數據集包含4,997病人的9,963影像數據(圖二A),第二個Messidor-2數據集包含874病人的1,748影像數據(圖二A)。用ROC (receiver operating characteristics) curve評估分析的效率分別可以達到AUC (area under the curve, 此數值越高、越趨近於1越好) 0.991 和0.990。這篇論文的結果,提供了非常優異的原理驗證(proof of principle)。

2

 

運用一樣的轉移學習策略(圖三上半),史丹福大學團隊利用深度卷積神經網路(deep convolutional neural networks, deep CNNs),以影像來診斷皮膚疾病,發表在2017年的Nature。作者從頭到尾,直接以影像來訓練機器學習演算法,只喂以含2,032不同疾病的129,450臨床影像的像素(pixels)和疾病標誌(disease labels) (圖三下半) ;接下來和21位皮膚科專科醫師比較對下列兩種疾病的診斷率: 角質形成細胞癌 (keratinocyte carcinoma,最常見的皮膚癌)和惡性黑色素瘤(malignant melanoma,最惡性的皮膚癌)。結果電腦演算法和皮膚科專科醫師的診斷率一樣好,不分上下(延伸閱讀四)。

3

 

在疾病診斷和偵測上,將轉移學習策略發揮的淋漓盡致的(圖四),當屬2018年發表於Cell的論文(延伸閱讀五)。張康(Kang Zhang, MD., PhD.)教授領導的跨國團隊分析光學同調斷層掃描(optical coherence tomography)數據集,在偵測眼科急症轉診的適應症上,意即:出現脈絡膜新生血管(choroidal neovascularization, CNV)和糖尿病黃斑水腫(diabetic macular edema, DME),用ROC curve評估效率時,可達到AUC 0.999 (圖五A);而分析小兒肺炎胸部X光影像數據集,能夠鑑定出細菌性肺炎的效率也可達AUC 0.94 (圖五B)

4

 

 

5

延伸閱讀:

  1. Rampasek L and Goldenberg A. Learning from everyday images enables expert-like diagnosis of retinal diseases. Cell (2018) 172: 893-895.
  2. Szegedy C et al. Rethinking the inception architecture for computer vision. In 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), pp. 2818-2826.
  3. Gulshan V et al. Development and validation of a deep learning algorithm for detection of diabetic retinopathy in retinal fundus photographs. JAMA (2016) 316: 2401-2410.
  4. Esteva A et al. Dermatologist-level classification of skin cancer with deep neural networks. Nature (2017) 542: 115-118.
  5. Kermany DS et al. Identifying medical diagnoses and treatable diseases by image-based deep learning. Cell (2018) 172: 1122-1131.