1. 稀釋性曲線(Rarefaction Curve)采用對測序序列進(jìn)行隨機(jī)抽樣的方法,以抽到的序列數(shù)與它們所能代表OTU的數(shù)目構(gòu)建曲線,即稀釋性曲線。
當(dāng)曲線趨于平坦時,說明測序數(shù)據(jù)量合理,更多的數(shù)據(jù)量對發(fā)現(xiàn)新OTU的邊際貢獻(xiàn)很?。环粗畡t表明繼續(xù)測序還可能產(chǎn)生較多新的OTU。

橫軸:從某個樣品中隨機(jī)抽取的測序條數(shù);"Label 0.03"
表示該分析是基于OTU 序列差異水平在0.03,即相似度為97% 的水平上進(jìn)行運(yùn)算的,客戶可以選取其他不同的相似度水平。
縱軸:基于該測序條數(shù)能構(gòu)建的OTU數(shù)量。
曲線解讀:
? 圖1中每條曲線代表一個樣品,用不同顏色標(biāo)記;
? 隨測序深度增加,被發(fā)現(xiàn)OTU 的數(shù)量增加。當(dāng)曲線趨于平緩時表示此時的測序數(shù)據(jù)量較為合理。
2. Shannon-Wiener
曲線
反映樣品中微生物多樣性的指數(shù),利用各樣品的測序量在不同測序深度時的微生物多樣性指數(shù)構(gòu)建曲線,以此反映各樣本在不同測序數(shù)量時的微生物多樣性。
當(dāng)曲線趨向平坦時,說明測序數(shù)據(jù)量足夠大,可以反映樣品中絕大多數(shù)的微生物物種信息。

橫軸:從某個樣品中隨機(jī)抽取的測序條數(shù)。
縱軸:Shannon-Wiener 指數(shù),用來估算群落多樣性的高低。
Shannon 指數(shù)計(jì)算公式:
其中,
Sobs= 實(shí)際測量出的OTU數(shù)目;
ni= 含有i 條序列的OTU數(shù)目;
N = 所有的序列數(shù)。
曲線解讀:
? 圖2每條曲線代表一個樣品,用不同顏色標(biāo)記,末端數(shù)字為實(shí)際測序條數(shù);
? 起初曲線直線上升,是由于測序條數(shù)遠(yuǎn)不足覆蓋樣品導(dǎo)致;
? 數(shù)值升高直至平滑說明測序條數(shù)足以覆蓋樣品中的大部分微生物。
3.Rank-Abundance
曲線
用于同時解釋樣品多樣性的兩個方面,即樣品所含物種的豐富程度和均勻程度。
物種的豐富程度由曲線在橫軸上的長度來反映,曲線越寬,表示物種的組成越豐富;
物種組成的均勻程度由曲線的形狀來反映,曲線越平坦,表示物種組成的均勻程度越高。

橫軸:OTU 相對豐度含量等級降序排列。
縱軸:相對豐度比例。
曲線解讀:
? 圖3與圖4中每條曲線對應(yīng)一個樣本(參考右上角圖標(biāo));
? 圖3與圖4中橫坐標(biāo)表示的是OTU(物種)豐度排列順序,縱坐標(biāo)對應(yīng)的是OTU(物種)所占相對豐度比例(圖3為相對百分比例,圖4為換算后Log值),曲線趨于水平則表示樣品中各物種所占比例相似;曲線整體斜率越大則表示樣品中各物種所占比例差異較大。
4. 樣本群落組成分析:多樣本柱狀圖/
單樣本餅狀圖
根據(jù)分類學(xué)分析結(jié)果,可以得知一個或多個樣品在各分類水平上的物種組成比例情況,反映樣品在不同分類學(xué)水平上的群落結(jié)構(gòu)。

柱狀圖(圖5)
橫軸:各樣品的編號。
縱軸:相對豐度比例。
圖標(biāo)解讀:
? 顏色對應(yīng)此分類學(xué)水平下各物種名稱,不同色塊寬度表示不同物種相對豐度比例;
? 可以在不同分類學(xué)水平下作圖分析。
餅狀圖(圖6)
在某一分類學(xué)水平上,不同菌群所占的相對豐度比例。不同顏色代表不同的物種。
5. 樣品OTU 分布Venn 圖
用于統(tǒng)計(jì)多個樣品中共有或獨(dú)有的OTU數(shù)目,可以比較直觀地表現(xiàn)各環(huán)境樣品之間的OTU 組成相似程度。
不同樣品用不同顏色標(biāo)記,各個數(shù)字代表了某個樣品獨(dú)有或幾種樣品共有的OTU 數(shù)量,對應(yīng)的OTU編號會以EXCEL 表的形式在結(jié)題報(bào)告中呈現(xiàn)。

分析要求
單張分析圖,樣本分組至少兩個,最多5 個。
? 默認(rèn)設(shè)置為97% 相似度水平下以O(shè)TU 為單位進(jìn)行分析作圖。
6. Heatmap 圖
用顏色變化來反映二維矩陣或表格中的數(shù)據(jù)信息,它可以直觀地將數(shù)據(jù)值的大小以定義的顏色深淺表示出來。將高豐度和低豐度的物種分塊聚集,通過顏色梯度及相似程度來反映多個樣品在各分類水平上群落組成的相似性和差異性。

相對豐度比例:
熱圖(圖8)中每小格代表其所在樣品中某個OTU 的相對豐度。以圖8為例,紅框高亮的小格所對應(yīng)的信息為:樣本(R11-1Z)中OTU(OTU128)的相對豐度比例大概為0.2%。
豐度比例計(jì)算公式(Bray Curtis 算法):

其中,
SA,i = 表示A樣品中第i個OTU所含的序列數(shù)
SB,i = 表示B樣品中第i個OTU所含的序列數(shù)
樣品間聚類關(guān)系樹:
進(jìn)化樹表示在選用成圖數(shù)據(jù)中,樣本與樣本間序列的進(jìn)化關(guān)系(差異關(guān)系)。處于同一分支內(nèi)的樣品序列進(jìn)化關(guān)系相近。
物種/OTU 豐度相似性樹:
豐度相似性樹表示選用成圖的數(shù)據(jù)中樣品與樣品中的OTU 或序列在豐度上的相似程度。豐度最相近的會分配到同一分支上。
客戶自定義分組:根據(jù)研究需求對菌群物種/OTU 研究樣本進(jìn)行二級分組
? 二級物種/OTU 分組:將下級分類學(xué)水平物種或OTU 分配到對應(yīng)的上級分類學(xué)水平,以不同顏色區(qū)分;
? 二級樣品分組:根據(jù)研究需要,對樣品進(jìn)行人為的分組,以不同顏色區(qū)分。
7. 主成分分析PCA (Principal Component Analysis)
在多元統(tǒng)計(jì)分析中,主成分分析是一種簡化數(shù)據(jù)集的技術(shù)。主成分分析經(jīng)常用于減少數(shù)據(jù)集的維數(shù),同時保持?jǐn)?shù)據(jù)集中對方差貢獻(xiàn)最大的特征,從而有效地找出數(shù)據(jù)中最“主要”的元素和結(jié)構(gòu),去除噪音和冗余,將原有的復(fù)雜數(shù)據(jù)降維,揭示隱藏在復(fù)雜數(shù)據(jù)背后的簡單結(jié)構(gòu)。
通過分析不同樣品的OTU 組成可以反映樣品間的差異和距離,PCA 運(yùn)用方差分解,將多組數(shù)據(jù)的差異反映在二維坐標(biāo)圖上,坐標(biāo)軸為能夠最大程度反映方差的兩個特征值。如樣品組成越相似,反映在PCA圖中的距離越近。

橫軸和縱軸:以百分?jǐn)?shù)的形式體現(xiàn)主成分主要影響程度。以圖9為例,主成分1(PC1)和主成分2(PC2)是造成四組樣品(紅色,藍(lán)色,黃色和綠色)的兩個最大差異特征,貢獻(xiàn)率分別為41.1% 和27.1%。
十字交叉線:在圖9中作為0 點(diǎn)基線存在,起到輔助分析的作用,本身沒有意義。
圖例解讀:
? PCA 分析圖是基于每個樣品中所含有的全部OTU 完成的;
? 圖9中每個點(diǎn)代表了一個樣本;顏色則代表不同的樣品分組;
? 兩點(diǎn)之間在橫、縱坐標(biāo)上的距離,代表了樣品受主成分(PC1 或 PC2)影響下的相似性距離;
? 樣本數(shù)量越多,該分析意義越大;反之樣本數(shù)量過少,會產(chǎn)生個體差異,導(dǎo)致PCA分析成圖后形成較大距離的分開,建議多組樣品時,每組不少于5個,不分組時樣品不少于10個;
? 圖10中的圓圈為聚類分析結(jié)果,圓圈內(nèi)的樣品,其相似距離比較接近。
8. RDA/ CCA
分析圖
基于對應(yīng)分析發(fā)展的一種排序方法,將對應(yīng)分析與多元回歸分析相結(jié)合,每一步計(jì)算均與環(huán)境因子進(jìn)行回歸,又稱多元直接梯度分析。主要用來反映菌群與環(huán)境因子之間的關(guān)系。RDA 是基于線性模型,CCA是基于單峰模型。分析可以檢測環(huán)境因子、樣品、菌群三者之間的關(guān)系或者兩兩之間的關(guān)系。

橫軸和縱軸:RDA 和CCA 分析,模型不同,橫縱坐標(biāo)上的刻度為每個樣品或者物種在與環(huán)境因子進(jìn)行回歸分析計(jì)算時產(chǎn)生的值,可以繪制于二維圖形中。
圖例解讀:
? 冗余分析可以基于所有樣品的OTU作圖,也可以基于樣品中優(yōu)勢物種作圖;
? 箭頭射線:圖11中的箭頭分別代表不同的環(huán)境因子(即圖中的碳酸氫根離子HCO3-,醋酸根離子AC-等,圖中的其它環(huán)境因子因研究不同代表的意義不同,因此不再贅述);
? 夾角:環(huán)境因子之間的夾角為銳角時表示兩個環(huán)境因子之間呈正相關(guān)關(guān)系,鈍角時呈負(fù)相關(guān)關(guān)系。環(huán)境因子的射線越長,說明該影響因子的影響程度越大;
? 圖11中不同顏色的點(diǎn)表示不同組別的樣品或者同一組別不同時期的樣品,圖中的拉丁文代表物種名稱,可以將關(guān)注的優(yōu)勢物種也納入圖中;
? 環(huán)境因子數(shù)量要少于樣本數(shù)量,同時在分析時,需要提供環(huán)境因子的數(shù)據(jù),比如 pH值,測定的溫度值等。
9. 單樣品/ 多樣品分類學(xué)系統(tǒng)組成樹
根據(jù)NCBI 提供的已有微生物物種的分類學(xué)信息數(shù)據(jù)庫,將測序得到的物種豐度信息回歸至數(shù)據(jù)庫的分類學(xué)系統(tǒng)關(guān)系樹中,從整個分類系統(tǒng)上全面了解樣品中所有微生物的進(jìn)化關(guān)系和豐度差異。

單樣品圖(圖12):可以了解單樣品中的序列在各個分類學(xué)水平上的分布情況。

圖例解讀:
? 圖12中不同的層次反映不同的分類學(xué)水平;
? 分支處的圓面積說明了分布在該分類學(xué)水平,且無法繼續(xù)往下級水平比對的序列數(shù)量,面積越大,說明此類序列越多;
? 每個分支上的名詞后面的兩組數(shù)字分別表示比對到該分支上的序列數(shù)和駐留在該節(jié)點(diǎn)上的序列數(shù);
? 圖13中為某單一水平物種分布情況,并非是序列分布。

多樣品圖(圖14):比對多個樣品在不同分類學(xué)分支上序列數(shù)量差異。
圖例解讀:
? 比對不同樣品在某分支上的序列數(shù)量差異,通過帶顏色的餅狀圖呈現(xiàn),餅狀圖的面積越大,說明在分支處的序列數(shù)量越多,不同的顏色代表不同的樣品。
? 某顏色的扇形面積越大,說明在該分支上,其對應(yīng)樣品的序列數(shù)比其他樣品多。
? 多樣品在做該分析時,建議樣品數(shù)量控制在10個以內(nèi),或者將重復(fù)樣本數(shù)據(jù)合并成一個樣本后,總樣品數(shù)在10個以內(nèi)。
10.系統(tǒng)發(fā)生進(jìn)化樹
在分子進(jìn)化研究中,基于系統(tǒng)發(fā)生的推斷來揭示某一分類水平上序列間堿基的差異,進(jìn)而構(gòu)建進(jìn)化樹。

圖例解讀:
? 圖15中體現(xiàn)的是序列進(jìn)化差異情況,處在同一分支上的物種說明進(jìn)化關(guān)系較近。
? 圖15左下角的圖例為距離標(biāo)尺,分支距離越長,進(jìn)化關(guān)系越遠(yuǎn)。
11. (un)Weighted UniFrac PCoA/Tree 分析
利用各樣品序列間的進(jìn)化信息來計(jì)算樣品間距離,反映環(huán)境樣品在進(jìn)化樹中是否有顯著的微生物群落差異。
PCoA(principal co-ordinates analysis)是一種研究數(shù)據(jù)相似性或差異性的可視化方法,通過一系列的特征值和特征向量進(jìn)行排序后,選擇主要排在前幾位的特征值,PCoA 可以找到 距離矩陣中最主要的坐標(biāo),結(jié)果是數(shù)據(jù)矩陣的一個旋轉(zhuǎn),它沒有改變樣品點(diǎn)之間的相互位置關(guān)系,只是改變了坐標(biāo)系統(tǒng)。通過PCoA 可以觀察個體或群體間的差異。

圖例解讀:
? 圖16和圖17中不同顏色代表不同分組;
? PCoA 分析建議不分組時,樣本數(shù)量不少于10 個;多組樣本時,每組樣本數(shù)量不少于5 個;
? 對于某一功能基因,進(jìn)行進(jìn)化樹分析時,建議采用OTU數(shù)目控制在10,000以內(nèi),或者由客戶指定分析優(yōu)勢OTU個數(shù)。
12. NMDS 分析
NMDS(Nonmetric Multidimensional Scaling)常用于比對樣本組之間的差異,可以基于進(jìn)化關(guān)系或數(shù)量距離矩陣。
橫軸和縱軸:表示基于進(jìn)化或者數(shù)量距離矩陣的數(shù)值在二維表中成圖。

圖例解讀:
? 圖18中不同的顏色代表不同的分組;
? 建議不分組時,樣本數(shù)量不少于10個;多組樣本時,每組樣本數(shù)量不少于5個;
? 圖18中的點(diǎn)代表樣本,點(diǎn)與點(diǎn)之間的距離表示差異程度。
13. 含相似性樹柱狀圖
根據(jù)樣品中相似程度進(jìn)行排布,并繪制對應(yīng)樣本樹狀圖反映樣本中群落結(jié)構(gòu)。

圖例解讀:
? 圖19中左側(cè)是相似度樹狀圖,樣本之間的差異越小,樣本便會處在相近的同一分支上;
? 右側(cè)柱狀圖,展示樣本中微生物的群落結(jié)構(gòu)。不同顏色代表不同物種。
14.Unifrac 顯著性差異分析
比較樣品間進(jìn)化差異的顯著性分析。

圖例解讀:
? 圖20橫坐標(biāo)為兩組樣品;
? 縱軸坐標(biāo)為unifrac 進(jìn)化距離(序列差異)。
15. 單因素unweighted unifrac PCA 分析
在某單一因素上,進(jìn)行unweighted unifrac PCA 分析。

圖例解讀:
? 圖21橫軸為不同變量(本例為不同年齡階段)下的樣本;
? 縱坐標(biāo)為主成分,圖21中顯示同一年齡階段內(nèi)和不同年齡階段間的由主成分導(dǎo)致的差異情況。
16.
個性化分析案例展示
案例描述一
Community composition of
root-associated fungi in a Quercus-dominated temperate
forest:"codominance" of mycorrhizal and root-endophytic fungi. Ecol
Evol. 2013 May; 3(5):1281-93.
樣本來源 | 樣本數(shù)量 | 高變區(qū) | 測序平臺 | 測序量(reads) |
植物根系/ 泥土 | 159/38 | ITS | Roche GS | 70,495 |
樣本來自于以日本橡木為主的溫帶森林,使用454 測序分析多個生態(tài)系統(tǒng)的真菌多樣性。樣品來源為植物根系樣本,從12 株植物中提取了159 份根系。分析結(jié)果表明,外生真菌群落和根系內(nèi)生真菌群落互相作用,維持了這種以日本橡木為主的溫帶森林的生態(tài)環(huán)境。

圖例解讀:
? 圖22構(gòu)建了地下植物與真菌的相互關(guān)系網(wǎng)絡(luò);
? 圖22中灰色圓點(diǎn)表示與植物共生的微生物物種,菱形代表真菌OTU,它們之間的關(guān)系用灰色連接線表示;
? 它們之間的密集程度越高表示它們之間相互作用被觀察的次數(shù)越多;
? 互利共生真菌OTU 用粉色菱形表示;寄生微生物OTU用橘色菱形表示;未知功能OTU用藍(lán)色菱形表示;
? A:子囊真菌門;B:擔(dān)子菌門;G:球囊菌門;U:表示門水平未知真菌。
案例描述二
The ignored diversity: complex bacterial communities in intensive care units revealed by 16S pyrosequencing. Sci Rep.
2013;3:1413.
室內(nèi)微生物群落對日常生活中人類健康起著重要作用,尤其是醫(yī)院的重癥監(jiān)護(hù)室。采用擴(kuò)增焦磷酸測序研究ICU 中微生物群落可以檢測多種微生物序列,與現(xiàn)有的傳統(tǒng)標(biāo)準(zhǔn)培養(yǎng)技術(shù)相比,有極大的優(yōu)越性。
傳統(tǒng)培養(yǎng)方式只能檢測總細(xì)菌多樣性的2.5%。結(jié)合外部環(huán)境與物種系統(tǒng)發(fā)育譜分析發(fā)現(xiàn),許多微生物與潛在的人類病原菌相關(guān),當(dāng)然也包含有益菌,一共7 個門76 個屬。此外,丙酸桿菌屬,假單孢菌屬和伯克霍爾德氏菌被確定為感染的重要來源。在地板,醫(yī)療器械和工作間微生物組成有顯著差異,但網(wǎng)絡(luò)分析和一致性分子指紋印記分析發(fā)現(xiàn)該三個地點(diǎn)微生物組成也有一定的相似性。這些信息將幫助加護(hù)病房進(jìn)行新的公共衛(wèi)生風(fēng)險(xiǎn)評估,幫助建立新的衛(wèi)生協(xié)議,幫助深入了解醫(yī)院獲得性感染的情況。
樣本來源 | 樣本數(shù)量 | 高變區(qū) | 測序平臺 | 測序量(reads) |
重癥監(jiān)護(hù)室(ICU)中地板,醫(yī)療設(shè)備及工作間表面樣品 | 34 | 16S rRNA | Roche 454 FLX+ | 5000/樣本 |

圖23為豐度最高的40 種菌(OTU) 在不同采樣區(qū)域的分布情況。不同顏色代表不同樣本來源,綠色為ICU 地板,紅色為醫(yī)療設(shè)備,藍(lán)色為工作間。結(jié)點(diǎn)面積表示該OTU 在三個采樣區(qū)域之間的相對豐度。
案例描述三
Skin Microbiome Imbalance in Patients with STAT1/STAT3 Defects Impairs Innate Host Defense Responses. Journal of
Innate Immunity. 2013, DOI: 10.1159/000351912.
CMC和HIES均屬于罕見的原發(fā)性免疫缺陷病。本文研究了CMC和HIES病人皮膚及口腔微生物與正常人群的微生物菌群差異。結(jié)果表明,相比正常人體的微生物組成(主要包括棒桿菌屬和放線菌科等),病人的所攜帶的微生物中革蘭氏陰性菌比例增加。而革蘭氏陰性菌(如不動桿菌屬)可以抑制機(jī)體對假絲酵母和金色葡萄球菌的免疫反應(yīng),結(jié)果很可能導(dǎo)致患者對這些菌感染的敏感性增加。本文的研究表明,此類免疫缺陷病人所攜帶的微生物菌群可以影響宿主的免疫防御系統(tǒng),進(jìn)而有可能通過基于微生物的輔助療法來治療免疫缺陷的患者。
樣本來源 | 樣本數(shù)量 | 高變區(qū) | 測序平臺 | 測序量(reads) |
慢性皮膚黏膜念珠菌?。–MC)、高IgE綜合癥(HIES)患者皮膚及口腔微生物 | 60 | 16S rRNA V4區(qū) | MiSeq | 6389/樣 本 |

圖24 為免疫缺陷疾病各亞型患者皮膚和口腔微生物群落結(jié)構(gòu)的協(xié)方差。(a)圖表示35個皮膚樣本的微生物多樣性的差異;(b)圖表示21個口腔樣本微生物多樣性差異。其中,綠色方塊表示健康對照組,紅色圓圈表示CMC,藍(lán)色三角形表示HIES。健康人體皮膚表面的微生物主要包括葡萄球菌和棒狀桿菌,而疾病組多為莫拉菌科。
? Aleksandar D. Kostic, Dirk Gevers, et al. Genomic analysis identifies association of Fusobacterium with
colorectal carcinoma. Genome Research, 2012, 22:292–298.
? Chiachi Hwang, Fangqiong Ling, et al. Microbial community dynamics of an urban drinking water
distribution system subjected to phases of chloramination and chlorination treatments. Microbiol,
2012, 78(22):7856.
? Craig E. Nelson, Stuart J. Goldberg, et al. Coral and macroalgal exudates vary in neutral sugar
composition and differentially enrich reef bacterioplankton lineages. The ISME Journal, 2013, 7:962–979.
? Elie Jami, Adi Israel, et al. Exploring the bovine rumen bacterial community from birth to adulthood.
The ISME Journal, 2013. 2:1–11.
? Erik C von Rosenvinge, Yang Song, et al. Immune status, antibiotic medication and pH are associated
with changes in the stomach fluid microbiota. The ISME Journal, 2013. 33:1–13.
? Krissi M. Hewitt, Charles P. Gerba, et al. Office space bacterial abundance and diversity in three metro
politan Areas. PLoS ONE, 2012, 7(5):e37849.
? Sizhong Yang, Xi Wen, et al. Pyrosequencing investigation into the bacterial community in permafrost
soils along the China-Russia crude oil pipeline (CRCOP). PLoS ONE, 2012, 7(12):e52730.
? Vasvi Chaudhry, Ateequr Rehman, et al. Changes in bacterial community structure of agricultural land
due to long-term organic and chemical amendments. Microb Ecol, 2012, 64:450-460.
? Weiguang Chen, Fanlong Liu, et al. Human intestinal lumen and mucosa-associated microbiota in
patients with colorectal cancer. PLoS ONE, 2012, 7(6):e39743.
? Katherine R Amato, Carl J Yeoman, et al. Habitat degradation impacts black howler monkey (Alouatta
pigra) gastrointestinal microbiomes. The ISME Journal, 2013, 7: 1344–1353.
? Kabir G Peay, Christopher Baraloto, et al. Strong coupling of plant and fungal community structure across
western Amazonian rainforests. The ISME Journal, 2013, 7: 1852–1861.
? Dagne Duguma, Paul Rugman-Jones, et al. Bacterial communities associated with culex mosquito larvae and
two emergent aquatic plants of bioremediation importance. PLoS ONE, 2013, 8(8): e72522.
? Coolon JD, Jones KL, et al. Long-term nitrogen amendment alters the diversity and assemblage of soil
bacterial communities in tallgrass prairie. PLoS One. 2013, 8(6): e67884.
? Zhao J, Schloss PD, et al. Decade-long bacterial community dynamics in cystic fibrosis airways. Proc Natl
Acad Sci USA, 2012, 109(15):5809-5814.
? Bo Liu, Lina L. Faller, Niels Klitgord, et al. Deep Sequencing of the Oral Microbiome Reveals Signatures of
Periodontal Disease. PLoS ONE, 2012, 7(6): e37919.
? Baldrian P, Kola?ík M, Stursová M, et al. Active and total microbial communities in forest soil are largely
different and highly stratified during decomposition. The ISME Journal, 2012, 6(2):248-258.
? Scott T Bates, Jose C Clemente, Gilberto E Flores. Et al. Global biogeography of highly diverse protistan
communities in soil. The ISME Journal, 2013, 7: 652–659.