SARS-CoV2 的源起: Part 1
每當一種新的疾病出現時,我們都會很自然地問說 ”這個疾病到底是從哪裡來的?” 在這篇貼文當中,我們將討論 SARS-CoV2 的起源以及它是藉由怎樣的媒介進入到人們的生活中。
每當有新興病原體出現在人類社會時,總會出現相對應的陰謀論來猜測這些新物種的起源。在Part 1 的文章中,我們將在提供證據 (文獻) 支持的前提之下來探討這樣的新物種是如何出現在人群中;而在Part 2,我們將更進一步的討論與剖析為何這樣的病毒可以如此有效率的造成人類的感染,最後,在Part 3,我們將會一併彙整與討論所有的訊息內容且利用它們來揭露有關於 SARS-CoV2 的陰謀論。
在這邊呢,我們先嘗試著回答第一個 – 也是最重要的問題:SARS-CoV2 最有可能的起源是什麼?;但在這之前我們先需要了解一些簡單的背景小常識,才能幫我們正確地回答這個問題。
動物與突變病毒
此圖描述了人畜共通的疾病是如何經由不同的媒介來達成傳播 (courtesy of the WHO).
據估計,約有百分之75的人類新興病毒是源自於人畜共通的疾病;所謂“人畜共通”指的是動物傳播給人類的疾病 (見上圖)。在動物中,每種動物的身上都帶有屬於自己的特定微生物群集 – 像是病毒、細菌、寄生蟲等等之類的微生物 – 而且這些微生物能夠輕易地感染該動物。
舉個例子來說好了,像是猿猴免疫缺乏病毒 (Simian immunodeficiency virus of chimpanzees, SIVcpz) 能夠容易地感染它的宿主- 黑猩猩;但如果用它來感染小鼠的話就會變得很困難。科學家同時也發現 SIVcpz 其實也很難對人類造成感染,但在演化上的證據卻認為它是人類免疫缺陷病毒 (HIV-1) 的前身;那 SIVcpz 是如何跨越物種間屏障來演化變成HIV-1 感染人類呢? - 在感染人類的過程中,SIVcpz 不斷地透過 (基因) 突變的方式來最佳化與適應自己在人類細胞中的生長,目的是要讓自己具有跟在黑猩猩中一樣好的生長能力,直到最後演化成另一種病毒- 也就是 HIV. 所以了解什麼是人畜共通疾病以及突變的過程對於理解 SARS-CoV2 的起源是尤其重要的。
微生物是為了它們所感染的動物而生的,這是微生物針對不同物種的宿主量身訂製 (最佳化) 後的結果;要記住的一點是,在自然界中,所謂量身訂製的感染並不是有預謀性的或是深思熟慮後的策略。取而代之的很土炮且沒效率的方式- 就是大量的做做做!,這些微生物在其生活史中進行遺傳物質的複製時會快速地產生成千上萬個不同的版本,而每個版本之間會有一點細微的差異存在 (就是QC很差的意思啦),這些差異大部分對於微生物在宿主體生存並沒有實質上的幫助,有些差異甚至還會不利於微生物的生存;但最終剩下的那一小部分,其中有一些差異卻是有利於微生物的繁衍,這時,微生物就會死抓的這版本不放 (當然啊),大量地複製這個版本而增加了自己的生存的優勢- 這個過程就是我們所謂的天擇 (Natural selection) 。病毒藉由非常快速但草率 (指的是在複製遺傳物質上常常會犯錯而產生突變) 的方式來複製 (replicate, 也就是產生更多的病毒) 自己,雖然是會出錯,但也因為這樣才能夠獲取有利於生長的突變,而在與其他病毒競爭的過程中得到優勢。
從上圖我們可以看到一個一開始最初的病毒族群 (Initial population),這個族群的數目很少而且多樣性 (種類) 的程度很低 (以不同的顏色來表示);隨著這些病毒開始複製- 開始產生突變,病毒總數的增加也同時造成多樣性的激增 (Expanded population)。而在下一張圖片我們可以發現,某些原因給了橘色病毒在生長上的優勢 (例如說感染了一個新的物種);在這樣的狀況之下,橘色的病毒能接管整個族群並成為優勢種。族群的擴增以及對於外在環境所反映的選擇,這兩者對於病毒的演化扮演著不可或缺的元素。
大部份的我們了解所謂物競天擇的這樣一個概念,但要強調是,病毒本身經由隨機突變來達到適應環境的這個過程 - 也同時給了我們一個很好的起始點來找尋病毒的根源。我們能藉由系統性地分析 SARS-CoV2 的 RNA 基因圖譜,找到與起源相關的蛛絲馬跡;也就是指,在這病毒演化的過程中 – 正所謂凡走過必留下的痕跡,這隻病毒從哪裡來、到過哪以及感染過哪些不同類別的宿主,都會在其基因圖譜中留下特徵與線索。
第一條線索
在首宗 SARS-Cov2 的病例被發現之前,我們已知有四種感染人類的病毒屬於乙型冠狀病毒屬 (Betacoronavirus, SARS-CoV2 也被加入其中);前兩種病毒,即 HKU1 與 OC43,能夠引起普通的感冒症狀。另外兩個 SARS-CoV 與 MERS-CoV 則為極度致命的病毒也曾經爆發過嚴重疫情 (但不是全球性的)。
左- 2003年SARS首次爆發疫情期間的新聞頭條。右- MERS 首次出現時的新聞標題。直到今天,由駱駝向人類的外溢傳播仍持續發生。
2019年的12月31日,中國政府回報了中國武漢市發生的一系列病毒性肺炎病例。其中的許多病例都與華南海鮮批發市場有關;人們首先擔心的是,會不會是 SARS-CoV又回來了,還是一個從沒看過且致命的流感病毒株正在不斷地傳播。不到一週的時間,中國的科學家已經將這個病毒分離出來並提供了全世界該病毒的完整基因序列;我們了解到這個病毒不是 SARS-CoV ,而是一種新型冠狀病毒,最初它被命名為 nCoV-2019。
此時,全世界對於這病毒只瞭解了三件事:
可能引起致命的病毒性肺炎
與SARS-CoV 有著高度相關性
有很大部分的病例-但不是全部,都與華南海鮮批發市場有所關聯
最初從 SARS-CoV 疫情爆發時所進行的研究指出,該病毒傳播給人類之前,很有可能是透過中間宿主- 果子貍 (masked palm civet, 又稱白鼻心) 的方式才從蹄鼻蝙蝠 (horseshoe bat, Rhinolophus affinis) 傳播到人類身上;因此,科學家推測 nCoV-2019(aka SARS-CoV2)也可能從蝙蝠傳播到人類,可能是在過程中透過不同的中間宿主。
雖然看起來這是一個蠻威的假設齁,但這畢竟是科學!- 我們仍需要想出辦法來驗證我們的想法,所以就衍伸出了另一個很重要的問題,那就是我們要如何確定病毒的來源咧?
病毒偵探所使用的工具
找尋病毒的起源是令人相當振奮一件事,如同福爾摩斯啦、名偵探柯南或是金田一他們在面對案件時,會不斷地藉由邏輯性推理與演繹來試圖找出結果…畢竟真相只有一個 !(XD)。身為一個病毒偵探,一開始我們必須盡可能收集大量的數據與證據,遺憾的是,我們往往很難找到直接確鑿的證據來支持;只能採用歸納推理的方式來對於我們沒有直接觀察到事物得到結論。
所以問題就來了,如果我們沒有辦法即時地“看到”病毒第一次跳到人類身上,那我們要怎麼去找尋它的來源呢?我們可以用最傳統類似於 23andMe 或是 Ancestry 這些服務的方式- 也就是透過病毒的基因序列的分析來了解它的祖先是誰。(23andMe 與 Ancestry 都是美國的生技公司,能提供個人基因的朔源檢測的服務- 找出你的祖先是誰、從哪裡來、你擁有怎樣的血統)。
請記住,當病毒在複製自己的過程中是會出錯的 - 也就是會產生突變,其中有些突變對病毒是有害的,帶有這些突變的病毒最終將無法成功地繁衍下去最後消失在群集中;有些突變對於病毒則是沒有影響,這種突變我們則稱為中性突變,相對地,也有突變能幫助病毒的大量複製。這邊要帶給大家的觀念是,同一個家族的病毒因為突變後所造成的差異可以被視為一種特徵,不同的特徵則顯示了病毒間的親緣關係,所以我們能藉由這些不同的特徵來建立出屬於這個病毒家族的族譜。
如上圖所示,其使用了是否有毛茸茸的尾巴、大耳朵或是鬍鬚來作為特徵,並經由繪製相關的特徵來追溯其最有可能的共同祖先 – 我們稱為這樣樹狀圖表為演化樹 (phylogenetic tree)。對於病毒的話我們的做法就稍微有點不同,我們首先會先病毒進行定序的動作- 也就是知道這些病毒在基因圖譜上每個位置的序列;接著我們會把每個病毒的序列兩兩放在一起,仔細地去比較在基因序列上的異同 – 這個過程我們稱作為序列比對 (sequence alignment)。
到底SARS-CoV2 的起源是什麼?
當 nCoV-2019 (現稱 SARS-CoV2) 從患者中被分離出來且定序後,科學家便把它的基因序列跟先前已經鑑定過的冠狀病毒進行序列比對。發現與 SARS-CoV2 親緣程度最高的是來自於蝙蝠的冠狀病毒 Bat CoV RaTG13,一種在蹄鼻蝙蝠身上所發現的冠狀病毒。
現在,讓我們來看看這些病毒在基因序列中最相似以及變異性最高的部份;我們先從 SARS-CoV2 序列開始看起。
稍微記住一下上面這張圖,因為會在接下來的內容使用到:
上圖 (PMID: 32015507) 是將不同的冠狀病毒與 SARS-CoV2 進行序列相似度分析後所得到的結果。我們可以發現,相較於其它不同的曲線,藍線 (Bat CoV RaTG13) 的分佈顯得非常不同;這是一種蝙蝠冠狀病毒,你可以發現它的整個基因組的核酸特異性 (Percentage of Nucleotide identity, 用來表示在基因序列上相同位置核苷酸的異同) 都落在 90-100%之間,這意味著當你把這個蝙蝠冠狀病毒 RaTG13 與 SARS-CoV2 放在一起來比較整個基因組的序列時,兩者在大部分的序列上是呈現高度相似的。相比之下,SARS-CoV (SARS-CoV BJ01, 紅色表示) 與 SARS-CoV2相比的結果則呈現徘迴在 50-60% 的一致性,表示說兩者仍有一定程度的關聯,但不如與蝙蝠冠狀病毒 RaTG13 那樣的相近。
我們再仔細看一下核酸特異性的分佈圖後可以發現,約在23,000核酸位置附近,所有病毒都呈現相似度急劇下將的趨勢,而這個區域正好是負責編譯突刺蛋白質 (spike protein) 的訊息;對於蝙蝠冠狀病毒 RaTG13 相對地則沒那麼明顯,但與基因組中的其他位置相比,它的下降幅度仍是最大的。
冠狀病毒表面的突刺蛋白質正是為什麼這些病毒被賦予冠狀這個形容詞的原因,下圖是 SARS-CoV2 病毒顆粒的影像;這些從病毒顆粒表面所形成的一個個小突出,看起來很像是太陽所形成的光暈一樣,是由病毒的突刺蛋白質所形成。這些蛋白質能讓病毒進入人體的細胞當中;其作用就像是一把特殊的鑰匙 – 也就是只能用來打開一把特定的鎖,而這把特定的鎖就是一個可以在體內細胞表面 (包括肺部細胞) 被發現的蛋白質 – 我們稱之為 ACE2。
圖ㄧ:穿透式電子顯微鏡所觀察到從患者身上分離出的 SARS-CoV2 病毒顆粒。Image captured and color-enhanced at the NIAID Integrated Research Facility (IRF) in Fort Detrick, Maryland. Credit: NIAID
圖二:藉由鑰匙 (突刺蛋白質, Spike protein) 與鎖 (ACE2) 的概念來解釋 SARS-CoV2 如何結合到細胞表面。Modified from BioRender.
有鑒於突刺蛋白質對於冠狀病毒的重要性,以及 RaTG13 與 SARS-CoV2 在編譯突刺蛋白質基因序列上的差異是極為重要的;科學家進一步找到了與 SARS-CoV2 在病毒突刺蛋白質中受器結合位 (receptor binding domain, RBD) 的這個區域,有著相似序列的唯一病毒,有趣的是,這隻病毒源自於馬來西亞穿山甲。
下面是另一張核酸特異性的分佈圖,但在這邊要比較相似度的對象則改為在馬來西亞穿山甲所發現的冠狀病毒;這邊我們要把重點放在以紅色表示的 SARS-CoV2 與以 綠色表示的蝙蝠冠狀病毒 RaTG13。
就如預期的一樣,我們可以看到紅色與綠色基本上是呈現高度吻合的趨勢,但突然間在某個特定的區間這兩者的分布則完全不同;下圖橘色網底的部分就是產生差異的區域,而且我們可以看到 SARS-CoV2 與穿山甲冠狀病毒在這個區域的序列有著高度的相似性。最最最重要的是!這個區域就是整個突刺蛋白質中最關鍵的受器結合位 (receptor binding domain, RBD)。
所以這一切意味著? 我們對於現階段的證據提出了假設 – 那就是穿山甲可能就是人跟蝙蝠之間的…中間宿主!
如果你還記得的話,先前我們提到果子貍是 SARS-CoV 的中間宿主;而對 SARS-CoV2 來說則可能為有鱗片的哺乳類動物 – 目前認為是穿山甲,但重點來了,我們發現穿山甲冠狀病毒與 SARS-CoV2 只有在受器結合位 (receptor binding domain, RBD) 的這個區域有著序列的相似度,但在其它基因組上的區域則呈現無法匹配的結果。這表示可能發生了病毒的基因重組,也就是說在演化的過程中,穿山甲冠狀病毒的部分基因序列被轉移到了蝙蝠冠狀病毒中,而產生了一個新的病毒。
冠狀病毒會經過一種我們稱為”同源重組的機制” ( 詳情可拜讀來自台灣的世界冠狀病毒權威 – 賴明詔院士的著作, Dr. Michael M.C. Lai, PMID: 2158184, 9233431 ) . 讓我們想像一下,假如兩種不同但是相近的病毒同時地進入同一個細胞;我們姑且稱它們為 A 病毒跟B病毒好了,當 A 病毒開始複製自己時,其基因組的一小部分可能會意外地複製到 B 病毒的序列,這樣的結果主要是因為 A 與 B 病毒在此區域的基因序列有著同源性或是相似性。這樣的概念類似於當一個人正在使用影印機時複製文件時,另一個人把其中一張的文件做了調換然後被裝訂在一起。在這樣的狀況下,複製出來的A病毒在基因序列上會跟源始的A病毒近乎完全一樣,但有一小部分則會跟 B 病毒相同。而這可能就發生在 SARS-CoV2上,除了在突刺蛋白質中的受器結合位與穿山甲病毒有著序列的相似性之外,其它部分都與跟蝙蝠冠狀病毒比較像。
到目前為止,我們的假設:
當藉由序列比對的方式來分析多種病毒的基因序列後,我們對於 SARS-CoV2 的源起有了想法。大部分的 SARS-CoV2 可能是源自於與 RaTG13 相近的蝙蝠冠狀病毒,經由與中間宿主中的另一種冠狀病毒的交互作用而獲得部分外源性的突刺蛋白質序列。目前主要認為的中間宿主是 – 穿山甲,一種可能性是新冠病毒在跳向人類之前是先從蝙蝠轉到穿山甲身上的。然而我們還缺少確切的證據來支持這個假設,因為科學家尚未從穿山甲身上分離出一隻完整的病毒株,其帶有上述我們所提到的基因序列特徵 – 我們只有從 SARS-CoV2 的序列中得到一些提示。我們當前的假設有可能是不正確的,然而隨著更多的病毒被定序與更多的數據被收集分析,我們可以更精確地把 SARS-CoV2 是如何出現的源由給拼湊起來。
希望您會喜歡這篇討論 SARS-CoV2 起源的第一篇文章,在下一篇貼文當中,我們將討論 SARS-CoV2 中的特定基因組成,其如何使這個病毒能夠輕易地感染人類。 請繼續關注我們並且要記得乖乖洗手呦!
負責任翻譯小編 洪傳典,原文著作 Mr. Christian Stevens @csstevens91
洪傳典來自於台灣 🇹🇼
目前任職於紐約西奈山伊坎醫學院-微生物學部門 Dr. Benhur Lee 的實驗室擔任博士後研究員
chuan-tien.hung@mssm.edu
作者:Christian Stevens
Christian 為西奈山伊坎醫學院的醫學生與博士候選人,於 Harvey Mudd College 獲得他的學士學位。他在2018年加入 Benhur Lee 的實驗室,主要從事兩個項目的研究:第一個是使用分子病毒工程,利用仙台病毒 (Sendai Virus) 作為載體來當作基因編輯的工具;第二個項目則針對 Illumina 定序平台與 Oxford Nanopore 的RNA定序平台來建立分析數據的流程。
作為一位醫學生與未來的醫生,Christian 的志向是要把世界一流的臨床研究資源普及到地球上的每個角落,將他在傳染病學與病毒學領域的所學與世人們一同分享。
christian.stevens@icahn.mssm.edu
推特:@csstevens91