新冠病毒的起源?

武漢肺炎

文:王立銘

浙大正式開學了(上網課),我主要的時間在備課講課,趁週末來聊一個最近熱的燙手的消息:

新冠病毒起源在美國?」

稍微查了一下,這個消息有三個緣由,陰差陽錯的恰好湊到了一起。

一個是2/22日中科院的一群科學家在開放平台ChinaXiv上傳了一篇論文,通過分析九十幾個新冠病毒的基因組序列,得出了「新冠病毒的發源地可能不是武漢華南海鮮市場」的推測。我當時就看到了論文,但是覺得論文的分析其實有一點點問題(不是作者們的問題,等下仔細說),但是這個分析思路非常重要,不妨留待日後數據更多、結論更確鑿的時候再講,就沒有太當回事。結果這個論文後來不知道什麼時候被某個台灣媒體大肆炒作作為「新冠病毒起源於美國」的證據,一下子引爆了中文互聯網。

一個是2/27日鍾南山院士在新聞發布會上說「疫情首先出現在中國,但不一定是發源在中國」,這句話在科學上是毫無問題的(我們下面再細說),但是在上面這條新聞的大背景下,給大家猜測病毒是不是來自於國外提供了專家背書。

還有一個是美國2/26日在加州發現了一位新冠病毒感染者,但是其人既沒有來過中國日本韓國等疾病多發的地區、也沒有和美國其他新冠患者的接觸史。這種案例就被美國新聞稱為「the first coronavirus case of unknown origin」,也就是,美國首例未知(感染)來源的新冠病毒感染者。這句話的表述同樣沒有任何問題,但是卻被不少不明真相、或者別有用心、又或者單純是英文不及格的自媒體理解成了美國才是第一例新冠肺炎的發源地。

三條不同來源的消息,被各種錯誤理解和添油加醋之後,最終醞釀出了「新冠不是中國起源,來源於美國」的大新聞。這就值得稍微展開討論下了。

1:新冠病毒是不是起源於武漢、特別是不是起源於華南海鮮市場?這個說法的依據主要是早期患者確實有相當一部分和華南海鮮市場有密切關係(Huang C et al Lancet 2020)。在新冠肺炎剛開始流行的2019年12月,武漢地區的醫生們根據患者的生活軌跡得出「這種疾病大概和華南海鮮市場有關係」的推論當然是很合理的,對於他們能夠準確和及時地認識到這種全新疾病的存在有很大幫助。這個你應該不難理解,新冠肺炎的症狀並不特別典型、不容易和其他病毒性肺炎相區分,當時又不知道病原體,沒有基於核酸或者抗體的檢驗手段,要是連「華南海鮮市場」這個抓手都不存在,醫生們就更難確認他們在面對一種全新疾病了。這也是在那之後地方政府封閉海鮮市場的決策依據。

2:不過即便在12月份,就已經出現了和華南海鮮市場沒有明確接觸史的患者(Huang C et al Lance 2020)。實際上有據可查的第一個發病的患者(12/1發病)就沒有去過那個市場。但是我得強調一下,這件事本身既不能用來說明、也不能用來推翻新冠肺炎和華南海鮮市場的聯繫。這個道理稍微有一點繞:這位患者雖然是有據可查的第一個發病的患者,但是我們其實並不知道他是不是就是歷史上第一個新冠肺炎患者——也許更早的患者症狀輕微沒有就醫,或者就醫但是被當成了其他疾病,又或者感染的早但是潛伏期更長。果真這樣的話,早期沒有華南海鮮市場接觸歷史的患者,完全可能是從其他這些未被發現的患者那裡感染的。

3:但是基於同樣的理由,我們實際上也沒有證據證明新冠肺炎就一定是起源於武漢,起源於華南海鮮市場。武漢地區當然是這次疫情爆發的中心,至今也仍然是病毒最有可能的起源地(否則無法解釋為什麼去年底病毒沒有在其他城市傳播),但是新冠病毒本身確實有可能是在另外的時間地點第一次進入人體開始人際傳播的。歷史上這種一開始比較「安靜」,突然在某個環境因素催化下開始爆發的傳染病比比皆是。這也是我在之前微博裡反覆討論的病毒溯源研究的重要性:我們需要仔細研究病毒的人際傳播規律和演化歷史,搞清楚它從天然宿主到中間宿主,再到人類世界的完整鏈條。這些信息不光能幫助我們更好地理解這個敵人,也能幫助我們切斷傳播鏈條,預防它的再次爆發。

4:實際上我也確實一直比較懷疑新冠病毒可能不是在去年12月的武漢才出現的。一個證據是至今為止完成基因組測序的新館病毒大概有130多個,來自世界各自的患者,而這些病毒之間的基因序列差異非常微弱,沒有明顯的變異和進化方向(O網頁鏈接)。這一點和17年前的SARS病毒截然不同,那個病毒在傳播過程中一直在發生高強度的變異(SARS Consortium Science 2004)。通俗理解,你可以認為這說明新冠病毒已經進化的很適應人體了。我們知道新冠病毒是一種來自動物的病毒,在進入人體之前它沒有未卜先知的能力提前做好準備。所以,要麼這個病毒碰巧在去年12月第一次進入人類世界的時候就具備了比較完備的各種特性,要麼就說明它可能在此之前就已經進入人類世界默默傳播一陣子、並且進化出了更適應人體的特性,然後在武漢開始了大爆發。我個人會覺得後一個解釋更符合常理。所以我也很認同鍾南山院士的說法,實際上我們現在並沒有證據明確的說新冠病毒到底起源於何處。(我對鍾院士說法的唯一反對意見是他沒有必要強調不同的國家;哪怕說是在中國,我們實際上也不知道是不是就是在武漢)。

5:想要搞清楚病毒的真正源頭,一個辦法是先從武漢、特別是華南海鮮市場入手,畢竟那裡仍然是最可疑的地點,不是第一現場,也是第二現場。但是就像我前面微博裡說過的,華南海鮮市場關閉的時候沒有保留動物樣本,失去了第一手證據,讓我們沒有辦法去真正分析海鮮市場內部是不是真的有某種野生動物身上攜帶了新冠病毒。這是一個歷史的遺憾。儘管後來疾控部門宣稱從海鮮市場的環境中檢測到了病毒的基因序列,但是這種證據的作用遠不如找到一隻或者一批確實攜帶病毒的動物標本。

6:第二個辦法則是利用病毒基因變異和演化的規律,通過分析目前存在的大量病毒樣本,追根溯源。這個邏輯本身是很簡單的,我打一個通俗的比方,如果你在三個患者身上分離病毒,檢測新冠病毒的基因序列,發現患者1身上的病毒有基因突變X,患者2身上的病毒有突變X和Y,患者3身上的病毒有三個突變XYZ。那麼一個最簡單的推測就是病毒的傳播應該是1>2>3,並且在這個過程逐漸積累了更多的基因突變。實際上進化生物學家們一直在用類似的辦法分析地球生物彼此的演化關係。這一次涉及到的中科院論文(Yu WB et al ChinaXiv 2020)也是在對新冠病毒做類似的分析。

7:具體來說,在這篇論文裡,科學家們分析了世界各地患者身上提取的90多個新冠病毒的基因組序列,根據他們彼此的差異大小把他們分組(ABCDE),然後還根據上面咱們討論的這個邏輯猜測了不同組別之間的傳播順序(A-B-C-D/E)。從這個進化/傳播鏈條上,科學家們發現武漢地區採集的病毒主要屬於C,而A和B組的樣本則來自武漢之外(A來自深圳患者,B來自美國患者,而且這些患者並未到過華南海鮮市場),所以他們得出了病毒可能來自華南海鮮市場之外、只是在海鮮市場出現了爆發的推論。

8:這個推論我覺得符合當下的數據。但是這項研究衍生出了兩個大問題。當然我要先說明一下,這兩個問題都和研究者們自身無關。

9:第一個問題就是被各種媒體錯誤解讀了。就像我們一開頭所說,台灣一個媒體完全錯誤理解了論文的含義,他們以為既然武漢的患者主要是C病毒,而更古老的A/B出現在深圳和美國,那麼就說明這個病毒的起源地大概就是這些地方——特別是和那條「the first coronavirus case of unknown origin」的美國新聞前後腳出現,讓媒體認定病毒就是起源於美國了。這完全是對兩條新聞同時錯誤解讀的疊加結果。特別是對於中科院這篇論文來說,A/B病毒的患者確實是在在深圳和美國被發現的,但是這些患者在發病前可都是剛剛去武漢旅行過的!他們在程序上固然被定義成了武漢之外的患者,但是他們體內的病毒則幾乎可以肯定是武漢來源的。

10:第二個問題則出在利用基因組差異研究病毒進化歷史,這種研究方法本身。首先要說明,這個研究本身的邏輯是完全成立的,也是當下我們找到病毒起源和傳播鏈條最好的方法。但是這個方法想要成立的前提,是病毒在傳播過程中確實發生了大量的基因變異,我們才能夠通過分析這些基因變異尋根溯源(想想我們說的患者123和病毒XYZ的例子)。但是我們也提到過了,新冠病毒的基因突變其實非常稀少,大量的病毒只攜帶區區幾個基因突變,而且彼此之間的基因突變還不重疊,這就給繪製它們的傳播和進化鏈條造成了很大的麻煩。我們還是通俗的打一個比方,如果三個患者身上的病毒的基因突變不是X,XY,XYZ,而是XY,XZ,Z,實際上你會非常難以判斷他們三者的傳播順序,即便你可以大概猜測XY和XZ的關係會大於XY和Z的關係,但是誰先出現、誰傳給誰,就很難分析了,對不對?換句話說,作者們固然畫出了一個A-B-C-D/E的傳播鏈條,但是這鏈條本身的可靠程度實際上是不太讓人放心的,換一個算法,換一個統計學模型,可能結論就會大相逕庭。

11:想要解決這個問題,可能唯一的辦法是測出大量病毒的基因序列,用數量暴力攻擊質量,得到更可靠的結論。但是問題是至今為止全世界接近8萬新冠肺炎患者,只有130多條基因組序列被分析和上傳,這顯然是遠遠不夠的!更麻煩的還有代表性問題,患者最為集中的武漢地區的病毒序列只有幾十條,不成比例的低。這就會導致一個顯而易見的麻煩,比如說在同一篇論文中,作者們也提到在美國患者體內發現的某些病毒類型在武漢地區沒有找到。但是基於武漢地區只有千分之幾的患者體內的病毒被測序,而且還集中在疾病早期的一小批患者,於是我們根本無從得知這些病毒是不是在武漢真的不存在,還是因為採樣太稀疏被遺漏掉了。

12:好了我們簡單小結一下吧:

A 科學上說,我們確實不知道新冠病毒真正的最初源頭是哪裡,它可能是世界上任何地方,然後在去年12月的武漢出現大爆發;

B 鑒於華南海鮮市場已經被破壞,我們最大的希望是利用病毒基因組序列繪製傳播和進化鏈條,找到最初源頭;

C 但是目前我們掌握的病毒基因組序列數量太低,代表性太差,類似的研究的結論可信度很低;

D 在我們掌握更多的數據得出更可靠的結論之前,武漢地區顯然仍然是最值得我們繼續挖掘和分析的第一或者至少是第二案發現場。分析武漢地區內部病毒的傳播規律,人群的歷史感染率,是重中之重的研究課題。

  1. 最後,咱們再簡單說一下那條美國新聞「the first coronavirus case of unknown origin」。這種未知傳播源的病例本身毫不稀奇,但確實是一個重要的標誌——它意味著新冠病毒在美國也可能正在進入大流行的階段。一般來說,在一個傳染病開始流行的最早期,如果防控措施到位、研究調查及時,我們是有可能搞清楚每一位患者的傳染源的——不管源頭是動物還是其他患者。而如果能夠搞清楚傳染源,那麼理論上我們就有可能把整個傳播鏈條鎖定、隔離、阻止疾病的進一步蔓延。在上海,在新加坡,人們就是這麼做的,也取得了很大的成功。

而如果一個地方,疾病已經開始流行,我們就會看到原來越多的患者,無法確定他們的傳染源頭——因為可能的傳染源太多了。過去兩個月的武漢,現在的日本韓國伊朗,以及未來的美國,可能都正在這個階段。

而這種未知傳染源的病例的出現,作為一個明確信號,可能意味著當地要對防控措施進行調整了。如果我們能鎖定傳播鏈條,那麼嚴防死守隔離所有潛在患者就是行之有效的辦法;如果不能鎖定傳播鏈條,那麼對疾病的防控可能就需要長期化、常態化。相比不惜一切代價的嚴防死守,可能更溫和但是持久的政策,比如改善個人習慣、禁止不必要的公眾集會、疫苗的快速開發、儲備醫療資源準備救治重症患者,可能就更重要。最近WHO的一篇文章也在強調這個差別(Heymann DL and Shindo N Lancet 2020)。這種防控策略的轉換邏輯我也曾經反覆寫過,它不光適用於世界其他地區,也適用於正在疫情關鍵轉折期的我們中國。

更多閱讀

夏小強:中共失控 中國各地進入自組織狀態

夏小強:武漢肺炎的驚天內幕正在浮現?

多愚昧啊!他們質疑李子柒「背後有團隊」

醜聞、逮捕、自殺……十位百億富豪的2019生死劫

何清漣: 美國之勝,將中國從進攻態勢逼回防禦狀態

    

傳播真相   探究歷史 支持正義  分享快樂

💰 打賞