您正在瀏覽的是香港網站,香港證監會BJA907號,投資有風險,交易需謹慎
市場資訊

市場資訊

首頁市場資訊資訊詳情

夜讀 | 萬物皆可ChatGPT

uSMART盈立智投 05-17 20:26

作者:羅小舟,中科院深圳先進技術研究院研究員、合成生物化學中心執行主任

來源:華夏基石e洞察

 

導讀:2023年4月20、21日,由深圳市前海管理局指導、基石資本主辦的“2023中國前海企業家峯會”在深圳蛇口成功舉行。此次峯會以“再談創新之道:國家和企業的未來”爲主題,圍繞創新環境、創新精神與創新實踐,多位重量級的企業家、科學家、學者和投資家進行了精彩演講與深入討論。中科院深圳先進技術研究院研究員、合成生物化學中心執行主任、合成生物研究重大科技基礎設施副總工藝師羅小舟發表了“進化的力量”的主題演講。

 

大家好!我是來自中科院深圳先進技術研究院的羅小舟。今天,很榮幸受到主辦方的邀請,來給大家介紹一下關於合成生物學及其相關的一些內容。

 

在座各位都是投資界、企業界的精英,要怎樣講才能讓大家感到有趣呢?還得講我的老本行。過去十幾年,我一直在做關於進化方面的研究,下面就逐步介紹一下我們在這個領域所做的一些努力。

 

首先,究竟什麼是進化。相信在座的各位都已經很熟悉進化論了,聽到進化這個詞想到的第一點,即人都是猴子變來的。再想想,可能還有物競天擇、適者生存這類思考。但實際上,進化是不是隻有這一點點能力?是不是隻進化出來我們人類一種高智能動物?實際上,進化遠遠不止這些非常表象的信息。

 

先給大家介紹一本書,我後面講的內容很多來自這本書:《自私的基因》,該書出版於1976年,作者是英國的演化生物學家理查德·道金斯。這是一本全球暢銷書,作者本人也是英國皇家學會會士、牛津大學的教授。他在這本書里提出了一個非常重要的觀點,即基因是進化的主要選擇單位,基因有其自私的特性,基因存在唯一的目的就是確保自身的生存和複製。

 

生存和複製,相信企業家們都能理解。剛開始創業的時候,企業最關鍵的問題是如何活下去,而如何變大,實際上就是生存和複製。

 

在《自私的基因》一書里,有一些比較有意思的觀點。

 

首先,它拋出了一個概念是“基因的機器”。這是什麼意思呢?大家認爲,我們日常生活中的病毒和細菌、家里面養的花、外面的樹、寵物狗和貓、水里面遊的魚等等,都是大自然創造的萬事萬物之一。而這本書的作者卻認爲,它們都是機器,是基因製造出來幫助自己繁殖、散播的機器。比如說鳥,作爲一個機器,它能幫助其攜帶的基因飛到天上去探索更廣闊的空間。而魚這樣的機器被造出來,就是可以將其攜帶的基因深入到大海里面……也就是說,萬物作爲機器,都只是幫助自己攜帶的基因,去利用別的物種利用不到的資源去繁殖自己。

 

造這樣的機器,該如何賦予它智能呢?當然,大自然不可能告訴機器,遇到障礙物該怎樣跳過去,這是不現實的。包括人類在內,所有物種的所有行爲,實際上都是有基因編碼的。而基因編碼都有預先設置好的程序,但這個程序不可能告訴你,10歲那年,會有個樹枝掉下來,你要躲開。

 

那麼,基因程序要怎樣編寫?這本書認爲,必須通過形成一定的策略,由這些策略,來應對我們所擁有的生活和麪對的各種事物,最終保證我們作爲基因的工具更好地在這個世界上生存、繁殖。

 

既然說到了策略,我們就會想,人與人之間的競爭,國與國之間的競爭,任何一個物種之間之內都存在競爭。最簡單的一個物種不同策略的競爭在現實中是廣泛存在的。比如,美國大選里面,有人支持川普,有人支持拜登。在經濟學領域,有人支持自由派,有人支持政府……這樣簡單的一物種內部的競爭比比皆是。

 

比如,我畫了一隻鴿子、一隻鷹,它不代表鴿子和鷹的競爭,而是代表一個物種里面的鴿派和鷹派。當同物種的兩個派別碰在了一起,爲了得到一個食物或者一個水源,它們互相對峙。這時,兩派會有什麼不同的策略呢?鴿派傾向於對峙,但如果一旦開打就逃跑,因此不會受傷。鷹派則全力以赴地戰鬥到底,無論輸贏。

 

推演一下兩種不同策略帶來的物種進化。假設一個條件是環境的壓力,因爲進化一定是在環境的壓力下才會產生的。兩者競爭,贏者得到50分,獲得一些新的食物或者一些新的水源。而輸的只能得到0分,即什麼都沒有。而如果輸家應爲爭鬥受傷了,它可能在之後的兩三天甚至10天都沒有食物來源,則會被扣100分,而因爲對峙浪費了時間、損失了尋找其他食物的機會被扣掉10分。那我們假設一個情況,該物種里面都是鴿派,那麼,當兩者相遇時,就會形成對峙,最終一方累了、跑了,另一方得到了食物,得了50分。雙方都浪費了時間各扣掉10分,就只有30分了。這樣這些鴿派的成員在這個世界上生存下來都能得到15的平均分,當羣體里面突然出現了一隻鷹,也就是出現了一個新的策略,那麼這個鷹就會存在巨大的競爭優勢,因爲它的每一個競爭對象都是鴿子,每一場爭鬥都可以得到50分。在這種情況下,它的基因將會在整個進化當中得到極大的擴張。

 

由此看來,全是鴿子狀態的基因肯定是不穩定的。同理,全是鷹的物種,因爲兩敗俱傷,使平均得分可能是負數,簡單計算後是-25。這時,一旦突變出來一隻鴿子,那麼這個鴿子在整個進化當也會有巨大的優勢。儘管它可能什麼都得不到,但不會受傷。

 

通過計算這些數學問題我們知道,無論是一隻鴿子突變成一隻鷹,還是一隻鷹突變成一隻鴿子,如果達到一個進化上的穩定策略,它都不會再變化了。當鴿子與鷹或者鴿派與鷹派是5:7的比例時,整個基因系統在進化上是穩定的狀態。

 

這種穩定的狀態下,個體平均得分是6.25分,跟剛纔那些分數比較,6.25分其實不高,相當於個體只能得到6.25分的實物。這時,如果全是鴿子,每一隻能夠得到15分。個體要得到最高分該怎麼做?如果羣體進化到5只鴿子和1只鷹的比例,個體就能得到16.67分。

 

這證明,我們每一個個體在進化層面都是非常自私的,只管自己,絲毫不會考慮整個羣體的利益。要如何才能讓每一個個體最大化自己的利益?就要通過外部的調節來選擇一個壓力,也就是剛纔說的那些分數,我們可以逐步使進化趨於最優解。

 

在我們的日常生活中,政府官員制定新的政策、投資人投入於一些特定的方向、科學家研發一些新的技術等等,都能改變我們這個環境,使得整個羣體達到最優水平。

 

以上只是介紹了最簡單的進化策略:一個是打不過就跑策略,一個是戰鬥到底策略。如果還想要更多的進化,則需要更加複雜的策略或者說更加根深蒂固的策略。

 

接下來,我想介紹一下生育和撫養。每次我們去國外交流,就有人問我們國家是不是實行了計劃生育,我說是的。事實上,在進化學家眼中,自然界其實早就已經開始實現計劃生育了。這是什麼意思呢?大家看到,作爲哺乳動物的貓、狗沒有出現過一次生100個的情況,這不可能,對不對?

 

這不是一個母親能夠決定的,生育的數量實際上是通過漫長的進化得出來的最優解。它隱含了什麼?但凡是生100個或者生育極少量的基因已經消失在漫長的歷史長河中了,因爲它不能適應環境。從基因本身來講,它是希望越傳越多,越多越好,但爲什麼會產生這樣一個生育數量?因爲個體繁殖過多,如果遇到第二年年景不好,發生饑荒等情況,可能整個物種都會餓死。於是,進化就會把該基因進行淘汰,最終完美地執行了接近“計劃生育”的一種策略。

 

進化還有什麼策略?實際上,我們所有的撫養行爲也是一個策略。就像北極熊生下了兩個寶寶,在年景不好的時候,它只能養活一個。那麼在自然界中,它會怎麼做?這就是一個母親的投資策略。它究竟分給兩個小北極熊同樣的食物?還是隻能給其中一個更多而給另一個更少?經過長期的觀察以及數學的計算,遇到只能養活一隻的情況,母親普遍會選擇放棄小一些的個體。爲什麼?因爲對大的的投資已經遠遠要大於對小的的投資,沉沒成本更高,所以自然界已經進化出來一個策略,即當一個投資比另外一個投資大時,放棄投入更少的個體,更有利於基因的繁殖。而在物質不那麼匱乏的時期,則會投入更多在小的個體上,因爲這也不一定會導致大的個體的死亡,最多隻是有些營養不良或者吃的少一些而已。

 

這種情況其實在人類社會中也是非常明顯的。比方說,在照顧小寶寶時,照顧到一定的月份或一定的年紀就會斷奶。爲什麼要斷奶?省下資源可以去照顧更下一代,照顧下一個個體,這樣會增加基因傳播下去的概率。我們的姥姥、姥爺、爺爺、奶奶會主動承擔起照顧第三代的責任,因爲第三代依然有母本25%的基因。通過照顧第三代,實際上能夠更加促進基因的延續。我們現在看到生育的個數一定不是一個固定的數值,大家周圍還有雙胞胎、三胞胎,從進化學的角度看,這也是母親的一種投資策略,就好比買期貨。期貨的條件是什麼?是預測明年的年景可能會更好,或者我感知明年的年景可能會更好,這樣我生下來兩個寶寶都能夠得到非常好的照料,都能夠繁衍壯大。如果第二年確實是一個很好的年景,期貨就買值了。如果不好,會有一個自然的選擇,作爲母親可能就會放棄一個的生育和撫養。如此,經過上萬年到現在,就進化出來了一些策略。

 

接下來,我想談一談大家都看到過的植物。大家心目中最成功的植物是什麼?喜歡花的會認爲,最成功的是一株最好最美麗的花朵。喜歡樹的可能認爲,最成功的是長得最高的那一類樹。但是從進化的角度,最成功的植物是以下三種:小麥、玉米和水稻。現在,這三種植物在地球上的數量最多,經營、傳播最廣,甚至連我們的空間站里面都有它們的身影。可能有些人會說,這些東西都是人類爲了吃才幫忙種出來的呀!但是在《自私的基因》里,作者提出,基因不僅可以影響本身的個體,還可以通過個體去影響其他個體。我們也可以這樣理解:小麥、水稻和玉米的基因造出的工具成功地利用了我們人類的口腹之慾,使得它們的基因得以無限地延續下去,並且得到最大規模的散佈。

 

針對一個物種可以影響另外的個體,作者又提出了一個叫“模因”的新概念。它仿照基因來命名,有些翻譯里面直接用英文名Meme。什麼意思呢?就是說,事物本身是一個文化的載體,比方說我們看的書報,我們聽的流行音樂都攜帶了自身的一個基因,而這個基因是可以從一個頭腦傳遞到另外一個頭腦的。對模因的研究可以套用基因,模因是基因在文化上面的一個類比,可以自己複製、變異,並且可以根據壓力的選擇來作出不同的迴應。比方說,我左邊的兩本書有幾千年的歷史了,它們在幾千年里一點都沒有變嗎?至少我們會發現,現在的書已經變成簡體字了。爲什麼要變成簡體字?實際上是它本身的基因或者它的模因爲了適應這個社會進行的本質的變化。因爲,它也是符合這樣一個遺傳規律的。

 

我們的手中有一張圖,是2010年有人隨機拍了發到網上的。到了2012年,網終上出現了它的複製版,最後,經過病毒式的傳播,到了2013年,它就變成了一個文化現象。這說明,它的基因爲了自己的生存,把自己變成了一個Doge幣。過了幾年,Doge幣大火,它的基因又得到了更廣泛的散播。原來一些並不關注網絡文化的人可能不知道,在2015年或者2016年,我們微信上還有一個Doge臉的圖標,至少在中國範圍內,它得到了廣泛的傳播。

 

這些文化現象的背後,都有進化的策略和規律,儘管我們看不見、摸不着。

 

除了我舉的這些例子,大家在網絡上看到的各種挑戰賽,聽到的各種流行歌曲也充分證明瞭模因的存在。有一些流行歌曲可能今年爆紅,明年我們就聽不到了,說明它的策略很短暫,只能夠在短時間內得到爆發,沒有長久性。有些歌曲可能歷經了10年20年還是經典,這也是基因或者模因採取的策略。

 

剛纔主持人介紹了,我的單位是合成生物學研究所。合成生物學究竟在研究什麼呢?可能有人說,合成生物學就是用微生物去合成一些東西,這其實不是我們真正研究並最終關注的內容。用一個微生物去做一個東西只能說是合成生物學在研究過程中產生的附帶效果,儘管這個效果足以支撐幾家上市公司和很多初創企業,但我們合成生物學實際研究的是多物種經過多年進化,體內究竟產生了什麼樣的東西,以及什麼樣的策略?我們的生命本質上作爲一個功能是如何涌現出來的?

 

什麼叫做涌現?舉例說明。電腦只有一個顯示器、一個鍵盤或者一個硬盤是不能播放PPT的;汽車單獨一個輪子或一個車框是沒有辦法奔跑的。但這些小的實體組裝到一起形成一個大的實體就能展現小實體所不存在的特性或功能,如:電腦可以做PPT了,汽車可以跑了。這個過程就叫做涌現。

 

我們研究生命,對於人類來說,生命過程本身就是一個涌現,這些策略本身也是一種涌現。什麼意思?我們其實就是一堆的化學物質。無論我們的DNA還是蛋白質,都是最簡單的化學物質。這些最簡單的化學物質爲什麼組合在一起之後自己就可以繁殖了,甚至像我都可以上臺來講PPT了。這個功能是怎麼涌現出來的?它的這些策略是怎麼來的?是通過最底層的基因編碼來架構的,這就是合成生物學。整個社羣就是全球合成生物學,所有的合成生物學家都想要去探究這些內容。探究這些內容我們提出了兩個方法,第一個是自上而下,就像拆一個電腦拆一個汽車,拆成一塊一塊的,然後去對每一塊進行研究和鑑定。

 

剛纔,方誌剛老師也提到了,知其然不知其所以然。我們希望用自下而上的方法去探究去測量,用數學來描述物質之間的關係,從數學的本質上去理解,然後從0開始地造就一個這樣的生命,纔可能真正理解生命進化的策略是怎麼產生的,以及生命是怎麼涌現出來的。

 

要拆分一個計算機已經很難了,那麼要去拆解一個生命只會更難,步驟更多,方法更復雜。而我們要去研究它的很多內容,或者說從下面把它製造出來,需要很多重複性地勞作,還需要有很多知識做輔助。

 

2018年,深圳市投資了七個多億,讓我們做一個軟件結合硬件的平臺。利用這個平臺,我們可以做大量的標準化的實驗,可以自下而上地從零開始,構建一些生命的元件。我們希望最終實現構建生命,也希望能夠通過自上而下的對生命一步一步的拆分,進一步地理解生命。

 

接下來講一講我們這幾年在深圳做的一些事情。

 

剛纔幾位老師都提到了軟件的重要性。在芯片領域,我們已經被卡脖子了,希望在生物設計領域不要再一次被卡脖子,所以設計了一個基於用戶的BioCAD來覆蓋我們整個合成生物學,也就是設計、構建、測試、學習的閉環。這個閉環很好理解,就像折一個紙飛機,先把草圖畫出來,再去構建它,再把它折出來去試飛,也就是測試。如果飛得遠,就要了解它爲什麼飛得遠,這個就叫學習。任何一個簡單的符合邏輯的工程領域都需要一個軟件幫助我們去實現這個過程。

 

合成生物的研究實在是太複雜了,我們希望能夠整合公共的數據資源,實現研究的數據閉環,這樣纔可能產生更多數據驅動的研究。我們已經以用戶爲中心開發了一整套生物設計軟件對接雲實驗室的接口,雲實驗室會操作我們的硬件平臺,去做所有的實驗。我們也已經實現了一站式的設計來構建測試學習的閉環。

 

我們在軟件方面已經成功地開發出了基礎數據庫,它集合了現在幾乎所有和生物學相關的信息。我們開發了一個元件庫,就是我們做出來的每一個生命元件都可以按圖索驥地去儲存,去分發。我們做了一個裝置設計軟件,可以從0開始去設計、製造生命的一個菌株。

 

未來,我們希望各位都可以設計一個菌株,用一個拖拽式就可以把一個生命給設計出來。

 

我們還做了一個基因組的編輯。因爲基因組是所有物種最大的一個遺傳單位,可以進行直接編輯,需要有軟件去設計,再由自動化去執行。現在,除了有多組學分析的軟件協助分析海量數據外,還有很多專業化的軟件能夠基本保證我們在生物的CAD領域不會被卡脖子,甚至能夠做一些領先於世界的研究。

 

除了軟件,當然還開發硬件。我們不僅會自主開發一些硬件的儀器,做一些原來我們做不了的生物實驗,還要開發相對應的工藝、工程。儀器做出來還不夠,我們還要開發與之配套的實驗方法,才能最終使用機器去做實驗。

 

目前,我們運行的這個大型平臺儘管還在建設期,但也做了不少內容。比如,我們用微生物合成了一些有價值的化合物。大家都知道,人的腸道里有很多細菌,通過人工維持或者加速它的進化可以治療高尿酸引起的痛風。我們用老鼠模型完成了這個實驗。我們希望把這項研究推廣到臨牀,進而造福於社會。我們還要繼續研究細菌在腸道內部是怎樣對話的,這些致病菌爲什麼能夠去殺掉其他一些菌,而益生菌又爲什麼能夠幫助並保護我們的健康?

 

一個物種的基因組實在太大了,包含了很多冗餘的信息。由於整體地研究它的策略太過複雜,所以我們又做了基因組最小化的底盤細胞。同時,我們也做了一些像抗生素類化合物這樣高效的表達平臺,幫我們開發更多藥物候選的分子。結合 AI、GPT等工具,我們還可以去擬合、預測一些實驗中難以測量的數據。

 

我們現在開發出來的工具比原來的工具提高了20%的準確率,並且已經實實在在地運用到生物學的研究當中了。

 

最後總結一下。我們在研究進化以及合成生物學生命是如何產生的同時,我本人也在努力地迎合這樣的進化。我用到的這個PPT大綱是用Chat-GPT幫我寫的,是用。所有的配圖都是Chat-GPT給我建議的,然後midjourney根據ChatGPT建議的內容畫的。如果大家都沒有看出來的話,就說明我們現在的人工智能真的是智能了。

 

謝謝大家。