細胞分子基因營養醫學

吳家睿教授:後基因組時代的思考---兩種大科學的抉擇

    從科學研究的歷史來看,形成一門學科並非一件容易的事。但在人類基因組計畫實施的短短幾年間,以××組學(-omics)構成的學科如雨後春筍般,迅速地在生命科學界蔓延。最早出現的是與DNA相關的「基因組學(genomics)」,隨後又產生了許多與各種生物大分子或小分子相關的「組學」,如蛋白質組學(proteomics)、轉錄組學(transcriptomics)、代謝組學(metabolomics)等。

    複合名詞則更是不可勝數,以基因組學為例,在文獻中就可以看到結構基因組學、功能基因組學、癌症基因組學、藥物基因組學、毒理基因組學、環境基因組學和營養基因組學等。

    這些術語的出現,從積極的方面來看,表現了生命科學的活力和迅速發展的勢頭。從消極的方面來看,則暗示了一種浮躁和輕率。本文試圖對後基因組時代出現的這諸多的「組學」進行一番梳理,並對這些新興學科進行反思和討論。

工程型與概念型大科學

    人類基因組計畫常被人們譽為生命科學的登月計畫。這一比喻應該說是很恰當的,不僅說明這兩者都是大科學,有大量人力物力的投入,而且表明兩者都擁有一個清晰、具體的目的。

    這兩個計畫都屬於科學工程。凡是工程都具有這樣一個特點:目的明確,可進行評估和度量。比如要建造一幢樓房或架設一座橋樑,顯然我們是有著明確的目的,而且可以對工程的實施進度和完成情況進行具體的和定量的評判。

    根據這一標準,筆者把生命科學領域中研究目的可以被明確界定和度量的大科學,如測定物種基因組全序列的基因組學,稱為「工程型大科學」。

    美國國立癌症研究所在1997年發起了一個「癌基因組解剖學計畫(Cancer Genome Anatomy ProjectCGAP)」,其目的是要收集和分析與癌症有關的遺傳和基因組資料。這個計畫內的兩個子計畫——哺乳動物基因收集(Mammalian Gene Collection)和癌細胞染色體畸變計畫(Cancer Chromosome Aberration Project)。

兩難的抉擇

    迄今為止,在生物學的大科學研究領域,基因組學最為成功,從低等微生物到高等動植物中的許多物種的基因組都已被破譯。基因組學的成功理所當然,因為它是典型的工程型大科學。此外,基因組學成功的另外一個原因是對技術的強烈依賴性。只要技術可行,目的就能達到。

    在1980年代初提出測定人類基因組的想法時,許多科學家都認為這是一個不可能實現的計畫,因為當時的測序能力極低,一年不過數萬個堿基。隨著DNA自動測序技術的出現和發展,測序能力迅速提高,在1998年已達到年測序能力9000萬堿基,2003年估計會達到每年5億堿基。

    但是,生命科學領域的工程型大科學也有其先天不足。首先,這類大科學不是針對具體的生物學問題來進行的,也不能回答或解決具體的生物學問題。其研究的最終結果只是為生物學問題的研究準備一個資料庫,提供一種進行大規模、高通量研究的基礎。如果這些資料沒有被用於進一步的功能性研究,其價值將會大打折扣。

    科學研究的標準之一是可重複性,不同的實驗室得到同樣的結果才是真實可信的。但是,在工程型大科學中,這一標準就難以貫徹了。很少有人願意把一個已經測完的基因組,再投入大量的人力和物力去重測一遍。雖然人們會制定一套標準來防止錯誤,如美國國立衛生研究院和能源部設立了測序合格的三個標準,但顯然還會有不少錯誤的資訊存在於資料庫中。

    不久前,美國人類基因組計畫的專家分析了國際人類基因組計畫(HGP)公佈的人類基因組序列,以及美國塞萊拉(Celera)公司採用鳥槍法測定的人類基因組序列,認為塞萊拉公司並沒有做什麼事,只是把公共資料庫堛爾禤ぉ奐s拼裝而已。塞萊拉公司的專家則否認這一指控。

    這一案例表明,即使對同一個基因組分別測序,兩個資料庫的差異也是不容易說清楚的。蛋白質組資料的問題更為嚴重,因為實驗條件的微小差別,都可以導致不同的蛋白質表達譜。國際蛋白質組織在20024月,專門成立了旨在建立統一標準的蛋白質組學標準計畫(Proteomics Standards Initiative)。工程型大科學的這種不可重複性對研究者和科研管理者都是一個挑戰:怎樣評判這類生物學大工程的質量?

    借用一下數學術語,工程型大科學是收斂的,有一個終點;而概念型大科學是發散的,難以界定其最終的研究目的,因此概念型大科學要取得工程型大科學那樣的成功常常是很困難的。美國在1970年代初曾掀起過一場攻克癌症的戰爭。當時是由總統掛帥,國會立法,實施「國家癌症計畫」。然而,30多年過去了,儘管投入了遠遠超過人類基因組計畫的人力和物力,卻沒有取得人們所預期的成果,因為癌症的複雜性遠遠超過了人們在計畫啟動時對癌症的理解。

    從上述討論中可以看到,生命科學領域中的這兩類大科學有某種互補性,工程型大科學的短處正好是概念性大科學的長處,反之亦然。古人曾說過,魚與熊掌不可兼而得之。對於這兩類大科學來說,是否也是只能選取其中之一種,還是有某種方式可以同時兼顧?

    以筆者看來,系統生物學是一種能夠把這兩類不同的大科學進行整合的途徑。工程型大科學實際上就是所謂「發現的科學」,以構造資料庫為主要任務;概念型大科學本質上屬於「假設驅動的科學」,以研究生物學問題為主線。而系統生物學的特點,正是整合兩者的科學。