人類的基因到底有多少個? 最新研究1.9萬個
時間:2014-07-09 09:36:18 來源:轉(zhuǎn)化醫(yī)學(xué)網(wǎng) 點擊:

目前,由西班牙國家癌癥中心(CNIO)基礎(chǔ)研究副主任和結(jié)構(gòu)計算生物學(xué)團(tuán)隊負(fù)責(zé)人Alfonso Valencia帶領(lǐng)的一項研究,將人類蛋白質(zhì)編碼基因數(shù)目更新到了19,000個;比最近注釋的基因少1700個,遠(yuǎn)低于最初估計的100,000個。相關(guān)研究結(jié)果發(fā)表在最近的國際著名學(xué)術(shù)期刊《人類分子遺傳學(xué)》(Human Molecular Genetics),得出結(jié)論認(rèn)為,幾乎所有這些基因,都有早于5000萬年前靈長類動物出現(xiàn)的祖先。
“縮小人類基因組”,這就是Valencia描述多年來他們對人類基因組中蛋白質(zhì)編碼基因數(shù)目的不斷修正,最終在當(dāng)前的研究中縮減到大約19,000個人類基因。他補(bǔ)充說:“基因組的編碼部分(產(chǎn)生蛋白質(zhì))是不斷活動的。幾年前沒有人能想象,這么小數(shù)量的基因,能制造出如此復(fù)雜的東西。”
科學(xué)家們首先分析蛋白質(zhì)組學(xué)實驗;蛋白質(zhì)組學(xué)是檢測蛋白質(zhì)分子最有力的工具。為了確定人類蛋白質(zhì)圖,研究人員整合了來自七項大規(guī)模質(zhì)譜研究、50多份人體組織的數(shù)據(jù)。Valencia說:“這樣做,是為了驗證哪個基因真正產(chǎn)生蛋白質(zhì)。”
少于10個基因能區(qū)分人和小鼠
研究發(fā)現(xiàn)了稍多于12,000個蛋白質(zhì),研究人員將這些蛋白質(zhì)定位到基因組上的相應(yīng)位置。他們分析了人類基因組中被注釋的幾千個基因,但是這并未出現(xiàn)在蛋白質(zhì)組學(xué)分析中,Tress得出結(jié)論:“其中1,700個我們認(rèn)為會產(chǎn)生蛋白質(zhì)的基因,因為各種原因沒有產(chǎn)生蛋白質(zhì),或者是因為它們沒有表現(xiàn)出任何蛋白質(zhì)編碼特征,或者是因為它們閱讀框的保守性不支持蛋白質(zhì)編碼功能。”
來自研究的一個假設(shè)是,超過90%的人類基因會產(chǎn)生蛋白質(zhì),這些蛋白質(zhì)起源于億萬年前動物王國的后生動物或多細(xì)胞生物;對于那些起源早于5000萬年前靈長類動物出現(xiàn)的基因來說,這個數(shù)字超過了99%。
研究人員稱:“我們的數(shù)據(jù)表明,人類和靈長類動物在基因和蛋白質(zhì)水平上的差異非常小。”本文共同作者、Valencia 實驗室的研究人員David Juan稱:“將人和小鼠區(qū)分開的基因數(shù)目,甚至少于10個。”與500多個具有當(dāng)前注釋中發(fā)現(xiàn)的靈長類起源的人類基因相反。研究人員得出結(jié)論:“靈長類動物之間的生理和發(fā)育差異,很可能是由基因調(diào)控引起,而不是問題蛋白質(zhì)的基本功能差異造成的。”
以少勝多
人類復(fù)雜性的來源,更多地在于基因如何使用,而不是基因的數(shù)目,在于蛋白質(zhì)中發(fā)生的成千上萬的化學(xué)變化,或者在于通過基因組非編碼區(qū)控制這些蛋白質(zhì)的生產(chǎn),這包括90%的全基因組,在最近的國際ENCODE項目中已經(jīng)做出描述。
這項研究使人類基因的數(shù)目接近其他物種,如秀麗隱桿線蟲——只有1毫米長的蠕蟲。但是,Valencia不愿意作比較:“人類基因組是注釋最好的,但是我們?nèi)匀徽J(rèn)為,這1700個基因可能要重新注釋。我們的研究表明,我們將不得不重新計算所有的基因組,不僅是人類基因組。”
這些研究結(jié)果是GENCODE項目的一部分,GENCODE是合并到ENCODE項目的一個財團(tuán),由世界各地的研究小組組成,包括Valencia研究小組,他們的任務(wù)是提供人類基因組中所有基因元件的注釋。
Valencia稱:“GENCODE正在討論我們的數(shù)據(jù),以并入到新的注釋中。當(dāng)這一切發(fā)生時,它將重新定義整個人類基因組圖,以及它如何用于宏項目,如癌癥基因組分析的項目。”