近日,加州大學(xué)圣地亞哥分校(UCSD)研究人員在《自然》雜志上發(fā)表研究,介紹其使用人工智能技術(shù)發(fā)現(xiàn)了新的DNA啟動碼“下游核心啟動子區(qū)”(downstream core promoter region-DPR),有望在生物技術(shù)和生物醫(yī)學(xué)應(yīng)用領(lǐng)域用來控制基因啟動。
據(jù)研究人員介紹,DNA接收到A、C、G、T這4種堿基的編碼指導(dǎo)后發(fā)出精確指令,人類基因收到指令后被激活采取行動。目前已知,近25%的基因都是由TATAAA類似序列(即“TATA框”)進(jìn)行轉(zhuǎn)錄的,但由于DNA堿基序列可能性非常多,剩下75%的基因是如何啟動的一直是個謎。
研究人員對50萬個隨機DNA序列的DPR活動進(jìn)行了評估,篩選出其中20萬個序列生成了一種能夠精確預(yù)測人體DNA中DPR活動的機器學(xué)習(xí)模型,此外還制作了一個能夠識別TATA框序列的類似機器學(xué)習(xí)模型。研究人員使用新模型對數(shù)千個已知TATA框和DPR活動情況的測試樣本進(jìn)行評估后發(fā)現(xiàn),其預(yù)測能力“非常棒”。研究結(jié)果顯示,人類基因中確實存在DPR活動,且其發(fā)生率與TATA框相當(dāng)。據(jù)研究作者、UCSD生物科學(xué)系特聘教授角川介紹稱,DPR能夠啟動約1/4至1/3的基因。此外,研究人員還發(fā)現(xiàn),DPR和TATA框之間存在一種奇妙的二元性,TATA框序列啟動的基因缺少DPR序列,反之亦然。
角川表示,DPR此前之所以未被發(fā)現(xiàn)是因為其不具備顯而易見的序列模式,隱藏在DNA序列中的加密信息使之具備DPR屬性,人類無法破譯這一信息,但機器學(xué)習(xí)模型可以。使用人工智能對DNA序列模式進(jìn)行分析應(yīng)該可以提升研究人員對人體細(xì)胞中基因啟動的理解和控制。
免責(zé)聲明:本網(wǎng)轉(zhuǎn)載自其它媒體的文章,目的在于弘揚科技創(chuàng)新精神,傳遞更多科技創(chuàng)新信息,并不代表本網(wǎng)贊同其觀點和對其真實性負(fù)責(zé),在此我們謹(jǐn)向原作者和原媒體致以崇高敬意。如果您認(rèn)為本站文章侵犯了您的版權(quán),請與我們聯(lián)系,我們將第一時間刪除。
據(jù)研究人員介紹,DNA接收到A、C、G、T這4種堿基的編碼指導(dǎo)后發(fā)出精確指令,人類基因收到指令后被激活采取行動。目前已知,近25%的基因都是由TATAAA類似序列(即“TATA框”)進(jìn)行轉(zhuǎn)錄的,但由于DNA堿基序列可能性非常多,剩下75%的基因是如何啟動的一直是個謎。
研究人員對50萬個隨機DNA序列的DPR活動進(jìn)行了評估,篩選出其中20萬個序列生成了一種能夠精確預(yù)測人體DNA中DPR活動的機器學(xué)習(xí)模型,此外還制作了一個能夠識別TATA框序列的類似機器學(xué)習(xí)模型。研究人員使用新模型對數(shù)千個已知TATA框和DPR活動情況的測試樣本進(jìn)行評估后發(fā)現(xiàn),其預(yù)測能力“非常棒”。研究結(jié)果顯示,人類基因中確實存在DPR活動,且其發(fā)生率與TATA框相當(dāng)。據(jù)研究作者、UCSD生物科學(xué)系特聘教授角川介紹稱,DPR能夠啟動約1/4至1/3的基因。此外,研究人員還發(fā)現(xiàn),DPR和TATA框之間存在一種奇妙的二元性,TATA框序列啟動的基因缺少DPR序列,反之亦然。
角川表示,DPR此前之所以未被發(fā)現(xiàn)是因為其不具備顯而易見的序列模式,隱藏在DNA序列中的加密信息使之具備DPR屬性,人類無法破譯這一信息,但機器學(xué)習(xí)模型可以。使用人工智能對DNA序列模式進(jìn)行分析應(yīng)該可以提升研究人員對人體細(xì)胞中基因啟動的理解和控制。
免責(zé)聲明:本網(wǎng)轉(zhuǎn)載自其它媒體的文章,目的在于弘揚科技創(chuàng)新精神,傳遞更多科技創(chuàng)新信息,并不代表本網(wǎng)贊同其觀點和對其真實性負(fù)責(zé),在此我們謹(jǐn)向原作者和原媒體致以崇高敬意。如果您認(rèn)為本站文章侵犯了您的版權(quán),請與我們聯(lián)系,我們將第一時間刪除。