科科學人這次所在乎的『文字遊戲』是指序列比對(Sequence Alignment)

推薦的進階素材是這篇Science文章:


Science 19 June 2009:
Vol. 324. no. 5934, pp. 1561 - 1564
DOI: 10.1126/science.1171243

Reports

Rapid and Accurate Large-Scale Coestimation of Sequence Alignments and Phylogenetic Trees

Kevin Liu, Sindhu Raghavan, Serita Nelesen, C. Randal Linder, Tandy Warnow


解釋名詞:

*序列比對(Sequence Alignments)

*系統發生樹(Phylogenetic Trees):亦可稱為演化樹

 

江江江江江!非常狠,序列比對和系統發生樹的研究文章很少見可以刊登上Science期刊,可見這篇文章的重要性。系統發生樹可以用來分析物種/個體間的親緣關係,目前多採DNA分子序列來進行系統發生學的分析。根據這篇報導,作者們提供了更快、更準確的改良計算方法來為大量的生物物種/個體進行系統發生樹的重建。喔對了,作者團隊主要來自於得克薩斯大學奧斯汀分校的計算機科學家和生物學家。他們發表了他們的新方法在Science期刊。

自從達爾文150年前的『物種原始』發表之後 ,演化生物學家們企圖以系統發生樹來解釋物種/個體之間的演化關係,對象包含了植物、動物和其他生物體。這門學問被稱為系統分類學(Systematics),在過去20年伴隨計算機科學、遺傳學和分子生物學的進展,而有長足的進步與發展。然而,世界上已被紀錄的150萬種物種之間的演化之謎仍有待生物學家去深入研究,而演化故事中也常常充滿了驚喜的事件等著被人們發現。

為了弄清楚物種之間的演化關係,科學家需要從生物身上取得大量的分子數據以進行分析,例如常見的DNA和蛋白質序列。計算機科學家坦迪瓦爾諾(Tandy Warnow),生物學家蘭蒂特林德(Randy Linder)和研究生們一起創造了一個自動化的計算方法,稱為沙嗲(SATe,亂翻...XD)。

沙嗲可以用來分析這些分子數據,並同時想辦法如何將序列分析的時間縮短至24小時內。(在過去,精確的系統發生樹重建演算法相當耗時,比方說分析的物種數量高達1000種時,那麼計算所需的CPU時間往往動輒數月或數年...)



該團隊之前發表的同步計算方法,即瓦爾諾(Warnow)和林德(Linder)的同步計算法,僅能分析20種或更少的物種,且計算時間達數月之久。本篇研究的領導者瓦爾諾說:“沙嗲可以徹底改變系統發生樹的重建法,也可能對目前演化上的認知產生革命性的衝擊。”此外,沙嗲可以準確地分析演化速度較快的DNA序列,事實上,這些高速演化的DNA序列以前時常因為計算上的困難而被捨棄。



在建立系統發生樹之前,用來進行分析的DNA和蛋白質序列必須先行組織一番,而這種處理過程被稱為序列比對(Sequence Alignments)。 瓦爾諾和林德所開發的程式的關鍵性突破在於能夠迅速而準確地調整並比對這些序列數據。另一名作者林德說:“我們的處理程序是相當新穎的,因為它能快速且同步地比對序列,並建立最佳的系統發生樹。過去的方式僅僅對大量的序列進行一次的比對,而我們的新方法可以從多種不同的排列結果之中,找到較正確、較適合的那個。” 這點很重要,因為不同的序列比對結果可能會產生差異性極大的系統發生樹,而科學家必須找到最佳的(最正確的)系統發生樹以解答物種之間的演化關係。

 

瓦爾諾、林德和他們的學生使用計算機生成的模擬序列和真實的生物序列來對沙嗲進行測試,結果相當令人滿意。瓦爾諾說:“過去生物學家總是對計算機所產生的序列比對結果抱持保留態度,現在他們應該可以放心地使用我們的程式了。這將有助於建立更準確的系統發生樹。” 一名演化生物學家,邁克爾布勞恩(Michael Braun)在看過這篇文章之後評論說道:“瓦爾諾和林德創建了一個方法,加快了分析的過程,且刪除任何人為的主觀看法。這的確是演化生物學向前邁出的一大步。”

 

* 要不要也來重新分析一下人類到底是和黑猩猩還是紅猩猩比較接近呀...XD

arrow
arrow
    全站熱搜

    kururu 發表在 痞客邦 留言(0) 人氣()