聚類和拼接的目的就是將來自同一個基因的具有重疊部分(over-lapping)的EST整合至單一的簇(cluster)中。通過聚類和拼接,可產生較長的一致性序列(consensussequence),便于進行注釋;降低數據的冗余,糾正測序錯誤,用于檢測選擇性剪切(alterna...[繼續閱讀]
海量資源,盡在掌握
聚類和拼接的目的就是將來自同一個基因的具有重疊部分(over-lapping)的EST整合至單一的簇(cluster)中。通過聚類和拼接,可產生較長的一致性序列(consensussequence),便于進行注釋;降低數據的冗余,糾正測序錯誤,用于檢測選擇性剪切(alterna...[繼續閱讀]
基因注釋即利用BLAST等序列聯配工具,通過將聚類和拼接所產生的一致性序列與已知的非冗余蛋白質數據庫(nr)、非冗余核酸數據庫(nt)、蛋白質功能結構域(domain)和基序(motif)等二級數據庫進行同源比對,從而賦予這些一致性序列一定的...[繼續閱讀]
從大規模EST測序分析數據可以發現大量新基因,除此以外其產生的序列和功能信息,還可用于進行比較基因組學分析、基因表達譜分析和選擇性剪切分析等。EST測序分析以其快速、低廉、直觀的優勢,成為連接結構基因組學和功能基因...[繼續閱讀]
1.AdamsM,VenterJCetal.ChromosomalDistributionof320GenesfromaBraincDNALibrary.NatureGenetics,1993,4(4):381~3862.AdamsM,JennyM,Kelleyetal.ComplementaryDNASequencing:ExpressedSequenceTagsandHumanGenomeProject.Science,1991,252(5013):1651~1656...[繼續閱讀]
大多數人已經習慣在個人計算機上工作,對窗口界面、字處理程序甚至一些數據分析軟件包非常熟悉。但是隨著基因組學研究的快速發展,EST數據的爆炸性增長,常用的個人電腦已不能滿足處理基因組大量數據和進行核苷酸及氨基酸復...[繼續閱讀]
EST數據分析計算中最常用的是簡單的序列比對,對于少量且簡單的運算,個人電腦在性能上不會輸給昂貴的服務器太多。EST數據分析所需計算機的基本配置:●處理器:486及以上CPU●內存:256MB以上●硬盤:20G以上當處理數據較多或所做分析...[繼續閱讀]
Cluster技術是近10年來興起的一項高性能計算技術,可用于科學研究系統的搭建,因此在EST數據分析中被廣泛采用。Cluster系統由一組獨立/完整的計算機互聯組成,是一種并行系統或分布式系統,提供完整的計算資源。在體系結構上具備高...[繼續閱讀]
優良的服務器應具有高可靠性和高穩定性,易于管理和維護,盡量少出故障或死機。承擔連續不斷的工作,尤其是在大規模EST數據分析過程中,許多程序都在服務器上運行,一旦服務器發生故障,將會造成大量數據丟失,產生不可估量的損失...[繼續閱讀]
和微型機有所區別,大型機通常是指安裝在帶框鐵盒子里的大型計算機系統。如system/360開始的一系列的IBM計算機,Amdahl,HitachiDataSystems(HDS)制造的兼容系統等。大型機在結構上通過開發處理器中各個層次的并行性和軟硬件協同來提高性...[繼續閱讀]
操作系統為它們的程序運行、打開文件、讀文件、分配存儲區等提供服務。對于多用戶計算機系統而言,Unix是一個功能強大的操作系統。它已經存在了30年之久,近年來,Unix不斷優化:增強了計算機之間的網絡功能;初始化多個異步工作...[繼續閱讀]