資源描述:
《大規(guī)模表達序列標簽測定及分析》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在教育資源-天天文庫。
1、大規(guī)模表達序列標簽(EST)測定及分析中山大學生科院主要內(nèi)容什么是EST?EST的應用EST序列測定及分析過程實例:家豬腦組織EST分析ESTs的來源上世紀80年代,對cDNA序列進行大規(guī)模測序的想法就曾提出,但對此一直存在爭論,有人認為這種方法能發(fā)現(xiàn)成千上萬的新基因;而反對者則認為cDNA序列缺少重要的基因調(diào)控區(qū)域的信息。90年代初GraigVenter提出了EST的概念,并測定了609條人腦組織的EST,宣布了cDNA大規(guī)模測序的時代的開始(Adamsetal.,1991)?!?3年前ESTs數(shù)據(jù)收錄于GenBank,EBI和DDBJ?!?993年NCBI(Natio
2、nalCenterofBiotechnologyInformation)建立了一個專門的EST數(shù)據(jù)庫dbEST來保存和收集所有的EST數(shù)據(jù)。什么是ESTs?ESTs(ExpressedSequencetags)是從已建好的cDNA庫中隨機取出一個克隆,從5’末端或3’末端對插入的cDNA片段進行一輪單向自動測序,所獲得的約60-500bp的一段cDNA序列。ESTs與基因識別ESTs已經(jīng)被廣泛的應用于基因識別,因為ESTs的數(shù)目比GenBank中其它的核苷酸序列多,研究人員更容易在EST庫中搜尋到新的基因(Boguskietal.,1994).●在同一物種中搜尋基因家族的
3、新成員(paralogs)?!裨诓煌锓N間搜尋功能相同的基因(orthologs)?!褚阎虻牟煌羟心J降乃褜??!咀ⅲ翰贿^很難確定一個新的序列是由于交替剪切產(chǎn)生的或是由于cDNA文庫中污染了基因組DNA序列(Wolfsbergetal.,1997)】ESTs與基因圖譜的繪制EST可以借助于序列標簽位點(sequence-taggedsites)用于基因圖譜的構建.STS本身是從人類基因組中隨機選擇出來的長度在200-300bp左右的經(jīng)PCR檢測的基因組中唯一的一段序列。來自mRNA的3’非翻譯區(qū)的ESTs更適合做為STSs,用于基因圖譜的繪制。其優(yōu)點主要包括:●由于沒
4、有內(nèi)含子的存在,因此在cDNA及基因組模板中其PCR產(chǎn)物的大小相同;●與編碼區(qū)具有很強的保守性不同,3’UTRs序列的保守性較差,因此很容易將單個基因與編碼序列關系非常緊密的相似基因家族成員分開。(JamesSikela等,1991年)GeneMap96‘定位了16,000個基于基因的STS(Schuleretal.,1996);GeneMap98’定位了30,000個基于基因的STS(Deloukasetal.,1998),而且基因圖譜隨著STS的定位正在不斷的更新中。ESTs與基因預測由于EST來源于cDNA,因此每一條EST均代表了文庫建立時所采樣品特定發(fā)育時期和生
5、理狀態(tài)下的一個基因的部分序列。使用合適的比對參數(shù),大于90%的已經(jīng)注釋的基因都能在EST庫中檢測到(Baileyetal.,1998)。ESTs可以做為其它基因預測算法的補充,因為它們對預測基因的交替剪切和3‘非翻譯區(qū)很有效。ESTs與SNPs來自不同個體的冗余的ESTs可用于發(fā)現(xiàn)基因組中轉錄區(qū)域存在的SNPs。最近的許多研究都證明對ESTs數(shù)據(jù)的分析可以發(fā)現(xiàn)基因相關的SNPs(Buetowetal.,1999;Gargetal.,1999;Marthetal.,1999;Picoult-Newbergetal.,1999)。應注意區(qū)別真正的SNPs和由于測序錯誤(EST
6、s為單向測序得來,錯誤率可達2%)而引起的本身不存在的SNPs。解決這一問題可以通過:●提高ESTs分析的準確性?!駥λl(fā)現(xiàn)的SNPs進行實驗驗證。利用ESTs大規(guī)模分析基因表達水平因為EST序列是從某以特定的組織的cDNA文庫中隨機測序而得到,所以可以用利用未經(jīng)標準化和差減雜交的cDNA文庫EST分析特定組織的基因表達譜。標準化的cDNA文庫和經(jīng)過差減雜交的cDNA文庫則不能反應基因表達的水平?!鬋GAP為研究癌癥的分子機理,美國國家癌癥研究所NCI的癌癥基因組解析計劃(CancerGenomeAnatomyProject,CGAP)構建了很多正常的或是癌癥前期的和癌癥
7、后期的組織的cDNA文庫,并進行了大規(guī)模的EST測序,其中大部分的文庫未經(jīng)標準化或差減雜交處理。CGAP網(wǎng)站提供了多種工具用以分析不同文庫間基因表達的差異,如:●DigitalGeneExpressionDisplayer(DGED)●cDNAxProfiler◆基因表達系列分析(SerialAnalysisofGeneExpression,SAGE)基因表達系列分析是一種用于定量,高通量基因表達分析的實驗方法(Velculescuetal.,1995)。SAGE的原理就是分離每個轉錄本的特定位置的較短的單一的序列標簽(約9-