水稻基因命名

RGAP:基因命名法 
 
在訪問水稻基因組註解計劃的FTP地址或網頁上的模擬分子數據時,會見到其內部使用的術語,如TU和基因模塊。這篇文章旨在解釋此計劃的命名法,並且將其與生物學家普遍使用的命名法聯繫起來。 
轉錄單位: 
一個轉錄單位相當於一個基因或模擬分子上的一個基因座。轉錄單元以一種精確的命名規則儲存在數據庫中,合適名字如:x.tyyyyy 。其中,x指的是BAC或模擬分子的收錄編號,yyyyy是轉錄單位的特異標識符。 
位點標識符: 
對於最終的用戶,上面命名規則介紹的複雜在於轉錄單位的合適名字可在版本之間轉換。爲了避免這個問題,基因的位點標識符已經在模擬分子的這個版本中被實施了。和擬南芥基因組命名使用的約定一樣,對更大的水稻基因組也只有較小的改變。每個細胞核基因被標記爲LOC_OsXXg#####,其中LOC_Os代表水稻的座點,XX表示染色體編號01-12,g代表基因,5個#####表示基因在染色體上的順序。LOC_Osp#g#####是用於質體基因,對於線粒體基因是使用LOC_Osm#g#####。基因(基因座)的編號是沿着染色體或細胞器的基因組,按順序每隔10個編號的,這是考慮到了將來新基因座的插入。在編號系統中提供了足夠的空間用於物理間隔,在序列上允許已經在物理間隔上填滿的新基因的插入。爲了促進基因的新位點標識符在以前兩種表示方式中的整合,我們已經開發了一個版本轉換器,允許使用者容易地找到以前的基因和模塊所對應的新位點標識符,這些以前的基因和模塊是根據合適名字被標誌的 
基因模塊: 
一個基因模塊是代表一個轉錄單位的mRNA轉錄物,因此它包含着轉錄本的特徵信息,如內含子和外顯子的邊界、剪切位點和非翻譯序列等。由於mRNA轉錄物的可變剪切,一個轉錄單位可以產生不止一個基因模塊。基因模塊在數據庫中有唯一的合適名字,並且它們和相應的轉錄單位也被連接起來。合適名字採取x.myyyyy的形式,其中x代表BAC或者模擬分子收錄ID,yyyyy是指基因模塊獨特的標識符。 
其中Pseudomolecule:模擬分子;feat_name:合適名字。感覺還是不對,但是找不到合適的詞來表示了! 
RAP-DB:水稻基因命名法 
 
自從國際水稻基因組測序計劃完成了水稻日本晴的基因組測序,其希望以此解密基因組的所有基因區。系統的基因座標識符被指定到IRGSP基因組彙編的RAP中。一個ID(OsXXg#######)包括物種名(Os代表水稻),一個表示染色體的兩位數,標識符的類型(g表示基因)和一個表示在染色體上相應順序的七位數。這種命名是由基因標記命












名與聯合委員會在第一、二屆水稻註解計劃大會上提出的。通過集中討論基礎上的改良,最終被IRGSP/RAP認定。水稻標識符的RAP註解以AP008207-AP009218 的登錄號被遞交至DDBJ/EMBL/Genbank,並且在RefSeq中使用。水稻的代碼也在UniProtKB/Swiss-Prot 中作爲位點標識符使用。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章