GI?number及Accession.Version就像是序列的身份證號碼一樣。通過這個(gè)號碼,我們能在NCBI/DDBJ/EMBL等數(shù)據(jù)庫查到該序列的數(shù)據(jù)。
問題: 回答: 兩種類型的序列標(biāo)識符(GI number、Accession.Version),有著不同的格式,并且開始使用的時(shí)間也不同。 1,GI?number(有時(shí)用小寫字母"gi"),由一系列的數(shù)字組成,是NCBI在處理序列時(shí)連續(xù)分配的。跟序列的Accession number是沒有關(guān)聯(lián)。
2,Version區(qū),通常我們都可以看到是Accession.Version,如NM_008261.1
GI?number作為序列的唯一標(biāo)識符已經(jīng)在GenBank使用多年,其它相關(guān)的數(shù)據(jù)庫仍然保留這個(gè)號碼。1999,隨著國際核酸序列數(shù)據(jù)庫同盟(NCBI/DDBJ/EMBL,International Nucleotide Sequence Database Collaboration)的成立,Version系統(tǒng)也開始啟用。 這兩種不同系統(tǒng)的標(biāo)識符是平行運(yùn)行的,即當(dāng)序列的數(shù)據(jù)改變或升級時(shí),將會分配一個(gè)新的GI?number,Accession number后的版本也會隨著增加。如NM_008261.1-->NM_008261.2(GI?number:6680238-->46575915)。 大概的歷史是這樣子的,一開始在GenBank及相關(guān)的數(shù)據(jù)庫中使用的是GI?number,GI是"GenInfo Identifier" 的縮寫。后來國際核酸序列數(shù)據(jù)庫同盟成立后,考慮到GI?number不適合作為國際性的通用序列標(biāo)識符,所以就弄了一個(gè)新的詞叫NID,代表核酸序列,PID代表氨基酸序列。但到了1999年12月,這個(gè)叫法就中斷了,全部統(tǒng)一改為用"GI"表示。 |
|
|