- 相關推薦
基于RefSeq數據庫的人類標準轉錄數據集的構建
美國國家生物信息技術中心(NCBI)提供了具有生物意義上的非冗余的基因和蛋白質序列的RefSeq參考序列數據庫.然而,由于基因普遍存在的多態性以及不同實驗室對于序列測定的質量控制存在差異等原因,已發現RefSeq數據庫可能存在部分質量問題.文章基于"中心法則"提出"標準轉錄數據集"的概念,以人類基因和基因組序列為例,利用BLAT、Sim4和自行設計的Elparser等基因結構解析程序分析了RefSeq人類基因轉錄數據(2005-4-18)與目前所公布的人類標準基因組(2005-4-20)的對應關系.對于有實驗證據支持的標記為NM_和NR_的記錄,多種程序分析結果表明,其與標準基因組完全相對應的記錄為9 771個;符合多個程序修訂標準的記錄有10 943個;而與標準基因組有較大差異的記錄為203個,多種程序分析結果不一致的記錄為2 676個,提示研究人員在使用此非標準轉錄組數據時,必須考慮到其存在非標準轉錄的原因甚至存在錯誤的可能性.此文為基于標準、高質量轉錄數據集的生物信息學數據分析、分子生物學實驗設計、基因多樣性和遺傳變異分析等提供了重要的參考標準.相關結果可通過http://biocompute bmi.ac.cn/transcriptome/訪問.
作 者: 李稚鋒 李玉鑒 趙東升 杭興宜 王正志 駱志剛 張成崗 LI Zhi-Feng LI Yu-Jian ZHAO Dong-Sheng HANG Xing-Yi WANG Zheng-Zhi LUO Zhi-Gang ZHANG Cheng-Gang 作者單位: 李稚鋒,LI Zhi-Feng(軍事醫學科學院放射與輻射醫學研究所,北京,100850;國防科技大學機電工程與自動化學院,長沙,410073)李玉鑒,LI Yu-Jian(北京工業大學計算機學院,北京,100822)
趙東升,ZHAO Dong-Sheng(軍事醫學科學院衛生勤務與醫學情報研究所,北京,100850)
杭興宜,張成崗,HANG Xing-Yi,ZHANG Cheng-Gang(軍事醫學科學院放射與輻射醫學研究所,北京,100850)
王正志,WANG Zheng-Zhi(國防科技大學機電工程與自動化學院,長沙,410073)
駱志剛,LUO Zhi-Gang(國防科技大學并行與分布處理國防科技重點實驗室,長沙,410073)
刊 名: 遺傳 ISTIC PKU 英文刊名: HEREDITAS(BEIJING) 年,卷(期): 2006 28(3) 分類號: Q754 關鍵詞: RefSeq數據庫 轉錄組 質量控制 人類標準轉錄數據集【基于RefSeq數據庫的人類標準轉錄數據集的構建】相關文章:
基于網絡構建稀土化合物物性數據庫04-27
基于GIS的基礎數據庫管理系統04-29
基于公路數據庫的數據資源整合研究04-27
基于多級組織結構網絡數據庫數據通信的實施04-28
基于宗地變更的地籍時空數據庫研究04-27
基于數據庫的自動測試系統(ATS)軟件04-27