在自己的研究工作中,经常会遇到一些需要对Gene ID进行转换的情况。目前存在着大量的生物信息数据库,每个数据库都有自己定义的ID命名规则,转换起来实在是一个很大的工作。举个例子,之前构建的Human PPI network, 共选用相关数据库有6个,其中对于蛋白的命名相关的形式多达近10中,耗费了一个多月的时间才完成此ID归一化的过程。当然这个过程中是借助相关的Gene ID Coversion Tools。
下面就对生物信息中用到的IDs Conversion的相关工具进行列举:
1. DAVID: The Database for Annotation, Visualization and Integrated Discover
http://david.abcc.ncifcrf.gov/conversion.jsp .
挺强大的一个工具,不过可能就是速度有点慢...还有一个缺点就是数据不能及时更新。
2. Biomart:
http://www.biomart.org/biomart/martview/65c2ea6c079d1b85820fa5bbf5af62b5
这是一个绝对不错的东东,定期发布新版本,而且可以将数据下载到本地进行操作,推荐一下...
3. BioDBnet:
http://biodbnet.abcc.ncifcrf.gov/db/db2db.php
4. Hyperlink Management System (HMS):
http://biodb.jp/
5. BridgeDB:
http://www.biomedcentral.com/1471-2105/11/5
更多其它可参考资源:
1. http://www.biostars.org/post/show/22/gene-id-conversion-tool/
2. http://hum-molgen.org/NewsGen/08-2009/000020.html