GO便是Gene Ontology。
前言请看:如何在NCBI实现大批量数据的一一对应
corelboy 的问题
帮他AD一下先:欢迎访问我的网站 http://www.bu-pathology.com ,我主要是做病理和医学图像分析的
想请教一下,这些大批量的数据在Linux下如何对应的具体操作步骤。比如我有一个list的geneID 我想跟GO item对应起来,应该怎么做?需要什么工具?望不吝赐教,谢谢!
=========================我是分割线============================
在NCBI下载gene2go.gz文件
用FTP登陆ftp.ncbi.nih.gov(windows下可以直接打开或是用迅雷/Flastget等下载工具)。cd gene/DATA(windows下依次找到gene/DATA这个文件夹)。ls一下,里面的文件大概有:
ftp ftp.ncbi.nih.gov cd gene/DATA
ncftp /gene/DATA > ls ASN_BINARY/ gene2sts gene_refseq_uniprotkb_collab.gz ASN_OLD/ gene2unigene go_process.xml gene2accession.gz gene_group.gz mim2gene gene2go.gz gene_history.gz misc/ gene2pubmed.gz GENE_INFO/ README gene2refseq.gz gene_info.gz
里面有个gene2go.gz。下载下来。解压。
get gene2go.gz gunzip gene2go.gz
一个list的geneID
如这个文件命名为:gene.list
linux下的代码
for i in $(cat gene.list);do echo $i#`grep "\<$i\>" gene2go`;done
最好在特定的物种里查询,如人的是9606。避免不必要的重复。
for i in $(cat gene.list);do echo $i#`cat gene2go | grep "^9606" | grep "\<$i\>"`;done
~完
有点相关的问题
- 怎样 go注释之柱状图 (0.737)
- 关于如何查找蛋白质模块的功能 (0.737)
- GO中查找 (0.737)
- 批量序列如何进行Go和kegg的分析 (0.737)
- 关于“NCBI对于gene_info的建议” (0.263)
- ncbi的gene数据库 (0.263)
- 教程:在NCBI批量Blast (0.263)
- ncbi 的orf finder (0.263)
- 问个弱问题,NCBI上怎么下个线粒体环? (0.263)
- 怎么在NCBI的nr database抽提同一种基因 (0.263)
- 有关NCBI上下载数据库的问题 (RANDOM - 0.263)
请问一下unigene ID和UniGene cluster number是不是一样的,还有这些ID会不会过期或者被替换,还是一直都可以用的
1●
@weihao:
给个例子和链接看看嘛
362●
@weihao:
unigene ID和UniGene cluster number,及基因注释是一一对应的关系、
不大可能会变。
362●
评论已关闭。