3
answers
925views


已解决

GO便是Gene Ontology。

前言请看:如何在NCBI实现大批量数据的一一对应

corelboy 的问题

帮他AD一下先:欢迎访问我的网站 http://www.bu-pathology.com ,我主要是做病理和医学图像分析

想请教一下,这些大批量的数据在Linux下如何对应的具体操作步骤。比如我有一个list的geneID 我想跟GO item对应起来,应该怎么做?需要什么工具?望不吝赐教,谢谢!

=========================我是分割线============================

NCBI下载gene2go.gz文件

用FTP登陆ftp.ncbi.nih.gov(windows下可以直接打开或是用迅雷/Flastget等下载工具)。cd gene/DATA(windows下依次找到gene/DATA这个文件夹)。ls一下,里面的文件大概有:

ftp ftp.ncbi.nih.gov
cd gene/DATA
ncftp /gene/DATA > ls
ASN_BINARY/         gene2sts         gene_refseq_uniprotkb_collab.gz
ASN_OLD/            gene2unigene     go_process.xml
gene2accession.gz   gene_group.gz    mim2gene
gene2go.gz          gene_history.gz  misc/
gene2pubmed.gz      GENE_INFO/       README
gene2refseq.gz      gene_info.gz

里面有个gene2go.gz。下载下来。解压。

get gene2go.gz
gunzip gene2go.gz

一个list的geneID

如这个文件命名为:gene.list

linux下的代码

for i in $(cat gene.list);do echo $i#`grep "\<$i\>" gene2go`;done

最好在特定的物种里查询,如人的是9606。避免不必要的重复。

for i in $(cat gene.list);do echo $i#`cat gene2go | grep "^9606" | grep "\<$i\>"`;done

~完




    1

    请问一下unigene ID和UniGene cluster number是不是一样的,还有这些ID会不会过期或者被替换,还是一直都可以用的

    Current score: 0
    [Link] | [回复Ta]
    2

    @weihao:
    给个例子和链接看看嘛

    Current score: 0
    [Link] | [回复Ta]
    3

    @weihao:

    unigene ID和UniGene cluster number,及基因注释是一一对应的关系、
    不大可能会变。

    Current score: 0
    [Link] | [回复Ta]

    评论已关闭。