29
answers
4,357views


已解决

先要多谢一下 Sophie 与 rebeccajiejie 的热心,让 云生物 看起来着实有些了活力。也希望更加的人参与进来回答问题。得开始认真宣传一下才行啊。

最近Sophie问了我关于批量Blast的问题。我尝试了一下NCBI的批量Blast,感觉非常不错。 写个教程分享一下。拿水稻的序列Blast做个例子。

Batch entrez

Batch entrez(http://www.ncbi.nlm.nih.gov/sites/batchentrez)是NCBI提供的批量搜索entrez数据库的工具。非常好用的。

比如说你有一个大量的accession或是gi的list(在文件里一行一个)。如下:

NM_016618
NM_022735
NM_023935
NM_022047
NM_004395

打开Batch entrez,载入这个文件。

如上图所示,选择一个文件。选择一个数据库。然后按Retrieve。

批量下载Fasta序列

在以一步之后,进入结果页面。在Display选择Fasta,然后再在send to 里选 择send to File。这样就完成了批量下载 Fasta序列了。

在NCBI批量Blast

上一步下载好的Fasta序列文件sequence.fasta先保留。打开Blast界面,http://blast.ncbi.nlm.nih.gov/Blast.cgi。选 择需要的物种的Blast程序。

上面已经说了拿水稻的做为例子。如下图所示,在choose a file to upload里选择刚刚下载好的Fasta文件。其它参数按需要选 择。

点Begin Search后,会进下如下图的界面。在Show Alignment as 里选 择 Plaing text(默认为html格式)。在Alignment View一栏选择Hit Table(即相当于在Blast选择-m9的参数)。

选择Hit table后,返回的结果有12列,依次是:

query id    query的ID

subject ids    比对到的ID

% identity   相似性(%)

alignment length  比对到的长度

mismatches  相对而言的,在alignment length中有多少个没有匹配,即PM

gap opens   同上,在alignment length中有多少个gap

q. start  query序列比对的开始

q. end   query序列比对的结束

s. start   subject序列比对的开始

s. end   subject序列比对的结束

evalue  E值

bit score  比对的得分

上面选 择完了之后,点击View report就可以查看结果了。如果数据太大,需要等一等。

返回的结果已经是清晰明了的。再把结果导入到Excel做一些筛选 工作就行了。这就不讲了。

NCBI批量Blast 完~  欢迎大家多写点文章来投稿啊。




    1

    我有一个问题啊,这种批量的在线比对有没有条数的限制的呢?

    Current score: 1
    [Link] | [回复Ta]
    2

    @rebeccajiejie:具体不知。我估计是没有的。 我试了2千多个序列都没问题。几万个对NCBI的服务器来说还是小意思的。

    Current score: 0
    [Link] | [回复Ta]
    3

    哇,我以前都神经兮兮的本地化,看来是很没必要的啦,不过我喜欢看 -m 9的结果

    Current score: 0
    [Link] | [回复Ta]
    4

    我想用核酸 basic blast
    那个输出的结果怎么调整,貌似没有找到hit table那个选项呢

    Current score: 0
    [Link] | [回复Ta]
    5

    额,找到了,呵呵,我真是笨啦

    Current score: 0
    [Link] | [回复Ta]
    6

    哇塞,这两天做实验搞得灰头土脸的。真是:园中才数日,世上已千年啊!
    不过这两天蛮有收获的是,纠结很久的data,终于搞定了。等忙过这段时间,我整个conclusion出来啊。

    Current score: 0
    [Link] | [回复Ta]
    7

    @rebeccajiejie:原来hit table就是-m9的格式。呵~ 搞错了。马上改改。

    Current score: 0
    [Link] | [回复Ta]
    8

    @O型天蝎座:
    那如何blast得到是在哪个染色体上面呢?

    Current score: 0
    [Link] | [回复Ta]
    9

    @Sophie:

    对基因组序列Blast啊。就是完整的染色体的全长序列。Blast后就会得到的一个accession号的了。

    根据这个accession就知道是哪条染色体了。

    Current score: 0
    [Link] | [回复Ta]
    10

    @O型天蝎座:
    悲剧,看来我的问题又没有描述清楚。我根据你上面的步骤做批量的blast,得出的结果就只是包括上面提及的9项。但是我更想知道每个编号的chr、locus、length等值。这应该怎么做呢?

    Current score: 0
    [Link] | [回复Ta]
    11

    @Sophie:

    根据染色体的 accession 搜一下就出来了。

    Current score: 0
    [Link] | [回复Ta]
    12

    @O型天蝎座:
    没有genomic这个结果啊。

    Current score: 0
    [Link] | [回复Ta]
    13

    @Sophie:

    什么意思。不明白你说的

    Current score: 0
    [Link] | [回复Ta]
    14

    @O型天蝎座:
    恩,我现在明白我的意思了。呵呵。我的意思是说,所的结果里面没有该sequence是在哪个染色体上面的描述(或者是染色体编号)。所以有很多疑问。后来发现在subject ids里面有相应的描述,例如NC_008401.1,我现在可以根据这个查找染色体位置了。有点苕。呵呵。

    Current score: 0
    [Link] | [回复Ta]
    15

    @Sophie:

    你才发现~~ ~~

    Current score: 0
    [Link] | [回复Ta]
    16

    @O型天蝎座:
    你不应该回复这句话的。呵呵!!!!

    Current score: 0
    [Link] | [回复Ta]
    17

    这个BLAST界面是怎么进去的?我是测序回来的结果,也能进行批量的比对吗?我没有序列号只有序列?谢谢

    Current score: 1
    [Link] | [回复Ta]
    18

    @bingmei:

    http://blast.ncbi.nlm.nih.gov/Blast.cgi

    Current score: 0
    [Link] | [回复Ta]
    19

    @bingmei:
    如果不方便记这么多,你可以在Google里面输入Entrez Batch。
    这个蛮好用。

    Current score: 0
    [Link] | [回复Ta]
    20

    ask:获得的FASTA格式的序列,如果要保存到本地的txt.格式的文件中,是不是还需要自己手动一个一个的复制粘贴到文件中保存,有没有批量下载保存到txt.的方法?

    Current score: 0
    [Link] | [回复Ta]
    21

    @biobefreind:

    请另开一贴发问。。。

    Current score: 0
    [Link] | [回复Ta]
    22

    测试。

    Current score: 0
    [Link] | [回复Ta]
    23

    请问下,如果不是一个物种的序列,而是多个物种的序列呢,NCBI上面有批量的吗?@O型天蝎座:

    Current score: 0
    [Link] | [回复Ta]
    24

    @bioxp: 也是一样的嘛。

    Current score: 0
    [Link] | [回复Ta]
    25

    楼主,我照你的方法进行检索之后,提示我的是以下记录不能被检索到,但是这些序列我都已经有了,这是怎么回事?

    Current score: 0
    [Link] | [回复Ta]
    26

     

    @chaojixijun:

    没明白你的意思。 最好重发贴。 详说问题。。

    Current score: 0
    [Link] | [回复Ta]
    27

    @柳城:我的一个文本文档中有2000多个fasta格式的文件,照你的方法在网页上检索不到啊,谢谢

    Current score: 0
    [Link] | [回复Ta]
    28

     

    @chaojixijun:

    那不大可能吧。 那有可能是你选错 数据库 或是 某个步骤错了

    Current score: 0
    [Link] | [回复Ta]
    29

    我按这种方法做的蛋白质的blast,导出了fasta序列,可是blastp的时候 居然显示

    Can't find the requested web page.

    请问这个是怎么回事?

    Current score: 0
    [Link] | [回复Ta]

    评论已关闭。

adobe free

adobe free

winrar 3 download

winrar 3 download freedownload

windows 7 free

windows 7 crack

key office 2010

office 2010 key

download photo shop free

photo shop serial

corel dvd moviefactory 6

corel dvd moviefactory 6 downloads

free corel photoshop download

free corel photoshop download keygen

photoshop key

photoshop key

free corel downloads

free corel downloads cracked

free winrar download for xp

download winrar for xp for free

serial corel draw 11

serial corel draw 11 serials

windows 7 key

windows 7 key

photo shop key

photo shop key

winrar password cracker serial

wirar password cracker

serial winzip 11

serial winzip 11 key

cs5 serialz

cs5 serialz free

office 2010 professional key

office 2010 key

office 2010 free

office 2010 key

windows key

windows key