现在手上有10个blastn -m 9的结果,想要把所有能比对上的query ID和subject ID提取出来以后求这10个结果的交集,但是不会写代码干着急,求助帮忙~
我要的是各自query ID和subject ID,然后求这十组数据的交集
blast -m 9 结果示例:
query id, subject id, %identity, alignment length, mismatches,gap openings
isotig1138 NODE_2836 100.00 20 0 0
isotig1139 NODE_2354 100.00 20 0 0
有点相关的问题
- 如何大批量blast? (1.000)
- 教程:在NCBI批量Blast (1.000)
- 请教本地blast问题 (1.000)
- 新手做BLAST时遇到的问题 (1.000)
- 询问批量蛋白Blast (1.000)
- 从blastx结果中提取编码区 (1.000)
- 本地化blast的问题 (1.000)
- blastout结果筛选 (1.000)
- 求助,NCBI里面有没有针对环境样品的批量blast? (1.000)
- 在本地BLAST时遇到的一些问题 (1.000)
- 一些内容的总结 (RANDOM - 1.000)
perl中使用BPlite模块可以提取blast中各项信息,你把那模块下载下来,仔细看看里面的说明,应该就可以了
1●
不想写代码的话。
要我说,导入excel处理还更好呢。
362●
excel对行数有限制,数据太多,显示不了全部。想写代码,但是在学习中,自己还写不出来。工作又不能等,只有求助了,唉
9●
@jingxy:
那倒是。 你会linux 还是perl?
362●
见笑了,今年2月份换了工作才开始接触linux,没几天,二者都属于初级阶段
9●
@jingxy:
把完整的前几行贴出来看看。。
362●
# BLASTN 2.2.19 [Nov-02-2008]
# Query: isotig11382_length_828_1_F1
# Database: ../EST_addlength.fna
# Fields: Query id, Subject id, % identity, alignment length, mismatches, gap openings, q. start, q. end, s. start, s. end, e-value, bit score
isotig11382_length_828_1_F1 isotig11382_length_828 100.00 20 0 0 1 20 373 392 2e-04 37.4
# BLASTN 2.2.19 [Nov-02-2008]
# Query: isotig11382_length_828_1_R1
# Database: ../EST_addlength.fna
# Fields: Query id, Subject id, % identity, alignment length, mismatches, gap openings, q. start, q. end, s. start, s. end, e-value, bit score
isotig11382_length_828_1_R1 isotig11382_length_828 100.00 20 0 0 1 20 812 793 2e-04 37.4
9●
用linux命令处理这些简单的处理是很容易的。
~假设你这个文件名为m9.blast
cat m9.blast |grep "^[^#]"|awk '{print $1,$2}'
过滤#开头的行,只留下有用的。另外取出第一列($1),和第二列($2)。根据你的意思,只取 Query id, Subject id嘛
~用sort排序,用uniq -d 取出重复行,就是有交集的部分。
cat m9.blast |grep "^[^#]"|awk '{print $1,$2}'|sort|uniq -d
~你有10个文件。用cat命令一步搞定. 文件名用空格隔开。下面列举3个。
cat m9.blast_1 m9.blast_2 m9.blast_3 |grep "^[^#]"|awk '{print $1,$2}'|sort|uniq -d
~上面是直接显示的。如果要输出到文件。完整命令如下。
cat m9.blast_1 m9.blast_2 m9.blast_3 |grep "^[^#]"|awk '{print $1,$2}'|sort|uniq -d >output
这样应该是完成你的要求了。其实用-m8不是更好嘛。。
362●
高手!跪谢了!
9●
@柳城:前辈,blast的-m 1-9哪里有解释的啊???请教一下
6●
@zhangjian995:
你可以重新开问题提问的。
362●
恩,以后会注意的,我在网上找到答案了,谢谢!!
6●
学习了,谢谢
4●