2
answers
87views
求助:如何用Perl将Genebank转化为特定要求的fasta文件(求源代码)
要处理的Genebank文件格式见下(Genebank是一个文件包含多个序列,名字为sequence.gb,以下只列出几个,实际有批量文件要处理),我需要生成的fasta文件的特定格式主要是名字的格式为:登录号_国家_年份。当然还有全序列。谢谢各位大虾!!! LOCUS AF027217 1768 bp DNA circular VRL 19-MAR-2009 DEFINITION [...]...
5
answers
99views
如何使fasta格式的序列标题精简?
>Unigene12046_All 156 1214 minus strand KANADI-like transcription factor FEATHERED [...]
2
answers
354views
一个处理序列的Perl脚本
源数据: 说明:1 >开头的为注释行,包含序列ID等信息 2 注释行下面两行是含有SNP的两个序列,末尾的数字是测序深度 3 *指示SNP的位置 目的:筛选测序深度均大于15,SNP为1的成组序列。输出格式为序列ID+序列信息。 Perl脚本: [...]
12
answers
217views
请求有人能为我解答一个perl小程序
用perl编写程序分离注释行内容,分离蛋白质序列,并转变成氨基酸三字母表示方式。说明使用的perl数据结构和程序的变量转换过程,解释含义。感谢老师指导 >1A23:A|PDBID|CHAIN|SEQUENCE AQYEDGKQYTTLEKPVAGAPQVLEFFSFFCPHCYQFEEVLHISDNVKKKLPEGVKMTKYHVNFMGGDLGKDLTQAWAVAM ALGVEDKVTVPLFEGVQKTQTIRSASDIRDVFINAGIKGEEYDAAWNSFVVKSLVAQQEKAAADVQLRGVPAMFVNGKYQ LNPQGMDTSNMDVFVQQYADTVKYLSEKK >1AAR:B|PDBID|CHA...
29
answers
680views
对FASTA格式的简单处理与统计的Perl程序
缘起 模仿lh3开发的网页版工具SeqTools 功能 1.格式化FASTA文件。 2.反向互补FASTA序列。 3.获取FASTA序列的长度。 4.计算GC含量并对ATGC计数。 5.搜索模式(子序列、motif等)。 改进 1.添加了GC含量的计算和ATGC的计数。 [...]
1
answers
65views
有关perl中的split函数的问题
看源代码是碰到个问题想问下大家 下面这个perl code打开DG文件,并做相应的split处理: print "dGn"; safelyOpen *DG, '<', "$prefix.dG"; scalar [...]
29
answers
250views
请教Perl程序用于 去除含有多于3个连续相同碱基的序列
大家好,我有个问题请教下大家: 我现在有一个容量为10万的随机DNA序列库(fasta格式的),我要预筛选下这个库:去除含有多于3个连续相同碱基的序列。请问谁有相应的Perl程序,或者perl函数库中可有这样的程序?先谢谢大家了。
7
answers
79views
请问这样的程序结构怎么样
我要做个DNA序列处理工具。我打算用java swing做界面,用perl做业务层。由于我对软件开发没有经验,想请问大家这样的设计,从程序实现上,合理吗,大家有更好的意见吗?
24
answers
177views
请教一个perl问题
有两个文件: 文件A t0001 123 abc t0002 234 bcd t0003 345 [...]
4
answers
236views
perl 输出的txt文件每行前面会有一个空格,如何解决啊
初学perl,将原有的文件作了个别字符的替换之后重新输出到新的txt文档,结果输出的结果只有第一行是顶格的,其余的行都在句首空了一格。 该问题只在输出到文件时存在,若将结果直接显示在屏幕上,则无空格。 求高手帮忙 #! /usr/bin/perl; while(defined($pairing_filename=<*.fas>)) { unless ( open(DNAFILE, [...]...
8
answers
318views
批量提取miRNA序列-perl
手头有几百个miRNA_name,想要得到相应的miRNA_seq 从miRBase下载了miRNA.dat,由于其是EMBL格式,于是利用BioPerl转换为了FASTA格式。 再利用perl按名字取提取序列。 可是,perl脚本中关于格式匹配,总出错,还麻烦各位看看。 $ head -n 6 miRNA.fa >cel-let-7 [...]...
8
answers
115views
新手请教一个“复杂”的perl问题
第一个图是文件夹中的文件的内容 1.txt,第二个图是文件夹中的文件,第三个图是 1.txt,第四个是2.txt~ 1.txt中的HID栏对应的是文件夹中的文件的名字,第三个图中的“|"两边的数字分别是前两个文件中的Tax ID 和 Gene ID; 我要做的是,找出文件夹中每一个文件中的 Tax ID [...]...
10
answers
301views
perl 按列合并文件
我有十几个文件,每个文件比较大,大概有十几兆吧,我需要把它们按列合并,linux下的paste命令,我用了一下,会有错误,不知道用perl怎么实现?
14
answers
162views
求助:如何从众多数据中提取数据的坐标信息
各位大虾,现在我有一个好几G的关于23条染色体上每个碱基位点测序深度的数据,但是有些位点的测序深度太离谱,明显超出了正常的范围,有些地方甚至过万。所以,想通过perl编程提取这些不正常的位点的位置(所在染色体以及在该染色体的位置),不知道有没有哪位可以给小弟指引一下啊? 数据的格式如下: >chrX 0 0 0 0 0 0 0 [...]...
6
answers
199views
perl画图程序求解释
! /usr/bin/perl -w use strict; use File::Basename; unless (@ARGV > [...]