大家好,我是生物信息的新手。在ensembl上下载了人基因组的序列,发现在序列中有很多重复的N。 ftp://ftp.ensembl.org/pub/release-64/fasta/homo_sapiens/dna/ ensemble说有两种版本,一种是用RepeatMasker跑过的,会有很多N的标记,但是我下载了没有用RepeatMasker跑过的,其中也有很多的N。 我想问下这些N到底代表什么意思,有没有不带N的基因组序列呢?求指教,谢谢。...
yurey
|
Registered User
|
这家伙很懒,什么也没留下。 |