我想分析在一组基因启动子中某一碱基组合出现次数是否是显著的,我又找了11组随机启动子背景序列和它对比,见图,请教怎么做统计学的显著性分析来找出哪个碱基组合在启动子中可以当做MOTIF?注:每组启动子都是160个,每组一共24万碱基,图中的数字表示在对应的一组启动子中出现该碱基组合的启动子个数
哇,直接用一般的分析统计方法不行么?呵呵,坐等答案
按照启动子中atcg出现的比率随机生成相同长度的启动子序列,数某一碱基组合(记为s)出现的个数(记为ni),上述步骤重复很多次(比如10000次),会有10000个ni值,这个长度为10000的向量记为n,记s在真实启动子上出现的次数为ns,则显著性(p值)可以计算为 (n中大于ns的个数)/(n的长度)
有意思的问题,坐等更明白的方案
You must be logged in to post a comment.
登陆后可评论。
Questions about bioinformatics & biocompute.
生物信息学(Bioinformatics)的快速问答系统.
已取消即时发送邮件通知。更改为由用户自行选择订阅(订阅框在首页侧边栏)
哇,直接用一般的分析统计方法不行么?呵呵,坐等答案
61●
按照启动子中atcg出现的比率随机生成相同长度的启动子序列,数某一碱基组合(记为s)出现的个数(记为ni),上述步骤重复很多次(比如10000次),会有10000个ni值,这个长度为10000的向量记为n,记s在真实启动子上出现的次数为ns,则显著性(p值)可以计算为 (n中大于ns的个数)/(n的长度)
34●
有意思的问题,坐等更明白的方案
54●