免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 4065 | 回复: 6
打印 上一主题 下一主题

求多重校正的perl脚本 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2014-02-28 20:34 |只看该作者 |倒序浏览
FDR错误控制法是Benjamini于1995年提出一种方法,通过控制FDR(FalseDiscovery Rate)来决定P值的域值.假设你挑选了R个差异表达的基因,其中有S个是真正有差异表达的,另外有V个其实是没有差异表达的,是假阳性的。实践中希望错误比例Q=V/R平均而言不能超过某个预先设定的值(比如0.05),在统计学上,这也就等价于控制FDR不能超过5%.
对所有候选基因的p值进行从小到大排序,则若想控制fdr不能超过q,则只需找到最大的正整数i,使得p(i)<=(i*q)/m.然后,挑选对应p(1),p(2),...,p(i)的基因做为差异表达基因,这样就能从统计学上保证fdr不超过q。因此,FDR的计算公式如下:
q-value(i)=p(i)*length(p)/rank(p)


表示看完这些我还是不会写perl,不知道有没有大神会写,帮写一个吧,急求!!!!!

论坛徽章:
2
射手座
日期:2014-10-10 15:59:4715-16赛季CBA联赛之上海
日期:2016-03-03 10:27:14
2 [报告]
发表于 2014-02-28 21:28 |只看该作者
回复 1# yang7473453

大概是这个意思
  1. #!/usr/bin/env perl
  2. my @test_data=(0.0003,0.0001,0.02);
  3. my %sorted_data = map{$_=>++$i}sort @test_data;
  4. @p_adjust_data = map{$_ * ($#test_data+1) / $sorted_data{$_}}@test_data;
  5. print join "\t", "@test_data"';
  6. print "\n";
  7. print join "\t", "@p_adjust_data";

复制代码

论坛徽章:
7
戌狗
日期:2013-12-15 20:43:38技术图书徽章
日期:2014-03-05 01:33:12技术图书徽章
日期:2014-03-15 20:31:17未羊
日期:2014-03-25 23:48:20丑牛
日期:2014-04-07 22:37:44巳蛇
日期:2014-04-11 21:58:0915-16赛季CBA联赛之青岛
日期:2016-03-17 20:36:13
3 [报告]
发表于 2014-03-01 01:29 |只看该作者
yinyuemi 发表于 2014-02-28 17:28
回复 1# yang7473453

大概是这个意思

这个有意思~学习了!

论坛徽章:
33
荣誉会员
日期:2011-11-23 16:44:17天秤座
日期:2014-08-26 16:18:20天秤座
日期:2014-08-29 10:12:18丑牛
日期:2014-08-29 16:06:45丑牛
日期:2014-09-03 10:28:58射手座
日期:2014-09-03 16:01:17寅虎
日期:2014-09-11 14:24:21天蝎座
日期:2014-09-17 08:33:55IT运维版块每日发帖之星
日期:2016-04-17 06:23:27操作系统版块每日发帖之星
日期:2016-04-18 06:20:00IT运维版块每日发帖之星
日期:2016-04-24 06:20:0015-16赛季CBA联赛之天津
日期:2016-05-06 12:46:59
4 [报告]
发表于 2014-03-01 07:48 |只看该作者
表示看完楼主写的, 我觉得我需要回去重新学一下语文了.

完全没理解是什么意思.

论坛徽章:
5
丑牛
日期:2014-01-21 08:26:26卯兔
日期:2014-03-11 06:37:43天秤座
日期:2014-03-25 08:52:52寅虎
日期:2014-04-19 11:39:48午马
日期:2014-08-06 03:56:58
5 [报告]
发表于 2014-03-01 13:30 |只看该作者
(⊙0⊙) ~ 比较茫然, 看完以后也确实什么都没理解


假设你挑选了R个差异表达的基因,其中有S个是真正有差异表达的,另外有V个其实是没有差异表达的

大牛, 帮忙指点一下, 举个栗子:

举个栗子,什么是 有差异表达 ?
什么是 没有差异表达 ?

回复 2# yinyuemi


   

论坛徽章:
0
6 [报告]
发表于 2014-03-01 20:32 |只看该作者
非常感谢,很有帮助回复 2# yinyuemi


   

论坛徽章:
2
射手座
日期:2014-10-10 15:59:4715-16赛季CBA联赛之上海
日期:2016-03-03 10:27:14
7 [报告]
发表于 2014-03-02 21:05 |只看该作者
回复 5# pitonas


    这是统计学的知识(http://en.wikipedia.org/wiki/False_discovery_rate), 一种控制假阳性率(FDR)的方法, 全称应该是benjamini hochberg.
楼主应该是搞生物信息的, 两种条件下生物的基因的表达量可能相同,也可能不一样, 前者就是 表达无差异, 后者即是 表达差异
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP