免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2091 | 回复: 6

[算法] 一个取数问题? [复制链接]

论坛徽章:
1
CU十二周年纪念徽章
日期:2013-10-24 15:41:34
发表于 2012-10-19 21:52 |显示全部楼层
本帖最后由 ecjtubaowp 于 2012-10-19 21:54 编辑

有2000个数,从1到2000,现在要取1500个数据,也即75%的数据,

注意数据是一个一个过来的,不能使用数组去保存这些数据。

比如1过来了,你要不要取?2过来了,你要不要取?

要能取到75%的数据(而且分布要比较均匀,不然取前1500个数就行了,这样不太好),有啥判断方法吗?

论坛徽章:
4
水瓶座
日期:2013-09-06 12:27:30摩羯座
日期:2013-09-28 14:07:46处女座
日期:2013-10-24 14:25:01酉鸡
日期:2014-04-07 11:54:15
发表于 2012-10-19 21:59 |显示全部楼层
学会洗牌法, 洗完取前1500就可以了.

论坛徽章:
320
射手座
日期:2013-08-23 12:04:38射手座
日期:2013-08-23 16:18:12未羊
日期:2013-08-30 14:33:15水瓶座
日期:2013-09-02 16:44:31摩羯座
日期:2013-09-25 09:33:52双子座
日期:2013-09-26 12:21:10金牛座
日期:2013-10-14 09:08:49申猴
日期:2013-10-16 13:09:43子鼠
日期:2013-10-17 23:23:19射手座
日期:2013-10-18 13:00:27金牛座
日期:2013-10-18 15:47:57午马
日期:2013-10-18 21:43:38
发表于 2012-10-19 22:04 |显示全部楼层
产生0~3的随机数,每收到4个数为一组,抛弃编号等于当前随机数的数

论坛徽章:
14
巨蟹座
日期:2013-11-19 14:09:4615-16赛季CBA联赛之青岛
日期:2016-07-05 12:36:0515-16赛季CBA联赛之广东
日期:2016-06-29 11:45:542015亚冠之全北现代
日期:2015-07-22 08:09:472015年辞旧岁徽章
日期:2015-03-03 16:54:15巨蟹座
日期:2014-12-29 08:22:29射手座
日期:2014-12-05 08:20:39狮子座
日期:2014-11-05 12:33:52寅虎
日期:2014-08-13 09:01:31巳蛇
日期:2014-06-16 16:29:52技术图书徽章
日期:2014-04-15 08:44:01天蝎座
日期:2014-03-11 13:06:45
发表于 2012-10-19 23:57 |显示全部楼层
估计楼主要的是:
一个数组 存着 1,2,3 …… 2000
第一次取下标为 rand()%2000 的数,取出后用下标为1999的数替换这个数
第二次取下标为 rand()%1999 的数,取出后用下标为1998的数替换这个数
……

论坛徽章:
11
摩羯座
日期:2013-09-16 11:10:272015亚冠之阿尔萨德
日期:2015-06-12 22:53:29午马
日期:2014-04-15 11:08:53亥猪
日期:2014-03-02 23:46:35申猴
日期:2013-12-06 22:07:00亥猪
日期:2013-11-28 12:03:13双鱼座
日期:2013-11-21 14:43:56亥猪
日期:2013-10-23 10:55:49处女座
日期:2013-10-17 18:15:43午马
日期:2013-09-27 17:40:4215-16赛季CBA联赛之青岛
日期:2016-06-22 00:45:55
发表于 2012-10-20 01:44 |显示全部楼层
本帖最后由 Ager 于 2012-10-20 01:51 编辑


一行命令,解决全部问题:
$ perl -e "map{print \$_.\"\\t\"}(sort { (-1,1)[rand 2] } (1..2000))[0..2000*.75-1];"



论坛徽章:
0
发表于 2012-10-20 18:29 |显示全部楼层
  1. import random

  2. totalcount = 2000
  3. remaining = 1500

  4. count = 0

  5. for i in range(1, 2001):
  6.         rand = random.random()
  7.         if rand < remaining * 1.0 / totalcount:
  8.                 print i,  
  9.                 remaining = remaining - 1
  10.                 count = count + 1
  11.         totalcount = totalcount - 1

  12. print "count:", count
  13.        
复制代码
所有数的概率是相等的……

论坛徽章:
1
CU十二周年纪念徽章
日期:2013-10-24 15:41:34
发表于 2012-10-21 11:48 |显示全部楼层
3楼的方法可行,其它都没理解我的意思:不能使用数组,数据一个一个过来,而且还要实时取。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP