论坛徽章:: 0

电梯直达

1楼 [收藏(0)] [报告]

发表于 2009-05-22 14:34 |只看该作者 |倒序浏览

score.zip

88.93 KB, 下载次数: 48

文库|博客

cenalulu

版主

论坛徽章:: 9

2楼 [报告]

发表于 2009-05-24 22:07 |只看该作者

写了一个procedure，用楼主的数据，执行时间在1秒左右。
其中我用的database是test，楼主把procedure里的test.tmp_subject_score 改成自己相应的数据库就ok了
大概的思路就是，对于每个paper_id的学生分数及排名通过下面这句sql得到

      select if(tmp_subject_score.score<@scorenow,@rank:=@rank+1,@rank:=@rank) as mrank,
      class_student_id,(@scorenow:=score) as mscore
      from  test.tmp_subject_score where paper_id = paper_id_now
      order by score desc ;

然后建立一个procedure遍历每个paper_id 结果输出。

delimiter //
create procedure show_mark()
begin

declare paper_id_now int ;
declare paper_id_csr cursor for select distinct paper_id from test.tmp_subject_score ;
open paper_id_csr;
begin

loop
      fetch paper_id_csr into  paper_id_now;
      set @scorenow = 99999;
      set @rank = 0;
      select if(tmp_subject_score.score<@scorenow,@rank:=@rank+1,@rank:=@rank) as mrank,
      class_student_id,(@scorenow:=score) as mscore
      from  test.tmp_subject_score where paper_id = paper_id_now
      order by score desc ;
end loop;

end ;
close paper_id_csr;

end;
//

delimiter ;
call show_mark();

[ 本帖最后由 cenalulu 于 2009-5-24 22:11 编辑 ]

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

zyrf2001

稍有积蓄

论坛徽章:: 0

3楼 [报告]

发表于 2009-05-25 15:15 |只看该作者

谢谢cenalulu 回复，效率确实比较高

mysql> call show_mark();
Query OK, 4800 rows affected (0.17 sec)

但是有两个问题，首先就是没有判断游标循环完，在我这里执行后会报错，我加了个异常处理，请教cenalulu是怎么执行的呢？当然算法还是cenalulu的算法，我修改后的语句如下

delimiter //

drop procedure if exists show_mark
//
create procedure show_mark()
begin
declare l_done int;
declare paper_id_now int ;
declare paper_id_csr cursor for select distinct paper_id from tmp_subject_score ;
DECLARE CONTINUE HANDLER FOR NOT FOUND SET l_done=1;
open paper_id_csr;
begin

      drop table if exists tmp_order;
      create table tmp_order(paper_id int, class_student_id int, score numeric(6,2), order_in_town int);
      grade_loop:loop
         fetch paper_id_csr into  paper_id_now;
         IF l_done=1 THEN
         LEAVE grade_loop;
      END IF;

         set @scorenow = 99999;
         set @rank = 0;
         insert into tmp_order(paper_id, class_student_id, order_in_town, score)
         select paper_id_now, class_student_id,if(score<@scorenow,@rank:=@rank+1,@rank:=@rank) as mrank,(@scorenow:=score) as mscore
         from  tmp_subject_score where paper_id = paper_id_now
         order by score desc ;
      end loop;

end ;
close paper_id_csr;

end;
//

delimiter ;
call show_mark();

这样可以执行了，但是结果和期望的有点差别

mysql> select * from tmp_order limit 10;
+----------+------------------+--------+---------------+
| paper_id | class_student_id | score  | order_in_town |
+----------+------------------+--------+---------------+
|    10 |          9168 | 116.00 |          1 |
|    10 |          9153 | 114.00 |          2 |
|    10 |          9416 | 113.00 |          3 |
|    10 |          9513 | 113.00 |          3 |
|    10 |          11088 | 112.00 |          4 |
|    10 |          9254 | 112.00 |          4 |
|    10 |          6501 | 111.00 |          5 |
|    10 |          6728 | 111.00 |          5 |
|    10 |          9240 | 111.00 |          5 |
|    10 |          10218 | 111.00 |          5 |
+----------+------------------+--------+---------------+
10 rows in set (0.00 sec)

在现实生活中，两个并列第3后面应该是第5名了，而不是第4名，下面的并列第5也是一样。如果能达到这种效果最好了，谢谢。

[ 本帖最后由 zyrf2001 于 2009-5-25 15:20 编辑 ]

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

cenalulu

版主

论坛徽章:: 9

4楼 [报告]

发表于 2009-05-25 17:21 |只看该作者

在你的基础上又改进了下~~昨天写的太匆忙显示的是多个结果集，今天本来想改进的，结果你已经做啦~~

大概的意思就是新加了一个计数器total记录排在自己之前的人的个数，一旦遇到一个新的分数值，就用它来更新rank变量。
我没想出来有什么办法既计算@total:=@total+1又不显示结果，所以就再套了一个select 把这列去掉~笨办法。
楼主要是有啥想法也可以跟贴哈~~

其中红的是增加的代码。

delimiter //

drop procedure if exists show_mark
//
create procedure show_mark()
begin
            declare l_done int;
            declare paper_id_now int ;
            declare paper_id_csr cursor for select distinct paper_id from tmp_subject_score ;
            DECLARE CONTINUE HANDLER FOR NOT FOUND SET l_done=1;
            open paper_id_csr;
            begin


                  drop table if exists tmp_order;
                  create table tmp_order(paper_id int, class_student_id int, score numeric(6,2), order_in_town int);
                  grade_loop:loop
                     fetch paper_id_csr into  paper_id_now;
                     IF l_done=1 THEN
                                    LEAVE grade_loop;
                                 END IF;

                     set @scorenow = 99999;
                     set @rank = 0;
                     set @total = 0;
                     insert into tmp_order(paper_id, class_student_id, order_in_town, score)
                     select paper_id_now,class_student_id,mrank,mscore from (
                              select (@total:=@total+1) as temp,
                              paper_id_now, class_student_id,
                              if(score<@scorenow,@rank:=@total,@rank:=@rank) as mrank,
                              (@scorenow:=score) as mscore
                              from  tmp_subject_score where paper_id = paper_id_now
                              order by score desc
                     )  as tmp_rank_tbl;
                  end loop;

            end ;
            close paper_id_csr;
            select * from tmp_order;
end;
//

delimiter ;
call show_mark();

[ 本帖最后由 cenalulu 于 2009-5-25 17:22 编辑 ]

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

zyrf2001

稍有积蓄

论坛徽章:: 0

5楼 [报告]

发表于 2009-05-26 09:44 |只看该作者

强！
太感谢了！

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

zyrf2001

稍有积蓄

论坛徽章:: 0

6楼 [报告]

发表于 2009-05-26 10:21 |只看该作者

受cenalulu 的启发，在cenalulu的基础上，我又简化了一下，去掉了对paper_id的循环，不使用游标。速度由0.23s 提高的 0.17s

delimiter //

drop procedure if exists show_mark
//
create procedure show_mark()
begin
  drop table if exists tmp_order;
  create table tmp_order(paper_id int, class_student_id int, score numeric(6,2), order_in_town int);

  set @scorenow = 99999;
  set @rank = 0;
  set @total = 0;
  set @paper_id = 0;
  insert into tmp_order(paper_id, class_student_id, order_in_town, score)
  select paper_id,class_student_id,mrank,mscore from (
      select if(paper_id=@paper_id,@total:=@total+1, @total:=1) as temp,
      if(paper_id=@paper_id,null, @rank:=1) as temp1,
      if(paper_id=@paper_id,null, @paper_id:=paper_id) as temp2,
      paper_id, class_student_id,
      if(score<@scorenow,@rank:=@total,@rank:=@rank) as mrank,
      (@scorenow:=score) as mscore
      from  tmp_subject_score
      order by paper_id, score desc
  )  as tmp_rank_tbl;

end;
//

delimiter ;
call show_mark();

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

zyrf2001

稍有积蓄

论坛徽章:: 0

7楼 [报告]

发表于 2009-05-26 10:21 |只看该作者

if(paper_id=@paper_id,@total:=@total+1, @total:=1) as temp,
                              if(paper_id=@paper_id,null, @rank:=1) as temp1,
                              if(paper_id=@paper_id,null, @paper_id:=paper_id) as temp2,

这个如果能在一个if里处理就好了

发了帖子删不掉了，在这个基础上修改吧

基于上面的想法，我把过程改成了这样

delimiter //

drop procedure if exists show_mark
//
create procedure show_mark()
begin
  drop table if exists tmp_order;
  create table tmp_order(paper_id int, class_student_id int, score numeric(6,2), order_in_town int);

  set @scorenow = 99999;
  set @rank = 0;
  set @total = 0;
  set @paper_id = 0;
  insert into tmp_order(paper_id, class_student_id, order_in_town, score)
  select paper_id,class_student_id,mrank,mscore from (
      select if(paper_id=@paper_id,@total:=@total+1, (@total:=1 and @rank:=1 and @paper_id:=paper_id)) as temp,
      paper_id, class_student_id,
      if(score<@scorenow,@rank:=@total,@rank:=@rank) as mrank,
      (@scorenow:=score) as mscore
      from  tmp_subject_score
      order by paper_id, score desc
  )  as tmp_rank_tbl;

end;
//

delimiter ;
call show_mark();

[ 本帖最后由 zyrf2001 于 2009-5-26 10:32 编辑 ]

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

lrg223

白手起家

论坛徽章:: 0

8楼 [报告]

发表于 2009-05-30 12:00 |只看该作者

学习

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

cenalulu

版主

论坛徽章:: 9

9楼 [报告]

发表于 2009-05-30 14:18 |只看该作者

原帖由 zyrf2001 于 2009-5-26 10:21 发表
受cenalulu 的启发，在cenalulu的基础上，我又简化了一下，去掉了对paper_id的循环，不使用游标。速度由0.23s 提高的 0.17s

delimiter //

drop procedure if exists show_mark
//
create procedure sho ...

赞~~~楼主也是牛人啊~~我咋就没想到用and做多个连续操作呢

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

zyrf2001

稍有积蓄

论坛徽章:: 0

10楼 [报告]

发表于 2009-06-01 19:23 |只看该作者

2楼和9楼是不是一个人啊？注册名一样，id不同？？！！这就是传说中的马甲吗？怎么搞的？

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

12 / 2 页下一页

返回列表

Chinaunix › 论坛 › 数据库技术 › MySQL › 请教高效的分组排序sql

请教高效的分组排序sql [复制链接]

浏览过的版块