免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 8486 | 回复: 16
打印 上一主题 下一主题

[算法] 求strcasecmp高效实现 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-03-14 19:49 |只看该作者 |倒序浏览
如题 ,比较字符串 ,不区分大小写,
最好不用系统调用,不用加减,尽量用二进制操作

论坛徽章:
0
2 [报告]
发表于 2009-03-14 20:06 |只看该作者
/* simple-assumption:
 *
 * most parts are equal and doing a case conversion needs time
 *
 */

 /*简单假定
    大部分相等,并且做大小写转换需要一定的时间消耗

大小写不敏感比较

*/

int buffer_caseless_compare(const char *a, size_t a_len, const char *b, size_t b_len) {
    size_t ndx = 0, max_ndx;
    size_t *al, *bl;
    size_t mask = sizeof(*al) - 1;

    /*
    ??是这样的?
    typedef   unsigned   int   size_t;

    类型强制转换
    */

    al = (size_t *)a;
    bl = (size_t *)b;

    /* is the alignment correct ? */
    /* 是否以4字节对齐(在32位下是以4字节,其它系统类似)
    如果是,则做比较,如果大部分相等的情况下
    这样的比较,速度快
    */

    if ( ((size_t)al & mask) == 0 &&
         ((size_t)bl & mask) == 0 ) {

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;max_ndx = ((a_len < b_len) ? a_len : b_len) & ~mask;

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;for (; ndx < max_ndx; ndx += sizeof(*al)) {
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;if (*al != *bl) break;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;/*四字节比较失败,跳出*/
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;al++; bl++;

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;}

&nbsp;&nbsp;&nbsp;&nbsp;}

&nbsp;&nbsp;&nbsp;&nbsp;/*开始一个一个字节的比较*/
&nbsp;&nbsp;&nbsp;&nbsp;a = (char *)al;
&nbsp;&nbsp;&nbsp;&nbsp;b = (char *)bl;

&nbsp;&nbsp;&nbsp;&nbsp;max_ndx = ((a_len < b_len) ? a_len : b_len);

&nbsp;&nbsp;&nbsp;&nbsp;for (; ndx < max_ndx; ndx++) {
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;char a1 = *a++, b1 = *b++;

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;if (a1 != b1) {
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;if ((a1 >= 'A' && a1 <= 'Z') && (b1 >= 'a' && b1 <= 'z'))
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;a1 |= 32;&nbsp;&nbsp;&nbsp;&nbsp;/*把a1转为小写*/
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;else if ((a1 >= 'a' && a1 <= 'z') && (b1 >= 'A' && b1 <= 'Z'))
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;b1 |= 32;&nbsp;&nbsp;&nbsp;&nbsp;/*把b1转为小写*/

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;/*转换之后比较不相等则返回*/
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;if ((a1 - b1) != 0) return (a1 - b1);&nbsp;&nbsp;&nbsp;&nbsp;

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;}
&nbsp;&nbsp;&nbsp;&nbsp;}

&nbsp;&nbsp;&nbsp;&nbsp;/* all chars are the same, and the length match too
&nbsp;&nbsp;&nbsp;&nbsp; *
&nbsp;&nbsp;&nbsp;&nbsp; * they are the same */

&nbsp;&nbsp;&nbsp;&nbsp;if (a_len == b_len) return 0;

&nbsp;&nbsp;&nbsp;&nbsp;/* if a is shorter then b, then b is larger */
&nbsp;&nbsp;&nbsp;&nbsp;return (a_len - b_len);
}

论坛徽章:
0
3 [报告]
发表于 2009-03-14 20:08 |只看该作者
这个函数来之Lighttpd源码 我加了部分注释 里面的结构 LZ不知道应该也能理解这个函数 如果实在不情况 请看我的另外一个帖子 连接在签名档里

论坛徽章:
0
4 [报告]
发表于 2009-03-14 20:33 |只看该作者
恩,这个思想不错 ,对于较长的串,应该比较适合,
对于短串,有点杀鸡牛刀了,有没有又简洁又快速的呢(其实只要判断是否相等就ok了,
相等就0,否则就-1)

论坛徽章:
0
5 [报告]
发表于 2009-03-16 18:19 |只看该作者
我顶 ,高手牛人都跑哪了?
大家平时用的代码发出来呵

论坛徽章:
0
6 [报告]
发表于 2009-03-16 18:50 |只看该作者
原帖由 lenky0401 于 2009-3-14 20:06 发表
/* simple-assumption:
&nbsp;*
&nbsp;* most parts are equal and doing a case conversion needs time
&nbsp;*
&nbsp;*/
&nbsp;/*简单假定
&nbsp;&nbsp;&nbsp;&nbsp;大部分相等,并且做大小写转换需要一 ...

这是已知长度了,要是未知长度呢?总不能先用strlen求长度吧

论坛徽章:
0
7 [报告]
发表于 2009-03-16 19:00 |只看该作者
这是已知长度了,要是未知长度呢?总不能先用strlen求长度吧

为什么不能? 我觉得未知长度只能用strlen

论坛徽章:
0
8 [报告]
发表于 2009-03-17 09:33 |只看该作者
原帖由 caijimin 于 2009-3-16 19:00 发表

为什么不能? 我觉得未知长度只能用strlen

既然都用strlen先求长度了,干嘛不直接比较就完了
玩那么多技巧有意义吗

论坛徽章:
0
9 [报告]
发表于 2009-03-17 09:48 |只看该作者
为什么不用C函数呢,不是已经写好了吗

论坛徽章:
0
10 [报告]
发表于 2009-03-17 10:14 |只看该作者

回复 #9 alexhappy 的帖子

我用的vc下貌似没这个函数呵!
附上我的代码(2次c库函数调用,很不爽):
int wr_strcasecmp(register const char *lStr ,register const char *rStr)
{
        while(*lStr && *rStr){
                if(*lStr !=*rStr && tolower(*lStr)!=tolower(*rStr))
                        break;
                ++lStr;
                ++rStr;
        }
        return *lStr - *rStr;
}
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP