免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: 大血落弯刀
打印 上一主题 下一主题

[C] 含泪求助帮我改改C程序,提高处理数据效率 [复制链接]

论坛徽章:
0
31 [报告]
发表于 2008-12-19 15:55 |只看该作者
typedef struct page_t;
struct page_t
{
    page_t *next;
    char data[4094];
};
每次分配4096大小的内存块,将数据读入,结成内存链表,并统计出有多少个邮箱地址。(要保证每个内存片中的邮箱地址都是完整的,想办法实现)
根据邮箱地址数分配指针数组,每个指针指向每个邮箱地址的开始。变\n为\0。
快速排序qsort指针数组,变无序为有序。剩下的就好办了。
统计输出自己需要的结果。
别忘了释放指针数组,及所有内存块。

主要是要避免频繁分配大量的小内存块,再结合快速排序算法。
应该很快了。

[ 本帖最后由 guoruimin 于 2008-12-19 16:01 编辑 ]

论坛徽章:
0
32 [报告]
发表于 2008-12-20 14:26 |只看该作者
楼主的程序复杂度是O(n^2),读入所有的字符串以后,先对字符串进行快速排序,复杂度O(nlogn),然后判断输出就可以了。效率会明显提高。

论坛徽章:
0
33 [报告]
发表于 2008-12-20 14:28 |只看该作者
awk,perl是首选

论坛徽章:
0
34 [报告]
发表于 2008-12-20 19:57 |只看该作者
传说中的重新发明轮子。。?

论坛徽章:
0
35 [报告]
发表于 2008-12-22 10:24 |只看该作者
用hash多方便,1GB的文件也就1分钟内搞定吧。用perl吧,好用得很,就算没学过翻翻书1个下午就搞出来了。

论坛徽章:
0
36 [报告]
发表于 2008-12-22 10:29 |只看该作者

回复楼主

看了你的代码,可不可以边读边处理。
这样效率不是很高?!
最好调整程序执行顺序。

论坛徽章:
0
37 [报告]
发表于 2008-12-22 12:27 |只看该作者
自己改进和扩充KMP算法!!

论坛徽章:
0
38 [报告]
发表于 2008-12-22 14:23 |只看该作者
莫斯科不相信眼泪

论坛徽章:
0
39 [报告]
发表于 2008-12-22 15:50 |只看该作者
可以先排序,c有自带的qsort函数。
排完了自然就知道是否重复了,写起来最简单。

论坛徽章:
0
40 [报告]
发表于 2008-12-22 16:12 |只看该作者
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
int compare_str(const void* a, const void* b)
{
    return strcmp((char*)a, (char*)b);
}
int main(int argc, char** argv)
{
    int len = 32, total = 0, j = 0;
    char* pbase = new char[len * 10000];
    char* p = pbase;
    FILE* fp = fopen("test.txt", "r");
    while (fgets(p, len, fp))
    {   
        p[strlen(p) - 1] = 0;
        total++;
        p += len;
    }   
    fclose(fp);
    qsort(pbase, total, len, compare_str);
    char buf[256];
    strcpy(buf, pbase);
    p = pbase;
    for (total; total > 0; total--, p += len)
    {   
        if (strcmp(buf, p) == 0)
            j++;
        else
        {   
            printf("%d %s\n", j, buf);
            strcpy(buf, p);
            j = 1;
        }   
    }   
    return 0;
}
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP