免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1564 | 回复: 1
打印 上一主题 下一主题

小白请教大师,如何从文件中查找中文字符串 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2007-11-07 09:35 |只看该作者 |倒序浏览
初学c,很多搞不懂,现在想从一个文本词典文件中(就是gg输入法导出的那个)查找一个字符串,写了一个程序,但是utf-8的编码每个汉字占3字节,我写的程序是在分段读取过程中可能会把汉字切掉,导致词典中明明有这个词但是无法找到,哪位大师能够指点一下,我写的代码如下:
  1. #include <stdio.h>
  2. #include <stdlib.h>
  3. #include <string.h>

  4. int main(void) {
  5.         int ch;

  6.         FILE * fp;
  7.         char td[300];
  8.        
  9.         fp=fopen("gg.dic", "rb");

  10.         while(!feof(fp)) {
  11.                 fread(td,sizeof(td),1,fp);
  12.                 if(strstr(td, "麒麟")) {
  13.                         printf("%s", td);
  14.                 }
  15.       }
  16. //        fwrite(&f, sizeof(f), 1, fp);
  17.        
  18.        

  19.         fclose(fp);
  20.        

  21.        
  22.         return 0;
  23. }
复制代码




下面其实还有一个附加问题,就是我如果把查找的字符串赋值给变量s,把s带入strstr查找,会找不到任何东西,这里面有什么玄机吗,哪位知道望指点
  1. #include <stdio.h>
  2. #include <stdlib.h>
  3. #include <string.h>

  4. int main(void) {
  5.         int ch;

  6.         FILE * fp;
  7.         char s[6] = "麒麟";
  8.         char td[300];
  9.        
  10.         fp=fopen("gg.dic", "rb");

  11.         while(!feof(fp)) {
  12.                 fread(td,sizeof(td),1,fp);
  13.                 if(strstr(td, s)) {
  14.                         printf("%s", td);
  15.                 }
  16.       }
  17. //        fwrite(&f, sizeof(f), 1, fp);
  18.        
  19.        

  20.         fclose(fp);
  21.        

  22.        
  23.         return 0;
  24. }
复制代码

论坛徽章:
0
2 [报告]
发表于 2007-11-07 10:01 |只看该作者
其中第二种情况用把查找的字符串赋值给变量后再查找就找不到的问题,我发现是因为赋值后,变量发生了变化造成的,如下面这段代码

  1. #include <stdio.h>
  2. #include <stdlib.h>
  3. #include <string.h>

  4. int main(void) {
  5.         int ch;

  6.         char s[6] = "麒麟";

  7.         printf("%s", s);
  8.        
  9.         return 0;
  10. }
复制代码


按理说输出的结果应该是麒麟,但是输出的却是"麒麟(0쿿",字符串赋值给变量再打印处理后就变了,所以会搜索不到,这是怎么回事?哪位先知知道?
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP