免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123下一页
最近访问板块 发新帖
查看: 9518 | 回复: 20
打印 上一主题 下一主题

[C] 关于用C截取字符串 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2012-10-24 17:05 |只看该作者 |倒序浏览
有一字符串“<10001>aaaaaaaa</10001>”,我想用C程序将"aaaaaaaa"截取出来,
我写了如下代码实现:
  1. #include <stdio.h>
  2. #include <stdlib.h>

  3. int main(void)
  4. {
  5.   char *pchStr = "<10001>aaaaaaaa</10001>";
  6.   char *pchStart = NULL;
  7.   char *pchEnd = NULL;
  8.   char szStr[1024+1];
  9.   memset( szStr,0x00,sizeof(szStr) );
  10.   pchStart = strstr(pchStr,"<10001>")+strlen("<10001>");
  11.   pchEnd = strstr(pchStr,"</10001>")-1;
  12.   memcpy( szStr,pchStart,pchEnd - pchStart );
  13.   printf("%s\n",szStr);
  14.   return 0;
  15. }
复制代码
不知道大家有没有好的想法,提供参考

论坛徽章:
4
水瓶座
日期:2013-09-06 12:27:30摩羯座
日期:2013-09-28 14:07:46处女座
日期:2013-10-24 14:25:01酉鸡
日期:2014-04-07 11:54:15
2 [报告]
发表于 2012-10-24 17:15 |只看该作者
能实现就行了, 复杂度又不高.

复杂点的用regex, 再麻烦用pcre.

论坛徽章:
1
摩羯座
日期:2013-12-19 10:04:07
3 [报告]
发表于 2012-10-24 17:40 |只看该作者
sscanf
"%*[^a-zA-Z]%[a-zA-Z]%*[a-zA-Z]"

论坛徽章:
4
水瓶座
日期:2013-09-06 12:27:30摩羯座
日期:2013-09-28 14:07:46处女座
日期:2013-10-24 14:25:01酉鸡
日期:2014-04-07 11:54:15
4 [报告]
发表于 2012-10-24 17:41 |只看该作者
sscanf是本世纪最不安全的函数之一, 因为对于%s, 它根本没办法防止内存溢出.

lin5161678 发表于 2012-10-24 17:40
sscanf
"%*[^a-zA-Z]%[a-zA-Z]%*[a-zA-Z]"

论坛徽章:
0
5 [报告]
发表于 2012-10-24 18:11 |只看该作者
回复 3# lin5161678

如果要截取字符串中有数字、标点符号、中文,这个写法应该不行吧


   

论坛徽章:
0
6 [报告]
发表于 2012-10-24 18:15 |只看该作者
用了一个300多M的文件测试了我程序效率,取第999998号记录,耗时小于1秒,基本符合使用要求了

论坛徽章:
1
摩羯座
日期:2013-12-19 10:04:07
7 [报告]
发表于 2012-10-25 09:07 |只看该作者
回复 4# linux_c_py_php


    sscanf没办法防止溢出????
  1. #include <stdio.h>
  2. int main()
  3. {
  4.         char *src="123456789";
  5.         char dest[5];
  6.         sscanf(src, "%4s", dest);
  7.         puts(dest);
  8.         return 0;
  9. }
复制代码

论坛徽章:
1
摩羯座
日期:2013-12-19 10:04:07
8 [报告]
发表于 2012-10-25 09:18 |只看该作者
回复 5# lol321


    你自己不说清楚 提供的样例又是只有字母 我就不考虑太多了
   "<%*[0-9]>%[^<]%*s"

论坛徽章:
0
9 [报告]
发表于 2012-10-25 09:32 |只看该作者
可以用KMP算法试试
int StrIndex_KMP(char *s,char *t,int pos)
/*从串s 的第pos 个字符开始找首次与串t 相等的子串*/
{ int i=pos,j=1,slen,tlen;
while (i<=s[0] && j<=t[0] ) /*都没遇到结束符*/
if (j==0||s[i]==t[j]) { i++; j++; }
else j=next[j]; /*回溯*/
if (j>t[0]) return i-t[0]; /*匹配成功,返回存储位置*/
else return –1;
}

论坛徽章:
14
巨蟹座
日期:2013-11-19 14:09:4615-16赛季CBA联赛之青岛
日期:2016-07-05 12:36:0515-16赛季CBA联赛之广东
日期:2016-06-29 11:45:542015亚冠之全北现代
日期:2015-07-22 08:09:472015年辞旧岁徽章
日期:2015-03-03 16:54:15巨蟹座
日期:2014-12-29 08:22:29射手座
日期:2014-12-05 08:20:39狮子座
日期:2014-11-05 12:33:52寅虎
日期:2014-08-13 09:01:31巳蛇
日期:2014-06-16 16:29:52技术图书徽章
日期:2014-04-15 08:44:01天蝎座
日期:2014-03-11 13:06:45
10 [报告]
发表于 2012-10-25 09:53 |只看该作者
看了楼主的代码,首先结果就是错误的,8个a,但只输出了前7个a。这是个小错误
龌龊的是 memset( szStr,0x00,sizeof(szStr) ) 这一句,根本就没有必要。任何寄希望用memset来消除错误,而不去仔细查找错误所在的行为,常常会恰得其反。虽然你这里幸运地没出现错误。
  1. #include <stdio.h>
  2. //#include <stdlib.h>
  3. #include <string.h>

  4. int main(void)
  5. {
  6.   char *pchStr = "<10001>aaaaaaaa</10001>";
  7.   char *pchStart = NULL;
  8.   char *pchEnd = NULL;
  9.   char szStr[1024+1];
  10.   // memset( szStr,0x00,sizeof(szStr) );
  11.   pchStart = strstr(pchStr,"<10001>")+strlen("<10001>");
  12.   //pchEnd = strstr(pchStr,"</10001>")-1;
  13.   pchEnd = strstr(pchStr,"</10001>");
  14.   memcpy( szStr,pchStart,pchEnd - pchStart );
  15.   szStr[pchEnd-pchStart] = '\0';
  16.   printf("%s\n",szStr);
  17.   return 0;
  18. }
复制代码
  1. #include <stdio.h>
  2. #include <string.h>

  3. int main(void)
  4. {
  5.     const char *pchStr = "<10001>aaaaaaaa</10001>";
  6.     const char *pchStart = NULL;
  7.     const char *pchEnd = NULL;

  8.     pchStart = strstr(pchStr,"<10001>");
  9.     if( pchStart )
  10.     {
  11.         pchStart += strlen("<10001>");
  12.         pchEnd = strstr(pchStart,"</10001>");
  13.         if( pchEnd )
  14.         {
  15.             printf("%.*s\n",pchEnd-pchStart,pchStart);
  16.         }
  17.     }

  18.     return 0;
  19. }
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP