免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 4597 | 回复: 4
打印 上一主题 下一主题

[C++] 诚心求助各位大侠:从字符串中分离出数字和特定位置的字符 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-09-11 01:02 |只看该作者 |倒序浏览
本帖最后由 dpxiong19 于 2013-09-11 01:11 编辑

诚心求助各位大侠:

文档中的内容如下:
         LYS107NZG697N72.91.9
            GLU99OE2C687N43.22.2
            ARG21NH1G64O63.12.2
            ......

需要提取的数字和字符均以红颜色标记,现在想 第一:从第1,2,3行中分别提取LYS,GLU,GLU后边的数字107,99,21(注:"GLU99OE2C687N43.22.2"中99后边是字符'O',而不是数字0);第二:从第1,2,3行中分别提取数字697,687,64前边的字符'G','C','G'。感激不尽!诚求各位帮助!

论坛徽章:
7
巳蛇
日期:2014-04-10 08:54:57白羊座
日期:2014-04-22 20:06:262015年亚洲杯之沙特阿拉伯
日期:2015-02-10 14:18:532015年辞旧岁徽章
日期:2015-03-03 16:54:152015亚冠之吉达阿赫利
日期:2015-06-02 11:34:112015亚冠之武里南联
日期:2015-06-24 12:13:082015亚冠之阿尔纳斯尔
日期:2015-08-03 09:08:25
2 [报告]
发表于 2013-09-11 08:59 |只看该作者
回复 1# dpxiong19


    做生物信息的人就喜欢用混乱的格式来存储数据,虽然你说了你需要提取例子里的哪些数据,但是你没有描述清楚那个数据每一项到底是什么意思。根据我的理解最多我可以知道第一,你需要提取每个氨基酸后面的数字,至于你的第二个要求就不太清楚了,只能猜测是每行最后是一个字母加三个被点分隔的数字,它们的前面也是一个数字,然后你要提取这个数字之前的字母。我不打算给你现成的代码,只是从我的角度认为你应该把问题描述清楚,然后肯定就会有很多热心的人给你代码了。
P.S. 生物信息的数据处理一般不都是用Perl/Python等脚本语言吗?像这类问题利用脚本语言的正则表达式功能很容易实现(当然C/C++也可用正则表达式)。当然要高效的话,脚本语言还是比C/C++效率低就是了。

论坛徽章:
0
3 [报告]
发表于 2013-09-11 09:27 |只看该作者
使用正则表达式, LYS的字母数量有规则,O63.12.2这个也有规则,处理字符串还是用正则,不知道你使用什么语言?

论坛徽章:
1
2015年迎新春徽章
日期:2015-03-04 09:50:28
4 [报告]
发表于 2013-09-11 10:14 |只看该作者
(\d+)..\d*(.)

此时不用正则,更待何时。

论坛徽章:
14
巨蟹座
日期:2013-11-19 14:09:4615-16赛季CBA联赛之青岛
日期:2016-07-05 12:36:0515-16赛季CBA联赛之广东
日期:2016-06-29 11:45:542015亚冠之全北现代
日期:2015-07-22 08:09:472015年辞旧岁徽章
日期:2015-03-03 16:54:15巨蟹座
日期:2014-12-29 08:22:29射手座
日期:2014-12-05 08:20:39狮子座
日期:2014-11-05 12:33:52寅虎
日期:2014-08-13 09:01:31巳蛇
日期:2014-06-16 16:29:52技术图书徽章
日期:2014-04-15 08:44:01天蝎座
日期:2014-03-11 13:06:45
5 [报告]
发表于 2013-09-12 09:28 |只看该作者
顶一下2楼
楼主应该告诉大家取数的规律
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP