免费注册	查看新帖 \|


平台论坛博客文库

› 论坛 › 程序设计 › C/C++ › 【讨论】格式文本中的分隔符

123 / 3 页下一页

最近访问板块

发新帖

楼主: sunlan

上一主题

下一主题

[C] 【讨论】格式文本中的分隔符 [复制链接]

论坛徽章:: 0

11楼 [报告]

发表于 2010-06-02 11:15 |只看该作者

认识这个字不？“丿”，我在江苏那边遇到一个地名里有这个字

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

12楼 [报告]

发表于 2010-06-02 11:17 |只看该作者

名称                            第一字节                            第二字节

GB2312          0xB0-0xF7(176-247)       0xA0-0xFE（160-254）

GBK                0x81-0xFE（129-254）       0x40-0xFE（64-254）

Big5             0x81-0xFE（129-255）       0x40-0x7E（64-126）

                                                               0xA1－0xFE（161-254）

所以我觉得用64以下的字符作为分隔符应该就可以了, 好像用\t做分隔符!

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

13楼 [报告]

发表于 2010-06-02 11:34 |只看该作者

丿不就是笔画么。
  第 56 区  〖一、丨、丿、刂、亻〗
┏━━┳━━━━━━━━━━━━━━━━━━━━━━━━━━┓
┃ D8 ┃ ０１２３４５６７８９  ┃
┣━━╋━━━━━━━━━━━━━━━━━━━━━━━━━━┫
┃ 560┃       亍丌兀丐廿卅丕亘丞  ┃
┃ 561┃ 鬲孬噩丨禺丿匕乇夭爻  ┃
┃ 562┃ 卮氐囟胤馗毓睾鼗丶亟  ┃
┃ 563┃ 鼐乜乩亓芈孛啬嘏仄厍  ┃
┃ 564┃ 厝厣厥厮靥赝匚叵匦匮  ┃
┃ 565┃ 匾赜卦卣刂刈刎刭刳刿  ┃
┃ 566┃ 剀剌剞剡剜蒯剽劂劁劐  ┃
┃ 567┃ 劓冂罔亻仃仉仂仨仡仫  ┃
┃ 568┃ 仞伛仳伢佤仵伥伧伉伫  ┃
┃ 569┃ 佞佧攸佚佝                         ┃
┗━━┻━━━━━━━━━━━━━━━━━━━━━━━━━━┛

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

14楼 [报告]

发表于 2010-06-02 16:49 |只看该作者

这个字不光是笔画，盐城有个地名叫“曹丿”

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

蜡笔小新他爸

论坛徽章:: 0

15楼 [报告]

发表于 2010-06-02 18:13 |只看该作者

回复 14# sunlan

这个字怎么读？

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

16楼 [报告]

发表于 2010-06-02 20:56 |只看该作者

回复 15# 蜡笔小新他爸

就念作pie

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

17楼 [报告]

发表于 2010-06-02 21:59 |只看该作者

可以试试将各个字段间用多个@@@分割或约定新的格式{begin...end}来解决

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

18楼 [报告]

发表于 2010-06-02 22:05 |只看该作者

可以试试用多个#或约定新的格式如{begin...end}来解决

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 15

射手座
日期:2014-11-29 19:22:49

15-16赛季CBA联赛之青岛
日期:2017-11-17 13:20:09

黑曼巴
日期:2017-07-13 19:13:47

15-16赛季CBA联赛之四川
日期:2017-02-07 21:08:57

2015年亚冠纪念徽章
日期:2015-11-06 12:31:58

每日论坛发贴之星
日期:2015-08-04 06:20:00

程序设计版块每日发帖之星
日期:2015-08-04 06:20:00

程序设计版块每日发帖之星
日期:2015-07-12 22:20:00

2015亚冠之浦和红钻
日期:2015-07-08 10:10:13

2015亚冠之大阪钢巴
日期:2015-06-29 11:21:12

2015亚冠之广州恒大
日期:2015-05-22 21:55:41

2015年亚洲杯之伊朗
日期:2015-04-10 16:28:25

19楼 [报告]

发表于 2010-06-21 17:36 |只看该作者

本帖最后由 yulihua49 于 2010-06-21 17:50 编辑

在应用系统中，经常会用格式文本（每条记录一行、同一行记录各字段间用分隔符分开）进行数据传输或处理。这 ...
sunlan 发表于 2010-06-02 00:03

可以转义，这问题早已解决。
XML和JSON也是用转义。

对于汉字，识别和跳过。
比如，我们用stptok()来拆分串，一个改造的stptok，跳过汉字，支持GBK，但不支持18030：

复制代码

SDBC的基础函数，用了很多年的，可靠。

打包时直接打，不管汉字不汉字，拆包时用stptok，保证汉字完整性。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

20楼 [报告]

发表于 2010-06-22 15:20 |只看该作者

perl split函数来处理

c ＋ perl

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

123 / 3 页下一页

发新帖

Chinaunix › 论坛 › 程序设计 › C/C++ › 【讨论】格式文本中的分隔符

北京盛拓优讯信息技术有限公司. 版权所有京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号：11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员联系我们：huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP