免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 4248 | 回复: 5
打印 上一主题 下一主题

如何用perl实现简单的分词 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-12-04 23:26 |只看该作者 |倒序浏览
按空格分词不考虑标点符号,并保存到一个数组或者hash中

比如,hello everybody good evening

把它分成hello,everybody,good,evening四个单词并存在一个数组里。

想了一些C语言的方法,比如,把这句话存在一个字符串数组里,然后读取到空格的时候,指针回溯去取前面的单词。但是。。。貌似perl。。。没有指针,也没有字符串数组。。。

然后又想到放到一个栈里,读到空格的时候,pop之前读取的元素,但是貌似,也不会写。。。

所以各位,有什么好的方法吗。最好能给出实例代码。

论坛徽章:
7
戌狗
日期:2013-12-15 20:43:38技术图书徽章
日期:2014-03-05 01:33:12技术图书徽章
日期:2014-03-15 20:31:17未羊
日期:2014-03-25 23:48:20丑牛
日期:2014-04-07 22:37:44巳蛇
日期:2014-04-11 21:58:0915-16赛季CBA联赛之青岛
日期:2016-03-17 20:36:13
2 [报告]
发表于 2013-12-05 06:53 |只看该作者
biru:
  1. my $s = 'hello everybody good evening';

  2. # for array
  3. my @a = split /\s+/, $s;
  4. my @b = $s =~ /\w+/g;
  5. my @c = map split, $s;
  6. my @d = map /\w+/g, $s;

  7. # for hash
  8. my %e = map { $_, 1 } split /\s+/, $s;
  9. my %f = map { $_, 1 } $s =~ /\w+/g;
  10. my %g = map { $_, 1 } map split, $s;
  11. my %h = map { $_, 1 } map /\w+/g, $s;
复制代码

论坛徽章:
46
15-16赛季CBA联赛之四川
日期:2018-03-27 11:59:132015年亚洲杯之沙特阿拉伯
日期:2015-04-11 17:31:45天蝎座
日期:2015-03-25 16:56:49双鱼座
日期:2015-03-25 16:56:30摩羯座
日期:2015-03-25 16:56:09巳蛇
日期:2015-03-25 16:55:30卯兔
日期:2015-03-25 16:54:29子鼠
日期:2015-03-25 16:53:59申猴
日期:2015-03-25 16:53:29寅虎
日期:2015-03-25 16:52:29羊年新春福章
日期:2015-03-25 16:51:212015亚冠之布里斯班狮吼
日期:2015-07-13 10:44:56
3 [报告]
发表于 2013-12-05 09:19 |只看该作者
这么暴力,直接列8种方法

论坛徽章:
7
戌狗
日期:2013-12-15 20:43:38技术图书徽章
日期:2014-03-05 01:33:12技术图书徽章
日期:2014-03-15 20:31:17未羊
日期:2014-03-25 23:48:20丑牛
日期:2014-04-07 22:37:44巳蛇
日期:2014-04-11 21:58:0915-16赛季CBA联赛之青岛
日期:2016-03-17 20:36:13
4 [报告]
发表于 2013-12-05 23:16 |只看该作者
回复 3# zhlong8
TMTOWTDI
Perl语言的中心思想..
   

论坛徽章:
0
5 [报告]
发表于 2013-12-12 10:58 |只看该作者
或者
  1. use strict;
  2. use warnings;

  3. my @a=qw(hello everybody good evening);
复制代码

论坛徽章:
0
6 [报告]
发表于 2013-12-12 14:17 |只看该作者
afukada 发表于 2013-12-12 10:58
或者

还是这厮的直接明了!
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP