免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123下一页
最近访问板块 发新帖
查看: 7155 | 回复: 23
打印 上一主题 下一主题

脚本分析 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2011-06-01 11:13 |只看该作者 |倒序浏览
我想统计下面文本中单词的个数,例如:F_OK, O_APPEND,...请高手帮忙解答一下

'F_OK', 'O_APPEND', 'O_BINARY', 'O_CREAT', 'O_EXCL', 'O_NOINHERIT', 'O_RANDOM',
'O_RDONLY', 'O_RDWR', 'O_SEQUENTIAL', 'O_SHORT_LIVED', 'O_TEMPORARY', 'O_TEXT',
'O_TRUNC', 'O_WRONLY', 'P_DETACH', 'P_NOWAIT', 'P_NOWAITO', 'P_OVERLAY', 'P_WAI
T', 'R_OK', 'SEEK_CUR', 'SEEK_END', 'SEEK_SET', 'TMP_MAX', 'UserDict', 'W_OK', '
X_OK', '_Environ', '__all__', '__builtins__', '__doc__', '__file__', '__name__',
'__package__', '_copy_reg', '_execvpe', '_exists', '_exit', '_get_exports_list'
, '_make_stat_result', '_make_statvfs_result', '_pickle_stat_result', '_pickle_s
tatvfs_result', 'abort', 'access', 'altsep', 'chdir', 'chmod', 'close', 'closerange',
'curdir', 'defpath', 'devnull', 'dup', 'dup2', 'environ', 'errno', 'error'
, 'execl', 'execle', 'execlp', 'execlpe', 'execv', 'execve', 'execvp', 'execvpe'
, 'extsep', 'fdopen', 'fstat', 'fsync', 'getcwd', 'getcwdu', 'getenv', 'getpid',
'isatty', 'linesep', 'listdir', 'lseek', 'lstat', 'makedirs', 'mkdir', 'name',
'open', 'pardir', 'path', 'pathsep', 'pipe', 'popen', 'popen2', 'popen3', 'popen
4', 'putenv', 'read', 'remove', 'removedirs', 'rename', 'renames', 'rmdir', 'sep
', 'spawnl', 'spawnle', 'spawnv', 'spawnve', 'startfile', 'stat', 'stat_float_ti
mes', 'stat_result', 'statvfs_result', 'strerror', 'sys', 'system', 'tempnam', '
times', 'tmpfile', 'tmpnam', 'umask', 'unlink', 'unsetenv', 'urandom', 'utime',
'waitpid', 'walk', 'write'

论坛徽章:
0
2 [报告]
发表于 2011-06-01 11:23 |只看该作者
'P_WAI
T', 'R_OK',

这样的数据是不是分行的?

论坛徽章:
0
3 [报告]
发表于 2011-06-01 11:26 |只看该作者
是分行的,
想要的预期结果是:P_WAIT,
也就是关注引号里面的内容

论坛徽章:
0
4 [报告]
发表于 2011-06-01 11:52 |只看该作者
grep -o "," file|wc -l

论坛徽章:
8
摩羯座
日期:2014-11-26 18:59:452015亚冠之浦和红钻
日期:2015-06-23 19:10:532015亚冠之西悉尼流浪者
日期:2015-08-21 08:40:5815-16赛季CBA联赛之山东
日期:2016-01-31 18:25:0515-16赛季CBA联赛之四川
日期:2016-02-16 16:08:30程序设计版块每日发帖之星
日期:2016-06-29 06:20:002017金鸡报晓
日期:2017-01-10 15:19:5615-16赛季CBA联赛之佛山
日期:2017-02-27 20:41:19
5 [报告]
发表于 2011-06-01 11:56 |只看该作者
tr -d '\n' <urfile|tr -s \', '\n'|sort|uniq -c

论坛徽章:
0
6 [报告]
发表于 2011-06-01 11:59 |只看该作者
本帖最后由 ywlscpl 于 2011-06-01 12:07 编辑

回复 1# huaqi2008
  1. awk -v RS=, -F "['\n]" 'NF==3{a[$2]++;next}{a[$(NF-1)$(NF-2)]++}END{for (i in a) print i,a[i];print "total:"asort(a)}' file
复制代码

论坛徽章:
0
7 [报告]
发表于 2011-06-01 12:02 |只看该作者
tr -d '\n' <file|tr -d \'

论坛徽章:
0
8 [报告]
发表于 2011-06-01 12:48 |只看该作者
4楼的统计结果又错,5楼的可以
6楼的,我的awk不支持asort,faint!!!

论坛徽章:
0
9 [报告]
发表于 2011-06-01 12:52 |只看该作者
回复 6# ywlscpl


    能简单解释一下这段awk吗?看不懂来

论坛徽章:
2
射手座
日期:2014-10-10 15:59:4715-16赛季CBA联赛之上海
日期:2016-03-03 10:27:14
10 [报告]
发表于 2011-06-01 12:56 |只看该作者
本帖最后由 yinyuemi 于 2011-06-01 13:39 编辑
我想统计下面文本中单词的个数,例如:F_OK, O_APPEND,...请高手帮忙解答一下

'F_OK', 'O_APPEND', 'O_B ...
huaqi2008 发表于 2011-06-01 11:13



    awk -vRS="'|," 'NF+=0{a[$0]}END{for(i in a) ++sum;print sum}'  file
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP