免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 43431 | 回复: 15
打印 上一主题 下一主题

[文本处理] 麻烦大神给个效率稍高一点的代码,谢谢! [复制链接]

论坛徽章:
31
程序设计版块每日发帖之星
日期:2016-02-06 06:20:00程序设计版块每日发帖之星
日期:2016-07-20 06:20:00程序设计版块每日发帖之星
日期:2016-07-26 06:20:00每日论坛发贴之星
日期:2016-07-26 06:20:00程序设计版块每日发帖之星
日期:2016-07-27 06:20:00每日论坛发贴之星
日期:2016-07-27 06:20:00程序设计版块每日发帖之星
日期:2016-07-28 06:20:00程序设计版块每日发帖之星
日期:2016-07-29 06:20:00程序设计版块每日发帖之星
日期:2016-08-02 06:20:00程序设计版块每日发帖之星
日期:2016-08-06 06:20:00程序设计版块每日发帖之星
日期:2016-08-08 06:20:00程序设计版块每日发帖之星
日期:2016-08-09 06:20:00
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2016-08-02 09:06 |只看该作者 |倒序浏览


干掉空行、只干掉行首空格及行尾空格 (包括Tab键符) 效率高一点的代码


或请大神给整理一下
sed 's/^[[:space:]]*\|[ \t]*$//g;/^$/d'

谢谢了

论坛徽章:
5
金牛座
日期:2013-10-14 14:40:422015年亚洲杯之伊朗
日期:2015-03-26 10:37:012015亚冠之浦和红钻
日期:2015-10-12 17:47:4115-16赛季CBA联赛之山东
日期:2016-01-20 16:43:1215-16赛季CBA联赛之辽宁
日期:2016-03-29 16:43:59
2 [报告]
发表于 2016-08-02 17:59 |只看该作者
[root@vof ~]# cat t
end 2kg  
this 1ok line
   start 4kg

  start end 2kg  
         start 1tab 1kg

end 1tab 1kg     
this 2ok line
[root@vof ~]# sed -r 's/^[ \t]+//;s/[ \t]+$//;/^[ \t]*$/d' t
end 2kg
this 1ok line
start 4kg
start end 2kg
start 1tab 1kg
end 1tab 1kg
this 2ok line
[root@vof ~]#

论坛徽章:
31
程序设计版块每日发帖之星
日期:2016-02-06 06:20:00程序设计版块每日发帖之星
日期:2016-07-20 06:20:00程序设计版块每日发帖之星
日期:2016-07-26 06:20:00每日论坛发贴之星
日期:2016-07-26 06:20:00程序设计版块每日发帖之星
日期:2016-07-27 06:20:00每日论坛发贴之星
日期:2016-07-27 06:20:00程序设计版块每日发帖之星
日期:2016-07-28 06:20:00程序设计版块每日发帖之星
日期:2016-07-29 06:20:00程序设计版块每日发帖之星
日期:2016-08-02 06:20:00程序设计版块每日发帖之星
日期:2016-08-06 06:20:00程序设计版块每日发帖之星
日期:2016-08-08 06:20:00程序设计版块每日发帖之星
日期:2016-08-09 06:20:00
3 [报告]
发表于 2016-08-02 18:40 |只看该作者
回复 2# itfly3



谢谢大神,感谢抽空来帮助

测试了一个400多M的文档

分别用一楼的和你的,你的确实快一些


   

论坛徽章:
0
4 [报告]
发表于 2016-08-03 00:44 |只看该作者
本帖最后由 请叫我俊哥哈 于 2016-08-03 01:28 编辑

cat 8
1 2 2

1 2 3
        ee
ffe  
geg geg
gehe hrhr
444








41 1        1        2



# awk '$1=$1' 8
1 2 2
1 2 3
ee
ffe
geg geg
gehe hrhr
444
41 1 1 2

论坛徽章:
31
程序设计版块每日发帖之星
日期:2016-02-06 06:20:00程序设计版块每日发帖之星
日期:2016-07-20 06:20:00程序设计版块每日发帖之星
日期:2016-07-26 06:20:00每日论坛发贴之星
日期:2016-07-26 06:20:00程序设计版块每日发帖之星
日期:2016-07-27 06:20:00每日论坛发贴之星
日期:2016-07-27 06:20:00程序设计版块每日发帖之星
日期:2016-07-28 06:20:00程序设计版块每日发帖之星
日期:2016-07-29 06:20:00程序设计版块每日发帖之星
日期:2016-08-02 06:20:00程序设计版块每日发帖之星
日期:2016-08-06 06:20:00程序设计版块每日发帖之星
日期:2016-08-08 06:20:00程序设计版块每日发帖之星
日期:2016-08-09 06:20:00
5 [报告]
发表于 2016-08-03 04:06 |只看该作者
回复 4# 请叫我俊哥哈


谢谢大神

麻烦再修改一下

下面这样的你的代码不认,给忽略掉了。应该是不认 0 吧?

把下面的我已处理过,空行、只行首空格及行尾空格 (包括Tab键符)
  1. +.0
  2. +.0000
  3. +0
  4. +0.
  5. +000
  6. +00000000
  7. -0.000
  8. -0000
  9. -000000
  10. -000000.
  11. -00000000
  12. .0
  13. .000
  14. .00000
  15. .000000
  16. .0000000
  17. 0
  18. 0.
  19. 0.0
  20. 0.00
  21. 0.0000
  22. 0.00000
  23. 0.000000
  24. 0.0000000
  25. 00
  26. 00.
  27. 00.00
  28. 00.000
  29. 000
  30. 000.
  31. 000.00
  32. 000.000
  33. 0000
  34. 0000.
  35. 0000.0
  36. 0000.0000
  37. 00000
  38. 00000.
  39. 00000.0
  40. 00000.00
  41. 000000
  42. 000000.
  43. 000000.0
  44. 000000.00
  45. 000000.000
  46. 0000000
  47. 0000000.
  48. 00000000
  49. 00000000.
  50. 00000000.0
  51. 000000000
  52. 000000000.
  53. 0000000000
  54. 0000000000.
  55. 00000000000
  56. 000000000000
  57. 0000000000000
  58. 00000000000000
  59. 000000000000000
  60. 0000000000000000
  61. 000000000000000000
  62. 0000000000000000000
  63. 00000000000000000000
  64. 000000000000000000000000
  65. 0000000000000000000000000
  66. 00000000000000000000000000000000
  67. 0000000000000000000000000000000000000000000000000000000000000000000
  68. 0000000000000000000000000000000000000000000000000000000000000000000000000000000000000
  69. 0000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000
  70. 00e0
  71. 0E0
  72. 0e36641
  73. 0e445760
复制代码
另外,这样的就不管了,没搞明白哪个代码认识它。(把下面的我已处理过)
  1. y:緬殊Uw3_h?絪庋oHL?姽砧?(ぺ?骔l軭岽_
复制代码

论坛徽章:
6
15-16赛季CBA联赛之新疆
日期:2016-03-22 22:34:5915-16赛季CBA联赛之山东
日期:2016-04-11 09:08:41程序设计版块每日发帖之星
日期:2016-06-28 06:20:00程序设计版块每日发帖之星
日期:2016-07-19 06:20:00每日论坛发贴之星
日期:2016-07-19 06:20:0015-16赛季CBA联赛之青岛
日期:2016-07-20 22:44:17
6 [报告]
发表于 2016-08-03 06:36 |只看该作者
$>  cat aa|grep .|perl -nlpe 's/^\s+|\s+$//'

论坛徽章:
6
15-16赛季CBA联赛之新疆
日期:2016-03-22 22:34:5915-16赛季CBA联赛之山东
日期:2016-04-11 09:08:41程序设计版块每日发帖之星
日期:2016-06-28 06:20:00程序设计版块每日发帖之星
日期:2016-07-19 06:20:00每日论坛发贴之星
日期:2016-07-19 06:20:0015-16赛季CBA联赛之青岛
日期:2016-07-20 22:44:17
7 [报告]
发表于 2016-08-03 06:37 |只看该作者
$>  cat aa|grep .|perl -nlpe 's/^\s+|\s+$//'

论坛徽章:
1
15-16赛季CBA联赛之广东
日期:2016-08-02 22:35:15
8 [报告]
发表于 2016-08-03 08:01 |只看该作者
sed -r 's/^[ \t]+//g;s/[ \t]+$//g;/^$/d'

论坛徽章:
31
程序设计版块每日发帖之星
日期:2016-02-06 06:20:00程序设计版块每日发帖之星
日期:2016-07-20 06:20:00程序设计版块每日发帖之星
日期:2016-07-26 06:20:00每日论坛发贴之星
日期:2016-07-26 06:20:00程序设计版块每日发帖之星
日期:2016-07-27 06:20:00每日论坛发贴之星
日期:2016-07-27 06:20:00程序设计版块每日发帖之星
日期:2016-07-28 06:20:00程序设计版块每日发帖之星
日期:2016-07-29 06:20:00程序设计版块每日发帖之星
日期:2016-08-02 06:20:00程序设计版块每日发帖之星
日期:2016-08-06 06:20:00程序设计版块每日发帖之星
日期:2016-08-08 06:20:00程序设计版块每日发帖之星
日期:2016-08-09 06:20:00
9 [报告]
发表于 2016-08-03 08:24 |只看该作者
回复 7# RE_HASH



大神,麻烦检查下

简单说,别的代码处理完后假如是10M,你这个代码处理完后只剩5M

辛苦


   

论坛徽章:
31
程序设计版块每日发帖之星
日期:2016-02-06 06:20:00程序设计版块每日发帖之星
日期:2016-07-20 06:20:00程序设计版块每日发帖之星
日期:2016-07-26 06:20:00每日论坛发贴之星
日期:2016-07-26 06:20:00程序设计版块每日发帖之星
日期:2016-07-27 06:20:00每日论坛发贴之星
日期:2016-07-27 06:20:00程序设计版块每日发帖之星
日期:2016-07-28 06:20:00程序设计版块每日发帖之星
日期:2016-07-29 06:20:00程序设计版块每日发帖之星
日期:2016-08-02 06:20:00程序设计版块每日发帖之星
日期:2016-08-06 06:20:00程序设计版块每日发帖之星
日期:2016-08-08 06:20:00程序设计版块每日发帖之星
日期:2016-08-09 06:20:00
10 [报告]
发表于 2016-08-03 08:29 |只看该作者
回复 8# 杰大森


谢谢大神

你这个和一楼的差不多,稍快一丁点。代码完美

辛苦了


   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP