免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1026 | 回复: 2
打印 上一主题 下一主题

[文本处理] 去掉文本内的特殊字符 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2017-03-16 17:36 |只看该作者 |倒序浏览
有一个文本文件,
在vim下面编辑的话,显示如下:
  ---- More ----^[[42D                                          ^[[42D local-user xxx privilege level 15
  ---- More ----^[[42D                                          ^[[42D arp-fake expire-time 30
  ---- More ----^[[42D                                          ^[[42D  #
  ---- More ----^[[42D                                          ^[[42D  #
  ---- More ----^[[42D                                          ^[[42D port link-type access
  ---- More ----^[[42D                                          ^[[42D interface GigabitEthernet0/0/19
  ---- More ----^[[42D                                          ^[[42D stp disable
  ---- More ----^[[42D                                          ^[[42D description lingdao-server
  ---- More ----^[[42D                                          ^[[42D user-interface vty 0 4   

用cat打开,显示如下:
local-user xxx privilege level 15      
arp-fake expire-time 30                  
#                                         
#                                         
port link-type access                    
interface GigabitEthernet0/0/19           
stp disable                              
description lingdao-server               
user-interface vty 0 4


用shell该怎么去掉” ---- More ----^[[42D                                          ^[[42D“ 这些无用的字符呢?

尝试过 :
while read line
do
  #sed -i -e "s/*$line/ $line/" source.txt
done < teefile


报错:
+ read line
/' source.txtr xxx privilege level 15      
sed:-e 表达式 #1,字符 210:未终止的“s”命令
+ read line
/' source.txtexpire-time 30                  
sed:-e 表达式 #1,字符 188:未终止的“s”命令
+ read line
/' source.txt                                
sed:-e 表达式 #1,字符 142:未终止的“s”命令
+ read line
/' source.txt                                
sed:-e 表达式 #1,字符 142:未终止的“s”命令
+ read line
/' source.txt-type access                    
sed:-e 表达式 #1,字符 184:未终止的“s”命令
+ read line
...
...
...
...
...



vim.png (14.55 KB, 下载次数: 9)

vim所得

vim所得

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
2 [报告]
发表于 2017-03-16 18:13 |只看该作者
本帖最后由 jason680 于 2017-03-16 19:41 编辑

回复 1# unandy

$ hexdump -C FILE
00000000  2d 2d 2d 2d 20 4d 6f 72  65 20 2d 2d 2d 2d 1b 5b  |---- More ----.[|
00000010  34 32 44 20 20 20 20 20  20 20 20 20 20 20 20 20  |42D             |
00000020  20 20 20 20 20 20 20 20  20 20 20 20 20 20 20 20  |                |
00000030  20 20 20 20 20 20 20 20  20 20 20 20 20 1b 5b 34  |             .[4|
00000040  32 44 20 6c 6f 63 61 6c  2d 75 73 65 72 20 78 78  |2D local-user xx|
00000050  78 20 70 72 69 76 69 6c  65 67 65 20 6c 65 76 65  |x privilege leve|
00000060  6c 20 31 35 0a                                    |l 15.|
00000065

$ perl -pe '{while(s/^([^\x1b]+)\x1b\[(\d+)D//){$l=length($1);if($l>$2){$_=substr($1,0,$l-$2).$_}}}' FILE
local-user xxx privilege level 15

$ perl -pe '{while(s/^([^\x1b]+)\x1b\[(\d+)D//){$l=length($1);if($l>$2){$_=substr($1,0,$l-$2).$_}}}' FILE |hexdump -C
00000000  20 6c 6f 63 61 6c 2d 75  73 65 72 20 78 78 78 20  | local-user xxx |
00000010  70 72 69 76 69 6c 65 67  65 20 6c 65 76 65 6c 20  |privilege level |
00000020  31 35 0a                                          |15.|
00000023


论坛徽章:
0
3 [报告]
发表于 2017-03-16 20:26 |只看该作者
@jason680 的方式可行,谢谢。

还有shell的处理方式吗?
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP