免费注册 查看新帖 |

ChinaUnix.net

  平台 论坛 博客 文库 频道自动化运维 虚拟化 储存备份 C/C++ PHP MySQL 嵌入式 Linux系统
最近访问板块 发新帖
查看: 5389 | 回复: 7

[文本处理] 帮我看看这是些什么?怎样删除? [复制链接]

论坛徽章:
31
程序设计版块每日发帖之星
日期:2016-02-06 06:20:00程序设计版块每日发帖之星
日期:2016-07-20 06:20:00程序设计版块每日发帖之星
日期:2016-07-26 06:20:00每日论坛发贴之星
日期:2016-07-26 06:20:00程序设计版块每日发帖之星
日期:2016-07-27 06:20:00每日论坛发贴之星
日期:2016-07-27 06:20:00程序设计版块每日发帖之星
日期:2016-07-28 06:20:00程序设计版块每日发帖之星
日期:2016-07-29 06:20:00程序设计版块每日发帖之星
日期:2016-08-02 06:20:00程序设计版块每日发帖之星
日期:2016-08-06 06:20:00程序设计版块每日发帖之星
日期:2016-08-08 06:20:00程序设计版块每日发帖之星
日期:2016-08-09 06:20:00
发表于 2017-07-04 06:11 |显示全部楼层



整理一个.txt文档时,发现这个文档里面有问题,一些命令运行数据不完全,用尽我知道的办法,没解决问题。只好求助

我终于找到这个影响运行命令的部分,并把它提取出来,放到附件(82.rar)里供参考。我搞不明白这是些什么东西
(这部分也就是第2行与第3行之间的部分)


我的要求:
删除文档中这个影响我命令运行的部分(这部分也就是第2行与第3行之间的部分)
换言之,先删除文档中7852前面的部分


看截图:
1、用UE打开后的,开头和结尾,两张图
2、用UE打开后的,转成UTF-8,才能打开文档,一张图
3、打开文档后,开头部分、显示7852部分、结尾部分,三张图
4、文档用写字板打开后的,开头和结尾部分,两张图


谢谢!






1.jpg
2.jpg
3.jpg
4.jpg
5.jpg
6.jpg
7.jpg
8.jpg

82.rar

275 Bytes, 下载次数: 12

论坛徽章:
31
程序设计版块每日发帖之星
日期:2016-02-06 06:20:00程序设计版块每日发帖之星
日期:2016-07-20 06:20:00程序设计版块每日发帖之星
日期:2016-07-26 06:20:00每日论坛发贴之星
日期:2016-07-26 06:20:00程序设计版块每日发帖之星
日期:2016-07-27 06:20:00每日论坛发贴之星
日期:2016-07-27 06:20:00程序设计版块每日发帖之星
日期:2016-07-28 06:20:00程序设计版块每日发帖之星
日期:2016-07-29 06:20:00程序设计版块每日发帖之星
日期:2016-08-02 06:20:00程序设计版块每日发帖之星
日期:2016-08-06 06:20:00程序设计版块每日发帖之星
日期:2016-08-08 06:20:00程序设计版块每日发帖之星
日期:2016-08-09 06:20:00
发表于 2017-07-04 06:54 |显示全部楼层


要求:

1、或者单独提取出,第2行与第3行之间的这一部分(便于单独处理它)
2、然后,接着取反,提取出剩余部分

这样也行



论坛徽章:
0
发表于 2017-07-04 14:06 |显示全部楼层
神马是非法txt?答这就是。

非法txt特点:
1含00h。
2两个回车之间太远。

awk,sed遇到00h结果未知,谁知道会出啥问题?
两个回车之间太远,超过内存缓冲区,任何文本处理工具应该都出问题。包括文本编辑器,脚本引擎。

论坛徽章:
31
程序设计版块每日发帖之星
日期:2016-02-06 06:20:00程序设计版块每日发帖之星
日期:2016-07-20 06:20:00程序设计版块每日发帖之星
日期:2016-07-26 06:20:00每日论坛发贴之星
日期:2016-07-26 06:20:00程序设计版块每日发帖之星
日期:2016-07-27 06:20:00每日论坛发贴之星
日期:2016-07-27 06:20:00程序设计版块每日发帖之星
日期:2016-07-28 06:20:00程序设计版块每日发帖之星
日期:2016-07-29 06:20:00程序设计版块每日发帖之星
日期:2016-08-02 06:20:00程序设计版块每日发帖之星
日期:2016-08-06 06:20:00程序设计版块每日发帖之星
日期:2016-08-08 06:20:00程序设计版块每日发帖之星
日期:2016-08-09 06:20:00
发表于 2017-07-04 14:25 |显示全部楼层
回复 3# 本友会机友会摄友会


谢谢

咋办?


论坛徽章:
0
发表于 2017-07-04 14:38 |显示全部楼层
awk,sed估计不行。不过人家也没必要去干这种脏活。
ps的话,用bytes方法打开文本。或者用流方法打开。然后依次删除00h。----总之二进制打开,修复。
linux下,有啥二进制工具,能干此脏活,我不熟。

论坛徽章:
31
程序设计版块每日发帖之星
日期:2016-02-06 06:20:00程序设计版块每日发帖之星
日期:2016-07-20 06:20:00程序设计版块每日发帖之星
日期:2016-07-26 06:20:00每日论坛发贴之星
日期:2016-07-26 06:20:00程序设计版块每日发帖之星
日期:2016-07-27 06:20:00每日论坛发贴之星
日期:2016-07-27 06:20:00程序设计版块每日发帖之星
日期:2016-07-28 06:20:00程序设计版块每日发帖之星
日期:2016-07-29 06:20:00程序设计版块每日发帖之星
日期:2016-08-02 06:20:00程序设计版块每日发帖之星
日期:2016-08-06 06:20:00程序设计版块每日发帖之星
日期:2016-08-08 06:20:00程序设计版块每日发帖之星
日期:2016-08-09 06:20:00
发表于 2017-07-04 14:56 |显示全部楼层
回复 5# 本友会机友会摄友会


谢谢

不是我的错,文档很大,刚开始发现不了,拼命地找原因。终于找到这部分。


论坛徽章:
18
技术图书徽章
日期:2018-08-22 12:54:30技术图书徽章
日期:2018-08-22 12:54:20技术图书徽章
日期:2018-08-22 12:53:5715-16赛季CBA联赛之北京
日期:2018-08-17 18:43:3315-16赛季CBA联赛之上海
日期:2018-07-25 11:55:2615-16赛季CBA联赛之青岛
日期:2018-07-10 14:13:18IT运维版块每日发帖之星
日期:2016-07-14 06:20:00每日论坛发贴之星
日期:2016-06-10 06:20:00综合交流区版块每日发帖之星
日期:2016-06-10 06:20:00黑曼巴
日期:2016-06-08 11:29:1815-16赛季CBA联赛之同曦
日期:2016-06-07 17:47:2815-16赛季CBA联赛之山东
日期:2016-04-18 10:23:10
发表于 2018-07-25 14:15 |显示全部楼层
不行就自己写C代码实现?

论坛徽章:
28
ChinaUnix元老
日期:2015-02-02 08:55:392017金鸡报晓
日期:2017-01-10 15:13:29CU十四周年纪念徽章
日期:2018-08-29 22:12:2715-16赛季CBA联赛之深圳
日期:2018-09-20 12:21:09
发表于 2018-07-26 16:19 |显示全部楼层
试过 strings 命令吗?
# strings 82.txt
%2012
7852
wzay
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

数据风云,十年变迁
DTCC 第十届中国数据库技术大会已启航!

2019年5月8日~5月10日,由IT168旗下ITPUB企业社区平台主办的第十届中国数据库技术大会(DTCC2019),将在北京隆重召开。大会将邀请百余位行业专家,就热点技术话题进行分享,是广大数据领域从业人士的又一次年度盛会和交流平台。与SACC2018类似,本届大会将采用“3+2”模式:3天传统技术演讲+2天深度主题培训。大会不仅提供超100场的主题演讲,还会提供连续2天的深度课程培训,深化数据领域的项目落地实践方案。
DTCC2019,一场值得期待的数据技术盛会,殷切地希望您报名参与!

活动入口>>
  

北京盛拓优讯信息技术有限公司. 版权所有 16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122
中国互联网协会会员  联系我们:huangweiwei@it168.com
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP