免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 5991 | 回复: 2
打印 上一主题 下一主题

怎么判断当前文件中含有unicode字符? [复制链接]

论坛徽章:
3
戌狗
日期:2014-09-10 17:07:162015年辞旧岁徽章
日期:2015-03-03 16:54:15wusuopu
日期:2016-06-17 17:43:45
1 [报告]
发表于 2009-01-13 11:17 |显示全部楼层
  1. perl -ne 'print "$.,". ($-[0]+1) ."($+): $_" if /([^\x00-\x7f]+)/' urfile
复制代码

论坛徽章:
3
戌狗
日期:2014-09-10 17:07:162015年辞旧岁徽章
日期:2015-03-03 16:54:15wusuopu
日期:2016-06-17 17:43:45
2 [报告]
发表于 2009-01-13 12:49 |显示全部楼层
原帖由 GodPig 于 2009-1-13 12:45 发表
谢谢,看起来很复杂呀
这个perl???
有空还得研究研究……

复杂是因为显示了行号,列,非ascii字符。
其他工具应该也有相应方法。

论坛徽章:
3
戌狗
日期:2014-09-10 17:07:162015年辞旧岁徽章
日期:2015-03-03 16:54:15wusuopu
日期:2016-06-17 17:43:45
3 [报告]
发表于 2009-01-14 01:01 |显示全部楼层
原帖由 GodPig 于 2009-1-13 19:28 发表
恩,用二进制编辑器查看了一下,发现文件前面果然多了三个字节!!!

但删除之后仍然有问题,看样改变的不只这个地方?、??

啊……

是不是默认保存成utf-8或者其他格式了
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP