- 论坛徽章:
- 0
|
本帖最后由 peterdocter 于 2013-09-12 11:53 编辑
sed -nr "/[^a-zA-Z0-9:' \-\,]/p"
grep -e "[^a-zA-Z0-9:' \-\,]"
都有部分失败?
如出现了:
1080:ten-eighties
1080:ten-eighty
4-F:4-Fs
4-H:4-Her
4-H:4-H'er
4-H:4-H'ers
lobo:lobo-
Logo:logo-
Hasa:Hasa, Al-
S-M:S/M
able-bodied seaman:able-bodied seamen
这些按道理不出现才对。
这条正则用editplus又可以正则,真奇怪...
最终要取到是:
Bahā' Allāh:Baha' Allah
Bahā' Allāh:Bahaullah
béchamel:bechamel
béchamel:bechamels
bergère:bergere
bergère:bergeres
ā有这样的非正常英文字母的记录...
给出完整demo
diff4.rar
(566.42 KB, 下载次数: 2)
|
|