论坛徽章:: 0

电梯直达

1楼 [收藏(0)] [报告]

发表于 2014-06-08 02:45 |只看该作者 |倒序浏览

本帖最后由 zhang40104 于 2014-06-08 16:21 编辑

文件１：
11412b4b-19cf-4ca4-84e1-a16759d184fa　 anyString
3078064c-1de4-42d3-ac6c-890f19a77ba3 anyString
50f97f0d-b5cf-4909-a941-544f9d5158d7 anyString
.....
十万条记录左右，第一个字段是uuid,为方便大家写正则表达式，可以用［0-9A-F]{32}来表示，不考虑其中的“－”号。

文件２：
asdf=11412b4b-19cf-4ca4-84e1-a16759d184fa=ejfsi=3078064c-1de4-42d3-ac6c-890f19a77ba3=jsdfl
woej2adfo=50f97f0d-b5cf-4909-a941-544f9d5158d7=o1jls2jasdfl

将文件２中出现在文件１第一个字段的字符串，更改为文件一相应第二个字段的任意字符串

我原先的思路是：
awk --re-interval 'BEGIN {while(getline < "文件１")var[$2]=$1} {print gensub(/([0-9A-F]{32})/,var["\\１"],"g")}' 文件２
即先用awk将文件１读入一个关联数组，以uuid为键，anyString为值，然后在文件２中找连续32个16进制字符，替换成以找到的32个字符为键的数组值。
可是不行，原因是var["\\1"]，这个反向引用第１个捕获行不通，\\1没有扩展成键，只是当成了"\\1"这个字符串。