论坛徽章:: 0

电梯直达

1楼 [收藏(0)] [报告]

发表于 2018-09-02 23:11 |只看该作者 |倒序浏览

我有一个文件想拆分为若干个xml文件

[R17:25:37.267][  DE01][0002882BA207D8F5E8E6C9F<?xml version="1.0" encoding="GBK" ?>
<ROOT>
  <HEAD>
<VERSION></VERSION>
<MSG_TYPE>1</MSG_TYPE>
<MSG_REAL>0</MSG_REAL>
<REQ_SAVE></REQ_SAVE>
<GLOBAL_TASK_ID>2021071010010000010803</GLOBAL_TASK_ID>
<SYS_ID></SYS_ID>
<CHL_NO>1001</CHL_NO>

.....................................

类似于这样，想按照<?xml version="1.0" encoding= >拆分为很多xml文件

使用sed 脚本如下

#!/bin/sh
File=./PktLog
count=0
line=(`sed -n '/?xml version="1.0" encoding/=' $File`)
num=${#line[@]}
for n in ${line[*]}
do
[ $count -eq 0 ] && startLine=$n && continue
let count+=1
let endLine=n-1
if [ $count -eq $num ]; then
   startLine=$n
   sed -n "${startLine},$ p" $File >result_${count}.txt
else
   sed -n "${startLine},${endLine} p;q" $File >result_${count}.txt
   startLine=$n
fi
done

但是脚本运行错误  请帮忙看看非常感谢。

spark@ubuntu:~$ sh split.sh
split.sh: 5: split.sh: Syntax error: "(" unexpected

文库|博客

cgiyan

白手起家

论坛徽章:: 0

2楼 [报告]

发表于 2018-09-03 09:23 |只看该作者

我调整bash后脚本可以正常运行。但是没有生成分割的文件。调试脚本信息如下图

spark@ubuntu:~$ sh -x split.sh
+ File=/home/spark/PktLog
+ count=0
+ line=(`sed -n '/?xml version="1.0" encoding/=' $File`)
++ sed -n '/?xml version="1.0" encoding/=' /home/spark/PktLog
+ num=333
+ for n in '${line[*]}'
+ '[' 0 -eq 0 ']'
+ startLine=1
+ continue
+ for n in '${line[*]}'
+ '[' 0 -eq 0 ']'
+ startLine=137
+ continue
+ for n in '${line[*]}'
+ '[' 0 -eq 0 ']'
+ startLine=244
+ continue
+ for n in '${line[*]}'
+ '[' 0 -eq 0 ']'
+ startLine=415
+ continue
+ for n in '${line[*]}'
+ '[' 0 -eq 0 ']'
+ startLine=522
+ continue
+ for n in '${line[*]}'
+ '[' 0 -eq 0 ']'
+ startLine=674
+ continue
+ for n in '${line[*]}'
+ '[' 0 -eq 0 ']'
+ startLine=780
+ continue
+ for n in '${line[*]}'
+ '[' 0 -eq 0 ']'
+ startLine=932
.............................

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

本友会机友会摄友会本友会机友会摄友会当前离线禁止发言好友博客消息论坛徽章: 0	3楼 [报告] 发表于 2018-09-03 15:04 \|只看该作者提示: 作者被禁止或删除内容自动屏蔽
	实战分享：从技术角度谈机器学习入门\| 【大话IT】RadonDB低门槛向MySQL集群下战书 \| ChinaUnix打赏功能已上线！ \| 新一代分布式关系型数据库RadonDB知多少？

cgiyan

白手起家

论坛徽章:: 0

4楼 [报告]

发表于 2018-09-03 16:56 |只看该作者

#!/bin/sh
File=/home/spark/PktLog
count=0
startLine=(`sed -n -e '/?xml version="1.0" encoding/=' $File`)
fileEnd=`sed -n '$=' $File`
endLine=(`echo ${startLine[*]} | awk -v a=$fileEnd '{for(i=2;i<=NF;i++) printf("%d ",$i-1);print a}'`)
let maxIndex=${#startLine[@]}-1
for n in `seq 0 $maxIndex`
do
sed -n "${startLine[$n]},${endLine[$n]}p" $File >result_${n}.xml
done
echo $startLine[@]
我用这个脚本也可以处理，生成大量的xml.
还有个问题请教：
fileEnd=`sed -n '$=' $File`
endLine=(`echo ${startLine[*]} | awk -v a=$fileEnd '{for(i=2;i<=NF;i++) printf("%d ",$i-1);print a}'`)

复制代码

能否给讲讲 endLine 和fileEnd 代码的意思，谢谢

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

返回列表

Chinaunix › 论坛 › 程序设计 › Shell › sed按关键字拆分一个文件

[文本处理] sed按关键字拆分一个文件 [复制链接]

浏览过的版块