- 论坛徽章:
- 0
|
本帖最后由 yelang5460 于 2015-06-02 13:11 编辑
我有一个文本,由固定开头格式和结尾格式的行形成的段落,组成的一个长文本,格式如下:
====================================================
<appwidget
launcher:packageName="com.sec.android.widgetapp.digitalclock"
launcher:className="com.sec.android.widgetapp.digitalclock.DigitalClockWidgetProvider"
launcher:screen="1"
launcher:x="0"
launcher:y="0"
launcher:spanX="4"
launcher:spanY="1" />
<appwidget
launcher:packageName="com.baidu.searchbox"
launcher:className="com.baidu.searchbox.widget.TransSearchWidgetProvider"
launcher:screen="1"
launcher:x="0"
launcher:y="1"
launcher:spanX="4"
launcher:spanY="1" />
<favorite
launcher:packageName="com.tencent.mtt"
launcher:className="com.tencent.mtt.SplashActivity"
launcher:screen="1"
launcher:x="1"
launcher:y="2" />
<favorite
launcher:packageName="com.tencent.android.qqdownloader"
launcher:className="com.tencent.assistant.activity.SplashActivity"
launcher:screen="1"
launcher:x="2"
launcher:y="2" />
........
........
........
=================================================
现在想通过awk,提取:1,以<appwidget开头,2,段落中间含有“digitalclock”或者“Digitalclock”字符串,3, 以第一个“/>”结尾的段,并将其中“ launcher:screen="1" launcher:x="0" launcher:y="0" "1 0 0 三个值赋值给三个变量
我是新手,对于正则和awk grep和cult sed之类的了解不多,试了几种方法,貌似都是基于文本行的处理,可以定位到digitalclock行,但是接下来怎么定位到开始标志和结束标志符号,仅有的知识储备不够用了,求大神指教......哪怕只有思路也行.......
|
|