免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 6635 | 回复: 9
打印 上一主题 下一主题

[文本处理] 请教如何去掉字符串开头的一个或者几个空格字符 [复制链接]

论坛徽章:
18
辰龙
日期:2014-05-21 21:01:4115-16赛季CBA联赛之深圳
日期:2016-12-23 13:51:3815-16赛季CBA联赛之北控
日期:2016-11-28 18:26:3815-16赛季CBA联赛之佛山
日期:2016-11-03 11:18:5815-16赛季CBA联赛之辽宁
日期:2016-07-10 16:09:4115-16赛季CBA联赛之江苏
日期:2016-02-20 23:09:202015亚冠之塔什干棉农
日期:2015-08-17 19:49:492015年亚洲杯之日本
日期:2015-04-30 01:24:342015年亚洲杯之约旦
日期:2015-04-01 00:37:182015年亚洲杯之沙特阿拉伯
日期:2015-03-02 15:55:40处女座
日期:2014-05-25 10:34:0020周年集字徽章-年
日期:2023-04-23 11:17:52
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2015-06-03 03:41 |只看该作者 |倒序浏览
大家好!
我有一个问题向大家请教。

请看以下三个变量,所代表的字符串中开头、中间和结尾,分别有一个、两个和三个空格。
  1. a1=" line one "
  2. a2="  line  two  "
  3. a3="   line   three   "
  4. [enb@hp8:~]$ printf "|$a1|\n|$a2|\n|$a3|\n"
  5. | line one |
  6. |  line  two  |
  7. |   line   three   |
  8. [enb@hp8:~]$
复制代码
现在我希望保持中间的字符串数量不变,
1)将头尾的空格全部删除应该怎么做呢?
  1. a1="line one"
  2. a2="line  two"
  3. a3="line   three"
  4. [enb@hp8:~]$ printf "|$a1|\n|$a2|\n|$a3|\n"
  5. |line one|
  6. |line  two|
  7. |line   three|
  8. [enb@hp8:~]$
复制代码
2)如果仅将头尾的空格各只删除一个,即一头一尾两个空格,应该怎么做呢?
  1. a1="line one"
  2. a2=" line  two "
  3. a3="  line   three  "
  4. [enb@hp8:~]$ printf "|$a1|\n|$a2|\n|$a3|\n"
  5. |line one|
  6. | line  two |
  7. |  line   three  |
  8. [enb@hp8:~]$
复制代码
谢谢大家!

论坛徽章:
8
摩羯座
日期:2014-11-26 18:59:452015亚冠之浦和红钻
日期:2015-06-23 19:10:532015亚冠之西悉尼流浪者
日期:2015-08-21 08:40:5815-16赛季CBA联赛之山东
日期:2016-01-31 18:25:0515-16赛季CBA联赛之四川
日期:2016-02-16 16:08:30程序设计版块每日发帖之星
日期:2016-06-29 06:20:002017金鸡报晓
日期:2017-01-10 15:19:5615-16赛季CBA联赛之佛山
日期:2017-02-27 20:41:19
2 [报告]
发表于 2015-06-03 06:05 |只看该作者

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
3 [报告]
发表于 2015-06-03 09:05 |只看该作者
  1. sed -r 's/^ *| *$//'
  2. sed -r 's/^ | $//'
复制代码

论坛徽章:
6
羊年新春福章
日期:2015-03-03 17:16:28双子座
日期:2015-03-03 17:16:56巳蛇
日期:2015-03-03 17:17:2415-16赛季CBA联赛之福建
日期:2016-03-11 09:05:00黑曼巴
日期:2016-07-07 16:58:1215-16赛季CBA联赛之吉林
日期:2016-11-14 09:23:07
4 [报告]
发表于 2015-06-03 09:06 |只看该作者
本帖最后由 jcdiy0601 于 2015-06-03 09:12 编辑

python
1.str.strip()去除头尾空格
2.去掉一个空格的情况,也就只能用正则来解决了
re.sub()
re.sub(r'^ | $','',a1)

论坛徽章:
11
射手座
日期:2015-08-11 16:10:26辰龙
日期:2015-08-11 16:11:11黑曼巴
日期:2016-04-26 16:58:40
5 [报告]
发表于 2015-06-03 10:35 |只看该作者
本帖最后由 hjfeng1988 于 2015-06-03 10:36 编辑

回复 3# yestreenstars


    并不是以空格开头或结尾。
1)
  1. sed -r 's/(=") */\1/;s/ *("$)/\1/' file
复制代码
2)
  1. sed -r 's/(=") /\1/;s/ ("$)/\1/' file
复制代码

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
6 [报告]
发表于 2015-06-03 10:57 |只看该作者
回复 5# hjfeng1988

呵呵呵~
   

论坛徽章:
18
辰龙
日期:2014-05-21 21:01:4115-16赛季CBA联赛之深圳
日期:2016-12-23 13:51:3815-16赛季CBA联赛之北控
日期:2016-11-28 18:26:3815-16赛季CBA联赛之佛山
日期:2016-11-03 11:18:5815-16赛季CBA联赛之辽宁
日期:2016-07-10 16:09:4115-16赛季CBA联赛之江苏
日期:2016-02-20 23:09:202015亚冠之塔什干棉农
日期:2015-08-17 19:49:492015年亚洲杯之日本
日期:2015-04-30 01:24:342015年亚洲杯之约旦
日期:2015-04-01 00:37:182015年亚洲杯之沙特阿拉伯
日期:2015-03-02 15:55:40处女座
日期:2014-05-25 10:34:0020周年集字徽章-年
日期:2023-04-23 11:17:52
7 [报告]
发表于 2015-06-03 13:04 |只看该作者
谢谢各位大神的指点。

论坛徽章:
14
15-16赛季CBA联赛之辽宁
日期:2019-06-16 15:47:3515-16赛季CBA联赛之广夏
日期:2016-08-13 21:24:352015亚冠之武里南联
日期:2015-07-07 17:37:372015亚冠之萨济拖拉机
日期:2015-07-06 17:07:482015亚冠之全北现代
日期:2015-06-04 13:54:272015亚冠之城南
日期:2015-05-21 15:43:212015年亚洲杯之伊朗
日期:2015-04-25 18:20:362015年亚洲杯之伊朗
日期:2015-04-20 16:06:052015年亚洲杯之科威特
日期:2015-03-07 12:51:26丑牛
日期:2014-12-30 10:26:38申猴
日期:2014-09-28 22:40:18金牛座
日期:2014-09-13 21:12:22
8 [报告]
发表于 2015-06-03 13:05 |只看该作者
本帖最后由 reb00t 于 2015-06-03 13:10 编辑
  1. 1. sed 's/^[ \t]*\|[ \t]*$//'
  2. 2. sed 's/^[ \t]\|[ \t]$//'
复制代码

论坛徽章:
6
处女座
日期:2014-04-02 16:07:17酉鸡
日期:2014-04-14 10:09:22子鼠
日期:2014-04-17 11:57:30辰龙
日期:2014-09-01 17:14:08戌狗
日期:2014-10-28 12:25:54未羊
日期:2014-11-14 11:31:58
9 [报告]
发表于 2015-06-03 15:35 |只看该作者
本帖最后由 rulebook 于 2015-06-03 15:39 编辑
  1. printf "|$a1|\n|$a2|\n|$a3|\n"|sed -r 's/^\| +/|/g;s/ +\|$/|/g'
复制代码
  1. printf "|$a1|\n|$a2|\n|$a3|\n"|sed -r 's/^\| /|/g;s/ \|$/|/g'
复制代码

论坛徽章:
9
射手座
日期:2014-07-29 13:05:07双子座
日期:2015-01-11 17:01:522015年亚洲杯之朝鲜
日期:2015-02-01 16:14:282015亚冠之阿尔艾因
日期:2015-06-04 17:54:40数据库技术版块每日发帖之星
日期:2015-08-02 06:20:00数据库技术版块每日发帖之星
日期:2015-10-28 06:20:00数据库技术版块每日发帖之星
日期:2015-11-26 06:20:0015-16赛季CBA联赛之天津
日期:2016-06-20 17:09:2015-16赛季CBA联赛之青岛
日期:2017-02-26 15:54:19
10 [报告]
发表于 2015-06-03 15:58 |只看该作者
本帖最后由 stupid_lee 于 2015-06-03 15:58 编辑

Python 2.6.6

a="   line   three   "
print len(a)   #18

b=a[1:len(a)-1]
print len(b)    #16
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP