免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123
最近访问板块 发新帖
楼主: firebull1
打印 上一主题 下一主题

[文本处理] 怎么把字符界面拆分到数据库中 [复制链接]

论坛徽章:
0
21 [报告]
发表于 2014-03-14 11:25 |只看该作者
回复 19# runintostar
这段
echo "$line"|grep '^[[:blank:]|0-9,.-/]*$'
匹配不到数据


   

论坛徽章:
0
22 [报告]
发表于 2014-03-14 11:30 |只看该作者
回复 21# firebull1
匹配不到的话,那你处理的文本可能和你上传的那个有点区别,很抱歉啊,但是这里必须要过滤,不然后面会有问题

   

论坛徽章:
1
戌狗
日期:2014-08-05 13:32:44
23 [报告]
发表于 2014-03-14 11:56 |只看该作者
不懂你的意思,但是按个人理解只能做到如下(一个一个写上去的,不容易啊):
[root@server tmp]# cat abc
+----+--------------+-----------------+---------------+-------------+--------------+
| id | department   |  username       |   recorddate  | recordtime  |   reason     |
+----+--------------+-----------------+---------------+-------------+--------------+
| 13 |  1           |   1             |   2013-11-13  | 4           |   4          |
| 14 |  12          |   12            |   2013-11-12  | 4           |   123        |
| 15 |  12          |   12            |   2013-11-12  | 4           |   123        |
| 16 |  12          |   12            |   2013-11-12  | 4           |   123        |
| 17 |  12          |   12            |   2013-11-19  | 4           |   12         |
+----+--------------+-----------------+---------------+-------------+--------------+
[root@server tmp]# ./ceshi.sh
13 1 1 2013-11-13 4 4
14 12 12 2013-11-12 4 123
15 12 12 2013-11-12 4 123
16 12 12 2013-11-12 4 123
17 12 12 2013-11-19 4 12
[root@server tmp]# cat ceshi.sh
#!/bin/bash
cat abc|tail -n 6|head -n 5| sed 's/|//g' >text
cat text |while read line
do
echo $line
done
[root@server tmp]#

论坛徽章:
0
24 [报告]
发表于 2014-03-14 13:41 |只看该作者
回复 22# runintostar

echo "$line"|grep '^[[:blank:]|0-9,.-/]*$'
这个主要是为什么去除那些行呢?
   

论坛徽章:
0
25 [报告]
发表于 2014-03-14 14:08 |只看该作者
回复 24# firebull1

你不是要往数据库里插么,除了有很多数字的那两行,别的难道你要插到库里?

   

论坛徽章:
0
26 [报告]
发表于 2014-03-14 14:17 |只看该作者
回复 25# runintostar


    单单grep '^[[:blank:]|0-9]'
他也会匹配所用行

论坛徽章:
0
27 [报告]
发表于 2014-03-14 14:28 |只看该作者
回复 26# firebull1

我们只能是按照你提供的文件来告诉你用什么样的方式去得到你想要的结果,我们能做到的只能是保证根据你提供的文件,用我们提供的代码在我们的环境上可以得到你想要的结果,最终还是需要您亲自来测试。
  1. $ grep '^[[:blank:]|0-9]' file
  2.    +-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
  3.       |           |               |          |          |                       |           |           金额                 |                                                  |
  4.              | 代号  |   账号    | 日期 | 日期 |       积数        | 利率  |------------------------------------|               姓名                         |
  5.                     |           |               |          |          |                       |  ( 月 )   |   利息   |   利息  |                                                  |
  6.                            +-----------+---------------+----------+----------+-----------------------+-----------+------------------+-----------------+--------------------------------------------------+
  7.                               | 1123123123  |121212|2014/01/21|2014/02/20|           5,580,000.00|   41.6122500|            857.93|                 | 123123213213|
  8.                                         +-----------+---------------+----------+----------+-----------------------+-----------+------------------+-----------------+--------------------------------------------------+
  9.                                                    | 13011201  |123123213|2014/01/21|2014/02/20|           4,650,000.00|   41.61121500|            714.94|                 | 123123213123|
  10.                                                       +-----------+---------------+----------+----------+-----------------------+-----------+------------------+-----------------+--------------------------------------------------+
  11.                                                                     会计:                                                  复核:                                               制表:                       编制日期: 2014/02/20 22:42:36



  12. $ grep '^[[:blank:]|0-9,.-/]* file
  13.                               | 1123123123  |121212|2014/01/21|2014/02/20|           5,580,000.00|   41.6122500|            857.93|                 | 123123213213|
  14.                                                    | 13011201  |123123213|2014/01/21|2014/02/20|           4,650,000.00|   41.61121500|            714.94|                 | 123123213123|
复制代码

论坛徽章:
0
28 [报告]
发表于 2014-03-14 14:28 |只看该作者
回复 25# runintostar


    grep '^[[:blank:]].*|[0-9]'
倒是可以
grep '^[[:blank:]].*|[0-9][,.|-]*$'
但是$结束符放入就匹配不到

论坛徽章:
0
29 [报告]
发表于 2014-03-14 14:31 |只看该作者
回复 28# firebull1

问题不是在代码上,如果你愿意可以私信我,这个帖子不继续回复了,影响别人的
   

论坛徽章:
33
荣誉会员
日期:2011-11-23 16:44:17天秤座
日期:2014-08-26 16:18:20天秤座
日期:2014-08-29 10:12:18丑牛
日期:2014-08-29 16:06:45丑牛
日期:2014-09-03 10:28:58射手座
日期:2014-09-03 16:01:17寅虎
日期:2014-09-11 14:24:21天蝎座
日期:2014-09-17 08:33:55IT运维版块每日发帖之星
日期:2016-04-17 06:23:27操作系统版块每日发帖之星
日期:2016-04-18 06:20:00IT运维版块每日发帖之星
日期:2016-04-24 06:20:0015-16赛季CBA联赛之天津
日期:2016-05-06 12:46:59
30 [报告]
发表于 2014-03-14 15:16 |只看该作者
你们确定楼主不是从数据库里 select出来的数据?

如果是, 不是折腾么 ...
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP