免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 6852 | 回复: 10
打印 上一主题 下一主题

[文本处理] 总时间 [复制链接]

论坛徽章:
2
15-16赛季CBA联赛之四川
日期:2020-08-18 20:19:4815-16赛季CBA联赛之青岛
日期:2022-01-19 11:51:49
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2023-08-04 21:25 |只看该作者 |倒序浏览
本帖最后由 unix520 于 2023-08-04 21:27 编辑

哈喽大家好
由于一个名称分成了很多行记录, 需要统计出所有名称相同总时间,    即会变成1个名称总时间   没有名称相同的也需要输出原数据         最大单位使用小时   精确到 时 分 秒
分隔符是 "\t"       第1列是名称               第3列时间   


  1. 老6        ID        1h:2m:59s
  2. 张三        ID        0h:10m:00s
  3. 李4        ID        0h:07m:07s
  4. 老6        ID        0h:01m:02s
  5. 老6        ID        0h:2m:59s
  6. 张三        ID        2h:11m:01s
  7. 王五        ID        0h:0m:01s

复制代码
喜欢awk

论坛徽章:
0
2 [报告]
发表于 2023-08-05 13:55 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
2
15-16赛季CBA联赛之四川
日期:2020-08-18 20:19:4815-16赛季CBA联赛之青岛
日期:2022-01-19 11:51:49
3 [报告]
发表于 2023-08-07 15:59 |只看该作者
本帖最后由 unix520 于 2023-08-07 16:05 编辑

回复 2# 本友会机友会摄友会

  直接处理不行吗要转一次csv 这么繁琐吗,   但为什么执行后变多了,,  似乎并没有统加起来,,,用的ps1,   看的头晕   可以写完整的试试吗
  1. Set-Location ${PSScriptRoot}

  2. #1 把不规范的txt,处理成规范的csv
  3. $csv = Get-Content -LiteralPath "${PSScriptRoot}20230805in.txt" | ForEach-Object {
  4.         $_ -replace ' +',','
  5. } | ConvertFrom-Csv -Header 'a','b','c'
  6. $csv

  7. $根据第一列分组 = $csv | Group-Object -Property 'a'
  8. # group-object是一个数组,属性有:
  9. # 数组属性有:g[0].name ,g[0].count,g[0].group

  10. foreach ($i in $根据第一列分组) #遍历分组
  11. {
  12.         $时间累加 = $null
  13.         foreach ($i2 in $i.Group) #遍历分组内的第3列的每一个值
  14.         {
  15.                 $i3 = $i2.c -replace '[a-z]' -as [timespan]
  16.                 $时间累加 += $i3
  17.         }
  18.         '{0} {1}' -f $i2.a,$时间累加 #输出结果
  19. }

  20. a                b c
  21. -                - -
  22. 老6        ID        1h:2m:59s     
  23. 张三        ID        0h:10m:00s   
  24. 李4        ID        0h:07m:07s   
  25. 老6        ID        0h:01m:02s   
  26. 老6        ID        0h:2m:59s     
  27. 张三        ID        2h:11m:01s   
  28. 王五        ID        0h:0m:01s     
  29. 老6        ID        1h:2m:59s
  30. 张三        ID        0h:10m:00s
  31. 李4        ID        0h:07m:07s
  32. 老6        ID        0h:01m:02s
  33. 老6        ID        0h:2m:59s
  34. 张三        ID        2h:11m:01s
  35. 王五        ID        0h:0m:01s

复制代码


论坛徽章:
0
4 [报告]
发表于 2023-08-09 10:40 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
2
15-16赛季CBA联赛之四川
日期:2020-08-18 20:19:4815-16赛季CBA联赛之青岛
日期:2022-01-19 11:51:49
5 [报告]
发表于 2023-08-10 09:43 |只看该作者
本帖最后由 unix520 于 2023-08-10 09:52 编辑

回复 4# 本友会机友会摄友会

我使用win10 22h2 最新系统自带PowerShell版本,  执行上面2楼代码一闪而过, 不知道某些代码是不是让网页吃了  对PowerShell有些陌生,看到老师发了100多文章,但都是中上知识编码难度,老师可以发一些非常简单PowerShell代码使用示例吗。例如输入文件有几种方法,输出文件又有几种方法,
另外希望老师发一些高速去重复行代码示例,处理文本列等示例,一些简单常用讲解文章。

论坛徽章:
2
15-16赛季CBA联赛之四川
日期:2020-08-18 20:19:4815-16赛季CBA联赛之青岛
日期:2022-01-19 11:51:49
6 [报告]
发表于 2023-08-10 22:28 |只看该作者
回复 4# 本友会机友会摄友会
执行你脚本后输入和输出一样


论坛徽章:
20
程序设计版块每日发帖之星
日期:2015-10-11 06:20:0015-16赛季CBA联赛之山东
日期:2016-05-28 18:18:5615-16赛季CBA联赛之新疆
日期:2017-04-12 22:55:4715-16赛季CBA联赛之青岛
日期:2017-06-26 18:30:0315-16赛季CBA联赛之四川
日期:2017-09-04 12:27:0315-16赛季CBA联赛之福建
日期:2018-02-09 14:28:3315-16赛季CBA联赛之同曦
日期:2018-04-17 12:43:3415-16赛季CBA联赛之浙江
日期:2018-07-14 13:27:4015-16赛季CBA联赛之吉林
日期:2018-09-13 15:48:2915-16赛季CBA联赛之新疆
日期:2016-05-07 05:05:3215-16赛季CBA联赛之八一
日期:2016-03-14 12:32:06程序设计版块每日发帖之星
日期:2015-12-12 06:20:00
7 [报告]
发表于 2023-08-11 10:24 |只看该作者
本帖最后由 baby_神 于 2023-08-11 10:32 编辑
  1.       
复制代码
  1. awk -F '[:\t ]+' '{         
  2.     name = $1
  3.     time = $3 * 3600 + $4 * 60 + $5
  4.     total_time[name] += time
  5. }
  6. END {
  7.     for (name in total_time) {
  8.         printf "%s\t%dh:%dm:%ds\n", name, total_time[name] / 3600, (total_time[name] % 3600) / 60, total_time[name] % 60
  9.     }
  10. }' filename
复制代码

论坛徽章:
2
15-16赛季CBA联赛之四川
日期:2020-08-18 20:19:4815-16赛季CBA联赛之青岛
日期:2022-01-19 11:51:49
8 [报告]
发表于 2023-08-11 11:10 |只看该作者
回复 7# baby_神

谢谢老师,写的非常优美

论坛徽章:
25
程序设计版块每日发帖之星
日期:2016-05-03 06:20:0015-16赛季CBA联赛之八一
日期:2018-07-05 10:34:09黑曼巴
日期:2018-07-06 15:19:5015-16赛季CBA联赛之佛山
日期:2018-08-03 13:19:3315-16赛季CBA联赛之山西
日期:2018-08-07 19:46:2315-16赛季CBA联赛之广夏
日期:2018-08-08 19:31:5015-16赛季CBA联赛之青岛
日期:2018-11-26 15:21:5015-16赛季CBA联赛之上海
日期:2018-12-11 09:45:3219周年集字徽章-年
日期:2020-04-18 23:54:5215-16赛季CBA联赛之深圳
日期:2020-04-19 21:40:19黑曼巴
日期:2022-04-03 17:55:1315-16赛季CBA联赛之八一
日期:2018-07-03 16:56:46
9 [报告]
发表于 2023-08-29 12:34 |只看该作者
回复 1# unix520

unix520你好:
下面你发表的主题中均有大家给你的回复,而你却把1楼提问帖的内容修改成了如“谢谢”、“算了 不问了”、“新年快乐”等内容。大家回复帮你解决问题是要耗费时间和精力的,你这样做是对回复人的不尊重,也让该主题失去了参考价值。请恢复这些主题中1楼提问帖的内容。

http://bbs.chinaunix.net/forum.php?mod=viewthread&tid=4319222
http://bbs.chinaunix.net/forum.php?mod=viewthread&tid=4319242
http://bbs.chinaunix.net/forum.php?mod=viewthread&tid=4319228
http://bbs.chinaunix.net/forum.php?mod=viewthread&tid=4319296


论坛徽章:
2
15-16赛季CBA联赛之四川
日期:2020-08-18 20:19:4815-16赛季CBA联赛之青岛
日期:2022-01-19 11:51:49
10 [报告]
发表于 2023-08-29 13:28 |只看该作者
回复 9# wh7211

没有不尊重意思,   请不要误会哦, 如有一些不当之处,  实在抱歉, 希望大家谅解。已全部更正及还原主题意思
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP