免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: zsszss0000
打印 上一主题 下一主题

[其他] 大数据崛起时代,命令行技术的价值在哪里? [复制链接]

论坛徽章:
7
CU大牛徽章
日期:2013-03-14 14:16:29CU大牛徽章
日期:2013-03-14 14:16:32CU大牛徽章
日期:2013-03-14 14:16:34CU大牛徽章
日期:2013-03-14 14:16:35IT运维版块每日发帖之星
日期:2015-07-13 23:09:32IT运维版块每日发帖之星
日期:2015-07-13 22:20:00数据库技术版块每日发帖之星
日期:2015-09-08 06:20:00
11 [报告]
发表于 2015-07-12 19:29 |只看该作者
批量处理数据和文件,命令行,高效简介速度快方便,GUI远不能比。
grep sed常备 awk现查 python终极武器。

求职 : 机器学习
论坛徽章:
79
2015年亚洲杯纪念徽章
日期:2015-05-06 19:18:572015七夕节徽章
日期:2015-08-21 11:06:172015亚冠之阿尔纳斯尔
日期:2015-09-07 09:30:232015亚冠之萨济拖拉机
日期:2015-10-21 08:26:3915-16赛季CBA联赛之浙江
日期:2015-12-30 09:59:1815-16赛季CBA联赛之浙江
日期:2016-01-10 12:35:21技术图书徽章
日期:2016-01-15 11:07:2015-16赛季CBA联赛之新疆
日期:2016-02-24 13:46:0215-16赛季CBA联赛之吉林
日期:2016-06-26 01:07:172015-2016NBA季后赛纪念章
日期:2016-06-28 17:44:45黑曼巴
日期:2016-06-28 17:44:4515-16赛季CBA联赛之浙江
日期:2017-07-18 13:41:54
12 [报告]
发表于 2015-07-13 09:40 |只看该作者
的确,预处理这块需求变化太快,需要具有非常大的灵活性,高级语言开发的话,可能的确不够灵活 回复 12# reallyfly_1


   

论坛徽章:
11
CU十二周年纪念徽章
日期:2013-10-24 15:41:342015年辞旧岁徽章
日期:2015-03-03 16:54:15丑牛
日期:2015-01-14 10:36:40技术图书徽章
日期:2015-01-12 15:46:11白羊座
日期:2014-11-14 09:35:36狮子座
日期:2014-10-30 13:18:49巳蛇
日期:2014-10-11 12:52:08子鼠
日期:2014-09-28 14:11:06双鱼座
日期:2014-04-22 13:05:48午马
日期:2014-02-11 17:58:002015年迎新春徽章
日期:2015-03-04 09:55:28
13 [报告]
发表于 2015-07-13 10:58 |只看该作者
支持下活动。

求职 : 机器学习
论坛徽章:
79
2015年亚洲杯纪念徽章
日期:2015-05-06 19:18:572015七夕节徽章
日期:2015-08-21 11:06:172015亚冠之阿尔纳斯尔
日期:2015-09-07 09:30:232015亚冠之萨济拖拉机
日期:2015-10-21 08:26:3915-16赛季CBA联赛之浙江
日期:2015-12-30 09:59:1815-16赛季CBA联赛之浙江
日期:2016-01-10 12:35:21技术图书徽章
日期:2016-01-15 11:07:2015-16赛季CBA联赛之新疆
日期:2016-02-24 13:46:0215-16赛季CBA联赛之吉林
日期:2016-06-26 01:07:172015-2016NBA季后赛纪念章
日期:2016-06-28 17:44:45黑曼巴
日期:2016-06-28 17:44:4515-16赛季CBA联赛之浙江
日期:2017-07-18 13:41:54
14 [报告]
发表于 2015-07-13 11:27 |只看该作者
刺客君,期待你的高论啊 回复 14# 刺客阿地


   

论坛徽章:
16
IT运维版块每日发帖之星
日期:2015-10-02 06:20:00IT运维版块每月发帖之星
日期:2015-09-11 19:30:52IT运维版块每周发帖之星
日期:2015-09-11 19:20:31IT运维版块每日发帖之星
日期:2015-08-26 06:20:00每日论坛发贴之星
日期:2015-08-20 06:20:00IT运维版块每日发帖之星
日期:2015-08-20 06:20:002015年辞旧岁徽章
日期:2015-03-03 16:54:15金牛座
日期:2014-05-04 16:58:09双子座
日期:2013-12-17 16:44:37辰龙
日期:2013-11-22 15:20:59狮子座
日期:2013-11-18 22:55:08射手座
日期:2013-11-12 10:54:26
15 [报告]
发表于 2015-07-13 11:53 |只看该作者
1、您是否喜欢用命令行?请谈谈你眼中命令行工具或者技术的魅力所在或者不足之处。
我比较喜欢cli,因为我很习惯用这个,也方便。不足之处暂时感觉没有。
2、您接触过哪些命令行工具,解决什么类型的问题。
perl,shell,python cli都可以,用的最多的就是shell了,感觉所有工作都可以用shell搞定吧,虽然python也很牛,但究其原因是胶水的本质。所以不是很喜欢。
3、有种观点认为数据科学可以分为如下五个部分: a)数据获取 b)数据清洗 c)数据探索 d)数据建模 e)数据解释。可否挑选上面的一个方面或者几个方面谈谈你的理解。
遇到过的就是etl,python scrapy, regex 感觉思路一样,最主要是对工具的认识以及基本功。
4、您认为对于解决3中各类问题,命令行过时了吗?命令行工具和技术是否仍然能够发挥自己的作用呢?
命令行没过时,脚本的基础都是在cli上实现的。
5、在处理html、xml、json,csv这里数据的时候,除了grep、sed、awk等通用的工具以为,是否还有其他使用起来更加简单易学的命令行技术或者工具大家分享一下。
egrep算不?regex.

我很喜欢这本书,版主算我一份吧。

求职 : Linux运维
论坛徽章:
19
CU大牛徽章
日期:2013-03-13 15:15:0815-16赛季CBA联赛之山东
日期:2016-10-31 10:40:10综合交流区版块每日发帖之星
日期:2016-07-06 06:20:00IT运维版块每日发帖之星
日期:2016-02-08 06:20:00数据库技术版块每日发帖之星
日期:2016-01-15 06:20:00IT运维版块每日发帖之星
日期:2016-01-15 06:20:00IT运维版块每日发帖之星
日期:2016-01-10 06:20:00黄金圣斗士
日期:2015-11-24 10:45:10IT运维版块每日发帖之星
日期:2015-09-01 06:20:00IT运维版块每日发帖之星
日期:2015-08-13 06:20:00IT运维版块每日发帖之星
日期:2015-07-30 09:40:012015年亚洲杯之巴勒斯坦
日期:2015-05-05 10:19:03
16 [报告]
发表于 2015-07-13 14:37 |只看该作者
现在多数情况下我更喜欢使用BASH来玩我的LINUX系统。

论坛徽章:
1
2016猴年福章徽章
日期:2016-02-18 15:30:34
17 [报告]
发表于 2015-07-13 15:36 |只看该作者
命令行的优点就是操作直接,输入命令,可即执行操作。
如果远程服务器出了问题,正好人在外面,那么用手机ssh到服务器进行故障处理,这比windows的远程桌面可靠多了。
命令行习惯后,没感觉有什么缺点。

论坛徽章:
4
IT运维版块每日发帖之星
日期:2015-08-19 06:20:002015七夕节徽章
日期:2015-08-21 11:06:17IT运维版块每日发帖之星
日期:2015-08-28 06:20:00IT运维版块每周发帖之星
日期:2015-09-11 19:20:31
18 [报告]
发表于 2015-07-13 16:34 |只看该作者


讨论话题
本期话题让我们畅想一下命令行技术在数据科学中的应用(可任选下面的一个或者几个问题谈谈自己的观点和看法)。
1、您是否喜欢用命令行?请谈谈你眼中命令行工具或者技术的魅力所在或者不足之处。

喜欢啊,命令行工具使每一个具体操作简单化、明确化,透明度很高,故障排查比图形化界面简单很多。

当然,略显不足的是,需要培养一下使用习惯,和需要一点脚本编程能力。

2、您接触过哪些命令行工具,解决什么类型的问题。

unix/linux的shell,windows的命令窗口、Oracle的sqlplus、rman等,及相关脚本,主要是用于自动化工作和批量处理数据。

3、有种观点认为数据科学可以分为如下五个部分: a)数据获取 b)数据清洗 c)数据探索 d)数据建模 e)数据解释。可否挑选上面的一个方面或者几个方面谈谈你的理解。

我主要是运维方面用过命令行工具,主要用于以下方面

a) 数据获取
通过批处理脚本快速采集数据,包括操作系统、数据库、应用系统的数据。

b)数据清洗
主要在采集的数据基础上,提取、格式化有用的数据,如操作系统状态,数据库状态、话单数据等。

c)数据探索
不懂。

d)数据建模
不懂,不明觉厉。

e)数据解释
就是数据的分析吧,是要加一些业务逻辑判断在里面。

4、您认为对于解决3中各类问题,命令行过时了吗?命令行工具和技术是否仍然能够发挥自己的作用呢?

没过时。用于可格式化、批处理数据是很方便的。 c、d没用过,不懂。

5、在处理html、xml、json,csv这里数据的时候,除了grep、sed、awk等通用的工具以为,是否还有其他使用起来更加简单易学的命令行技术或者工具大家分享一下。

如果是批处理数据的话,我用过perl,感觉功能很强大的,特别是在正则表达式方面。这也解释性语言,不需要编译的,但现在好象不是太流行。

论坛徽章:
24
天蝎座
日期:2014-05-13 18:05:59IT运维版块每日发帖之星
日期:2015-11-26 06:20:00操作系统版块每月发帖之星
日期:2015-12-02 14:57:54IT运维版块每月发帖之星
日期:2016-01-07 23:01:56IT运维版块每周发帖之星
日期:2016-01-07 23:04:2615-16赛季CBA联赛之青岛
日期:2016-01-23 07:58:272016猴年福章徽章
日期:2016-02-18 15:30:3415-16赛季CBA联赛之北控
日期:2016-03-23 14:20:06IT运维版块每日发帖之星
日期:2016-04-01 06:20:0015-16赛季CBA联赛之吉林
日期:2016-06-28 13:51:54IT运维版块每日发帖之星
日期:2016-07-01 06:20:00IT运维版块每日发帖之星
日期:2015-11-23 06:20:00
19 [报告]
发表于 2015-07-13 18:03 |只看该作者
命令行是it人用的,图形化是用户使用的。解读完毕!

论坛徽章:
15
2015七夕节徽章
日期:2015-08-21 11:06:172017金鸡报晓
日期:2017-01-10 15:19:56极客徽章
日期:2016-12-07 14:07:30shanzhi
日期:2016-06-17 17:59:3115-16赛季CBA联赛之四川
日期:2016-04-13 14:36:562016猴年福章徽章
日期:2016-02-18 15:30:34IT运维版块每日发帖之星
日期:2016-01-28 06:20:0015-16赛季CBA联赛之新疆
日期:2016-01-25 14:01:34IT运维版块每周发帖之星
日期:2016-01-07 23:04:26数据库技术版块每日发帖之星
日期:2016-01-03 06:20:00数据库技术版块每日发帖之星
日期:2015-12-01 06:20:00IT运维版块每日发帖之星
日期:2015-11-10 06:20:00
20 [报告]
发表于 2015-07-15 11:35 |只看该作者
1、您是否喜欢用命令行?请谈谈你眼中命令行工具或者技术的魅力所在或者不足之处。
命令行方式简单高效,不足之处是可视化不好,只适合工程师,领导需要看高大上的界面

2、您接触过哪些命令行工具,解决什么类型的问题。
主要是awk,grep,wc等,主要解决简单的统计或问题定位

3、有种观点认为数据科学可以分为如下五个部分: a)数据获取 b)数据清洗 c)数据探索 d)数据建模 e)数据解释。可否挑选上面的一个方面或者几个方面谈谈你的理解。
命令行工具最大的用途是数据探索,其实数据的价值与否可以先用命令行大致看看,就好比沙子里面的大颗粒黄金,用命令行工具可以快速的得到,如果价值不明显就放到大数据平台,让大数据去做淘金的工作

4、您认为对于解决3中各类问题,命令行过时了吗?命令行工具和技术是否仍然能够发挥自己的作用呢?
暂时还未过时,一些数据不大,又需要快速出结果的地方就是命令行的天下

5、在处理html、xml、json,csv这里数据的时候,除了grep、sed、awk等通用的工具以为,是否还有其他使用起来更加简单易学的命令行技术或者工具大家分享一下。
如果hadoop的命令行也算命令行的话就这个了
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP