忘记密码   免费注册 查看新帖 | 论坛精华区

ChinaUnix.net

  平台 论坛 博客 认证专区 大话IT HPC论坛 徽章 文库 沙龙 自测 下载 频道自动化运维 虚拟化 储存备份 C/C++ PHP MySQL 嵌入式 Linux系统
最近访问板块 发新帖
查看: 519 | 回复: 0

以后双十一不用“剁手”了,对着电视说话就能直接下单 [复制链接]

论坛徽章:
0
发表于 2017-11-13 17:46 |显示全部楼层
O2O时代和电商时代已经完美教会了我们怎样上网订外卖、购物,缔造了双11这样的全球购物狂欢节。如今现有的服务闭环中多是基于屏幕的手触操作,弱问一句,双11之后,“剁手党”的双手还安在?
随着AI时代的来临,在触摸交互之外,正逐渐探索语音对话的交互,可以满足用户在更多生活场景下、不同需求下的交互方式。
届时万物都将智能,语音交互必将成为下一代主流交互方式。如果能通过与设备语音对话就可以在网上直接下单,坐等收货。那听起来真是一件兴奋的事,终于可以“动口不剁手”了。
这已经不是遥远的事儿,国内一家AI创业公司蓦然认知最近就推出了在电视上实现语音购物的功能。
打通语音购物闭环背后是「语义理解」和「多轮对话」的技术支持
蓦然认知CEO戴帅湘创业之前,曾在百度做了9年自然语言处理,主要工作是分析理解用户在搜索框中输入的query的意思,理解语义是给出搜索结果的重要前提,NLP(自然语言处理)方向技术积累颇深。
2016年5月4日,戴帅湘正式离职创业,NLP也是其创业方向。不论是2014年亚马逊推出Echo抢占端流量入口,还是国内AI火爆,语音识别技术日臻完善,戴帅湘看到了语音交互中的蓝海。如今蓦然认知成立一年半,拿到了天使轮和A轮两轮融资,其中A轮获得1000万美元,为NLP赛道拿到的最高融资。
前不久蓦然认知在技术领域再下一城,打通了语音购物和订外卖的闭环,36氪记者在蓦然认知的办公室里亲自体验了一把。
蓦然认知市场总监龚思颖开玩笑,“戴老板最近招待大家的方式,就是在电视上语音交互下单订一杯咖啡。”
戴帅湘对着电视说到,“给我来两杯香草拿铁,加冰的”,说完出现了购买页面,由于之前记录了收货地址,系统选定后直接进入支付页面,戴帅湘说到“确认支付”,屏幕出现微信二维码,扫码就直接完成了支付。大约30分钟,咖啡送到了办公室。就这样,我们完成在电视上由语音交互带来的一次购物体验。
除此之外,还可以进行订餐,选餐厅,订酒店以及查询天气等服务。也可以进行多轮人机对话,“今天北京的天气如何(海淀今天6-18度”明天呢?(明天海淀天气7-15度)”系统可以自动进行上下文语义的理解,从现场的感受来看,机器的反应较为智能。
再比如下面这段现场的真实对话:
戴帅湘:谢霆峰的前妻是谁?
机器:谢霆峰的前妻是张柏芝。
戴帅湘:她多大了?
机器:张柏芝的年龄是37岁。
戴帅湘:播放一首她的粤语歌曲。
机器:开始为你播放张柏芝的粤语歌曲。
戴帅湘:她演过什么电影?
机器:这是张柏芝主演的电影《少林寺》。
戴帅湘解释,语义理解和多轮对话是蓦然认知的技术核心。36氪记者此前亲自体验过某家智能音箱,并与之对话,经验证,这款智能音箱的语音识别能力尚可,但对于语义的理解欠佳,多轮对话更是非常薄弱。比如,你问它,今天的天气怎样,它回答“天气多少度,如何如何”,但是你接着问,明天呢?智能音箱回答:“对不起,我没有听懂你的意思。”
语义理解和多轮对话技术在NLP(自然语言处理)领域,是非常难以攻克的难题,毕竟语言是人类思想和智慧的体现,想要让机器理解人类并不容易实现。
如果只是单轮问答形式,机器只需理解该句话的意思,然后输出一个结果反馈回去即可,其实就是信息的检索输出,技术难度并不大。但在多轮对话反复的情况下,机器需要记忆上下文内容,并结合语境,才能理解用户表达的真正意思,从而输出。
现在国内NLP做的非常厉害的大公司,多是百度、搜狗、微软亚洲研究院这类会做搜索的大公司,有大量的搜索数据和对话语料,有利于训练数据模型。
戴帅湘有此前百度9年NLP的经验,这次在技术积累的基础上能够打通电视上语音购物的闭环,涉及到语音交互调取服务、进入相关服务商的支付环节,完成交易等几个环节。而在此之前,其他一些语音交互产品到交易环节,需要依赖人工介入才能完成,这次是全程无人工干预,多轮对话的能力功不可没。
商业化打法:选择主流场景的主流设备切入
技术出身的戴帅湘并不是要打造一个技术开发平台,可能那也是巨头争相要做的事。蓦然认知想把语音交互的能力,集成于汽车、家居等硬件设备上,为用户提供人机对话及决策服务,打造一个可快速移植、实时学习、多场景融合的对话交互及决策系统。
整套系统中,包括了多轮对话等核心技术,还包括基于技术开发的产品模型、语音识别解决方案,以及技术所对接的服务。这不是对技术、产品以及服务连接能力,都对蓦然认知提出了更高要求。
在设备场景的选择上至关重要。
尽管国内智能音箱百“箱”大战,热火朝天,天猫精灵双11购物节8小时销售超100万台,但是蓦然认知还是选择避开这个赛道。戴帅湘曾表示,“我坚定地不看好智能音箱,是因为中国人可能并没有使用音箱的习惯,市场太小。”戴帅湘向36氪解释到,推出的新品必须要和文化主题相适应。
智能音箱之所以火,是亚马逊最早在美国推出,而这是符合文化传统的。在美国本土几乎没有做电视机的厂商,但是每家每户基本都会有音箱,而中国则不同,并没有使用音箱的习惯,恰恰每家每户都会有电视。
蓦然认知的判断标准是瞄准头部需求,解决衣食住行领域的问题,选定智能家居、智能车载两个领域深耕。用戴帅湘的话来说,“要选择主流场景下的主流设备”。这两大设备占据着人典型的两种生活状态,下班以后的休闲时间和上班或者旅途中的时间。
除设备本身的市场规模大以外,这两个场景下的交互方式还有着迫切求变的需求和可能。戴帅湘说,汽车一百年历史了,电视也有近一百年,但是交互方式基本从没发生过变迁。这里有非常大的难度,但这次随着AI技术的成熟,交互方式逐渐改变,非常看好这次将会是一次很大的变迁。
“交互的变化以及多设备的协同工作,交互能力,都正在发生巨大变化,这里面都是机会。”
不单要打造单个设备良好的用户体验,戴帅湘的思路是,要把各个场景关联起来。电视和汽车这两个看似独立的场景,没有关联性,但如果能把这些独立的场景关联起来,就能形成更大的场景,给人带来极大方便。比如,开车快到家时,可以语音给汽车帮我把家里的灯打开,空调或者电视机打开。准备出门前,也可以通过电视提前将汽车启动。之前谈万物互联,现在正逐渐走向万物智能。
把每个生活场景都串联起来,不同设备,不同场景之间都可以进行同步,在多个场景中体验得很好。这背后的软件其实可以一体化,具体场景交互会有个性化的要求,但是底层技术都是相通的,未来希望可扩展到所有的设备。
一端接设备,一端接服务
不同于其他公司只提供某一个环节的做法,比如语音或者降噪技术,蓦然认知提供能够完成对话任务中的一整套软件系统,来驱动硬件设备,整套系统包括VUI&GUI,语音识别,语义理解,多轮对话等技术,同时还有接入类似订外卖、购物、订机票、路线导航等生活类服务。
戴帅湘告诉36氪,“你要让服务商觉得你这事靠谱,他才愿意接受。”在他看来,这件事也没有特别难,他会告诉服务商,服务接入不是放在手机端,而是放到其他设备,比如电视机和汽车、机器人等。这相当于扩大了它的应用场景,且没有抢占它的现有市场,再者未来其他设备如耳机或可穿戴设备,可能取代手机会成为主流。
这印证了蓦然认知想要打造的商业版图,当未来越来越多的设备接入语音,交互方式一旦改变,蓦然认知则可通过技术授权、服务分成、精准广告等方式实现盈利。
如今蓦然认知拿下了4家电视领域的主流厂商客户,并已经和几家前装车厂达成合作,通过这样的B端客户,真正让更多的C端人群体验到产品。
蓦然认知做的是 ToB ToC的生意,不过更加看重的是C端用户的使用量,这有利于迅速验证各个场景中哪个是最适合的,也会产生更多的用户交互数据。因此,在选择B端客户时,就显得特别谨慎。
“我们从整个大B端切入,有的甚至像一些老牌的语音公司都很难切入的B端,我们都做到了快速切入。”
问到戴帅湘能够快速搞定大客户的原因,他思考了一下,说到,“虽然我们是技术型公司,但是我们强调产品化。”
AI技术型公司需要考虑产品化
“技术型公司一定要比你的客户更往前想一步产品。”戴帅湘很认真。
如今的AI公司,因为很多技术难以商业化落地,所以大谈技术的居多,但一直炫技肯定行不通,在商业化中再进一步才是王道。
“你的客户他对技术的敏感性不强,有时候也分不出哪一个好坏,最终看的是产品化。”戴帅湘继续说,按道理这不应该是他们做出来的,应该是客户来想,但是等他们想清楚再做出产品就太慢了。
比如要在电视上接入蓦然认知的技术和服务,但是不知道最终形态,蓦然认知会尝试做出基本的产品形态,客户看到很容易理解这套方案怎样嫁接他们的产品中。而研发出的这个产品原形本身也是一个产品,只是细节的地方不再过多考虑。“我们是按照产品的思路来做事,而不是按照一个demo来做事的。”
在蓦然认知公司中用来演示语音购物、叫外卖、订电影票的电视,就是他们打磨出的完整的产品,可以正常使用。
“尤其是这种新兴技术,谁也不知道这个新技术,最终做成什么样是最好的。对于大的产品可能无法做出原型,但要有意识用你的想法去影响他们的想法,在技术领域你一定比他懂得多。”
在戴帅湘看来,技术型公司要自己拿出各种可能的产品的路径来,而且要把你认为最可能有效的路径的产品做出来一个,可能不面向C端,但最好有一个自己的产品团队,专门设计原形产品。
这是戴帅湘认为蓦然认知能弯道超车快速切入大B端的原因,“光卖技术不卖产品是很难的,应该把B端当作C端一样去做,就是你卖给B端的不只是一些零部件,应该是有一个整体概念的东西,尤其是对于软件而言。”
越是抽象的技术越需要产品化才能卖出去,戴帅湘再次强调。
做知识和决策引擎时代的核心驱动力
这一代的互联网可以理解为搜索引擎,电商可以理解为驱动引擎,而知识和决策的引擎会是IOT时代中最大的平台。如今终端智能越来越火爆,这个产业链条上诸如做芯片、做语音交互、做智能硬件的厂商都将大大获利。
而就如同iPhone的触摸屏开启了智能手机时代,与设备端的语音交互会也成为未来主流的交互方式,入口的改变会成就哪一个流量的高地,各大厂商怕是正在这个格局未定的当口,正紧锣密鼓布局。
在戴帅湘看来,大公司在做技术不成熟、市场不成熟的情况下并不会比小公司有更多优势,“决策慢、精力分散,暂时不敢投太多的资源,会非常犹豫,但我创业就孤注一掷。”
现在戴帅湘的精力会更多放在产品和人员招聘上,他说要盯着研发和产品两端,非常看重技术的落地能力,“你要研发对产品直接有效的事情”。
在研发实力和产品推进的速度上,戴帅湘比较满意。对戴帅湘而言,当下最大的挑战来自于商务和市场。怎样让更多目标客户真正成为合作伙伴,这需要不断的向对方输出观点。
从技术出发,又不囿于技术,不断探寻商业化策略,蓦然认知目前在这个领域具备先发优势。业内百度的DuerOS也立志 “**万物”,让设备“听清、听懂、满足”,等到赛道越来越热,资本一涌而上,蓦然认知能否在强敌环伺之中继续保持优势,这要交给时间验证。


转自:36氪



您需要登录后才可以回帖 登录 | 注册

本版积分规则

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号 北京市公安局海淀分局网监中心备案编号:11010802020122
广播电视节目制作经营许可证(京) 字第1234号 中国互联网协会会员  联系我们:
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP