忘记密码   免费注册 查看新帖 |

ChinaUnix.net

  平台 论坛 博客 文库 频道自动化运维 虚拟化 储存备份 C/C++ PHP MySQL 嵌入式 Linux系统
123下一页
最近访问板块 发新帖
查看: 48140 | 回复: 20

【大话IT】早孕网红受热捧,算法识别要背锅? [复制链接]

论坛徽章:
137
2015年亚洲杯之日本
日期:2015-04-28 13:32:012015年亚洲杯之朝鲜
日期:2015-05-06 10:16:442015年亚洲杯之日本
日期:2015-05-06 10:21:342015年亚洲杯纪念徽章
日期:2015-05-13 17:16:442015亚冠之北京国安
日期:2015-05-13 17:18:292015亚冠之鹿岛鹿角
日期:2015-05-13 17:19:062015亚冠之德黑兰石油
日期:2015-05-27 16:47:402015亚冠之塔什干棉农
日期:2015-05-28 15:24:122015亚冠之卡尔希纳萨夫
日期:2015-06-01 13:52:392015亚冠之柏斯波利斯
日期:2015-06-04 17:37:292015亚冠之阿尔纳斯尔
日期:2015-06-16 11:31:202015亚冠之塔什干火车头
日期:2015-06-23 10:12:33
发表于 2018-04-04 16:38 |显示全部楼层
话题背景:
3月31日,央视《新闻直播间》和《东方时空》报道了在快手、火山小视频等短视频平台出现大量未成年怀孕视频,以未成年生子为噱头,争相炫耀。各大视频直播平台更是推波助澜,为博眼球、抢流量对此进行推送。
4月1日凌晨,在节目中被点名的快手在其官方微博中做出回应,称其进行了全站清查,查删封禁了一批视频和账号,同时将关闭推荐功能,升级人工智能识别系统,加强核查。其中,快手CEO宿华发文致歉,表示:将对低俗与擦边球内容全量多轮人工审核,研发升级算法识别体系。另外,将用正确的价值观指导算法,优先推荐个性化的更符合用户兴趣的正能量作品。

本期,我们主要讨论的话题,由以下几个问题展开:
1. 关于一些违规视频的内容,通过关键词抓取,往往无法准确识别内容的违规,比如,搜索“米妮”,出来的是涉及血腥暴力的视频,如何通过技术手段,判断和规避这种问题?
2. 在升级算法识别体系时,您认为可能涉及到哪些技术层面的问题?
活动时间:2018年4月4日-5月4日

活动奖励:
活动结束后,我们将随机选取1位回复精彩的同学,送DTCC2018入场券一张。
同时,我们将选取2位讨论精彩的同学,各送一台H3C路由器。






大会简介:
中国数据库技术大会(简称DTCC)是国内数据库及大数据领域规模最大、最受欢迎的技术交流盛会,每年一届。自2010年以来,迄今已成功举办了八届,累计参与人次达到20000+。DTCC每年都将邀请百余位行业专家,就热点技术话题进行分享,为数据库人群、大数据从业人员、广大互联网人士及行业相关人士提供最具价值的交流平台。2018年5月10-12日,第九届中国数据库技术大会(DTCC2018)将如约而至。本届大会以“数领先机•智赢未来”为主题,设定2大主会场及20个技术专场,邀请来自国内外互联网、金融、教育等行业百余位技术专家,共同探讨Oracle、MySQL、NoSQL、大数据、机器学习、区块链、数据可视化等领域的前瞻性热点话题与技术。

时间:2018年5月10-12日

报名入口:http://dtcc.it168.com/

论坛徽章:
1
2017金鸡报晓
日期:2017-01-10 15:13:29
发表于 2018-04-06 14:06 |显示全部楼层
本帖最后由 aloki 于 2018-04-06 23:02 编辑

1. 关于一些违规视频的内容,通过关键词抓取,往往无法准确识别内容的违规,比如,搜索“米妮”,出来的是涉及血腥暴力的视频,如何通过技术手段,判断和规避这种问题?
对于这种问题高端一点可以采用人工智能和深度学习等技术,配合高性能多媒体计算集群,提升了对内容风险的防控能力。低端一点的做法,可以利用互联网爬虫对直播平台中的热门播主、直播房间等信息进行主动搜集,对于观众较为密集或数量呈激增趋势的播主或房间能够主动提醒用户实施关注,从而在一定程度上实现网络直播服务平台的监管。

2. 在升级算法识别体系时,您认为可能涉及到哪些技术层面的问题?
在升级算法识别体系时,可能面临的问题包括业界缺乏成熟方案和标准、主播行为、直播内容不可控、峰值期间数千路高并发处理、对算法的高实时响应要求等等。这其中涉及到两个难题:首先,计算机的视觉算法得快,一旦出现违规画面,能够快速的识别。其次,必须同样迅速的对是否中断当前的视频直播做出判断。

论坛徽章:
137
2015年亚洲杯之日本
日期:2015-04-28 13:32:012015年亚洲杯之朝鲜
日期:2015-05-06 10:16:442015年亚洲杯之日本
日期:2015-05-06 10:21:342015年亚洲杯纪念徽章
日期:2015-05-13 17:16:442015亚冠之北京国安
日期:2015-05-13 17:18:292015亚冠之鹿岛鹿角
日期:2015-05-13 17:19:062015亚冠之德黑兰石油
日期:2015-05-27 16:47:402015亚冠之塔什干棉农
日期:2015-05-28 15:24:122015亚冠之卡尔希纳萨夫
日期:2015-06-01 13:52:392015亚冠之柏斯波利斯
日期:2015-06-04 17:37:292015亚冠之阿尔纳斯尔
日期:2015-06-16 11:31:202015亚冠之塔什干火车头
日期:2015-06-23 10:12:33
发表于 2018-04-08 09:08 |显示全部楼层
回复 2# aloki

回复很赞

论坛徽章:
3
季节之章:冬
日期:2015-01-15 10:36:57IT运维版块每日发帖之星
日期:2015-09-24 06:20:00IT运维版块每日发帖之星
日期:2015-10-24 06:20:00
发表于 2018-04-08 10:26 |显示全部楼层
关注这个跟我遇到的事情有关,有一次周末带小朋友,他在玩快手,我起初没留意,自己以前没有接触过,不太清楚都是些什么内容,后面看了下,发现部分视频低俗、语言低俗,我就有点担心,是否这个视频的发布,没有经过审核?这样对小朋友的毒害是很严重的,于是果断卸载了。
    为何我对这些东西比较警觉呢?如果您是80后的,估计会记得有一系列香港电影“古惑仔”系列,当时风靡大陆,不知道里面那些渣男、欲女毒害了多少80后。本人虽没有中毒,但是亲眼见到了很多同龄人学着砍人、乱搞的事情。
1. 关于一些违规视频的内容,通过关键词抓取,往往无法准确识别内容的违规,比如,搜索“米妮”,出来的是涉及血腥暴力的视频,如何通过技术手段,判断和规避这种问题?
    技术手段看是否有大数据技术,对发布的信息监督,记录,有过违规的一律封号。账号实名制,全网公开低俗人的信息。
    本贴虽然是技术手段,我觉得管理手段也可以考虑下,比如反馈机制,有人投诉的时候,核查内容,确实违规就下线,封号。
2. 在升级算法识别体系时,您认为可能涉及到哪些技术层面的问题?
     不太懂,但是强烈支持 有这样的技术能控制源头。利国利民。。

论坛徽章:
137
2015年亚洲杯之日本
日期:2015-04-28 13:32:012015年亚洲杯之朝鲜
日期:2015-05-06 10:16:442015年亚洲杯之日本
日期:2015-05-06 10:21:342015年亚洲杯纪念徽章
日期:2015-05-13 17:16:442015亚冠之北京国安
日期:2015-05-13 17:18:292015亚冠之鹿岛鹿角
日期:2015-05-13 17:19:062015亚冠之德黑兰石油
日期:2015-05-27 16:47:402015亚冠之塔什干棉农
日期:2015-05-28 15:24:122015亚冠之卡尔希纳萨夫
日期:2015-06-01 13:52:392015亚冠之柏斯波利斯
日期:2015-06-04 17:37:292015亚冠之阿尔纳斯尔
日期:2015-06-16 11:31:202015亚冠之塔什干火车头
日期:2015-06-23 10:12:33
发表于 2018-04-08 10:29 |显示全部楼层
回复 4# ylky_2000
最近也是关注这些问题比较多,希望更多的朋友都能关注内容审核这个问题

论坛徽章:
1
2016猴年福章徽章
日期:2016-02-18 15:30:34
发表于 2018-04-08 11:26 |显示全部楼层
1. 关于一些违规视频的内容,通过关键词抓取,往往无法准确识别内容的违规,比如,搜索“米妮”,出来的是涉及血腥暴力的视频,如何通过技术手段,判断和规避这种问题?
以前研究过中文分词的问题,这些技术手段我估计是无法完成纯技术手段的,因为分词对于不同的人、事件和时间有不同的分法,需要结合上下文具体分析,人工智能短时间还不能达到这一高度。
比如: 张居正在喝茶,张某某时常去火车站,象这种分词需要对上下文理解才行,对于正常的人还有难度,何况人工智能。
2. 在升级算法识别体系时,您认为可能涉及到哪些技术层面的问题?
具体技术层面,需要人工智能完成热点分析、语境分析、学习某些语境、自动识别特殊群体等,估计人工智能算法上还要走好多路。

论坛徽章:
210
2022北京冬奥会纪念版徽章
日期:2015-08-10 16:30:322015亚冠之全北现代
日期:2016-05-11 17:05:27操作系统版块每日发帖之星
日期:2016-05-10 19:23:04操作系统版块每日发帖之星
日期:2016-05-10 19:23:04操作系统版块每日发帖之星
日期:2016-05-10 19:23:04操作系统版块每日发帖之星
日期:2016-05-10 19:23:04操作系统版块每日发帖之星
日期:2016-05-10 19:22:58数据库技术版块每日发帖之星
日期:2016-05-10 19:23:04数据库技术版块每日发帖之星
日期:2016-05-10 19:23:04操作系统版块每日发帖之星
日期:2016-05-10 19:22:58操作系统版块每日发帖之星
日期:2016-05-10 19:22:58操作系统版块每日发帖之星
日期:2016-05-10 19:22:58
发表于 2018-04-08 12:51 |显示全部楼层
青少年教育健康,也需要技术力量的支持

论坛徽章:
9
丑牛
日期:2014-09-06 00:12:55未羊
日期:2014-09-04 08:50:45辰龙
日期:2014-08-18 20:38:42寅虎
日期:2014-12-22 20:50:56摩羯座
日期:2015-01-14 22:28:15巳蛇
日期:2015-01-23 20:39:272015年辞旧岁徽章
日期:2015-03-03 16:54:1515-16赛季CBA联赛之青岛
日期:2016-03-13 23:37:1915-16赛季CBA联赛之深圳
日期:2016-03-29 18:52:38
发表于 2018-04-08 14:13 来自手机 |显示全部楼层
1. 关于一些违规视频的内容,通过关键词抓取,往往无法准确识别内容的违规,比如,搜索“米妮”,出来的是涉及血腥暴力的视频,如何通过技术手段,判断和规避这种问题?

论坛徽章:
26
IT运维版块每日发帖之星
日期:2016-04-01 06:20:0015-16赛季CBA联赛之福建
日期:2016-07-18 09:10:1715-16赛季CBA联赛之广东
日期:2016-07-25 18:17:09C
日期:2016-10-25 16:10:552017金鸡报晓
日期:2017-02-08 10:39:4215-16赛季CBA联赛之同曦
日期:2017-02-11 13:43:1415-16赛季CBA联赛之同曦
日期:2017-05-13 19:24:3815-16赛季CBA联赛之上海
日期:2017-07-19 17:38:4415-16赛季CBA联赛之福建
日期:2017-08-02 09:45:3315-16赛季CBA联赛之山东
日期:2017-08-23 17:34:3615-16赛季CBA联赛之上海
日期:2017-11-14 09:20:5015-16赛季CBA联赛之佛山
日期:2017-12-01 10:26:38
发表于 2018-04-08 14:46 |显示全部楼层
主要有2个方面进行识别
1、通过大数据分析用户的行为来识别。
2、通过人工智能来识别视频内容。

论坛徽章:
37
CU大牛徽章
日期:2013-04-17 11:10:17CU十二周年纪念徽章
日期:2013-10-24 15:41:34射手座
日期:2013-10-24 21:01:23辰龙
日期:2013-12-20 17:07:19狮子座
日期:2014-05-12 11:00:00寅虎
日期:2014-06-04 16:25:27IT运维版块每日发帖之星
日期:2015-08-17 06:20:002015亚冠之首尔
日期:2015-11-04 22:25:43数据库技术版块每日发帖之星
日期:2015-12-01 06:20:00平安夜徽章
日期:2015-12-26 00:06:30IT运维版块每日发帖之星
日期:2016-01-27 06:20:0015-16赛季CBA联赛之新疆
日期:2016-06-07 14:10:01
发表于 2018-04-08 16:16 |显示全部楼层
我觉得还是管理手段+经济手段更简单,
1.针对主播个人行为
发动朝阳群众,一键举报.
实名制, 交押金.  一经发现,封url, 罚没押金和赏金.
针对少数不缺钱的, 抓了也不冤,送劳教.
2.针对网站行为
要求直播的打赏必需走第三方监管,审核通过才能支付.
出现问题重罚直播网站.
3.技术上
对于访问流量暴涨的url,自动触发提交人工审核+自动限流/熔断(结合(预)报备机制)
ai什么的还是算了,不要把计算机教坏了
您需要登录后才可以回帖 登录 | 注册

本版积分规则

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号 北京市公安局海淀分局网监中心备案编号:11010802020122
广播电视节目制作经营许可证(京) 字第1234号 中国互联网协会会员  联系我们:wangnan@it168.com
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP