忘记密码   免费注册 查看新帖 |

ChinaUnix.net

  平台 论坛 博客 文库 频道自动化运维 虚拟化 储存备份 C/C++ PHP MySQL 嵌入式 Linux系统
最近访问板块 发新帖
楼主: 王楠w_n

【大话IT】早孕网红受热捧,算法识别要背锅?(获奖名单已公布) [复制链接]

论坛徽章:
32
15-16赛季CBA联赛之四川
日期:2018-04-13 10:22:2215-16赛季CBA联赛之四川
日期:2018-03-13 17:59:5215-16赛季CBA联赛之广东
日期:2018-03-02 11:21:5515-16赛季CBA联赛之北控
日期:2017-12-08 13:59:442017金鸡报晓
日期:2017-02-08 10:33:21PHP
日期:2016-10-25 16:17:17JAVA
日期:2016-10-25 16:07:27平安夜徽章
日期:2015-12-26 00:06:30白银圣斗士
日期:2015-12-07 12:56:44CU十四周年纪念徽章
日期:2015-11-30 12:58:54神斗士
日期:2015-11-30 09:14:23黄金圣斗士
日期:2015-11-26 12:54:22
发表于 2018-04-08 17:06 |显示全部楼层
1. 关于一些违规视频的内容,通过关键词抓取,往往无法准确识别内容的违规,比如,搜索“米妮”,出来的是涉及血腥暴力的视频,如何通过技术手段,判断和规避这种问题?
答:国人的智慧是不能忽视的,各种文字游戏让平台无法确定内容的合法性,这些汉字的奥妙是无法通过抓取全部捕获的。平台还是要根据主推的内容进行业务审核,比如视频,要对视频进行审核,图片要对图片进行审核等等。当然文字审核应该比较简单。对于图片和视频的审核,应该比较复杂。所以人工的干预应该是有必要的。对于搜索量暴增,点击量暴增的图片或视频进行人为干预,快速人工审核。

2. 在升级算法识别体系时,您认为可能涉及到哪些技术层面的问题?
答:技术的升级可能涉及的东西比较多的,各种方案都有可能用到。目前好像还没有特别的方案对视频和文字进行自动审核的机制,需要这些平台加大研发力度,尽快找到解决方案。能够挽救自己也能够挽救别人。

论坛徽章:
0
发表于 2018-04-13 15:30 |显示全部楼层
1. 关于一些违规视频的内容,通过关键词抓取,往往无法准确识别内容的违规,比如,搜索“米妮”,出来的是涉及血腥暴力的视频,如何通过技术手段,判断和规避这种问题?
1.  关键字搜索:这是最简单的审核方式,通过输入关键词,能将一些看起来明显是违法、涉黄涉暴的内容直接干掉。如果做好这一项,至少能将网络视频糟粕内容去掉一大半。
2.  建立身份档案:DNA是人类唯一的身份识别码,而文件的DNA无疑是MD5,如果能通过大数据等手段能建立涉黄涉暴文件的MD5数据库,用户上传后自动分析MD5是否合法,则能避免涉黄涉暴文件的重复分享。
3.  自动截取视频缩略图:要建立违法图片自动识别技术。可以自动截取一个视频的十来个地方的缩略图,用违法图片识别技术鉴别该视频是否违法。
4.  关注访问量高的文件:访问量高,基本是涉黄涉暴类分享内容的主要特征之一,如果能在人工审核中,对这些访问量突然蹿升的文件进行审查,相比又会毙掉一部分文件分享。当然这中间可以利用机器深度学习或者人工智能来替代人工!
就目前而言,全球最大的直播平台Facebook在全球建立起超过7500人大规模审核团队,今日头条在天津建立起超过2000人审核团队,而作为上市公司新浪微博,也早上在2017年搭建起超过3000人规模的审核团队,还有我们未曾了解的其他短视频企业,如,快手视频、花椒直播、映客直播等大型互联企业,而人工审核的成本扩容跟随着企业用户量及用户内容上传数量进行正向匹配。早期视频审核主要是对库,而随着录制、剪辑等技术的进步,单纯的对库审核已无法对违规违禁视频做到全面识别,需要引入基于深度学习、图像识别、云技术的机器智能审核与人工审核相结合,这对各平台的技术能力将是一个考验。所以解决这种根本问题还是要技术的跟进,深度学习和人工智能的不断演化精进,才能逐步解决这样的问题。


2. 在升级算法识别体系时,您认为可能涉及到哪些技术层面的问题?
在计算机音视频和图形图像技术等二维信息算法处理方面,目前比较先进的视频处理算法包括:机器视觉(也是此类算法研究的核心)、2D转3D算法(2D-to-3D conversion)、去隔行算法(de-interlacing)、运动估计运动补偿算法(Motion estimation/Motion Compensation)、去噪算法(Noise Reduction)、缩放算法(scaling)、锐化处理算法(Sharpness)、超分辨率算法(Super Resolution)、手势识别(gesture recognition)、人脸识别(face recognition)。
  在通信物理层等一维信息领域,目前常用的算法包括:无线领域的RRM、RTT,传送领域的调制解调、信道均衡、信号检测、网络优化、信号分解等。另外,数据挖掘、互联网搜索算法也成为当今的热门方向。
     当然算法领域里,国内的大部分企业还缺少核心自创算法,但中国算法正在不断创新,进行了人才储备,技术层面的算法已经降低,剩下的就是对于原创算法的资金投入和人才投入了!

论坛徽章:
6
未羊
日期:2013-11-15 09:12:28狮子座
日期:2013-12-10 10:10:54技术图书徽章
日期:2014-01-09 17:41:45技术图书徽章
日期:2014-01-09 17:42:04技术图书徽章
日期:2014-01-09 17:42:5215-16赛季CBA联赛之广夏
日期:2018-01-10 15:17:38
发表于 2018-04-15 16:36 |显示全部楼层
1. 关于一些违规视频的内容,通过关键词抓取,往往无法准确识别内容的违规,比如,搜索“米妮”,出来的是涉及血腥暴力的视频,如何通过技术手段,判断和规避这种问题?
其实我觉得这本质上通过技术很难根治,你搜索“米妮”,出来的是涉及血腥暴力的视频,你搜花朵,可能是带有色情的东西,对于关键字匹配也好,图像识别也好,都是表层化的,而且往往存在矫枉过正的问题,所以,我觉得一方面是利用技术识别,比如图像,音频分析,大数据以及url动态识别,更重要的是通过好的环境,这里面包括教育,举报,以及更多电子警察的作用

2. 在升级算法识别体系时,您认为可能涉及到哪些技术层面的问题?
这里面涉及自动学习,图像识别,大数据分析和建模,以及网络动态分析,主要是在范围和深度上做文章,比如范围上,类似大数据和网络热点动态分析都是帮助大家从范围上更好去定位,而自动学习和图像识别就是为了帮助大家在深度上去分析并识别不良信息。

论坛徽章:
6
未羊
日期:2013-11-15 09:12:28狮子座
日期:2013-12-10 10:10:54技术图书徽章
日期:2014-01-09 17:41:45技术图书徽章
日期:2014-01-09 17:42:04技术图书徽章
日期:2014-01-09 17:42:5215-16赛季CBA联赛之广夏
日期:2018-01-10 15:17:38
发表于 2018-04-15 16:37 |显示全部楼层
回复 10# laputa73

实名制, 交押金.  一经发现,封url, 罚没押金和赏金.

其实这个惩罚没什么作用,现在基本上都是这样,对比收入,惩罚的钱很少,小巫见大巫

论坛徽章:
6
未羊
日期:2013-11-15 09:12:28狮子座
日期:2013-12-10 10:10:54技术图书徽章
日期:2014-01-09 17:41:45技术图书徽章
日期:2014-01-09 17:42:04技术图书徽章
日期:2014-01-09 17:42:5215-16赛季CBA联赛之广夏
日期:2018-01-10 15:17:38
发表于 2018-04-15 16:40 |显示全部楼层
回复 13# tree_fox

关键字搜索:这是最简单的审核方式,通过输入关键词,能将一些看起来明显是违法、涉黄涉暴的内容直接干掉。如果做好这一项,至少能将网络视频糟粕内容去掉一大半

这个现在不是都是这样了吗,别说违法的,现在敏感的你也搜不到,但是,大家还是能找到是不

在通信物理层等一维信息领域,目前常用的算法包括:无线领域的RRM、RTT,传送领域的调制解调、信道均衡、信号检测、网络优化、信号分解等。另外,数据挖掘、互联网搜索算法也成为当今的热门方向。

想问下,这个通信物理层的算法对互联网应用层有啥好借鉴的,这是物理层的工作.....怎么去识别网络层和应用层的应用?

论坛徽章:
6
未羊
日期:2013-11-15 09:12:28狮子座
日期:2013-12-10 10:10:54技术图书徽章
日期:2014-01-09 17:41:45技术图书徽章
日期:2014-01-09 17:42:04技术图书徽章
日期:2014-01-09 17:42:5215-16赛季CBA联赛之广夏
日期:2018-01-10 15:17:38
发表于 2018-04-15 16:41 |显示全部楼层
回复 11# baopbird2005

国人的智慧是不能忽视的

我一直觉得中国网民是最聪明的群体,没有之一

论坛徽章:
6
未羊
日期:2013-11-15 09:12:28狮子座
日期:2013-12-10 10:10:54技术图书徽章
日期:2014-01-09 17:41:45技术图书徽章
日期:2014-01-09 17:42:04技术图书徽章
日期:2014-01-09 17:42:5215-16赛季CBA联赛之广夏
日期:2018-01-10 15:17:38
发表于 2018-04-15 16:42 |显示全部楼层
回复 5# 王楠w_n

嗯嗯,看来管理员是紧跟时政热点,哈哈啊

论坛徽章:
37
CU大牛徽章
日期:2013-03-13 15:32:35CU十二周年纪念徽章
日期:2013-10-24 15:41:34射手座
日期:2013-10-24 21:01:23辰龙
日期:2013-12-20 17:07:19狮子座
日期:2014-05-12 11:00:00寅虎
日期:2014-06-04 16:25:27IT运维版块每日发帖之星
日期:2015-08-17 06:20:002015亚冠之首尔
日期:2015-11-04 22:25:43数据库技术版块每日发帖之星
日期:2015-12-01 06:20:00平安夜徽章
日期:2015-12-26 00:06:30IT运维版块每日发帖之星
日期:2016-01-27 06:20:0015-16赛季CBA联赛之新疆
日期:2016-06-07 14:10:01
发表于 2018-04-16 08:36 |显示全部楼层
回复 15# infoback

那是罚太少啊
提高惩罚力度比加强什么技术识别算法容易多了.
什么AI识别,现阶段就是圈钱概念.
就算未来ai能识别了,控制ai的仍然是政策,背后仍然是钱.
唯技术论其实就是在推卸责任.
说白了,生态而已.

论坛徽章:
6
未羊
日期:2013-11-15 09:12:28狮子座
日期:2013-12-10 10:10:54技术图书徽章
日期:2014-01-09 17:41:45技术图书徽章
日期:2014-01-09 17:42:04技术图书徽章
日期:2014-01-09 17:42:5215-16赛季CBA联赛之广夏
日期:2018-01-10 15:17:38
发表于 2018-04-16 09:14 |显示全部楼层
回复 19# laputa73

我觉得像这类,很难用AI去做到自动识别,很多时候,连人都很难区分色情和艺术,暴力和血腥,所以还是你说的,好的生态和监管才是关键,但是说白了现在很多监管也是无为而治

论坛徽章:
0
发表于 2018-04-17 08:49 |显示全部楼层
回复 16# infoback

诚然,现在还是人工筛选为主的,但是科技发展的方向是朝着人工智能的。科技是导向,作为it公司自然要跟着科技走在发展的前端,否则注定要被淘汰的。至于为什么要研究物理层面,这个怎么说呢,主要还是考虑在一维和二维层面进行技术革新!
您需要登录后才可以回帖 登录 | 注册

本版积分规则

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号 北京市公安局海淀分局网监中心备案编号:11010802020122
广播电视节目制作经营许可证(京) 字第1234号 中国互联网协会会员  联系我们:wangnan@it168.com
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP