免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2572 | 回复: 0
打印 上一主题 下一主题

鉴黄师要下岗了!日本 AI 教你花式识别“小黄文” [复制链接]

论坛徽章:
146
2015年亚洲杯之日本
日期:2015-04-28 13:32:012015年亚洲杯之朝鲜
日期:2015-05-06 10:16:442015年亚洲杯之日本
日期:2015-05-06 10:21:342015年亚洲杯纪念徽章
日期:2015-05-13 17:16:442015亚冠之北京国安
日期:2015-05-13 17:18:292015亚冠之鹿岛鹿角
日期:2015-05-13 17:19:062015亚冠之德黑兰石油
日期:2015-05-27 16:47:402015亚冠之塔什干棉农
日期:2015-05-28 15:24:122015亚冠之卡尔希纳萨夫
日期:2015-06-01 13:52:392015亚冠之柏斯波利斯
日期:2015-06-04 17:37:292015亚冠之阿尔纳斯尔
日期:2015-06-16 11:31:202015亚冠之塔什干火车头
日期:2015-06-23 10:12:33
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2017-06-02 10:10 |只看该作者 |倒序浏览
5月23日到5月26日,在中国棋手们努力迎战阿尔法狗的同时,日本也举办了第31届全国人工智能大会。在这次大会上,立命馆大学情报理工学科的三名研究人员发布了一篇关于AI识别小黄文的论文。论文的主要内容是,如何利用AI来识别那些“使用隐喻手法”来表现“少儿不宜”的文章。也就是说,即使作者只是在小说里遮遮掩掩地进行了某些暗示,也会被AI给揪出来。

研究人员为什么要做这种奇怪的研究我们不得而知,但使用的研究样本对同人文化、腐文化非常不友好,在日本国内也引发了激烈的争论。

论文截图

争论的原因之一是,这篇对全年龄段读者公开发表的论文,引用了网站分级为R18的小说内容,而且还没有提前取得网站和小说作者的同意。

论文使用了pixiv网站上,2016年十月R18分类下人气最高的10篇BL同人小说。论文将这些小说作为研究样本,在“小说里有不健康内容”的前提下,来说明“AI如何识别出通过隐喻手段表达的不健康内容”。

为了说明AI的识别方法,论文里引用了不少“少儿不宜”的内容。论文作者在引用前没有取得作者或pixiv网站的授权,还私自公布了小说的题目、作者和URL地址。

pixiv是一家日本同人插画和小说网站,对内容有严格的分级制度,它有一个中文名字“插画交流网站”(而且还支持新浪微博登陆)。pixiv上分类为R18的内容只有年龄设置在18岁以上的注册用户才能查看。


这篇论文公开发表后,所有年龄段的人都可以看到被引用的少儿不宜内容,也都可以通过论文中的URL地址找到被引用的R18小说。一些小说作者只能将被引用的小说删除或设成不公开状态。

论文中给出的小说作者和URL地址

除了会被小朋友看见,在未经网站和作者允许的情况下,使用这些小说作为研究对象在日本还存在版权问题。

被引用的小说在pixiv网站上只有注册用户能够查看,并且不对18岁以下用户公开。这样的内容是否可以被判定为“网络公开内容”加以引用和公开发表,在日本法律界还没有定论。
日本网友们的另一个争论点是,把这些有分级的小说划为不健康内容真的合适吗?

被引用的小说在pixiv网站已经被分级在R18类型下,未成年人不能阅读。研究中依然将这些小说归为“内容不健康文章”,还公布了小说作者和URL地址,一些日本网友认为这是对小说作者的诽谤,有违研究伦理。

这篇论文5月24日在大会上发表,5月25日,pixiv就公开表示:

我们已经要求发表论文者所在学校对这件事加以调查和解决,也希望大家以后能够继续安心使用P站。

机器的日文翻译大家随便看看就好

学校方面则表示正在着手调查这件事。这篇论文在此之前已经在日本人工智能学会的网站上发布,不过目前已经被隐藏。论文作者之一、立命馆大学助理教授山西良典在接受日本媒体采访时表示,论文确实存在一些问题,之后是否会继续发表还有待研究。

虽然这项利用AI判断隐晦小黄文的研究存在问题,但用AI来识别网络内容的研究方向实在让人不寒而栗。如果将来AI真的开始监督网上发布的内容,我们在网上说话的时候是不是要更小声了呢?




您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP