AI绘画

绘制江湖儿女,绘制世间万物

只要AI跑得快,色情黑话就追不上我

比老司机更懂行话,可快速辨别“多人疏通”“王者五排”等涉黄词汇,继每天审核数亿张图片,辨别准确率高于99.5%的技能才能后,近日,阿里危险宣布,AI鉴黄

比老司机更懂行话,可快速辨别“多人疏通”“王者五排”等涉黄词汇,继每天审核数亿张图片,辨别准确率高于99.5%的技能才能后,近日,阿里危险宣布,AI鉴黄师技能才能再度升级,通过将常识融会技能与已有常识图谱进行结合,可精准快速拦截不可描述的变异升级版色情黑话暗语。

业内大师评价,这对人工智能技能的发展具有非常重要的意义,让呆板引入常识后并不对原始语义产生曲解,正是训练智能AI模型必要重点解决的难题。

色情“黑话”变异升级  一般NLP模型难辨别

“小哥哥,要不要来我们这里多人疏通啊?”“大号玻璃过滤彩珠大水瓶、玻璃水壶全套配件到手即用”。大多数群众并不了解这些行话内在意义,但黑灰产从业人员几乎每天都在想如何利用类似行业“黑话”,绕过鉴黄师的检测。

这对人工智能技能的发展带来了非常大的挑战。目前谷歌发布的BERT自然语言处理模型已经在文本明白领域取得了突破性进展,但在辨别上述这些黑话时仍难以发挥实际的拦截作用,不能撕掉这些黑话的伪装,以及无法辨别其指代“色情、毒品”的本来含义。

原因在于呆板虽然对字面意思的自然语言处理模型都懂,但想要了解其中“内在”就变得极其艰难。

阿里危险高级算法大师开阳指出,黑话的辨别难度还在于黑灰产对黑话的创造才能非常强。“他们会结合一些热点事宜来造梗与‘搞内在’,而这些热点事宜通常难以预测”。例如“多人疏通”这类词,如果不是某明星事宜发酵,就不会被色情黑话所引用,这就要求AI模型能够针对新事宜快速感知,并构建形成常识,来为新风险的辨别提供才能。

开阳介绍,在这个过程中,必要依赖各种分析技能对事宜进行辨别,同时基于新词发现技能挖掘事宜词,也就是有可能被黑灰产使用的“梗”,最后通过常识融会技能与已有常识图谱进行融会。

此外,常识的引入也必要避免“过度解读”,例如“足球是一项多人疏通”,对这个句子来说,必要让AI模型知道即便带入常识(多人疏通-某明星出轨-群P),也不应辨别成色情疏通。

新一代危险架构注重文本辨别  提升AI鉴黄才能

“阿里新一代危险架构核心AI技能可以做到这一点。”开阳介绍,针对此类问题,阿里危险提出了一种基于常识图谱的黑话辨别方法,将人工经验常识引入,提升AI鉴黄师的文本明白才能。

首先,算法大师采用半自动化的方式,结合人工经验,构建黑话常识图谱,例如“多人疏通”第一次出现在某明星前女友的分手信,指出某明星背着他在外面多次做出格的事。

图说:以罗XX事宜为例打造的关联图谱

算法大师可以让模型学习到“多人疏通”除了在通用明白层面与足球、篮球有关系外,与“群P”、“出轨”等也有相近意义。然后,进行文本明白时,算法大师将常识信息引入到文本模型当中,让AI将“小哥哥,要不要来我们这里多人疏通啊?“准确明白为“小哥哥,要不要来我们这里多人疏通啊?”,呆板模型带着这样的背景常识来判定原始输入文本,就很容易将其判定为色情文本。

当然,常识图谱不是简单罗列几个关键词,必要根据向量计算,在神经网络结构中提取不同的特征,使AI在信息提炼、语义关系的明白上更精准。

开阳介绍,只必要把新的黑话常识添加到常识图谱中就可以生效,发现舆情事宜导致的变异的时间可能在小时级,辨别过程只需几十毫秒。阿里危险AI鉴黄师的新才能可以增强对内在低俗内容的辨别处置,能够净化网络空间环境,尤其现在接触互联网的青少年越来越多,年龄越来越低,网络空间更需清朗。

“我前两天听到了两个小学生的对话,一个对另一个说‘我觉得你在开车,你就是在开车’,这种内在的网络语言已经开始影响到青少年,必要我们相关从业者做更多工作。”开阳强调,他已经越发感觉到推广该项技能的必要性与紧迫性。

目前,阿里新一代危险架构核心AI技能已应用在阿里的内容危险业务中,帮助辨别色情、赌博等违禁内容,为净化网络空间环境起到了关键作用。

留下评论

您的电子邮箱地址不会被公开。 必填项已用*标注