人工智能如今的写作才能固然还不至于写出生界名著,但足以掩藏住呆板的陈迹,殽杂平凡人的视野。最紧张的是,AI可以批量消费文本,炮制假新闻、疾速刷批评。该怎样揪出假冒人类的AI呢?哈佛大学和麻省理工学院- IBM沃森人工智能实行室(MIT-IBM Watson AI Lab)的研讨职员想到了用AI辨认AI。
他们开辟了一种叫做“巨型言语模子测试器”(GLTR)的新东西,用于辨认人工智能天生的文本。其区分原理基于:人工智能是使用文本中的统计形式来主动天生文本的,而不思索单词和句子的实践寄义。也便是说,假如一篇文章中的用词都是可展望的,该文章就极大概是由人工智能写的,而GLTR可以标注出文章用词能否可展望。
开辟最厚的盾,就要用最强的矛来测试。前一阵子,埃隆马斯克到场创建的AI研讨机构OpenAI推出了一种算法,可以主动天生真实度极高的段落。只需在该算法的“学习形式”中输出海量数据,该算法就可以统计词频,组合高频词,天生新的段落。而哈佛大学的团队正是用Open AI公然公布的代码为底子,创造了GLTR。
GLTR可以依据词频,标明最大概呈现的单词搭配。最易展望的单词是绿色的,较难展望的是黄色和白色的,最难展望的是紫色的。当对Open AI编写的算法所天生的笔墨举行测试后,发明大局部单词都可展望;而人类写出的新闻和迷信择要笔墨搭配更多样。
那么,什么样的用词才是AI无法仿照的“人来之笔”呢?汹涌新闻记者将《哈姆雷特》中到处颂扬[dào chù sòng yáng]的段落放进该东西中检索。