【TechOrange 编辑部导读】
「AI 创作时代」要到来了吗?自去年底 ChatGPT 爆红後,许多学生、文字工作者都在使用它来「偷吃步」,不过近日 ChatGPT 开发公司 OpenAI 自己开发了 AI Text Classifier,可检测文本是否由 AI 生成。正所谓的「解铃还须系铃人」,由 AI 生成的内容还是需要使用 AI 工具来检测。
打造热门 AI 聊天机器人 ChatGPT 的开发公司 OpenAI 这周三 (2/1) 对外宣告,已经开发出了可以初步检测由 AI 所产生的文字的侦测工具:AI Text Classifier。这个语言模型是以人类和人工智慧针对相同主题所撰写及生成的文字组资料加以训练,使用多种来源,以处理自动生成的假消息,以及学术抄袭等问题。
不过根据 OpenAI 的说法,这个侦测工具除了需要至少 1,000 个字元(约 150 ~ 250 个字)才能使用;且目前能成功辨识的机率也还仅有 26% 而已。而 OpenAI 也表示他们正在与教育工作者合作,讨论 ChatGPT 的功能和局限性,并将继续致力於检测 AI 生成的文字。
不久前我们还以为 AI 生成内容将从此成为主流,人类写手恐怕会有失业的一天。但工程师们似乎决心不让机器人专美於前,正尝试开发多种侦测工具,可辨识出 ChatGPT 等聊天机器人程式之产出内容。
》下载 TechOrange 2023 趋势观察报告《
♦ TO 延伸阅读:在我们还无法想像有人可取代「Google 搜寻」时,「AI 合成引擎」横空出世了
「对话式人工智慧系统」大行其道
ChatGPT 由「OpenAI LP」所开发,该公司隶属於加州非营利组织、AI 研究机构「OpenAI」,由特斯拉执行长马斯克、矽谷创投 Y Combinator 前执行长阿特曼(Sam Altman)共同创立,微软也是重要投资者之一。
OpenAI 在 2020 年推出自然语言处理(NLP)模型「GPT-3」,经过大量文本学习,熟悉人类惯用的文字接龙方向;透过人类训练者标注,让 AI 模仿答覆;再以人类回答的资料模型进行「增强式学习」,让 AI 更精准模仿人类语言,不断练习组织内文与意涵,才发展成如今见到的 ChatGPT 聊天机器人工具。
不只 ChatGPT,OpenAI 目前公开的一系列 AI 应用都正挑战着人类的想像边际。例如文字转图像模型「DALL・E」、AI 音乐生成工具「Jukebox」、胜率突破 99% 的电竞 AI「OpenAI Five」,以及去年 12 月最新推出的两项应用:文字转 3D 模型「Point-E」、Email 自动撰写工具「Ellie A」。
♦ TO 延伸阅读:汽车内的 AI 语音助手成为最强副驾驶!帮你导航还能陪聊提神
创新工具帮你揪出 AI 内容
随着生成式 AI 技术不断进步,ChatGPT 等内容生成器也开始在全球引发争议,尤其是在教育界——如果所有学生都叫 AI 写作业或论文,难道不算是一种作弊?学习效果自然也会大打折扣。也难怪日前纽约市教育局,宣布将在特定网路与装置上禁用 ChatGPT。
与此同时,市面上已出现多款 AI 内容辨识工具,能帮助你(或虎视眈眈的教授和老板)揪出 AI 生成内容,判别准确度也将不断提升。
面对国际市场快速发展的 AI 技术趋势,台湾企业应当采取什麽策略?
→ 立即下载《TechOrange 2023 趋势观察报告》
GPTZero
这款应用程式由就读普林斯顿大学的大四学生爱德华.田开发,他主修电脑科学、副修新闻,在寒假期间开发出 GPTZero,能够辨别出内容是否由 ChatGPT 所撰写;使用上非常方便,只要将文本复制贴上再送出,该工具就能告诉你文本是真、是假的可能性有多高。
给出判别前,GPTZero 会评估好几个变因,其中一项评估项目就是文本的「变化性」——人类写手作品在用字遣词、句子长度上,往往都更多变。
Hugging Face
Hugging Face 是一间 AI 机器学习工具的开发商,早在 ChatGPT 尚未问世的 2019 年,就已架设出 AI 内容辨识网站,使用者只需要输入约 50 字,它就能给出此段内容是否由 AI 生成的概率。
♦ TO 延伸阅读:ChatGPT 版新搜寻引擎可望 3 月亮相! OpenAI 即将挑战 Google 地位?
GPT-2 内容产出侦测器(GPT-2 Output Detector)
如果 OpenAI 工程师能打造出写作能力和普通人不相上下、甚至更优异的机器人,那麽想设计出比人类更擅於判别 AI 内容的应用程式,想必也非难事。
目前此工具尚处於线上 demo 阶段,使用者只需要将文本输入指令框,就能即时看到这段文字为 AI 产出的可能性有多高。
GPT-3 内容产出侦测器(GPT-3 Output Detector)
此工具由加拿大 AI 内容流程软体商「DNG.AI」开发,能够有效辨识内容是出於 AI 或人类之手,使用者必须在指令框输入至少 400 字, 跑过分析模型後就会得出概率;此工具目前仅能分析英文文本,但 DNG.AI 已预告很快将推出多国语言版本。
巨型语言模型(GLTR)
OpenAI 在 2019 年释出 GPT-2 模型时,由 MIT、IBM 联合成立的华生实验室(Watson AI Lab)找上哈佛 NLP 社群合作,开发出这款 GLTR 演算法。
尽管表面上电脑生成文本可能和人类写的没两样,但其实人类写手的字词选用,通常拥有较高的不可预测性,因此若演算法能预测出某句子中的下一个字,该句子就会被判定为可能由 AI 产出。
♦ TO 延伸阅读:电脑会选土豆、AI 会设计蛋白质!生成式 AI 如何助攻科学家拓展生医全新可能?
Chat-GPT 文字水印功能
不同於上面几款抄袭侦测器,OpenAI 选择从源头下手处理问题——在近期一场 AI 安全研讨会中,OpenAI 客座学者 Scott Aaronson 指出,组织内工程师已设计出工具雏型,能够为 OpenAI 产出的所有文本加上辨识用途的浮水印;然而圈内人士多半认为此功能极易破解。
尽管智慧内容辨识工具越来越多,但专家指出,人们不该仰赖单一模型或演算法,更好的解方应该是博采众家之长,创建出一个结合多种方法的平台,这麽做将能有效提高辨识准确率。
想知道 2023 年最新科技趋势吗?
→ 立即下载《TechOrange 2023 趋势观察报告》
♦ TO 延伸阅读:致力投资 AI 的老板是在扼杀人类工作权吗——不,他们在帮助未来人类获得更多自由
*本文开放合作夥伴转载,参考资料:中央社、WSJ、FastCompany、未来城市,首图来源:Shutterstock
(责任编辑:游绒绒)