Archive : 人工智慧

AI 训练师年薪 400 万!除了喂养提示词,还需具备哪些技能?

2022 年 11 月 30 日,OpenAI 发表 ChatGPT,从此石破天惊地改变了各行各业,更翻转人类与机器之间的相互关系。人工智慧(AI)是否会进化到与人类同样自行思考,尚无法得知,不过,协助 AI 调整语言模型(如 GPT-3)行为的「AI 训练师」已应运而生,奇货可居的工作特性,更让他们的年薪达到新台币 400 万元。

训练优化 AI 输出

「AI 训练师」的原文是 Prompt Engineer,Prompt 原意为「提示」或「驱使」,Prompt Engineer 的任务,是训练或协助调整 AI 输出想要或正确的答案,在专业上,Prompt Engineer 的定义,是「具备自然语言与机器学习等各种专业知识,然後透过评估各种不同的 prompt 组合,找出最佳的 prompt,来提高模型效率的工程师」。

不过,Prompt Engineer 通常不会直译为「提示工程师」,比较贴切的翻译应该是「AI 沟通工程师」、「AI 沟通师」,或是「AI(模型)训练师」,较符合实际工作的内容。

AI 沟通师进行的「模型训练」(Prompt engineering),是一种专业技术,用以帮助调整语言模型(如 GPT-3)的行为,使语言模型能在特定应用中运作得更好。语言模型通常透过提供预先定义的「提示文本」(prompt),来建立「逻辑模式」,因此,这些提示文本可包括一个或多个关键字,或是一组完整的题目或描述,让模型练习并提高「理解输入」「生成输出」之间的相关。…

《马斯克,挑战科学的男人》:科学家持续探索「脑机介面」,马斯克藉着Neuralink也参了一脚

文:奥利维耶.拉斯卡(Olivier Lascar)

脑机介面:让人脑变电脑

从1970年代以来,脑机介面一直是科学家持续探索的研究领域,而马斯克也藉着Neuralink参了一脚。脑机介面的概念是:「在大脑和电脑之间建立直接连结,使配备此装置的人可以用思考控制行动,无须经过周围神经和肌肉的作用便可执行动作。」

这项技术在1990年代首次使用於人体临床实验。伯吉耶解释:「为四肢瘫痪的患者植入一种『头盔』,使他可以操作机械臂来替自己端杯子,这些目前都已经能做到了。」

例如BrainGate大脑植入系统,从2000年代初期开始一直在美国开发;它是一家私人的生物科技公司,与几所美国大学共同的工作成果,目前这套系统设备正在对瘫痪者进行试验。结果相当令人感到惊奇。

丹尼斯.德格雷(Dennis DeGray)是一名颈部以下瘫痪的患者,但现在,他可以单凭意念在键盘上打字。2016年研究团队在他的运动皮质区(即控制运动的大脑区域),植入了100个电极。即使他的身障情况,已经令他无法再透过手指敲打键盘,但他可以用「想」的做到。

他脑中的电波会被头上的装置接收,这个小盒子看起来像是放在头骨上,但实际上与脑内神经紧密相连;大脑发出的信号会被传送到电脑,然後电脑可以有效选择出丹尼斯所想的字母。正如《麻省理工科技评论》(MIT Technology Review)杂志的总结,这简直就像使用滑鼠一样在使用自己的大脑。

在德格雷的案例中,脑机介面建立在想像一个任务且加以转化:例如他想要移动手指到某个字键上,并按下它,此时,传达这个意念的脑波就会被感测到与转化,使该动作能够确实执行。

法国健康与医学研究院名誉研究主任阿涅斯.罗比-布拉米(Agnès Roby-Brami)解释:「还有一种『诱发电位法』。使用该方法时,装有脑部植入物的病患,必须集中注意力回应。我们将提供一种特殊键盘,上面的字母会一个接一个亮起来。当轮到患者所想的字母亮起时,便会引起大脑信号发生变化,代表这就是患者所想的字母。然後一个字母接一个字母,就可以拼成一个单字。」

这种设备不一定要在头部植入电子装置才能执行,该功能也可以简单的由脑电图(EEG)头套执行。这类「周边设备」在电动游戏行业已取得突破,现在已经商品化了。

它就像一顶布满传感器的泳帽,只要套在头上就可以记录大脑活动。伯吉耶解释:「放在头皮上的头套和脑部植入物,两者之间的差别在於讯息的品质。」单纯放在头上,就像隔着一堵厚墙听某种音乐:你会听到低频,但听不到细微的变化;反之,如果尽可能贴近扩音喇叭(也就是大脑中的电极),你会听到更精致的细节和更好的音质。

其中有些设备是根据反馈原理操作,更加细腻和准确——植入物传递的电信号,会根据它在大脑中感测到的讯息而变化。这类设备目前正在开发中,像是医疗界嵌入式电子技术巨头美敦力(Medtronic),该公司的工程师正在研究利用反馈系统治疗癫痫。

此项技术是把植入物放置在大脑的癫痫发生区,当出现异常放电、显示癫痫发作开始时,植入物就会发出抑制性的电刺激。因此,所有过程都是在患者不知情的情况下进行,患者甚至不晓得自己刚刚脱离了危险!

伯吉耶表示:「此概念是根据闭环控制操作。植入物的电子装置感测到大脑中的电信号,并根据其值产生另一个信号,再发送回大脑以纠正生理讯息。」

闭环刺激(closed loop stimulation)的研究工作,主要由英国帕金森氏症科学家彼得.布朗(Peter Brown)进行探索。但布朗的方法与贝纳比德不同,它的信号不是连续的,并非永久不断的刺激,而是记录和监测大脑的活动,并根据感测到的某些特定线索,决定刺激或不刺激。

不过,这项刺激的应用方法还需要更精确,伯吉耶继续说:「研究团队设定了一个阈值,当超越阈值时,相关装置就会刺激帕金森区,但他们不确定这个阀值对应的是什麽。他们只有一些假设可提供解释,但缺乏实质证据。」

尽管如此,科学家已经观察到可以用这种方式操作。伯吉耶总结道:「这是医学的特点:我们经常会遇到治疗方法有效,但还不确定真正原因为何。这时就会告诉自己,稍後我们就会了解的,好让这些疗法更加完善;但只要它现在有效,我们就会提供给患者。」

法国在这方面的成果也不遑多让。在格勒诺博,贝纳比德教授创办的Clinatec生物医学公司一直担任先驱者角色,持续研究脑机介面,预期未来能让四肢瘫痪的病人,透过脑部植入物来控制外骨骼重新走路。

2019年7月,一名四肢瘫痪的年轻男子在经过两年训练後,利用这个笨重的设备,成功走了几步。研究主任布拉米表示:「这和马斯克的提议有点相同。此外,过去也还有脑机介面方面的顶尖人才——神经科学家米格尔.尼科莱利斯(Miguel Nicolelis)所开发的专案计画:为了替2014年巴西世界杯的首场比赛开赛,一位四肢瘫痪的年轻病患,配备了尼科莱利斯团队所开发的外骨骼,成功踢出了一球。」

不过该事件引起很多讨论。与其说这一球被「踢出」,实际上只是轻轻被推了一下。梅内教授则评论:「这和当初承诺的相差甚远。尽管如此,在10年内我们将有机会看到瘫痪患者在外骨骼装置的帮助下正常行走。」

神经元就像电线,Neuralink能做到无孔不入

MacWhisper 利用 OpenAI Whisper 技术将音讯影片自动转逐字稿

OpenAI 公司最为人所知的就是 ChatGPT 人工智慧聊天机器人(现在还有人不知道吗?),其实它还有其他也是很强大的专案研究,例如「DALL·E 以描述让 AI 创造图片,也能编辑现有图片呈现逼真效果」或是另一个对语音即时辨识、转为文字档的 Whisper 技术,都是当今 AI 领域的伟大发明,对於使用者来说或许不用很清楚这些技术背後的实际运作方式,只要善用对的工具就能提高工作效率。

本文要介绍「MacWhisper」是一个将录音或影片自动转为逐字稿的 Mac 应用程式,使用的正是 OpenAI 旗下的 Whisper 技术,无论是会议录音、讲座或是任何音讯档都能透过 MacWhisper 快速准确地转换为文字,同时标记时间轴,也能在辨识後直接修正错误的本文段落,支援超过 100 种语言。

更棒的是 MacWhisper 所有辨识、转录工作都在使用者的电脑上进行,不需要让任何资料离开电脑,即使遇到隐私、敏感的资料也很适合透过 MacWhisper 进行转换,应用程式本身有免费和付费 PRO 方案,差异在於可下载的训练模型(Models)大小不一样,即使如此,免费版模型就能获得相当不错的正确性,同时也能在很短时间完成音讯的识别工作。

MacWhisper 适用於 MP3、WAV、M4A、MP4 和 MOV 格式,付费後还能直接贴上 YouTube 影片网址、直接将影音内容转为文字逐字稿,转换後可保存为 SRT、VTT、TXT、CSV、DOCX(付费後还有 HTML、PDF 和 …

《尼尔自动人形 ver1 1a》:人与机械的距离

文:官俊铭

最近由大热游戏《尼尔:自动人形》改篇而成的动画《尼尔:自动人形 Ver1.1a》,正在热播好评中!《尼尔》的故事讲述在数千年後的未来,地球早已成为机械生命霸占,成为机械的乐园,「人类」为了重夺地球派出人造人寄叶部队与机械战斗。而2B(女主角)和9S(男主角)在战争过程中,遇到不少机械的言行均於人类非常相似,2B亦不时发出「这种像人类一样的……」的疑惑。本文将尝试讨论人类与机械的分别。

图片来源:NieR:Automata Ver1.1a宣传图片

机械懂得思考吗?

早在第一集2B在侦查工厂的任务中便听到机械生命在说着片断的话语。在2B思考机械在做什麽的时候,9B便断钉截铁地回答「只是参照旧世界的资料,随意讲些甚麽而己,机械生命做的事情没有任何意义」。 或者我们可以将9S的观点还原成以下内容,机械生命只是按着记录播放旧世界的录音,当中没有任何的思考过程,机械人根本不明白它们正在说甚麽。

9S的这个想法,其实跟哲学家约翰.瑟尔(John Searle)提出的中文房间论证不谋而合,该论证的内容大概是有一个完全不懂中文的外国人被关在密封的房间,房间里有一个与外界沟通的信箱。外界的人可以透过投中文书信与房内的人交流,房内的人虽然不懂中文但他却可以拎房中的参考书,按着指引写出像样的回信。但即使能骗过房外的人,这仍没改那个外国人不懂中文的事实。

可能那个机械真的只是按照纪录行事,可是这又如何?我的意思是这根本不能区分人与机械的分别。举个例子,笔者相信大家在中学的时候总有学过毕氏定理,a2+b2=c2 又有谁不知呢? 可是,你真的懂得当中的原理呢,了解当初的数学家是如何证明这道公式吗?还是你们都跟笔者一样只是背熟了这条公式?

如果是机械与人的分别,单纯是机械不懂「理解」,那这个论点是站不住脚的。因为不管是不懂毕氏定理原理的我们,还是那个不懂中文的外国人,我们都是人类啊? 如此这般,我们与机械有何分别?

Photo Credit: アニメ『NieR:Automata Ver1.1a』ノンクレジットオープニングムービー

机械没有同情共感的能力?

9S对械械生活的第二个判断可能归纳为「就算模仿得再相似,机械终归是机械,它们没有情感,也是没有心」。这个判断跟大众的理解亦相当接近。

可是为什麽我们会这样想呢?请回想一下我们日常是如何判断他们的情感,我们不就是通过别人的言行作出判断吗?在情人节没有任何表示的男友会被视为没有诚意;在审讯台上哭泣流涕的被告会被判断为持有歉意;说话大声的囚犯,会被判断成没有礼貌不尊重别人……

正因为我们没有辨法透视别人的内心,所以只能观察他人的行为,但是为何当对象变成机械人我们则不用以上的准则作判断,反而假定机械人没有内心?

Photo Credit: アニメ『NieR:Automata Ver1.1a』ノンクレジットオープニングムービー

存在先於本质

在「尼尔」的故事中,机械生命在失去它们的造物主後,有的机械仍然执行遗留下来的程式继续战斗,有的其他机械组成部落一起生活,有的更是想成为人。剧中的反派角色亚当,一直都在模仿人类的行为,在某一幕,亚当正在看沙特的书,并振振有词的出「人类真是有趣……存在先於本质」,人与物是不同的。即使在物尚未存在的时候,物的本质还是已经被决定。例如一只水杯即使尚未被制造出来,它的目的就是盛水。机器生命亦是一样,机械生物的存在目的都早已被它们的造物主赋予,不能突破造物主写下的程式。

这似乎是区分人与机械的分别,人类在每刻,每个当下都可以选择做甚麽,亦可能随时与过去的自己决别,可能你15岁时想成为漫画家,25岁想成为运动员,40岁想成为音乐家。

遗憾的是,有时我们总会画地自限认为自己是一个天生是某一种人。例如笔者的英文奇差,而我小时候总会跟自己说「自己天生就是英文差的人」;另一例子是某些艺人在访问时讲粗口,会说自己的性格天生就是大情大性。

值得思考的是,若我们为自己的人生画下本质,我们与机械人还有甚麽分别?当机械不断突破程式的限制,而人类不断自我限制,两者的分野似乎愈来愈模糊。

後记

AI绘图、OpenAI的出现,引起全球关注。不少人在感叹科技进步日新月异,同时害怕自己的工作会被AI取代。亦有人认为AI的发现可以带出另一种的理想可能,一种宛如多啦A梦的世界,所以难题及工作都可以交给猫型机械人。人类可以自始摆脱劳动,可以尽展所长做自己喜欢的事。这种情况相当令人神往,但在此之前,也许有一个问题需要思考那是:机械人有思考及情感吗?如果有的话人跟机械人到底有何分别?又假若没有的话我们有甚麽理由让它们做人类的下仆?

【加入关键评论网会员】每天精彩好文直送你的信箱,每周独享编辑精选、时事精选、艺文周报等特制电子报。还可留言与作者、记者、编辑讨论文章内容。立刻点击免费加入会员!

责任编辑:Alex
核稿编辑:Alvin

AI 佛祖来了!为你解答人生的意义、繁中问答都能通!

大环境变化之际,你是否有时感到时机歹歹、生活不顺遂?信奉日本净土宗的创业家「家入一真」使用与 ChatGPT 相同的 API(gpt-3.5-turbo)、开发出 AI 佛祖聊天机器人「HOTOKE AI(HOTOKE 音同「仏」,意指「佛」)」,以佛教等视点为使用者解答人生的疑惑。

根据 ITmedia 报导,开发「HOTOKE AI」的家入一真曾参与网路服务公司「GMO Pepabo」的前身「BASE」、以及募资网站「CAMPFIRE」等公司的创办,为一名创业者。GMO Pepabo 提供的网路开店平台「minne」,为日本及海外手工艺创作者的集散地,最为知名。家入一真本人已接受净土真宗的剃度。

实际在 HOTOKE AI 输入提问测试,首先用繁体中文询问是否可以用中文提问?AI 以日文回覆可以。再询问是否可用繁体中文回应?AI 仍然以日文正面回应「没有问题」。於是再次使用繁体中文询问:「请佛祖用繁体中文回答我,台湾受到战争的威胁,我们应该如何稳定自己的心情?」HOTOKE AI 回应了如下附图的解答。可以看到 AI 运用佛教与心理学的角度分别作出回应。

Photo Credit:「HOTOKE AI」自动生成回应截图

接着尝试将完全相同的问句输入 ChatGPT 的全新对话(New chat),得到的结果如下图。

Photo Credit:「ChatGPT」自动生成回应截图

相较之下,HOTOKE AI 提供更温和、舒缓的语气,提供的建议也比 ChatGPT 来得略为具体。ChatGPT 可能较无法在未进行更多训练的前提下,提供佛教与心理学的见解。…

人工智慧狂潮来袭,南韩政府砸钱催生本土 AI 晶片产业

ChatGPT 点燃 AI 热潮,南韩希望成为满足下一代 AI 晶片新需求的关键参与者。为此南韩政府付诸行动,提出计画和预算并投资当地的 AI 晶片新创。

南韩科学技术情报通信部(Ministry of Science and ICT,MSIT)15 日公告,2030 年前计划投入 8,262 亿韩圜(约台币 193 亿元)预算,投资研发先进 AI 晶片的本土公司,具体包括建设新的资料中心,以吸引 AI 晶片新创和云端供应商合作。

在 2022 年 9 月公布的南韩数位策略计画,宣示从 2023 年起重点投入「AI」、「AI 半导体」、「5G 和 6G 通讯」、「量子」、「元宇宙」、「网路安全」六大领域的技术研发,AI 是计画首重的部分,具体预算也已公开,而 MSIT 最新公告的内容则是整个计画的一环。

南韩数位策略计画为发展 AI 半导体拨出 …

AI 爆发关键在应用!麦肯锡收购 Iguazio 让商业导入快八倍、生产力高五倍

麦肯锡公司於 1/ 24 宣布,AI 和机器学习领域的公司 Iguazio 加入团队。公告说明,在 Iguazio 技术和 70 多位资料和 AI 专家的加入後,麦肯锡将能够大幅加速和扩大 AI 部署,为客户带来更大的影响。

为了在竞争激烈的市场中生存,利用 AI 的能力是必要的。

根据麦肯锡的研究,从 2012 年到 2021 年,全球各地对 AI 投资了超过 4,900 亿美元。但是,大多数企业领导者仍在努力将这些投资转化为具体回报,只有 10%的 AI 专案能够在实际商业环境中成功。

作为技术领域的领导者,麦肯锡的 QuantumBlack,已经与客户合作了十多年,将 AI 融入即时决策,以解决世界上最具挑战性的问题。但是,一个关键的问题仍然无解:组织如何成功部署和扩大 AI 以解锁真正的商业价值?

麦肯锡官方部落格

Iguazio 创办人,左起技术长 Yaron…