AI能比人类更有创造力吗

一项新的大规模研究显示,人工智能在创造力表现上已经超过了普通人类,但仍未达到最顶尖的人类水平。

研究的合著者包括人工智能和深度学习先驱Yoshua Bengio,以及第一作者Antoine Bellemare-Pépin和François Lespinasse,还有Philipp Thölke、Yann Harel、Cory Matteson、Jay A. Olson和Karim Jerbi,他们共同领导并撰写了这项研究。研究表明,尽管AI在创意任务中表现出色,但在最具挑战性的创意岗位上,现有人工智能系统仍难以取代表现最佳的人类。

创意工作真的能免受AI影响吗?根据美国国家艺术基金会的数据,创意经济约占美国国内生产总值的4%,在2023年约为1.2万亿美元。联合国估计,全球约有5亿个职位属于创意经济范畴。

创造力在许多行业中都至关重要,包括数字媒体、信息技术、出版、音乐、表演艺术、广告、市场营销、电影、电视、广播、视觉设计、电子游戏、软件开发、手工艺、珠宝、烹饪艺术、文化机构、摄影、时尚、建筑、舞蹈和娱乐等领域。

在OpenAI于2022年11月向公众推出ChatGPT之前多年,未来学家普遍认为,AI最早应用的行业是那些工作内容重复、可预测且高度机械化的岗位。回顾2022年前的职业列表,许多创意职位曾被认为较为安全。然而进入2026年,人工智能已经成为一些创意岗位潜在的影响因素。

人工智能在创意产业中是威胁还是机会?技术自动化和AI正在迅速改变创意行业的格局。麦肯锡全球研究院在《生成式人工智能与美国未来工作》报告中指出,到2030年,美国经济中约30%的工作时间可能被自动化取代,而生成式AI正在加速这一过程。

Adobe对2500多名创意专业人士进行的调查显示,83%的受访者在工作中使用生成式AI工具。生成式AI在创意产业中的日益普及促使我们重新审视大型语言模型与人类创造力之间的关系。

人们通常认为,人类天然比机器更具创造力。然而,AI的机器学习能力在迅速进步,它正逐渐渗透到传统上属于人类创造力的领域。生成式AI模型究竟有多具创造力?

衡量创造力的方法是科学研究中的关键难题。研究团队采用了由合著者Jay A. Olson开发的方法,即发散联想任务(Divergent Association Task, DAT)。Olson在哈佛大学博士后期间,与Margaret Weber、Johny Nahas和Dennis Kmuijevich合作,在《美国国家科学院院刊》(PNAS)上发表了相关论文《命名无关词预测创造力》。DAT方法最初让来自98个国家的8900多名参与者完成创造力测试,用以量化主观的创造性表现。

在蒙特利尔大学心理学系Jerbi教授领导的新研究中,团队沿用DAT方法,将其应用于比较不同大型语言模型(LLMs)与人类的创造力表现。研究人员指出,他们在DAT任务及多个创意写作任务(包括俳句、故事梗概、闪小说)中进行基准测试,采用一致的客观评分方法。

为了适应AI评测,DAT任务的指令被转化为提示符,要求大型语言模型输出10个尽可能不同的词语,再根据前七个有效词计算DAT得分。在一项包含10万名男女参与者的人类数据集中,各种大型语言模型的表现得以科学比较。

研究显示,大型语言模型在DAT任务上的表现可以超过人类平均水平,接近人类的创意写作能力,但仍低于创造力较高的人类参与者的平均水平。

参与评测的模型包括Stability AI的StableLM、Nous Research的Vicuna、EleutherAI的Pythia、Anthropic的Claude 3、Together AI的RedPajama、Google的Gemini Pro,以及OpenAI的GPT-4、GPT-4-Turbo和GPT-3。结果显示,GPT-4在DAT任务中表现最突出,其次是Gemini Pro。

研究人员强调:“关键发现是,包括GPT-4在内的多个大型语言模型,其DAT得分超过了10万名人类样本的总体平均水平;然而,即便是表现最好的模型,也未超过前50%人类参与者的平均值,高分人类仍然形成明显的优势差距。”

研究结论显示,当前最高水平的人类创造力仍然优于大型语言模型的表现。研究团队指出:“尽管普遍担心AI可能很快取代创意工作者,如作家,但我们的研究结果表明,这种担忧仍为时过早。”

来源:psychologytoday(编译 / 整理:olaola

图片来源:unsplash/Andrea De Santis