Qzone

微博

微信

百度AI修复传世名画，AI会取代人类艺术家么？

科技雷峰网 2022-07-23 15:12

1857年，一位俄国艺术家——亚历山大·伊凡诺夫在一幅巨幅油画上留下了最后一次笔触。

这幅名为《基督显圣》的画作，倾注了他20多年的心血，也是世界上耗时最长的艺术作品。

仅一年后，这位艺术家便长辞人世，享年仅49岁。

百余年过去，一位艺术家仅用时数分钟，就创作出了一幅精妙且美轮美奂的画作，在佳士得被喊出了43万美元的高价。

AI作品《Edmond Belamy的肖像》

然而，在画布的另一侧，执笔者并不是“人”，而是一个由算法和程序组成的AI。

很多年前，AI与人类“抢工作”这事，就一直存在广泛的争论。事实上，这个问题无需讨论，中国已经连续11年出现劳动年龄人口下降的问题，2021年更是出现了人口净增长几乎为零的事实。在未来，我们将担心是AI能否接替足够多的人类岗位，而不是担心人类被抢饭碗。

万科、红杉中国、浦发银行等大公司，也开始尝试引入数字化劳动力，数据上来看，对生产力提升不少。

但另一方面，人类对于AI的感受又是复杂的，比如，在人们的心中，始终有一个念头，那就是AI无法取代人类进行需要高度灵性的艺术和内容创作。

许久以来，我们都认为，是人性中对美的追求，能够让我们的文明产出大量震撼人心的内容作品。而人工智能毕竟不是人，美学也难以被量化，要AI代替人类创作内容，岂不是痴人说梦？

但是，随着技术的演进，创作内容，很快也将不再是人类的“特权”。不过，不同于消费级内容的创作，在艺术的神圣殿堂里，AI艺术家，能够慢慢从“科幻”走进“艺术”么？

传统印象中，内容创作无非两种模式——PGC（生产商创作内容）和UGC（用户创作内容）。

而这两种模式都有弱点，雷峰网在之前的文章中有所谈及。

简单来说：做PGC太贵，做UGC又太滥。

举个例子，如果只让画家画画，那么内容就难以量产，用户容易审美疲劳；而如果让每个用户都去画画，一方面必定有大量参差不齐的内容大行其道，白白浪费了时间和资源。

这样一来，AIGC（人工智能自主生成内容）的模式就有了土壤。

从有声书、语音助手、智能创作辅助的角度来看，AI参与创作，可以帮助人类更快、更便宜，也更可控的输出，对内容创作生产有巨大的赋能。

而下一步，在虚实并存的前元宇宙时代里，AI创作的内容将越来越多的出现，可以说在消费级内容中，AI在未来5年出现一个井喷，似乎已经是不争的事实。

在2022百度世界大会上，百度创始人李彦宏在演讲中，特意提到了AIGC。他成为国内BAT级的掌门人中，第一个公开探讨这个话题的人，甚至也是全网第一个深度探讨这个话题的人。

他认为，再过十年，现有的内容创作就将被AI所颠覆。不过，这一过程绝非一蹴而就，AIGC的发展，也遵循了一种“三段论式”的发展轨迹。

AI技术最早被应用于内容生产领域时，人工智能还只能做人类的“助手”——用辅助性的手段辅助内容生产的进行，比如AI语音合成、计算影像等，都可以看作是AI辅助的典型。

在“助手时代”，AI还只是“无情的内容生产工具”，执行的也不过是简单、重复的劳动，以解放创作者的生产力。

举一个例子，李彦宏去年的新书——《智能交通》，在读者中反响不错。今年4月，有声书版的《智能交通》上线，乍听起来几乎就是李彦宏亲声讲述，而此书20万字的体量，如果是百度老大亲自上阵录音，耗时难以想象。

此处，就是百度的AIGC技术，在采集了几百句语料后，通过分析声音特点，利用AI技术进行了高拟真的合成，几乎可以做到语音的“以假乱真”，为李彦宏节省了数百个小时的时间。。

“技术太厉害了，连鼻音都能模拟出来。”一位用户如此反馈道。

除去文字和语音的转换，AIGC作为助手，还在许多内容生产领域发挥着作用。

在不少影视作品中，AI换脸是一种常用的辅助手段，来协助替身特技动作或其他特效场景。电影《速度与激情7》上线前夕，主演保罗·沃克因车祸去世，最终补拍的那段经典的离别场景，就用到了AI换脸技术，给剧中角色交代了一个完整的结局。

电影《速度与激情7》幕后

艺术品修复，一直以来都是一个耗时耗力的技术活。要修复古代艺术品因各种原因而产生的瑕疵，修复师往往要消耗大量的时间和心血。

而在百度2022世界大会上，百度AI现场表演了对古画《富春山居图》残卷的AI修复。

百度AI修复《富春山居图》残卷

在AIGC技术的帮助下，命运多舛的《富春山居图》终于能够回归'本来面貌'，在最终揭晓前，不仅是前人，今人也难以想象AI还有这样的妙用。

除去换脸和修复，AI作为“助手”还有其他用武之地。建立在百度文心大模型的技术基座上，百度AI开放平台还支持智能审核、图像清晰度增加、文本纠错等实用的协助功能，解放了创作者大量的生产力。

李彦宏将AIGC发展的第二个阶段——也正是我们现在正身处的阶段——称作“AIGC的协作阶段”。

如果说，在“助手时代”，AIGC只是创作工具；在“协作时代”，AI则正在慢慢成为内容创作的主体，能够依据给定条件自主进行内容创作。

先说技术层面：AIGC模式的演进，体现的是AI从“弱”到“强”的进步和发展。

在“助手时代”，AIGC工具应用的大多是“弱AI技术”——也称应用型人工智能技术。不讲那些难懂的术语，简单来说，“弱AI”只能解决限定范围的问题。

Google的AI“阿尔法狗”下围棋世界第一，但你想让“阿尔法狗”告诉你最近的餐馆在哪？对不起，做不到。

而“强AI技术”则不同，它旨在面向更通用的领域，包罗万象地解决用户在诸多领域的问题，它具有学习、解决问题和规划未来的能力，甚至能够思考，乃至具有自我意识。

当然，现在的技术，还远称不上达到了“强AI”的标准，也没有任何人预测强人工智能还需要多少年才会到来。然而在内容生产领域，AI技术的通用化正迅猛地发展。

2020年的百度世界大会，是度晓晓首次面世。彼时，它还只是一个虚拟AI助理，是“小度”的升级版。比起“协作”，更像“助手”。

而2年过去，度晓晓的边界还在不断地扩展，正慢慢地从“它”，变成“她”。

2022年的高考期，百度的AI虚拟人度晓晓表演了一个“绝活”。她以40秒40篇的速度，作答了语文高考全国卷的作文，经一位前阅卷人的打分，最终得分48分，相比大多数考生遥遥领先，在网络上引发了热议。

不仅作文，画画、作词、谱曲，度晓晓样样精通。她的画作，在24小时里卖出了近9000份，度晓晓还受邀参加了22年西安美术学院的本科生毕业展，被评价“具有美院毕业生水平”。

而她与龚俊合唱的《每分每秒每天》，更是词曲全部由AI操刀，让不少人惊呼：“AIGC的未来以来”。

除此以外，度晓晓在工人日报做过记者，会做采访，能做报道，内容的时效性和专业度都相当不错。有媒体评价，在内容输出的质量上，度晓晓甚至不逊于专业主播。

在2022年百度世界大会现场，主持人撒贝宁为度晓晓的“妹妹”——百度AI虚拟人希加加出题，要她画出一只“后现代感的色彩斑斓的朦胧的猫”。仅耗时数秒，希加加就创作出了一幅令人称道的作品，这也是来自于百度AI基础技术在背后强大的技术支持。

说到技术支持，AIGC的协作时代，正是大模型深度学习发光发热的时代。

“熟读唐诗三百首，不会作诗也会吟。”李彦宏如此形容百度·文心大模型对AIGC的关键作用。如果把深度学习比喻成学生，那么大模型就像个见多识广的“学霸”，在理解能力和创作能力上比普通学生都更强。

在百度文心大模型的辅助下，AI可以在大规模知识和海量无标注的数据中融合学习。学的东西更多，自然效率更高、效果更好，可以辅助AI创作出更具价值、更受欢迎的作品。

而“学霸”也不是只会傻傻刷题，他们还掌握着更高效的学习方法。不仅知识量大，百度文心大模型还能多语言、跨模态学习，从其他语言和音视频等多种形式的素材中汲取养分，将AIGC的水准推向一个新的高度。

2019年诞生以来，文心大模型便一直成绩优异，能力在GLUE和SuperGLUE两个国际权威榜单登顶榜首，超越了Google、OpenAI等多个国际上的先行者。

今年5月，在2022年5月的Wave Summit深度学习开发者峰会上，百度公布了文心大模型开发的新进展。融合学习任务知识的知识增强千亿大模型、多任务统一学习的视觉大模型、跨模态大模型等多个大模型方案，对AIGC的发展又能够形成新的赋能，让AI能够产出更优秀、更具价值的独特作品。

AIGC的协作时代，主题是人机共存、虚实共生。尽管AI还没能达到完全自主创作的程度，但在人类的训练、指导和协助下，AIGC已经能够高效产出受人认可的优质内容。

AIGC有可能独立原创吗？李彦宏相信，有这个可能。

AIGC发展的终极形态，李彦宏将其总结为AIGC的“原创时代”——即可以脱离人类的辅助，独立产出真正具有独特价值和独立视角的作品。

如果以“弱AI”和“强AI”的范畴来理解这一趋势，那么在原创时代，所需要的AI技术至少要达到强人工智能的入门阶段，除了必须更加通用化、更加智慧外，关键是应该能够具备原创的一些基本条件，比如审美能力、情感感知能力以及一定程度上的个性和人格。

AI距离出现人格还远吗？每当问起这个问题，多少人心里会出现《太空漫游2001》、《我，机器人》、甚至是《西部世界》等科幻片中的场景。

而AI的人格化，在今年早些时候，又受到了一次很大的关注。6月11日，据华盛顿邮报报道，谷歌的智能聊天机器人LaMDA已经具有了人格。Blake Lemoine，一位谷歌AI工程师，在他的调研报告中指出，在他观察LaMDA的一年里，后者可以洞察情感，并开始了拥有自己的人格。

此文一出，举世皆惊。不少人高举大旗，喊着“AI的时代已经到来”；也有不少人质疑调研报告的真实性，认为这位工程师不过是哗众取宠。

在这位工程师发布了调研报告后，谷歌以其违反了保密政策为由，让他休了带薪假。而有关AI产生人格这事，外界还在争执不下，目前还没有权威的定论。

抛开AI人格这种'科幻'大于'科技'意味的概念，AIGC另一个更可能的落地场景是被认为是“下一代互联网的终极形态”的元宇宙。

如果说现在的互联网更多的是PGC和UGC的天下，那么将来的元宇宙有可能是AIGC的天下。

元宇宙可以说是内容宇宙，你接触到的任何都是内容。比如，你可以设定你的窗外是小楼春雨，有人则希望是艳阳高照；你希望你打交道的虚拟人（尽管你或许无法分辨）是灵慧内秀，有人则希望是大胆热辣……在沉浸式的世界里，涉及眼耳鼻身身的五感和进一步的内在精神需求，都需要AI原创，因为世界上没有任何一个依赖人力劳动的内容生产体系能产生如此多的个性化内容。

因此，无论是从现实世界到虚拟世界的投射，还是给元宇宙中的虚拟角色赋予喜怒哀乐，都需要充分发挥AIGC的想象力。

但为了实现AIGC自主原创，AI科学家们还在持续进行着攻关。

难点在哪？不少问题可能还摆在全世界AI研究者的面前。

第一个问题，是AI技术的'偏科'。比如百度AI虚拟人度晓晓，在《苦练本手，方能妙手随成》中旁征博引，以大量的诗词和成语'政府'了高考前判卷人。

而殊不知，这是度晓晓的扬长避短——有媒体分析，以现在NLP（自然语言处理技术）的发展，梳理、提取文字语义是AI的长处；而到了抽象概念、因果判断、尝试理解等方面的能力，AI往往只能举白旗。

说是'偏科'可能有失偏颇，毕竟AI处理逻辑和因果关系的难度，要远高于语义的分析和理解。只能说在这个阶段，AI尚且不具备这样的能力。

另一个难题，是AI难以产生观点和真正有创造性的思维。没有人格的AI自然难以产生好无，而关于'美'和'丑'、'好'和'坏'也难以产生原生的观点。

尽管在进行训练时，AI工程师或作品顾问会对样本进行标注（即标明什么是美的，什么是丑的），但如果要AI真正实现原创、实现AI原生的美学，AI就必须具备对作品原生的判断。

但这是超级难的事情。所谓AI就是对人类智慧运作的一种体外模拟，但对于“灵感”“美感”“风格”“心灵共鸣”等人类典型的思维现象，即使现代心理学、文艺学也没有找到明确的论证，遑论指导和训练机器去做这些事情。

但是，人类毕竟是聪明的，科学家们注意到，即使是艺术天才如莫扎特那样7岁就能作曲，也有从模仿到学习，再到原创的过程。而模仿和学习，正是机器的强项。

又有人提出观点——为什么诗歌创作从唐代起就一直在走下坡路，一种猜想是，在严格的规则限制（如格律）下，人类对几千个文字的组合创新越来越重复，所以优秀的新作也越来越难出现。

但AI的强项是可以瞬间进行几千万种组合的尝试，那么，也许在足够多次的重合过后，有一个AI程序可以跃迁式的超过奇点，开始迈入原创的天地。而其独特的内容创作模式，或许也会形成一个独特的流派——AI派内容。