西配学术|戴清:关于AIGC赋能影视创作的思考

发布者:戏剧影视学院发布时间:2024-04-26浏览次数:10



中传戏文.

中国传媒大学戏剧影视学院戏文系




关于AIGC赋能影视创作的思考


作者

戴清,中国传媒大学戏剧影视学院教授、中国文艺评论家协会视听专委会秘书长


复旦大学中文系影视美学系列活动之一“AI艺术实践与未来影像发展”学术论坛,于202445日举行,本文为我院戴清教授参加此次学术论坛发言,经整理如下:


感谢杨俊蕾教授的邀请,十分荣幸能参加复旦大学中文系影视美学系列活动之一“AI艺术实践与未来影像发展”学术论坛。

没想到俊蕾刚才提到的Professor X竟然是艾伦·图灵先生,由这位人工智能之父致辞,你们这个创意实在太棒了,It's amazing!给我带来很大的冲击。图灵奖是数学、计算机类的诺贝尔奖,以数学天才、人工智能之父图灵之名命名,图灵的一生是传奇的,虽然只活了40多岁,但他对人类的贡献却是极高的,以他热情充沛的致辞开启我们的论坛,实在是既恰当又充满深意的。


AI艺术实践与未来影像发展”学术论坛海报截图


刚才听俊蕾教授介绍今天的发言顺序是由AI确定的,让我这个第一位发言人稍感心安。起初我以为是因我虚长几岁,让我先发言,颇为诚惶诚恐,因为在AIGC这个领域我实在是一个后学者,在此就自己新近调研、学习的一点心得向各位同行专家和同学们汇报,意在抛砖,以引后续真正专家的真知灼见之玉。AIGC本身是一个新领域,我们大家也都在学习探索中,我不揣冒昧以一孔之见跟大家交流、请教,也请专家和同学们多多批评指正。

AIGC,在虚构生成上具有通用性——文生文、图生图、文生图……具有极大的通用性。这种通用性在目前现实世界人工智能的开发应用中还难以实现,比如人工智能可以在餐厅中穿梭送菜,却离研制出管家保姆这样高级的机器人差得很远;在虚实结合——如人工智能与现实接触的物理界面层面,更是难以达到其通用性,如雷达、监控等人工智能覆盖都有其虚实结合面临的较大局限性。最难的则是完全硬件的开发吧,如芯片,其通用性就完全不可与AIGC虚构生成式的全面开花同日而语,这也是考量AIGC已有成绩的一个基本参照。有玩笑说人们本来指望AI做保姆管家,以便解放人们,有闲暇去写诗画画。没想到正好相反,AI小冰们在艺术创作上一发不可收,而管家保姆的琐碎烦杂工作却仍由人类充任。其原因正是由于管家保姆需要做太多协调衔接的工作。


图片来自网络


AIGCChatGPT运用自然语言,现在人们用自然语言就能向 AI提问,不再必须经由程序员的代码指令操控,这是巨大的技术飞跃,当它应用到日常生活中,必将是全面渗透性的。对编剧工作来说,也将成为一个极大的赋能与助力,人机协同、“人爱”(AI)合一将成为新的创作趋势,AIGC不仅能提高工作效率、降低成本,如这句英文所说的:AI-Generated Everything. (AIGX),也将极大地改变现在、未来几代人的教育模式,这个冲击是前所未有的。畏惧、逃避没有用,只有直面它,像AI一样进行深度学习,当然我们的学习速度肯定赶不上AI,就像人跑不过汽车一样,所以更需要我们了解和把握AI thinking(思维),善于给它提问题,实际上提出问题永远比回答问题更难更重要。


图源:该论坛会务组依照发言题目和嘉宾信息,使用DALL·E生成


同时,作为老师,我们要向学生学习,在对ChatGPTSoraAIGC模型、软件的学习把握上,年轻一代更有优势,老师在教学中也要帮助学生去修正、完善和解释AI提供的答案,实际上AIGC带来的变化将挑战教师的传统教学、提问与考核方式。AIGC在认知上有时候是有缺陷的,有学者将其称为“新常人”,即知识渊博,又不时暴露其认知之平庸,同时它也具有创造力智者的一面。它对人们的赋能是一定的,比如《繁花》电视剧播出时,我通过百度开发的国内版ChatGPT4.0——文心一言提问,请GPT进行评论。它啰里哆嗦了一大通,这里我只截取了一小段。从中,我们发现它的话语中相关性很强,但因果性和准确性都很不足,深入细致程度、特色把握都差得较远。但我们不能忽略此时GPT还没有读过原作,也不了解电视剧情节全貌,也就是说它还不占有新的数据和信息——专业大数据语料投喂不足,GPT缺乏训练、深度学习不够,包括它的智能程度还依赖于我这样一个使用者/用户对专业领域的理解程度以及使用AI的深度,显然GPT还有发掘的潜力空间。

AIGC的创造力是令人刮目相看的,它可以给我们启发,帮我们打开一扇窗,进入一个开阔的天地。AIGC的核心竞争力是它强大的学习能力和多样的学习形态,如所谓监督学习、无监督学习、强化学习和深度学习。在此,各类学习,并不是一个个单纯的名词,它意味着不同的算法、算力和大数据。


图片来自网络


AIGC模型包含着众多的子概念和流程环节,如多头自注意力、注意力权重、位置编码……如ppt中列出来的这些名词。作为非技术人员,我们可能不了解其创造机制和数学、计算机原理,但是我们已能够运用这种大语言模型,初步了解其编码器与解码器的功能,包括上千亿 token的作用,以及其奖励模型对AIGC选择性的肯定,以及通过知识库、小样本、思维链的提示,去减少AI给出答案的错误与不确定性。这方面,与围棋比赛中人工智能AlphaGo可以战胜李世石、孔捷等国际高手的辉煌相对比,AlphaGo更带有确定性与单向维度,而AIGC则更倾向不确定和多维度——尤其是复杂叙事的生成。因此AIGC可以为我们的创作赋能,而不会像围棋人工智能AlphaGo那样完胜人类。


图片来自网络


在创作上,编导演负责的是从01的策划、创意环节,人的灵感和创造力是第一位的,而从1-N 中的部分则可由AIGC负责实操,同时编导们要不断修正它的错误,有时候GPT也会正儿八经地胡说八道,有时它连影视剧的人物关系都会弄错。你指出来,它会非常谦虚地道歉,但后面可能还是不可避免错误,其实这和它掌握的语料不足有关系。

未来的影视创作中,人机协作是趋势,如编剧团队中有分工,成熟编剧负责提供01的策划和创意,年轻编辑则主要承担和AIGC的沟通工作,彼此协作,团队的效率会大大提高。目前GPT4.0版已经能够承担影视剧策划写作剧本之用,较快的话,一天或许能够达到四五万字——即长剧本三集多的体量,如果几个团队同时创作的话,效率多高,大家可以推想。当然,这个前提是编剧、编辑创意沟通水平都很高,对GPT的训练和高质量语料足够多。如果只追求效率,也可能只生产出一堆垃圾。当下ChatGPT的写作方式,有一种被称为“静态计划”模式,即把整个故事线都策划出来,再生成故事,就是说前期的工作很细致很扎实,情节的连贯性和丰富性也就更强。


图片来自网络


实践出真知,面对新事物,最好的学习方法就是去尝试,因此我也进行了一点儿小实践——我不是编剧,只是试着提出一个创意,稍后详谈。

一般而言,ChatGPT在写作、分析剧本方面有很多优长,关键在于编剧需要像程序员一样去了解它的思维特征,ChatGPT需要清晰的要求,也需要细分要求,还需要不断的细化深化、纠错补充,而不是一蹴而就。目前经典叙事结构比如金字塔结构、英雄旅程结构运用得较多。GPT可以针对剧本的人物、情节、结构、节奏、风格等方面进行创作。不仅写作高效率,还可以仿效多种文风,比如它的小说写作,可以模仿马尔克斯、玛格丽特·杜拉斯等作家的语言风格;悬疑推理影视剧创作,可以仿效阿加莎·克里斯蒂戏剧模式,以及变换视角呈现等等,这些都是AIGC的强项。这方面如果由编剧个人来完成会非常耗时费脑。其他流程工作,如制片需要根据某演员档期,集中安排拍摄该演员的戏,可以让人工智能(实际上excel统计也可以部分完成)去统一安排统筹,规划详细到各场戏涉及哪些场景、和其他演员的对手戏等。在管理上、创作上,人工智能的都可能发挥强大作用。


图片来自网络


为了了解、测试AIGC的创作能力,我在文心一言上设计了一个小创意(再次强调,我不是编剧,但我们每天都在看故事、琢磨故事),故事创意围绕影子爱人展开:每个人都有影子,故事当中的主人公——年轻人柳丛的影子是有灵魂的,她无条件地爱着柳丛。最终,影子爱人为了保护柳丛而消失了。从此,柳丛就踏上了对影子爱人的追寻之路。

我告诉AI这个创意后,它很快给我编了一个小故事,真的是让我非常惊喜,也让我对AI刮目相看。因时间有限,这里不祥细复述,只简要举例。

AI设计出一位神秘老者对柳丛进行提点:影子爱人其实是由一个古老魔法生成的。故事因此带有了很强的魔幻色彩。那么柳丛在追寻影子爱人的道路上都发生了什么呢?有怎样的艰难险阻?在这个基础之上,我又进一步给AI提了一些新要求,主要是为了扩充和丰富情节,生成的内容体量做一个微短剧应该够了。如柳丛和影子之间有哪些温馨的过往和微妙的默契?他们之间怎么互动?误解、闹别扭、解除误会之后的甜蜜是怎样的?柳丛后来在追寻影子爱人的路上,又遇到了哪些敌人?敌人当中,有和影子爱人非常相似的邪恶影子。在困扰时柳丛是如何进行辨别的?这方面我想到的其实是《西游记》中的六耳猕猴。最后,柳丛发现影子爱人消逝的真正原因是古老魔法规定的,她的灵魂是有大限的,这样就引向了一个魔幻浪漫主义的悲情结局;在此基础之上,青年和影子爱人之间实际上是自恋性的纳卡索斯情结,可以设计柳丛最终走出内心封闭,与影子爱人的分别成就了他的精神成长,这样故事就带有哲理思辨的色彩了。GPT持续给我带来惊喜,我一个不会编故事的人,在人工智能的协助下,居然创造了一个微短剧,AIGC算不算是给我赋能了呢?


图片来自网络


AIGC又岂止是给编剧赋能,我们说它对影视创作的全流程各环节而言,简直就是个全能助手。比如导演提出整体构思,AIGC可以在角色塑造、地域特色、制景等方面自动生成所需要的图像和模型。当然,当下由于普及性不够、成本高等原因,有些技术虽然能达到了,但成本上却不经济,还是无法全面实现,从未来趋势看,应该有很大的拓展空间和前景。目前在一些大制作中已有相当多的运用。概念图、分镜头的场景绘制、道具设计、舞台设计等工作,Mid journey软件就可以胜任。网上已经能看到非常多的演示,3D建模早就在用AIGC辅助了,比如《流浪地球》系列、《封神》等。后期的智能剪辑工作,字幕、色彩等也都能用AI来完成,刘德华年轻版本换脸换妆,大家都看到了;另外,当下艺人因各类原因导致的舆情风险较高,有AI的辅助,可以大大降低制片方遭遇艺人舆情问题时的损失。


图源:该论坛会务组依照发言题目和嘉宾信息,

使用Mid journey生成


摄影方面,从光化学显影、数字影像到AI助力摄影,这就像是为摄影机安上了透视眼,借助AIGC的预效果图,可以大大降低实际拍摄成本,找到最佳的拍摄方案、角度、造型、光影、色彩,追求最佳效果。当然前提仍然是需要有成熟的摄影师提出方案、通盘把握并了解熟悉Sora运作规律。


图片来自网络


在此我们也推荐一个英伟达深度学习培训中心的信息,经过深度学习(可能需要付费),未来你可能获得更多的职业选择机会。就像互联网给我们带来极大便利和创造力一样,AIGC赋能影视创作,也会有着巨大潜力,就看我们如何去培训和开发它。

同时,作为学术论题,我们也要进行一种延展性的反思。这种反思既是理论性的、文化层面的,也涉及当下的创作实践。首先,AIGC赋能影视创作有没有题材的优势和劣势,值得我们思考。目前AIGC剧本创作带有模板化特点,前面提到的经典叙事结构反复搬用,对ChatGPT的训练还需拓展拓深,充分开掘AIGC深度学习的能力潜力。语料,特别是优质语料需要不断丰富,可以预期AIGC会给我们带来更多惊喜,当然前提仍然依赖人类的高妙策划创意能力。目前,仅模仿经典叙事结构还远远不够,也容易造成创作门槛低、作品量高质低、扁平化发展趋势,会因此造成管理成本高企,这类问题常常与新事物相伴随,也是我们所忧虑的问题。


图片来自网络

 

其次,目前对AIGC语料的训练,偏重欧美文化内容方面,今后对AIGC的培训、语料投喂应加强中国优秀传统文化的体量分量;当然语料也应更具开放性,而不是因过多禁忌和限制而画地为牢——那样会限制AIGC的能力和潜力,和我们追求的影视创作高质量发展的目标是不匹配的。

再次,应思考,语料是不是无穷无尽的?有研究显示,高质量语料2026年即将耗尽,这个讯息是否准确?以及据说低质量语料将在2030-2050枯竭,低质量图像将在2030-2060枯竭。这些状况应引起我们的注意。目前仅中关村就有几十家公司致力于人工智能大数据集的开发工作,带有对大数据提前布局的意味,由此在发挥大数据优势的同时,开发成本较高是否会造成实际应用时的占有集中?如人们了解的,互联网发展过程就伴随着快速集中化趋势,也让我们不由得联想,人工智能的发展因资本投入更高会不会带来更强的集中趋势?从而阻碍创作平等,这也是我们忧虑的。


图片来自网络

 

其他问题如AIGC运用与开发中对语料版权的侵权问题,以及当AIGC以人机协同方式参与创作,是不是可以被视为创作主体?当然还有对AIGC道德伦理水平的要求——AI是很容易受语料影响、带偏的,也是容易被教坏的。那么由谁来确定AIGC的语料构成?以及怎么训练AIGC?这些问题可能对国家的文化安全有长久、潜在的影响,也是我们需要关注和思考的。

我的不成熟的思考就汇报到这里,请各位专家和学者们批评指正。


论坛介绍


人工智能(AI)技术的高速发展,引发了广泛关注。近年来,影视行业积极创新,中央广播电视总台联合上海人工智能实验室发布了“央视听媒体大模型”,加强艺术与技术之间的互动实践。复旦大学与阿里云等共同打造智能计算平台CFFFComputer for the Future at Fudan),是国内高校最大的云上科研智算平台,为研究者开拓前沿课题提供了新的算力支持。面对人工智能时代的新机遇和新挑战,“AI艺术实践与未来影像发展”学术论坛于202445日举行。为复旦大学中文系影视美学的系列学术活动之一,此次论坛邀请到了国内多家高校的学者代表,共同讨论高新技术转型升级的时代命题,包括:影视中的AIAI技术应用和未来影像发展。与会专家学者们共同关注艺术与技术的互动融合,思考影像文化的未来走向。



附:关于生成式人工智能

应用于我校在校生学术实践的提醒


同学们需认识使用生成式人工智能等新技术开展毕业论文(设计)的局限性、风险性,包括但不限于生成式人工智能可能产生的信息不准确、缺乏创新性等问题,以及由此可能引发的学术不端风险,

生成式人工智能在毕业创作中的使用规范,应包括但不限于:

1)不得将人工智能列为成果共同完成人,不得使用生成式人工智能直接生成选题。

2)遵循相关法律法规及学术规范,依规合理使用生成式人工智能处理文字、数据或学术图像,防范伪造、篡改数据等风险。

3)不得直接使用未经核实的由生成式人工智能生成的参考文献。

4)须明确披露是否使用生成式人工智能(情况说明表有相应模板,点击原文可下载)。如使用,须详述使用方式、细节,包括模型/软件/工具名称、版本及使用时间。涉及事实和观点引证的辅助生成内容,须明确说明其生成过程,并同时在毕业论文(设计)相应位置具体标注,确保真实准确和尊重他人知识产权。

5)如同学在“情况说明表”中未按照实际情况予以说明,视为违规行为,应给予相应惩处。


转载自“中传戏文”公众号