在赛灵力位于黄埔区公司进门处,落地屏中“虚拟CEO”向来访者介绍公司发展情况。这就是赛灵力打造的数字人。
和以往不同的是,以ChatGPT代表的AIGC(生成式人工智能)技术突破,对虚拟数字人的智能化和交互能力有了新的突破,不仅能让虚拟人的外形更加精细、逼真,在语言交互方面也能更加自然、真实,还能自动生成对话脚本、角色台词等等。
在公司CEO付玟看来,大模型不是简单的对话框,数字人产业也将逐步迈入深水区,走向直播带货、虚拟客服、数字员工等多个应用场景。
(资料图片)
能导览会直播还是医生助手
自己和自己互动对话,听起来有些不可思议?赛灵力推出的“互动数字分身”,就可以实现人与“智能分身”的互动。
“第一次见面更多是程序性交互,未必会聊太多实质性内容。我的虚拟数字人就可以替我出场讲解;在企业管理中,虚拟数字人甚至还可以帮忙‘出席’一些大会。”付玟说,因为频繁出差,这个功能对自己来说比较实用。
作为一家虚拟数字人研发公司,在付玟看来,大模型算法增强了AIGC能力,用户可利用虚拟数字人AI模型批量生成AI视频。
例如,在文化领域,可以通过虚拟数字人技术制作的虚拟导览员,帮助游客更好地了解和学习文化遗产和历史。
直播带货已经成为一个热门赛道,但主播的时间是有限的,这个时候超写实虚拟数字分身就可以替主播上场,实现24小时不间断直播。
在医疗领域,付玟介绍,针对互动问答、线上问诊,患者可以和与医生“一模一样”的虚拟数字人先行沟通,让患者更有信任感。同时,虚拟数字人还可以辅助医生进行手术模拟、协助进行病理学诊断和分析等。
7月4日,赛灵力还发布一款针对生物领域的人工智能模型——“达尔文”大模型,它既可以用来辅助生物学基础科研工作,还能在基因组学、蛋白质组学、代谢组学等领域应用,帮助生物学家更好地理解生物分子之间的相互作用机制、进化规律和环境适应性,为生物学的研究提供新视角。
那么,在生命攸关的医疗领域,AI大模型可信度真的有多高?付玟对此解释,数字人可以提供到诊服务,到后期开方还是需要医生来确认,整个过程不是要取代真人,而是作为助手辅助真人,“很多时候病人需要的是安抚,当看到一个超写实的虚拟数字人与他对话,患者能感受到服务的专业性”。
敲开“元宇宙”大门
作为一家由清华珠三角研究院孵化的研发公司,赛灵力成立时间只有2年多,何以能入局AIGC数字人?
付玟对此介绍,赛灵力一开始瞄准的是元宇宙机遇,而元宇宙一个重要因素就是虚拟人。一开始,赛灵力聚焦的是数字人口播,用户拿它用来聊天互动——疫情防控期间,虚拟数字人成为不少主播的代替。
“但后来我们发现不够用了,用户希望的聊天互动,可以接入对话大模型,需要根据提问来生成答案,问题的回答能说到用户的心里去,说到底,还是需求在驱动。”付玟说。
相比于传统的2D表现方式,数字人在展现形象上具备的更高自由度,不仅体现在表情细微度更高、运动流畅度更优,也可以更好地满足现实场景中的交互需求,进一步强化了虚拟场景与真实场景之间的互通性。
2023年,元宇宙市场柳暗花明。Meta、苹果接连发布了自研MR(混合现实)头显产品。此外ChatGPT代表的大模型技术飞速走红,付玟认为,虚拟数字人成为元宇宙内容生态创建的关键一环。
再往前进一步,赛灵力希望实现“数字永生”,期望未来每一个家庭里面,能拥有一块比如穿衣镜,里面站着虚拟闺蜜等等,能与人形成互动,成为家庭虚拟成员之一,也希望家庭主人自己能站在风扇屏或者空气屏里面,或者站在客厅里面迎接家庭来客。
大模型将朝向小型化
作为一家初创型公司,何以能开发出大模型?付玟介绍,拥抱大模型将是趋势,并不需要面面俱到,而是发挥各家所长,从算力层面,赛灵力自己采购了不少物理硬件算力,并且也会与一些云供应商合作。
“我们拥有丰富的数据,尤其是生物科技领域数据,因为我们的控股公司就是全球最大的生物科技集团之一。”付玟说。
那么,大模型掀起“百模大战”,是因为门槛太低了?对此,付玟回应表,紧跟时代潮流只是一个表象,但本质在于,大模型能解决中小模型不能解决的问题。同样是写作,此前参数比较小,而借助大模型,ChatGPT可以写出一篇相对不错的文章出来。
再比如,AI过去也有写歌,但谱写出来的歌曲并不好听或者不够生动,而如今大模型则可以解决这个问题。
“大模型之大,不只是在参数够大、模型结构比较复杂外,还有一个关键因素是,历史的训练数据量也是超大型、超级多元的。”付玟说。
但他也认为,大模型不是万能的,比如在互动对话,用户希望问一个问题,大模型可以立马就回答,而现在要三五秒甚至要上十秒,背后计算非常耗时间和算力,此外,大模型对于一些答案是不可控的,甚至还会出现“口无遮拦”与“一本正经胡说八道”的有趣现象。
在他看来,尽管当下需要依赖大模型,并不会永远依赖,未来小模型也能逐步解决一些问题,或者达到大模型一样的效果,“正如第一代计算机是大型计算机,那时候没有谁能想象到,可以用一个手机装下;大模型在体积或者参数上也会降低,但具备的能力会持续下去”。
◎内容链接
动嘴即可改设计,人人都能做“甲方”|大模型冲击波
不争一时的腾讯,为何一口气发布50多个方案?|大模型冲击波
【文字】南方+记者 郜小平 实习生郭峻豪
【海报】吴颖岚 谭唯
【统筹】程鹏 郜小平
【策划】陈韩晖
【出品】南方产业智库
【作者】 郜小平;吴颖岚;谭唯
南方产业智库