仅需3分钟视频,自动训练5小时,得到高质量数字人,效率10倍提升!看小冰技术框架是怎么实现的

图片
作者|格林     出品 | 新芒X
图片
让你分分钟造出一个自己的数字人来。
之前听到这样的宣传口号,其实是不怎么相信的。但是也有可能,要么是那种捏出来的卡通虚拟人,要么是只会动动嘴眨眨眼的"一眼假"数字人。
直到最近,使用了由小冰数字人框架驱动的技术方案,并从0到1生成出自己的专属数字人后,真切地打破了笔者的认知。
图片
一方面感受到现有数字人技术的成熟度,另外也享用着自己真身数字人带来工作效率的提升。
我们不妨通过以下原创视频来感受下。
接下来,我们试图从生成的全过程,和小冰技术能力角度,来进行详细分享,如果你也想拥有自己的专属数字人,最后我会附上联系方式。
从0到1生成自己的数字人总共分几步?
不知大家有没有这种发现,我们在刷直播间,短视频,甚至网上购物时,时不时的就会碰见数字人的形象。现在已经是遍地开花的状态和节奏。
图片
 微软公司CEO萨提亚·纳德拉认为,数字人技术具有帮助人类提高工作效率、创新和包容性的巨大潜力。但也需要开发人员秉持高道德标准和社会责任感来使用它。
那么如此高能的数字人,到底是怎么创作生成的?我们以笔者用小冰框架的数字人来做一个详细讲解。看完之后你会直呼原来定制自己的数字人真的一点也不难。
最开始,我们需要有数字人制作平台的权限,如果你也想开通制作属于自己的数字人,我后面会讲到。有了权限后,就会有一个数字人制作的后台,如下(在手机或电脑上均可操作)。
图片
整个定制过程,就是需要我们准备形象和声音素材数据。形象,即我们真人出镜的视频。
先看形象定制,需要录制视频、制作形象、配置入驻三个步骤。
图片
其中录制视频过程,平台会给到你很详细的指引和注意事项提示,看懂后,即可开始录制,也可以使用已经录制好的视频,直接上传,视频质量越高越好(1080p-4k)。所需时长在3分钟左右,不算长。
图片
录制完成并提交上传后,先有一个常规的初审,审核通过后,即可进入训练过程,所需时长在5个小时左右。
经过训练后,你就会得到一个专属的高度复刻还原的数字人形象。当笔者看到自己的数字人出炉后,虽然见识过很多数字人,但依旧很激动。
图片
形象定制完成后,就可以按照几乎同样的步骤来定制声音了。
图片
完成形象和声音的录制和训练,就完成后整个数字人定制的过程。就可以来进行入驻的工作,也只需要一个步骤就能搞定。
看完之后,是不是就会察觉到制作一个专属数字人,也没有那么复杂和高深?
图片
升级后的AI数字员工,基于小样本学习,用智能手机采集3分钟音视频数据,经过数小时训练,就能复现真实人类的容貌‍与声音。且视觉声音完全依靠CPU运行,能有效缓解市场上GPU算力供给不足和成本高昂的痛点。
笔者的数字人前后录制也就花了半个小时时间,其他的就交给后台自动训练和生成就行了,整个过程还是比较丝滑的。
更进一步,直接生成数字人播报视频成片
有了数字人的形象之后,我们就需要来安排他干活了。数字人,原则上可以做诸多事情,比如视频内容生产、资讯播报、电商直播,导购推荐、任务助理,品牌大使等。但用小冰的数字人框架,目前赋予了播报和语音生成,两项基础的能力。
图片
操作界面也比较简单,就是输入需要播报或生成语音的文案,在编辑相关的模版、字幕、背景、音乐等元素,完成后点击提交即可生成任务。最后即可一键下载到本地。
图片
可以根据需要分发至各大平台。
以上正是小样本数据即可定制专属数字人,并制作输出视频的整个过程。在笔者看来,整个过程是非常容易上手的。
如此高质量数字人,小冰是怎么做到的
在之前的印象中,定制数字人需要很专业的采集设备,专业的人员,很长的时间,以及高昂的费用。但是笔者使用的小冰框架的数字人解决方案,几乎将各项成本拉至极低,打破了有需求的普通人制作使用的门槛。
关于小冰公司,这里有一个背景是绕不开的,一个是网红数字人ip小冰,打出了“在亿万⼈之中,我只属于你”的口号,另外一个是微软背景。
小冰公司,源于微软亚太研发集团,2020年从微软完整分拆独立。2021年7月完成A轮融资,AI行业成长最快独角兽。
2022年11月完成A+轮10亿元战略融资,继续高速发展。拥有自然语言处理、计算机视觉、计算机语音、AIGC、大模型全栈能力。国内首倡AIBeing和AIGC,研发应用最早,已落地、可体验的商业价值案例最多。
图片
据了解,小冰的数字人具有不同的性格特征、态度观点、生物学特征、创造力、知识和技能,兼具情感交互能力、专业能力和内容生产能力,已被大众熟知,并应用在多个行业场景。
在真实的落地场景中,我们注意到,短视频播报和数字人带货直播领域,已经被广泛应用。 
图片
通过AI电商主播,可以7*24小时讲解产品,轻松讲解海量SKU,准确回答留言区问题,沉淀和提炼最佳运营实践;更重要的是,从价格促销型直播带货,升级为品牌价值型直播带货,让品牌主不再被头部主播绑架。
图片
此外,还有这样一个案例,笔者印象深刻。那就是万科集团引入的数字人形象崔筱盼,作为财务部催收专员,数字员工,基于流程和数据建模,结合小冰框架的整体能力,由她催办的预付应收逾期单据核销率达到91.44%。由于业绩突出,万科集团董事会主席郁亮在2021年底,颁给她“万科集团总部2021年度优秀新人奖”。
在今年4月份,小冰公司宣布了AI数字员工SaaS产品线最新进展。升级后的AI数字员工,采用大模型小样本技术,支持线上自助创建,以及真实人类的声音和形象复刻,能进行内容生产与实时交互。
升级后的AI数字员工,基于小样本学习,用智能手机采集3分钟音视频数据,经过数小时训练,就能复现真实人类的容貌与声音。且视觉声音完全依靠CPU运行,能有效缓解市场上GPU算力供给不足和成本高昂的痛点。
小冰的大模型技术也在此次升级中获得公开。升级后的AI数字员工能进行语音和文本实时交互,有多种对话模式,最佳效果与ChatGPT无异。可在网页(PC端+移动端)、公众号、APP、直播间、VoIP、线下装置落地,几乎覆盖了企业全部应用场景。
如何即刻拥有同款小冰框架数字人?
数字人的价值不言而喻,并且后期更会呈现井喷式发展。谷歌CEO桑达尔·皮查伊表示数字人技术的影响将是渐进和长期的,它能够辅助人类工作 而不是替代人类,让人类专注于更创造性的工作。 
笔者对使用小冰框架打造的数字人分身是很满意的。看完后,如果大家也需要用同款技术能力来创造自己的数字人,提高自己工作效率和业务想象力的话,我们公司和小冰的所属公司签订了战略合作协议,为数字员工标准化产品提供营销渠道和推广,为数字人的进一步普及,和客户效率的提升贡献一份自己的力量。
图片
有明确需要的客户,可以直接和我们联系对接(加下方微信或扫描二维啊,备注数字人),助力你和公司一步到位使用世界级的数字人能力。
定制数字人联络微信 623974966
数字人技术的快速发展,它对人类工作和生活方式产生了深远的影响。数字人在效率、质量、成本等方面表现出超过人类的能力,可以处理大量重复性工作,显著提升工作效率,还可以与人形成协同效应,大幅提升决策水平。总体来说,数字人是具有重要辅助人类作用的新兴技术形态。
当0与1取得生机,科技赋予代码以灵魂,数字人由此诞生,蕴含无穷空间。
----End-----
捕捉更多精彩科技风向标
欢迎关注旗下加V视频号【格林队长的AI大视野】
图片
专注「前沿科技」和「大公司商业秩序」
兼具内容品质和传播影响力
商务合作 & 广告:请联系微信 ▶15101138350
转载&投稿:请联系微信 ▶ 623974966
(注:部分图片来自网络,向原作者致谢,如侵权可后台私信处理)
近日独家文章推荐(点击图片即可进入▼)
图片
图片
图片
我们近日组建了「 新芒 @ AIGC & GPT Inside」社群,每天分享最新的AIGC、GPT、大模型、智能产品等最新动态。
目前百度、华为、微软、腾讯、商汤科技、出门问问、Face++ 、猎豹移动、物灵等顶级人工智能公司集结,如果感兴趣,可加微信:623974966,备注:新芒+单位和职位,符合条件,邀您加入。
图片