| 手把手教你用 可灵AI 做 AI 数字人!
					当前位置:点晴教程→知识管理交流
					
					→『 技术文档交流 』
					
				 
 什么是数字人?怎么做数字人? 说白了,就是创建一个自己的克隆人,只需输入文案,就能生成自己说话的视频。 那今天,我将手把手教你使用数字人工具,让你无需露脸就能轻松做出自己的数字人。 
 打造数字人总共只需两步,接下来我将分步骤为大家拆解其底层逻辑。 
 第一步,要让数字人动起来;第二步,则是让数字人对口型。 
 对于第一步“动起来”,我们可以借助可灵 AI,因为它的动态生成效果既稳定又真实。  
 这里有三种实现方式: 
 第一种 使用可灵 AI 的文生视频功能。 可灵:https://klingai.kuaishou.com/ 
 点击这个功能后,我们可以选择参考人脸。(这个功能只能铂金会员以上才行) 
 
 
 比如,我想使用自己的人脸,就直接选择“羊羊”,不过需要提前录制好自己的人脸素材。 
 在左上角的创意描述区域,使用“羊羊”的人脸,并进行详细描述, 
 
 
 像“我作为一个博主,眼神是怎样的,背景是什么样子,动作有哪些,整体画面风格如何”等。 
 描述完成后,填入不希望呈现的内容,如变形、扭曲、毁容等, 
 
 
 然后点击“立即生成”, 
 就能得到一个以我的人脸为主,动作稳定的视频。我们可以利用这个视频进行后期的对口型操作。 
 第二种 方法是采用图生视频的方式。 
 比如,我们先获取一张生成的图片,像我在这里截一张图,将其上传到这个位置后,在创意描述处输入我们期望图片会呈现怎样的动作。 
 
 
 这种图生视频方式的好处是什么呢? 
 一个是图片美观,背景也能随心设定,可控性很强,二是还能更精细地控制动作。 
 第三种 方式是自己拍摄。 
 自己拍一张照片,然后上传到可灵 AI 的图生视频中。 
 
 
 接着在图片创意描述处输入相关描述,比如让人物动起来,描述其眼神状态等。 
 不过建议大家尽量让动作缓慢些,人物动态效果不要太强烈。毕竟人正常面对镜头说话时,动作幅度不会特别大,而且动作幅度太大容易出现手指变形的 bug。 
 
 
 上传照片并完成描述后,点击“立即生成”,就能得到我们想要的视频。 
 这就是第一步,让数字人形象动起来。 
 接下来进入第二步——对口型。  
 对口型有两种方式, 第一种 是我们可以直接使用可灵 AI 的对口型功能。 
 
 
 点击“对口型”后,在左边上传视频,配音音频有文本驱动和声音驱动两种方式可选。 
 
 
 如果选择 文本驱动,还能挑选音色,输入想说的文本就能生成数字人讲解这段话的视频。 
 但不足之处在于,尽管音色选择多样,却无法使用自己的声音,难以达到与本人声音一模一样的效果。 
 不过对口型也有好处,我们可以选用他人音色,说不定会更加悦耳动听。 
 对口型还有 声音驱动 这种方式,我们能上传一段自己的音频,可灵 AI 支持 MP3 等常见音频格式。 
 上传音频后即可直接生成视频。 
 不过,可灵 AI 每次仅支持生成 5 秒的片段。 
 我们可以通过变速将音频尽量压缩至 5 秒以内,但这并长久之计,比较适合制作短口播视频、短数字视频,或者将多个片段组合起来使用。 
 第二种 方式,我们还可以使用 必火AI工具。 必火AI:https://www.bihuoai.com/login/7i1cN6 
 它的优势在于能够进行形象克隆和声音克隆,且生成效果较好。 
 下面来看看具体操作流程: 
 首先,上传视频以克隆数字分身,将前面可灵 AI 生成的动态视频上传; 
 
 
 接着,在声音克隆处克隆自己的声音; 
 
 
 最后,在数字分身板块进行创作,若采用文本驱动,输入想要数字人说的话,选择自己克隆好的声音,点击提交,就能生成一段数字人视频。 
 
 
 若采用音频驱动方式,上传自己的一段声音,同样可以生成数字人视频。 
 
 
 总体而言,最关键的就是这两步: 
 先生成一段动态视频,再让这段动态视频完成对口型操作, 
 这样一来,我们想要的数字人视频便制作完成了。 现在的 AI 时代,真的是减轻了人很多的工作量, 一天做 100条 口播的数字人时代真的来了。  阅读原文:原文链接 该文章在 2025/3/4 11:02:04 编辑过 | 关键字查询 相关文章 正在查询... |