《可灵从零基础到精通》学习手册
一、可灵介绍
基本介绍
- 可灵大模型是由快手大模型团队自研打造的视频生成大模型,具备3D时空注意力机制,能模拟真实物理世界,转化用户想象为具体画面,并支持多种视频宽高比,适用于多样化的视频制作和内容创作需求。
- 该模型有移动端(快影app)和网页端
二、效果展示
一个戴眼镜的中国男孩在快餐店闭眼睛享受美味的芝士汉堡
三、可灵大模型特点
- 1.大幅度的合理运动:可灵采用3D时空联合注意力机制,能够更好地建复杂时空运动,生成较大幅度运动的视频内容,同时能够符合运动规律。
- 2.长达2分钟的视频生成:得益于高效的训练基础设施、极致的推理优化和可扩展的基础架构,可灵大模型能够生成长达2分钟的视频,且率达到30fps。
- 3.模拟物理世界特性:基于自研模型架构及Scaling Law激发出的强大建模能力,可灵能够模拟真实世界的物理特性,生成符合物理规律的视频。
- 4.强大的概念组合能力:基于对文本-视频语义的深刻理解和DiffusionTransformer架构的强大能力,可灵能够将用户丰富的想象力转化为具体的画面,虚构真实世界中不会出现的的场景。
- 5.电影级的画面生成:基于自研3D VAE,可灵能够生成1080p分辨率的电影级视频,无论是浩瀚壮阔的宏大场景还是细腻入微的特写镜头,都能够生动呈现。
- 6.支持自由的输出视频宽高比:可灵采用了可变分辨率的训练策略在推理过程中可以做到同样的内容输出多种多样的视频宽高比,满足更丰富场景中的视频素材使用需求。
四、移动端使用教程
1.下载快影app
- 此处与iphone为准,进行演示
- 打开 App store(安卓打开应用商店)并搜索快影,下载即可

2.打开快影app,并登录
- (1)进入app,点击我的
- 此处有两种方式登录,登录即注册。

- (2)其他方式登录
- 此处可以进行手机号、微信、QQ登录,推荐手机号登录

3.进入可灵大模型界面
- (1)点击AI创作

- (2)点击生成视频

4.文生视频
- 4.1进入文生视频界面
- 1.进入可灵大模型的文生视频界面

- 4.2输入提示词
- 2.输入文字描述

- 4.3设置参数
- 3.根据自己的需求设置参数即可,优先使用高表现

- 4.4生成视频
- 4.点击生成视频

- 5.等待生成视频

- 4.5查看效果
- 6.查看效果
5.图生视频
- 5.1进入图生视频界面
- 1.进入可灵大模型的图生视频界面

- 5.2上传图片并编写提示词
- 2.上传图片并编写提示词

- 5.3生成视频
- 3.点击生成视频

- 4.等待生成视频

- 5.4查看效果
- 5.查看效果
6.延长视频 可以将生成的视频进一步延长创作
- 6.1延长视频
- 1.选择要延长的视频,点击预览

- 2.点击延长视频

- 3.编写提示词

- 4.点击确认延长

- 6.2查看效果
- 5.查看延长后的视频

- 五、网页端使用教程
1、打开网贡版可灵
- 网址:https://klingai.kuaishou.com/

2、选择AI视频

3、文生视频
- 3.1输入提示词

- 3.2点击立即生成

- 3.3查看效果

4、图片生成
- 4.1上传图片和编写提示词

- 4.2点击立即生成

- 4.3查看效果

5、下载视频
- 生成好的视频可以进行下载,如图所示

6、延长视频
- 生成好的视频,可以延长原视频内容,操作如图所示

六、常见问题答疑
1、高性能和高表现有什么区别?
- 高性能:生成速度更快
- 高表现:画面质量更佳
2、为什么会有重新选择图片的提示?
- 可能是图片包含敏感信息,可能是图片格式不对,一般格式是jpg或者pn
七、测评效果
经过多次实践,得出以下几点评价(仅供参考,因为生成具有随机性)
- 1.相比于其他AI视频生成工具,可灵综合效果可以说是最好
- 2.在图生视频中,对于多人图片生成视频,容易造成人物脸部变形。
该文档及图片引用来源于广州沐瓜科技有限公司Gybbb的文档库《可灵从零基础到精通》学习手册
上一篇
人工智能赋能教育发展研究报告
延伸阅读:
知识库是怎么回事?知识库在大模型使用中扮演什么角色?
但很多同学对RAG在问答中扮演了什么角色,如何起作用的不是很清楚。创建知识库后,大模型真的会去学习知识库中的知识么?在这...
Markdown,json,mermaid
1.Markdown(MD)——简单好用的文本格式适合:写作、笔记、文档、博客Markdown是一种轻量级的标记语言,专...