日报&周刊合集 | 生产力工具与行业应用大全 | 点赞关注评论拜托啦!
软件:midjourney & Stable Diffusion
模型:moonmix_utopia
人物lora: 老婆真人
后期:PS
Steps: 50, Sampler: DPM++ 2M SDE Karras, CFG scale: 7
随着AI技术不断发展,诸如Midjourney 和 Stable Diffusion 等工具生成的图片质量已经非常高了!在AI创意二维码、文字、证件照之后,AI创意写真也火爆了起来~
以这套「荷叶罗裙一色裁,芙蓉向脸两边开」的古风人物摄影为例。这些完全由AI生成图片,精美的服饰、优美的姿态、优雅的布局,使得照片非常逼真且极具美感。可见,当前的AI算法已经能捕捉并重现复杂的艺术细节,这对依赖传统服装、妆容来打造古风照片的摄影行业无疑是个巨大的冲击 ⋙ 小红书
7月24日,Runway 宣布 Gen-1 和 Gen-2 已经完全开放,任何人都可以注册一个账号免费尝试。需要说明的是,Gen-1 和 Gen-2 是 Runway 研发的两代AI生成系统:
Gen-1是第一代系统,可以实现各种图像到图像、文本到图像等生成任务,如文字换脸、视频背景替换等
Gen-2是新一代系统,实现了文本到视频的生成,只需要文本描述就可以生成逼真的视频,并且图像生成质量也有了大幅度提高,可以生成更高分辨率和更逼真的图片 ⋙ Runway官网
在线试玩:https://clipdrop.co/stable-diffusion
7月27日,Stability AI 宣布推出最新的图像生成模型 Stable Diffusion XL 1.0,开源版本可在 GitHub 上获取。
Stable Diffusion 是目前全球使用最广泛的开源文生图模型。本次推出的 Stable Diffusion XL 1.0,是对早期 SDXL 0.9、SDXL Beta 和流行的 V1.5 模型的改进,也是当前图像生成领域最好的开源模型。
如图所示,SDXL 基础模型的性能明显优于之前的变体,并且与细化模块相结合的模型实现了最佳的整体性能 ⋙ 公告 | GitHub
目前,使用AI技术生成视频的工具已经非常多了!这篇文章总结了当前的18种主流方法,并附上了相关教程,非常全面了~
方法一:图片转视频双雄
Runway
Midjourney
方法二:文字生成视频三强
Runway Gen-2
Pikalabs
Zeroscope
方法三:使用Midjourney图片生成视频
制作3D全景视频
利用变形功能制作视频
使用Pan功能生成视频
使用Zoom Out功能制作一镜到底视频
方法四:使用其他AI软件创作视频
Runway frame interpolation
Genmo
Wonder Studio
Stable Diffusion
Gen-1
ControlNet
Kaiber
Deforum Colab ⋙ 今说新语
这是一篇极速操作指南,结合代码案例演示了如何使用 Hugging Face 库对 Llama 2 模型进行微调 (fine-tuning),使其成为一个对话摘要生成器,对于 Llama 模型的实际使用具有很好的参考价值。
Download the model:通过 clone Llama 的 inference repo 来下载 Llama 2 的7B模型,并组织好目录结构,准备接下来的转换和训练;这一步获取了基础的Llama 2模型
Convert model to Hugging Face format:使用提供的转换脚本,将原始的 Llama 2 模型转换为 Hugging Face 的格式,方便后续通过 Hugging Face 的 API 进行微调;这一步实现了模型格式的转换,为 fine-tuning 做好了准备
Run the fine-tuning notebook:基于 Hugging Face 的 transformers 库,作者编写了一个 nNotebook,内含了数据集准备、模型加载、设置训练参数等代码,可以直接运行进行对话摘要任务的微调;这一步完成了对话摘要模型的训练
Run inference on your fine-tuned model:由于 Hugging Face 仅保存 adapter 权重,所以需要将经过微调的权重加载到完整 Llama 2 模型中,然后就可以进行推理和生成对话摘要了;这一步实现了利用微调过的模型进行下游任务 ⋙ @Sam L’Huillier
这篇文章的观点很有意思!AI技术和产品的爆发,非但不会取代人类员工,反而会赋能人类,提升工作效率和产出。BUT!个人效率的提升可能会导致企业的进一步压榨。整理下文章核心要点:
- 变化,不是替代
- 历史上,被认为会取代人类的新技术,往往只是改变并增强了人类,AI也将是如此
- AI在工作中的应用
AI可以增强各个团队的工作效率和产出,例如市场营销、销售、支持、产品和工程等
AI释放人力去处理更复杂和关键的问题,也能使游戏的员工更出色
- 故事将走向何方
AI提高个人效率的结果,可能是公司对员工劳动力的进一步压榨;但这是企业文化的问题,而不是AI技术本身的问题
AI浪潮提高了对员工能力和产出的期待,员工需要积极适应变化,并随着时代一起成长 ⋙ 阅读原文
Niji 官方最近推出了系列免费的绘画课程 Niji Academy ,将艺术基础与AI技术相结合,补上绘制一张优秀图像所需要的绘画历史、审美熏陶、基础理论等「必修课」,带领读者丝滑进入艺术的领域。
抄写别人已经写好的提示词再缝缝补补,很难真的学会AI绘画。只有见过足够多美的、好看的东西,掌握最基本的原理与基础,才能自己绘制出美图。
目前官网更新了两节课程,但是只有英语和日语版本。幸好!歸藏进行了内容翻译,链接一并附上!一起来刷课呀!
https://sizigi.notion.site/Lesson-1-Fundamentals-of-Measurement-and-Abstraction-The-Theory-of-How-to-Draw-Everything-0833708fbe044f6a9f37d4357d25f32e
一切之理论 (为何一切都是美) :这部分讲述了为什么左图不是「真正的艺术」,右图又为什么「无聊」,提出要找到一个包罗万象的艺术理论
为什么它值得在博物馆里展出? 这部分通过比较乔托的画作和同期的文学作品,说明语言是组织口头信息,艺术是组织视觉信息;当一个想法被良好传达时,不管传达方式,美都会涌现
意外的文艺复兴:这部分提到了一个reddit社区,探索具有古典感觉的各种艺术作品,说明组织概念对各种媒介都适用
视觉抽象:这部分通过对句子进行逐步抽象来说明抽象的过程,并给出抽象程度不同的图像例子,说明艺术家需要给予观众足够信息,让他们自己想象
说服观众相信真相:这部分比较了现实主义和抽象主义这两种辩证方式,以及它们之间的恐怖谷效应
那么对于超抽象的东西呢:这部分分析了超抽象艺术难以理解的两个原因,并说明不要过于关注风格,应该学习组织视觉信息的方式 ⋙ 中文学习笔记
https://sizigi.notion.site/Lesson-2-The-Terminator-Line-459ceabed46c42fb9b9eeebb8df57354
建立视觉层级:这部分举了拉斐尔的画作为例子,说明使用简单和复杂的区域驱动观看者的视线,形成焦点
当你有不止一个焦点时会发生什么? 这部分给出了两个焦点竞争视觉优先级的例子,说明焦点的相对层级关系
当你没有焦点时会发生什么? 这部分给出一个没有焦点的博斯画作为反例,解释这样的画需要仔细观看才能理解
全能的明暗交界线:这部分介绍了使用明暗交界线来组织图像的方法,在亮和暗两个区域划分细节
边缘光,终极明暗交界线:这部分展示了边缘光效果作为明暗交界线应用的极致形式
控制细节的层次:这部分总结了组织图像的第一步是划分光和影,一切都始于光和影的划分,你可以从明暗交界线看到整个画面 ⋙ 中文学习笔记
这是一篇非常「硬核」的飞书文档,面向非科班出身但想要了解AI技术原理的受众,帮助实现零基础入门大语言模型 (Large Language Mode, LLM) 底层技术原理。
文档从浅到深,覆盖了非常多内容细节,并在持续更新 LLM 最新技术进展及相关原理!如果你对ChatGPT等大语言模型感兴趣、希望入门了解大语言模型这件事、想知道这个世界上正在发生什么,那这篇文档值得放入你的收藏夹~
Introduction:人工智能概述
入门 | 多层感知器 Multiple-Layer Perceiver, MLP
入门 | 卷积神经网络 Convolutional Neural Network, CNN
入门 | 循环神经网络 Recurrent Neural Networks, RINNS
入门 | 强化学习 Reinforcement Learning, RL
入门 | 自然语言处理与语言模型 NLP & LanguageModeI, LM
开始进入正题!seq2seq模型与注意力机制 Attention! (2014)
RNN 时代的 BERT 和 GPT!Semi-Supervised Sequence Learning:怎么用大量无标注样本去做自监督学习? (2015)
欢迎来到芝麻街家族!图解ELMo:Embedding的新纪元 (2018.2)
Attention is All You Need!大语言模型的基石 Transfoormer (2017)
ULM-FiT 与多任务学习 Multitask Learning:NLP的 ImageNet 时刻 (2018.5)
它来了它来了,终于等到你!大篇幅详解 GPT,GPT-2 与 GPT3
预训练语言模型的新范式:Prompting!
为什么它诞生之初远比 GPT 出风头?图解芝麻街家族新员BIERT!(2018.10)
回看波澜壮阔的语言模型乃至 NLP 的发展史! ⋙ 飞书文档
感谢贡献一手资讯、资料与使用体验的 ShowMeAI 社区同学们!
◉ 点击 日报&周刊合集,订阅话题 #ShowMeAI日报,一览AI领域发展前沿,抓住最新发展机会!
◉ 点击 生产力工具与行业应用大全,一起在信息浪潮里扑腾起来吧!