日报&周刊合集 | 生产力工具与行业应用大全 | 点赞关注评论拜托啦!
这张进化图来自于论文 「On the Origin of LLMs: An Evolutionary Tree and Graph for 15,821 Large Language Models」,构建了一个包含15821个大型语言模型的进化树和关系图,以便探索不同的大模型之间的关系 ⋙ 论文
这是 Reddit 论坛 Midjourney 子区一个非常热门的讨论:判断上面两张图是 AI 生成的,还是真实拍摄的。根据经验我们几乎可以快速判定,这是AI生成的图片!
但如果让你说出几条理由,是不是就卡壳了?因为这跟真实世界的图片太像了!原帖评论区的大神们,给出了非常细节的判断依据,我们一起来学习下:
皮肤太平滑无瑕疵,看起来不自然
五官和面部特征重复率高,缺乏细微差异
牙齿、耳朵等部位存在反常的绘制错误
灯光和阴影不协调,不同方向的光源
背景物体透视对不准,存在失真
存在马赛克和图像边缘毛刺等制作瑕疵
衣服和背景缺乏质感和细节,图案和阴影不协调
衣服与身体相接的部分处理不自然,没有厚度和遮挡感
分辨率和清晰度比当时胶片摄影水平要高,而非胶片质感,缺乏胶片风格的磨砂质感 ⋙ Reddit @Midjourney
山东能源集团、华为公司联合发布盘古矿山大模型,将解决人工智能在矿山领域落地难的问题,引领矿山AI开发模式从作坊式向工厂式转变,为AI大规模进入矿山打下坚实基础。
作为AI大模型在能源领域的全球首次商用,山东能源、云鼎科技、华为在前期试点验证AI大模型赋能工业生产领域的基础上,正在开发和实施首批场景应用,涵盖采煤、掘进、主运、辅运、提升、安监、防冲、洗选、焦化9个专业21个场景应用 ⋙ 华为云
7月19日,阅文集团正式发布国内网络文学行业首个大模型「阅文妙笔」和基于这一大模型的应用产品「作家助手妙笔版」。
阅文妙笔大模型的知识储备能够覆盖情节内容、角色介绍、作品推荐、行业知识等,并在回答的准确度、全面性、提炼总结等方面表现出色,可以辅助阅文创作者完成创作。
阅文集团 CEO 兼总裁侯晓楠在致辞中表示,阅文妙笔是国内第一个网文大模型,也是最懂网文的大模型,将来会持续升级 ⋙ 阅文集团
Hugging Face 在7月8日至10日举办了「Open Source AI Game Jam 」在线AI游戏开发挑战赛。在经过48小时紧张开发和一段时间的评分之后,官网终于公布了比赛结果。而且!游戏在线可玩哦!
比赛共收到88个参赛游戏作品,其中81个游戏获得了共521次评价和打分,评价标准包括总体评价、有趣度、创造力和主题体现度。简单介绍下排行榜的前5名:
Snip It:一个剪刀石头布游戏,与AI对战 〖评分4.222〗
Yabbit Attack:一个兔子要吃萝卜游戏 〖评分4.167〗
Fish-Dang Bot: Rolling Laud:一个使用视觉和语音的机器人游戏 〖评分4.0〗
EVERCHANGING QUEST:一个不断变化的探索游戏 〖评分3.833〗
Word Conquest:一个占领字母地图的文字游戏 〖评分3.790〗
浏览了提交的81个游戏的信息,并进行了简单分析,可以看到:
▢ 游戏风格:多样化,包括了动作游戏、策略游戏、射击游戏、文字游戏等等
▢ 游戏机制:游戏在不同程度上使用了AI技术,比如自动对战、自然语言处理、知识图谱等
▢ 视觉风格:有使用像素风格的老游戏复古风,也有使用3D模型的次世代游戏
▢ 游戏主题:太空主题、幻想主题、动物主题、战争主题、文字游戏、探索主题等 ⋙ 比赛结果页面
这篇文章主要介绍了如何利用 MobileGPT 来掌握AI提示工程的技巧。如果你对生成式人工智能 (比如ChatGPT、Stable Diffusion等) 感兴趣,那这篇文章介绍的提示工程技巧,会帮助你成为文本生成和图像生成的大师!
需要注意的是,作者的示例演示使用了 MobileGPT,不过调用的依旧是 OpenAI 的 GPT 模型
MobileGPT 是一款移动端AI助理,可以将 OpenAI 的 GPT3.5-turbo和GPT-4 模型直接集成到 WhatsApp 中
以下是文章内容要点:
基础提示词需要包含以下两个因素
格式 Format
主题 Subject
想进一步完善,需要考虑以下因素
语气 The Tone:指定AI生成内容时要表现出的整体性格、态度或情感,有助于营造氛围
受众 The Audience:明确内容的预期接收者是谁,让AI能够相应调整内容
目标 Objective:阐明生成内容的预期目的或目标,给AI指明方向、要达成什么
角色扮演 Act As: - 指示AI在生成内容时担任特定的角色、观点或人格,会影响风格和措辞
背景信息 Background Information:为AI提供相关的上下文和细节以融入并引用在内容中
关键词 Keywords:指定内容中应包含的重要术语和词汇,确保关键话题表达出来
字数统计 Word Count:为AI的输出设置目标长度,有助控制整体范围
指导方针 Guidelines:给AI关于如何构造和组织内容的指示,能得到更好的输出
大纲 Outline:为AI提供内容的框架,有助塑造流程和结构
基础提示词需要包含以下两个因素
详细定义主题
定义受试者在做什么
详细定义背景图像
想进一步完善,需要考虑图像类型
真实感 Photorealistic:看起来像照片的图像
素描 Sketch:铅笔或木炭素描
水彩图像 Watercolor images
油画图像 Oil Painting images
点画 Pointillism:图像由彩色小点组成
卡通 Cartoon
动漫/漫画 Anime/Manga
波普艺术 Pop Art:具有大胆的颜色和图形形状
想进一步完善,需要考虑背景设置
工作室设置 Studio Setting:包括基本背景 (如白色、黑色或特定颜色) 与控制,专业光照,以及道具和模型
自然设置 Natural Settings:包括森林、山脉、海滩、沙漠、海洋和其他景观,光照条件可以从明亮的阳光到日落的柔和色调或月夜的冷色调
城市环境 Urban Environments:包括摩天大楼、忙碌街道、公园或郊区社区等,光照条件可以变化以模拟一天中的不同时间或天气条件
室内场景 Indoor Scenes:包括家庭内部、办公室、餐馆、学校、博物馆或任何其他类型的室内环境。光照可以调整,以配合典型的室内条件,如温暖的台灯或明亮的荧光灯的办公室
历史或虚构背景 Historical or Fictional Settings
抽象背景 Abstract Backgrounds:AI可以生成具有各种颜色、形状和图案的纯抽象或艺术背景 ⋙ 阅读全文
Paul Graham 是全球最早的线上软件 Viaweb 的联合开发者 (Viaweb 后被雅虎收购,成了今天的 Yahoo! Store),是硅谷天使投资公司 Y Combinator 创始人,持续在自己播客发表对于创业和科技行业的思考,在硅谷很有影响力。他的著作《黑客与画家》传播非常广泛。
Paul Graham 终于在7月发布了「How To Do Great Work (如何取得杰出成就)」这篇长文,全文多达两万字,是非常实用的工作指南。ShowMeAI 摘取原文中金句,全文非常值得一读!!
第一步是决定要做什么。我们所选择的工作需要具有三个特质:1) 我们对这件事有天赋;2) 我们对这件事有深深的兴趣;3) 这件事拥有取得杰出成就的空间
我们对什么有着「过分的」好奇心,「过分」到其他大多数人会觉得无聊的程度?那就是我们所要寻找的事
三个最强大的内在动机是好奇心、快乐和做出令人印象深刻的事情的欲望,当它们会汇聚在一起时,会成为最强大的组合。
大多数国家的教育系统都假装决定要做什么很容易,他们期望我们在知道某个领域真正是什么样子之前就做出决定;因此沿着最佳轨迹来看,一个有雄心壮志的人往往会被系统视为异类
杰出的成就,通常需要我们在一个问题上,花费大多数人认为超出了合理范围的大量时间
通过让思绪稍微漫游一下,我们经常能够解决那些无法通过正面攻击解决的问题
成为那个把事情做出来的人,而不是坐在背后提供复杂的批评的人;「批评很容易」在最字面的意义上是真的,而取得伟大成就的路永远不容易
当一个想法看起来既新颖又显而易见时,它可能是个好主意
在有效市场中,风险与回报成比例,所以不要寻求确定性,而要寻找高期望价值的赌注
经验给我们带来的最有价值的知识之一,是知道我们不必担心什么
不要依赖某个「看门人」给自己一个「大机会」,即使这是真的,得到它的最好方式是专注于做好工作,而不是追逐有影响力的人
我们有时可以从做得糟糕的事情中学到比从做得好的事情中更多的东西,有时只有当它缺失时,才能清楚地看出完满需要什么
取得杰出成就是一种深度优先搜索,其根节点是我们想成功的欲望
想要给别人留下印象是可以的,但要选择正确的人,我们所尊重的人的观点是信号;名声,也就是我们可能尊重或可能不尊重的更广泛群体的观点,只是噪音
如果我们问一个预言家取得杰出成就的秘密,预言家用一个词回答,我赌就是「好奇心」 ⋙ 阅读原文 | 中文翻译(全文)
Hugging Face团队推出了一门音频领域的图文课程「Hugging Face Audio course」,是一门涵盖音频领域Transformer全流程的实践性强的优质课程,迄今为止反响非常好!
课程内容覆盖了音频领域 Transformer 的各种应用,包括语音识别、音频分类、语音合成等。完成学习后可以掌握音频数据的处理方法,了解不同 Transformer 模型的架构,并利用预训练模型构建各种音频任务的模型。
课程已经完成了 7 个单元的发布:
处理音频数据 - 为处理音频奠定基础
音频应用简介 - 介绍了众多音频应用
音频的 Transformers 架构 - 讲解了处理音频相关任务时存在的不同类型的架构和设计
构建音乐流派分类器 - 实际操作教程,教你如何构建音频分类流程
语音识别 - 深入探索语音识别,并构建一个模型来转录会议记录
文字转语音 - 学习如何将给定的文本转换为音频输出
具体应用 - 构建真实世界的音频应用程序 ⋙ 学习链接
感谢贡献一手资讯、资料与使用体验的 ShowMeAI 社区同学们!
◉ 点击 日报&周刊合集,订阅话题 #ShowMeAI日报,一览AI领域发展前沿,抓住最新发展机会!
◉ 点击 生产力工具与行业应用大全,一起在信息浪潮里扑腾起来吧!