人工智能学家

2023将至，Bengio等大佬年度展望！懂理性的AI模型要来了？

来源：新智元

【导读】2022年对AI来说注定是不平凡的一年，这不吴恩达、Bengio等一众圈内大佬在接受DeepLearning.ai的采访中都展望了2023年AI的发展趋势，还分享了自己的科研小故事。

还有1天，2022年就要过去了。

此前我们报道了吴恩达的2022年终盘点，辞旧迎新之际，Bengio等一众AI大佬们在DeepLearning.ai聚在一起，展望了自己眼中的2023年。

Yoshua Bengio：寻找具备理性的AI模型

过去，深度学习的进展主要是「大力出奇迹」：采用最新的架构，提升硬件，扩大算力、数据和规模。我们是否已经拥有了我们所需要的架构，剩下的就是开发更好的硬件和数据集，以便我们能够继续扩大规模？现在还缺什么吗？

我认为是缺的，我希望在未来的一年里能找到这些缺失的东西。

我一直在与神经科学家和认知神经科学家合作，研究最先进的系统和人类之间的差距。简单地扩大模型规模并不能填补这种差距。相反，在目前的模型中建立一种类似于人类的能力，来发现和推理高层次的概念和它们之间的关系，可能会让差距变得更大。

考虑一下学习一项新任务所需的例子数量，即所谓的「样本复杂度」。训练一个深度学习模型玩一个新的视频游戏需要大量的游戏玩法，这些玩法对而人类而言，可以很快学会。但计算机需要考虑无数的可能性，来规划一条从A到B的高效路线。而人类则不需要。

人类可以选择正确的知识片段，并将这些片段贴合在一起，形成一套相关的解释、答案或计划。此外，给定一组变量，人类非常擅长确定哪些是原因，哪些是结果。而目前的人工智能技术在这个能力上还无法接近人类水平。

通常情况下，AI系统对生成的答案和方案的正确性高度自信，即使实际上是错误的。这个问题在文本生成器或聊天机器人这样的应用中可能是一些很有意思的笑话，但换到自动驾驶汽车或医疗诊断系统中，却可能威胁到生命。

目前的AI系统的行事特征，部分原因是它们就是被设计成这样的。比如，文本生成器的训练只是为了预测下一个单词，而不是建立一个内部数据结构，也不必说明所操作的概念以及它们之间的关系。

但我认为，我们可以设计出能够追踪事情背后的意义，并对其进行推理的AI系统，同时仍能发挥当前深度学习方法的众多优势。这样就可以解决从过度的样本复杂性到过度自信的不正确性等各种挑战。

论文链接：https://arxiv.org/pdf/2111.09266.pdf

我对「生成流网络」GFlowNets很感兴趣，这是我们团队一年前开始的一种训练深度网络的新方法。这个想法的灵感来自于人类通过一连串步骤进行推理的方式，在每一步加入新的相关信息。

这就像强化学习，因为模型是按顺序学习政策来解决问题的。它也像生成式建模，因为它可以对解决方案进行抽样，以对应于进行概率推理。

如果你想到一个图像的解释，你的想法可以转换成一个句子，但它不是句子本身。相反，它包含关于该句子中的概念的语义和关系信息。一般来说，我们把这种语义内容表示为一个图，其中每个节点是一个概念或变量。

我不认为这是唯一的解决方案，我期待着看到多种多样的方法。通过多样化的探索，我们将有更大的机会找到目前AI领域缺失的东西，，弥补当前人类和人类水平的AI之间的差距。

Yoshua Bengio是蒙特利尔大学计算机科学教授和Mila-魁北克人工智能研究所的科学主任。他与Geoffrey Hinton和Yann LeCun一起获得了2018年图灵奖，以表彰他对深度学习的突破性贡献。

Alon Halevy：个人数据时间轴

Alon Halevy是一位以色列裔美国计算机科学家，也是数据集成领域的专家。他从2005年到2015年担任谷歌的研究科学家，负责谷歌数据融合表。

他是ACM会员，并于2000年获得美国总统奖 (PECASE)。他还是科技公司Nimble Technology（现为Actuate Corporation）和Transformic Inc.的创始人。

在对2023年的展望中，Halevy聚焦于个人数据时间轴（personal data timeline）的构建。

公司和组织如何使用用户数据？这一重要问题在技术圈和政策界都受到了广泛关注。

2023年，还有一个同样重要、值得更多关注的问题：作为个人，我们如何利用生成的数据来改善我们的健康，增加活力和生产力？

我们每天都在生成各种数据。照片捕捉我们的生活经历，手机记录我们的锻炼情况和位置，互联网服务记录我们的消费和购买内容。

我们还会记录各种愿望：想要前往的旅行和尝试的餐厅、计划欣赏的书籍和电影，以及想要进行的社交活动。

不久后，智能眼镜将更细致地记录我们的种种体验。然而，这些数据分散在许多应用程序中。为了更好地总结过去的经历，我们需要每天从不同应用中整理过去的记忆。

能不能把所有的信息都融合在一张个人时间表上，帮助我们朝着目标、希望和梦想前进呢？事实上，很久之前就有人有这样的想法。

早在1945年，美国科学家范内瓦·布什（Vannevar Bush）就设计了一款产品，称其为麦克斯储存器（memex）。90年代，戈登·贝尔 (Gordon Bell) 和微软研究院的同事构建了MyLifeBits，可以储存一个人一生中所有的信息。

但是，当我们把所有数据都保存在一个地方，保护隐私，防止信息被滥用显然是一个关键问题。

目前，没有一家公司可以拥有我们所有的数据，也没有存储我们的所有数据的授权。因此，需要通力合作，构建支持个人时间线的技术，包括用于数据交换、加密存储和安全处理的协议。

建立个人时间轴，有两个技术挑战亟待解决。

第一个挑战关于系统的智能问答。尽管我们在基于文本和多模态数据的问答方面取得了重大进展，然而在许多情况下，智能问答要求我们明确推理答案集合。

这是数据库系统的基础。例如，要回答「我在东京参观了哪些咖啡馆？」或者「我在两小时内跑了多少次半程马拉松？」，要求检索集合作为中间答案。而在目前，自然语言处理中还无法完成这项任务。

从数据库中汲取更多灵感，还需要让系统能够解释答案的出处，并判断答案是否正确完整。

构建个人时间轴的第二个挑战，是如何开发个人数据轴分析技术，以改善用户的生活质量。

根据积极心理学，人们可以为自己创造积极的体验并养成更好的习惯，以实现更好的发展。一个可以访问我们生活点滴和目标的AI智能体，可以及时提醒我们需要完成和避免的事情。

当然，我们选择做什么取决于我们自己，但我相信，一个能够全面了解我们的日常活动，拥有更好的记忆力和计划能力的人工智能会使每个人受益良多。

Douwe Kiela：少点炒作，多点谨慎

Douwe Kiela是斯坦福大学符号系统的兼职教授。在剑桥大学完成硕士和博士学位后，Kiela分别在IBM、微软、Facebook AI担任研究员，并担任Hugging Face的研究主管。

在新年展望中，Kiela表达了他对人工智能系统发展的愿望。

今年，我们真正看到人工智能开始成为主流。像Stable Diffusion和ChatGPT这样的系统完全激发了公众的想象力。

这是激动人心的时刻，我们正处于伟大事物的风口浪尖：毫不夸张地说，这种能力的转变会和工业革命一样，产生颠覆性的影响。

但是在兴奋之余，我们应该警惕炒作，格外谨慎，以负责任的态度进行研发。

对大型语言模型而言，不论这些系统是否真的「有意义」，外行人都会将它们拟人化，因为它们有能力执行人类最具代表性的事情：产生语言。

但是，我们必须让公众了解这些人工智能系统的能力和局限性，因为公众大多认为计算机还是那种老式的符号处理器，例如，它们擅长数学但不擅长艺术，而目前情况却恰恰相反。

现代AI有项严重的缺陷，其系统很容易被无意误用或有意滥用。它们不仅会产生错误的信息，而且看起来非常自信，让人信以为真。

这些AI系统对复杂的多模态人类世界缺乏足够的理解，也不具备哲学家所说的「大众心理学」，即解释和预测他人行为和心理状态的能力。

目前，AI系统还是不可持续的资源密集型产品，我们对输入的训练数据和输出的模型之间的关系知之甚少。

同时，虽然模型扩展可以极大提高有效性——例如，某些功能只有在模型达到一定规模时才会出现——但也有迹象表明，随着这模型扩展，更容易出现偏见，甚至是更不公平的系统。

因此，我对2023年的希望是，我们能改善这些问题。对多模态、定位和交互的研究可以使系统更好地理解现实世界和人类行为，从而更好地理解人类。

研究对齐、归因和不确定性可以使AI系统更安全，更不容易产生幻觉，并构建更加准确的奖励模型。以数据为中心的人工智能有望展示更高效的缩放法则，更有效地将数据转化为稳健和公平的模型。

论文链接：https://arxiv.org/pdf/2007.14435.pdf

最后，我们应该更加关注人工智能持续的评估危机。我们需要对数据和模型进行更精细、更全面的测量，以确保我们能够描述我们的进步和局限性，并从生态有效性（例如，AI系统在真实世界的应用案例）的角度出发，理解我们从人工智能发展中真正想要获得的东西。

Been Kim：用科学研究解释模型

Been Kim是来自Google Brain的一名科学家，毕业于麻省理工大学，他的研究领域是交互式机器学习。

对于过去这一年里AI所展现的创造力以及取得的诸多成就，她在激动兴奋之余，也提出了自己对未来AI研究的一些看法。

对于AI来说，这是一个激动人心的时刻，在生成艺术和许多其他应用程序方面取得了令人着迷的进步，

虽然这些方向令人兴奋，但我认为我们需要从事不那么浮躁的工作，不光是AI能创造出更多东西，或是能设计出多大的模型：

回归基础并将研究人工智能模型作为科学探究的目标。

为什么要这么做？

可解释性领域旨在创建工具来为复杂模型的输出生成解释，帮助我们探寻AI与人类的关系。

例如一种工具采用图像和分类模型，并以加权像素的形式生成解释。像素的权重越高，它就越重要。例如，它的值对输出的影响越大，它可能就越重要，但如何定义重要性因工具而异。

虽然生成AI取得了一些成功，但事实证明许多工具的运行方式出乎我们的意料。

例如未经训练的模型的解释在数量和质量上与训练模型的解释无法区分，尽管产生相同的输出，但解释通常会随着输入的微小变化而改变。

此外，模型的输出与工具的解释之间没有太多因果关系。其他工作表明，对模型输出的良好解释不一定会对人们使用模型的方式产生积极影响。

期望和结果之间的这种不匹配意味着什么，我们应该怎么做？它表明我们需要检查我们如何构建这些工具。

目前我们采用以工程为中心的方法：反复试验。我们基于直觉构建工具（例如我们为每个像素块而不是单个像素生成权重，解释会更直观）。

论文链接：https://arxiv.org/pdf/1811.12231.pdf

图宾根大学的一个团队发现，神经网络看到的纹理（如大象的皮肤）比形状（大象的轮廓）更多，即使我们在解释图像时看到了大象的轮廓可能是以集体高亮像素的形式。

这项研究告诉我们，模型可能看到的不是形状，而是纹理，这称为归纳偏差—由于其架构或我们优化它的方式而导致的特定类别模型的趋势。

揭示这种倾向可以帮助我们了解模型，就像揭示人类的倾向可以用来理解人类的行为（例如不公平的决定）一样。

这种常用于理解人类的方法也可以帮助我们理解模型。对于模型，由于其内部结构的构建方式，我们还有一种工具：理论分析。

这个方向的工作已经在模型、优化器和损失函数的行为方面产生了令人兴奋的理论结果。有些利用统计学、物理学、动力系统或信号处理中的经典工具，许多来自不同领域的工具在人工智能的研究中还有待探索。

追求科学并不意味着我们应该停止实践：科学使我们能够根据原理和知识构建工具，而实践则将理念变为现实。

论文链接：https://hal.inria.fr/inria-00112631/document

实践也可以启发科学：在实践中行之有效的东西可以为科学结构化的模型结构提供参考，就如同2012年的高性能卷积网络激发了许多分析为什么卷积有助于泛化的理论论文一样。

Reza Zadeh：让ML模型主动学习

Reza Zadeh是计算机视觉公司Matroid 的创始人兼CEO，毕业于斯坦福大学，他的研究领域是机器学习、分布式计算和离散应用数学，同时也是 Databricks 的早期成员。

他认为，在即将到来的2023将会是主动学习腾飞的一年。

随着我们进入新一年，人们希望生成AI的爆炸式增长将在主动学习（Active Learning）方面带来重大进展。

这种技术使ML系统能够生成自己的训练示例并对它们进行标记，而在大多数其他形式的机器学习中，算法被赋予一组固定的示例，并且通常只能从这些示例中学习。

那么主动学习可以给机器学习系统带来什么呢？

适应不断变化的条件
从更少的标签中学习
让人们了解最有价值/最困难的实例
实现更高的性能

主动学习的理念已经存在了几十年，但从未真正流行起来。以前，算法很难生成供人类评估并可推进学习算法的图像或句子。

但随着图像和文本生成AI的大火，主动学习有望取得重大突破。现在当学习算法不确定其编码空间的某些部分的正确标签时，它可以主动从该部分生成数据以获取输入。

主动学习有可能彻底改变机器学习的方式，因为它允许系统随着时间的推移不断改进和适应。

主动学习系统不依赖于一组固定的标记数据，而是可以寻找新的信息和示例，以帮助它更好地理解它试图解决的问题。

这可以带来更准确和有效的机器学习模型，并且减少对大量标记数据的需求。

我对主动学习在生成AI的最新进展之上充满期待。进入新的一年，我们很可能会看到更多实施主动学习技术的机器学习系统，2023 年可能是主动学习真正腾飞的一年。

参考资料：

https://www.deeplearning.ai/the-batch/issue-177/?utm_campaign=The%20Batch&utm_content=233085322&utm_medium=social&utm_source=twitter&hss_channel=tw-992153930095251456

未来智能实验室的主要工作包括：建立AI智能系统智商评测体系，开展世界人工智能智商评测；开展互联网（城市）大脑研究计划，构建互联网（城市）大脑技术和企业图谱，为提升企业，行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

如果您对实验室的研究感兴趣，欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

Kubernetes 集群简介部署搭建及常用命令 GHY@CloudGuardian Kubernetes kubernetes 容器云原生运维 linux
Kubernetes集群简介Kubernetes（简称K8s）是一个开源的容器编排平台，用于自动化容器化应用的部署、扩展和管理。它为容器提供了一个完整的管理框架，帮助开发者和运维团队在大规模环境中高效地部署和管理应用。Kubernetes集群是由多个组件组成的，主要包括控制平面和工作节点。集群的核心目的是确保容器化应用的高可用性、可扩展性、负载均衡、自动化部署等功能。Kubernetes集群的基本
《独孤残缺》第一百一十六章：传国玉玺卧龙镇吟
韩萧萧只是从直觉上认为寂无名有问题，但是还说不出到底有什么问题，而最有话语权和可信度的人就是柳云烟，但是李默天暂时还不准备见她，他还没准备好要以什么样的心去接受她。如今寂无名又跟陵南王扯上了关系，不管慕容汐所言真假，就算真的是在借刀杀人，李默天都不能再对这个人置之不理。“背叛你！”李默天又问道：“你的意思是说寂无名只是你的人？”慕容汐也感觉自己表达有误，急忙改口，说道：“背叛我就是背叛组织。”李默
工作随感，收获宁静致远05
1.维护好自己的声誉和品质，一起配合，提供合理的建议，帮助，做好自己份内事。2.接受比对，真诚对待，态度不卑不亢。
超详细 Conda 指令详解---附有相应的示例
以下是所有conda指令的详细列表，并附有相应的示例超详细Conda指令详解环境管理命令condacreate：创建新环境condacreate--name[package_spec1package_spec2...]示例：condacreate--namemyenvnumpypandascondainstall：安装包到当前环境condainstall[--name][--file][--cha
仓库货物检测：基于YOLOv5的深度学习应用与UI界面开发 YOLO实战营 YOLO 深度学习 ui 目标跟踪目标检测人工智能
一、引言随着电商和物流行业的快速发展，仓库货物管理已经成为企业运营中至关重要的环节。为了提高仓库管理的效率和准确性，越来越多的企业开始应用自动化技术来完成货物的盘点、分类、分拣等任务。传统的货物管理方式通常依赖人工检查，不仅效率低下，而且容易出现误差。为了克服这些问题，利用计算机视觉和深度学习技术来实现仓库货物的自动化检测成为了一种有效的解决方案。本博客将介绍如何使用YOLOv5进行仓库货物检测，
2021-5-11晨间日记飞翔_8019
今天是什么日子起床：7:05就寝：23:32天气：晴天心情：好纪念日：昨天跟闺蜜聊天一个多小时叫我起床的不是闹钟是梦想年度目标及关键点：财富自由本月重要成果：理财投资学习今日三只青蛙/番茄钟1.读书2.日更文章成功日志-记录三五件有收获的事务1.不能自己欺骗自己，要实事求是能做多少，不能做多少，为什么做不了，要分析原因。不能太迁就自己。2.自己最近做事效率不高。要想办法提高效率。3.规定自己什么时
大前端几种开发语言对比 Fighting Horse 开发语言 flutter swift kotlin
项目概述语言特性备注基本类型BasicOperators整数、浮点数C++整数类型宽度不固定，如int，自动数值类型转换Java没有无符号整数，存在装箱Box类型C#Swift基本tuple类型KotlinT?是Box的支持原生类型数组IntArray等无符号整数是Beta的，通过内联类实现Dart运算符BasicOperators赋值、流程、算术、位、逻辑、关系运算符下标、后缀、前缀运算符三元条
【云原生】Helm来管理Kubernetes集群的详细使用方法与综合应用实战景天科技苑云原生K8S 零基础到进阶实战云原生 kubernetes 容器 Helm k8s k8s集群
✨✨欢迎大家来到景天科技苑✨✨养成好习惯，先赞后看哦~作者简介：景天科技苑《头衔》：大厂架构师，华为云开发者社区专家博主，阿里云开发者社区专家博主，CSDN全栈领域优质创作者，掘金优秀博主，51CTO博客专家等。《博客》：Python全栈，前后端开发，小程序开发，人工智能，js逆向，App逆向，网络系统安全，数据分析，Django，fastapi，flask等框架，云原生k8s，linux，she
什么才是成功？岳雪莲
今天想到这个问题，是因为前段时间孩子的比赛状态不好，他比较喜欢乒乓球，最近有很大进步，但是一到比赛就紧张的打不好球，往往以失败告终。那在我的思想里他这样的状态就是不成功的，有球却输了。孩子从小喜欢圆的东西，玩具也都是大大小小的球，四岁时就在篮球场把篮球能托到球筐里（我们那叫端马桶），到五岁时我们去社区玩，他看到乒乓球台，突然说我也要玩，于是第二天我们就带上球拍和球过去打了（我和他爸都会打打，但打的
以自我革命精神推进全面从严治党向纵深发展 uosuor
勇于自我革命是中国共产党最鲜明的政治品格，也是我们党最大的优势，党的二十大报告指出，全面从严治党永远在路上，党的自我革命永远在路上，决不能有松劲歇脚、疲劳厌战的情绪，必须持之以恒推进全面从严治党，深入推进新时代党的建设新的伟大工程，以党的自我革命引领社会革命。高度重视自身建设,不断进行自我革命。历史和实践表明,中国共产党之所以能够带领中国人民克服一个又一个艰难险阻,在战胜困难中不断成熟,不断从胜利
【泽宇读书会18】突发事件打乱所有计划，四大法则傍身，谁来也不怕！暴富的小青
阅读《高效能人士的时间管理课：不可不知的8项黄金法则》P46-61第四天，进度只有20页。我们经常经常会碰到这样一种情况：花了很长时间制定好自己的一份完美的计划清单。当准备重新开始美好的一天时，却发现自己办公桌堆满新的任务，工作如大海波浪，一波未平一波又起，而且每一波都会被注明是“紧急任务”，看看计划清单，再看看堆积如山的新任务，瞬间更加焦虑了。元亨利在《高效能人士的时间管理课：不可不知的8项黄金
我的十一假期，总算是结束了冷帅
我的这个十一假期是从9月30号开始的，从那一天开始，我几乎是在马不停蹄的赶场，只有一天是在家里睡的，搞得我整个人都疲惫不堪。和很多人一样，我国庆的第1天假期是给家庭的，走了三家亲戚，最后在爷家聚餐，然后我的弟弟妹妹又给这个大家庭添加了两位新成员，就是他们的男女朋友，而我作为在场的这一代人里，年龄最大的，却还是个单身，自然免不了受到上一辈人，言语上的各种“关心”。国庆节的第2天，我去参加了一场婚礼，
极限挑战：用知识蒸馏压缩模型，实时推荐系统在50ms内完成推荐
极限挑战：用知识蒸馏压缩模型，实时推荐系统在50ms内完成推荐标题极限挑战：用知识蒸馏压缩模型，实时推荐系统在50ms内完成推荐TagAI,知识蒸馏,实时推荐,模型压缩,技术挑战,高性能描述面对实时推荐系统必须在50ms内完成推荐这一极限条件，AI研发工程师团队在数据量从GB级飙升至PB级的巨大冲击下，展现出极高的技术实力和创新能力。团队通过引入先进的模型压缩和优化技术，成功在性能和精度之间找到了
2019-06-07 d0945092c1e5
烤全羊很多人都吃过，把一头小羊肉弄好之后绑上铁架子上烤，烤到外皮焦脆的时候吃，非常香！但是烤全牛你见过吗？前所未闻是大多数人的感受！在这大众创新万众创业的高频率发展时代，为了响应市场发展需求，牛匠专利烤牛炉应运而生。整只全牛烤制的震慑感，手撕大口吃肉的强烈满足感，令人们风靡于“烤牛”世界。你们从未想过要了解的烤全牛炉牛匠专利烤牛炉1.原创烤牛炉，填补空白市场：人无我有。做别人没有的，是商机、是特色
来自疫区的故事 4b24da36de2a
重症病房里的患者，大多已经病情严重，有些今天看着还好，明天却已经生死一线间。今天是建德姑娘、浙江医院ICU（一）护士叶蕾在武汉的第34天。武汉这座城被按下暂停键，而对叶蕾来说，生活给她按下的是快进键，大家像陀螺似的停不下来......ICU里的病人变得格外敏感：病房里的一静一动都关乎生死有一位患者，进入ICU的第一晚，血氧饱和度掉到90%以下，每一次呼吸都成了巨大的煎熬，上了呼吸机，病情暂时稳定了
Node+OBS直播服务器搭建总结马克关 Node教程直播 node obs
导语：最近研究了一下网页直播流的原理以及实现，现在就目前的实现方法做一个总结。目录直播流媒体协议拉流与推流Node服务搭建前端播放页面OBS推流配置直播流媒体协议先来了解一下基本的直播流媒体协议。http-flv,rtpm协议/特点开发者原理优点缺点http-flvAbode通过服务器把flv下载到本地缓存，然后通过NetConnection本地连接播放节省服务器消耗保密性差rtmpAbode通过
关于减肥我叫丁坚持
今天，好姐妹跟我在一起吃饭，哇塞，一见面发现好瘦啊，皮肤也很白皙，再一看这孩子吃饭，跟我确实差距很大，我是狼吞虎咽，人家是细嚼慢咽，这样看来过活的很粗糙啊……本来以为自己已经很不错了，有对比才有差距，隔以前的话，我会责备自己，为什么一而再再二三管不住自己的嘴巴，不过现在，我更愿意去问自己为什么会有这样的结果……其一：闭门造车，绝对行不通的；其二，遇到问题，冷静，然后想解决对策，怎样才能把优秀当成一
LeetCode 数据流中的第 K 大元素吴敬悦
设计一个找到数据流中第k大元素的类（class）。注意是排序后的第k大元素，不是第k个不同的元素。请实现KthLargest类：KthLargest(intk,int[]nums)使用整数k和整数流nums初始化对象。intadd(intval)将val插入数据流nums后，返回当前数据流中第k大的元素。示例：输入：["KthLargest","add","add","add","add","ad
KL散度：信息差异的量化标尺 | 从概率分布对齐到模型优化的核心度量
不对称性、计算本质与机器学习的普适应用本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、核心定义与数学本质KL散度（Kullback-LeiblerDivergence）用于衡量两个概率分布PPP和QQQ的差异程度，定义为：DKL(P∥Q)=∑x∈XP(x)log⁡P(x)Q(x)(离散形式)D_
亲子日记第九天康靖祺姑姑
2018年4月6日星期五天气阴转多云今天晚上吃过饭，问了康靖祺一些昨天作业上的知识，掌握的不是很好。这个学期开学以后数学学习直接下降了，两次都是80多，按理来说不应该这样。放假前发了一张试卷，出错率很高，有的直接没看懂题直接乱写，还有就是直接不会。今晚我问了一个15+15都答错了。他二姑姑还说早上说话口气太不行了，直接让他二姑姑闭嘴，我一听这话我就想起他妈妈训他的时候，除了闭嘴就是滚一边。家长是孩
Transformer：自注意力驱动的神经网络革命引擎大千AI助手人工智能 Python #OTHER transformer 神经网络深度学习 google 人工智能机器学习大模型
本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！从语言理解到多模态智能的通用架构基石⚙️一、核心定义与历史意义Transformer是由Google团队在2017年论文《AttentionIsAllYouNeed》中提出的深度学习架构，其颠覆性创新在于：完全摒弃RNN/CNN：仅依赖自注意力机制（S
[特殊字符] LLM（大型语言模型）：智能时代的语言引擎与通用推理基座大千AI助手人工智能 Python #OTHER 语言模型人工智能自然语言处理 LLM 大模型 Transformer
本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！从千亿参数到人类认知的AI革命一、核心定义与核心特征LLM（LargeLanguageModel）是基于海量文本数据训练的深度学习模型，通过神经网络架构（尤其是Transformer）模拟人类语言的复杂规律，实现文本理解、生成与推理任务。其核心特征可概
后来心之所向不负时光
后来呀雪孩子变成了白云白云变成了雨滴雨滴变成了花瓣花瓣变成了香气香气融化成你愉悦的心情而你变成我的妻我们一起变成了回忆变成水晶时间的匣子里晶莹的几颗泪点无瑕的几声笑语
想自己写个“规则引擎”？你得先学会解释器模式 java干货 Spring boot 解释器模式
你是否也曾深陷在解析自定义规则或命令的泥潭，为了处理一个类似(AandB)orC的简单查询，你的SpringBoot代码里充斥着复杂的字符串分割和层层嵌套的if-else，难以维护和扩展？是时候用解释器设计模式(InterpreterDesignPattern)来解脱了！这是一种行为型设计模式，它为一种语言定义一种文法表示，并提供一个解释器来处理这种文法。在SpringBoot中，当你需要构建一个
MAP最大后验估计：贝叶斯决策的优化引擎大千AI助手人工智能 Python #OTHER python 人工智能算法贝叶斯 MAP 概率论条件概率
融合先验知识与观测数据的概率推断方法本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、核心概念与数学本质MAP（MaximumAPosteriori）估计是贝叶斯框架下的参数估计方法，其目标为：最大化后验概率(P(\theta\midX))，即：[\hat{\theta}{MAP}=\arg\ma
MLE最大似然估计：数据驱动的概率模型参数推断基石大千AI助手人工智能 Python #OTHER 数据挖掘人工智能机器学习算法 MLE 参数估计概率论
从样本中还原未知分布的本质规律本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、核心思想与数学定义最大似然估计（MaximumLikelihoodEstimation,MLE）是频率学派的参数估计方法，其核心思想为：选择使观测数据出现概率最大的参数值。给定独立同分布样本X={x1,x2,…,xn}
HTML+CSS简单网页练习
前言运用了CSS进行简单的网页制作一、效果图二、HTML代码手机alert("欢迎—>"+prompt("请输入你的姓名")+"首页智能手机平板电脑配件服务支持关于尚合最新公告：尚合Aone智能手机入网证已经获工信部门审批下发。尚合官方新品发布新闻中心致歉公告首批尚合Aone已全部售罄！【媒体报道】国产高性价比尚合Aone四核手机评测我司产品已经通过了国家强制性产品3C认证尚合Aone智能手机入网
小Z思维，西方式幼儿教育小Z思维
中国的幼儿教育比较侧重促进幼儿的思想发展程度，习惯于依靠成人的聪明协助幼儿把握越来越复杂的思想方法，以及鼓励幼儿思索尽能够复杂的问题。西方的早期教育理念是，知识只要成为智力活动的推进力才具有价值。因此西方国家的幼儿教育更侧重于鼓励幼儿依靠本身聪明来发展本身才能，以及依靠本人的努力去发现周围的世界，逐渐丰富感性知识。成人的主要义务则是创造各种能给幼儿带来新感受的环境，以协助他们从各种感受中获取新知识
Flink 流处理的核心基石【时间语义、水位线、状态、检查点、反压】 csdn_tom_168 大数据 flink 核心时间语义水位线状态检查点反压
Flink流处理的核心基石【时间语义、水位线、状态、检查点、反压】，这些概念相互协作，构建了Flink高吞吐、低延迟、高容错的实时计算能力。以下是这些核心技术的深度解析及其内在联系：一、五大基石的内在联系驱动触发计算持久化保护恢复时间语义水位线状态管理检查点反压二、核心组件深度解析1.时间语义（TimeSemantics）核心作用：定义事件的时间维度//设置事件时间语义（关键配置）env.setS
2019.3.22 a71d1e6193ed
今天家庭聚餐，儿子没有拼命的转桌子，并能照顾表弟，表现越来越好。之前没事就转个不停，越不让他转，他转的越起劲。原来以为只要不吼他就行了，从来没想到态度不好也对他影响也这么大，之前说两句他不听，我就不好好说话了，各种责备。兴趣班回家的路上聊了好多，知道了他为什么不喜欢背书，原来在他一年级时，强迫他背书，埋下了厌恶的果子，还好知道了原因。继续好好说好，仔细聆听。
iOS http封装 374016526 ios 服务器交互 http 网络请求
程序开发避免不了与服务器的交互，这里打包了一个自己写的http交互库。希望可以帮到大家。内置一个basehttp，当我们创建自己的service可以继承实现。 KuroAppBaseHttp *baseHttp = [[KuroAppBaseHttp alloc] init]; [baseHttp setDelegate:self]; [baseHttp
lolcat ：一个在 Linux 终端中输出彩虹特效的命令行工具 brotherlamp linux linux教程 linux视频 linux自学 linux资料
那些相信 Linux 命令行是单调无聊且没有任何乐趣的人们，你们错了，这里有一些有关 Linux 的文章，它们展示着 Linux 是如何的有趣和“淘气” 。在本文中，我将讨论一个名为“lolcat”的小工具 – 它可以在终端中生成彩虹般的颜色。何为 lolcat ? Lolcat 是一个针对 Linux，BSD 和 OSX 平台的工具，它类似于 cat 命令，并为 cat
MongoDB索引管理（1）——[九] eksliang mongodb MongoDB管理索引
转载请出自出处：http://eksliang.iteye.com/blog/2178427 一、概述数据库的索引与书籍的索引类似，有了索引就不需要翻转整本书。数据库的索引跟这个原理一样，首先在索引中找，在索引中找到条目以后，就可以直接跳转到目标文档的位置，从而使查询速度提高几个数据量级。不使用索引的查询称
Informatica参数及变量 18289753290 Informatica 参数变量
下面是本人通俗的理解，如有不对之处，希望指正 info参数的设置：在info中用到的参数都在server的专门的配置文件中（最好以parma）结尾下面的GLOBAl就是全局的，$开头的是系统级变量，$$开头的变量是自定义变量。如果是在session中或者mapping中用到的变量就是局部变量，那就把global换成对应的session或者mapping名字。 [GLOBAL] $Par
python 解析unicode字符串为utf8编码字符串酷的飞上天空 unicode
php返回的json字符串如果包含中文，则会被转换成\uxx格式的unicode编码字符串返回。在浏览器中能正常识别这种编码，但是后台程序却不能识别，直接输出显示的是\uxx的字符，并未进行转码。转换方式如下 >>> import json >>> q = '{"text":"\u4
Hibernate的总结永夜-极光 Hibernate
1.hibernate的作用,简化对数据库的编码,使开发人员不必再与复杂的sql语句打交道做项目大部分都需要用JAVA来链接数据库，比如你要做一个会员注册的页面，那么获取到用户填写的基本信后，你要把这些基本信息存入数据库对应的表中，不用hibernate还有mybatis之类的框架，都不用的话就得用JDBC，也就是JAVA自己的，用这个东西你要写很多的代码，比如保存注册信
SyntaxError: Non-UTF-8 code starting with '\xc4' 随便小屋 python
刚开始看一下Python语言，传说听强大的，但我感觉还是没Java强吧！写Hello World的时候就遇到一个问题，在Eclipse中写的，代码如下 ''' Created on 2014年10月27日 @author: Logic ''' print("Hello World!"); 运行结果 SyntaxError: Non-UTF-8
学会敬酒礼仪不做酒席菜鸟 aijuans 菜鸟
俗话说，酒是越喝越厚，但在酒桌上也有很多学问讲究，以下总结了一些酒桌上的你不得不注意的小细节。细节一：领导相互喝完才轮到自己敬酒。敬酒一定要站起来，双手举杯。细节二：可以多人敬一人，决不可一人敬多人，除非你是领导。细节三：自己敬别人，如果不碰杯，自己喝多少可视乎情况而定，比如对方酒量，对方喝酒态度，切不可比对方喝得少，要知道是自己敬人。细节四：自己敬别人，如果碰杯，一
《创新者的基因》读书笔记 aoyouzi 读书笔记《创新者的基因》
创新者的基因创新者的“基因”，即最具创意的企业家具备的五种“发现技能”：联想，观察，实验，发问，建立人脉。第一部分破坏性创新，从你开始第一章破坏性创新者的基因如何获得启示：发现以下的因素起到了催化剂的作用：(1) -个挑战现状的问题；(2)对某项技术、某个公司或顾客的观察；(3) -次尝试新鲜事物的经验或实验；(4)与某人进行了一次交谈，为他点醒
表单验证技术百合不是茶 JavaScript DOM对象 String对象事件
js最主要的功能就是验证表单,下面是我对表单验证的一些理解,贴出来与大家交流交流 ,数显我们要知道表单验证需要的技术点, String对象,事件,函数一:String对象;通常是对字符串的操作; 1,String的属性; 字符串.length;表示该字符串的长度; var str= "java"
web.xml配置详解之context-param bijian1013 java servlet web.xml context-param
一.格式定义： <context-param> <param-name>contextConfigLocation</param-name> <param-value>contextConfigLocationValue></param-value> </context-param> 作用：该元
Web系统常见编码漏洞（开发工程师知晓） Bill_chen sql PHP Web fckeditor 脚本
1.头号大敌：SQL Injection 原因：程序中对用户输入检查不严格，用户可以提交一段数据库查询代码，根据程序返回的结果，获得某些他想得知的数据，这就是所谓的SQL Injection，即SQL注入。本质: 对于输入检查不充分，导致SQL语句将用户提交的非法数据当作语句的一部分来执行。示例： String query = "SELECT id FROM users
【MongoDB学习笔记六】MongoDB修改器 bit1129 mongodb
本文首先介绍下MongoDB的基本的增删改查操作，然后，详细介绍MongoDB提供的修改器，以完成各种各样的文档更新操作 MongoDB的主要操作 show dbs 显示当前用户能看到哪些数据库 use foobar 将数据库切换到foobar show collections 显示当前数据库有哪些集合 db.people.update，update不带参数，可
提高职业素养，做好人生规划白糖_ 人生
培训讲师是成都著名的企业培训讲师，他在讲课中提出的一些观点很新颖，在此我收录了一些分享一下。注：讲师的观点不代表本人的观点，这些东西大家自己揣摩。 1、什么是职业规划：职业规划并不完全代表你到什么阶段要当什么官要拿多少钱，这些都只是梦想。职业规划是清楚的认识自己现在缺什么，这个阶段该学习什么，下个阶段缺什么，又应该怎么去规划学习，这样才算是规划。
国外的网站你都到哪边看？ bozch 技术网站国外
学习软件开发技术，如果没有什么英文基础，最好还是看国内的一些技术网站，例如：开源OSchina，csdn，iteye,51cto等等。个人感觉如果英语基础能力不错的话，可以浏览国外的网站来进行软件技术基础的学习，例如java开发中常用的到的网站有apache.org 里面有apache的很多Projects,springframework.org是spring相关的项目网站,还有几个感觉不错的
编程之美-光影切割问题 bylijinnan 编程之美
package a; public class DisorderCount { /**《编程之美》“光影切割问题” * 主要是两个问题： * 1.数学公式（设定没有三条以上的直线交于同一点）： * 两条直线最多一个交点，将平面分成了4个区域； * 三条直线最多三个交点，将平面分成了7个区域； * 可以推出：N条直线 M个交点，区域数为N+M+1。
关于Web跨站执行脚本概念 chenbowen00 Web 安全跨站执行脚本
跨站脚本攻击(XSS)是web应用程序中最危险和最常见的安全漏洞之一。安全研究人员发现这个漏洞在最受欢迎的网站,包括谷歌、Facebook、亚马逊、PayPal,和许多其他网站。如果你看看bug赏金计划,大多数报告的问题属于 XSS。为了防止跨站脚本攻击,浏览器也有自己的过滤器,但安全研究人员总是想方设法绕过这些过滤器。这个漏洞是通常用于执行cookie窃取、恶意软件传播,会话劫持,恶意重定向。在
[开源项目与投资]投资开源项目之前需要统计该项目已有的用户数 comsci 开源项目
现在国内和国外,特别是美国那边,突然出现很多开源项目,但是这些项目的用户有多少,有多少忠诚的粉丝,对于投资者来讲,完全是一个未知数,那么要投资开源项目,我们投资者必须准确无误的知道该项目的全部情况,包括项目发起人的情况,项目的维持时间..项目的技术水平,项目的参与者的势力,项目投入产出的效益.....
oracle alert log file（告警日志文件） daizj oracle 告警日志文件 alert log file
The alert log is a chronological log of messages and errors, and includes the following items: All internal errors (ORA-00600), block corruption errors (ORA-01578), and deadlock errors (ORA-00060)
关于 CAS SSO 文章声明 denger SSO
由于几年前写了几篇 CAS 系列的文章，之后陆续有人参照文章去实现，可都遇到了各种问题，同时经常或多或少的收到不少人的求助。现在这时特此说明几点： 1. 那些文章发表于好几年前了，CAS 已经更新几个很多版本了，由于近年已经没有做该领域方面的事情，所有文章也没有持续更新。 2. 文章只是提供思路，尽管 CAS 版本已经发生变化，但原理和流程仍然一致。最重要的是明白原理，然后
初二上学期难记单词 dcj3sjt126com english word
lesson 课 traffic 交通 matter 要紧；事物 happy 快乐的，幸福的 second 第二的 idea 主意；想法；意见 mean 意味着 important 重要的，重大的 never 从来，决不 afraid 害怕的 fifth 第五的 hometown 故乡，家乡 discuss 讨论；议论 east 东方的 agree 同意；赞成 bo
uicollectionview 纯代码布局, 添加头部视图 dcj3sjt126com Collection
#import <UIKit/UIKit.h> @interface myHeadView : UICollectionReusableView { UILabel *TitleLable; } -(void)setTextTitle; @end #import "myHeadView.h" @implementation m
N 位随机数字串的 JAVA 生成实现 FX夜归人 java Math 随机数 Random
/** * 功能描述随机数工具类<br /> * @author FengXueYeGuiRen * 创建时间 2014-7-25<br /> */ public class RandomUtil { // 随机数生成器 private static java.util.Random random = new java.util.R
Ehcache（09）——缓存Web页面 234390216 ehcache 页面缓存
页面缓存目录 1 SimplePageCachingFilter 1.1 calculateKey 1.2 可配置的初始化参数 1.2.1 cach
spring中少用的注解@primary解析 jackyrong primary
这次看下spring中少见的注解@primary注解，例子 @Component public class MetalSinger implements Singer{ @Override public String sing(String lyrics) { return "I am singing with DIO voice
Java几款性能分析工具的对比 lbwahoo java
Java几款性能分析工具的对比摘自：http://my.oschina.net/liux/blog/51800 在给客户的应用程序维护的过程中，我注意到在高负载下的一些性能问题。理论上，增加对应用程序的负载会使性能等比率的下降。然而，我认为性能下降的比率远远高于负载的增加。我也发现，性能可以通过改变应用程序的逻辑来提升，甚至达到极限。为了更详细的了解这一点，我们需要做一些性能
JVM参数配置大全 nickys jvm 应用服务器
JVM参数配置大全 /usr/local/jdk/bin/java -Dresin.home=/usr/local/resin -server -Xms1800M -Xmx1800M -Xmn300M -Xss512K -XX:PermSize=300M -XX:MaxPermSize=300M -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=5 -
搭建 CentOS 6 服务器(14) - squid、Varnish rensanning varnish
（一）squid 安装 # yum install httpd-tools -y # htpasswd -c -b /etc/squid/passwords squiduser 123456 # yum install squid -y 设置 # cp /etc/squid/squid.conf /etc/squid/squid.conf.bak # vi /etc/
Spring缓存注解@Cache使用 tom_seed spring
参考资料 http://www.ibm.com/developerworks/cn/opensource/os-cn-spring-cache/ http://swiftlet.net/archives/774 缓存注解有以下三个： @Cacheable @CacheEvict @CachePut
dom4j解析XML时出现"java.lang.noclassdeffounderror: org/jaxen/jaxenexception"错误 xp9802
java.lang.NoClassDefFoundError: org/jaxen/JaxenExc 关键字: java.lang.noclassdeffounderror: org/jaxen/jaxenexception 使用dom4j解析XML时，要快速获取某个节点的数据，使用XPath是个不错的方法，dom4j的快速手册里也建议使用这种方式执行时却抛出以下异常： Exceptio

2023将至，Bengio等大佬年度展望！懂理性的AI模型要来了？

【导读】2022年对AI来说注定是不平凡的一年，这不吴恩达、Bengio等一众圈内大佬在接受DeepLearning.ai的采访中都展望了2023年AI的发展趋势，还分享了自己的科研小故事。

你可能感兴趣的:(2023将至，Bengio等大佬年度展望！懂理性的AI模型要来了？)