BAAIBeijing

加拿大两院院士裴健：搜索皆智能，智能皆搜索

6月23日，加拿大西门菲莎大学教授裴健在第二届北京智源大会智能信息检索与挖掘专题论坛上做了《智能搜索：从工具到思维方式和心智》的报告。

裴健最近当选为加拿大工程院院士，现在是加拿大皇家科学院和加拿大工程院的两院院士。裴健是国际著名的数据科学、数据挖掘和数据管理专家，专长于通过数据战略制定、数据资产管理、数据资源整合和数据产品设计研发把数据和技术转化为业务能力和效益。他同时是多家企业的顾问，提供高端战略咨询和技术咨询服务。其论著被引用九万七千多次。有关裴健的更多独家信息，请移步《我所知道的裴健和华人数据挖掘大牛们 | 中国人工智能简史》一文。

北京智源大会是智源研究院主办的年度国际性人工智能高端学术交流活动，2019年举办了首届大会，今年为第二届。大会参会官网：2020.baai.ac.cn。

裴健在这次的演讲中提出了三个核心观点：

第一，搜索皆智能，搜索以人为核心，以满足人的信息需求为目的，所以它天然就包含了智能成分。

第二，智能皆搜索，我们要做到智能必须要用到搜索的方法，目前人工智能的很多应用都是搜索任务，智能和搜索同行。

第三，智能搜索不仅是一个单纯的技术问题，更是一个与人相关的问题，我们必须要一起努力，使得每个人都不会被落下，让智能搜索服务全人类。

在演讲最后，中国人民大学教授、智源首席科学家文继荣与裴健进行了精彩的问答互动：

智能搜索和智能推荐可能比我们想象中更深刻地影响到我们每天的生活，比如你有一个问题，你的第一反应是不是去搜一下？或者说你想获取什么信息，你会第一时间打开如头条、微博、知乎这样的一些APP，然后去看它给你推荐了一些什么？

做搜索、推荐、数据分析的人责任是非常重大的，如果这方面做得不好，在极端情况下就有可能改变我们下一代甚至改变人类的思维方式，改变我们对世界的看法，因为一个人对整个世界的看法更多地是由他接收到的信息、他的经历所塑造的。如果我们的信息推送和用户检索到的信息是有问题的，比如刚刚提到的信息是有偏见的，比如我看什么就给我推荐什么，那我就进入了信息减法的世界，我可能会失去了解这个世界的更多可能性。

通过这次精彩的演讲和问答互动，我们可以从智能推荐或者个性化推荐等技术中看到一些人文关怀和哲学反思。

人文关怀：老人会不会因为不会用智能手机、不会用电脑而享受不了智能搜索带来的红利？比如说残疾人和在偏远地区、经济不发达地区的人会不会因为达不到智能搜索的入门门槛而被慢慢抛弃？我们应该如何解决这些问题？

哲学反思：随着我们越来越依靠智能搜索、个性化推荐，我们是否会失去了解这个世界的更多可能性？我们是否会失去一部分原有的“自由意志”？究竟是我们驯化了这个信息流世界还是被其驯化？

以下为裴健演讲正文：

今天我报告的题目是智能搜索：从技术工具到思维心智。

首先，让我们来简单回顾一下搜索的基本概念。在搜索当中，我们假定用户有信息需求。用户的信息需求往往不能直接被搜索系统直接理解，于是用户把信息需求转化为搜索系统的查询。搜索系统得到用户的查询，找到相应的结果，可能是一些文档、图片、图像或者是生成的内容，返回给用户。用户可以根据这些是否是所需要的，产生相应的反馈，搜索系统根据用户的反馈来决定是否需要去对搜索进行增强。这样一个过程不断循环，直到用户信息需求得到了满足，整个搜索过程就结束了。

这个过程听起来非常得完美，很简洁。但在实际当中，搜索并不是那么简单，要比这个复杂得多。

一、搜索皆智能

在实际生活当中，“用户信息需求是固定的”这个假设命题其实是个伪命题。在很多情况下，用户的信息需求不断变化。更麻烦的是，用户本身可能并不清楚自己的信息需求到底是什么。举个例子来说，比如我听说某个小区有新型肺炎的新感染案例，发出一个“新冠肺炎感染病例”的查询，那么这个查询到底是想问什么呢？用户自己可能并不清楚，在很多时候用户可能是发出一个查询先问一下，看搜索引擎给返回什么样的信息。用户和搜索引擎的交互过程就是一个探索的过程，用户的信息需求在不断变化。在“新冠肺炎感染病例”的例子里，用户可能想问的是这个感染病例是不是得到了治疗？感染病例的具体情况是怎样的？看到搜索引擎的回答后，用户可能马上想到这个感染案例对小区的生活，如出行、购物等，有什么影响？大家可以看到信息需求是不断变化的，我们在搜索过程中不能假定用户的信息需求是不变的。信息系统必须想办法去理解用户的真实信息需求，为用户提供探索的工具。因此，搜索本身从一开始就是智能的，因为它把人摆在了整个过程的中心。

下面举个例子来讲一下搜索过程为什么是一个探索的过程。在VLDB-2019的会议上，我的研究小组发表了一篇社团搜索的文章。和很多已有的社团搜索工作不太一样，我们假定在每一个网络节点上都有一个数据库。如果这个网络结点是一个人，那么这个数据库就可以是这个人以往购买东西的整个历史。如果这个网络结点是一个论文作者，那这个数据库就是他以前发表的所有论文的集合。我们关心在这样一个网络里面怎样找到社团？

我们希望社团内成员之间不但有很密切的网络连接关系，还能在数据库上又有非常相似的模式。

这样社团有什么用呢？举例来说，在论文作者的数据网络上，用户可能关心的是能不能找到那些用数据挖掘方法来研究人脸识别和图象检索的社团？我们的搜索首先形成了一个查询模式a1。

同时，我们的搜索算法还能够提供针对a1的各种细化，比如b1、b2、直到b8。在这些细化当中我们会专门看各个具体的分支，包括算法具体分支和问题具体分支。这些分支给用户带来探索方向和探索方便。这种探索可以进一步往下走。比如说b8可以进一步探索到c1、c2两种具体的情况。整个过程是一个不断深入、不断尝试、不断修正的探索过程。

二、智能皆搜索

搜索皆智能，搜索要用到大量的人工智能技术，所以我们要通过人工智能技术去理解用户的信息需求。同时，智能很复杂，智能的每一个任务都需要多多少少用到搜索技术。

什么是智能？智能是关于连接的，我们需要把不同的数据、不同的知识点连接起来；智能是关于推理的，我们需要对数据、对知识进行相应的推理；智能是关于泛化的，我们有具体的观察，我们希望通过若干具体的观察、具体的例子来泛化来概括成通用的规律；智能还需要去做具体化，我们有一些通用的原则，要把它用到具体的事例里面，提高具体事例处理的效率和效果。所有这些都需要搜索相应的数据，搜索相应的知识，搜索相应的连接。所以智能皆搜索，智能离不开搜索，智能必须通过搜索来实现。

下面举个一个我们KDD 2016论文中的例子来介绍我们怎么通过搜索来达到知识发现。我们可以在WordNet的网络上面找到很有意思的一些社团，每一个社团内部非常相似，社团成员之间有很强的关联，同时，社团之间非常对立，有非常大的差异。

当我们把这个问题用在形容词网络里面，我们就找到了大家在胶片上看到的Group1和Group2这样对立的社团，所以我们把它叫做gangs in war。大家仔细看，每一个社团内部是一组同义组，Group1和Group2之间是反义词关系。我们用智能搜索带给我们新知识，我们可以在词的网络上自动发现同义词和反义词。

刚才我们讲了搜索皆智能，智能皆搜索，所以智能和搜索是密不可分的，二者紧密结合，搜索和智能同行。这里包括两个意思，第一，我们需要用搜索的技术来达到更好的人工智能。像我刚才举的例子，我们可以通过很好的搜索来自动的发现知识，同时我们需要用很多的智能技术和计算来使得搜索更加有效。这里的智能不单单只是人工智能，还包括了很多真正的人的智能，因为我们最终的搜索是为人服务的。

这里举一个例子，这是我们最近刚刚完成的一个论文，我们研究的是基于Web-scale的多语言问答系统。问答系统有很多，在很多商用的搜索引擎里面都有相应的问答功能。当一个用户给出一个问题，例如说想知道感冒症状，搜索引擎可以总结出像下图左边的信息卡，这个信息卡上会列出相应的感冒的症状甚至是治疗的方法。这给用户带来了很多的便利，在一定程度上这也是对知识的抽取和总结。

当搜索引擎给出这样一个答案时，这个答案是否满足了用户的信息需求？这个答案的知识是否正确？是否有用？我们希望能够得到用户的反馈，我们希望用户用人的智能来帮助机器进行学习。这里有一个挑战。很多情况下，用户看过答案但并不一定给出一个显式的反馈，理解人的反馈是一个非常复杂的过程。在这篇论文里面，我们系统地研究了如何观察、推理用户对搜索引擎所给出的问答信息的反馈，如何对用户的行为进行挖掘，抽取相应的反馈信号，用这些信号来改进我们的QA系统。

上图是在一个全球化商业搜索引擎数据集上面所做的实验结果。当我们的系统考虑了用户真正的已知反馈之后，整个搜索效果比不用这个反馈的系统好得多。同时，我们可以看到一个非常有意思的现象：这种智能搜索所发现的知识可以在不同的领域进行迁移。

举个例子来说，在整个模型建立的过程中，我们用的是英语数据，在英语数据里面，我们抽取了相应的问答和相应的用户反馈。英语里发现的知识完全是可以往别的语言迁移，如德语和法语。迁移的效果很好，在法语的数据集上面我们用了很少的大概5K的数据就能够达到如果没有跨语言的迁移、没有反馈的时候需要用50K的数据才能达到的效果。也就是说，通过应用用户的反馈，我们能够大大减少相应的数据需求，我们的确可以通过智能化的方法理解用户，并让用户把人类智能来帮助我们的机器。我们的技术已经在一个大型商用搜索引擎的多语言服务中上线应用。

三、智能搜索，与人相关

因为搜索的主体是人，所以搜索并不简单是一个技术问题。最近在《纽约时报》有一篇很好的文章，题目就是Tech is global. right？：技术是全球化的，对吗？对，技术是全球化的。

这篇文章谈到了很多先进的美国企业把相应的技术和平台用到别的国家和地区效果不好。这里面涉及到很多因素，特别是很多与人有关的因素，例如说本地化、可理解性、文化、公平性、隐私保护、模型的复杂性、安全性等等。如果我们要把智能搜索做好，就必须密切考虑人的因素。

其中，深度学习模型的复杂性是一个重要的因素。我们最近刚刚完成了一篇KDD2020的论文在这方面做了一些探索。模型复杂性本身是一个很复杂的问题。在很多场合下，人们可能只是简单地比较两个模型之间的准确度或者别的一些性能指标，但哪怕两个模型的性能在测试集上是完全一样的，并不意味着这两个模型的本质是一样的，也不意味着它们捕捉了同样的客观现实。

举个具体例子，上图这两个模型在相应的数据点上是完全一致的，但是这两个模型其实差得非常远。因此我们需要有一个系统的方法来衡量模型的复杂度、来衡量模型到底有没有对数据过拟合。我们的KDD2020上的论文就在这方面给出了一些新的方法。

与模型和搜索方法很相关的另外一个问题是可解释性，一个模型要获得大家的信任，它必须有良好的可解释性。我们认为，模型的可解释性一定要满足两个原则。第一是准确性：如果我用一个模型来解释另外一个模型，那这两个模型必须在数学上等价。如果不等价，解释就可能会有问题。第二，模型的解释必须是一致的。一致是什么意思呢？如果我有两个非常相似的样例，它们相应的解释也应该非常相似，这才能够符合人的直觉。可解释性问题的核心是把一个黑盒子转化为一个白盒子。

我们KDD2018的论文通过把一个深度网络转化为一个基于内部神经元状态的向量，给出基于多胞体（polytope）的解释。这样所得到的解释是精确的：从数学上解释的模型和原来的深度网络等价。同时，解释也是是一致的：如果两个点很相近，它们落在同一个多胞体里面，它们就会遵从相应的相同的线性分类器，所以它们的相应解释也会是一样的。

在今年的ICDE论文中，我们把解释模型推到了云端。以往的解释工具往往需要知道整个模型的参数，甚至要知道相应的很多训练数据。在今年的ICDE论文里，我们提出可以把整个模型作为一个黑盒，然后给出准确和一致的解释，不需要知道模型的参数和训练数据。这里核心的想法是：如果我们有若干的样例，这些样例落在同一个多胞体里面，它们就应该遵循同一个线性分类器，于是我们可以建造一个线性方程式系统，用此来为我们提供相应的解释。

关于怎么样把智能搜索做好，我们讲了很多。但是我们应该要充分认识到一点，智能搜索也在不断地改变我们的心智。

在国外大家经常说这句话：如果你遇到一个不了解的事情怎么办？用搜索引擎查一下(google it)。在国内也有俗语叫：内事问度娘，外事问谷歌。搜索的过程和结果很深刻地改变了人类的思维和学习方式。在某些方面搜索拓宽了我们获取信息的渠道和速度，使得我们更聪明。但在另一些方面，我们可能会过度依赖智能搜索，在很多地方会变得笨了。这里，信息的准确性和公平性变得非常重要。

在这次的疫情当中，我们都知道虚假信息是非常严重的一个问题。很多小道消息、虚假消息通过社交媒体传播产生了很坏的作用。最近推特干了一件很有意思的事情，他们用了一个简单聪明的办法来对付虚假消息。他们观测到有很多人在社交媒体里面看到一个有意思的标题就转发了，但并没有看过那个文章。于是推特在你转发一个没有看过内容的推特时，提示用户其实没有看过这篇文章。这个提示对于降低虚假消息的传播会有很大的帮助。但是这种帮助是有代价的，它需要我们牺牲一定的隐私。推特需要知道你看过什么才知道你有没有看过自己转发的东西。这里有一个挑战性的均衡：我们到底需要保留什么样的隐私，怎么样制止虚假消息的传播。

我们知道抖音在国内外都非常成功，已经出现了一代新的人类叫作Tik TOK Generation。它们通过智能的搜索和推荐技术把人与人连接起来，把内容和内容连接起来。在内容创造上Tik TOK Generation以及这类新媒体有一些重要的特点。其中之一就是媒体内容本身不是那么重要，反而对媒体的评论和媒体的跟进会更重要。大家经常跑到很多新媒体上并不是看它真正的内容，而是看后面跟着的评论。由于智能搜索和智能推荐技术的发展使得人与人之间的连接、内容与内容之间的连接、人与内容之间的连接更加容易、更加广泛。很多人原来并不需要互相认识，但是通过这个智能搜索和智能推荐他们会联系在一起，形成长期的交互，这就导致了我们现在面临着新一代所谓的热情经济。

跟传统的零工经济经济相比，热情经济有一系列新特点。举例来说，热情经济从业者不断地产生新内容，不断地吸引更多的观众获得相应的营收，这是以往很多经济模式不具备的。同时由于智能搜索、智能推荐和平台的连接作用使受众面会大大提高，更多有创意的产品和服务可以以更低的成本推向服务市场，这些也给我们带来很多新机会和新挑战。

热情经济完全是基于新的技术、新的软件、新的媒体。智能搜索是热情经济的核心技术，通过技术的进步使得平台更加有效、内容开发更加方便、创业更加快捷、创业者和受众的联系更加紧密、交互更加方便。

智能搜索彻底改变了我们的生活。可以说智能搜索已经变成了我们无时无刻、无处不在的需求和工具。智能搜索同时也会产生很多新的挑战。其中一个核心的挑战是我们怎么确保智能搜索服务于社会的每一个人，没有人因为各种限制而被智能搜索遗弃。

举个例子来说，老人们会不会因为不会用智能手机而享受不了智能搜索带来的红利？又比如说，残疾人、偏远地区和经济不发达地区的人们会不会因为达不到智能搜索的基础设施入门门槛而被抛弃？这些都是我们需要考虑的问题。我们都知道现在医院挂号经常需要用智能手机来预约，但是很多老人，特别是那些七八十岁、八九十岁的老人，并不会使用智能手机，用起来也很不方便。他们怎么才能获得信息渠道并消费这些信息？这些都是我们做智能搜索的人需要认真考虑和抓紧行动的方向。我个人认为智能搜索远远不仅仅是一个技术问题，也远远不仅仅是一个人工智能的问题，它是一个非常复杂的全社会的系统工程。

问答环节

文继荣：对智能搜索和智能推荐来说，所谓的智能就是越来越了解你，以人为中心来了解你，它给你的信息越来越趋近于你过去的兴趣和经历，但是这样会不会使你失去了解这个世界多样性的可能？在整个大的框架方面或者在整个研究方向上面，有没有更多的深刻思考？

裴健：智能搜索化、智能推荐已经成为下一代人类重要的信息入口，也是非常重要的信息出口。只能搜索把握了这一进一出，对未来的人类有很大的塑造能力。这也许是大家做技术的时候并没有特别深思的一个问题。我们一点一滴的技术贡献会怎样改变未来人类学习的方式、思考的方式和所知所行。这里面涉及很多问题。例如说我们可以通过可适应性使得我们的教育效率提高，使得一个人更容易学习。但是可适应性在一定程度下又可能有缺陷。我们如果过分迁就人类的惰性，就可能会使一部分最聪明的人失去了挑战更高高度的机会。再例如，到底让智能搜索受众学什么？怎么保证整个环境公平性？大家开始去思考，但是远远没有答案。我在演讲的最后也强调了这不是简单的技术问题，这是全社会的很复杂的问题。

观众发问：感觉像谷歌、百度这些巨头已经形成了垄断，其它的搜索引擎或者其它的新的搜索工具经历了多年都没有成长起来。请问这些研究智能搜索方向的人除了到这些巨头公司工作以外，还有没有更好的出路？

裴健：搜索仍在不断地创新，现在所有商用搜索引擎最头疼的事情是越来越多的高质量信息不在公开的互联网上，而在相对封闭的社交媒体上。例如说在朋友圈有很多质量高的信息源，但这种信息源是通用搜索引擎查不到的。怎样把这些信息源整合起来形成一种更强大的搜索能力？这是一个有意思的研究方向。现在很多的搜索跟广告、商业模式结合起来，是商业驱动、利润引导。最近原谷歌的两位高管创办了一个新公司，这个公司做的搜索引擎Neeva号称不会有广告，而且要打通一些社交媒体，使得搜索的面更广。这些新业务模式不管成功与否都是非常有意义的尝试。智能搜索从就业、创业的角度来说有很广阔的前景。同时智能搜索会涉及到我们生活中的方方面面，例如说在IOT环境下怎么做智能搜索？这些都是现有的面向通用web搜索所不能涵盖的，也会是很有意思的方面。

文继荣：现在搜索引擎不管从主要的核心功能还是到形态上已经几十年没有变化了，实际上现在很多东西都在变，比如说裴老师讲的热情经济，还有国内的一个网红经济，现在都是影响非常大的。我昨天看了一个新闻说的非常好玩，浙江余姚区网红可以评为国家级创新人才，不知道真的假的。实际上这个世界在飞速的变化，可能很多时候你认为没有变化空间的时候就是会开始很大变化的时期。就搜索来说，我觉得就直观感受而言还远远达不到我们真正想要了解的世界。

这次新冠病毒期间，我觉得甚至可以开一个研讨会来讨论一下这中间的很多问题，人们在获取信息时出现了很多问题，有虚假信息问题也有信息多样性问题。这些信息对大家的影响是巨大的，你可以经常感觉到整个朋友圈都在转发和讨论一个信息。尤其大家在家里没办法面对面交谈，你可以通过控制信息来控制大家的观点和情绪，这个事情我觉得是非常重要的。我们人类将来会走向更加数字化的阶段，从搜索和推荐的角度对信息进行获取和处理，我觉得我们到了一个全新的时期，我们需要去探索。

讚（232-0857）｜智能方法练习王羲之的《圣教序》（硬笔）｜每日精进开心练字
所谓取法乎上，学习行书自然要学习书圣王羲之，而学书圣行书的最佳入门途径是学习和练习《圣教序》，毛笔如此，硬笔亦如此。几种常见形态比较image《圣教序》的特色言字旁极度夸张的拉开上下距离为全字增加了一丝“动感”。开心指数欣赏指数：★★★★☆易写指数：★★★☆☆实用指数：★★☆☆☆行笔路线（笔顺）image行笔路线如图：行楷的结构特征image形体（整体视野）左右视角——左低右高：整体呈斜的“行”书
趣闲赚是不是骗局,到底能不能够赚钱? 好项目高省
趣闲赚是一款备受关注的赚钱应用，它声称用户可以通过完成任务、看视频、填问卷等方式获得佣金。但是，这个应用真的能让人们赚到钱吗?我们来一起探讨一下。京东密令红包：最爱领红包828红包多多148今天给大家分享我长期在做的副业，也在这里赚到人生第3桶金！高省APP佣金高，资质靠谱，各大应用市场均可搜索使用。【高省】高省app是杭州长孚科技有限公司旗下一款新开发电商导购应用，为用户打造一个集成电商购物优惠
dubbo与zookeeper 中庸逍遥
1.什么是DubboDubbo是一款高性能、轻量级的开源JavaRPC框架，它提供了三大核心能力：面向接口的远程方法调用，智能容错和负载均衡，以及服务自动注册和发现。1.1架构1.2节点角色说明：Provider:暴露服务的服务提供方（生产者）Consumer:调用远程服务的服务消费方（消费者）Registry:服务注册与发现的注册中心（例如：zookeeper）Monitor:统计服务的调用次数
2022-12-26 胡诌文学
今天看到一个人发了文章说不再买书了，这是时代的悲哀，也是时代的幸运，以前，知识就像是一个象牙塔，虽说事事洞明皆学问，但躲不过黄金屋的书籍，但是现在，知识扩散越来越明显，我们只要有心，就可学习，不必纠结于书
【云原生】Helm来管理Kubernetes集群的详细使用方法与综合应用实战景天科技苑云原生K8S 零基础到进阶实战云原生 kubernetes 容器 Helm k8s k8s集群
✨✨欢迎大家来到景天科技苑✨✨养成好习惯，先赞后看哦~作者简介：景天科技苑《头衔》：大厂架构师，华为云开发者社区专家博主，阿里云开发者社区专家博主，CSDN全栈领域优质创作者，掘金优秀博主，51CTO博客专家等。《博客》：Python全栈，前后端开发，小程序开发，人工智能，js逆向，App逆向，网络系统安全，数据分析，Django，fastapi，flask等框架，云原生k8s，linux，she
KL散度：信息差异的量化标尺 | 从概率分布对齐到模型优化的核心度量
不对称性、计算本质与机器学习的普适应用本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、核心定义与数学本质KL散度（Kullback-LeiblerDivergence）用于衡量两个概率分布PPP和QQQ的差异程度，定义为：DKL(P∥Q)=∑x∈XP(x)log⁡P(x)Q(x)(离散形式)D_
Transformer：自注意力驱动的神经网络革命引擎大千AI助手人工智能 Python #OTHER transformer 神经网络深度学习 google 人工智能机器学习大模型
本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！从语言理解到多模态智能的通用架构基石⚙️一、核心定义与历史意义Transformer是由Google团队在2017年论文《AttentionIsAllYouNeed》中提出的深度学习架构，其颠覆性创新在于：完全摒弃RNN/CNN：仅依赖自注意力机制（S
[特殊字符] LLM（大型语言模型）：智能时代的语言引擎与通用推理基座大千AI助手人工智能 Python #OTHER 语言模型人工智能自然语言处理 LLM 大模型 Transformer
本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！从千亿参数到人类认知的AI革命一、核心定义与核心特征LLM（LargeLanguageModel）是基于海量文本数据训练的深度学习模型，通过神经网络架构（尤其是Transformer）模拟人类语言的复杂规律，实现文本理解、生成与推理任务。其核心特征可概
MAP最大后验估计：贝叶斯决策的优化引擎大千AI助手人工智能 Python #OTHER python 人工智能算法贝叶斯 MAP 概率论条件概率
融合先验知识与观测数据的概率推断方法本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、核心概念与数学本质MAP（MaximumAPosteriori）估计是贝叶斯框架下的参数估计方法，其目标为：最大化后验概率(P(\theta\midX))，即：[\hat{\theta}{MAP}=\arg\ma
MLE最大似然估计：数据驱动的概率模型参数推断基石大千AI助手人工智能 Python #OTHER 数据挖掘人工智能机器学习算法 MLE 参数估计概率论
从样本中还原未知分布的本质规律本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、核心思想与数学定义最大似然估计（MaximumLikelihoodEstimation,MLE）是频率学派的参数估计方法，其核心思想为：选择使观测数据出现概率最大的参数值。给定独立同分布样本X={x1,x2,…,xn}
HTML+CSS简单网页练习
前言运用了CSS进行简单的网页制作一、效果图二、HTML代码手机alert("欢迎—>"+prompt("请输入你的姓名")+"首页智能手机平板电脑配件服务支持关于尚合最新公告：尚合Aone智能手机入网证已经获工信部门审批下发。尚合官方新品发布新闻中心致歉公告首批尚合Aone已全部售罄！【媒体报道】国产高性价比尚合Aone四核手机评测我司产品已经通过了国家强制性产品3C认证尚合Aone智能手机入网
【薄媚摘遍·春】诗词接龙大赛（总第117期）陈良心
郑重声明：作品皆作者原创，文责自负！【文字家园诗词】本期词牌《薄媚摘遍·春》赵以夫体，双调九十二字，前段十一句三仄韵、一叶韵，后段十句四仄韵、一叶韵。纳兰蕙若：薄媚摘遍·落絮摘梅时醉花阴，青玉案，春事今如许。柳含烟，梅弄影，吹花飞絮相妒。缤纷渐去，兀自飘飘，催雪满亭庐。不忆曾经，风尘别怨鹧鸪语。浮世欢娱难聚。哪管莺啼序。芳草渡，少年游，云山万叠千阻。权当知会，寄与征鸿，步月桂香酥。品令归来，词林拾
【深入C++】std::move 空基类优化智能指针 vector＜bool＞阿猿收手吧！遣返回家的C家家 c++开发语言
文章目录std::move是啥？干了啥？一、底层原理：转换而非移动二、核心应用场景：高效转移资源所有权三、关键注意事项与陷阱四、总结空基类优化一、空类的内存占用二、空基类优化的原理三、优化生效的条件四、应用场景五、注意事项move和智能指针的有趣结合实现`std::unique_ptr`移动语义的核心要素`unique_ptr`简化版实现代码移动操作关键解析移动构造函数实现移动赋值运算符实现使用示
思途html学习 0717 Asu5202 html 学习前端
1.HTML基础概述HTML定义：超文本标记语言（HyperTextMarkupLanguage），用于创建网页结构。“超文本”指支持嵌入图像、音频、视频和脚本等非文本内容。编辑器推荐：VSCode、HBuilderX或IDEA都很实用。安装VSCode后，添加LiveServer插件（通过Extensions搜索安装），能实现实时预览网页（快捷键：Ctrl+S保存后自动刷新）。核心特性：空白处理
知识蒸馏：模型压缩与知识迁移的核心引擎大千AI助手人工智能 Python #OTHER transformer 人工智能神经网络深度学习知识蒸馏 KD 蒸馏
本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！从软目标迁移到无数据合成的轻量化革命一、核心定义与技术价值知识蒸馏（KnowledgeDistillation,KD）是一种通过迁移大型教师模型（Teacher）的知识至小型学生模型（Student）的模型压缩技术。其核心思想是：学生模型不仅学习原始数
众趣SDK重磅升级：空间物联IOT新视界，赋能实景三维场景深度应用 zhongqu_3dnest 物联网 3d 点云处理人工智能计算机视觉点云扫描
近日，空间数字孪生云服务行业领导者—众趣科技宣布旗下核心产品云服务平台QverseSDK迎来里程碑式升级！本次升级聚焦行业前沿需求，重磅推出IoT设备监控系统、iframe跨平台页面无缝集成、BI数据智能三大解决方案，旨在将三维空间计算能力转化为更强大、更易用的生产力工具，为企业用户和开发者构建下一代空间数字化应用提供坚实底座。一、IoT空间物联，让设备运行尽在掌控痛点解决：告别传统分散的设备管理
零信任产品联合宁盾泛终端网络准入，打造随需而变、精准贴合业务的网络安全访问体系宁盾Nington 安全
零信任网络访问控制（ZeroTrustNetworkAccess，ZTNA，文中零信任皆指ZTNA）基于“永不信任，持续验证”的理念，打破了企业基于传统网络边界进行防护的固有模式。在当前日趋复杂的网络环境下，内部威胁与外部攻击加剧，零信任能够为企业构建一个动态的安全访问体系。通过持续身份验证、权限动态调整等机制，确保合法用户在安全的环境下访问企业资源，有效防止未授权访问与数据泄露，提升企业整体信息
Python面向对象编程(OOP)详解：通俗易懂的全面指南盛夏绽放 python 开发语言有问必答
前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。文章目录Python面向对象编程(OOP)详解：通俗易懂的全面指南一、OOP基本概念1.什么是面向对象编程？2.OOP的四大支柱3.核心概念对比表二、类和对象1.类(Class)vs对象(Object)2.类结构详解三、OOP三大特性详解1.封装(Encapsulation)2.继承(Inherita
考拉海购返利app哪个最好（推荐八个大家都在用的返利软件排行榜）日常购物小技巧
大家好，我是花桃APP商品推荐官：美美，今天给各位说说考拉海购返利app哪个最好（推荐八个大家都在用的返利软件排行榜）答：目前全网最高的是【花桃APP】我也在用，亲测过了！很好用的！说【考拉海购返利】之前给大家推荐一款返利APP，【全网返利最高哦!可以对比一下自己在用的返利软件】都是有内部返利和优惠券的，应用商店搜索下载花桃APP即可查询返利佣金。【官方邀请码：999999】目前的话考拉海购返利平
B 树和 B+ 树前端_学习之路数据结构数据结构 b树
一、B树和B+树的基本概念B树和B+树是两种重要的平衡多路搜索树，特别适合在磁盘等外存设备上组织和存储数据。它们通过增加节点的分支因子，减少树的高度，从而减少磁盘I/O操作，提高数据访问效率。B树(B-Tree)B树是一种自平衡的多路搜索树，每个节点可以有多个子节点。主要特点所有叶子节点在同一层每个节点可以包含多个键值和子节点节点的键值按升序排列除根节点外，每个节点至少有m/2个子节点(m为树的阶
HTML快速复习
目录!DOCTYPE声明头部head标题title标记元信息meta标记主体body标题分割线段落加粗倾斜下划线文字加删除线预编译标签换行实体字符多媒体标签超链接设置锚点列表标签表格标签框架框架集合form表单模拟百度搜索表单元素文本框密码框单选按钮多选按钮文件隐藏域普通按钮特殊按钮下拉列表多行文本框label标签提交按钮HTML5新增的一些type类型HTML5新增的一些属性thisismyfi
Willoughby Wallaby Woo JeetChan
小袋鼠WilloughbyWallabyWoo这首歌的作曲者与原唱名叫Raffi。Raffi是一位加拿大籍的作曲家兼歌手，曾被称为“英语语言世界里最有名的儿童歌曲唱作人”。WilloughbyWallabyWoo收录在他最出名的专辑SingableSongsfortheVeryYoung中。Willoughbywallabywee小袋鼠袋鼠小Anelephantsatonme一只大象坐我身上Wil
python分布式爬虫打造搜索引擎--------scrapy实现 weixin_30515513 爬虫 python 开发工具
http://www.cnblogs.com/jinxiao-pu/p/6706319.html最近在网上学习一门关于scrapy爬虫的课程，觉得还不错，以下是目录还在更新中，我觉得有必要好好的做下笔记，研究研究。第1章课程介绍1-1python分布式爬虫打造搜索引擎简介07:23第2章windows下搭建开发环境2-1pycharm的安装和简单使用10:272-2mysql和navicat的安装
day9｜学习前端打卡 universe_01 前端算法
时间复杂度，O（1）的时间复杂度没有for循环O（N）O（logN）并列循环，加起来N+N嵌套循环NlogN时间复杂度和运行时间是不一样的东西空间复杂度：算法存储空间和输入值之间的关系array数组：在连续的内存空间中，储存一组相同类型的元素访问：通过索引去取的index搜索：直接去找元素enumerate（index，element）函数，遍历索引和元素数组排序的时间复杂度是NlogN声明式渲染
他位至大夫，却投河自尽，我们因他感到高兴。晚晚风微凉
原何投江?缘何等待?诺大的宫殿，辉煌的龙椅，端坐着的楚怀王，随波逐流的大臣，格格不入的屈原，仿佛定格在那个瞬间。突然，震怒的声音打破了短暂的平静。“屈大夫，你可知罪?”楚怀王手持奏折冲屈原喊到。“大王，臣不知何罪之有?”“不知何罪之有，还是不敢承认?”“请大王直言，臣确实不知有何罪?”“众人皆支持联秦，为何只有你屈原一人反对?是不想放弃钱财?还是另有所图?是你不忠?还是他人有二心?”“大王，明鉴哪
【家庭经济学】陈健中流砥柱陈健
【家庭经济学专栏】陈健（356）林园6确定性卖出“老公，老公”朱姨渐渐地觉得，林园的投.资策略更接地气，一早起来，就煮水泡茶，听朱公吹水。朱公品了口茶，“老婆，林园的确定性还有一个，就是确定性卖出。”“懂得卖出才是师傅啊！他怎卖出呢？”“他介绍了五种离场的方法。”朱公扳起拇指，“首先是持股公司经营困难；如果企业产品的毛利率有下降趋势，最终得到确认，就会坚决卖掉股.票。”“林园还提醒投资者说，股市最
安家大结局：集体辞职创业小健健求婚狐狸精念旧成瘾
相信最近很多网友都在追《安家》这部电视剧，其实在剧中有很多生活中很常见的情景，婆媳矛盾、夫妻离心以及生活带来的各种压力都让这部电视剧看起来非常的真实、这部剧让很多人产生共鸣，让我们一起来看看结局如何。源于生活老严夫妇起早贪黑在上海卖了大半辈子攒下来的积蓄，想为即将结婚的儿子买婚房，当时儿子和未来儿媳都在场，未来儿媳要求添上自己的名字，还趁机说自己怀孕了，徐姑姑知道这意味着什么，建议老严夫妇支付首付
AI产品经理面试宝典第18天：AI思维矩阵构建与实战应用面试题与答法 TGITCIC AI产品经理一线大厂面试题产品经理面试 AI产品经理面试大模型产品经理面试 AI面试大模型面试
如何构建AI思维矩阵？产品经理的"降维攻击"密码面试官：请解释什么是AI思维矩阵？作为产品经理如何构建这种思维？你的回答：AI思维矩阵不是技术架构，而是产品经理在AI时代的核心认知框架。它包含四个关键维度：软硬结合创新：如智能音箱通过硬件采集语音数据，软件优化交互体验，形成闭环数据驱动决策：在智能客服场景中，通过用户对话数据优化意图识别模型，实现NLU准确率提升30%生态协同视角：以智能家居为例，
淘宝返利微信公众号？淘宝返利app哪个最好氧惠好物
值得推荐返利app有哪些?十大返利最高的平台1、氧惠app（邀请码：666888）氧惠APP是一家综合优惠导购返佣分享型社交电商平台,致力于做全网全品类商品和服务的供给,为用户提供购物、餐饮、休闲娱乐及生活服务等领域的消费优惠,让用户可以一站式享受全网的优惠。手机应用商店搜索“氧惠”即可下载，注册填写邀请码：666888【氧惠】是一个自用省钱佣金高，分享推广赚钱多的平台，2022全新模式，0投资，
Instagram千号矩阵：亚矩阵云手机破解设备指纹检测的终极方案云云321 矩阵智能手机线性代数
在Instagram的全球化运营中，构建千号矩阵已成为品牌扩大曝光、精准触达用户的核心策略。然而，平台对设备指纹的强监管——通过硬件参数聚类、传感器动态性检测、IP地理一致性校验等200余个维度构建风控模型，使得传统多账号运营面临高封号率、低存活率的双重挑战。亚矩阵云手机通过动态设备指纹重置、智能行为仿真与独立IP池管理三大技术模块，为Instagram千号矩阵提供了安全、高效、低成本的解决方案。
jvm调优总结（从基本概念到深度优化） oloz java jvm jdk 虚拟机应用服务器
JVM参数详解：http://www.cnblogs.com/redcreen/archive/2011/05/04/2037057.html Java虚拟机中，数据类型可以分为两类：基本类型和引用类型。基本类型的变量保存原始值，即：他代表的值就是数值本身；而引用类型的变量保存引用值。“引用值”代表了某个对象的引用，而不是对象本身，对象本身存放在这个引用值所表示的地址的位置。
【Scala十六】Scala核心十：柯里化函数 bit1129 scala
本篇文章重点说明什么是函数柯里化，这个语法现象的背后动机是什么，有什么样的应用场景，以及与部分应用函数(Partial Applied Function)之间的联系 1. 什么是柯里化函数 A way to write functions with multiple parameter lists. For instance def f(x: Int)(y: Int) is a
HashMap dalan_123 java
HashMap在java中对很多人来说都是熟的；基于hash表的map接口的非同步实现。允许使用null和null键；同时不能保证元素的顺序；也就是从来都不保证其中的元素的顺序恒久不变。 1、数据结构在java中，最基本的数据结构无外乎：数组和引用（指针），所有的数据结构都可以用这两个来构造，HashMap也不例外，归根到底HashMap就是一个链表散列的数据
Java Swing如何实时刷新JTextArea，以显示刚才加append的内容周凡杨 java 更新 swing JTextArea
在代码中执行完textArea.append("message")后，如果你想让这个更新立刻显示在界面上而不是等swing的主线程返回后刷新，我们一般会在该语句后调用textArea.invalidate()和textArea.repaint()。问题是这个方法并不能有任何效果，textArea的内容没有任何变化，这或许是swing的一个bug，有一个笨拙的办法可以实现
servlet或struts的Action处理ajax请求 g21121 servlet
其实处理ajax的请求非常简单，直接看代码就行了： //如果用的是struts //HttpServletResponse response = ServletActionContext.getResponse(); // 设置输出为文字流 response.setContentType("text/plain"); // 设置字符集 res
FineReport的公式编辑框的语法简介老A不折腾 finereport 公式总结
FINEREPORT用到公式的地方非常多，单元格（以=开头的便被解析为公式），条件显示，数据字典，报表填报属性值定义，图表标题，轴定义，页眉页脚，甚至单元格的其他属性中的鼠标悬浮提示内容都可以写公式。简单的说下自己感觉的公式要注意的几个地方： 1.if语句语法刚接触感觉比较奇怪，if(条件式子,值1,值2)，if可以嵌套，if(条件式子1，值1，if(条件式子2，值2，值3)
linux mysql 数据库乱码的解决办法墙头上一根草 linux mysql 数据库乱码
linux 上mysql数据库区分大小写的配置 lower_case_table_names=1 1-不区分大小写 0-区分大小写修改/etc/my.cnf 具体的修改内容如下: [client] default-character-set=utf8 [mysqld] datadir=/var/lib/mysql socket=/va
我的spring学习笔记6-ApplicationContext实例化的参数兼容思想 aijuans Spring 3
ApplicationContext能读取多个Bean定义文件，方法是： ApplicationContext appContext = new ClassPathXmlApplicationContext（ new String[]｛“bean-config1.xml”，“bean-config2.xml”，“bean-config3.xml”，“bean-config4.xml
mysql 基准测试之sysbench annan211 基准测试 mysql基准测试 MySQL测试 sysbench
1 执行如下命令，安装sysbench-0.5： tar xzvf sysbench-0.5.tar.gz cd sysbench-0.5 chmod +x autogen.sh ./autogen.sh ./configure --with-mysql --with-mysql-includes=/usr/local/mysql
sql的复杂查询使用案列与技巧百合不是茶 oracle sql 函数数据分页合并查询
本片博客使用的数据库表是oracle中的scott用户表; ------------------- 自然连接查询查询 smith 的上司(两种方法) &
深入学习Thread类 bijian1013 java thread 多线程 java多线程
一．线程的名字下面来看一下Thread类的name属性，它的类型是String。它其实就是线程的名字。在Thread类中，有String getName()和void setName(String)两个方法用来设置和获取这个属性的值。同时，Thr
JSON串转换成Map以及如何转换到对应的数据类型 bijian1013 java fastjson net.sf.json
在实际开发中，难免会碰到JSON串转换成Map的情况，下面来看看这方面的实例。另外，由于fastjson只支持JDK1.5及以上版本，因此在JDK1.4的项目中可以采用net.sf.json来处理。一.fastjson实例 JsonUtil.java package com.study; impor
【RPC框架HttpInvoker一】HttpInvoker：Spring自带RPC框架 bit1129 spring
HttpInvoker是Spring原生的RPC调用框架，HttpInvoker同Burlap和Hessian一样，提供了一致的服务Exporter以及客户端的服务代理工厂Bean，这篇文章主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中
【Mahout二】基于Mahout CBayes算法的20newsgroup的脚本分析 bit1129 Mahout
#!/bin/bash # # Licensed to the Apache Software Foundation (ASF) under one or more # contributor license agreements. See the NOTICE file distributed with # this work for additional information re
nginx三种获取用户真实ip的方法 ronin47
随着nginx的迅速崛起，越来越多公司将apache更换成nginx. 同时也越来越多人使用nginx作为负载均衡, 并且代理前面可能还加上了CDN加速，但是随之也遇到一个问题：nginx如何获取用户的真实IP地址,如果后端是apache,请跳转到<apache获取用户真实IP地址>，如果是后端真实服务器是nginx，那么继续往下看。实例环境：用户IP 120.22.11.11
java-判断二叉树是不是平衡 bylijinnan java
参考了 http://zhedahht.blog.163.com/blog/static/25411174201142733927831/ 但是用java来实现有一个问题。由于Java无法像C那样“传递参数的地址，函数返回时能得到参数的值”，唯有新建一个辅助类：AuxClass import ljn.help.*; public class BalancedBTree {
BeanUtils.copyProperties VS PropertyUtils.copyProperties 诸葛不亮 PropertyUtils BeanUtils
BeanUtils.copyProperties VS PropertyUtils.copyProperties 作为两个bean属性copy的工具类，他们被广泛使用，同时也很容易误用，给人造成困然；比如：昨天发现同事在使用BeanUtils.copyProperties copy有integer类型属性的bean时，没有考虑到会将null转换为0，而后面的业
[金融与信息安全]最简单的数据结构最安全 comsci 数据结构
现在最流行的数据库的数据存储文件都具有复杂的文件头格式，用操作系统的记事本软件是无法正常浏览的，这样的情况会有什么问题呢？从信息安全的角度来看，如果我们数据库系统仅仅把这种格式的数据文件做异地备份，如果相同版本的所有数据库管理系统都同时被攻击，那么
vi区段删除 Cwind linux vi 区段删除
区段删除是编辑和分析一些冗长的配置文件或日志文件时比较常用的操作。简记下vi区段删除要点备忘。 vi概述引文中并未将末行模式单独列为一种模式。单不单列并不重要，能区分命令模式与末行模式即可。 vi区段删除步骤： 1. 在末行模式下使用:set nu显示行号非必须，随光标移动vi右下角也会显示行号，能够正确找到并记录删除开始行
清除tomcat缓存的方法总结 dashuaifu tomcat 缓存
用tomcat容器，大家可能会发现这样的问题，修改jsp文件后，但用IE打开依然是以前的Jsp的页面。出现这种现象的原因主要是tomcat缓存的原因。解决办法如下: 在jsp文件头加上 <meta http-equiv="Expires" content="0"> <meta http-equiv="kiben&qu
不要盲目的在项目中使用LESS CSS dcj3sjt126com Web less
　如果你还不知道LESS CSS是什么东西，可以看一下这篇文章，是我一朋友写给新人看的《CSS——LESS》　　不可否认，LESS CSS是个强大的工具，它弥补了css没有变量、无法运算等一些“先天缺陷”，但它似乎给我一种错觉，就是为了功能而实现功能。　　比如它的引用功能 ? .rounded_corners{
[入门]更上一层楼 dcj3sjt126com PHP yii2
更上一层楼通篇阅读完整个“入门”部分，你就完成了一个完整 Yii 应用的创建。在此过程中你学到了如何实现一些常用功能，例如通过 HTML 表单从用户那获取数据，从数据库中获取数据并以分页形式显示。你还学到了如何通过 Gii 去自动生成代码。使用 Gii 生成代码把 Web 开发中多数繁杂的过程转化为仅仅填写几个表单就行。本章将介绍一些有助于更好使用 Yii 的资源：
Apache HttpClient使用详解 eksliang httpclient http协议
Http协议的重要性相信不用我多说了，HttpClient相比传统JDK自带的URLConnection，增加了易用性和灵活性（具体区别，日后我们再讨论），它不仅是客户端发送Http请求变得容易，而且也方便了开发人员测试接口（基于Http协议的），即提高了开发的效率，也方便提高代码的健壮性。因此熟练掌握HttpClient是很重要的必修内容，掌握HttpClient后，相信对于Http协议的了解会
zxing二维码扫描功能 gundumw100 android zxing
经常要用到二维码扫描功能现给出示例代码 import com.google.zxing.WriterException; import com.zxing.activity.CaptureActivity; import com.zxing.encoding.EncodingHandler; import android.app.Activity; import an
纯HTML+CSS带说明的黄色导航菜单 ini html Web html5 css hovertree
HoverTree带说明的CSS菜单:纯HTML+CSS结构链接带说明的黄色导航在线体验效果：http://hovertree.com/texiao/css/1.htm代码如下,保存到HTML文件可以看到效果： <!DOCTYPE html > <html > <head> <title>HoverTree
fastjson初始化对性能的影响 kane_xie fastjson 序列化
之前在项目中序列化是用thrift，性能一般，而且需要用编译器生成新的类，在序列化和反序列化的时候感觉很繁琐，因此想转到json阵营。对比了jackson，gson等框架之后，决定用fastjson，为什么呢，因为看名字感觉很快。。。网上的说法： fastjson 是一个性能很好的 Java 语言实现的 JSON 解析器和生成器，来自阿里巴巴的工程师开发。
基于Mybatis封装的增删改查实现通用自动化sql mengqingyu DAO
1.基于map或javaBean的增删改查可实现不写dao接口和实现类以及xml，有效的提高开发速度。 2.支持自定义注解包括主键生成、列重复验证、列名、表名等 3.支持批量插入、批量更新、批量删除 <bean id="dynamicSqlSessionTemplate" class="com.mqy.mybatis.support.Dynamic
js控制input输入框的方法封装(数字，中文，字母，浮点数等) qifeifei javascript js
在项目开发的时候，经常有一些输入框，控制输入的格式，而不是等输入好了再去检查格式，格式错了就报错，体验不好。 /** 数字，中文，字母,浮点数(+/-/.) 类型输入限制，只要在input标签上加上 jInput="number,chinese,alphabet,floating" 备注：floating属性只能单独用*/ funct
java 计时器应用 tangqi609567707 java timer
mport java.util.TimerTask; import java.util.Calendar; public class MyTask extends TimerTask { private static final int
erlang输出调用栈信息 wudixiaotie erlang
在erlang otp的开发中，如果调用第三方的应用，会有有些错误会不打印栈信息，因为有可能第三方应用会catch然后输出自己的错误信息，所以对排查bug有很大的阻碍，这样就要求我们自己打印调用的栈信息。用这个函数：erlang:process_display (self (), backtrace).需要注意这个函数只会输出到标准错误输出。也可以用这个函数：erlang:get_s

加拿大两院院士裴健：搜索皆智能，智能皆搜索

你可能感兴趣的:(加拿大两院院士裴健：搜索皆智能，智能皆搜索)