东南大学崇志宏

崇志宏转“博弈机器学习”-东南大学机器学习

博弈机器学习和贝叶斯学习可以看成集成目前机器学习组件的理论框架，解决从感知到认知的人工智能技术问题。崇志宏 http://cse.seu.edu.cn/people/zhchong/index.htm

刘铁岩：博弈机器学习是什么？

作者：微软亚洲研究院首席研究员刘铁岩

拖至文末查看相关论文

人工智能早就不是一个新词了。早在六十年前，在达特茅斯学院举行的一次会议就正式确立了人工智能（Artificial Intelligence）的名称，以及研究领域和任务。在那之后，人工智能几经沉浮，走过黄金时代，也走过人工智能的寒冬。如今，人工智能又迎来了新的春天，不管是Skype Translator实时的语音翻译技术，超过人类准确度的图像识别技术，像微软小娜、小冰一样琳琅满目的聊天机器人，还是不久前的人机围棋大战，都让我们目睹了人工智能技术的一个又一个突破。身处人工智能时代，一方面，我们对人工智能的未来充满信心，另一方面我们也需要深刻反思现在的人工智能技术是否存在局限性，而未来的人工智能之旅又该去向何方？

从个体智能到社会智能

作为人工智能领域的研究人员，我认为“人工智能即将取代人类”的想法未免太过“乐观”了。事实上，目前人类对人工智能的研究还停留在相当初级的个体智能阶段，即计算机仍只能完成某些单一任务，例如识别出图像中的内容、听懂一段语音、打赢某个电子游戏，或者在某次考试中取得一定成绩……虽然计算机在某些特定领域或某些特定任务上的表现已经逐渐逼近人类，甚至超越人类，但这些任务通常目标单一，且缺乏与其他智能个体（人类）或群体的互动。

从智商到情商，从个体智能到群体智能，是实现人工智能的一道重要门槛。不夸张地讲，如果我们人类只有个体智能，而不知道如何和其他同类打交道，不能通过群体和社会来不断放大我们的智能的话，那么我们将无法像今天一样成为万物之灵。在日常生活中，有很多例子都能充分表明拥有社会智能，并充分利用社会智能的重要性。比如商业领域的互联网广告竞价、股票交易；公共服务领域的城市交通、教育；甚至到各项政策的推行、法律法规的制定等等。在这些例子中，每一次规则与政策的变化，参与其中的人（局中人，player）也会根据策略相应地调整自己的行为。

人类做出每一项决策，其实都是与其他若干拥有同样智能的人类相互博弈的过程。本着趋利避害的本能，人类倾向于在相互博弈的过程中做出最有利于自己的决策。相比之下，人工智能技术的行为原理，大多假设世界是客观存在（或者一成不变、或者具有稳定的统计属性），很少考虑到它要处理的数据可能是另外一个智能体在与自己博弈的过程中产生的。这种简单的假设会使得人工智能的算法只具备个体智能，而缺乏社会智能，从而很难在与聪明的人类交往的过程中真正逼近或者超越人类。

具体来讲，绝大部分人工智能和机器学习方法都是基于这样的一个假设——用于研究的数据（或产生数据的环境）是预先存在的，而且它的统计规律不因学习过程本身而改变。机器学习过程就是对这些数据进行分析和学习，理清其潜在的数据分布，从而找到合适的分类器、回归器，实现对未来事件的预测。这种假设在某些情况下是合理的，例如用于图像识别的大量图像及标签数据，用于语音识别的声音数据，用于机器翻译的语言数据等。这类数据都十分可靠、稳定，不会持续地发生变化，我们也易于用一些概率分布去描述这些数据。

与这类稳定的天然数据不同，在互联网时代我们所说的大数据却并不是一成不变的。例如应用商店的下载排名发生变化时，用户的下载行为也会产生相应的变化；例如搜索引擎给出不同的查询结果页时，用户的点击行为也会因为排序的变化而改变；又例如在社交媒体中，回复、跟帖、转发等大量数据产生都是由人类这一智能体产生的，并且会根据系统的推荐算法、其他用户的互动行为而发生变化。在这些例子中，如果我们依据收集好的历史数据学到一个模型（比如排序模型或推荐模型）并把它应用到实际中，一旦用户的行为随之发生了变化（从而导致数据分布的变化），原来学到的模型将不再最优，其性能可能远远低于我们的预期。但人们的行为变化迅速，即便我们再根据变化之后的数据更新模型，也总会比人们行为的改变慢上一拍，在这个由博弈导致的变化环境中永远与“最优”隔岸相望。

此前，我的团队在与微软在线广告部门合作时，就发现了这样的问题。我们团队首先依据此前累积的数据，帮微软广告部门离线训练了一个效果极佳的机器学习模型用于必应广告搜索中的竞价排名。上线之初模型立刻带来了很大的效益，但随着时间的推移，广告效益却大打折扣。我们很快地找到了这个现象的根源：广告竞价排名过程常常涉及到人（广告主）的因素，广告主会敏锐地发现因为广告竞价算法的改变所带来的自己广告投放成本和收益的变化，从而相应地调整自己的广告投放策略，这是一个动态的变化过程。如果不考虑经济规律和人的动态策略，离线地进行机器学习模型的训练，结果自然会产生很大的偏差。

广告竞价的过程包含广告平台与广告主之间的互动，以及广告主之间的相互博弈，想要对其进行精准建模，仅靠机器学习的知识背景是显然不够的。因此我们团队把博弈论的思想引入机器学习，并于2013年在国际人工智能大会（IJCAI）上首次提出了“博弈机器学习”的概念，将博弈论的思想引入机器学习中，即以博弈论的思想对人的动态策略进行显式建模，利用行为模型和决策模型相结合的方式来解决这一类难题。有了博弈机器学习，我们的算法就可以比人多想一步、甚至多想很多步，提前预料对方会做出什么样的反应，从而在与博弈的时候占得先机。

行为经济学和增强学习

此前，学术界还有多种方法用于解决个体和个体之间的博弈问题，例如行为经济学、增强学习等等，博弈机器学习与这些学科既有联系又有区别。

首先是行为经济学，这是一个经济学概念，研究人员主要是经济学家。我们知道，传统经济学的基本假设是人是完全理性的，但这种假设在很多实际情况下是不合理的。例如，情况一：你扔一枚硬币，正面就给你1000块钱，反面就一分钱也不给你；情况二：直接给你500块钱。这两种情况从理性角度并无区别（期望的收益都是500块钱），但在现实生活中，人可能因为对风险的恐惧，更倾向于选择直接拿500块钱。为了更好地解释人类的这种行为，学者们又提出了有限理性的概念，对传统经济学进行了修正，从而衍生出了行为经济学这个学术分支。行为经济学虽然比传统经济学更加合理，但是其主要研究目的仍然和传统经济学一脉相承——对经济数据进行解释，而在计算机领域我们则是希望通过构建算法模型对将要发生的事情进行计算和预测。

增强学习，大家都知道此前的围棋机器人所采用的主要算法之一叫做增强学习。增强学习主要关注的是智能体如何在环境中通过采取一系列行动（包括探索和利用），获得最大累积回报的自学习策略。增强学习认为数据是环境产生的，并且把环境分成随机型和对手型两种进行考察。虽然在对手型增强学习里，某种程度上考虑了算法和环境的博弈过程，但是它没有对对手的行为进行显式建模，而是简单地使用最大最小准则来得出最坏情况下的学习路径。从这个意义上讲，它对于对手的理解很有限，和人们想象的不同，这种算法不能达到比对手多想一步的效果。以人机围棋大战为例，系统并没有针对博弈对象（李世乭）本身的行为特点（棋路、现场表现、情绪状态等）采取有的放矢的个性化策略，而是利用离线习得的策略函数和价值函数、以及在线的蒙特卡洛树搜索来决定如何出招。

真实的人类行为既非随机、也非完全理性和对立——事实上人类（智能体）的行为往往会有一定规律可循。与前面提到的这些技术不同，博弈机器学习就是利用了这样一个简单的常识。无论是人与人之间的互动，还是人与计算机之间的互动都是可以被建模的，这样我们就能够知道这些人为的数据是如何产生的，从而在学习的过程中对此加以利用，从而在和人类博弈的过程中占得先机。

用博弈机器学习解决现实生活中的问题

除了我们前面提到的，博弈机器学习可以帮助我们优化在线广告的竞价机制，它的思想在很多其他领域都大有用武之地，比如社交媒体、众包管理、交通疏导等等。一旦我们在机器学习的过程中，对人的行为模型做出学习和描述，就可以知道我们的算法机制发生改变之后，人们的行为会怎么去改变，从而知道在很长时间以后当人的行为趋于稳定（均衡态），我们取得的结果是好是坏。

以城市交通为例：

目前城市中的其中一条主干道A堵车情况十分严重，另外一条路线B行驶缓慢，而路线C较为畅通，那么当司机通过导航等渠道得知了这个信息之后会做出怎么样的选择呢？很有可能司机们选择一窝蜂涌入道路C而造成该道路极为拥堵，当然也可能存在大量无论如何也不愿意绕远路而死守在最短路线A上的司机。那么如何实现理想的资源优化配置呢？

如果从博弈机器学习的角度来思考，我们首先会注意到每位司机都有着大量的驾驶数据，例如几点出门，几点回家，习惯走哪条路，备用路线通常是什么、对拥堵的忍耐程度、是否常常根据导航给出的建议改变行车路线、等等。倘若我们将这些数据利用起来，为每个司机构建个性化的行为模型，那么作为交通诱导信息的发布者（这里我们假设是交管局或者导航软件）就可以预测在发布某个交通诱导信息之后对城内交通可能带来的影响，并以此为依据来帮助决策者选择更好的诱导策略，甚至能有针对性的对不同行为偏好的司机提供不同的诱导策略。而对于一些数据量较少，不足以构建个性化行为模型的司机，我们可以做一些聚类模型，或是采用通用模型，加以解决。

2013年，我们提出的“博弈机器学习”理念随后得到了学术界的广泛肯定，很多国际知名的博弈论专家、以及机器学习专家也开始纷纷进入这一领域。现在回想起来，之所以我们的工作会取得这么大的反响，是有原因的。首先，算法博弈论的研究通常是以理论研究为主，对应用的研究相对较少。但在微软亚洲研究院，我们是站在工业界的角度，能够发现实际问题，并找到理论问题与实际问题之间的差距和联系，从而弥补这一方面的空白。正是因为这种独特的角度，近几年我们的研究组提出了大量全新的问题，受到了理论界的广泛欢迎。其次，机器学习的主流研究人员是统计学家和数据科学家，而博弈论研究的主力则是组合数学家和理论计算机科学家。这原本是两个非常不同的世界。但现实问题多是既有组合又有概率，既有数据又需要理论分析，我们研究组的背景恰恰与此吻合——我们同时具有统计背景和博弈论知识，自然而然就担当起了学科交流融合的角色，并为这两个学科都引入了新鲜血液。

当计算机学会博弈

什么才是人工智能？想要解决这个问题，首先需要为“智能”提出一个定义。如果说过去对于个体智能的研究为计算机赋予了智商（IQ）的话，那么社会智能则对应着人工智能的情商（EQ）。三人成众，人类是具有极强社会性的动物，而“社会性”则少不了与其他人类进行互动，这样的互动体现出的就是情商和社会智能。真正想把人类的智能研究清楚，把个体智能扩展到社会智能是一条必经之路；而想要把社会智能解释清楚，既利用了人类的行为数据，又利用了群体之间博弈行为本质的博弈机器学习将会是一个绝佳的工具。

为计算机打造出高情商，博弈机器学习可能是个极佳的解决方案。通过观察周围人的行为，对每个人构建不同的个性化行为模型，计算机就可以三思而后行，选择一条能让周围人最大化满意的策略。假设我们现在要设计一个聊天机器人，那么有了博弈机器学习，我们就可以基于用户的个性化行为模型，计算一下当机器人说出某句话以后其他人会有什么反应，几个人开心，几个人生气，最终是否能达到平衡，平衡的结果是大家都离我而去，还是相谈甚欢。这样的聊天机器人可以超越简单的问答模式，懂得“察言观色”、“看人说话”，体现出非同凡响的情商。我们的研究组目前正在和微软的小冰团队一起，探索这方的技术和应用，如果小冰学会博弈、具有情商，那样我们离真正的人工智能就更近了一步。

经常有年轻的研究员问我，如何在当下火热的人工智能大潮中把握好前进的方向。从我的研究经历出发，其实上面提到的博弈机器学习的研究历程就是一个很好的例子。当一个人拥有非常宽的领域知识、并且怀揣强烈的好奇心，对应用还非常敏感，那么他就可以很容易找到属于自己的独特的研究方向，做出对学术界和产业界都有价值的创新性研究。微软亚洲研究院正是一个可以帮助大家实现这一目标的孵化器，欢迎各路有才华有想法的年轻人加入我们，一起开拓更新的世界，为世界创造更多的价值。

参考论文：

1) Di He, Wei Chen, Liwei Wang, and Tie-Yan Liu, A Game-theoretic Machine Learning Approach for Revenue Maximization in Sponsored Search, IJCAI 2013.

2) Tie-Yan Liu, Wei Chen, and Tao Qin, Mechanism Learning with Mechanism Induced Data, AAAI 2015.

3) Haifang Li, Wei Chen, Fei Tian, Tao Qin, and Tie-Yan Liu, Generalization Analysis for Game-theoretic Machine Learning, AAAI 2015.

4) Fei Tian, Haifang Li, Wei Chen, Tao Qin and Tie-Yan Liu, Agent Behavior Prediction and Its Generalization Analysis, AAAI 2014.

5) Wei Chen, Tie-Yan Liu, and Xinxin Yang, Reinforcement Learning Behaviors in Sponsored Search, Applied Stochastic Models in Business and Industry, 2016.

6) Tao Qin, Wei Chen, and Tie-Yan Liu, Sponsored Search Auctions: Recent Advances and Future Directions, ACM Transactions on Intelligent Systems and Technology, 2014.

7) Di He, Wei Chen, Liwei Wang, and Tie-Yan Liu, Online Learning for Auction Mechanism in Bandit Setting, Decision Support Systems, 2013

8) Haifeng Xu, Diyi Yang, Bin Gao and Tie-Yan Liu, Predicting Advertiser Bidding Behaviors in Sponsored Search by Rationality Modeling, WWW 2013.

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
直返最高等级与直返APP：无需邀请码的返利新体验古楼
随着互联网的普及和电商的兴起，直返模式逐渐成为一种流行的商业模式。在这种模式下，消费者通过购买产品或服务，获得一定的返利，并可以分享给更多的人。其中，直返最高等级和直返APP是直返模式中的重要概念和工具。本文将详细介绍直返最高等级的概念、直返APP的使用以及与邀请码的关系。【高省】APP（高佣金领导者）是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，运行三年，稳定可靠。高省APP，
【加密社】Solidity 中的事件机制及其应用加密社闲侃区块链智能合约区块链
加密社引言在Solidity合约开发过程中，事件（Events）是一种非常重要的机制。它们不仅能够让开发者记录智能合约的重要状态变更，还能够让外部系统（如前端应用）监听这些状态的变化。本文将详细介绍Solidity中的事件机制以及如何利用不同的手段来触发、监听和获取这些事件。事件存储的地方当我们在Solidity合约中使用emit关键字触发事件时，该事件会被记录在区块链的交易收据中。具体而言，事件
在一台Ubuntu计算机上构建Hyperledger Fabric网络落叶无声9 区块链超级账本 Hyperledger fabric 区块链 ubuntu 构建 hyperledger fabric
在一台Ubuntu计算机上构建HyperledgerFabric网络Hyperledgerfabric是一个开源的区块链应用程序平台，为开发基于区块链的应用程序提供了一个起点。当我们提到HyperledgerFabric网络时，我们指的是使用HyperledgerFabric的正在运行的系统。即使只使用最少数量的组件，部署Fabric网络也不是一件容易的事。Fabric社区创建了一个名为Cello
2019考研 | 西交大软件工程笔者阿蓉
本科背景：某北京211学校电子信息工程互联网开发工作两年录取结果：全日制软件工程学院分数：初试350+复试笔试80+面试85+总排名：100+从五月份开始脱产学习，我主要说一下专业课和复试还有我对非全的一些看法。【数学100+】张宇，张宇，张宇。跟着张宇学习，入门视频刷一遍，真题刷两遍，错题刷三遍。书刷N多遍。从视频开始学习，是最快的学习方法。5-7月份把主要是数学学好，8-9月份开始给自己每个周
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
探索ASPICE V3.1：汽车行业软件开发的中文指南阮懿同
探索ASPICEV3.1：汽车行业软件开发的中文指南ASPICE_V3.1中文版.pdf.zip项目地址:https://gitcode.com/open-source-toolkit/422a2在汽车软件工程领域，高质量的标准对于确保行车安全和提升用户体验至关重要。今天，我们为您介绍一个珍贵的开源宝藏——ASPICEV3.1中文版资源。这是一篇专为国内汽车行业开发者、质量管理者准备的深度解读，旨
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
Go编程语言前景怎么样？参加培训好就业吗 QFdongdong
Go语言专门针对多处理器系统应用程序的编程进行了优化，使用Go编译的程序可以媲美C或C++代码的速度，而且更加安全、支持并行进程。不仅可以开发web,可以开发底层，目前知乎就是用golang开发。区块链首选语言就是go,以-太坊，超级账本都是基于go语言，还有go语言版本的btcd.Go的目标是希望提升现有编程语言对程序库等依赖性(dependency)的管理，这些软件元素会被应用程序反复调用。由
音视频知识图谱 2022.04 关键帧Keyframe
前些时间，我在知识星球上创建了一个音视频技术社群：关键帧的音视频开发圈，在这里群友们会一起做一些打卡任务。比如：周期性地整理音视频相关的面试题，汇集一份音视频面试题集锦，你可以看看《音视频面试题集锦2022.04》。再比如：循序渐进地归纳总结音视频技术知识，绘制一幅音视频知识图谱。下面是2022.04月知识图谱新增的内容节选：1）图谱路径：**采集/音频采集/声音三要素/响度******主观计量响
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
区块链～我的念夜未央0075460
世界上最快的速度不是光，不是电，而是我们的「念」。一念起，万水千山；一念灭，沧海桑田。念起念灭当随缘，切莫执迷。执念区块链
不简单的简化之路颜小婧
简化16年前，畅销书作者理查德·科克向世人介绍了80/20法则，即我们80%的成就源于仅仅20%的时间、努力和关键决策。对于这个80/20法则，我相信大家都很熟悉了。而被称为80/20法则之父的的理查德·科克和格雷格·洛克伍德一起合作了一本《极简法则》，揭示了：简化是创造大规模市场、建立高盈利企业的秘密。通过对亚马逊、苹果、宜家、福特等成功的企业所采取的商业模式的分析得出两种简化策略：价格简化和命
【深度学习】训练过程中一个OOM的问题，太难查了 weixin_40293999 深度学习深度学习人工智能
现象：各位大佬又遇到过ubuntu的这个问题么？现象是在训练过程中，ssh上不去了，能ping通，没死机，但是ubunutu的pc侧的显示器，鼠标啥都不好用了。只能重启。问题原因：OOM了95G，尼玛！！！！pytorch爆内存了，然后journald假死了，在journald被watchdog干掉之后，系统就崩溃了。这种规模的爆内存一般，即使被oomkill了，也要卡半天的，确实会这样，能不能配
20180718 今日思考水到渠成逄格亮
创业这件事愈发感觉有意思，前年计划去年是一个样子，去年计划今年又是一个样子。如果反过来看就会发现前年的计划跟去年关系不大，去年的计划跟今年也关系不大。没错，有的时候会发现很多机会根本不是计划出来的，而是长出来的。跟一个老朋友交流，谈起来我们业务未来的商业模式，他给了很多建议，这样的平台，那样的入口，总之就是很为我着急，为我没有更好的获得客户收益而感到惋惜。我则不以为然，我说如果说去年没有想到今年，
时间买卖 ziworeborn
以下为《通往财富自由之路》专栏中，关于时间买卖的笔记摘要。如果把一个人比作一个公司的话，刚开始我们的商业模式只能单份出售自己的时间。在这个阶段，升级个人商业模式的核心只有一个，提高我们的单位时间售价。在这个阶段，大多数人会做出最终被证明不明智的选择，把自己的付出与自己的单位时间售价直接挂钩，于是，开始不由自主地采用两个简单粗暴的方式提高自己的单位时间售价：磨洋工、喊高价。然而，长期来看，这其实是不
以太坊DApp开发指南 Kirn
DApp架构设计DApp架构.png如上图，DApp的架构我们可以简单分为以上三种类型：轻钱包模式、重钱包模式和兼容模式。轻钱包模式轻钱包模式下我们需要有一个开放HttpRPC协议的节点与钱包通信，这个节点可以是任意链上的节点。轻钱包通常会作为一个浏览器插件存在，插件在运行时会自动注入Web3框架，DApp可以通过Web3与区块链节点通信。当DApp只是单纯的获取数据时是不需要钱包介入的，但是当D
面试常见题之Spring Cloud 拾光编程 java面试面试 spring cloud 职场和发展
在Java软件工程师的面试中，关于SpringCloud的题目旨在考察候选人对微服务架构的理解、SpringCloud各组件的掌握程度、以及如何在实际项目中应用这些技术来构建可扩展、可靠和高效的服务。本文将概括性地列出20个关于SpringCloud的面试题目，并为每个题目提供一个简要的回答框架或关键点，以便你根据需要进行扩展。1.SpringCloud是什么？它解决了什么问题？回答框架：Spri
云服务业界动态简报-20180128 Captain7
一、青云青云QingCloud推出深度学习平台DeepLearningonQingCloud，包含了主流的深度学习框架及数据科学工具包，通过QingCloudAppCenter一键部署交付，可以让算法工程师和数据科学家快速构建深度学习开发环境，将更多的精力放在模型和算法调优。二、腾讯云1.腾讯云正式发布腾讯专有云TCE(TencentCloudEnterprise)矩阵，涵盖企业版、大数据版、AI
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
深度学习-13-小语言模型之SmolLM的使用皮皮冰燃深度学习深度学习
文章附录1SmolLM概述1.1SmolLM简介1.2下载模型2运行2.1在CPU/GPU/多GPU上运行模型2.2使用torch.bfloat162.3通过位和字节的量化版本3应用示例4问题及解决4.1attention_mask和pad_token_id报错4.2max_new_tokens=205参考附录1SmolLM概述1.1SmolLM简介SmolLM是一系列尖端小型语言模型，提供三种规
apache 安装linux windows 墙头上一根草 apache inux windows
linux安装Apache 有两种方式一种是手动安装通过二进制的文件进行安装，另外一种就是通过yum 安装，此中安装方式，需要物理机联网。以下分别介绍两种的安装方式通过二进制文件安装Apache需要的软件有apr,apr-util,pcre 1，安装 apr 下载地址：htt
fill_parent、wrap_content和match_parent的区别 Cb123456 match_parent fill_parent
fill_parent、wrap_content和match_parent的区别: 1）fill_parent 设置一个构件的布局为fill_parent将强制性地使构件扩展，以填充布局单元内尽可能多的空间。这跟Windows控件的dockstyle属性大体一致。设置一个顶部布局或控件为fill_parent将强制性让它布满整个屏幕。 2） wrap_conte
网页自适应设计天子之骄 html css 响应式设计页面自适应
网页自适应设计网页对浏览器窗口的自适应支持变得越来越重要了。自适应响应设计更是异常火爆。再加上移动端的崛起，更是如日中天。以前为了适应不同屏幕分布率和浏览器窗口的扩大和缩小，需要设计几套css样式，用js脚本判断窗口大小，选择加载。结构臃肿，加载负担较大。现笔者经过一定时间的学习，有所心得，故分享于此，加强交流，共同进步。同时希望对大家有所
[sql server] 分组取最大最小常用sql 一炮送你回车库 SQL Server
--分组取最大最小常用sql--测试环境if OBJECT_ID('tb') is not null drop table tb;gocreate table tb( col1 int, col2 int, Fcount int)insert into tbselect 11,20,1 union allselect 11,22,1 union allselect 1
ImageIO写图片输出到硬盘 3213213333332132 java image
package awt; import java.awt.Color; import java.awt.Font; import java.awt.Graphics; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imagei
自己的String动态数组宝剑锋梅花香 java 动态数组数组
数组还是好说，学过一两门编程语言的就知道，需要注意的是数组声明时需要把大小给它定下来，比如声明一个字符串类型的数组：String str[]=new String[10]; 但是问题就来了，每次都是大小确定的数组，我需要数组大小不固定随时变化怎么办呢？动态数组就这样应运而生，龙哥给我们讲的是自己用代码写动态数组，并非用的ArrayList 看看字符
pinyin4j工具类 darkranger .net
pinyin4j工具类Java工具类 2010-04-24 00:47:00 阅读69 评论0 字号：大中小引入pinyin4j-2.5.0.jar包: pinyin4j是一个功能强悍的汉语拼音工具包，主要是从汉语获取各种格式和需求的拼音，功能强悍，下面看看如何使用pinyin4j。本人以前用AscII编码提取工具，效果不理想，现在用pinyin4j简单实现了一个。功能还不是很完美，
StarUML学习笔记----基本概念 aijuans UML建模
介绍StarUML的基本概念，这些都是有效运用StarUML?所需要的。包括对模型、视图、图、项目、单元、方法、框架、模型块及其差异以及UML轮廓。模型、视与图（Model, View and Diagram） &
Activiti最终总结 avords Activiti id 工作流
1、流程定义ID：ProcessDefinitionId，当定义一个流程就会产生。 2、流程实例ID：ProcessInstanceId，当开始一个具体的流程时就会产生，也就是不同的流程实例ID可能有相同的流程定义ID。 3、TaskId，每一个userTask都会有一个Id这个是存在于流程实例上的。 4、TaskDefinitionKey和（ActivityImpl activityId
从省市区多重级联想到的，react和jquery的差别 bee1314 jquery UI react
在我们的前端项目里经常会用到级联的select，比如省市区这样。通常这种级联大多是动态的。比如先加载了省，点击省加载市，点击市加载区。然后数据通常ajax返回。如果没有数据则说明到了叶子节点。针对这种场景，如果我们使用jquery来实现，要考虑很多的问题，数据部分，以及大量的dom操作。比如这个页面上显示了某个区，这时候我切换省，要把市重新初始化数据，然后区域的部分要从页面
Eclipse快捷键大全 bijian1013 java eclipse 快捷键
Ctrl+1 快速修复(最经典的快捷键,就不用多说了)Ctrl+D: 删除当前行 Ctrl+Alt+↓ 复制当前行到下一行(复制增加)Ctrl+Alt+↑ 复制当前行到上一行(复制增加)Alt+↓ 当前行和下面一行交互位置(特别实用,可以省去先剪切,再粘贴了)Alt+↑ 当前行和上面一行交互位置(同上)Alt+← 前一个编辑的页面Alt+→ 下一个编辑的页面(当然是针对上面那条来说了)Alt+En
js 笔记函数征客丶 JavaScript
一、函数的使用 1.1、定义函数变量 var vName = funcation(params){ } 1.2、函数的调用函数变量的调用： vName(params); 函数定义时自发调用：(function(params){})(params); 1.3、函数中变量赋值 var a = 'a'; var ff
【Scala四】分析Spark源代码总结的Scala语法二 bit1129 scala
1. Some操作在下面的代码中，使用了Some操作：if (self.partitioner == Some(partitioner))，那么Some(partitioner)表示什么含义？首先partitioner是方法combineByKey传入的变量， Some的文档说明： /** Class `Some[A]` represents existin
java 匿名内部类 BlueSkator java匿名内部类
组合优先于继承 Java的匿名类，就是提供了一个快捷方便的手段，令继承关系可以方便地变成组合关系继承只有一个时候才能用，当你要求子类的实例可以替代父类实例的位置时才可以用继承。在Java中内部类主要分为成员内部类、局部内部类、匿名内部类、静态内部类。内部类不是很好理解，但说白了其实也就是一个类中还包含着另外一个类如同一个人是由大脑、肢体、器官等身体结果组成，而内部类相
盗版win装在MAC有害发热，苹果的东西不值得买，win应该不用 ljy325 游戏 apple windows XP OS
Mac mini 型号: MC270CH-A RMB:5,688 Apple 对windows的产品支持不好,有以下问题: 1.装完了xp,发现机身很热虽然没有运行任何程序！貌似显卡跑游戏发热一样，按照那样的发热量,那部机子损耗很大,使用寿命受到严重的影响! 2.反观安装了Mac os的展示机，发热量很小，运行了1天温度也没有那么高 &nbs
读《研磨设计模式》-代码笔记-生成器模式-Builder bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 生成器模式的意图在于将一个复杂的构建与其表示相分离，使得同样的构建过程可以创建不同的表示（GoF） * 个人理解： * 构建一个复杂的对象，对于创建者（Builder）来说，一是要有数据来源(rawData)，二是要返回构
JIRA与SVN插件安装 chenyu19891124 SVN jira
JIRA安装好后提交代码并要显示在JIRA上，这得需要用SVN的插件才能看见开发人员提交的代码。 1.下载svn与jira插件安装包，解压后在安装包(atlassian-jira-subversion-plugin-0.10.1) 2.解压出来的包里下的lib文件夹下的jar拷贝到(C:\Program Files\Atlassian\JIRA 4.3.4\atlassian-jira\WEB
常用数学思想方法 comsci 工作
对于搞工程和技术的朋友来讲，在工作中常常遇到一些实际问题，而采用常规的思维方式无法很好的解决这些问题，那么这个时候我们就需要用数学语言和数学工具，而使用数学工具的前提却是用数学思想的方法来描述问题。。下面转帖几种常用的数学思想方法，仅供学习和参考函数思想　　把某一数学问题用函数表示出来，并且利用函数探究这个问题的一般规律。这是最基本、最常用的数学方法
pl/sql集合类型 daizj oracle 集合 type pl/sql
--集合类型 /* 单行单列的数据，使用标量变量单行多列数据，使用记录单列多行数据，使用集合（。。。） *集合：类似于数组也就是。pl/sql集合类型包括索引表（pl/sql table）、嵌套表（Nested Table）、变长数组（VARRAY）等 */ /* --集合方法 &n
[Ofbiz]ofbiz初用 dinguangx 电商 ofbiz
从github下载最新的ofbiz（截止2015-7-13），从源码进行ofbiz的试用 1. 加载测试库 ofbiz内置derby，通过下面的命令初始化测试库 ./ant load-demo (与load-seed有一些区别) 2. 启动内置tomcat ./ant start 或 ./startofbiz.sh 或 java -jar ofbiz.jar &
结构体中最后一个元素是长度为0的数组 dcj3sjt126com c gcc
在Linux源代码中，有很多的结构体最后都定义了一个元素个数为0个的数组，如/usr/include/linux/if_pppox.h中有这样一个结构体： struct pppoe_tag { __u16 tag_type; __u16 tag_len; &n
Linux cp 实现强行覆盖 dcj3sjt126com linux
发现在Fedora 10 /ubutun 里面用cp -fr src dest，即使加了-f也是不能强行覆盖的，这时怎么回事的呢？一两个文件还好说，就输几个yes吧，但是要是n多文件怎么办，那还不输死人呢？下面提供三种解决办法。方法一我们输入alias命令，看看系统给cp起了一个什么别名。 [root@localhost ~]# aliasalias cp=’cp -i’a
Memcached(一)、HelloWorld frank1234 memcached
一、简介高性能的架构离不开缓存，分布式缓存中的佼佼者当属memcached，它通过客户端将不同的key hash到不同的memcached服务器中，而获取的时候也到相同的服务器中获取，由于不需要做集群同步，也就省去了集群间同步的开销和延迟，所以它相对于ehcache等缓存来说能更好的支持分布式应用，具有更强的横向伸缩能力。二、客户端选择一个memcached客户端，我这里用的是memc
Search in Rotated Sorted Array II hcx2013 search
Follow up for "Search in Rotated Sorted Array":What if duplicates are allowed? Would this affect the run-time complexity? How and why? Write a function to determine if a given ta
Spring4新特性——更好的Java泛型操作API jinnianshilongnian spring4 generic type
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装JDK liuxingguome centos
1、行卸载原来的： [root@localhost opt]# rpm -qa | grep java tzdata-java-2014g-1.el6.noarch java-1.7.0-openjdk-1.7.0.65-2.5.1.2.el6_5.x86_64 java-1.6.0-openjdk-1.6.0.0-11.1.13.4.el6.x86_64 [root@localhost
二分搜索专题2-在有序二维数组中搜索一个元素 OpenMind 二维数组算法二分搜索
1,设二维数组p的每行每列都按照下标递增的顺序递增。用数学语言描述如下：p满足 (1),对任意的x1，x2，y，如果x1<x2,则p(x1,y)<p(x2,y); (2),对任意的x，y1,y2, 如果y1<y2,则p(x,y1)<p(x,y2); 2,问题：给定满足1的数组p和一个整数k，求是否存在x0,y0使得p(x0,y0)=k? 3,算法分析： (
java 随机数 Math与Random SaraWon java Math Random
今天需要在程序中产生随机数，知道有两种方法可以使用，但是使用Math和Random的区别还不是特别清楚，看到一篇文章是关于的，觉得写的还挺不错的，原文地址是 http://www.oschina.net/question/157182_45274?sort=default&p=1#answers 产生1到10之间的随机数的两种实现方式： //Math Math.roun
oracle创建表空间 tugn oracle
create temporary tablespace TXSJ_TEMP tempfile 'E:\Oracle\oradata\TXSJ_TEMP.dbf' size 32m autoextend on next 32m maxsize 2048m extent m
使用Java8实现自己的个性化搜索引擎 yangshangchuan java superword 搜索引擎 java8 全文检索
需要对249本软件著作实现句子级别全文检索，这些著作均为PDF文件，不使用现有的框架如lucene，自己实现的方法如下： 1、从PDF文件中提取文本，这里的重点是如何最大可能地还原文本。提取之后的文本，一个句子一行保存为文本文件。 2、将所有文本文件合并为一个单一的文本文件，这样，每一个句子就有一个唯一行号。 3、对每一行文本进行分词，建立倒排表，倒排表的格式为：词=包含该词的总行数N=行号

崇志宏 转“博弈机器学习”-东南大学机器学习

刘铁岩：博弈机器学习是什么？

你可能感兴趣的:(深度学习,软件工程,知识图谱,区块链,深度学习,软件工程,软件工程,商业模式,软件工程,深度学习框架)

崇志宏转“博弈机器学习”-东南大学机器学习