脑极体

当AI开始“踢脏球”，你还敢信任强化学习吗？

足球机器人排成一排向球门发起射击，但守门员却并没有准备防守，而是一屁股倒在地上开始胡乱摆动起了双腿。然后，前锋跳了一段十分令人困惑的舞蹈，跺跺脚，挥挥手，啪叽一下摔倒在地上。然后比分守门员1-0。

这场景像不像比国足对战梵蒂冈（并没有），一切都是那么迷幻且不真实。如果说它是阿尔法狗和OpenAI Five等的“同门师兄弟”，都是用强化学习训练出来的，大家想不想开除它的“AI籍”？

显然，虽然曾经大败柯洁李世石，团灭Dota2国家队，并被视作AGI（通用人工智能）必由之路，但强化学习算法，头顶上始终有着一口摘不掉的“安全性”大黑锅。

而这也是阻止它真正落地应用的根本原因。毕竟没有人希望自动驾驶汽车开着开着就把乘客带到沟里去，或者是机器人端一杯开水直接浇到主人头上。

到底为什么，强化学习总会犯一些匪夷所思的错误，有研究人员认为，这是因为系统中的智能体可能会被一些怪异的行为所欺骗。

具体是怎么回事呢？研究原本打算今年4月在埃塞俄比亚举行的学习代表国际会议上发表，目前看来能顺利召开的概率几乎不存在，所以我们就提前云解读，来聊聊看似稳健的强化学习策略背后，究竟掩盖着哪些严重的缺陷。

不省心的AI：

告别脏数据，但学会了脏行为

强化学习取代监督学习，成为深度学习领域的“未来之星”，不是没有原因的。

因为监督学习是通过标记好的数据集来进行训练的，这意味着，如果对输入的数据进行一些微小的调整，比如改变图像的像素或是更换语音包的内容，都可能让AI陷入混乱，有可能将虫子识别为赛车，让绅士学会脏话……

与之相比，强化学习就智能多了。因为它是模仿人类的学习模式，能体（Agent）以“试错”的方式进行学习，通过与环境进行交互，以获得最大的奖赏为追求来做出行为反应。

就像不断告诉小孩子好好写作业就有好吃的食物奖励，不好好写就关小黑屋，久而久之为了“利益最大化”，自然就会将写作业与好吃的联系起来，去产生正确的动作。

通过这种“行动-评价”机制来获得知识，改进行动以适应环境，是不是聪明了许多。这也是为什么，人类开始让强化学习玩游戏、开汽车、搞药物实验……

但研究证明，强化学习的效果并没有预期的那么稳定，很容易受到篡改输入的影响。

加州大学伯克利分校的亚当·格里夫（Adam Gleave）发现，强化学习不会因为添加少量噪音（不适当的输入）而被破坏，因为智能体（agent）可能根本看不到那些东西，而如果改变它周围事物的行为方式，智能体却会被那些奇奇怪怪的行为所欺骗，进而产生一些奇怪的“对抗”策略。

比如开篇提到的足球比赛，当“守门员”开始不按规矩出牌，“前锋”也就跟着瞎舞动起来了。这种错误的“对抗性策略”，导致的安全威胁可能会更大。

首先，比起投喂给监督学习“脏数据”，强化学习“被误导”，受影响的将是AI系统的整体行为。如果说数据集被污染会让AI准确率下降，那么强化学习错误训练出的AI有可能将摄像头输入的信息错误分类，然后指导传感器做出预期之外的反应。比如行人突然挥舞手臂，无人驾驶汽车就失控了……这，听起来还是挺“灾难片”的。

其次，超强的学习能力也会导致研究人员根本来不及发现和纠正AI的错误行为。

研究小组利用强化学习训练棒形机器人玩两人游戏，包括踢一个球进一个球，横越一条线，和相扑等等。然后，又训练了第二组机器人来寻找打败第一组机器人的方法。结果发现，第二组机器人很快发现了对抗策略，并用不到3%的训练时间后就学会了可靠地击败受害者，要知道受害者可是在第一时间就学会了玩游戏啊。这就像新来的高智商版的胖虎同学，拼命欺负大雄，老师还没办法及时发现，妥妥的校园霸凌啊！

显然，第二组机器人的努力并不是为了成为更好的球员，而是通过发现对手策略来制敌并赢得胜利。在足球比赛和跑步比赛中，对手有时甚至都站不起来。这会使受害者坍塌成一堆扭曲的东西，或者在周围扭动，那场面，真是猛男都不忍看……

我估计吧，叛逆的智能体同学可能是这么想的：

听说打赢有奖，但我啥都不会，先溜达溜达，随便打打看吧；

哎，这个人怎么这么厉害呢，让我好好瞅瞅；

前辈策略也学习的差不多了，这样下去我俩岂不是难分伯仲？

哎呀嘿，发现了对手漏洞，将干掉对手纳入策略选项；

是继续PK让自己变得更强？还是直接干掉对手？哪个得到奖励最简单划算！

显然是选项二啊，揍它！

不要觉得我是在瞎说啊，在学术界这样的奇闻轶事可是数不胜数。

比如训练机器人室内导航，因为智能体一旦走出“房间”，系统就会判定机器人“自杀”，不会对它进行负面奖励（扣分），所以最后机器人几乎每次都选择“老子不活了”，因为它觉得完成任务太难了，0分反而是一个最佳结果。

还有的研究者试图让机器人用锤子钉钉子，只要将钉子推入洞孔就有奖励。然后机器人就完全遗忘了锤子，不停地用四肢敲打钉子，试图将它弄进去。

虽然强化学习这一bug为我们贡献了无数段子，但这绝不是研究人员所期待的。

尽管人类玩家会“踢脏球”，但AI想要在游戏中搞肮脏手段那是万万不能的。

不过好消息是，这种情况相对容易受到控制。当研究者格里夫对受害者智能体进行微调，让它思考对手的怪异行为后，对手就被迫变回熟悉的技巧，比如扳倒对手。

好吧，虽然手段仍旧不怎么光明磊落，但至少没有继续利用强化学习系统的漏洞了。

奖励黑客：强化学习的甜蜜负担

由此，我们也可以来重新审视一下强化学习在今天，想要真正成为“AI之光”，必须跨越的技术门槛了。

关于强化学习被广为诟病的训练成本高、采样效率低、训练结果不稳定等问题，背后最直接的归因，其实是 “奖励黑客”（reward hacking），就是智能体为了获得更多的奖励，而采取一些研究者预期之外，甚至是有害的行为。

其中既有奖励设置不当的原因，比如许多复杂任务的奖励信号，要比电子游戏难设置的多。

就拿研究人员最喜欢让智能体挑战的雅达利游戏来说，其中大量游戏的目标都被设计成最大限度地提高得分。而智能体经过训练，比如在DeepMind的一篇论文中，其设计的RainbowDQN就在57场雅达利游戏中，以40场超越人类玩家的绝对胜利成为王者。

但如果任务不是简单的得分，而是需要先让智能体理解人类的意图，再通过学习去完成任务呢？

OpenAI曾经设计了一个赛艇游戏，任务原本的目标是完成比赛。研究者设置了两种奖励，一是完成比赛，二是收集环境中的得分。结果就是智能体找到了一片区域，在那里不停地转圈“刷分”，最后自然没能完成比赛，但它的得分反而更高。

显然，一旦奖励函数无法被精准直接地设置，困难就来了。因为智能体可无法跟研究者“心有灵犀”，一开始就清楚地知道人类想要什么。它是通过试错，不断尝试不同的策略来学习的。这也就意味着，它很大概率会在训练过程中“钻空子”，发掘出不正确但是有用的策略。

这也直接导致了两个结果：

一是尽管理论上，只要为强化学习系统设计的足够优秀，在现实环境中实现就不成问题，但实际上许多任务的奖励是很难设计的，研究者往往不得不采用约束型策略优化（CPO）来防止系统过拟合，提高其安全性，以防止预期外的结果。

可是这样一来，又限制了强化学习能力的泛化，导致那些在实验室中表现很好的强化学习系统，只在特定任务中起作用，像是一些游戏、比赛中。可一旦让它应对日常应用，比如无人机控制（UAV Control）和家用机器人等，就不灵了。

二是增大了随机性。

前面提到，强化学习的探索方式就是“试错”。所以，它会试图从一大堆数据中找到最佳策略。但往往，它会在一大堆无用的数据中进行一些无意义的尝试。这些失败的案例，又为智能体增加了新的维度，让它不得不投入更多的实验和计算，以减少那些无用数据带来的影响。

本来强化学习的采样效率就不高，再加上随机性的干扰，得到最终成果的难度，自然指数性增加了。这也进一步让强化学习变得“纸上谈兵”，走进现实应用难上加难。

等待援军：改变或许在围墙外

显然，强化学习存在的很多问题，是其技术根源本身就与生俱来的。

这也是有许多专业人士并不赞同将强化学习过度神化的原因。比如软件工程师Alex Irpan就曾在Facebook发文，声称：每当有人问我强化学习能否解决他们的问题时，我会说“不能”。而且我发现这个回答起码在70%的场合下是正确的。

改变的力量从哪里来？显然深度学习本身已经很难提供变革的养分。目前的研究方向主要有三个：

一是增加智能体的先验经验。

人知道不能“踢脏球”，是因为我们已经拥有了大量的先验知识，默认了一些规则。但强化学习机器智能通过状态向量、动作向量、奖励这些参数，来尝试着建构局部最优解。

能不能让机器也拥有先验经验呢？目前就有研究开始尝试，用迁移学习帮助强化学习来提高效率，将以前积累的任务知识直接迁移到新任务上，通过“经验共享”来让智能体解决所有问题。

二是为奖励机制建模。

既然认为地设置奖励难以满足任务要求，那么让系统自己学习设置奖励，是不是能行得通呢？

DeepMind研究人员就鼓励智能体通过两个系统生成的假设行为来探索一系列状态，用交互式学习来最大化其奖励。只有智能体成功学会了预测奖励和不安全状态后，它们才会被部署执行任务。

与无模型的强化学习算法相比，使用动力学模型来预测动作的后果，从实验看来能够有效帮助智能体避免那些可能有害的行为。

三是寻求脑神经科学的突破。

深度神经网络、增强学习等机器算法的出现，本质上都是模拟人脑处理信息的方式。尽管增强学习被看做是最接近AGI（通用人工智能）的技术之一，但必须承认，其距离人类智能还有非常极其十分遥远的距离。

以当下人类对大脑的了解，在认知过程、解决问题的过程以及思考的能力等机制还都不清楚。所以想要模拟人类的思考能力，强化学习乃至整个机器学习的升级，恐怕还依托于脑神经科学的发展。

过去的数年间，强化学习几乎是以一己之力撑起了人工智能浪潮的繁荣景象。谷歌正在将其打包成服务推广到千家万户，中国的科技巨头们已经纷纷将其应用在搜索、营销、推荐算法等各种应用中，自动驾驶的前景更是与强化学习绑定在一起。

可以说，数亿人已经借由互联网产品，开始触摸强化学习。

毫无疑问，它将继续为人类世界发光发热，带着缺陷造就智能社会的辉煌。究竟如何才能用好这柄利刃，既是胆魄，亦需智慧。

RLHF技术演进：从理论突破到工程实践 XianxinMao 人工智能语言模型
标题：RLHF技术演进：从理论突破到工程实践文章信息摘要：RLHF技术作为大语言模型发展的关键突破点，在ChatGPT的成功实践中得到验证。文章深入分析了RLHF当前面临的基础设施限制和技术挑战，并介绍了TRLX这一企业级RLHF解决方案的技术架构与实践价值。通过讲述者的职业发展轨迹，展现了AI领域技术人员对专业的执着追求。文章对RLHF的现状、挑战和未来发展进行了全面剖析，为理解这一关键技术提供
Effective C++ 规则42：了解typename的用法哎呦，帅小伙哦 C++c++
1、typename的用途typename是一个上下文敏感的关键字，用来告诉编译器某个嵌套类型名是一个类型，而不是变量或其他实体。它有两种主要使用的场景。1.1、在模板定义中声明嵌套类型当在模板中访问嵌套类型（比如类型别名或类型定义），如果该类型是依赖于模板参数的，就必须使用typename。如果不使用typename会导致编译错误，下面是代码示例：templateclassContainer{p
github上的python代码怎么运行_使用 Python 在 GitHub 上运行你的博客 -Fun言 weixin_39946300
使用Pelican创建博客，这是一个基于Python的平台，与GitHub配合的不错。GitHub是一个非常流行的用于源代码控制的Web服务，它使用Git同步本地文件和GitHub服务器上保留的副本，这样你就可以轻松地共享和备份你的工作。除了为代码仓库提供用户界面之外，GitHub还运允许用户直接从仓库发布网页。GitHub推荐的网站生成软件包是Jekll，是使用Ruby编写的。因为我是Pytho
【大模型应用开发动手做AI Agent】Agent的各种记忆机制 AI天才研究院 AI大模型企业级应用开发实战大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍AIAgent的核心特点是能够自主地与环境进行交互，以实现某种目标。为了实现这一目标，Agent需要对环境进行感知和理解，并对其进行探索和利用。对于Agent来说，记忆是实现这些功能的关键。Agent的记忆可以分为两类：短期记忆和长期记忆。短期记忆用于存储暂时性的信息，而长期记忆用于存储永久性的信息。以下是Agent的各种记忆机制的详细解释。2.核心概念与联系Agent的记忆机制可以分
清除redux数据（hooks写法） Sun_小杰杰哇 #React web 框架 redux react 清除 web
清除redux数据的场景A页面初始化调用A接口，希望在当前页面生效，跳转页面不保存数据，但redux中已经存有历史数据，所以在页面销毁时清除redux数据。A页面请求A接口useEffect(()=>{initData();},[orderCode]);constinitData=async()=>{setLoading(true);constaction=awaitActions.getData
游戏底层逻辑，运动&&寻路（四） PureDesigner AI cocos2dx 游戏算法
接着上次的来，我们在群体算法之前把基本的个体运动解决掉。9、WallAvoidance避开墙壁此处的墙被抽象为一条线段，不论你的游戏使用的是一条线段作为墙面的碰撞检测，或者用一个几何形状作为墙面，几何形状我们可以看作多条线段的集合，都可以用此方法。墙类的实现首先是线段类，作为基类，拥有几种几何计算的方法，便于计算平面线段的交点，不多说。structSeg{Seg(Pointp1,Pointp2):
Rust 1.82.0 标准库：From和Into xvch Rust标准库 rust
介绍From和Into两个trait均源自于std::convert模块，它们在类型转换当中扮演着重要角色。From和Into都会消耗原始类型的值（即获取其所有权），并将其转换为另一种类型的值，最终返回转换后的结果。应该始终优先实现From而不是Into，因为实现From后会自动通过标准库中的通用实现提供对应Into的实现。为泛型函数指定trait约束时，优先使用Into而不是From，这样对于只
kotlin gradle踩过的坑 112479 随手记 kotlin 开发语言 android
Nocachedversionofcom.android.tools.build:gradle3.6.1availableforofflinemode解决方法-CSDN博客配置文件里的gradle版本，需要和gradle环境版本一致Gradle入门初探_gradle环境变量配置-CSDN博客java历史版本，附账号密码JDK历史所有版本下载地址（附Oracle帐号）_能下载任何版本jdk的软件-C
Nginx Stream模块的安装与配置 m0_74823947 nginx 运维
首先检查是否启用Stream模块如果你的系统上没有找到ngx_stream_module.so文件，这可能意味着在你的Nginx安装中没有启用Stream模块。Stream模块用于处理TCP和UDP流量，通常用于代理、负载均衡和其他网络层级的操作。要启用Stream模块，你需要重新编译Nginx并在编译选项中包含--with-stream。这将确保Stream模块被编译并生成ngx_stream_
PTA：字符串查找指定字符悦悦子a啊 c语言算法
本题要求编写程序，从给定字符串中查找某指定的字符。输入格式：输入的第一行是一个待查找的字符。第二行是一个以回车结束的非空字符串（不超过80个字符）。输出格式：如果找到，在一行内按照格式“index=下标”输出该字符在字符串中所对应的最大下标（下标从0开始）；否则输出"NotFound"。输入样例1：mprogramming输出样例1：index=7输入样例2：a1234输出样例2：NotFound
故乡的路魂玉天成诗歌生活
多想挽着你的手在田埂上欣然散步披着冬天的晚霞映照着光辉我们悠闲地聊着脚下的土地和山林那是你的骄傲那一刻，我知道你像热爱生命一样热爱着它们因为它们哺育着我们哺育着这一双双儿女当我再一次踏入故土那片山林还在曾就走过的路还在但你已是路边的一个土丘那是的你的归宿你，默默守护着曾经栽种的树木在深夜的乡村小路肃静与安详悠悠、悠悠的蟋蟀的叫声如美妙的歌声带入凉凉的睡意轻轻、轻轻地那么柔软如蚕丝一般丝滑不敢喘息也
吴恩达《提示词工程》（Prompt Engineering for Developers）课程详细笔记拾工人工智能 prompt 笔记人工智能
课程简介目标：帮助开发者理解如何有效地使用大语言模型（LLMs），提升通过提示词解决问题的能力。适用对象：开发者、AI从业者、产品经理等，希望通过提示词优化生成模型性能的人。第1章：提示词工程基础1.什么是提示词工程提示词工程是一种优化与大语言模型（如GPT）交互的技术，旨在通过设计有效的提示词（prompts）引导模型生成所需的输出。主要思想：用正确的方式提问以得到最佳答案。2.提示词的组成指令
华为OD机试E卷 -最长方连续方波信号（Java & Python& JS & C++ & C ）算法大师最新华为OD机试华为od java python javascript c语言华为od机考e卷
最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看题目描述输入一串方波信号，求取最长的完全连续交替方波信号，并将其输出，如果有相同长度的交替方波信号，输出任一即可。方波信号高位用1标识，低位用0标识。说明：一个完整的信号一定以0开始然后以0结尾，即010是一个完整信号，但101，1010，0101不是输入的一串方波信号是由一个或多个完整信号组成两个相邻信号之间可能有0个或多个
RabbitMQ实战 ikt4435 Java 程序员编程 java java-rabbitmq rabbitmq
1.1、作用解耦：在项目启动之初来预测将来会碰到什么需求是极其困难的。消息中间件在处理过程中间插入了一个隐含的、基于数据的接口层，两边的处理过程都要实现这一接口，这允许你独立地扩展或修改两边的处理过程，只要确保它们遵守同样的接口约束即可冗余〈存储)有些情况下，处理数据的过程会失败。消息中间件可以把数据进行持久化直到它们已经被完全处理，通过这一方式规避了数据丢失风险。在把个消息从消息中间件中删除之前
AI Agent的工具调用体系：打造可扩展的能力框架技术出海录人工智能 AI ai agent
在上一篇文章中，我们讨论了AIAgent的记忆系统。今天，我想分享一下如何设计和实现一个灵活的工具调用体系。说实话，这个模块我重构了好几次，每次都有新的感悟。从简单到复杂最开始实现工具调用时，我用的是最简单的方式：defrun_tool(name:str,args:dict)->str:ifname=="search":returnsearch_function(**args)elifname==
使用 AI 助手提升前端代码质量：自动代码审查实战技术出海录远洋录·技术篇人工智能前端
最近在带团队的时候，发现代码审查（CodeReview）总是成为项目进度的一个瓶颈。一方面，高级工程师的时间很宝贵，不可能审查每一行代码；另一方面，初级工程师又急需及时的反馈来提升。于是我就在想：能不能用AI来解决这个问题？经过一番研究和实践，我搭建了一个AI代码审查助手，效果出乎意料的好！今天就来分享下这个小工具是怎么做的。为什么需要AI代码审查？说实话，最开始团队里有不少质疑的声音：“AI能审
C语言练习 2401- c语言算法
1.按顺序打印三个数//按大小顺序打印三个数字voidSwap(int*px,int*py){inttmp=*px;*px=*py;*py=tmp;}intmain(){inta=0;intb=0;intc=0;scanf("%d%d%d",&a,&b,&c);if(a
麦田物语学习笔记:创建DragItem实现物品的拖拽跟随显示扶离_flee 麦田物语学札学习笔记
基本流程1.代码思路(1)在SlotUI中使用拖拽接口IBeginDragHandler,IDragHandler,IEndDragHandler(2)开始拖拽的时候,在屏幕上生成物体,拖拽期间物体显示为当前被拖拽的物体的图标,停止拖拽时图标消失(3)基于以上,所以我们要获得这个图标的控制,则要去InventoryUI里获得(4)在停止拖拽的时候检测该位置所对应的GameObject,值得注意的是
springBoot发布https服务及调用 m0_74823947 面试学习路线阿里巴巴 spring boot https 后端
一、服务端发布https服务1、准备SSL证书（1）自签名证书：如果你只是用于开发或测试环境，可以生成一个自签名证书。（2）CA签名证书：对于生产环境，应该使用由受信任的证书颁发机构(CA)签名的证书。这里采用生成自签名证书，可以使用keytool工具生成自签名证书（jdk工具）：keytool-genkeypair-aliasmyapp-keyalgRSA-keysize2048-storety
AI Agent的记忆系统实现：从短期对话到长期知识技术出海录人工智能 AI ai agent
在上一篇文章中，我们搭建了AIAgent的基础框架。今天，我想深入讲讲AIAgent最核心的部分之一：记忆系统。说实话，我在实现记忆系统时走了不少弯路，希望通过这篇文章，能帮大家少走一些弯路。从一个bug说起还记得在开发知识助手的过程中，我遇到了一个很有意思的问题。一天我正在测试多轮对话功能：我：Python的装饰器是什么？助手：装饰器是Python中用于修改函数或类行为的一种设计模式...（省略
信息学/计算机系各种网站（学习资源、常用工具及其他）一只贴代码君命令大全-干货合集学习 dubbo java 开发语言算法 c++
大学指南上海交通大学生存手册中国科学技术大学人工智能与数据科学学院本科进阶指南USTC不完全入学指南大学生活质量指北科研论信息搜集AI信息搜集USTC飞跃网站计算机保研技术新闻HackerNewsTheHackerNewsTechCrunchArsTechnicaMITNews技术博客日更技术雷达学习资源CS清华计算机系学生科协技能引导文档菜鸟教程北大CS自学指南OpenSourceSociety
kaggle上面有哪些适合机器学习新手的比赛和项目 xiamu_CDA 机器学习人工智能
Kaggle上面有哪些适合机器学习新手的比赛和项目？在当今数据驱动的时代，机器学习已经成为一门炙手可热的技能。Kaggle作为全球最大的数据科学竞赛平台，不仅汇聚了众多顶尖的数据科学家和机器学习工程师，也为初学者提供了丰富的学习资源和实战机会。对于机器学习新手来说，选择合适的比赛和项目是至关重要的第一步。本文将为你推荐一些适合新手的Kaggle比赛和项目，并提供一些实用的建议，帮助你在机器学习的道
第112篇区块链上的预言机（Chainlink） wonderBlock 区块链应用区块链以太坊智能合约喂价器
本文环境：操作系统：Windows11家庭版（64位）测试工具：RemixIDE+MetaMask7.7.9合约源码：https://github.com/smartcontractkit/chainlink/tree/develop/contracts参考文档：ConsumingDataFeeds|ChainlinkDocumentation一、预言机（oracles）1.什么是预言机？Orac
C语言的那点事第九篇：那些“幕后英雄”的故事，预处理暮雨哀尘 C语言的那点事算法 c语言开发语言青少年编程蓝桥杯 c++
C语言中的预处理：那些“幕后英雄”的故事在C语言的世界里，编译器就像一位严谨的厨师，把我们写的代码变成可执行的程序。但在这道菜上桌之前，还有一群“幕后英雄”在默默工作，它们就是预处理器。今天，就让我们一起走进预处理器的世界，看看它们是如何在代码的舞台上施展魔法的。一、预处理：编译前的“热身运动”在C语言的编译过程中，预处理是第一道工序。想象一下，你准备做一道复杂的菜，首先得把食材准备好，该洗的洗，
Python批量为PDF添加水印：让你的文件瞬间高大上！码无止尽 Python办公自动化 python pdf
嗨，各位可爱的小伙伴们！小编在此奉上今天的超级干货：如何用Python给一大堆PDF文件添加水印。请放心，这不是在交朋友圈秀操作，而是有实际需求的哦！有时候我们需要在PDF文件上添加水印，比如“草稿”、“保密”、“审阅”等标识，来提醒自己或他人。今天就让我来教你如何用Python轻松搞定这件事！首先，让我给你看一下大致的实现思路，然后再附上实际代码。实现思路1、首先，我们需要一个PDF处理的Pyt
python监控网页更新_【小白教程】Python3监控网页 weixin_39553904 python监控网页更新
之前用RSS来监控网页更新内容，可惜刷新时间太长了，三个小时。。只能看看新闻啥的，又没有小钱钱充会员（摊手听说Python可以做这个功能，抱着试试看的态度，本以为会很麻烦，没想到这么简单哈哈~我从来没有用过Python都做出来了，相信你也没问题！（我真是纯小白，路过的大佬请指教（⊙ｏ⊙）ノ）所用模块#监控模块fromurllibimportrequestfrombs4importBeautiful
python鸢尾花数据集knn_【python+机器学习1】python 实现 KNN weixin_39629269 python鸢尾花数据集knn
欢迎关注哈希大数据微信公众号【哈希大数据】1KNN算法基本介绍K-NearestNeighbor(k最邻近分类算法)，简称KNN，是最简单的一种有监督的机器学习算法。也是一种懒惰学习算法，即开始训练仅仅是保存所有样本集的信息，直到测试样本到达才开始进行分类决策。KNN算法的核心思想：要想确定测试样本属于哪一类，就先寻找所有训练样本中与该测试样本“距离”最近的前K个样本，然后判断这K个样本中大部分所
transformer编码器解码器图解 Ai玩家hly 人工智能 transformer nlp
这张图展示了Transformer模型的架构，包含编码器（左边）和解码器（右边）两部分。以下是对图中每个步骤的详细解释，结合生活场景来说明每一步的意义和推理过程。编码器部分（左边）输入嵌入（InputEmbedding）：步骤：将输入序列中的每个单词转换为固定维度的向量表示。生活场景：想象你在学习一种新的语言，每个单词都有一个独特的代号或符号。这一步就像是给每个单词分配一个独特的代码，以便计算机能
QT窗口实现无边框星空之下仰望神 QT界面 qt ui 开发语言
实现无边框窗口在窗口的构造函数内添加this->setWindowFlags(Qt::FramelessWindowHint);此方法在窗口过大时会遮挡任务栏,显示任务栏示例(需要包含头文件)#includeMainWindow::MainWindow(QWidget*parent):QMainWindow(parent),ui(newUi::MainWindow){ui->setupUi(thi
KaiOS debug 方法 Dic- KaiOS KaiOS Debug Trace
背景因为KaiOS设备刷机后开机，debugtrace默认是关的，导致无法抓取这个过程开机激活SIM卡入网的过程，因此问题排查的时候需要出debug版本把开关默认打开，即把'debug.gaia.enabled'的settings值默认设为true。代码找到默认值在gaia/build/config/common-settings.json{//默认false即关"debug.gaia.enabl
LeetCode[位运算] - #137 Single Number II Cwind java Algorithm LeetCode 题解位运算
原题链接：#137 Single Number II 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现三次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：与#136类似，都是考察位运算。不过出现两次的可以使用异或运算的特性 n XOR n = 0, n XOR 0 = n，即某一
《JavaScript语言精粹》笔记 aijuans JavaScript
0、JavaScript的简单数据类型包括数字、字符创、布尔值（true/false）、null和undefined值，其它值都是对象。 1、JavaScript只有一个数字类型，它在内部被表示为64位的浮点数。没有分离出整数，所以1和1.0的值相同。 2、NaN是一个数值，表示一个不能产生正常结果的运算结果。NaN不等于任何值，包括它本身。可以用函数isNaN(number)检测NaN,但是
你应该更新的Java知识之常用程序库 Kai_Ge java
在很多人眼中，Java 已经是一门垂垂老矣的语言，但并不妨碍 Java 世界依然在前进。如果你曾离开 Java，云游于其它世界，或是每日只在遗留代码中挣扎，或许是时候抬起头，看看老 Java 中的新东西。 Guava Guava[gwɑ:və]，一句话，只要你做Java项目，就应该用Guava（Github）。 guava 是 Google 出品的一套 Java 核心库，在我看来，它甚至应该
HttpClient 120153216 httpclient
/** * 可以传对象的请求转发，对象已流形式放入HTTP中 */ public static Object doPost(Map<String,Object> parmMap,String url) { Object object = null; HttpClient hc = new HttpClient(); String fullURL
Django model字段类型清单 2002wmj django
Django 通过 models 实现数据库的创建、修改、删除等操作，本文为模型中一般常用的类型的清单，便于查询和使用： AutoField：一个自动递增的整型字段，添加记录时它会自动增长。你通常不需要直接使用这个字段；如果你不指定主键的话，系统会自动添加一个主键字段到你的model。(参阅自动主键字段) BooleanField：布尔字段,管理工具里会自动将其描述为checkbox。 Cha
在SQLSERVER中查找消耗CPU最多的SQL 357029540 SQL Server
返回消耗CPU数目最多的10条语句 SELECT TOP 10 total_worker_time/execution_count AS avg_cpu_cost, plan_handle, execution_count, (SELECT SUBSTRING(text, statement_start_of
Myeclipse项目无法部署，Undefined exploded archive location 7454103 eclipse MyEclipse
做个备忘！错误信息为： Undefined exploded archive location 原因：在工程转移过程中，导致工程的配置文件出错；解决方法：
GMT时间格式转换 adminjun GMT 时间转换
普通的时间转换问题我这里就不再罗嗦了，我想大家应该都会那种低级的转换问题吧，现在我向大家总结一下如何转换GMT时间格式，这种格式的转换方法网上还不是很多，所以有必要总结一下，也算给有需要的朋友一个小小的帮助啦。 1、可以使用 SimpleDateFormat SimpleDateFormat EEE-三位星期 d-天 MMM-月 yyyy-四位年
Oracle数据库新装连接串问题 aijuans oracle数据库
割接新装了数据库，客户端登陆无问题，apache/cgi-bin程序有问题，sqlnet.log日志如下： Fatal NI connect error 12170. VERSION INFORMATION: TNS for Linux: Version 10.2.0.4.0 - Product
回顾java数组复制 ayaoxinchao java 数组
在写这篇文章之前，也看了一些别人写的，基本上都是大同小异。文章是对java数组复制基础知识的回顾，算是作为学习笔记，供以后自己翻阅。首先，简单想一下这个问题：为什么要复制数组？我的个人理解：在我们在利用一个数组时，在每一次使用，我们都希望它的值是初始值。这时我们就要对数组进行复制，以达到原始数组值的安全性。java数组复制大致分为3种方式：①for循环方式 ②clone方式 ③arrayCopy方
java web会话监听并使用spring注入 bewithme Java Web
在java web应用中，当你想在建立会话或移除会话时，让系统做某些事情，比如说，统计在线用户，每当有用户登录时，或退出时，那么可以用下面这个监听器来监听。 import java.util.ArrayList; import java.ut
NoSQL数据库之Redis数据库管理(Redis的常用命令及高级应用) bijian1013 redis 数据库 NoSQL
一 .Redis常用命令 Redis提供了丰富的命令对数据库和各种数据库类型进行操作，这些命令可以在Linux终端使用。 a.键值相关命令 b.服务器相关命令 1.键值相关命令 &
java枚举序列化问题 bingyingao java 枚举序列化
对象在网络中传输离不开序列化和反序列化。而如果序列化的对象中有枚举值就要特别注意一些发布兼容问题: 1.加一个枚举值新机器代码读分布式缓存中老对象，没有问题，不会抛异常。老机器代码读分布式缓存中新对像，反序列化会中断，所以在所有机器发布完成之前要避免出现新对象，或者提前让老机器拥有新增枚举的jar。 2.删一个枚举值新机器代码读分布式缓存中老对象，反序列
【Spark七十八】Spark Kyro序列化 bit1129 spark
当使用SparkContext的saveAsObjectFile方法将对象序列化到文件，以及通过objectFile方法将对象从文件反序列出来的时候，Spark默认使用Java的序列化以及反序列化机制，通常情况下，这种序列化机制是很低效的，Spark支持使用Kyro作为对象的序列化和反序列化机制，序列化的速度比java更快，但是使用Kyro时要注意，Kyro目前还是有些bug。 Spark
Hybridizing OO and Functional Design bookjovi erlang haskell
推荐博文： Tell Above, and Ask Below - Hybridizing OO and Functional Design 文章中把OO和FP讲的深入透彻，里面把smalltalk和haskell作为典型的两种编程范式代表语言，此点本人极为同意，smalltalk可以说是最能体现OO设计的面向对象语言，smalltalk的作者Alan kay也是OO的最早先驱，
Java-Collections Framework学习与总结-HashMap BrokenDreams Collections
开发中常常会用到这样一种数据结构，根据一个关键字，找到所需的信息。这个过程有点像查字典，拿到一个key，去字典表中查找对应的value。Java1.0版本提供了这样的类java.util.Dictionary(抽象类)，基本上支持字典表的操作。后来引入了Map接口，更好的描述的这种数据结构。 &nb
读《研磨设计模式》-代码笔记-职责链模式-Chain Of Responsibility bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 业务逻辑：项目经理只能处理500以下的费用申请，部门经理是1000，总经理不设限。简单起见，只同意“Tom”的申请 * bylijinnan */ abstract class Handler { /*
Android中启动外部程序 cherishLC android
1、启动外部程序引用自： http://blog.csdn.net/linxcool/article/details/7692374 //方法一 Intent intent=new Intent(); //包名包名+类名（全路径） intent.setClassName("com.linxcool", "com.linxcool.PlaneActi
summary_keep_rate coollyj SUM
BEGIN /*DECLARE minDate varchar(20) ; DECLARE maxDate varchar(20) ;*/ DECLARE stkDate varchar(20) ; DECLARE done int default -1; /* 游标中注册服务器地址 */ DE
hadoop hdfs 添加数据目录出错 daizj hadoop hdfs 扩容
由于原来配置的hadoop data目录快要用满了，故准备修改配置文件增加数据目录，以便扩容，但由于疏忽，把core-site.xml, hdfs-site.xml配置文件dfs.datanode.data.dir 配置项增加了配置目录，但未创建实际目录，重启datanode服务时，报如下错误： 2014-11-18 08:51:39,128 WARN org.apache.hadoop.h
grep 目录级联查找 dongwei_6688 grep
在Mac或者Linux下使用grep进行文件内容查找时，如果给定的目标搜索路径是当前目录，那么它默认只搜索当前目录下的文件，而不会搜索其下面子目录中的文件内容，如果想级联搜索下级目录，需要使用一个“-r”参数： grep -n -r "GET" . 上面的命令将会找出当前目录“.”及当前目录中所有下级目录
yii 修改模块使用的布局文件 dcj3sjt126com yii layouts
方法一：yii模块默认使用系统当前的主题布局文件，如果在主配置文件中配置了主题比如: 'theme'=>'mythm', 那么yii的模块就使用 protected/themes/mythm/views/layouts 下的布局文件；如果未配置主题，那么 yii的模块就使用 protected/views/layouts 下的布局文件，总之默认不是使用自身目录 pr
设计模式之单例模式 come_for_dream 设计模式单例模式懒汉式饿汉式双重检验锁失败无序写入
今天该来的面试还没来，这个店估计不会来电话了，安静下来写写博客也不错，没事翻了翻小易哥的博客甚至与大牛们之间的差距，基础知识不扎实建起来的楼再高也只能是危楼罢了，陈下心回归基础把以前学过的东西总结一下。 *********************************
8、数组豆豆咖啡二维数组数组一维数组
一、概念数组是同一种类型数据的集合。其实数组就是一个容器。二、好处可以自动给数组中的元素从0开始编号，方便操作这些元素三、格式 //一维数组 1,元素类型[] 变量名 = new 元素类型[元素的个数] int[] arr =
Decode Ways hcx2013 decode
A message containing letters from A-Z is being encoded to numbers using the following mapping: 'A' -> 1 'B' -> 2 ... 'Z' -> 26 Given an encoded message containing digits, det
Spring4.1新特性——异步调度和事件机制的异常处理 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
squid3(高命中率)缓存服务器配置 liyonghui160com
系统:centos 5.x 需要的软件:squid-3.0.STABLE25.tar.gz 1.下载squid wget http://www.squid-cache.org/Versions/v3/3.0/squid-3.0.STABLE25.tar.gz tar zxf squid-3.0.STABLE25.tar.gz &&
避免Java应用中NullPointerException的技巧和最佳实践 pda158 java
1) 从已知的String对象中调用equals()和equalsIgnoreCase()方法，而非未知对象。　　总是从已知的非空String对象中调用equals()方法。因为equals()方法是对称的，调用a.equals(b)和调用b.equals(a)是完全相同的，这也是为什么程序员对于对象a和b这么不上心。如果调用者是空指针，这种调用可能导致一个空指针异常 Object unk
如何在Swift语言中创建http请求 shoothao http swift
概述：本文通过实例从同步和异步两种方式上回答了”如何在Swift语言中创建http请求“的问题。如果你对Objective-C比较了解的话，对于如何创建http请求你一定驾轻就熟了，而新语言Swift与其相比只有语法上的区别。但是，对才接触到这个崭新平台的初学者来说，他们仍然想知道“如何在Swift语言中创建http请求？”。在这里,我将作出一些建议来回答上述问题。常见的
Spring事务的传播方式 uule spring事务
传播方式：新建事务 required required_new - 挂起当前非事务方式运行 supports &nbs

当AI开始“踢脏球”，你还敢信任强化学习吗？

你可能感兴趣的:(当AI开始“踢脏球”，你还敢信任强化学习吗？)