巴比特资讯

深度丨当生成式 AI 被持续优化提供人类“奖励”其产生的答案时，该如何破译其“隐藏思想”...

撰文：Ian Scheffler

来源：Freethink

编译：巴比特

图片来源：由无界 AI工具生成

两千多年前，当柏拉图设想理想社会时，他选择驱逐诗人。“所有诗意的模仿都是毁灭性的，”他在《理想国》中写道。

柏拉图心目中的“模仿性”诗歌，在很大程度上是指讲故事 -- 一种试图对我们周围的世界做出令人信服的摹本语言。柏拉图写道：“所有这些诗意的个体，从荷马开始，都只是模仿者；他们复制美德之类的形象，但他们永远无法触及真理。”

对柏拉图来说，荷马的《伊利亚特》能够让我们憧憬特洛伊战争的场景并使我们相信它们的真实性，与其说是一种艺术成就，不如说是一种威胁。他认为，玩弄我们情感的强大虚构，会使我们误入歧途，或者，更糟糕的是，使我们相信一个虚假的现实，并根据虚构的东西冲动行事。

当然，所有社会都有讲故事的人，从西非的格里特人到当代的 TikTokers。但从来没有一个讲故事的人像 ChatGPT、DALL-E 以及近几个月抢占头条的其他各种生成式人工智能工具那样多产，或缺乏道德直觉。

正如柏拉图可能被迫承认的那样 -- 毕竟他自己的作品采取了虚构对话的形式 -- 艺术模仿往往是吸引观众注意力所必需的，但随着生成式人工智能将这种模仿的成本降低到几乎为零，曾经困扰柏拉图的哲学问题已经进入了政策领域。

这种工具是否应该被监管，甚至被禁止，就像在纽约市的公立学校一样？鉴于这些模型背后的大部分研究都是现成的，你可以在 YouTube 上用不到两个小时的时间建立 GPT（ChatGPT 的前身之一），那么有效的监管是否可能？

也许最重要的是，随着大型语言模型 -- 当今最先进的人工智能的技术基础 -- 越来越强大，未来会发生什么？目前，我们仍然可以训练大型语言模型的行为，但必须有大量的人工干预，就像 OpenAI 在肯尼亚雇用了几十个承包商来手动训练 ChatGPT，以避免其最不适当的输出。

大型语言模型的不完善之处显而易见（而且每当你打开 ChatGPT、新的 Bing 或谷歌的 Bard AI 时，都会有弹出式的提示）：这些模型不断地编造信息，导致它们产生一些被比喻为幻觉的内容，而且容易反映出其训练数据中的偏见。

但是，如果有一天 ChatGPT 和 Bing AI 等工具的捏造和错误不再是无意的呢？如果这些可以令人信服地生成几乎任何风格的图像、文本和音频的工具主动欺骗我们，该怎么办？

黑匣子的内部

“想象一下，一只猩猩试图建立一个只追求猩猩价值的人类级别的智能，”德克萨斯大学奥斯汀分校的计算机科学家 Scott Aaronson 说。“这个想法听起来很荒唐。”

在过去的一年里，Aaronson 从 UT 休假，并在 ChatGPT 和 DALL-E 的制造商 OpenAI 工作，负责人工智能安全。他说：“与我交谈过的人工智能安全研究中的每一个人都认为，有一件事很重要”，那就是可解释性——让人类观察者能够理解人工智能认知的‘黑匣子’。”

对人类来说，可解释性是一门不精确的科学。“我们对人类大脑内部的观察能力非常有限且粗糙，”Aaronson 说，“（但）至少对哪些区域是活跃的有一些了解——比如哪些区域燃烧更多的葡萄糖。”

但是大型语言模型的思维——如果你可以把多维向量空间称为思维的话——是不同的。“我们可以完全访问这些系统的代码，”Aaronson 说。“唯一的问题是你如何理解它。”

透过模式看问题

十几岁的时候，Collin Burns 就已经很喜欢思考了。他在费城郊区长大，十几岁时就在宾夕法尼亚大学学习大学水平的数学课程。他还花了几个小时来解决魔方问题。

他没有记住独特情况下的复杂算法，而是非常、非常缓慢地扭动魔方。矛盾的是，这种方法使他变得非常、非常快。Burns 对下一次扭动后可能发生的情况形成了直觉。2015 年，他打破了世界纪录，仅用 5.25 秒就解决了三阶魔方难题。

疫情期间，Burns 在加州大学伯克利分校攻读计算机科学博士学位，他在研究中采用了类似的方法。随着时间的推移，他产生了一种强烈的直觉：阅读大型语言模型的思想是可能的。

在 Burns 看来，人类的思维和大型语言模型的思维在一个突出的方面并没有什么不同：相关的信息聚集在一起，使你能够搜索到模式和结构。

例如，如果你要求一个人依次考虑真实和虚假的陈述，并监测他们的大脑活动，不同的区域可能会亮起。同样，Burns 意识到，在作为大型语言模型思维的“向量空间”中，“突出的特征往往被很好地分开”-- 这意味着，从本质上讲，类似的信息会聚在一起。

像 Netflix 和 Etsy 这样的公司可能会利用这些向量空间的结构来进行推荐。如果你的个人资料（以“矢量”的形式存储，代表该服务收集的关于你的数据）恰好与另一个用户的个人资料很接近，那么 Netflix 可能会使用该功能向你推荐类似用户也喜欢的电影，而 Etsy 则会推荐一种类似的产品。

Burns 想知道，同样的属性是否也可以用来迫使大型语言模型说出真相。如果该模型“将事物分类为真或假，”伯恩斯假设，该信息“可能会聚集在一起 -- 就像，你可以想象，你可以在两个维度上进行可视化，拥有两个云状的点。”

通常，当你查询像 ChatGPT 这样的模型时，你只能看到模型认知过程的第一步和最后一步。你输入的内容会进入模型的“输入层”，就像你阅读这些文字时进入你眼睛的信息。

在模型的答案到达“输出层”并出现在你的屏幕上之前，反应要经过几十个“隐藏层”，这些层接收来自上一层的输出，并将其输出发送到下一层 -- 类似于你大脑中的神经元。随着每一个连续的层，输出被转化，在理论上接近你查询的和模型训练数据之间的最佳匹配。

来源：Annelisa Leinbach

当然，就像一个知道正确答案的孩子，但告诉你他们认为你想听的内容一样，输出层并不总是产生最准确的内容 -- 相反，模型被优化为提供人类“奖励”它产生的东西，要么是通过字面上对模型的输出进行向上或向下评级，要么是简单地编程让模型预测类似人类的文本，这些文本可能是真实的，也可能不是真实的。

Burns 想知道，如果你从模型的隐藏层中提取答案，而不是根据模型的最终输出，会发生什么。

最终的结果可能看起来很相似 -- 来自聊天机器人的文本回应 -- 但如果模型包含了真实的信息集群，那么你是否可以通过阅读模型在中间层的“想法”，而不是听它最终产生的结果来更容易地获取信息？

关于“真理”的数学

最初，Burns 编写了一个算法，在这个未标记的向量海洋中搜索信息集群。但事实证明，这就像在大海里用针钓鱼一样。Burns 想，也许他可以用一种更有针对性的方式进行搜索。“直觉上，我认为，真理确实有这种特殊的性质——即否定的一致性。”

真理语句的最基本属性之一，如二加二等于四，就是反面为假。这是计算机可以理解的原则，即使它没有真理的概念：“如果 X 是真的，”正如 Burns 所说，“那么 not-X 是假的。”

幸运的是，否定一致性在数学中是相对简单的表示。Burns 说：“如果一件事既可以是真也可以是假，那么如果你赋予它一定的概率为真，你就应该赋予它一个减去这个概率为假的概率。”

换句话说，一个真实的陈述和它的否定形式的概率加起来应该是 1。现在 Burns 有了要寻找的东西，即满足这些标准的群组。“我有这种直觉，在向量空间中应该有这种类型的几何，”Burns 回忆说。“所以也许我们可以直接搜索它。”

“如果模型中有任何其他的集群，”他补充说，“它可能会对应于一些随机的东西 -- 比如，这个输入的情绪是积极的还是消极的？这肯定不能满足否定的一致性。但真相应该是这样。”

隐藏的知识

把这个想法变成现实花了 Burns 几个月的时间。他说：“你真的需要把很多细节搞清楚，”“才能看到比随机更好的东西。但是，如果你确实得到了正确的细节，那么它可以工作得非常好。”

2022 年 12 月，Burns 和三位合著者 -- 北京大学的学生 Haotian Ye，以及 Burns 在加州大学伯克利分校的导师 Dan Klein 和雅 Jacob Steinhardt-- 发表了一篇题为“在没有监督的情况下发现语言模型中的潜在知识”的论文，该论文将于 2023 年 5 月在该领域的一个主要集会上发表。

他们在一系列数据上测试了他们的方法 -- 他们称之为“对比一致搜索”，即 CCS（Contrast-Consistent Search）-- 他们发现 Burns 的直觉基本上是正确的。在相对较高的准确率下，CCS 能够在不查看模型输出的情况下成功地回答是或否的问题。

“此外，”作者写道，“我们尝试故意促使模型做出不正确的输出，这在直觉上应该会改变模型的说法，但这不应该影响它们的潜在知识。”

这些误导性的输入 -- 给模型一系列有错误或无意义的答案的问题 -- 确实引导了模型的错误，在一个案例中，模型在后续问题上的准确性降低了高达 9.5%。但这些干扰并不影响 CCS 的准确性，CCS 依赖于隐藏在模型中间层的“潜在知识”。

作者总结说：“我们的研究结果为发现语言模型知道什么，而不是它们说什么提供了第一步。”-- 不管模型的输入事先是否被标记为真或假。

你想要一份工作吗？

Burns 在推特上分享这篇论文和附带的代码后，引发了学术计算机科学界的热烈关注。

“非常有尊严的工作！”AI 安全和研究的主要批评者 Elizier Yudkowsky 写道。

“在没有监督的情况下发现语言模型中的潜在知识，这让我大吃一惊，”Meta 机器学习工程师 Zack Witten 写道。“基本想法很简单，但却很精彩”。

而在 OpenAI 休假的德克萨斯大学奥斯汀分校教授 Aaronson 将这篇论文描述为“令人惊叹的”。

麻省理工学院的教授 Jacob Andreas 感慨道“希望我可以引用这篇论文”。据悉，Andreas 刚刚发表了一篇论文，探索了语言模型在多大程度上反映了人类交流者的内部动机。

此外，OpenAI 的对齐负责人 Jan Leike（主要负责指导像 GPT-4 这样的新模型来帮助而不是伤害人类的进步）也对这篇论文作出回应，即向 Burns 提供一份工作，但 Burns 最初拒绝了，而后 OpenAI 的联合创始人兼首席执行官 Sam Altman 的个人呼吁改变了他的想法。

“Colin 关于‘在没有监督的情况下发现语言模型中的潜在知识’的工作是一种新颖的方法，可以确定语言模型对世界的真实看法，”Leike 说。“他的工作令人兴奋的地方在于，它可以在人类自己都不知道什么是真的情况下工作，所以它可以应用于比人类更聪明的系统。”

缺陷与挑战

正如作者自己所承认的，CCS 也有缺点 -- 即它依赖于将自己组织成真实和虚假信息集群的向量的存在。

“这就要求一个模型既能评估给定输入的真实性，”他们写道，“也要求模型主动评估该输入的真实性。”

显然，一些模型和数据集 --Burns 和他的合著者使用了半打模型和近十种数据集（从 IMDB 评论到短篇小说集）测试 CCS-- 符合这些标准，而其他的则不符合。

“目前还不清楚这些条件在什么时候准确地成立，”他们补充道，指的是利用这些工具带来的神秘感，研究人员仍在研究这些工具的内部工作原理。

此外，依赖从互联网上学习的模型也是一个挑战，互联网上充满了自信的假话和真相。

“你可以说，在某种意义上，网络所代表的并不是‘现实的真相’，”Aaronson 指出，“而只是训练数据中被视为真实的东西。”

或者，正如麻省理工学院的博士后 Anna Ivanova 所说：互联网上的真相是通过共识达成的，至少就语言模型而言是这样。例如，如果你看一下网上的所有文件，大多数会把猫归类为哺乳动物——所以一个模型很可能正确地学习到猫是哺乳动物，因为这是模型最常看到的。

“但当涉及到更多有争议的话题或阴谋论时，”她说，“当然会有不同的陈述”，而且比例要高得多，这使得语言模型更有可能鹦鹉学舌地模仿谎言。

不过，正如 Aaronson 后来推测的那样，CCS-- 或类似的一些方法 -- 可能会被证明有助于打击错误信息的增加，而错误信息的增加必然会伴随着越来越强大的语言模型而出现。Aaronson 指出，像 ChatGPT 这样的工具，本质上是即兴艺术家：“他们在玩一种不同于关于现实的真理或谬误的游戏。”

Burns 和他的合著者没有检测人工智能主动谎言的能力，因为研究人员还没有为这种情况开发出标准化的测试。他们写道：“如果未来的工作开发出这样的设置，一个好的压力测试将是应用 CCS 在这种设置下进行‘测谎’。”

Aaronson 设想，在这种情况下，如果你向 ChatGPT 询问一个问题，你的查询可能同时探测模型的内部环境来寻找答案，当答案与模型的输出不一致时，就会弹出一个窗口：“警告，我们的内部测谎仪已经触发了警报！”

对 Burns 来说，CCS-- 以及更普遍的“对齐”研究 -- 解决我们尚未遇到的问题的潜力是重点。“我认为未来模型的能力被低估了，”他说。“如果我们有更先进的人工智能系统，我们怎么能相信他们所说的呢？”

中文推特：https://twitter.com/8BTC_OFFICIAL

英文推特：https://twitter.com/btcinchina

Discord社区：https://discord.gg/defidao

电报频道：https://t.me/Mute_8btc

电报社区：https://t.me/news_8btc

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
【中国国际航空-注册_登录安全分析报告】风控牛验证码接口安全评测系列安全行为验证极验网易易盾智能手机
前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机器学习能力提高的当下，连百度这样的大厂都遭受攻击导致点名批评，图形验证及交互验证方式的安全性到底如何？请看具体分析一、中国国际航空PC
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
七.正则化愿风去了
吴恩达机器学习之正则化（Regularization）http://www.cnblogs.com/jianxinzhou/p/4083921.html从数学公式上理解L1和L2https://blog.csdn.net/b876144622/article/details/81276818虽然在线性回归中加入基函数会使模型更加灵活，但是很容易引起数据的过拟合。例如将数据投影到30维的基函数上，模
机器学习-------数据标准化罔闻_spider 数据分析算法机器学习人工智能
什么是归一化，它与标准化的区别是什么？一作用在做训练时，需要先将特征值与标签标准化，可以防止梯度防炸和过拟合；将标签标准化后，网络预测出的数据是符合标准正态分布的—StandarScaler()，与真实值有很大差别。因为StandarScaler()对数据的处理是（真实值-平均值）/标准差。同时在做预测时需要将输出数据逆标准化提升模型精度：标准化/归一化使不同维度的特征在数值上更具比较性，提高分类
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
cmd泛滥_与您的后泛滥同事见面：人工智能机器人 weixin_26644585 人工智能 leetcode
cmd泛滥Readytoswapyouroldcube-mateforadisembodiedAI?IPsoftCEOChetanDube,creatorofAIco-workerAMELIA,giveshistakeonthepost-COVIDofficelandscape.准备将您的旧立方体伙伴换成无形的AI？AIsoft同事AMELIA的创始人IPsoft首席执行官ChetanDube阐述
jQuery 键盘事件keydown ,keypress ,keyup介绍 107x js jquery keydown keypress keyup
本文章总结了下些关于jQuery 键盘事件keydown ,keypress ,keyup介绍，有需要了解的朋友可参考。一、首先需要知道的是： 1、keydown() keydown事件会在键盘按下时触发. 2、keyup() 代码如下复制代码 $('input').keyup(funciton(){
AngularJS中的Promise bijian1013 JavaScript AngularJS Promise
一.Promise Promise是一个接口，它用来处理的对象具有这样的特点：在未来某一时刻（主要是异步调用）会从服务端返回或者被填充属性。其核心是，promise是一个带有then()函数的对象。为了展示它的优点，下面来看一个例子，其中需要获取用户当前的配置文件： var cu
c++ 用数组实现栈类 CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T, int SIZE = 50> class Stack{ private: T list[SIZE];//数组存放栈的元素 int top;//栈顶位置 public: Stack(
java和c语言的雷同麦田的设计者 java 递归 scaner
软件启动时的初始化代码，加载用户信息2015年5月27号从头学java二 1、语言的三种基本结构：顺序、选择、循环。废话不多说，需要指出一下几点： a、return语句的功能除了作为函数返回值以外，还起到结束本函数的功能，return后的语句不会再继续执行。 b、for循环相比于whi
LINUX环境并发服务器的三种实现模型被触发 linux
服务器设计技术有很多，按使用的协议来分有TCP服务器和UDP服务器。按处理方式来分有循环服务器和并发服务器。 1 循环服务器与并发服务器模型在网络程序里面，一般来说都是许多客户对应一个服务器，为了处理客户的请求，对服务端的程序就提出了特殊的要求。目前最常用的服务器模型有： ·循环服务器：服务器在同一时刻只能响应一个客户端的请求 ·并发服务器：服
Oracle数据库查询指令肆无忌惮_ oracle数据库
20140920 单表查询 -- 查询************************************************************************************************************ -- 使用scott用户登录 -- 查看emp表 desc emp
ext右下角浮动窗口知了ing JavaScript ext
第一种 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/
浅谈REDIS数据库的键值设计矮蛋蛋 redis
http://www.cnblogs.com/aidandan/ 原文地址：http://www.hoterran.info/redis_kv_design 丰富的数据结构使得redis的设计非常的有趣。不像关系型数据库那样，DEV和DBA需要深度沟通，review每行sql语句，也不像memcached那样，不需要DBA的参与。redis的DBA需要熟悉数据结构，并能了解使用场景。
maven编译可执行jar包 alleni123 maven
http://stackoverflow.com/questions/574594/how-can-i-create-an-executable-jar-with-dependencies-using-maven <build> <plugins> <plugin> <artifactId>maven-asse
人力资源在现代企业中的作用百合不是茶 HR 企业管理
//人力资源在在企业中的作用人力资源为什么会存在，人力资源究竟是干什么的人力资源管理是对管理模式一次大的创新，人力资源兴起的原因有以下点：工业时代的国际化竞争，现代市场的风险管控等等。所以人力资源在现代经济竞争中的优势明显的存在，人力资源在集团类公司中存在着明显的优势(鸿海集团)，有一次笔者亲自去体验过红海集团的招聘，只知道人力资源是管理企业招聘的当时我被招聘上了，当时给我们培训的人
Linux自启动设置详解 bijian1013 linux
linux有自己一套完整的启动体系，抓住了linux启动的脉络，linux的启动过程将不再神秘。阅读之前建议先看一下附图。本文中假设inittab中设置的init tree为： /etc/rc.d/rc0.d /etc/rc.d/rc1.d /etc/rc.d/rc2.d /etc/rc.d/rc3.d /etc/rc.d/rc4.d /etc/rc.d/rc5.d /etc
Spring Aop Schema实现 bijian1013 java spring AOP
本例使用的是Spring2.5 1.Aop配置文件spring-aop.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmln
【Gson七】Gson预定义类型适配器 bit1129 gson
Gson提供了丰富的预定义类型适配器，在对象和JSON串之间进行序列化和反序列化时，指定对象和字符串之间的转换方式， DateTypeAdapter public final class DateTypeAdapter extends TypeAdapter<Date> { public static final TypeAdapterFacto
【Spark八十八】Spark Streaming累加器操作（updateStateByKey) bit1129 update
在实时计算的实际应用中，有时除了需要关心一个时间间隔内的数据，有时还可能会对整个实时计算的所有时间间隔内产生的相关数据进行统计。比如：对Nginx的access.log实时监控请求404时，有时除了需要统计某个时间间隔内出现的次数，有时还需要统计一整天出现了多少次404，也就是说404监控横跨多个时间间隔。 Spark Streaming的解决方案是累加器，工作原理是，定义
linux系统下通过shell脚本快速找到哪个进程在写文件 ronin47
一个文件正在被进程写我想查看这个进程文件一直在增大找不到谁在写使用lsof也没找到这个问题挺有普遍性的，解决方法应该很多，这里我给大家提个比较直观的方法。 linux下每个文件都会在某个块设备上存放，当然也都有相应的inode, 那么透过vfs.write我们就可以知道谁在不停的写入特定的设备上的inode。幸运的是systemtap的安装包里带了inodewatch.stp，位
java-两种方法求第一个最长的可重复子串 bylijinnan java 算法
import java.util.Arrays; import java.util.Collections; import java.util.List; public class MaxPrefix { public static void main(String[] args) { String str="abbdabcdabcx";
Netty源码学习-ServerBootstrap启动及事件处理过程 bylijinnan java netty
Netty是采用了Reactor模式的多线程版本，建议先看下面这篇文章了解一下Reactor模式： http://bylijinnan.iteye.com/blog/1992325 Netty的启动及事件处理的流程，基本上是按照上面这篇文章来走的文章里面提到的操作，每一步都能在Netty里面找到对应的代码其中Reactor里面的Acceptor就对应Netty的ServerBo
servelt filter listener 的生命周期 cngolon filter listener servelt 生命周期
1. servlet 当第一次请求一个servlet资源时，servlet容器创建这个servlet实例，并调用他的 init(ServletConfig config)做一些初始化的工作，然后调用它的service方法处理请求。当第二次请求这个servlet资源时，servlet容器就不在创建实例，而是直接调用它的service方法处理请求，也就是说
jmpopups获取input元素值 ctrain JavaScript
jmpopups 获取弹出层form表单首先，我有一个div，里面包含了一个表单，默认是隐藏的，使用jmpopups时，会弹出这个隐藏的div，其实jmpopups是将我们的代码生成一份拷贝。当我直接获取这个form表单中的文本框时，使用方法：$('#form input[name=test1]').val()；这样是获取不到的。我们必须到jmpopups生成的代码中去查找这个值，$(
vi查找替换命令详解 daizj linux 正则表达式替换查找 vim
一、查找查找命令 /pattern<Enter> ：向下查找pattern匹配字符串 ?pattern<Enter>：向上查找pattern匹配字符串使用了查找命令之后，使用如下两个键快速查找： n：按照同一方向继续查找 N：按照反方向查找字符串匹配 pattern是需要匹配的字符串，例如： 1: /abc<En
对网站中的js,css文件进行打包 dcj3sjt126com PHP 打包
一，为什么要用smarty进行打包 apache中也有给js,css这样的静态文件进行打包压缩的模块，但是本文所说的不是以这种方式进行的打包，而是和smarty结合的方式来把网站中的js,css文件进行打包。为什么要进行打包呢，主要目的是为了合理的管理自己的代码。现在有好多网站，你查看一下网站的源码的话，你会发现网站的头部有大量的JS文件和CSS文件，网站的尾部也有可能有大量的J
php Yii: 出现undefined offset 或者 undefined index解决方案 dcj3sjt126com undefined
在开发Yii 时，在程序中定义了如下方式： if($this->menuoption[2] === 'test')，那么在运行程序时会报：undefined offset:2，这样的错误主要是由于php.ini 里的错误等级太高了，在windows下错误等级
linux 文件格式（1） sed工具 eksliang linux linux sed工具 sed工具 linux sed详解
转载请出自出处： http://eksliang.iteye.com/blog/2106082 简介 sed 是一种在线编辑器，它一次处理一行内容。处理时，把当前处理的行存储在临时缓冲区中，称为“模式空间”（pattern space），接着用sed命令处理缓冲区中的内容，处理完成后，把缓冲区的内容送往屏幕。接着处理下一行，这样不断重复，直到文件末尾
Android应用程序获取系统权限 gqdy365 android
引用如何使Android应用程序获取系统权限第一个方法简单点，不过需要在Android系统源码的环境下用make来编译： 1. 在应用程序的AndroidManifest.xml中的manifest节点
HoverTree开发日志之验证码 hvt .net C#asp.net hovertree webform
HoverTree是一个ASP.NET的开源CMS，目前包含文章系统，图库和留言板功能。代码完全开放，文章内容页生成了静态的HTM页面，留言板提供留言审核功能，文章可以发布HTML源代码，图片上传同时生成高品质缩略图。推出之后得到许多网友的支持，再此表示感谢！留言板不断收到许多有益留言，但同时也有不少广告，因此决定在提交留言页面增加验证码功能。ASP.NET验证码在网上找，如果不是很多，就是特别多
JSON API：用 JSON 构建 API 的标准指南中文版 justjavac json
译文地址：https://github.com/justjavac/json-api-zh_CN 如果你和你的团队曾经争论过使用什么方式构建合理 JSON 响应格式，那么 JSON API 就是你的 anti-bikeshedding 武器。通过遵循共同的约定，可以提高开发效率，利用更普遍的工具，可以是你更加专注于开发重点：你的程序。基于 JSON API 的客户端还能够充分利用缓存，
数据结构随记_2 lx.asymmetric 数据结构笔记
第三章栈与队列一．简答题 1. 在一个循环队列中，队首指针指向队首元素的前一个位置。 2.在具有n个单元的循环队列中，队满时共有 n-1 个元素。 3. 向栈中压入元素的操作是先移动栈顶指针&n
Linux下的监控工具dstat 网络接口 linux
1) 工具说明dstat是一个用来替换 vmstat,iostat netstat,nfsstat和ifstat这些命令的工具, 是一个全能系统信息统计工具. 与sysstat相比, dstat拥有一个彩色的界面, 在手动观察性能状况时, 数据比较显眼容易观察; 而且dstat支持即时刷新, 譬如输入dstat 3, 即每三秒收集一次, 但最新的数据都会每秒刷新显示. 和sysstat相同的是,
C 语言初级入门--二维数组和指针 1140566087 二维数组 c/c++指针
/* 二维数组的定义和二维数组元素的引用二维数组的定义：当数组中的每个元素带有两个下标时，称这样的数组为二维数组； (逻辑上把数组看成一个具有行和列的表格或一个矩阵); 语法：类型名数组名[常量表达式1][常量表达式2] 二维数组的引用：引用二维数组元素时必须带有两个下标，引用形式如下：例如： int a[3][4]; 引用：
10点睛Spring4.1-Application Event wiselyman application
10.1 Application Event Spring使用Application Event给bean之间的消息通讯提供了手段应按照如下部分实现bean之间的消息通讯继承ApplicationEvent类实现自己的事件实现继承ApplicationListener接口实现监听事件使用ApplicationContext发布消息