weixin_30780221

第四次工业革命：人工智能（AI）入门

转载自 http://www.infoq.com/cn/articles/the-fourth-industrial-revolution-an-introduction-to-ai

“过去10年我们在忙于打造移动为先的世界。未来10年，我们将步入AI为先的世界。”（谷歌CEO Sundar Pichai，2016年10月）

从亚马逊到Facebook，再到谷歌和微软，全球最顶尖、最有影响力的技术公司都将目光转向了人工智能（AI）。AI到底是什么？为何如此重要？为何现在变得重要？虽然人们对AI的关注与日俱增，但对该领域有着充分理解的依然仅仅只是业内专家。本文意在让更多人了解这一重要的前沿领域。

本文首先会介绍“AI”的含义以及包括“机器学习”在内的一些关键词。我们将介绍“深度学习”这一最有成效的AI分支是如何实现的。同时还会介绍AI试图解决的问题以及这些问题的重要性。最后，我们还将深入介绍为何早在二十世纪五十年代就已诞生的AI这一概念直到今天才开始逐渐成熟。

作为风险投资人，我们需要紧跟能为消费者和企业创造价值的新兴趋势。我们认为AI是计算领域的一次革命，其重要性甚至远远超过移动或云计算。“这实在难以用言语表达，”亚马逊CEO Jeff Bezos写道：“未来20年里，人工智能对全社会产生的影响将大到难以想象。”希望本文可以破除各种喧嚣炒作，向消费者或企业高管，以及创业者和投资人解释这一新兴趋势如此重要的原因。

1. AI是什么？

人工智能：研究智能程序的科学

“人工智能（AI）”这个词由达特茅斯大学助理教授John McCarthy在1956年提出，作为一种统称，AI可用于指代可体现出智能行为的硬件或软件。按照McCarthy教受的说法，这是一种“可以制造出智能的机器，尤其是智能的计算机程序的科学和工程。”

最基本的AI早在几十年前就已诞生，当时的AI可通过基于规则的程序，在某些特定情境中体现出最基本的“智能”。然而这类技术的发展一直受到各种限制，因为足以应对现实世界中各种问题所需的算法实在是太过复杂，很难由人工编程的方式实现。

这里所谓的复杂的活动包括做出医学诊断、预测机器故障时间或衡量某些资产的市值，这些行为中往往涉及数千种数据集和大量变量之间的非线性关系。这种情况下通常难以通过现有数据获得最佳效果，即对我们的预测进行“优化”。对于其他一些情况，例如识别图片中的物体以及翻译语言，此时我们甚至无法开发出用于描述所需“功能”的规则。例如，我们该如何通过编写一系列规则，使得程序能在任何情况下描述出一只狗的外观？

如果能将做出各种复杂预测的困难工作，即数据优化和特征（Feature）规范?，从程序员身上转嫁给程序，情况又会怎样？这正是现代化人工智能带给我们的承诺。

机器学习：承担优化任务

机器学习（ML）是AI的一个子集。所有机器学习都是AI，但并非所有AI都是机器学习（图上图1）。当今人们对AI的兴趣主要体现在对机器学习技术的关注中，使得这一技术快速获得了显著进步。

机器学习使得我们可以将某些沉重的工作交给算法处理，进而解决相对于人类来说过于复杂的问题。AI分支的先驱Arthur Samuel在1959年曾经写到，机器学习是“一种能够让计算机在无须进行有针对性的编程情况下，自行获得学习能力的学科领域。”

大部分机器学习技术的目标在于针对特定用例开发一种预测引擎。算法负责接收有关特定领域（例如某人过去看过的所有电影）的信息，通过对输入的信息进行权衡做出有用的预测（此人未来观看其他种类电影的可能性）。通过实现让“计算机自行学习的能力”，我们可以将优化方面的任务，即对可用数据中的不同变量进行权衡，进而面向未来做出精确的预测，交给算法负责。有时候甚至可以更进一步，将“需要考虑的未来”这种初步决策也交给程序处理。

机器学习算法可通过训练进行学习。最开始，可以为算法提供输出结果为已知的样本数据，并将实际结果与预测结果的差异进行对比，随后对所输入内容的权重进行调优，借此改善预测结果的精确度，直到最终获得优化。因此机器学习算法的界定性征（Defining characteristic）就在于通过经验对预测结果进行改善所能取得的质量。我们提供的数据越多（通常大到某种临界点），就能创建出越好的预测引擎（如下图2和图3，需要注意，所需数据集的规模严重取决于具体情境，但无法从下列范例中加以概括。）

目前机器学习方法已经超过15种，每种都可以使用不同的算法结构通过收到的数据对预测进行优化。作为其中的一种方法，“深度学习”在很多全新领域实现了突破性的结果，下文将详细介绍。算法其实还有很多，其他算法虽然不像深度学习那样获得了最为广泛的关注，但也有自己的价值，因为可以适用于更广泛的用例中。除了深度学习，其他最实用的机器学习算法还包括：

“Random forests（随机丛林）”，通过创建大量决策树对预测进行优化；
“Bayesian networks（贝叶斯网络）”，使用基于概率的方法分析变量和变量之间的关系，以及
“支持向量机（Vector machine）”，可通过多种分类样本并创建模型将新的输入内容分配给某一分类。

每种方法各有利弊，并能混合使用（一种“综合”方法）。针对特定问题选择哪种算法，主要取决于各种因素，包括可用数据集的本质特征等。实际上开发者通常趋向于通过多种实验确定最佳算法。

机器学习技术的用例因具体需求和想象力而各不相同。只要有合适的数据，我们就可以为无数用途构建所需的算法，例如：根据购买记录推荐顾客可能愿意购买的产品，预测汽车组装流水线上的机械手什么时候会故障，预测邮件地址是否输入有误，估算某笔信用卡交易存在欺诈情况的可能性等。

深度学习：开始处理特征规范

就算借助通用用途的机器学习（随机丛林、贝叶斯网络、支持向量机等），编写能良好执行某类任务的程序这也是一项困难的工作，从语言的理解到图片中物体的识别不出其外。为什么？因为我们无法用足够实用并且可靠的方式明确指定所要优化的特征。举例来说，如果希望编写能识别车辆图片的计算机程序，我们根本不能通过为算法指定车辆特征的方式确保在任何情况下均能获得正确的识别结果。车辆有着不同的外形、尺寸和颜色，车辆的位置、朝向以及具体形态也多种多样。背景、光照，以及众多其他因素都会对物体的外观产生影响。此时若要编写规则，需要考虑的变化实在是太多了。就算可以做到这一切，整个解决方案的缩放能力也会受到极大限制：我们必须为打算识别的每个类型的物体分别编写一套程序。

拥抱深度学习（DL）吧，该技术让人工智能领域产生了脱胎换骨的革新。深度学习是机器学习的一个子集，也是超过15种不同方法之一。所有深度学习均为机器学习，但并非所有机器学习均为深度学习（见下图4）。

深度学习很有用，避免了程序员不得不自行处理特征规范（定义要在数据种分析的特征）或优化（如何对数据进行权衡以提供更精确的预测）的麻烦，这些可交给算法来做。

这是如何实现的？深度学习的突破之处在于对大脑，而非整个世界进行建模。人类的大脑会学着做各种困难的事，例如理解语音和识别物体，这并不是通过事无巨细的规则实现的，而是通过各种实践和反馈实现。孩提时期，我们会逐渐开始探索整个世界（例如看到一张汽车的图片），做出预测（“看，汽车！”），并收到反馈（“你说的没错！”）。并不需要各种琐碎的规则，我们可以通过训练自行学习。

深度学习使用了类似的方法。人工制造的仅仅是基于软件的计算器，借此模拟出与大脑中神经元相互连接后所实现的类似功能。通过这种计算机组成一个“神经网络”，接受输入（继续上文的例子，一张汽车的图片），对输入的内容进行分析进而做出判断，并了解自己的判断是否正确。如果输出结果是错误的，将由算法对神经元之间的连接进行调教，进而改变后续的预测。最初这个网络可能会经常犯错，但随着我们向TA提供数百万个样本，神经元之间的连接将获得调优，使得整个神经网络能在几乎所有情况下做出正确的判断。实践出（近似的）真知。

通过这种过程，随着效果日渐好转，现在我们已经可以：

识别图片中的元素；
实时进行两种语言的互译；
通过语音命令控制设备（例如苹果的Siri、Google Now、亚马逊Alexa，以及微软小娜）；
预测基因变异对DNA转录的影响；
分析客户评论中的情绪；
检测医疗影像中的肿瘤等。

深度学习并不能用来解决所有问题。这种方式通常需要用极大量的数据集进行训练。神经网络的训练和运行需要投入大量计算处理能力，此外这种方法还存在“可解释性”方面的问题：可能很难知道某个神经网络的预测能力是如何发展起来的。但因为能将开发者从复杂的特征规范任务中解脱出来，深度学习已经可以为各种重要问题提供非常成功的预测引擎。因此深度学习已经成为AI开发者手中一款强大的利器。

2. 深度学习是如何工作的？

鉴于其重要性，我们有必要对深度学习的工作原理有所简单理解。深度学习需要使用人造的“神经网络”，这是一种相互连接的“神经元”（基于软件的计算器）的集合。

人造的神经元可以接受一种或多种输入。神经元会针对输入结果执行数学运算，并产生可输出的结果。输出的结果取决于每类输入的“权重”以及神经元的“输入-输出函数”配置（见下图5）。输入-输出函数各异。神经元可以是：

一种线性单位（Linear unit），输出结果与输入总权重成比例；
一种阈值单位（Threshold unit），输出结果为两个级别中的一种，取决于总输入是否高于某一特定值；或
是一种S形单位（Sigmoid unit），输出结果频繁变化，而不像输入那样呈线性变化的态势。

多个神经元相互连接组成了神经网络，一个神经元的输出可以成为另一个神经元的输入（见下图6）。

神经网络可通过组织整理呈现为多层次神经元（这也是“深度”这个词的由来）。其中“输入层”负责接收将由网络处理的信息，例如一组图片。“输出层”负责提供结果。输入和输出层之间还有“隐藏层”，大部分活动均在这一层中发生。通常来说，神经网络上每一层神经元的输出内容均可成为下一层神经元的输入内容之一（见下图7）。

用图像识别算法作为例子来看看吧。假设要识别图片中的人脸。将数据装入神经网络后，第一层负责识别局部对比模式，例如图片边缘，这是一种“底层”特征。随着图片在整个网络中流动，逐渐提取出“高层”特征，例如从边缘到鼻子，再从鼻子到面孔（见下图8）。

在输出层方面，根据训练效果，神经网络会就图片是每种特定类型的可能性给出概率（人脸：97%；气球：2%；树叶：1%）。

通常来说，神经网络的训练过程需要使用大量已经进行过分类的样本。随后算法会通过检测出的错误和神经元之间的连接权重进行调整，借此改善效果。优化过程的重复性极高，训练完成后即可部署系统并对未分类图片进行评估。

上文描述的是一种很简单的神经网络，实际上神经网络的结构可能各异，并且大部分都非常复杂。各种常见变体包括：同层神经元之间的不同连接，每层神经元数量的变化，以及将神经元的输出结果流向前一层网络（“递归”神经网络）的连接。

神经网络的设计和完善需要投入相当多的技能。例如针对特定应用调整网络结构，提供适宜的训练数据集，根据进展调整网络结构，以及多种方法的混合使用等。

3. 为何AI如此重要？

AI如此重要，原因在于这种技术可以顺利解决以往看来极为困难的问题，而这些问题的解决方案能够应用于关乎人类福祉的重要领域：健康、教育、商业、运输、公共事业、娱乐…… 自二十世纪五十年代开始，人们对AI的研究主要侧重于下列五大领域的“查询”：

推论（Reasoning）：通过逻辑推理解决问题的能力。
知识（Knowledge）：运用人类知识的能力（了解现实世界中的某些实体、事件以及情况，并了解到这些元素有不同的属性，并且这些元素可以进行分类）。
规划（Planning）：设置并实现目标的能力（世界存在一种特定的未来预期状态，以及通过采取一系列行动最终推动世界向着这种状态发展的结果）。
交流（Communication）：理解书面和口头语言的能力。
感知（Perception）：通过视觉图像、声音和其他传感器输入推演出世间物件的能力。

AI蕴含着重大的价值，因为在很多情境下，这些能力方面取得的最新进展往往能催生出颠覆性（Revolutionary），而不仅仅是逐渐演变而来（Evolutionary）的其他能力。例如下文列举了AI的部分（远非全部）应用范例：

推论：法律评估、金融资产管理、金融应用处理、游戏、自主武器系统。
知识：医学诊断、药品研发、媒体推荐、购买预测、金融市场交易、欺诈检测。
规划：物流、调度、导航、物理和数字化网络优化、预防式维护、需求预测、库存管理。
交流：语音控制、智能代理/助理/客户支持、实时翻译书面和口头语言、文字实时转录。
感知：自动驾驶机动车、医学诊断、安防监控。

未来几年里，机器学习能力将被运用于几乎所有领域的各种过程中。以企业中的某一个职能为例，例如公司内部的人力资源（HR）活动，即可在下列不同过程中运用机器学习技术：

通过更完善的目标定位、更智能的岗位匹配，以及部分程度上自动化实现的评估改善人员招募过程；
通过对个人需求和可能出现的缺席进行预测式规划，改善员工管理能力；
通过向员工提供更有针对性的培训内容建议，实现更有效的员工学习活动；以及
通过预测重要员工可能存在离职风险降低员工流失率。

随着时间的发展，我们期待着机器学习能变成常态。机器学习迟早会成为开发者人手必备的工具，最初也许只能对现有过程进行改善，但有朝一日将实现彻底的革新。

机器学习的深远影响远远胜过这些直接产生的影响。深度学习已经让计算机视觉获得了突飞猛进的提高，例如目前的自动驾驶机动车（轿车和卡车）均已变为现实。但会产生怎样的影响？以目前的英国为例，90%的人员和80%的货物运输是在道路上进行的，仅自动驾驶机动车本身就能产生下列影响：

安全性（90%的机动车事故源于驾驶员注意力不集中）；
就业（英国的货运和物流行业员工总数为220万人，年薪总和约为570亿英镑）；
保险（Autonomous Research预计经过一段时间后英国的机动车保险保费总额将减少63%）；
经济（消费者更愿意按需获得交通服务，而非自行购置机动车）；
机动车生产量、城市规划、规章制度……

4. 为何AI直到今天才开始成熟？

有关AI的研究始于二十世纪五十年代，经历过数次虚假的“黎明期”后，为何现在才迎来拐点？由于新算法的陆续完善，所适用数据的大幅丰富，用于训练的硬件日益强大，以及云服务对开发者接受度的逐渐催化，AI的实际运用效果在近些年有了大幅改进。

1. 算法的改进

虽然深度学习算不上一种新技术（早在1965年就有人提出了第一个实际有效的多层神经网络规范?），但最近十年来深度学习算法的革新催生出了截然不同的结果。

识别图像中物体的能力随着卷积神经网络（CNN，Convolutional Neural Network）的发展产生了突飞猛进的提高（如下图9）。受到动物视觉脑皮层工作原理启发设计而来的CNN中，神经网络中的每一层均可充当判断特定模式是否存在所用的筛选器。2015年，微软基于CNN的计算机视觉系统在对图片中物体进行识别方面实现了比人类更高的准确度（计算机：95.1%；人类：94.9%）。“据我们所知，”他们写到：“我们的测试结果是计算机战胜人类的首例。”CNN还可应用于视频和语音识别等更广泛的领域。

与此同时，随着递归神经网络（RNN，Recurrent Neural Network）的诞生，语音和手写识别方面也取得了飞速进展（见下图10）。不同于卷积神经网络仅“向下馈送”的运作方式，RNN可通过反馈连接让数据呈环路流动。RNN还出现了一种更强大的新类型：长短期记忆（LSTM，Long Short-Term Memory）模型。在额外的连接和内存“细胞（Cell）”的帮助下，RNN可以“记住”自己在数千步操作之前看到的数据，并使用这些数据对后续需要关注的内容进行解释：这一特性对语音识别产生了巨大的帮助，因为对下一个词的理解通常会受到之前所处理词汇的影响。从2012年开始，谷歌就在使用LSTM驱动Android中的语音识别系统。就在六周前，微软工程师称他们的系统实现了低至5.9%的单词错误率，这是有史以来首次接近人类能力的水平。

2. 专用硬件

图形处理器（GPU）是一种特殊设计的电子电路，可大幅缩短为深度学习训练神经网络所需的时间。

现代化的GPU最初诞生于二十世纪九十年代末，当时主要是为了为3D游戏和3D开发应用程序进行加速。在3D环境中平移或缩放镜头需要重复用到一种名为矩阵计算的数学运算过程，串行架构的微处理器，包括当今大部分计算机所用的CPU很不适合用来处理此类任务。为了更高效地执行矩阵计算，GPU通常会使用大规模并行架构来制造（Nvidia M40包含3,072个内核）。

神经网络的训练会涉及大量矩阵计算。因此人们发现原本针对3D游戏设计的GPU其实很适合用来对深度学习过程加速。这样做获得了巨大的收效：一颗GPU即可让神经网络的训练时间缩短5倍，针对一些比较大规模的问题甚至可实现10倍甚至更高的加速。在配合针对深度学习框架进行优化的软件开发工具包之后，甚至还可以进一步加快训练速度（见下图11）。

3. 广博的数据

深度学习所用的神经网络通常需要用大量数据集进行训练，样本数量从数千起步，甚至可高达数百万。好在数据的创建速度和可用性也经历了指数形式的增长。今天，随着我们步入“第三波”数据时代，人类平均每天会生成2.2EB（23亿GB）数据，全球数据总量中有90%是过去24个月内创建的。

“第一波”的数据创建时代始于二十世纪八十年代，当时创建的主要是文档和事务数据，这一时期还在可联网台式计算机的普及过程中获得了催化。随后“第二波”数据时代，在可联网智能手机的推动下，诞生了大量非结构化媒体数据（邮件、照片、音乐、视频）、Web数据，以及各种元数据。今天我们正在步入数据的“第三个时代”，工业设施和家庭中部署的机器传感器创造了更多监视用数据、分析用数据，以及更多元数据。

考虑到今天我们所创建的大部分数据都会通过互联网传输，日益膨胀的互联网流量也开始充当人类海量数据生成过程中的代理。1992年，全人类每天平均传输100GB数据，但到2020年，我们将每秒传输61,000GB数据（见下图12，请注意尺度的变化）。

除了通用数据的富足，专用数据资源也在机器学习的推动下与日俱增。例如ImageNet是一个免费提供的数据库，其中已经包含超过1千万张手工分类的图片。该资源的诞生也对深度学习算法物体分类能力的发展起到了推波助澜的效果。

4. 云服务

开发者对机器学习的运用还受到云端机器学习基础架构和业界领先云供应商所提供服务的推动。

谷歌、亚马逊、微软，以及IBM均提供了云端基础架构（用于构建和迭代模型的环境，提供可缩放“GPU即服务”产品，并提供其他相关托管服务），这也使得机器学习能力的开发成本和难度大幅降低。

此外他们还提供了正在飞速发展的一系列云端机器学习服务，开发者可将其（从图像识别到语言翻译）直接用于自己的应用程序内。谷歌的机器学习服务针对下列领域提供了易于访问的服务：视觉（物体识别、显性内容检测、人脸检测、图像情绪分析）；语音（语音识别和语音到文字转换）；文字分析（实体识别、情绪分析、语言检测和翻译）；以及职员工作搜索（机会呈现和基于资历的匹配）。微软认知服务也提供了涵盖视觉、语音、语言、知识和搜索等领域的超过21种服务。

5. 兴趣和创业者

公众对AI的兴趣在过去五年里增加了六倍（见下图13），风投公司对AI公司的注资金额也有了显著增长（见下图14）。我们已经进入了一种良性循环的境地，机器学习的进一步发展正在继续吸引投资、创业者，以及社会各界的关注。尤其是后者，对机器学习的未来发展意义重大。

5. 接下来会怎样？

机器学习能带来数量众多、意义重大的收益。很多收益是看得见的，从无人驾驶机动车到新的人机交互方式等。还有一些收益虽然不那么明显，但也会对日常业务流程和消费者服务提供更强大的能力和效率。

与任何范式转变过程一样，有时过高的期望可能会超出短期内所能实现的潜力。我们期待着未来某一时刻，人们对AI的幻想能够彻底幻灭，随之而来的将会是长期、持续的价值认可，因为机器学习已经被用于改善并革新现有的系统。

在历史上，工业革命曾通过新的电力和传送方式改变了生产和交流方法。第一次工业革命在十八世纪八十年代使用蒸汽机驱动了机械化的生产过程；第二次工业革命在十九世纪七十年代使用电力推动了商品的大规模量产；第三次工业革命在二十世纪七十年代使用电子和软件技术实现了生产和交流的自动化。今天，随着软件逐渐“蚕食”整个世界，我们创造价值的主要来源已成为信息本身的处理。通过用更智能的方式完成这样的工作，机器学习将低调地为我们带来效益和历史意义。

作者：David Kelnar，阅读英文原文：The fourth industrial revolution: a primer on Artificial Intelligence (AI)

转载于:https://www.cnblogs.com/hwBeta/p/7571051.html

Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
SQL Server_查询某一数据库中的所有表的内容 qq_42772833 SQL Server 数据库 sqlserver
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是从查询结果中选择TABLE_NAM
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
MongoDB Oplog 窗口喝醉酒的小白 MongoDB 运维
在MongoDB中，oplog（操作日志）是一个特殊的日志系统，用于记录对数据库的所有写操作。oplog允许副本集成员（通常是从节点）应用主节点上已经执行的操作，从而保持数据的一致性。它是MongoDB副本集实现数据复制的基础。MongoDBOplog窗口oplog窗口是指在MongoDB副本集中，从节点可以用来同步数据的时间范围。这个窗口通常由以下因素决定：Oplog大小：oplog的大小是有限
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
【PG】常见数据库、表属性设置江无羡数据库
PG的常见属性配置方法数据库复制、备份相关表的复制标识单表操作批量表操作链接数据库复制、备份相关表的复制标识单表操作通过ALTER语句单独更改一张表的复制标识。ALTERTABLE[tablename]REPLICAIDENTITYFULL;批量表操作通过代码块的方式，对某个schema中的所有表一起更新其复制标识。SELECTtablename,CASErelreplidentWHEN'd'TH
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
关于Mysql 中 Row size too large (＞ 8126) 错误的解决和理解秋刀prince mysql mysql 数据库
提示：啰嗦一嘴，数据库的任何操作和验证前，一定要记得先备份！！！不会有错；文章目录问题发现一、问题导致的可能原因1、页大小2、行格式2.1compact格式2.2Redundant格式2.3Dynamic格式2.4Compressed格式3、BLOB和TEXT列二、解决办法1、修改页大小（不推荐）2、修改行格式3、修改数据类型为BLOB和TEXT列4、其他优化方式（可以参考使用）4.1合理设置数据
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
MongoDB知识概括 GeorgeLin98 持久层 mongodb
MongoDB知识概括MongoDB相关概念单机部署基本常用命令索引-IndexSpirngDataMongoDB集成副本集分片集群安全认证MongoDB相关概念业务应用场景：传统的关系型数据库（如MySQL），在数据操作的“三高”需求以及应对Web2.0的网站需求面前，显得力不从心。解释：“三高”需求：①Highperformance-对数据库高并发读写的需求。②HugeStorage-对海量数
Mongodb Error: queryTxt ETIMEOUT xxxx.wwwdz.mongodb.net 佛一脚 error react mongodb 数据库
背景每天都能遇到奇怪的问题，做个记录，以便有缘人能得到帮助！换了一台电脑开发nextjs程序。需要连接mongodb数据，对数据进行增删改查。上一台电脑好好的程序，新电脑死活连不上mongodb数据库。同一套代码，没任何修改，搞得我怀疑人生了，打开浏览器进入mongodb官网毫无问题，也能进入线上系统查看数据，网络应该是没问题。于是我尝试了一下手机热点，这次代码能正常跑起来，连接数据库了！！！是不
入门MySQL——查询语法练习 K_un
前言：前面几篇文章为大家介绍了DML以及DDL语句的使用方法，本篇文章将主要讲述常用的查询语法。其实MySQL官网给出了多个示例数据库供大家实用查询，下面我们以最常用的员工示例数据库为准，详细介绍各自常用的查询语法。1.员工示例数据库导入官方文档员工示例数据库介绍及下载链接：https://dev.mysql.com/doc/employee/en/employees-installation.h
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
ubuntu安装wordpress lissettecarlr
1安装nginx网上安装方式很多，这就就直接用apt-get了apt-getinstallnginx不用启动啥，然后直接在浏览器里面输入IP:80就能看到nginx的主页了。如果修改了一些配置可以使用下列命令重启一下systemctlrestartnginx.service2安装mysql输入安装前也可以更新一下软件源，在安装过程中将会让你输入数据库的密码。sudoapt-getinstallmy
深入浅出 -- 系统架构之负载均衡Nginx的性能优化 xiaoli8748_软件开发系统架构系统架构负载均衡 nginx
一、Nginx性能优化到这里文章的篇幅较长了，最后再来聊一下关于Nginx的性能优化，主要就简单说说收益最高的几个优化项，在这块就不再展开叙述了，毕竟影响性能都有多方面原因导致的，比如网络、服务器硬件、操作系统、后端服务、程序自身、数据库服务等，对于性能调优比较感兴趣的可以参考之前《JVM性能调优》中的调优思想。优化一：打开长连接配置通常Nginx作为代理服务，负责分发客户端的请求，那么建议开启H
【RabbitMQ 项目】服务端：数据管理模块之绑定管理月夜星辉雪 rabbitmq 分布式
文章目录一.编写思路二.代码实践一.编写思路定义绑定信息类交换机名称队列名称绑定关键字：交换机的路由交换算法中会用到没有是否持久化的标志，因为绑定是否持久化取决于交换机和队列是否持久化，只有它们都持久化时绑定才需要持久化。绑定就好像一根绳子，两端连接着交换机和队列，当一方不存在，它就没有存在的必要了定义绑定持久化类构造函数：如果数据库文件不存在则创建，打开数据库，创建binding_table插入
计算机毕业设计PHP仓储综合管理系统（源码+程序+VUE+lw+部署） java毕设程序源码王哥 php 课程设计 vue.js
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程。欢迎交流项目运行环境配置：phpStudy+Vscode+Mysql5.7+HBuilderX+Navicat11+Vue+Express。项目技术：原生PHP++Vue等等组成，B/S模式+Vscode管理+前后端分离等等。环境需要1.运行环境：最好是小皮phpstudy最新版，我们在这个版本上开发的。其他版本理论上也可以。2.开发
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
3.增删改查--连接查询问女何所忆
关系型数据库的一个特点就是，多张表之间存在关系，以致于我们可以连接多张表进行查询操作，所以连接查询会是关系型数据库中最常见的操作。连接查询主要分为三种，交叉连接、内连接和外连接，我们一个个说。1、交叉连接交叉连接其实连接查询的第一个阶段，它简单表现为两张表的笛卡尔积形式，具体例子：如果你没学过数学中的笛卡尔积概念，你可以这样简单的理解这里的交叉连接：两张表的交叉连接就是一个连接合并的过程，T1表中
docker from指令的含义_多个FROM-含义 weixin_39722188 docker from指令的含义
小编典典什么是基本图片？一组文件，加上EXPOSE端口ENTRYPOINT和CMD。您可以添加文件并基于该基础图像构建新图像，Dockerfile并以FROM指令开头：后面提到的图像FROM是新图像的“基础图像”。这是否意味着如果我neo4j/neo4j在FROM指令中声明，则在运行映像时，neo数据库将自动运行并且可在端口7474的容器中使用？仅当您不覆盖CMD和时ENTRYPOINT。但是图像
Redis:缓存击穿我的程序快快跑啊缓存 redis java
缓存击穿(热点key)：部分key(被高并发访问且缓存重建业务复杂的)失效,无数请求会直接到数据库，造成巨大压力1.互斥锁：可以保证强一致性线程一：未命中之后，获取互斥锁，再查询数据库重建缓存，写入缓存，释放锁线程二：查询未命中，未获得锁(已由线程一获得)，等待一会，缓存命中互斥锁实现方式：redis中setnxkeyvalue:改变对应key的value,仅当value不存在时执行，以此来实现互
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
mysql学习教程，从入门到精通，TOP 和MySQL LIMIT 子句（15）知识分享小能手大数据数据库 MySQL mysql 学习 oracle 数据库开发语言 adb 大数据
1、TOP和MySQLLIMIT子句内容在SQL中，不同的数据库系统对于限制查询结果的数量有不同的实现方式。TOP关键字主要用于SQLServer和Access数据库中，而LIMIT子句则主要用于MySQL、PostgreSQL（通过LIMIT/OFFSET语法）、SQLite等数据库中。下面将分别详细介绍这两个功能的语法、语句以及案例。1.1、TOP子句（SQLServer和Access）1.1
ios内付费 374016526 ios 内付费
近年来写了很多IOS的程序，内付费也用到不少，使用IOS的内付费实现起来比较麻烦，这里我写了一个简单的内付费包，希望对大家有帮助。具体使用如下: 这里的sender其实就是调用者，这里主要是为了回调使用。 [KuroStoreApi kuroStoreProductId:@"产品ID" storeSender:self storeFinishCallBa
20 款优秀的 Linux 终端仿真器 brotherlamp linux linux视频 linux资料 linux自学 linux教程
终端仿真器是一款用其它显示架构重现可视终端的计算机程序。换句话说就是终端仿真器能使哑终端看似像一台连接上了服务器的客户机。终端仿真器允许最终用户用文本用户界面和命令行来访问控制台和应用程序。（LCTT 译注：终端仿真器原意指对大型机-哑终端方式的模拟，不过在当今的 Linux 环境中，常指通过远程或本地方式连接的伪终端，俗称“终端”。）你能从开源世界中找到大量的终端仿真器，它们
Solr Deep Paging(solr 深分页) eksliang solr深分页 solr分页性能问题
转载请出自出处：http://eksliang.iteye.com/blog/2148370 作者：eksliang(ickes) blg:http://eksliang.iteye.com/ 概述长期以来，我们一直有一个深分页问题。如果直接跳到很靠后的页数，查询速度会比较慢。这是因为Solr的需要为查询从开始遍历所有数据。直到Solr的4.7这个问题一直没有一个很好的解决方案。直到solr
数据库面试题 18289753290 面试题数据库
1.union ,union all 网络搜索出的最佳答案： union和union all的区别是,union会自动压缩多个结果集合中的重复结果，而union all则将所有的结果全部显示出来，不管是不是重复。 Union：对两个结果集进行并集操作，不包括重复行，同时进行默认规则的排序； Union All：对两个结果集进行并集操作，包括重复行，不进行排序； 2.索引有哪些分类？作用是
Android TV屏幕适配酷的飞上天空 android
先说下现在市面上TV分辨率的大概情况两种分辨率为主 1.720标清，分辨率为1280x720. 屏幕尺寸以32寸为主，部分电视为42寸 2.1080p全高清，分辨率为1920x1080 屏幕尺寸以42寸为主，此分辨率电视屏幕从32寸到50寸都有适配遇到问题，已1080p尺寸为例：分辨率固定不变，屏幕尺寸变化较大。如：效果图尺寸为1920x1080，如果使用d
Timer定时器与ActionListener联合应用永夜-极光 java
功能:在控制台每秒输出一次代码: package Main; import javax.swing.Timer; import java.awt.event.*; public class T { private static int count = 0; public static void main(String[] args){
Ubuntu14.04系统Tab键不能自动补全问题解决随便小屋 Ubuntu 14.04
Unbuntu 14.4安装之后就在终端中使用Tab键不能自动补全，解决办法如下： 1、利用vi编辑器打开/etc/bash.bashrc文件（需要root权限） sudo vi /etc/bash.bashrc 接下来会提示输入密码 2、找到文件中的下列代码 #enable bash completion in interactive shells #if
学会人际关系三招轻松走职场 aijuans 职场
要想成功，仅有专业能力是不够的，处理好与老板、同事及下属的人际关系也是门大学问。如何才能在职场如鱼得水、游刃有余呢？在此，教您简单实用的三个窍门。　　第一，多汇报最近，管理学又提出了一个新名词“追随力”。它告诉我们，做下属最关键的就是要多请示汇报，让上司随时了解你的工作进度，有了新想法也要及时建议。不知不觉，你就有了“追随力”，上司会越来越了解和信任你。　　第二，勤沟通团队的力
《O2O：移动互联网时代的商业革命》读书笔记 aoyouzi 读书笔记
移动互联网的未来：碎片化内容+碎片化渠道=各式精准、互动的新型社会化营销。 O2O：Online to OffLine 线上线下活动 O2O就是在移动互联网时代，生活消费领域通过线上和线下互动的一种新型商业模式。手机二维码本质：O2O商务行为从线下现实世界到线上虚拟世界的入口。线上虚拟世界创造的本意是打破信息鸿沟，让不同地域、不同需求的人
js实现图片随鼠标滚动的效果百合不是茶 JavaScript 滚动属性的获取图片滚动属性获取页面加载
1,获取样式属性值 top 与顶部的距离 left 与左边的距离 right 与右边的距离 bottom 与下边的距离 zIndex 层叠层次例子:获取左边的宽度,当css写在body标签中时 <div id="adver" style="position:absolute;top:50px;left:1000p
ajax同步异步参数async bijian1013 jquery Ajax async
开发项目开发过程中，需要将ajax的返回值赋到全局变量中，然后在该页面其他地方引用，因为ajax异步的原因一直无法成功，需将async:false，使其变成同步的。格式： $.ajax({ type: 'POST', ur
Webx3框架（1） Bill_chen eclipse spring maven 框架 ibatis
Webx是淘宝开发的一套Web开发框架，Webx3是其第三个升级版本；采用Eclipse的开发环境，现在支持java开发；采用turbine原型的MVC框架，扩展了Spring容器，利用Maven进行项目的构建管理，灵活的ibatis持久层支持，总的来说，还是一套很不错的Web框架。 Webx3遵循turbine风格，velocity的模板被分为layout/screen/control三部
【MongoDB学习笔记五】MongoDB概述 bit1129 mongodb
MongoDB是面向文档的NoSQL数据库，尽量业界还对MongoDB存在一些质疑的声音，比如性能尤其是查询性能、数据一致性的支持没有想象的那么好，但是MongoDB用户群确实已经够多。MongoDB的亮点不在于它的性能，而是它处理非结构化数据的能力以及内置对分布式的支持(复制、分片达到的高可用、高可伸缩)，同时它提供的近似于SQL的查询能力，也是在做NoSQL技术选型时，考虑的一个重要因素。Mo
spring/hibernate/struts2常见异常总结白糖_ Hibernate
Spring ①ClassNotFoundException: org.aspectj.weaver.reflect.ReflectionWorld$ReflectionWorldException 缺少aspectjweaver.jar，该jar包常用于spring aop中 ②java.lang.ClassNotFoundException: org.sprin
jquery easyui表单重置(reset)扩展思路 bozch form jquery easyui reset
在jquery easyui表单中尚未提供表单重置的功能，这就需要自己对其进行扩展。扩展的时候要考虑的控件有： combo,combobox,combogrid,combotree,datebox,datetimebox 需要对其添加reset方法，reset方法就是把初始化的值赋值给当前的组件，这就需要在组件的初始化时将值保存下来。在所有的reset方法添加完毕之后，就需要对fo
编程之美-烙饼排序 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; /* *《编程之美》的思路是：搜索+剪枝。有点像是写下棋程序：当前情况下，把所有可能的下一步都做一遍；在这每一遍操作里面，计算出如果按这一步走的话，能不能赢（得出最优结果）。 *《编程之美》上代码有很多错误，且每个变量的含义令人费解。因此我按我的理解写了以下代码： */
Struts1.X 源码分析之ActionForm赋值原理 chenbowen00 struts
struts1在处理请求参数之前，首先会根据配置文件action节点的name属性创建对应的ActionForm。如果配置了name属性，却找不到对应的ActionForm类也不会报错，只是不会处理本次请求的请求参数。如果找到了对应的ActionForm类，则先判断是否已经存在ActionForm的实例，如果不存在则创建实例，并将其存放在对应的作用域中。作用域由配置文件action节点的s
[空天防御与经济]在获得充足的外部资源之前,太空投资需有限度 comsci 资源
这里有一个常识性的问题: 地球的资源,人类的资金是有限的,而太空是无限的..... 就算全人类联合起来,要在太空中修建大型空间站,也不一定能够成功,因为资源和资金,技术有客观的限制.... &
ORACLE临时表—ON COMMIT PRESERVE ROWS daizj oracle 临时表
ORACLE临时表转临时表：像普通表一样，有结构，但是对数据的管理上不一样，临时表存储事务或会话的中间结果集，临时表中保存的数据只对当前会话可见，所有会话都看不到其他会话的数据，即使其他会话提交了，也看不到。临时表不存在并发行为，因为他们对于当前会话都是独立的。创建临时表时，ORACLE只创建了表的结构（在数据字典中定义），并没有初始化内存空间，当某一会话使用临时表时，ORALCE会
基于Nginx XSendfile+SpringMVC进行文件下载 denger 应用服务器 Web nginx 网络应用 lighttpd
在平常我们实现文件下载通常是通过普通 read-write方式，如下代码所示。 @RequestMapping("/courseware/{id}") public void download(@PathVariable("id") String courseID, HttpServletResp
scanf接受char类型的字符 dcj3sjt126com c
/* 2013年3月11日22:35:54 目的：学习char只接受一个字符 */ # include <stdio.h> int main(void) { int i; char ch; scanf("%d", &i); printf("i = %d\n", i); scanf("%
学编程的价值 dcj3sjt126com 编程
发一个人会编程, 想想以后可以教儿女, 是多么美好的事啊, 不管儿女将来从事什么样的职业, 教一教, 对他思维的开拓大有帮助像这位朋友学习: http://blog.sina.com.cn/s/articlelist_2584320772_0_1.html VirtualGS教程 (By @林泰前): 几十年的老程序员，资深的
二维数组（矩阵）对角线输出飞天奔月二维数组
今天在BBS里面看到这样的面试题目, 1，二维数组（N*N），沿对角线方向，从右上角打印到左下角如N=4： 4*4二维数组 { 1 2 3 4 } { 5 6 7 8 } { 9 10 11 12 } {13 14 15 16 } 打印顺序 4 3 8 2 7 12 1 6 11 16 5 10 15 9 14 13 要
Ehcache（08）——可阻塞的Cache——BlockingCache 234390216 并发 ehcache BlockingCache 阻塞
可阻塞的Cache—BlockingCache 在上一节我们提到了显示使用Ehcache锁的问题，其实我们还可以隐式的来使用Ehcache的锁，那就是通过BlockingCache。BlockingCache是Ehcache的一个封装类，可以让我们对Ehcache进行并发操作。其内部的锁机制是使用的net.
mysqldiff对数据库间进行差异比较 jackyrong mysqld
mysqldiff该工具是官方mysql-utilities工具集的一个脚本，可以用来对比不同数据库之间的表结构，或者同个数据库间的表结构如果在windows下，直接下载mysql-utilities安装就可以了，然后运行后，会跑到命令行下： 1）基本用法 mysqldiff --server1=admin:12345
spring data jpa 方法中可用的关键字 lawrence.li java spring
spring data jpa 支持以方法名进行查询/删除/统计。查询的关键字为find 删除的关键字为delete/remove (>=1.7.x) 统计的关键字为count (>=1.7.x) 修改需要使用@Modifying注解 @Modifying @Query("update User u set u.firstna
Spring的ModelAndView类 nicegege spring
项目中controller的方法跳转的到ModelAndView类，一直很好奇spring怎么实现的？ /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version 2.0 (the "License"); * yo
搭建 CentOS 6 服务器(13) - rsync、Amanda rensanning centos
（一）rsync Server端 # yum install rsync # vi /etc/xinetd.d/rsync service rsync { disable = no flags = IPv6 socket_type = stream wait
Learn Nodejs 02 toknowme nodejs
（1）npm是什么 npm is the package manager for node 官方网站：https://www.npmjs.com/ npm上有很多优秀的nodejs包，来解决常见的一些问题，比如用node-mysql，就可以方便通过nodejs链接到mysql，进行数据库的操作在开发过程往往会需要用到其他的包，使用npm就可以下载这些包来供程序调用 &nb
Spring MVC 拦截器 xp9802 spring mvc
Controller层的拦截器继承于HandlerInterceptorAdapter HandlerInterceptorAdapter.java 1 public abstract class HandlerInterceptorAdapter implements HandlerIntercep