黑洞拿铁

机器学习初探：（一）机器学习绪论

（一）机器学习绪论

文章目录

（一）机器学习绪论
- 什么是机器学习？
- 数据科学、人工智能、机器学习、深度学习
- - - 人工智能（Artificial Intelligence, AI)
    - 机器学习（Machine Learning, ML)
    - 深度学习（Deep Learning，DL)
    - 数据科学（Data Science, DS)
- 机器学习是怎么学习的？
- 机器学习的分类
- - 有监督学习（Supervised Learning）
  - - 回归（Regression）
    - 分类（Classification）
  - 无监督学习
  - 弱监督学习
  - 强化学习
- 小结
- 参考资料

什么是机器学习？

作为开场，我们先大致了解一下什么是“机器学习”（machine learning)。

既然名为“学习”，那自然与我们人类的学习过程有某种程度的相似性。

回想一下，我们小时候是如何学习识字的呢？家长会为我们准备很多图文并茂的识字卡片，小朋友的大脑在接受许多遍相似图像的刺激后，为每个汉字总结出了某种规律性的东西，下次大脑再看到符合这种规律的图案，就知道是什么字了。要教计算机认字，差不多也是同样的道理¹。

机器学习正是这样一门学科，它致力于研究计算机如何模拟或实现人类的学习行为，以获取经验，并用之不断改善自身的性能。在计算机系统中，“经验”通常以“数据”形式存在。

人类通过看、听、经历等获取信息，然后使用归纳、演绎等方法进行学习，最后总结形成知识和智慧；而机器学习是通过数据训练，使用算法挖掘事物背后隐藏的规律和本质，得到模型，用于预测或推断。

模型 = 数据 + 算法

下图1将“小朋友的识字过程”与“机器学习”过程做了一个类比，我们学习使用的“识字卡片”在机器学习领域相当于训练使用的“数据集”，我们根据“字形、发音”等的差异来辨识不同字，这在机器学习领域被称为“特征”，根据特征的差异总结、归纳的过程对应于“训练”，总结出的规律表现为“模型”，人类将总结出的知识应用于辨识新字的过程，即对应于机器学习领域使用训练好的模型进行"预测或推理"。

图1 什么是机器学习

数据科学、人工智能、机器学习、深度学习

当我们开始关注这个领域之后，耳边经常会充斥着 “数据科学”、“人工智能”、“机器学习”、“深度学习”等术语，这些可谓是人工智能时代的流行语了，在某些场合中经常被不加区分的混合使用。

那么它们究竟指什么呢，之间又有怎样的区别和联系呢？在正式介绍机器学习的学习过程和算法之前，有必要对这几个概念进行辨析。

如果用一张图来表示它们之间的联系的话，可参考下图2²：

图2 数据科学、人工智能、机器学习、深度学习概念辨析

人工智能（Artificial Intelligence, AI)

IOT For All 解释说，人工智能描述的是能模仿人类行为执行任务的机器。因此，人工智能意味着人工地模仿人类智能的机器。

那么什么是人类智能呢？人类智能可以理解为，与人类思维相关的认知功能（如感知、推理、学习和解决问题）的能力，包括一系列通过人工智能解决业务问题的能力。相对应的，人工智能的主要发展方向包括：运算智能、感知智能、认知智能、创造智能，如下图3所示。这一观点如今也得到业界广泛的认可。

图3 人工智能四个阶段

机器学习（Machine Learning, ML)

机器学习是一种实现人工智能的技术。 通过机器学习，我们教会了机器如何执行特定的任务，比如识别图像中的猫狗（图像识别）、为用户推荐其感兴趣的电影（推荐系统）、通过设备运行数据检测是否存在异常（异常检测）等等。

ML算法有许多类型，包括线性回归、逻辑回归、支持向量机、朴素贝叶斯、决策树等等。

深度学习（Deep Learning，DL)

深度学习是许多ML方法中的一种，以深度神经网络算法为代表。 DL算法受人脑神经系统处理复杂信息进行决策判断的启发，构建了一个人工神经网络（Artifical Neural Network, ANN），在它的输入层和输出层之间有多个层，用于抽象和刻画不同维度的信息。深度学习中的“深度”指的就是这个网络的层数，众多的层使得刻画复杂规律成为可能。

谷歌的AlphaGo就是深度学习技术的一个例子，通过从上千万人类棋谱、几十万盘围棋高手之间的对弈数据训练，最终先后击败了世界围棋冠军李世石、柯洁。

数据科学（Data Science, DS)

数据科学是一个更广泛的领域，从数据中总结规律、形成数据洞察（探索性数据分析），或基于大型数据集进行分析预测等（预测性分析）。 DS涵盖了大规模数据的采集、管理、分析和解释等过程，具有广泛的应用。可以认为，它集成了以上所有领域，并包括了其他更多范畴，涉及许多不同的学科和工具，比如统计推理、领域知识（专家知识）、数据可视化、实验设计和通信。

题外话：关于这些术语的边界其实是比较模糊的，即便是专业人士也是众说纷坛、互不信服，感兴趣的可以参见文末“大数据挖掘、机器学习、人工智能的维恩图战争”³。

机器学习是怎么学习的？

我们前面提到了，机器学习即是解析数据、从数据中学习背后的规律，并将之用于预测或推断的过程。那么机器究竟是如何实现学习的呢？

机器学习运作机理如下图4：

图4 机器学习的学习过程

训练数据集：从数据集中划分出一部分作为训练数据集，用来进行模型训练。
算法选择：一般要从业务场景出发，综合考虑问题的特点、数据的情况，根据经验选择一种合适的算法。
模型训练及评估：使用算法在训练数据集上进行训练（学习过程），在测试数据集上评估模型是否是一个”好“的模型，并以此为依据，决定是否结束训练过程。类似于我们小时候的学习过程，一次次的课后作业、随堂测验、期中期末考都是用来检查我们是否掌握了所学的知识，哪些知识掌握的不好，需要巩固加强。
模型使用：将需要预测的数据输入至训练好的模型，得到最终的预测结果。所有的课程、作业、测验都是为了应对最终的中高考，中高考会出什么题我们事先是不知道的，但基本知识点应该是跑不出我们之前学过的内容、刷过的习题册，我们希望学习的结果可以自如应对这些未知的题目，机器学习也是同样的道理。

机器学习的分类

从学习方式来说，机器学习还可分为有监督学习、无监督学习、弱监督学习、强化学习，学习过程和上图4类似，主要区别在于训练数据集里告不告诉机器正确答案。训练集给定了正确答案的叫有监督学习，训练集未指定正确答案的为无监督学习，训练集给了部分正确答案的叫弱监督学习。

有监督学习（Supervised Learning）

有监督学习是机器学习任务的一种。它从有标记的训练数据中推导出预测函数。有标记的训练数据是指每个训练实例都包括输入 $x$ 和期望的输出 $y$ （即，正确答案）。有监督学习又分为回归和分类两大任务类型。

一句话概括有监督学习：给定数据集 $(x, y)$ ，能够基于 $x$ 预测 $y$

回归（Regression）

回归这个词的意思是，我们在试着推测出一系列连续值属性。

假设您是一家餐饮连锁店的 CEO，并且正在考虑在不同城市开设新的门店，您可以获得各个城市的人口数据和利润数据。如何依据这组数据决定在哪个城市开设分店呢？⁴

那要先看看数据是否呈现了某种规律？下图5所示横坐标为城市人口数，纵坐标为利润数据。可以发现，人口越多的城市，餐厅的利润也普遍越高。最直观的想法就是，我能不能拟合一条直线来刻画这种关系，这条直接应该能穿过大多数的数据点，这样对于一个新的城市，我就可以根据城市人口数，大致估计餐厅的利润额了，这就是一个典型的回归任务。

图5 回归问题示例

分类（Classification）

分类和回归最大的区别在于，我们在试着推测出几个离散值（类别）属性。

还是举个例子来说明，桌子上放了一个水果，我们一眼就能分辨出是苹果还是橘子。那么如何让机器进行识别呢？如果我们有一个水果传感器，能观测并输出水果的特征，如：纹理（表面是否粗糙）、颜色、形状和重量等等，将这些水果特征输入机器，并告诉它这是苹果还是橘子。慢慢地，机器就学会了：橘子的表面一般是粗糙的，颜色一般是橘黄色的；苹果的表面一般是光滑的，颜色有红色、绿色、黄色等等…

如下图6所示，基于“纹理”和“颜色”两个特征，机器找到了区分两种水果的标准（表示在图中即为，分界线）。接下来，对于一个不明类别的水果，机器通过判断它是处于分界线的上方还是下方，就可以自己分辨苹果和橘子了。这就是一个典型的分类任务。

图6 分类问题示例

在图5餐厅连锁店利润预测的例子中，如果我们人为地将利润额划分为几个区间，比如低、中、高三档，根据每个城市人口数预测分店的利润处于哪个档，这样一个回归问题就转化为了分类问题。此外，判断是否为垃圾邮件，预测明天的天气是晴、多云、还是有雨，识别图像中的猫狗等，都是分类问题。

无监督学习

无监督学习是机器学习任务的一种。它从无标记的训练数据中推断结论。无标记的训练数据是指每个训练实例都包括输入 $x$ ，但不包括期望的输出 $y$ （即，正确答案）。最典型的无监督学习就是聚类分析，它可以在探索性数据分析阶段用于发现隐藏的模式或者对数据进行分组。

一句话概括无监督学习：给定数据集 $\quad)$ ，寻找隐藏的结构。

在图6区分苹果和橘子的例子中，我们明确地告诉了机器它“看到”的是什么水果（也即，我们反复提及的正确答案），那如果我们不告诉机器正确答案，机器能从传感器采集到的水果特征中学习出什么信息呢？

机器仍能通过水果颜色、纹理特征识别出两个类别：一类相对表面比较粗糙、颜色为橘色；另一类相对表面比较光滑、颜色很少有橘色，只不过机器不知道这两类分别对应什么而已。这便是无监督学习中的一类典型问题——聚类问题（如下图7所示）。

无监督学习解决的主要是以下问题：

* 没有标签，如何查找隐藏在数据集里面的内在结构?

* 没有标签，如何总结出规律形成最有用的组合?

图7 聚类问题示例

弱监督学习

大多数成功的技术，如深度学习，都需要含有真值标签的大规模训练数据集。然而，在许多任务中，由于数据标注过程的成本极高，很难获得强监督信息，那我们该怎么办呢？

弱监督学习是相对于强监督学习和无监督学习来说的，当我们得到的数据集之中只有一部分数据有标签，而另一部分数据没有标签，或者数据集中标签质量较低（比如，打错的、不全的、冲突的等情况），但我们还是想训练一个不错的模型，我们称其为弱监督学习。

弱监督学习具体包括三类：

一是，不完全监督，即，只有训练集的一个（通常很小的）子集是有标签的，其他数据则没有标签；
二是，不确切监督，即，图像只有粗粒度的标签；
三是，不准确的监督，即，模型给出的标签不总是正确的。

一句话概括弱监督学习：让学习器不依赖外界交互、自动地利用未标记样本来提升学习性能。

弱监督学习在实际应用场景中具有广泛的应用价值，比如医学影像中病理切片的解读。病理图片通常很大，一张病理图片可以达到 5万 × 5 万像素，甚至更大。详细标出图像中癌细胞和正常细胞的边界工作量巨大，尤其中国医疗资源极度匮乏、病理图片标注的专业门槛又比较高，很难实现构建带详细标签的训练数据集。弱监督学习的优势为：在减少标注工作量的情况下，更充分、有效地利用数据。 具体来说，对于一张既有癌细胞又有正常细胞的病理切片图像，只需要提供这两类图片，无需勾画所有癌细胞和正常细胞的边界，系统就能学习出标注规则。

强化学习

强化学习是机器学习的另一个领域。它关注的是在没有任何标签的情况下，通过与环境的不断交互，来不断优化自身策略的算法。

下图8描述了经典的强化学习场景中，智能体与环境不断交互的过程：在 $t$ 时刻，智能体获得了环境状态 $S_t$ ，经过计算输出动作值 $A_t$ 并在环境中执行，环境会返回 $t + 1$ 时刻的环境状态 $S_{t+1}$ 与上一个时刻产生的奖励 $R_t$ 。

一句话概括强化学习：给定数据集 $(\quad,\quad)$ ，学习如何选择一系列行动，以最大化长期收益。

图8 强化学习算法中智能体与环境循环交互的过程

打个比方，你想让一个小孩子坐下来复习考试，这是非常困难的。但是如果每次完成一个话题时都给他一块巧克力，他就会明白，如果他继续学习，他就会得到更多的巧克力棒，这样他就会有动力去复习。然而一开始，这个孩子并没有时间观念，也不知道该如何准备，他可能会花费数小时研究一个话题，而无法按时完成教学大纲内的所有复习内容。那么，如果他在1个小时内完成了一个话题，我们就给他一个大块的巧克力；如果他花了1.5个小时，就给他一小块巧克力；如果他花了更长的时间，就只给他一块太妃糖。渐渐地，这个孩子不仅知道了学习，而且会找到方法如何更快地完成任务。

在上面这个例子中，孩子即对应智能体（Agent）；奖励系统和考试即对应环境（Environment）；学习的话题即对应状态（States）；为了获得更多奖励，孩子需要判断哪个话题更重要（即，计算每个话题的价值），这即对应于强化学习中价值函数（Value-Function）所起的作用。孩子采取的行动会获得奖惩反馈（Reward），他采用的复习方法即为策略（Policy)⁵。

强化学习和前面介绍的算法有着一些本质上的区别⁶：

没有“正确”的行为：监督学习有专门样本标签，而强化学习并没有类似的强监督信号，通常只有基于奖励函数的单一信号。
无法立刻获得反馈：强化学习场景存在延迟奖励的问题，智能体可能无法在每一步获得奖励，需要不断试错，只有在完成整个任务之后才能给予奖励，还需要平衡短期奖励与长期奖励的权重。
具有超人类的上限：传统的机器学习算法依赖人工标注好的数据，从中训练好的模型的性能上限是产生数据的模型（人类）的上限；而强化学习可以从零开始和环境进行不断地交互，可以不受人类先验知识的桎梏，从而能够在一些任务中获得超越人类的表现。

小结

在这篇文章中，我们主要介绍了以下三点内容：

首先，我们辨识了数据科学、人工智能、机器学习、深度学习的概念差异。其中，
- 人工智能泛指人工地模仿人类智能的机器；
- 机器学习是一种实现人工智能的技术，具体而言，是让计算机基于概率统计的模型对未知数据进行预测与分析；
- 深度学习是许多机器学习方法中的一种，其典型代表为深度神经网络，即通过在输入层和输出层中间构建很多层来刻画数据间的复杂规律；
- 数据科学囊括了前述三个领域，是一个更广泛的概念，涵盖了大规模数据的采集、管理、分析和解释等过程。
其次，我们了解了机器学习的学习过程。
最后，我们介绍了机器学习的四种常见类型。 其中，
- 训练集给定了正确答案的叫有监督学习；
- 训练集未指定正确答案的为无监督学习；
- 训练集给了部分正确答案的叫弱监督学习；
- 不依赖训练集，让模型通过不断试错和外界环境反馈来学习的是强化学习。
- 此外，有监督学习包括回归和分类两种方法，回归是推测出一系列连续值属性，分类是推测出几个离散值属性。

参考资料

李开复，王咏刚.人工智能[M]. 北京：文化发展出版社，2017 . ↩︎
Explaining the Terms AI, ML, DL, DS ↩︎
大数据挖掘、机器学习、人工智能的维恩图战争 ↩︎
数据来自吴恩达机器学习网络课程. ↩︎
The very basics of Reinforcement Learning . ↩︎
强化学习问题描述 ↩︎

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
【中国国际航空-注册_登录安全分析报告】风控牛验证码接口安全评测系列安全行为验证极验网易易盾智能手机
前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机器学习能力提高的当下，连百度这样的大厂都遭受攻击导致点名批评，图形验证及交互验证方式的安全性到底如何？请看具体分析一、中国国际航空PC
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
七.正则化愿风去了
吴恩达机器学习之正则化（Regularization）http://www.cnblogs.com/jianxinzhou/p/4083921.html从数学公式上理解L1和L2https://blog.csdn.net/b876144622/article/details/81276818虽然在线性回归中加入基函数会使模型更加灵活，但是很容易引起数据的过拟合。例如将数据投影到30维的基函数上，模
机器学习-------数据标准化罔闻_spider 数据分析算法机器学习人工智能
什么是归一化，它与标准化的区别是什么？一作用在做训练时，需要先将特征值与标签标准化，可以防止梯度防炸和过拟合；将标签标准化后，网络预测出的数据是符合标准正态分布的—StandarScaler()，与真实值有很大差别。因为StandarScaler()对数据的处理是（真实值-平均值）/标准差。同时在做预测时需要将输出数据逆标准化提升模型精度：标准化/归一化使不同维度的特征在数值上更具比较性，提高分类
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
cmd泛滥_与您的后泛滥同事见面：人工智能机器人 weixin_26644585 人工智能 leetcode
cmd泛滥Readytoswapyouroldcube-mateforadisembodiedAI?IPsoftCEOChetanDube,creatorofAIco-workerAMELIA,giveshistakeonthepost-COVIDofficelandscape.准备将您的旧立方体伙伴换成无形的AI？AIsoft同事AMELIA的创始人IPsoft首席执行官ChetanDube阐述
设计模式介绍 tntxia 设计模式
设计模式来源于土木工程师克里斯托弗亚历山大（http://en.wikipedia.org/wiki/Christopher_Alexander）的早期作品。他经常发表一些作品，内容是总结他在解决设计问题方面的经验，以及这些知识与城市和建筑模式之间有何关联。有一天，亚历山大突然发现，重复使用这些模式可以让某些设计构造取得我们期望的最佳效果。亚历山大与萨拉-石川佳纯和穆雷西乐弗斯坦合作
android高级组件使用(一) 百合不是茶 android RatingBar Spinner
1、自动完成文本框（AutoCompleteTextView） AutoCompleteTextView从EditText派生出来，实际上也是一个文本编辑框，但它比普通编辑框多一个功能：当用户输入一个字符后，自动完成文本框会显示一个下拉菜单，供用户从中选择，当用户选择某个菜单项之后，AutoCompleteTextView按用户选择自动填写该文本框。使用AutoCompleteTex
[网络与通讯]路由器市场大有潜力可挖掘 comsci 网络
如果国内的电子厂商和计算机设备厂商觉得手机市场已经有点饱和了,那么可以考虑一下交换机和路由器市场的进入问题..... 这方面的技术和知识,目前处在一个开放型的状态,有利于各类小型电子企业进入 &nbs
自写简单Redis内存统计shell 商人shang Linux shell 统计Redis内存
#!/bin/bash address="192.168.150.128:6666,192.168.150.128:6666" hosts=(${address//,/ }) sfile="staticts.log" for hostitem in ${hosts[@]} do ipport=(${hostitem
单例模式(饿汉 vs懒汉) oloz 单例模式
package 单例模式; /* * 应用场景:保证在整个应用之中某个对象的实例只有一个 * 单例模式种的《懒汉模式》 * */ public class Singleton { //01 将构造方法私有化，外界就无法用new Singleton()的方式获得实例 private Singleton(){}; //02 申明类得唯一实例 priva
springMvc json支持杨白白 json springmvc
1.Spring mvc处理json需要使用jackson的类库，因此需要先引入jackson包 2在spring mvc中解析输入为json格式的数据:使用@RequestBody来设置输入 @RequestMapping("helloJson") public @ResponseBody JsonTest helloJson() {
android播放，掃描添加本地音頻文件小桔子
最近幾乎沒有什麽事情，繼續鼓搗我的小東西。想在項目中加入一個簡易的音樂播放器功能，就像華為p6桌面上那麼大小的音樂播放器。用過天天動聽或者QQ音樂播放器的人都知道，可已通過本地掃描添加歌曲。不知道他們是怎麼實現的，我覺得應該掃描設備上的所有文件，過濾出音頻文件，每個文件實例化為一個實體，記錄文件名、路徑、歌手、類型、大小等信息。具體算法思想，
oracle常用命令 aichenglong oracle dba 常用命令
1 创建临时表空间 create temporary tablespace user_temp tempfile 'D:\oracle\oradata\Oracle9i\user_temp.dbf' size 50m autoextend on next 50m maxsize 20480m extent management local
25个Eclipse插件 AILIKES eclipse插件
提高代码质量的插件1. FindBugsFindBugs可以帮你找到Java代码中的bug，它使用Lesser GNU Public License的自由软件许可。2. CheckstyleCheckstyle插件可以集成到Eclipse IDE中去，能确保Java代码遵循标准代码样式。3. ECLemmaECLemma是一款拥有Eclipse Public License许可的免费工具，它提供了
Spring MVC拦截器+注解方式实现防止表单重复提交 baalwolf spring mvc
原理：在新建页面中Session保存token随机码，当保存时验证，通过后删除，当再次点击保存时由于服务器端的Session中已经不存在了，所有无法验证通过。 1.新建注解： ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
《Javascript高级程序设计(第3版)》闭包理解 bijian1013 JavaScript
“闭包是指有权访问另一个函数作用域中的变量的函数。”--《Javascript高级程序设计(第3版)》看以下代码： <script type="text/javascript"> function outer() { var i = 10; return f
AngularJS Module类的方法 bijian1013 JavaScript AngularJS Module
AngularJS中的Module类负责定义应用如何启动，它还可以通过声明的方式定义应用中的各个片段。我们来看看它是如何实现这些功能的。一.Main方法在哪里如果你是从Java或者Python编程语言转过来的，那么你可能很想知道AngularJS里面的main方法在哪里？这个把所
[Maven学习笔记七]Maven插件和目标 bit1129 maven插件
插件(plugin)和目标(goal) Maven，就其本质而言，是一个插件执行框架，Maven的每个目标的执行逻辑都是由插件来完成的，一个插件可以有1个或者几个目标，比如maven-compiler-plugin插件包含compile和testCompile，即maven-compiler-plugin提供了源代码编译和测试源代码编译的两个目标使用插件和目标使得我们可以干预
【Hadoop八】Yarn的资源调度策略 bit1129 hadoop
1. Hadoop的三种调度策略 Hadoop提供了3中作业调用的策略， FIFO Scheduler Fair Scheduler Capacity Scheduler 以上三种调度算法，在Hadoop MR1中就引入了，在Yarn中对它们进行了改进和完善.Fair和Capacity Scheduler用于多用户共享的资源调度 2. 多用户资源共享的调度
Nginx使用Linux内存加速静态文件访问 ronin47
Nginx是一个非常出色的静态资源web服务器。如果你嫌它还不够快，可以把放在磁盘中的文件，映射到内存中，减少高并发下的磁盘IO。先做几个假设。nginx.conf中所配置站点的路径是/home/wwwroot/res，站点所对应文件原始存储路径：/opt/web/res shell脚本非常简单，思路就是拷贝资源文件到内存中，然后在把网站的静态文件链接指向到内存中即可。具体如下：
关于Unity3D中的Shader的知识 brotherlamp unity unity资料 unity教程 unity视频 unity自学
首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，然后我们来看下Unity3D自带的60多个S
CopyOnWriteArrayList vs ArrayList bylijinnan java
package com.ljn.base; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import java.util.concurrent.CopyOnWriteArrayList; /** * 总述： * 1.ArrayListi不是线程安全的，CopyO
内存中栈和堆的区别 chicony 内存
1、内存分配方面：堆：一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式是类似于链表。可能用到的关键字如下：new、malloc、delete、free等等。栈：由编译器(Compiler)自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中
回答一位网友对Scala的提问 chenchao051 scala map
本来准备在私信里直接回复了，但是发现不太方便，就简要回答在这里。问题写道对于scala的简洁十分佩服，但又觉得比较晦涩，例如一例，Map("a" -> List(11,111)).flatMap(_._2)，可否说下最后那个函数做了什么，真正在开发的时候也会如此简洁？谢谢先回答一点，在实际使用中，Scala毫无疑问就是这么简单。
mysql 取每组前几条记录 daizj mysql 分组最大值最小值每组三条记录
一、对分组的记录取前N条记录：例如：取每组的前3条最大的记录 1.用子查询： SELECT * FROM tableName a WHERE 3> (SELECT COUNT(*) FROM tableName b WHERE b.id=a.id AND b.cnt>a. cnt) ORDER BY a.id,a.account DE
HTTP深入浅出 http请求 dcj3sjt126com http
HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP，使HTTP客户（如Web浏览器）能够从HTTP服务器(Web服务器)请求信息和服务，HTTP目前协议的版本是1.1.HTTP是一种无状态的协议，无状态是指Web浏览器和Web服务器之间不需要建立持久的连接，这意味着当一个客户端向服务器端发出请求，然后We
判断MySQL记录是否存在方法比较 dcj3sjt126com mysql
把数据写入到数据库的时，常常会碰到先要检测要插入的记录是否存在，然后决定是否要写入。　　我这里总结了判断记录是否存在的常用方法：　　sql语句： select count ( * ) from tablename; 　　然后读取count(*)的值判断记录是否存在。对于这种方法性能上有些浪费，我们只是想判断记录记录是否存在，没有必要全部都查出来。
对HTML XML的一点认识 e200702084 html xml
感谢http://www.w3school.com.cn提供的资料 HTML 文档中的每个成分都是一个节点。节点根据 DOM，HTML 文档中的每个成分都是一个节点。 DOM 是这样规定的：整个文档是一个文档节点每个 HTML 标签是一个元素节点包含在 HTML 元素中的文本是文本节点每一个 HTML 属性是一个属性节点注释属于注释节点 Node 层次
jquery分页插件 genaiwei jquery Web 前端分页插件
//jquery页码控件// 创建一个闭包 (function($) { // 插件的定义 $.fn.pageTool = function(options) { var totalPa
Mybatis与Ibatis对照入门于学习 Josh_Persistence mybatis ibatis 区别联系
一、为什么使用IBatis/Mybatis 对于从事 Java EE 的开发人员来说，iBatis 是一个再熟悉不过的持久层框架了，在 Hibernate、JPA 这样的一站式对象 / 关系映射（O/R Mapping）解决方案盛行之前，iBaits 基本是持久层框架的不二选择。即使在持久层框架层出不穷的今天，iBatis 凭借着易学易用、
C中怎样合理决定使用那种整数类型？秋风扫落叶 c 数据类型
如果需要大数值(大于32767或小于32767), 使用long 型。否则, 如果空间很重要 (如有大数组或很多结构), 使用 short 型。除此之外, 就使用 int 型。如果严格定义的溢出特征很重要而负值无关紧要, 或者你希望在操作二进制位和字节时避免符号扩展的问题, 请使用对应的无符号类型。但是, 要注意在表达式中混用有符号和无符号值的情况。 &nbs
maven问题 zhb8015 maven问题
问题1： Eclipse 中新建maven项目无法添加src/main/java 问题 eclipse创建maevn web项目，在选择maven_archetype_web原型后，默认只有src/main/resources这个Source Floder。按照maven目录结构，添加src/main/ja
(二)androidpn-server tomcat版源码解析之--push消息处理 spjich java androdipn 推送
在 (一)androidpn-server tomcat版源码解析之--项目启动这篇中，已经描述了整个推送服务器的启动过程，并且把握到了消息的入口即XmppIoHandler这个类，今天我将继续往下分析下面的核心代码，主要分为3大块，链接创建，消息的发送，链接关闭。先贴一段XmppIoHandler的部分代码 /** * Invoked from an I/O proc
用js中的formData类型解决ajax提交表单时文件不能被serialize方法序列化的问题中华好儿孙 JavaScript Ajax Web 上传文件 FormData
var formData = new FormData($("#inputFileForm")[0]); $.ajax({ type:'post', url:webRoot+"/electronicContractUrl/webapp/uploadfile", data:formData, async: false, ca
mybatis常用jdbcType数据类型 ysj5125094 mybatis mapper jdbcType
MyBatis 通过包含的jdbcType 类型 BIT FLOAT CHAR