源于花海

人工智能学习笔记（一）

家人们，好久不见哈！最近在尝试着学习人工智能的相关知识和具体技能呀。说实话，当像我这样的 小白初探人工智能体系时，总是被很多未知的名词以及茫茫内容所淹没，便去想通过网络学习帮助自己建立正确的人工智能基本概念认知。在此，我便进一步对人工智能体系从 人工智能、机器学习、深度学习、计算机视觉、自然语言处理、知识图谱等笔记中进行宏观的探索和认知，同时也帮助感兴趣的小伙伴一起入门人工智能呀。

一、人工智能概述

1.1 人工智能简介

1.2 人工智能的起源与发展

1.3 人工智能的研究内容

1.4 人工智能领域的著名专家与代表性人物

1.5 人工智能研究的主要学派

1.6 人工智能的应用

二、人工智能基础知识

2.1 人工智能的数学基础

2.2 人工智能的常用工具

2.3 数据采集

2.4 数据存储

2.5 数据清洗

2.6 数据分析

三、机器学习

3.1 机器学习概述

3.2 机器学习的分类

3.3 机器学习常用算法

四、深度学习

4.1 神经网络

4.2 感知机

4.3 卷积神经网络

4.4 循环神经网络

4.5 生成对抗网络

4.6 深度学习的应用

一、人工智能概述

1.1 人工智能简介

1.1.1 人工智能的定义

人工智能（Artificial Intelligence），英文缩写为AI。它是一个以计算机科学（Computer Science）为基础，由计算机、心理学、哲学等多学科交叉融合的交叉学科、新兴学科，研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学，企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器，该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。

1.1.2 人工智能的特点

从人工知识表达到大数据驱动的知识学习技术
从分类型处理的多媒体数据转向跨媒体的认知、学习、推理
从追求智能机器到高水平的人脑相互协同和融合
从聚焦个体智能到基于互联网和大数据的群体智能
从拟人化的机器人转向更加广阔的智能自主系统

1.1.3 人工智能的分类

弱人工智能（Artificial Narrow Intelligence，简称ANI）：在单一领域具有一定智能的程序。现在的有关研究基本上属于这一层次，比如，AlphaGo的专属领域是围棋，谷歌翻译的专属领域是翻译自然语言。
强人工智能（Artificial General Intelligence，简称AGI）：拥有自我意识的程序，它们具有接近于人类的智能，可以像人类一样思考、学习、交流、解决问题。但是，现在的科技水平还远远实现不了这种级别。
超人工智能（Artificial Super Intelligence，简称ASI）：在所有领域都凌驾于人类智慧的计算机程序，它们善于思考和创新，并且比人类更加聪明。要是未来真的实现如此，那么它们在人类面前，恐怕就是神明一样的存在。

1.2 人工智能的起源与发展

1.2.1 人工智能的历史

1. 1956年达特茅斯会议

1956年，Marvin Minsky, John McCarthy 和 2位顶级科学家: Claude Shannon（克劳德·艾尔伍德·香农）以及IBM 的 Nathan Rochester，组织了达特茅斯会议，此次会议其中的一个提案断言：任何一种学习或者其他形式的人类智能都能够通过机器进行模拟。同时约翰·麦卡锡为这种机器智能取了一个名字：Artificial Intelligence。由此，AI 第一次被正名。

2. 黄金年代（1956–1974）

第一代AI 研究者曾经作出一些预测：

1965, H. A. Simon 曾说道：智能机器在二十年内，将能胜任人类可以做的任何事情。
1967, Marvin Minsky：通过一代人的努力，人工智能的相关问题将从根本上得到解决。
1970, Marvin Minsky (in Life Magazine)：3到五年内，我们将能创造媲美人类智能的通用人工智能。

同时，也有一些比较成功的人工智能应用铺展开来：

搜索推理

通过回溯和动态搜索，逐步的实现一个既定目标的方法，称之为搜索推理。可以应用于游戏对战和理论证明，其依据的还是基础的理论算法实现，通过启发式和经验式（heuristic & rules of thumb）的方法可以优化搜索空间。

自然语言处理

AI 研究的一个重要目标是实现计算机的类人语言交流。早期比较成功的几个项目是：
① 语义网络：Roger Schank 的conceptual dependency theroy 处理所有的英文单词为一个网络中的节点，单词间的语法作为节点间的连接；

② Joseph Weizenbaum 的ELIZA 偶尔表现，让与其对话的人感觉是一个真人。但是事实上，ELIZA 不清楚自己在说什么，它只是机械的回答事前准备好的回答，结合一些语法规则重新组织这些表达，ELIZA 也被称为第一个chatterbot（对话机器人）；

微观世界

60 年代末期，MIT AI 实验室的 Marvin Minsky 和 Seymour Papert 提出AI 研究应该集中精力在微观世界的简单场景。他们认为类似物理世界中很多经典的原理都是基于理想的简化模型，比如完全无摩擦的飞机和完美刚体（rigid body）。

黄金年代的各项成果也得到了财政方面的各项资助：

① 1963 年，MIT 收到了一笔2.2 百万的资助，主要用于MAC 项目，其在5年前由Minsky 和MCCarthy 发起；
② DARPA 每年提供3 百万用于Newell 和Simon 在CMU 的项目以及John McCarthy 在Standford 的项目；
③ Edinburgh 大学由Donanld Michie 在1965 年创立的AI 实验室也获得了很多自助；
以上四个研究中心是那个年代主要的AI 研究战场，其获得的财政支持没有太多约束与要求，这些支持也创造了当时的Hacker 文化，让从业者可以天马行空式的进行发明创造，但是这种放手式的支持维持不了多长时间。

3. 1993～2011 年：AI 的蛰伏期

AI 到这个时期，已经发展了近半个世纪，终于实现了一些它早期既定的目标，比如智能代理（定期地收集信息或执行服务的程序，它不需要人工干预）。

1.2.2 我国的人工智能发展现状

1.3 人工智能的研究内容

认知建模
知识表示
知识应用
推理
机器感知
机器思维
机器学习
机器行为

1.4 人工智能领域的著名专家与代表性人物

艾伦·图灵
斯图尔特·罗素
斯蒂芬·霍金
贾斯汀·卡塞尔
约翰·麦卡锡
吴恩达
德米什·哈萨比斯

1.5 人工智能研究的主要学派

符号主义（symbolicism）：又称为逻辑主义、心理学派或计算机学派，其原理主要为物理符号系统，即符号操作系统，假设和有限合理性原理。
连接主义（connectionism）：又称为仿生学派或生理学派，其主要原理为神经网络及神经网络间的连接机制与学习算法。
行为主义（actionism）：又称为进化主义或控制论学派，其原理为控制论及感知-动作型控制系统。

1.6 人工智能的应用

人工智能已经逐渐走进我们的生活，并应用于各个领域，它不仅给许多行业带来了巨大的经济效益，也为我们的生活带来了许多改变和便利。人工智能的主要应用有如下方面：

专家系统
自然语言处理
博弈
搜索

二、人工智能基础知识

2.1 人工智能的数学基础

1. 微积分

微积分又称为“初等数学分析”，它是一门纯粹的数学理论，也是现代数学的基础，在商学、科学和工程学领域有广泛的应用，主要用来解决那些仅依靠代数学和几何学不能有效解决的问题。对于机器学习而言，微积分的主要作用如下：

（1）求解函数的极值（2）分析函数的性质

2. 线性代数

线性代数研究的是向量空间以及将一个向量空间映射到另一个向量空间的函数。在人工智能中，线性代数是计算的根本，因为所有的数据都是以矩阵的形式存在的，任何一步操作都是在进行矩阵相乘、相加等。线性代数在人工智能领域的主要应用如下：

（1）搜索引擎的排名（2）线性规划（3）纠错码（4）信号分析（5）面部识别（6）量子计算

3. 概率论与数理统计

概率论是研究随机现象数量规律的数学分支，是一门研究事情发生的可能性的学问。数理统计以概率论为基础，研究大量随机现象的统计规律性。机器学习除了处理不确定量之外，也需处理随机量，而不确定性和随机性可能来自多个方面，从而可以使用概率论来量化不确定性在人工智能算法中无论是对于数据的处理还是分析，数据的拟合还是决策等，概率与统计都可以为其提供重要的支持。

4. 最优化理论

最优化理论是关于系统的最优设计、最优控制、最优管理问题的理论与方法。最优化就是在一定的约束条件下，使系统具有所期待的最优功能的组织过程，是从众多可能的选择中做出最优选择，使系统的目标函数在约束条件下达到最大或最小。

5. 形式逻辑

形式逻辑是研究人的认识知性阶段思维规律的学说，狭义指演绎逻辑，广义上还包括归纳逻辑。形式逻辑的思维规律也是思维形式和思维内容的统一，形式逻辑靠概念、判断、推理（主要包括归纳推理与演绎推理）来反映事物的实质。

2.2 人工智能的常用工具

1. TensorFlow

TensorFlow 是谷歌出品的开源人工智能工具，它提供了一个使用数据流图进行数值计算的库。其具有强大的灵活性、真正的可移植性、自动微分功能，并支持Python 和 C++。

2. Mahout

Mahout 提供了一些可扩展的机器学习领域经典算法的实现，旨在帮助开发人员更方便快捷地创建智能应用程序。 Mahout 包含许多实现方式，如聚类、分类、推荐过滤、频繁子项挖掘等。

3. Torch

Torch 是一个用于科学和数值的开源机器学习库，主要采用 C 作为编程语言，它基于 Lua 的库，通过提供大量的算法而深入学习研究，提高了效率和速度。 Torch 有一个强大的 n 维数组，可以方便地进行切片和索引等操作。除此之外，它提供了线性代数程序和神经网络模型。

4. Spark MLlib

Spark MLlib 是 Spark 的机器学习库，旨在简化机器学习的工程实践工作，并方便扩展到更大规模。一些通用的学习算法和工具组成，包括分类、回归、聚类、协同过滤、降维等，同时包括底层的优化原语和高层的管道 API。

5. Keras

Keras 是一个由 Python 编写的开源人工神经网络库，可以作为人工智能工具的高阶应用程序接口，进行深度学习模型的设计、调试、评估、应用和可视化。

6. CNTK

CNTK 是微软出品的开源深度学习工具包，支持在 CPU 和 GPU 上运行。

2.3 数据采集

2.3.1 数据采集的概念

数据采集是人工智能与大数据应用的基础，研究人工智能离不开大数据的支撑，而数据采集是大数据分析的前提。

数据采集作为大数据生命周期的第一个环节，是指通过传感器、摄像头、射频识别（Radio Frequency Identification，RFID）数据以及互联网等方式获取各种结构化、半结构化与非结构化的数据。

2.3.2 数据采集的常见方法

日志数据采集：日志采集系统的主要工作就是收集业务日志数据，供离线和在线的分析系统使用。
网络数据采集：网络数据采集是指利用互联网搜索引擎技术实现有针对性、行业性、精准性的数据抓取，并按照一定规则和筛选标准进行数据归类，形成数据库文件的一个过程。
数据库采集：数据库采集是将实时产生的数据以记录的形式直接写入企业的数据库，并使用特定的数据处理系统进行进一步分析。
其他数据采集方法

2.4 数据存储

2.4.1 数据存储的概念

数据存储指将数量巨大，难于收集、处理、分析的数据集持久化到计算机中。

2.4.2 数据存储的方式

1. 分布式存储

分布式存储包含多个自主的处理单元，通过计算机网络互连来协作完成分配的任务，其分而治之的策略能够更好地处理大规模数据分析问题。

分布式存储主要包括分布式文件系统（Hadoop Distributed File System，HDFS）和分布式键值系统。

2. NoSQL 数据库

NoSQL 又叫作非关系型数据库，它是英文“Not Only SQL”的缩写，即“不仅仅是 SQL”。

典型的 NoSQL 包括以下几种：键值数据库、列族数据库、文档数据库和图形数据库。NoSQL 也存在一些缺点，如缺乏较为扎实的数学理论基础，在查询复杂数据时性能不强；很难实现事务强一致性和数据完整性；技术尚不成熟，缺乏专业团队的技术支持，维护较为困难等。

3. NewSQL 数据库

NewSQL 数据库是指各种新的可扩展/高性能数据库，它是一种相对较新的形式，旨在使用现有的编程语言和以前不可用的技术来结合 SQL 和 NoSQL。这类数据库不仅具有 NoSQL 对海量数据的存储管理能力，还保持了传统数据库支持 ACID 和 SQL 等的特性。

4. 云数据库

云数据库是指被优化或部署到一个虚拟计算环境中的数据库。

云数据库具有高可扩展性、高可用性、采用多租形式和支持资源有效分发等特点，可以实现按需付费和按需扩展。

2.5 数据清洗

2.5.1 数据清洗的概念

采集到的众多数据中总是存在着许多脏数据，即不完整、不规范、不准确的数据，数据清洗就是指把脏数据清洗干净，从而提高数据质量，具体操作包括检查数据一致性，处理无效值和缺失值等。

在机器学习领域中，数据清洗则被定义为对特征数据和标注数据进行处理，如样本采样、样本调权、异常点去除、特征归一化处理、特征变化、特征组合等。

2.5.2 数据清洗的原理

数据清洗的原理如下：利用相关技术，如统计方法、数据挖掘方法、模式规则方法等将脏数据转换为满足数据质量要求的数据。按照实现方式与范围分类：

手工清洗
自动清洗

2.5.3 数据清洗的应用领域

1. 数据仓库

在数据仓库领域，一般在几个数据库合并时或多个数据源进行集成时进行数据清洗。数据清洗在数据仓库中的应用并不是简单地清洗合并记录，它还涉及数据的分解与重组。

2. 数据挖掘

在数据挖掘领域，经常会遇到挖掘出来的特征数据存在各种异常的情况，如数据缺失、数据值异常等。对于这些情况，如果不加以处理，则会直接影响到最终挖掘模型建立后的使用效果，甚至是使得最终的模型失效，导致任务失败。

3. 数据质量管理

数据质量管理覆盖了质量评估、数据去噪、数据监控、数据探查、数据清洗、数据诊断等方面。在此过程中，数据清洗为提高数据质量提供了重要的保障。

2.5.4 数据清洗的评估

数据清洗的评估实质上是对清洗后的数据质量进行评估，而数据质量的评估过程是一种通过测量和改善数据综合特征来优化数据价值的过程。数据质量的评估和方法研究的难点在于数据质量的含义、内容、分类、分级、评价指标等。两方面的基本评价指标：

1. 数据可信性

精确性：描述数据是否与其对应的客观实体的特征相一致。
完整性：描述数据是否存在缺失记录或缺失字段。
一致性：描述同一实体的同一属性的值在不同的系统中是否一致。
有效性：描述数据是否满足用户定义的条件或在一定的阈值范围内。
唯一性：描述数据是否存在重复记录。

2. 数据可用性

时间性：描述数据是当前数据还是历史数据。
稳定性：描述数据是否稳定，是否在其有效期内。

2.6 数据分析

2.6.1 大数据分析概述

数据分析是指用适当的统计分析方法对收集来的大量数据进行分析，将它们加以汇总和理解并消化，以求最大化地开发数据的功能，发挥数据的作用。

2.6.2 大数据分析的主要类型

1. 描述性统计分析

描述性统计分析是指运用制表、分类、图形以及计算概括性数据来描述数据特征的各项活动。

2. 探索性数据分析

对已有的数据（特别是调查或观察得来的原始数据）在尽量少的先验假定下进行探索，通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。

3. 验证性数据分析

验证性数据分析注重对数据模型和研究假设的验证，侧重于已有假设的证实或证伪。假设检验是根据数据样本所提供的证据，肯定或否定有关总体的声明。

2.6.3 数据挖掘

1. 数据挖掘的概念

数据挖掘是指在大量的数据中挖掘出有用信息，通过分析来揭示数据之间有意义的联系、趋势和模式。数据挖掘首先是搜集数据，数据越丰富越好，数据量越大越好，只有获得足够大量的高质量的数据，才能获得确定的判断，才能产生认知模型，这是从量变到质变的过程。数据挖掘可以分为两类：

直接数据挖掘

直接数据挖掘的目标是利用可用的数据建立一个模型，利用这个模型对剩余的数据或对一个特定的变量进行描述。

间接数据挖掘

间接数据挖掘的目标中没有选出某一具体的变量，也不是用模型进行描述，而是在所有的变量中建立起某种关系。

注意点：

数据源必须是真实的、大量的、含有噪声的、用户感兴趣的数据。
挖掘知识的方法可以是数学的方法，也可以是非数学的方法；可以是演绎的方法，也可以是归纳的方法。
挖掘的知识具有应用的价值，可以用于信息管理、查询优化、决策支持和过程控制等，还可以用于数据自身的维护

2. 数据挖掘技术

根据挖掘任务可将数据挖掘技术分为预测模型发现、聚类分析、分类与回归、关联分析、序列模式发现、依赖关系（依赖模型发现）、异常和趋势发现、离群点检测等类型。

根据挖掘对象可将数据挖掘技术分为关系型数据库、面向对象数据库、空间数据库、时态数据库、文本数据库、多媒体数据库、异质数据库以及遗产数据库等类型。

根据挖掘方法可将数据挖掘技术分为机器学习方法、统计方法、神经网络方法和数据库方法等类型。

在机器学习方法中，可细分为归纳学习方法（决策树、规则归纳等）、基于范例学习、遗传算法等；
在统计方法中，可细分为回归分析（多元回归、自回归等）、判别分析（贝叶斯判别、 Fisher 判别和非参数判别等）、聚类分析（系统聚类、动态聚类等）、探索性分析（主元分析法、相关分析法等）等；
在神经网络方法中，可细分为前向神经网络（反向传播算法等）、自组织神经网络（自组织特征映射、竞争学习等）等。

2.6.4 数据可视化

三、机器学习

3.1 机器学习概述

3.1.1 机器学习简介

机器学习，通俗地讲就是让机器拥有学习的能力，从而改善系统自身的性能。

这里的“学习”指的是从数据中学习，从数据中产生模型的算法，即学习算法。有了学习算法，只要把经验数据提供给它，它就能够基于这些数据产生模型，在面对新的情况时，模型能够提供相应的判断，进行预测。

机器学习实质上是基于数据集的，它通过对数据集进行研究，找出数据集中数据之间的联系和数据的真实含义。

3.1.2 机器学习的发展

3.1.3 机器学习的应用前景

1. 数据分析与挖掘

数据分析则通常被定义为“指用适当的统计方法对收集来的大量第一手资料和第二手资料进行分析，以求最大化地开发数据资料的功能，发挥数据的作用，是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程”。

数据挖掘是“识别出巨量数据中有效的、新颖的、潜在有用的、最终可理解的模式的过程”。

2. 模式识别

模式识别研究主要集中在两个方面：

研究生物体（包括人）是如何感知对象的，属于认识科学的范畴；
在给定的任务下，如何用计算机实现模式识别的理论和方法，这些是机器学习的长项。

模式识别的应用领域广泛，包括计算机视觉、医学图像分析、光学文字识别、自然语言处理、语音识别、手写识别、生物特征识别、文件分类、搜索引擎等，而这些领域也正是机器学习大展身手的舞台，因此模式识别与机器学习的关系越来越密切。

3. 更广阔的领域

研究和应用机器学习的最终目标是全面模仿人类大脑，创造出拥有人类智慧的机器大脑。

当今互联网科技的三大挑战：大数据、人工智能和人机互动。

4. 机器学习的未来

3.2 机器学习的分类

3.2.1 监督学习

监督学习（监督训练或有教师学习）是指利用一组已知类别的样本调整分类器的参数，使其达到所要求性能的过程。

1. 监督学习概述

监督学习表示机器学习的数据是带标记的，这些标记可以包括数据类别、数据属性及特征点位置等。

具体实现过程是通过大量带有标记的数据来训练机器，机器将预测结果与期望结果进行比对；之后根据比对结果来修改模型中的参数，再一次输出预测结果；再将预测结果与期望结果进行比对，重复多次直至收敛，最终生成具有一定鲁棒性的模型来达到智能决策的能力。

常见的监督学习有分类（Classification）和回归（Regression），分类是将一些实例数据分到合适的类别中，其预测结果是离散的；回归是将数据归到一条“线”上，即为离散数据生产拟合曲线，因此其预测结果是连续的。

2. 监督学习的应用

判断邮件是否为垃圾邮件

3.2.2 无监督学习

根据类别未知（没有被标记）的训练样本解决模式识别中的各种问题，称为无监督学习。

1. 无监督学习概述

无监督学习的训练样本的标记信息是未知的，目标是通过对无标记训练样本的学习来揭示数据的内在性质及规律。

常见的无监督学习有聚类（Clustering）和降维（Dimensionality Reduction）两种。

在聚类工作中，由于事先不知道数据类别，因此只能通过分析数据样本在特征空间中的分布，如基于密度或基于统计学概率模型，从而将不同数据分开，把相似数据聚为一类。

降维是将数据的维度降低，由于数据本身具有庞大的数量和各种属性特征，若对全部数据信息进行分析，则会增加数据训练的负担和存储空间。因此可以通过主成分分析等其他法，考虑主要因素，舍弃次要因素，从而平衡数据分析的准确度与数据分析的效率。在实际应用中，可以通过一系列的转换将数据的维度降低。

2. 无监督学习的应用

数据挖掘，用于在大量无标签数据中寻找信息。

3.2.3 半监督学习

半监督学习包括半监督聚类、半监督分类、半监督降维和半监督回归 4 种学习场景。

使用少量标记样本作为指导，利用大量无标记样本改善学习性能的半监督学习成为研究的热点。

常见的半监督分类代表算法包括生成式方法、半监督支持向量机（Semi-supervised Support Vector Machines，S3VMs）、基于图的半监督图方法和基于分歧的半监督方法共 4 种算法。

常见的假设模型有混合高斯模型、混合专家模型、朴素贝叶斯模型，采用极大似然方法作为参数估计的优化目标，选择最大期望（Expectation-Maximization，EM）算法进行参数的优化求解。

3.2.4 迁移学习

迁移学习是运用已存有的知识对不同但相关领域的问题进行求解的一种新的机器学习方法。

按照迁移学习方法采用的技术划分，可以把迁移学习方法分为 3 类：基于特征选择的迁移学习、基于特征映射的迁移学习和基于权重的迁移学习。

3.2.5 强化学习

强化学习（Reinforcement Learning，RL）又称再励学习、评价学习或增强学习，是机器学习的范式和方法论之一，用于描述和解决智能体在与环境的交互过程中，通过学习策略以达成回报最大化或实现特定目标的问题。

强化学习主要包括智能体、环境状态、奖励和动作 4 个元素以及一个状态。

强化学习是带有激励机制的，即如果机器行动正确，则施予一定的“正激励”；如果机器行动错误，则会给出一定的惩罚，也可称为“负激励”。在这种情况下，机器将会考虑在一个环境中如何行动才能达到激励的最大化，具有一定的动态规划思想。

强化学习的应用：

机械狗
AlphaGo Zero

3.3 机器学习常用算法

3.3.1 回归算法

回归算法是一种应用极为广泛的数量分析方法。该算法用于分析事物之间的统计关系，侧重考察变量之间的数量变化规律，并通过回归方程的形式描述和反映这种关系，以帮助人们准确把握变量受其他一个或多个变量影响的程度，进而为预测提供科学依据。

回归算法的分类：

线性回归（Linear Regression）
逻辑回归（Logistic Regression）
多项式回归（Polynomial Regression）
逐步回归（Step-wise Regression）
岭回归（Ridge Regression）
套索回归（Lasso Regression）
弹性回归（Elastic Net Regression）

3.3.2 聚类算法

聚类就是将相似的事物聚集在一起，将不相似的事物划分到不同类别的过程，是数据挖掘中一种重要的方法。聚类算法的目标是将数据集合分成若干簇，使得同一簇内的数据点相似度尽可能大，而不同簇间的数据点相似度尽可能小。聚类能在未知模式识别问题中，从一堆没有标签的数据中找到其中的关联关系。

1. 聚类算法概述

聚类技术是一种无监督学习，是研究样本或指标分类问题的一种统计分析方法。聚类与分类的区别是其要划分的类是未知的。常用的聚类分析方法有系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、图论聚类法和聚类预报法等。

聚类分析注意点：

可伸缩性
处理不同类型属性的能力
发现任意形状的聚类
输入参数的选择
处理“噪声”数据的能力
对于输入记录的顺序不敏感
高维度
基于约束的聚类
可解释性和可用性

2.聚类算法的分类

（1）基于划分的聚类算法

K-Means 算法
K-Medoids 算法
CLARANS 算法

（2）基于层次的聚类算法

BIRCH 算法
CURE 算法
Chameleon 算法

（3）基于密度的聚类算法

DBSCAN 算法
OPTICS 算法
DENCLUE 算法

（4）基于网格的聚类算法

STING 算法
CLIQUE 算法
Wave-Cluster 算法

（5）基于模型的聚类算法

统计的方法
神经网络的方法

（6）传递闭包法、布尔矩阵法、直接聚类法、相关性分析聚类法

3.3.3 降维算法

1. 降维算法概述

降维就是一种针对高维度特征进行的数据预处理方法，是应用非常广泛的数据预处理方法。

降维算法指对高维度的数据保留下最重要的一些特征，去除噪声和不重要的特征，从而实现提升数据处理速度的目的。在实际的生产和应用中，在一定的信息损失范围内，降维可以节省大量的时间和成本。机器学习领域中所谓的降维就是指采用某种映射方法，将原高维空间中的数据点映射到低维度的空间中。

2. 降维算法的分类

主成分分析（Principal Component Analysis，PCA）法

试图在保证数据信息丢失最少的原则下，对多个变量进行最佳综合简化，即对高维变量空间进行降维处理。

因子分析（Factor Analysis，FA）法

因子分析法是从假设出发。

因子分析法有几个主要目的：一是进行结构的探索，在变量之间存在高度相关性的时候希望用较少的因子来概括其信息；二是把原始变量转换为因子得分后，使用因子得分进行其他分析，从而简化数据，如聚类分析、回归分析等；三是通过每个因子得分计算出综合得分，对分析对象进行综合评价。

3. 降维算法的应用场景

降维算法通常应用于数据压缩与数据可视化中。

4. 决策树算法

下图为典型的决策树示例。

5. 贝叶斯算法

贝叶斯算法是对部分未知的状态进行主观概率估计，并使用贝叶斯公式对发生概率进行修正，最后利用期望值和修正概率做出最优决策。

6. 支持向量机算法

支持向量机算法是一种支持线性分类和非线性分类的二元分类算法。经过演进，其现在也支持多元分类，被广泛地应用在回归以及分类当中。

支持向量机算法在垃圾邮件处理、图像特征提取及分类、空气质量预测等多个领域都有应用，已成为机器学习领域中不可缺少的一部分。

7. 关联规则算法

关联规则算法常用来描述数据之间的相关关系，关联规则模式属于描述型模式。

8. 遗传算法

遗传算法是一种启发式的寻优算法，该算法是以进化论为基础发展出来的。它是通过观察和模拟自然生命的迭代进化，建立起一个计算机模型，通过搜索寻优得到最优结果的算法。

四、深度学习

4.1 神经网络

4.1.1 神经网络简介

神经网络（Neural Network，NN）亦称为人工神经网络（Artificial Neural Network，ANN），是由大量神经元（Neurons）广泛互连而成的网络，是对人脑的抽象、简化和模拟，应用了一些人脑的基本特性。

神经网络与人脑的相似之处可概括为两方面，一是通过学习过程利用神经网络从外部环境中获取知识，二是内部神经元用来存储获取的知识信息。

神经网络的信息处理是由神经元之间的相互作用实现的，知识与信息的存储主要表现为网络元件互相连接的分布式物理联系。

人工神经网络具有很强的自学习能力，它可以不依赖于“专家”的头脑，自动从已有的实验数据中总结规律。

人工神经网络擅长处理复杂的多维的非线性问题，不仅可以解决定性问题，还可以解决定量问题，同时具有大规模并行处理和分布信息存储能力，具有良好的自适应性、自组织性、容错性和可靠性。

4.1.2 神经网络发展历史

4.1.3 单个神经元

4.1.4 神经网络的结构

神经网络会将多个单一神经元连接在一起，将一个神经元的输出作为下一个神经元的输入神经网络的结构大致可以分为以下 5 类：

前馈式网络：该网络结构是分层排列的，每一层的神经元输出只与下一层的神经元连接。
输出反馈的前馈式网络：该网络结构与前馈式网络的不同之处在于，其中存在着一个从输出层到输入层的反馈回路。
前馈式内层互连网络：在该网络结构中，同一层的神经元之间相互关联，它们有相互制约的关系。但从层与层之间的关系来看，它仍然是前馈式的网络结构，许多自组织神经网络大多具有这种结构。
反馈型全互连网络：在该网络结构中，每个神经元的输出都和其他神经元相连，从而形成了动态的反馈关系，该网络结构具有关于能量函数的自寻优能力。
反馈型局部互连网络：在该网络结构中，每个神经元只和其周围若干层的神经元发生互连关系，形成局部反馈，从整体上看是一种网状结构。

4.1.5 神经网络的学习

神经网络的学习也称为训练，指的是通过神经网络所在环境的刺激作用调整神经网络的自由参数，使神经网络以一种新的方式对外部环境做出反应的一个过程。

神经网络最大的特点是能够从环境中学习，以及在学习中提高自身性能。经过反复学习，神经网络对其环境会越来越了解。

4.1.6 激活函数

激活函数（Activation Functions）对于人工神经网络模型以及卷积神经网络模型学习理解非常复杂和非线性的函数来说具有十分重要的作用。

4.1.7 损失函数

损失函数是模型对数据拟合程度的反映，拟合得越差，损失函数的值就越大。与此同时，当损失函数比较大时，其对应的梯度也会随之增大，这样就可以加快变量的更新速度。

4.2 感知机

4.2.1 感知机简介

感知机被称为深度学习领域最为基础的模型。虽然感知机是最为基础的模型，但是它在深度学习的领域中有着举足轻重的地位，它是神经网络和支持向量机学习的基础。

感知机学习的目标就是求得一个能够将训练数据集中正、负实例完全分开的分类超平面，为了找到分类超平面，即确定感知机模型中的参数 w 和 b，需要定义一个基于误分类的损失函数，并通过将损失函数最小化来求解 w 和 b。

4.2.2 多层感知机

多层感知机（MLP）也叫作前馈神经网络，是深度学习中最基本的网络结构。

4.3 卷积神经网络

4.3.1 卷积神经网络简介

卷积神经网络（Convolutional Neural Network，CNN），顾名思义，指在神经网络的基础上加入了卷积运算，通过卷积核局部感知图像信息提取其特征，多层卷积之后能够提取出图像的深层抽象特征，凭借这些特征来达到更准确的分类或预测的目标。卷积神经网络与一些传统的机器学习方法相比，能够更加真实地体现数据内在的相关特征，因此，目前卷积神经网络是图像、行为识别等领域的研究热点。

4.3.2 卷积神经网络的结构

卷积神经网络是多层感知机的变体，根据生物视觉神经系统中神经元的局部响应特性设计，采用局部连接和权值共享的方式降低模型的复杂度，极大地减少了训练参数，提高了训练速度，也在一定程度上提高了模型的泛化能力。

4.3.3 常用的卷积神经网络

VGG
GoogLeNet
ResNet

4.4 循环神经网络

4.4.1 循环神经网络简介

循环神经网络（Recurrent Neural Network，RNN）是深度学习领域中一类特殊的内部存在自连接的神经网络，可以学习复杂的矢量到矢量的映射。

循环神经网络是一种以序列（Sequence）数据为输入，在序列的演进方向进行递归（Recursion），且所有节点（循环单元）按链式连接形成闭合回路的递归神经网络（Recursive Neural Network）。

循环神经网络是为了刻画一个序列当前的输出与之前信息的关系。从网络结构上看，循环神经网络会记忆之前的信息，并利用之前的信息影响后面节点的输出。

循环神经网络的隐藏层之间的节点是有连接的，隐藏层的输入不仅包括输入层的输出，还包括上一时刻隐藏层的输出。对于每一个时刻的输入，循环神经网络会结合当前模型的状态给出一个输出，其可以看作同一神经网络被无限复制的结果。

闭合回路连接是循环神经网络的核心部分。循环神经网络对于序列中每个元素都执行相同的任务，输出依赖于之前的计算（即循环神经网络具有记忆功能），记忆可以捕获迄今为止已经计算过的信息。循环神经网络在语音识别、语言建模、自然语言处理（Natural Language Processing，NLP）等领域有着重要的应用。

4.4.2 循环神经网络的结构

4.4.3 常用的循环神经网络

长短期记忆网络（Long Short-Term Memory，LSTM）
门控循环单元神经网络（Gated Recurrent Unit，GRU）

4.5 生成对抗网络

4.5.1 生成对抗网络简介

生成对抗网络（Generative Adversarial Networks，GAN）的基本思想是学习训练样本的概率分布。

生成对抗网络独特的对抗性思想使得它在众多生成网络模型中脱颖而出，被广泛应用于计算机视觉、机器学习和语音处理等领域。

1. GAN 过程描述

GAN 让两个网络（生成网络 G 和判别网络 D）相互竞争，G 不断捕捉训练集中真实样本 xreal 的概率分布，并通过加入随机噪声将其转变成赝品 xfake。D 观察真实样本 xreal 和赝品 xfake，判断这个 xfake 到底是不是 xreal。整个对抗过程是先让 D 观察（机器学习）一些真实样本 xreal，当 D 对 xreal 有了一定的认知之后，G 尝试用 xfake 来欺骗 D，让 D 相信 xfake 是 xreal。有时候 G 能够成功骗过 D，但是随着 D 对 xreal 了解的加深（即学习的样本数据越来越多），G 发现越来越难以欺骗 D，因此 G 在不断提升自己仿制赝品 xfake 的能力。如此往复多次，不仅 D 能精通 xreal 的鉴别，G 对 xreal 的伪造技术也会大为提升。这便是 GAN 的生成对抗过程。

2. GAN 优点的简单总结

能学习真实样本的分布，探索样本的真实结构。
具有更强大的预测能力。
样本的脆弱性在很多机器学习模型中普遍存在，而 GAN 对生成样本的鲁棒性强。
通过 GAN 生成以假乱真的样本，缓解了小样本机器学习的困难。
为指导人工智能系统完成复杂任务提供了一种全新的思路。
与强化学习相比，对抗式学习更接近人类的学习机理。
GAN 与传统神经网络的一个重要区别是，传统神经网络需要人工精心设计和建构一个损失函数，而 GAN 可以学习损失函数。
GAN 解决了先验概率难以确定的难题。

4.5.2 生成对抗网络的结构

1. 生成网络

生成网络本质上是一个可微分函数，生成网络接收随机变量 z 的输入，经生成器 G 生成假样本 G(z)。

生成网络理论上可以逐渐学习任何概率分布，经训练后的生成网络可以生成逼真图像，但又不会和真实图像完全一样，即生成网络实际上是学习了训练数据的一个近似分布，这在数据增强应用方面尤为重要。

2. 判别网络

在 GAN 中，判别网络的主要目的是判断输入是否为真实样本，并提供反馈以指导生成网络训练。

判别网络和生成网络组成零和博弈的两个玩家，为取得游戏的胜利，判别网络和生成网络通过训练不断提高自己的判别能力和生成能力，游戏最终会达到一个纳什均衡状态。

3. 常用的生成对抗网络

条件生成对抗网络

条件生成对抗网络（Conditional GAN，CGAN）在原始 GAN 的基础上增加了约束条件，控制了 GAN 过于自由的问题，使网络朝着既定的方向生成样本。

深度卷积生成对抗网络

深度卷积生成对抗网络（Deep Convolutional GAN，DCGAN）的提出对 GAN 的发展有着极大的推动作用，它将 CNN 和 GAN 结合起来，使得生成的图片质量和多样性得到了保证。

循环一致性生成对抗网络

循环一致性生成对抗网络（Cycle-consistent Generative Adversarial Networks，CycleGAN）， CycleGAN 可以让两个域的图像互相转换且不需要成对的图像作为训练数据。

4.6 深度学习的应用

深度学习技术目前在人工智能领域占有绝对的统治地位，因为相比于传统的机器学习算法而言，深度学习在某些领域展现出了最接近人类所期望的智能效果，同时在悄悄地走进人们的生活，如刷脸支付、语音识别、智能翻译、自动驾驶、棋类人机大战等。

AlphaGo Zero
自动驾驶

你可能感兴趣的:(学习笔记,人工智能,深度学习)

基于YOLOv8的Web端交互式目标检测系统设计与实现 YOLO实战营 YOLO 前端目标检测人工智能 ui 目标跟踪计算机视觉
1.引言目标检测是计算机视觉领域的一项重要任务，它在安防监控、自动驾驶、医疗影像分析等领域有着广泛的应用。近年来，随着深度学习技术的快速发展，YOLO(YouOnlyLookOnce)系列算法因其出色的速度和精度平衡而备受关注。本文将详细介绍如何基于最新的YOLOv8模型构建一个Web端交互式目标检测系统，包含完整的UI界面设计和数据集处理流程。本系统将实现以下功能：基于YOLOv8的高效目标检测
交错并联Buck+LLC变换器的建模与控制优化研究
交错并联Buck+LLC变换器的建模与控制优化研究前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家，觉得好请收藏。点击跳转到网站。摘要本文针对宽输入电压范围(200-450V)、多电压输出(12-48V)的高效DC-DC变换系统，提出了一种基于交错并联Buck预调节器和LLC谐振变换器的两级式拓扑结构。中间母线电压设定为200V，系统输出功率为1500W，要求电压和
基于卷积神经网络与小波变换的医学图像超分辨率算法复现神经网络15044 python 算法 cnn 算法人工智能图像处理开发语言神经网络深度学习
基于卷积神经网络与小波变换的医学图像超分辨率算法复现前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家，觉得好请收藏。点击跳转到网站。1.引言医学图像超分辨率技术在临床诊断和治疗规划中具有重要意义。高分辨率的医学图像能够提供更丰富的细节信息，帮助医生做出更准确的诊断。近年来，深度学习技术在图像超分辨率领域取得了显著进展。本文将复现一种结合卷积神经网络(CNN)、小波变
使用MMDetection中的Mask2Former和X-Decoder训练自定义数据集及结果复现神经网络15044 算法 python 分类矩阵人工智能数据挖掘深度学习
使用MMDetection中的Mask2Former和X-Decoder训练自定义数据集及结果复现前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家，觉得好请收藏。点击跳转到网站。1.引言1.1研究背景实例分割是计算机视觉领域的重要任务，它要求模型不仅要检测图像中的对象，还要精确地分割出每个对象的像素级掩码。近年来，基于Transformer的模型在实例分割任务上取得
OpenCV引擎：驱动实时应用开发的科技狂飙芯作者 DD：计算机科学领域 opencv 计算机视觉
在人工智能与计算机视觉技术迅猛发展的今天，实时图像处理已成为工业自动化、自动驾驶、医疗诊断、增强现实等领域的核心技术需求。而**OpenCV（OpenSourceComputerVisionLibrary）**作为全球最活跃的开源计算机视觉库，正以其强大的算法生态、跨平台兼容性以及持续进化的架构设计，成为驱动实时应用开发的“数字引擎”。本文将深入剖析OpenCV如何通过技术创新突破实时处理的性能极
深度学习系列-----＞环境搭建（Ubuntu）二师兄用飘柔深度学习历程深度学习 ubuntu 人工智能 pytorch python
1、前言电脑基础系统硬件情况：系统：ubuntu18.04、显卡：GTX1050Ti；后续的环境搭建都在此基础上进行。此次学习选择Pytorch作为深度学习的框架，选择的原因主要由于PyTorch在研究领域特别受欢迎，较多的论文框架也是基于其开发。2、anaconda+python3安装测试在学习深度学习的过程中会涉及到使用不同版本python包的问题，而anaconda可以便捷获取包且对包能够进
深度学习-常用环境配置瑶山 AI linux 人工智能 windows CUDA PyTorch
目录Miniconda安装安装NVIDIA显卡驱动安装CUDA和cnDNNCUDAcuDNNPyTorch安装手动下载测试Miniconda安装最新版Miniconda搭建Python环境_miniconda创建python虚拟环境-CSDN博客安装NVIDIA显卡驱动直接进NVIDIA官网：NVIDIAGeForce驱动程序-N卡驱动|NVIDIA在这里有GeForce驱动程序，立即下载，这是下
《数据结构》学习笔记二：算法（二）小曼blog
继续上节的学习，我们在这一篇文章里把“算法”这一章内容学习完。本节解决问题：算法的好坏到底是如何评估的？知识点：1.函数的渐进增长2.算法的时间复杂度3.常见的时间复杂度4.算法的空间复杂度1.函数的渐进增长这一知识点与数学相关，不过没关系都是很容易理解的内容。问题：假如两个算法的输入规模都是n,A的执行次数是2n+3,B的执行次数是3n+1,那么这两个算法哪一个更好呢？我们来分析一下，用数学的折
全球软件技术峰会 2025：聚焦大模型开发、智能运维与架构创新，共赴技术实战盛宴向日葵也有悲伤运维架构推荐算法数据结构大数据数据库架构
全球软件技术峰会2025：聚焦大模型开发、智能运维与架构创新，共赴技术实战盛宴在软件定义未来的时代，人工智能与数字化技术正以颠覆性力量重塑全球产业格局。2025年8月15-16日，以"全球专家、卓越智慧"为宗旨的全球软件技术峰会将盛大启幕，特邀全球近50位来自微软、谷歌、亚马逊、字节跳动等企业的技术领袖及一线实战专家，围绕大模型智能应用开发、AI与ML智能运维、软件开发智能化、架构设计与演进四大核
AI产品经理面试宝典第42天：学习方法与产品流程解析 TGITCIC AI产品经理一线大厂面试题产品经理 AI面试大模型面试 AI产品经理面试大模型产品经理面试 AI产品大模型产品
具体问答：学习产品及AI知识的方法问：请谈谈您是如何学习产品及AI知识的，以及您认为哪些资源对您帮助最大答：我的学习体系包含三个维度：分层知识架构、实践验证闭环、资源筛选机制。在知识获取阶段，采用「理论-案例-工具」三级学习法：通过《人工智能：一种现代的方法》构建AI基础框架，用TensorFlow官方文档掌握工程实现，结合《启示录》《俞军产品方法论》理解产品逻辑。实践环节采用「项目反哺」模式，例
重磅！LM Studio AI编程全面免费
从今天起，LMStudio在家和工作中均可免费使用。查看更新后的条款了解详情。我们的隐私政策保持不变，您可以在此处阅读。在家免费使用，现在也可在工作场所使用LMStudio一直以来都免费供个人使用。这源于我们秉持的根本信念：人工智能应该让人们在自己的机器上轻松访问，无需依赖任何外部资源，并且完全保护隐私。此前，LMStudio应用条款规定，公司或组织若要使用LMStudio，必须联系我们并获得单独
在NLP深层语义分析中，深度学习和机器学习的区别与联系
在自然语言处理（NLP）的深层语义分析任务中，深度学习与机器学习的区别和联系主要体现在以下方面：一、核心区别特征提取方式机器学习：依赖人工设计特征（如词频、句法规则、TF-IDF等），需要领域专家对文本进行结构化处理。例如，传统情感分析需人工定义“情感词库”或通过词性标注提取关键成分。深度学习：通过神经网络自动学习多层次特征。例如，BERT等模型可从原始文本中捕获词向量、句法关系甚至篇章级语义，无
深度学习--利用梯度下降法进行多变量的二分类（感知机）白话学生nit 深度学习分类人工智能
其实这一节涉及到了感知机的相关知识，就把这一节当作是学习感知机的引子吧。什么是二分类我们先来说一下什么是二分类，二分类指的是将结果分为两个互斥的类别，通常用来表示问题的两种可能。为什么用感知机学习二分类常见的解决问题的模型有很多，这里我们使用感知机模型。至于为什么，因为感知机模型很多地方用起来比较简便，就拿我们这一节的问题举一下例子，我们需要依照房子的价格对房子进行分类。在感知机模型中，我们可以使
Self-Consistency：跨学科一致性的理论与AI推理的可靠性基石大千AI助手人工智能 Python #Prompt 人工智能机器学习神经网络算法大模型幻觉 LLM
本文综合其在逻辑学、心理学及人工智能领域的核心定义、技术实现与前沿进展来对Self-Consistency（自洽性）进行系统性解析。本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、核心定义与跨学科内涵基础概念逻辑学定义：指理论或系统内部逻辑自洽，无矛盾或悖论。例如物理理论中，狭义相对论的速度变换
人工智能学习指南：从菜鸟到大神的进击之路橡晟人工智能深度学习计算机视觉算法学习 python
人工智能学习指南：从菜鸟到大神的进击之路前言：别慌，AI没那么可怕嘿！想学人工智能？恭喜你，你已经比90%的人更有眼光了！很多人一听到"人工智能"就开始头疼，仿佛这是什么高深莫测的巫术。其实不然，AI就像学做饭一样——刚开始可能会糊锅，但掌握了方法，你也能做出一桌好菜！目录第一章：认清现实，别被忽悠第二章：建立知识地图第三章：实战为王第四章：自检清单——你真的学会了吗？第五章：进阶之路结语：成为A
阴谋爆仓！社科院课堂朱民ST-balance节能风电被骗揭秘！受害者亲述不能出金真相！正义青天
随着互联网的普及，数字经济蓬勃发展，各种线上平台如雨后春笋般涌现。然而，在这些看似繁荣的平台中，不乏一些黑平台，它们以欺诈手段骗取用户的财产，给人们的财产安全带来严重威胁。因此，我们有必要提高警惕，防范黑平台诈骗。针对网上素未谋面的牛散大咖，经济学家等推荐网上投资理财、数字经济，数字体育市场，人工智能项目，数字低碳，慈善投票网站买数字的等等都是骗局若你也不幸被骗遇到此类平台一定不要打草惊蛇，早期不
智能喷洒机器人目标识别系统：基于NanoDet的目标检测与UI界面实现 YOLO实战营机器人目标检测 ui NanoDet 计算机视觉目标跟踪深度学习
在现代农业生产中，自动化喷洒系统是实现精准农业的重要组成部分。智能喷洒机器人通过图像识别和自动控制技术，能够高效识别并精确喷洒农药、肥料等，提高农业生产效率，降低化学品使用量，减少环境污染。目标识别是智能喷洒机器人中至关重要的部分，它涉及到精准的作物和病虫害识别，确保喷洒操作的准确性。在本篇博客中，我们将构建一个基于NanoDet深度学习目标检测模型的智能喷洒机器人目标识别系统。我们将介绍如何使用
对标ChatGPT，「文心一言」今日亮相！AI人机时代来临，未来在何方？ AI医学
本文由「AI医学er」提供医海无涯，AI同舟。关注我们，助力高效科研。3月15日，OpenAI公布了其大型语言模型的最新版本——GPT-4。3月16日，百度文心一言人工智能聊天机器人正式上线。一个时代开始了。OpenAI在官网表示，GPT-4是一个能接受图像和文本输入，并输出文本的多模态模型，是OpenAI在扩展深度学习方面的最新成果。此前的ChatGPT，只能通过向其输入文字提问才能生成文字回答
【深度学习新浪潮】什么是system 1和system 2？小米玄戒Andrew 深度学习新浪潮深度学习人工智能大模型推理模型 COT 模型蒸馏动态推理
在大模型研究中，System1和System2的概念源于心理学家DanielKahneman的双系统理论，用于描述人类思维的两种模式。System1代表快速、直觉、自动化的思维（如模式识别），而System2代表慢速、有意识、需要努力的逻辑推理（如复杂数学计算）。这一理论被引入AI领域后，成为理解大模型能力边界和优化方向的重要框架。一、大模型中的System1与System2的定义System1（
飞算科技：以原创技术为翼，赋能产业数字化转型
在数字经济浪潮席卷全球的当下，一批专注于技术创新的中国企业正加速崛起，飞算数智科技（深圳）有限公司（简称“飞算科技”）便是其中的佼佼者。作为一家国家级高新技术企业，飞算科技以自主创新为核心驱动力，凭借互联网科技、大数据、人工智能等前沿技术，为各行业客户插上数字化转型的翅膀。飞算科技的定位清晰而坚定——自主创新型数字科技公司。这一定位不仅体现在其技术研发的方向上，更融入到为客户服务的每一个环节。无论
警惕!北恒私募高级班周一丰，马建军不正规。不让出金,不能提现,大家远离骗局! 昌龙律法
随着互联网的普及，数字经济蓬勃发展，各种线上平台如雨后春笋般涌现。然而，在这些看似繁荣的平台中，不乏一些黑平台，它们以欺诈手段骗取用户的财产，给人们的财产安全带来严重威胁。因此，我们有必要提高警惕，防范黑平台诈骗。针对网上素未谋面的牛散大咖，经济学家等推荐网上投资理财、数字经济，数字体育市场，人工智能项目，数字低碳，慈善投票网站买数字的等等都是骗局，广大市民对此要提高警惕，若你也不幸被骗遇到此类平
学习人工智能开发的详细指南 Ws＿学习人工智能 python
一、引言人工智能（AI）开发是一个充满挑战与机遇的领域，它融合了数学、计算机科学、统计学、认知科学等多个学科的知识。随着大数据、云计算和深度学习技术的快速发展，AI已经成为推动社会进步和产业升级的关键力量。本文将为初学者提供一份详细的学习指南，帮助大家逐步掌握AI开发的核心技能。二、基础知识准备数学基础：线性代数：理解向量、矩阵、线性变换等基本概念，掌握矩阵运算和特征值分解等技巧。概率论与统计学：
计算机发展史：人工智能时代的智能变革与无限可能 jdlxx_dongfangxing 计算机发展史计算机发展史
在计算机发展的漫长进程中，人工智能时代的到来无疑是最具革命性的篇章之一。它使计算机从单纯的数据处理工具，进化为能够模拟、延伸和拓展人类智能的强大系统，对科学研究、经济发展、社会生活乃至人类文明的走向，都产生了深远且不可逆转的影响。从早期对智能机器的设想，到如今人工智能技术在全球范围内的广泛应用，这一领域经历了无数次理论突破、技术迭代与实践探索，正以前所未有的速度重塑着我们的世界。人工智能的起源与早
走进区块城市，开启你的元宇宙之旅！口碑信息传播者
随着科技的飞速发展，虚拟现实、区块链、人工智能等前沿技术逐渐融入我们的生活。在这个大背景下，元宇宙概念应运而生，成为全球关注的焦点。本文将带领读者走进区块城市，一探元宇宙的究竟，感受这个未来世界的魅力。探索未来，触碰无限可能！国内区块链元宇宙正引领一场前所未有的科技革命，现在正是您加入这场盛宴的最佳时机！在这里，您将亲身体验到一个全新的虚拟世界，感受与现实世界无缝对接的震撼体验。加入国内区块链元宇
AI人工智能领域知识图谱在文本分类中的应用技巧 AI天才研究院 AI大模型企业级应用开发实战人工智能知识图谱分类 ai
AI人工智能领域知识图谱在文本分类中的应用技巧关键词：知识图谱、文本分类、图神经网络、实体关系抽取、深度学习、自然语言处理、特征融合摘要：本文深入探讨了知识图谱在文本分类任务中的应用技巧。我们将从知识图谱的基本概念出发，详细分析如何将结构化知识融入传统文本分类流程，介绍最新的图神经网络方法，并通过实际案例展示知识增强型文本分类系统的构建过程。文章特别关注知识表示学习与文本特征的融合策略，以及在不同
java学习笔记
期末课堂作业,以下内容为2024年上学期java课堂学习笔记202402150705目录[第1章:Java语言概述](#第1章:Java语言概述)[第2章:数据类型与运算符](#第2章:数据类型与运算符)[第3章:控制流程语句](#第3章:控制流程语句)[第4章:数组](#第4章:数组)[第5章:类与对象](#第5章:类与对象)[第6章:封装、继承与多态](#第6章:封装、继承与多态)[第7章:异
《随园诗话》学习笔记一百五十四飞鸿雪舞
卷三求诗于书中，得诗于书外八、直抒胸中意【原文】王梦楼侍讲云：“诗称家数，犹之官称衙门也。衙门自以总督为大，典史为小。然以总督衙门之担水夫，比典史衙门之典史，则亦宁为典史，而不为担水夫。何也?典史虽小，尚属朝廷命官；担水夫衙门虽尊，与他无涉。今之学杜、韩不成，而矜矜然自以为大家者，不过总督衙门之担水夫耳。”叶横山先生云：“好摹仿古人者，窃之似，则优孟衣冠；窃之不似，则画虎类狗。与其假人余焰，妄自称
大学专业科普 | 人工智能、物联网和云计算技术鸭鸭鸭进京赶烤人工智能物联网云计算 5G 信号处理信息与通信网络
一、专业概述人工智能专业是一门融合计算机科学、数学、信息学等多学科知识的交叉学科。它旨在培养学生掌握人工智能领域的基本理论、方法和技能，以应对人工智能在各个领域的应用需求和发展挑战。二、主要课程基础课程：包括高等数学、线性代数、概率论与数理统计、离散数学等数学基础课程，为人工智能算法提供理论支撑；以及数据结构、算法设计与分析、计算机组成原理、操作系统、计算机网络等计算机科学基础课程，帮助学生理解人
解读一个大学专业——信号与图像处理
专业定义与核心内容维度内容定义研究如何采集、处理、分析和理解一维信号（语音、雷达、脑电）和二维/三维图像（医学、遥感、工业视觉）。关键词数字信号处理（DSP）、图像处理、计算机视觉、模式识别、压缩感知、深度学习、GPU加速、嵌入式系统。技术栈MATLAB/Python+OpenCV/PyTorch+DSP/FPGA+GPU（CUDA）第五届先进算法与信号、图像处理国际学术会议（AASIP2025）
Pad Token技术原理与实现指南 Takoony AI
目录概述理论基础：第一性原理分析技术实现机制工程最佳实践性能优化策略常见问题与解决方案技术发展趋势附录1.概述1.1文档目的本文档旨在深入阐述深度学习中PadToken的技术原理、实现机制及工程应用，为算法工程师提供全面的理论指导和实践参考。1.2适用范围自然语言处理模型开发序列数据批处理优化深度学习系统架构设计高性能计算资源管理1.3核心问题研究问题:为什么深度学习模型需要将变长序列统一到固定长
ztree异步加载 3213213333332132 JavaScript Ajax json Web ztree
相信新手用ztree的时候,对异步加载会有些困惑，我开始的时候也是看了API花了些时间才搞定了异步加载，在这里分享给大家。我后台代码生成的是json格式的数据，数据大家按各自的需求生成，这里只给出前端的代码。设置setting，这里只关注async属性的配置 var setting = { //异步加载配置
thirft rpc 具体调用流程 BlueSkator 中间件 rpc thrift
Thrift调用过程中，Thrift客户端和服务器之间主要用到传输层类、协议层类和处理类三个主要的核心类，这三个类的相互协作共同完成rpc的整个调用过程。在调用过程中将按照以下顺序进行协同工作：（1）将客户端程序调用的函数名和参数传递给协议层（TProtocol），协议
异或运算推导, 交换数据 dcj3sjt126com PHP 异或 ^
/* * 5 0101 * 9 1010 * * 5 ^ 5 * 0101 * 0101 * ----- * 0000 * 得出第一个规律: 相同的数进行异或, 结果是0 * * 9 ^ 5 ^ 6 * 1010 * 0101 * ---- * 1111 * * 1111 * 0110 * ---- * 1001
事件源对象周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
MySql配置及相关命令 g21121 mysql
MySQL安装完毕后我们需要对它进行一些设置及性能优化，主要包括字符集设置，启动设置，连接优化，表优化，分区优化等等。一修改MySQL密码及用户
[简单]poi删除excel 2007超链接 53873039oycg Excel
采用解析sheet.xml方式删除超链接，缺点是要打开文件2次,代码如下: public void removeExcel2007AllHyperLink(String filePath) throws Exception { OPCPackage ocPkg = OPCPac
Struts2添加 open flash chart 云端月影
准备以下开源项目： 1. Struts 2.1.6 2. Open Flash Chart 2 Version 2 Lug Wyrm Charmer (28th, July 2009) 3. jofc2，这东西不知道是没做好还是什么意思，好像和ofc2不怎么匹配，最好下源码，有什么问题直接改。 4. log4j 用eclipse新建动态网站，取名OFC2Demo，将Struts2 l
spring包详解 aijuans spring
下载的spring包中文件及各种包众多，在项目中往往只有部分是我们必须的，如果不清楚什么时候需要什么包的话，看看下面就知道了。 aspectj目录下是在Spring框架下使用aspectj的源代码和测试程序文件。Aspectj是java最早的提供AOP的应用框架。 dist 目录下是Spring 的发布包，关于发布包下面会详细进行说明。 docs&nb
网站推广之seo概念 antonyup_2006 算法 Web 应用服务器搜索引擎 Google
持续开发一年多的b2c网站终于在08年10月23日上线了。作为开发人员的我在修改bug的同时，准备了解下网站的推广分析策略。所谓网站推广，目的在于让尽可能多的潜在用户了解并访问网站，通过网站获得有关产品和服务等信息，为最终形成购买决策提供支持。网站推广策略有很多，seo，email，adv
单例模式,sql注入,序列百合不是茶单例模式序列 sql注入预编译
序列在前面写过有关的博客,也有过总结,但是今天在做一个JDBC操作数据库的相关内容时需要使用序列创建一个自增长的字段居然不会了,所以将序列写在本篇的前面 1,序列是一个保存数据连续的增长的一种方式; 序列的创建; CREATE SEQUENCE seq_pro 2 INCREMENT BY 1 -- 每次加几个 3
Mockito单元测试实例 bijian1013 单元测试 mockito
Mockito单元测试实例： public class SettingServiceTest { private List<PersonDTO> personList = new ArrayList<PersonDTO>(); @InjectMocks private SettingPojoService settin
精通Oracle10编程SQL(9)使用游标 bijian1013 oracle 数据库 plsql
/* *使用游标 */ --显示游标 --在显式游标中使用FETCH...INTO语句 DECLARE CURSOR emp_cursor is select ename,sal from emp where deptno=1; v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; begin ope
【Java语言】动态代理 bit1129 java语言
JDK接口动态代理 JDK自带的动态代理通过动态的根据接口生成字节码(实现接口的一个具体类)的方式，为接口的实现类提供代理。被代理的对象和代理对象通过InvocationHandler建立关联 package com.tom; import com.tom.model.User; import com.tom.service.IUserService;
Java通信之URL通信基础白糖_ java jdk webservice 网络协议 ITeye
java对网络通信以及提供了比较全面的jdk支持，java.net包能让程序员直接在程序中实现网络通信。在技术日新月异的现在，我们能通过很多方式实现数据通信，比如webservice、url通信、socket通信等等，今天简单介绍下URL通信。学习准备：建议首先学习java的IO基础知识 URL是统一资源定位器的简写，URL可以访问Internet和www，可以通过url
博弈Java讲义 - Java线程同步 (1) boyitech java 多线程同步锁
在并发编程中经常会碰到多个执行线程共享资源的问题。例如多个线程同时读写文件，共用数据库连接，全局的计数器等。如果不处理好多线程之间的同步问题很容易引起状态不一致或者其他的错误。同步不仅可以阻止一个线程看到对象处于不一致的状态，它还可以保证进入同步方法或者块的每个线程，都看到由同一锁保护的之前所有的修改结果。处理同步的关键就是要正确的识别临界条件（cri
java-给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 bylijinnan java
public class DeleteExtraSpace { /** * 题目：给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 * 方法1.用已有的String类的trim和replaceAll方法 * 方法2.全部用正则表达式，这个我不熟 * 方法3.“重新发明轮子”，从头遍历一次 */ public static v
An error has occurred.See the log file错误解决！ Kai_Ge MyEclipse
今天早上打开MyEclipse时，自动关闭！弹出An error has occurred.See the log file错误提示！很郁闷昨天启动和关闭还好着！！！打开几次依然报此错误，确定不是眼花了！打开日志文件！找到当日错误文件内容： --------------------------------------------------------------------------
[矿业与工业]修建一个空间矿床开采站要多少钱? comsci
地球上的钛金属矿藏已经接近枯竭........... 我们在冥王星的一颗卫星上面发现一些具有开采价值的矿床..... 那么,现在要编制一个预算,提交给财政部门..
解析Google Map Routes dai_lm google api
为了获得从A点到B点的路劲，经常会使用Google提供的API，例如 [url] http://maps.googleapis.com/maps/api/directions/json?origin=40.7144,-74.0060&destination=47.6063,-122.3204&sensor=false [/url] 从返回的结果上，大致可以了解应该怎么走，但
SQL还有多少“理所应当”？ datamachine sql
转贴存档，原帖地址：http://blog.chinaunix.net/uid-29242841-id-3968998.html、http://blog.chinaunix.net/uid-29242841-id-3971046.html！ ------------------------------------华丽的分割线--------------------------------
Yii使用Ajax验证时，如何设置某些字段不需要验证 dcj3sjt126com Ajax yii
经常像你注册页面,你可能非常希望只需要Ajax去验证用户名和Email,而不需要使用Ajax再去验证密码,默认如果你使用Yii 内置的ajax验证Form,例如: $form=$this->beginWidget('CActiveForm', array( 'id'=>'usuario-form',&
使用git同步网站代码 dcj3sjt126com crontab git
转自:http://ued.ctrip.com/blog/?p=3646?tn=gongxinjun.com 管理一网站，最开始使用的虚拟空间，采用提供商支持的ftp上传网站文件，后换用vps，vps可以自己搭建ftp的，但是懒得搞，直接使用scp传输文件到服务器，现在需要更新文件到服务器，使用scp真的很烦。发现本人就职的公司，采用的git+rsync的方式来管理、同步代码，遂
sql基本操作蕃薯耀 sql sql基本操作 sql常用操作
sql基本操作 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:30:33 星期一 &
Spring4+Hibernate4+Atomikos3.3多数据源事务管理 hanqunfeng Hibernate4
Spring3+后不再对JTOM提供支持，所以可以改用Atomikos管理多数据源事务。Spring2.5+Hibernate3+JTOM参考：http://hanqunfeng.iteye.com/blog/1554251Atomikos官网网站：http://www.atomikos.com/ 一.pom.xml <dependency> <
jquery中两个值得注意的方法one()和trigger()方法 jackyrong trigger
在jquery中，有两个值得注意但容易忽视的方法，分别是one()方法和trigger()方法,这是从国内作者<<jquery权威指南》一书中看到不错的介绍 1） one方法 one方法的功能是让所选定的元素绑定一个仅触发一次的处理函数，格式为 one(type,${data},fn) &nb
拿工资不仅仅是让你写代码的 lampcy 工作面试咨询
这是我对团队每个新进员工说的第一件事情。这句话的意思是，我并不关心你是如何快速完成任务的，哪怕代码很差，只要它像救生艇通气门一样管用就行。这句话也是我最喜欢的座右铭之一。这个说法其实很合理：我们的工作是思考客户提出的问题，然后制定解决方案。思考第一，代码第二，公司请我们的最终目的不是写代码，而是想出解决方案。话粗理不粗。付你薪水不是让你来思考的，也不是让你来写代码的，你的目的是交付产品
架构师之对象操作----------对象的效率复制和判断是否全为空 nannan408 架构师
1.前言。如题。 2.代码。 (1)对象的复制，比spring的beanCopier在大并发下效率要高，利用net.sf.cglib.beans.BeanCopier Src src=new Src(); BeanCopier beanCopier = BeanCopier.create(Src.class, Des.class, false);
ajax 被缓存的解决方案 Rainbow702 JavaScript jquery Ajax cache 缓存
使用jquery的ajax来发送请求进行局部刷新画面，各位可能都做过。今天碰到一个奇怪的现象，就是，同一个ajax请求，在chrome中，不论发送多少次，都可以发送至服务器端，而不会被缓存。但是，换成在IE下的时候，发现，同一个ajax请求，会发生被缓存的情况，只有第一次才会被发送至服务器端，之后的不会再被发送。郁闷。解决方法如下： ① 直接使用 JQuery提供的 “cache”参数，
修改date.toLocaleString()的警告 tntxia String
我们在写程序的时候，经常要查看时间，所以我们经常会用到date.toLocaleString()，但是date.toLocaleString()是一个过时的API，代替的方法如下： package com.tntxia.htmlmaker.util; import java.text.SimpleDateFormat; import java.util.
项目完成后的小总结 xiaomiya js 总结项目
项目完成了，突然想做个总结但是有点无从下手了。做之前对于客户端给的接口很模式。然而定义好了格式要求就如此的愉快了。先说说项目主要实现的功能吧 1，按键精灵 2，获取行情数据 3，各种input输入条件判断 4，发送数据（有json格式和string格式） 5，获取预警条件列表和预警结果列表， 6，排序， 7，预警结果分页获取 8，导出文件（excel，text等） 9，修