ANN同学在搬砖

人工智能技术概述与入门

一、人工智能概述

上世纪50年代，以香农（Claude Elwood Shannon ）为首的科学家共同研究机器模拟的相关问题，形成了人工智能的雏形。”人工智能”一词最初在1956 年达特茅斯学会上被提出，初期的人工智能主要在机器学习、定理证明、模式识别、问题求解、专家系统及人工智能语言等方面取得了不少成就，上世纪70年代后许多国家都开展了人工智能的研究，这段时间涌现了大量的研究成果，尤其是专家系统的研究在多种领域中取得了重大突破，各种不同功能、不同类型的专家系统如雨后春笋般地建立起来，产生了巨大的经济效益及社会效益。上世纪90年代以来，计算机算力不断增加，人工智能的桎梏被打破，同时其他信息技术与互联网技术的快速普及推动了人工智能实现规模化商用，而人工智能应用的普及也推动了其技术的发展，自此，人工智能进入高速发展阶段。

人工智能的定义目前还没有形成统一，我国《人工智能标准化白皮书（2018年）》将人工智能定义为是利用数字计算机或者由数字计算机控制的机器，模拟、延伸和扩展人类的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术和应用系统[1]。加州大学伯克利分校人工智能系统中心创始人斯图尔特·罗素(Stuart Russell)将人工智能分为像人一样思考的系统、像人一样行动的系统、理性思考的系统、理性行动的系统四类[2]。

人工智能目前的主要领域分为计算机视觉、语音识别与合成、机器学习、自然语言处理、知识图谱等，图1显示了我国2019年科技企业在不同的人工智能领域的实际研发投入情况。计算机视觉是一门使计算机像人类通过视觉了解世界一样，对图像进行分析与识别，读取其中的信息。语音识别、自然语言识别与计算机视觉类似，都是指计算机对声音信号与文本语言进行类人的分析与识别，以获取其中的信息。机器学习主要是计算机通过对数据的分析实现对规则的学习，实现自身算法性能的提高。知识图谱是一种展示知识结构关系与发展进程的技术，通过可视化技术为学科研究提供有价值的参考。

数据来源：中国金融科技发展报告（2020）

图 1 2019年中国科技企业AI主要领域算法研发投入情况

二、人工智能技术原理
1. 机器学习

（1）基本概念

机器学习（Machine Learning, ML）是人工智能领域最能体现其智能性的分支，主要是计算机通过对已知情况的数据集进行分析后，生成可以面对新情况的模型算法。机器学习与人类学习的过程十分类似，我们在学习时往往会通过以往的经验对新遇到的情况作出判断，实际上机器学习中的计算机也是这样。

设想一个人从未见过刺角瓜，但现在因为某种原因需要经常吃这种水果，所以需要学习怎样在市场上挑选好吃的刺角瓜，那么他可以先随机买一筐刺角瓜，吃的时候注意观察好吃与不好吃的刺角瓜分别有什么特征，特征包括表皮颜色、表皮粗糙程度、体积大小、香味大小、饱满程度等，每一个刺角瓜都可以在这几个方面做出评价。在吃到一定数量了之后，往就能够学习到哪种特征的刺角瓜更好吃了，之后再去市场买刺角瓜就可以依据学习到的经验进行挑选购买并品尝，以验证他学习到的挑瓜经验是否有效了。这个学习过程对应到机器学习中，”挑选好吃的刺角瓜”是学习目标，”随机买回来的一筐刺角瓜”是训练数据集，”一边观察特征一边吃”就是训练过程，”得到哪种特征的瓜好吃的经验”就是模型算法，从训练数据集中获取规律生成模型算法的能力就是泛化能力，而”去市场挑选购买并品尝”就是进行测试。再具体一点，随机买的那筐刺角瓜也就是训练数据集中，对于计算机来说，每一个刺角瓜都是一条数据，这条数据包括表皮颜色、表皮粗糙程度、体积大小、香味大小、饱满程度这几个维度的数据，可以将其想象成如同表1 的一张表格。那么计算机就需要通过某种办法基于这些数据生成一种判断模型，例如可以认为表皮颜色为黄透红且体积小的瓜好吃，并通过这个模型对下一个遇到的刺角瓜进行判断。

表1 训练集数据示意

数据\特征	表皮颜色	表皮粗糙程度	体积大小	香味大小	饱满程度	是否好吃
刺角瓜1	黄透红	粗糙	大	小	干瘪	否
刺角瓜2	黄透绿	中等	大	中等	饱满	否
刺角瓜3	纯黄色	粗糙	小	大	中等	是
刺角瓜4	黄透红	光滑	小	小	饱满	是
……	……	……	……	……	……	……

当然这只是一种很简单的学习任务，我们可以称之为二分类问题，因为它得出的预测结果为只有好吃与不好吃两类。我们还可以进一步将问题扩展为预测刺角瓜是甜的、酸的、苦涩的，还是无味的，那么这就变成了多分类问题。如果再进一步，将刺角瓜的好吃程度打分，0为最不好吃，1为最好吃，预测的结果是连续分布的，那么就变成了回归问题。这种有确定的分类或取值范围的机器学习任务往往是以建立一种映射关系为目的，将输入的数据以n种特征建立为n维的输入空间，通过一种特定的方法映射到输出空间中，实现对新数据的预测。

品尝刺角瓜并对其进行评价的过程在机器学习中称为标记，当然这个”标记”也是个名词，代表这条训练数据自带的结果，例如好吃、不好吃或者好吃程度的评分就可以作为数据的标记。分类问题与回归问题等带有标记的机器学习问题称为监督学习，不带有的标记的称为无监督学习，聚类问题就是无监督学习的代表。因为无监督只有特征值没有标记，最后也不知道应该将这些处理成什么样，所以一般是将这些数据根据其特征的相似性进行分类，但具体分为哪几类并没有明确的规定，一般用在潜在类别的预测以及数据压缩等场景。除了有监督学习与无监督学习之外，还有介于这二者之间的半监督学习，半监督学习的训练集中既包括有标签数据也包括无标签数据，通常情况下无标签数据占多数，在实际应用中还不太普及，常规的半监督算法有自训练算法与半监督支持向量机等。

（2）基本原则与测试检验

机器学习中可以认为计算机需要学习的是一种确实存在的普遍规律，当计算机对训练数据的分析的不够深刻，没能学习到普遍规律时，称为欠拟合；当计算机对数据的分析程度过高，导致学习到了除普遍规律以外的其他只存在在训练集中特殊规律，称为过拟合。在进行机器学习时，需要在欠拟合与过拟合之间寻找平衡，达到最佳效果。另外，机器学习算法必然有其归纳偏好，但什么样的偏好更优呢？机器学习中最常见的一个原则为奥卡姆剃刀，其内容为”若有多种假设与观察一致，则选择最简单的那个”，也就是说应该选择最简单的规律作为学习成果。

机器学习包含多种算法，不同算法的预测结果可能完全不同，那么对一个机器学习算法进行测试与评价也是个非常重要的问题。训练数据集完成训练后，需要对训练成果进行测试，测试的数据需要与训练集有所区别，这些用于测试评价的数据被称为测试集。获但取数据时往往不分训练集和测试集，那么就需要将数据进行训练集与测试集的划分，常见的划分与测试方法有留出法、交叉验证法、自助法等。留出法即直接将数据分为两部分，以其中较多的一部分作为训练集，另一部分作为测试集。交叉验证法是留出法的变体，因为直接分为两部分往往会有测试偏差，那么就进行多次划分取平均值，具体方法是将数据集通过分层采样分为n等份，将第i份（i∈[1，n]）数据作为测试集，剩下的作为训练集，这样就有n种划分的方法，依次用这n种方法进行训练和测试，将这n次测试结果取平均值即为交叉验证的结果。自助法是通过自助采样对数据进行有放回的多次采样，即数据可以重复，那么无论采样多少次，理论上一定会有一部分数据不会被采到，那么将采样到的数据作为训练集，将未被采到的数据作为测试集，直接进行测试。自助法一般用在数据样本规模较小的情况，而在数据样本规模较大时通常会采用交叉验证。

在测试集中进行测试时，有多种评价指标可以对算法模型的性能进行评价。回归任务的性能大多使用均方误差来进行度量，而对于分类任务来说，可选择错误率、精度、查准率、查全率、受试者工作特征（ROC）与其曲线下面积（AUC）作为性能评价指标。前四项望文生义，比较好理解，而ROC指标不太常见，它是指将每个测试数据的真正例率作为纵轴，假正例率作为横轴标定离散点并将其连接后绘制的曲线，实际上反映的是数据按学习目的（例如刺角瓜的好吃程度）进行排序的正确程度，AUC作为ROC曲线下的面积数值一般一般在0.5到1之间，数值越大说明算法的分类能力越强。在进行模型比较与专业的算法竞赛中，往往主要依据AUC对算法的优劣进行评价。

（3）常见算法

机器学习的算法非常多，在此仅以几种最基础最常用算法为例进行解释：

·决策树（Decision Tree, DT）

决策树一般用在分类问题中，是一种基于特征对实例进行分类的算法。学习时，利用训练数据，根据损失函数最小化的原则建立决策树模型；预测时利用决策模型对新遇到的数据进行分类。

一棵典型的决策树包括一个根节点、若干个内部节点与若干个叶节点，根节点中包含全部的训练样本数据，每个内部节点代表一个特征的判断，训练样本通过内部节点后逐步被划分到子节点中，直至被全部划分到叶节点为止，每个叶节点代表一种分类结果。所以决策树最重要的是内部节点的规则，也就是要依据什么特征，怎样判断划分数据，才能保证最终叶节点的分类结果最可靠，这就是决策树学习过程中的特征选择与决策树生成过程。另外，在学习中往往为了保证划分的更加准确，内部节点的划分会有大量的重复，导致了决策树的分支过多产生过拟合问题，为了避免过拟合，我们需要对决策树进行剪枝处理。剪枝策略包括在节点划分前进行的预剪枝与在生成树后再进行的后剪枝两种，预剪枝的时间开销小但存在一定的欠拟合风险，后剪枝通常会保留更多的分支，但由于是在生成了完整的树之后才进行的剪枝，往往需要较大的剪枝开销。

·神经网络（Artificial Neural Network, ANN）

神经网络是是指计算机模拟生物的神经系统，以神经元为单位对事物做出反应的一种模型。事实上神经网络是一个非常大的概念，而此处所指的神经网络仅包括与机器学习相关的神经网络学习。

神经网络是由多个神经元相互连接组成，且神经元之间的连接带有一定的权重，信号在神经元网络之间进行传递时，每经过一个神经元都会通过其特定函数（激活函数）的处理，最终得到整个系统的处理结果。感知机是一种最基本的神经网络，仅由两层神经元组成，输入层神经元接受外部信号，并传给具有激活函数的输出层神经元，但因为只有单层含有激活函数的功能神经元，感知机在实际应用中的使用场景非常有限。目前的主流神经网络都是多层的，多层神经网络的学习能力要比单层强很多，常见的多层神经网络算法包括误差逆传播（Back Propagation）网络、径向基函数（Radial Basis Function）网络、竞争型学习（Compitition Learning）网络等。

通常情况下，神经网络的层数越多、模型越复杂时，相应能完成的学习任务就越复杂，但是复杂的神经网络往往容易产生过拟合问题、训练效率低且有极大的训练开销。近年来，随着大数据时代的到来与微电子技术的发展，训练复杂模型的可行性逐渐提高，最近热度很高的深度学习就是高复杂度神经网络的代表。深度学习与普通的神经网络相比，含有更多的特征代表层数，如果将神经网络看作是黑盒的话，那么可以将称特征代表层为隐层，增加隐层的数量比增加神经元的数量更能提高模型的复杂程度，如此看来，深度神经网络其实就是层数很多很深的一种神经网络，常见的深度神经网络包括卷积神经网络（Convolutional Natural Network）和深度信念网络（Deep Belief Network）等。

·支持向量机（Support Vector Machine, SVM）

支持向量机是一种对数据进行二元分类的广义线性分类器，最简单的支持向量机思想可以理解为将含有二维特征并带有标记的数据集投射在二维平面坐标系中，形成带标记的二维散点图，而支持向量机的任务则是在此平面空间上找到一条线将这些样本散点按照标记划分为两部分，当面对待分类数据时，只要将数据标记在平面中并观察其被线划分到哪部分即可。当然在实际的应用中的特征维数往往是大于2的，那么划分空间的就不是一条线，而是一个平面，这个平面在支持向量机中被称为划分超平面。划分超平面的选择需要考虑多种因素，最重要的是要能够在数据样本存在一定噪声的时候所受的影响小，具备足够的鲁棒性。另外，很有可能无法在以特征数量为样本空间维数的原始样本空间中，找到划分超平面，那么可以将样本空间进行非线性变换，将其映射到更高维的空间中，在高维空间中寻找划分超平面，只要原始样本空间的维数有限，那么一定可以找到一个存在划分超平面的高维空间。总体来说，支持向量机就是利用升维和线性化来进行模式分类，在最优化求解计算上利核展开定理在原特征空间进行对偶求解。

·k近邻（k-Nearest Neighbor, KNN）

K 近邻学习是一种特殊的机器学习方法，因为它没有正式的模型训练过程，是一种典型的懒惰学习方法。其主要思想是每个样本都可以用它最接近的K个邻近值来代表，如果一个样本在特征空间中的K个最相似（即特征空间中最邻近）的样本中的大多数属于某一个类别，则该样本也属于这个类别。K的取值在k近邻算法中十分重要，会直接导致分类结果的不同，k值的确定往往需要与实际情况相结合。

k近邻算法每次进行判断时都需要计算所有样本与待学习样本的距离，计算开销非常大，因此通常需要对已知样本进行处理与剪辑，以保证减小计算开销并保证预测的合理性。K 近邻算法更适合在样本容量较大时运用，在小样本容量的场景往往不具有可靠性。

·集成学习

集成学习是混合运用多个机器学习方法来完成学习任务，通过不同学习器的合理组合，往往可以获得比单一学习器更优的性能。多个学习器的结合策略有很多，对于回归任务通常会采取直接对不同学习器学习结果取平均值或加权平均值的的平均法。对于分类任务则通常采用投票法，包括绝对多数投票法、相对多数投票法和加权投票法等。当训练数据集样本容量较大时，还可以使用学习法，即通过另一个学习器将这些学习器结合到一起，进行二次学习。

2. 智能认知

智能认知的是数据分析模型与机器学习模型结合下的实际应用，主要包括以下几种应用场景。

（1）计算机视觉

计算机视觉（Machine Vision, MV）指用图像采集设备与计算机代替人眼人脑，对目标进行识别、跟踪和测量等功能，并进一步对图形进行处理，是一种能够从图像或者多维数据中获取有效信息的人工智能系统。计算机是觉得应用范围目前包括控制过程、导航、事件检测、组织信息、造型对象或环境、相互作用和自动检测七类，有非常广阔的应用场景，例如基于事件检测的生物身份信息识别、基于导航的智能驾驶与导弹制导、基于造型对象的医学影像分析等。计算机视觉主要有图像分类、目标追踪与语义分割三种关键技术。

图像分类实际上是一种机器学习的分类任务，一般先通过特征提取对图像的通用特征进行选择，然后使用机器学习训练分类模型，最终实现图像的分类。图像分类目前使用最广泛的是深度学习算法，其在分类精度与分类效率上都具有优势。目标追踪的用途包括单目标跟踪、多目标跟踪、行人重识别、多目标多摄像头跟、姿态跟踪等，其使用的算法主要有相关滤波算法、检测跟踪结合算法与深度学习相关算法。语义分割则是对图片进行逐级分割后的小图片进行语义理解，用途主要为识别图片中的特定物体，卷积神经网络及其变体是当前语义分割的主流算法。

（2）语音识别

语音识别（Speech Recognition, SR）是将语音信号转化为电信号并进行一系列信号预处理后，对语音信号进行特征提取，将提取出的特征与数据库中的特征进行比对，最终识别出语言内容，这些基础的信号处理比对技术与人工智能相关性较小，在此不展开描述。当前语音识别的难点主要在于噪声的处理与模型的鲁棒性，实际应用中的噪声往往是持续存在的，其规律性往往难以确定，通常会干扰识别的结果。语音识别模型的鲁棒性也是当前的一大难题，在发出声音时的环境、情绪等因素都会对最终语音信号的生成产生很大的影响。因此，语音信号的噪声消除工作与处理模型鲁棒性的提升都需要机器学习来进行优化，当前应用比较广泛的方法是深度学习。

（3）自然语言处理

自然语言处理（Natural Language Processing, NLP）是指计算机处理文本语言并提取有效信息的过程，是人工智能中最为困难的问题之一。广义的自然语言处理也包括语音识别，但一般情况下自然语言处理仅指对文本进行处理。自然语言处理的主要的分析内容包括即语音分析、词法分析、句法分析、语义分析和语用分析，主要任务方向有分类、匹配、翻译、结构预测及序列决策等。统计自然语言处理运用了推测学、机率、统计的方法来解决容易出现高度模糊问题的长难句，当套用实际文法对长难句进行分析时会产生出成千上万中可能性，在进行消歧时通常会用到语料库比对以及机器学习和资数据挖掘等人工智能技术。

另外，由于不同模态的信息对不同类型词汇的贡献度不同，还发展出了动态可以分别针对词类和词汇的融合机制，对其不同模态赋予不同的权重，建立动态多模态模型，以更好地进行词汇表示。利用相关或相似词汇作为弱监督学习信号，让模型在学习相关或相似词汇的过程中，通过动态融合的多模态机制，对不同类型的词汇赋予不同的权重，可以在较大程度上提高词汇识别、处理和表示的质量[3]。

3. 知识图谱

知识图谱(knowledge graph, KG)是以图的形式表现客观世界中的实体(概念、人、事物)及其之间关系的知识库，现已发展成为语义搜索、智能问答、决策支持等智能服务的基础技术之一[4]。知识图谱可以理解为一张巨大的由多个节点构成的复杂版思维导图，如果图中有两个节点之间存在关系，他们就会被一条无向边连接在一起，这个节点就是实体（Entity），而它们之间的这条边就是关系（Relationship）。

知识图谱的架构主要包括逻辑结构和体系架构，逻辑结构可分为模式层与数据层两个层次，数据层主要是由一系列的事实组成，而知识将以事实为单位进行存储，知识数据以”实体-关系-实体”或”实体-属性属性值”的三元组形式存在，并以Neo4j、JanusGraph等图数据库作为存储介质。模式层构建在数据层之上，是知识图谱的概念模型和逻辑基础，对数据层进行规范和约束。模式层主要是通过本体库来规范数据层的一系列事实表达，本体是结构化知识库的概念模板，通过本体库而形成的知识库，具有层次结构强、冗余程度小等优点。体系结构指知识图谱构建模式的结构，大规模知识库的构建与应用需要多种智能信息处理技术的支持，这些技术即为知识图谱的核心技术，例如从数据中提取出实体、关系、属性等知识要素的知识抽取技术；消除实体、关系、属性等指称项与事实对象之间的歧义，形成高质量的知识库的知识融合技术；在已有的知识库基础上继续挖掘隐含的知识以扩展知识库的知识推理技术等。目前的知识图谱技术主要用于智能语义搜索、关联性追溯与深度问答系统等。

三、人工智能特征

1. 通用性

人工智能是机器的智能，能够完成复杂的智力任务，因此是一种通用性极高的技术。人工智能能够结合的应用场景及其广泛，包括制造、交通、医疗、政务、金融等大部分行业，并且可以与其他各种技术相互补充，有极强的技术溢出效应。

2. 过程不可知性

人工智能往往使用包含多个隐层的复杂算法模型，导致输入与输出的数据关系无法被明确解释，虽然算法模型输出的结果可以被验证是有效的，但算法的使用者只能被动接受这个结果，而无法对过程有清晰的理解。这就导致了人工智能像一个看不透的黑色箱子一样，大家对其内部情况全然不知，只知道输入与输出，却没有具体的过程。

3. 数据依赖性

数据是人工智能的基础，人工智能往往通过数据对规则进行学习，进而形成算法。那么数据的质量会很大程度上影响到人工智能算法，在人工智能的世界中，数据就是规则与规律的缩影，不完整或者倾向性明显的数据可能会导致算法出现问题，甚至导致人工智能的不可控。

四、人工智能发展趋势

1. 多模态学习

每一种信息的来源或者形式都可以称为是一种模态，广义的多模态可以是听觉、触觉、嗅觉等人类能够感知到的不同类型的信息，或者是压力、温度、电流、加速度等传感器探测到的不同类型的信息，而狭义的多模态可以是同一种大类下不同小类的信息，例如不同的语言、不同方式下的电流监测值、不同的温度单位等也都可以算是多模态信息。人就是典型的多模态学习者，因此人工智能的未来必然会与多模态学习相关。

人工智能下的多模态学习，顾名思义，是通过机器学习的方法实现处理和理解多源模态信息能力的一种技术。当前多模态的主要研究方向包括多模态表示学习、模态映射、模态对齐、多模态融合和协同学习等，其中表示学习是将原始数据转换成为能够被机器学习来有效开发的形式；模态映射是将一种模态的信息通过特定方式转换为另一种模态信息；模态对齐负责在来自同一个实例的不同模态信息的子集中寻找对应关系，以时间维度对齐与空间维度对齐为主；多模态融合主要是合并信息并处理信息的冗余，主要算法包括贝叶斯决策、稀疏表示和深度学习等。

2. 联邦学习

联邦学习最初的设计目标是为保证进行大数据交换时，在保障信息安全与个人隐私安全的前提下，多个参与方或者计算节点之间开展联合高效的学习。联邦学习本质上是一种分布式机器学习框架，但与广义的分布式学习的差别在于联邦学习中各分节点的数据不是独立同分布的，且分节点性能不同、通信连接不稳定。在实际应用中，分布式学习一般使用性能相似连接稳定的服务器群，联邦学习一般使用的是用户的是个人计算机或是移动端等设备。联邦学习目前有两种主要的框架，分别是客户端-服务器架构与对等网络架构。客户端-服务器架构中各个数据持有方根据自己的条件和规则在本地训练模型后，将脱敏后的参数汇总到中央服务器进行计算，完成计算后再下发回各个联邦学习参与方更新其本地的模型，直至全局模型达到较好的效果为止。对等网络架构中，各个联邦学习参与方之间可以直接进行通信，不需要借助第三方或是中心节点，整个系统的安全性更高，但也需要更多的通信成本。

当前的联邦学习的优化方向主要包括减少节点间连接次数的通信优化方向、避免分节点上传的特征被反推的隐私保护方向、客户端-服务器架构程的客户端攻击与服务器防御的鲁棒性优化方向、选择可靠客户端的客户端筛选方向以及异步聚合优化方向等。联邦学习能够解决数据流通性与数据隐私性之间的矛盾，打破数据孤岛并实现各组织之间的协作。随着技术的发展，联邦学习使用的模型已经不仅限于神经网络与深度学习，还包括联邦线性模型、联邦树模型、联邦支持向量机、等普通机器学习算法，其主要的发展趋势是基于人工智能协同计算和协作网络，优化分布式安全计算框架，继续解决节点之间联合建模的效率问题。

3. 迁移学习

迁移学习是把已训练好的模型（预训练模型）参数迁移到新的模型上，在新任务中帮助新模型的训练，可以通俗地理解为机器在有了一定学习能力的基础上，再继续学习相关领域的知识时会更加容易，所以通过迁移学习我们可以将已经学到的模型参数通过某种方式来分享给新模型，从而加快并优化模型的学习效率，不用像传统的网络那样从零学习。迁移学习中将已有的知识称为源域，将需要新学习的知识称为目标域，源域与目标域不相同但有一定的相似性。迁移学习利用源域或源任务中已有的知识来协助学习目标域或目标任务中的新知识，其关键就是找到源域与目标域或源任务与目标任务之间的共性，它们的共性涵盖样本实例、特征表达、网络架构或网络参数等方面。挖掘出这些共性之后，再进行知识迁移，得到一个新的模型，可以实现对目标域的样本进行分类或识别，并有效完成目标任务[5]。

迁移学习主要包括实例迁移学习方法、特征迁移学习方法、参数迁移学习方法和关系迁移学习方法四种方法[6]。实例迁移法的主要思想是根据某个相似度匹配原则从源域数据集中挑选出和目标域数据相似度比较高的实例，并把这些实例迁移到目标域中帮助目标域模型的学习；特征迁移法主要是在源域和目标域之间寻找典型特征代表来进一步弱化两个域之间的差异从而实现知识的跨领域迁移和复用；参数迁移法就是寻找源域数据和目标域数据之间可以共享的参数信息，从而可以把已获得的参数知识迁移；关系迁移法假定源域数据之间的关系和目标域数据之间的关系存在一定的相关性，通过建立源域数据的关系模型与目标域数据的关系模型的映射模型来实现关系知识的迁移。当前迁移学习主要是基于有监督学习进行，随着深度学习在无监督和半监督领域的应用越来越广泛，深度迁移学习算法正在逐步发展。

4. 可解释机器学习

人工智能的过程不可知性，使人工智能在一些领域的应用受到了很多限制，例如基于人工智能的信贷决策并没有直接提供决策的具体依据，在信贷申请方对信贷决策方提出异议时，信贷决策方因无法提供有效的解释而可能会面临官司或者监管机构的质询。若要获得人工智能模型的”解释”，要先理解机器学习模型的方法，并确定模型解释方法的标准以及模型的解释范围。除此之外，可理解性和可解释性这两个专业术语经常需要注意区分，可理解性主要是指向人类提供可理解的能力，多指代原模型即可理解，而可解释性指使用解释作为人类和智能模型之间的接口，作为模型代理能够被人类所理解，倾向于指代原模型不可理解，而需要构造事后模型进行解释[7]。

可解释机器学习（Interpretable Machine Learning, IML）分为全局可解释与局部可解释两种，局部可解释主要关注某个节点的特征变化，并分析其影响周围局部区域其他节点的结果以获取局部特征空间的因果变化，目前已经取得了部分进展。全局可解释需要理解模型的结构和各个组成部分如何发挥作用，以及模型的子集如何影响整个模型的决策。机器学习模型的维数通常较高，这就导致了全局解释实现困难，但实现全局可解释是可解释机器学习最终的实现目标，未来需要重点在此领域进行突破。

[1] 中国信息通信研究院.人工智能标准化白皮书(2018年) [M].中国信息通信研究院.2018.

[2] 斯图尔特·罗素.人工智能:一种现代的方法[M].人民邮电出版社.2010.

[3] 杨涛,贲圣林,杨东,宋科,刘勇.中国金融科技运行报告(2020)[M].北京:社会科学文献出版社,2020:29-30.

[4] 黄恒琪,于娟,廖晓,席运江.知识图谱研究综述[J].计算机系统应用,2019,28(06):1-12.

[5] 朱应钊.异构迁移学习研究综述[J].电信科学,2020,36(03):100-110.

[6] 王惠.迁移学习研究综述[J].电脑知识与技术,2017,13(32):203-205.

[7] 孔祥维,唐鑫泽,王子明.人工智能决策可解释性的研究综述[J/OL].系统工程理论与实践:1-20[2021-03-08].http://kns.cnki.net/kcms/detail/11.2267.N.20201116.1422.002.html.

你可能感兴趣的:(金融科技基础,人工智能,科技)

如何在 Fork 的 GitHub 项目中保留自己的修改并同步上游更新？github_fork_update iBaoxing github
如何在Fork的GitHub项目中保留自己的修改并同步上游更新？在GitHub上Fork了一个项目后，你可能会对项目进行一些修改，同时原作者也在不断更新。如果想要在保留自己修改的基础上，同步原作者的最新更新，很多人会不知所措。本文将详细讲解如何在不丢失自己改动的情况下，将上游仓库的更新合并到自己的仓库中。问题描述假设你在GitHub上Fork了一个项目，并基于该项目做了一些修改，随后你发现原作者对
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
高端密码学院笔记285 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（598）期《幸福》之回归内在深层生命原动力基础篇——揭秘“激励”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:成功=艰苦劳动+正确方法+少说空话。贪图省力的船夫，目标永远下游。智者的梦再美，也不如愚人实干的脚印。幸福早课堂2020.10.16星期五一笔记:1，重视和珍惜的前提是知道它的价值非常重要，当你珍惜了，你就真正定下来，真正的学到身上。2，大家需要
2020-04-12每天三百字之连接与替代冷眼看潮
不知道是不是好为人师，有时候还真想和别人分享一下我对某些现象的看法或者解释。人类社会不断发展进步的过程，就是不断连接与替代的过程。人类发现了火并应用火以后，告别了茹毛饮血的野兽般的原始生活（火烧、烹饪替代了生食）人类用石器代替了完全手工，工具的使用使人类进步一大步。类似这样的替代还有很多，随着科技的发展，有更多的原始的事物被替代，代之以更高效、更先进的技术。在近现代，汽车替代了马车，高速公路和铁路
从0到500+，我是如何利用自媒体赚钱？一列脚印
运营公众号半个多月，从零基础的小白到现在慢慢懂了一些运营的知识。做好公众号是很不容易的，要做很多事情；排版、码字、引流…通通需要自己解决，业余时间全都花费在这上面涨这么多粉丝是真的不容易，对比知乎大佬来说，我们这种没资源，没人脉，还没钱的小透明来说，想要一个月涨粉上万，怕是今天没睡醒（不过你有的方法，算我piapia打脸）至少我是清醒的，自己慢慢努力，实现我的万粉目标！大家快来围观、支持我吧！孩子
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
数组去重好奇的猫猫猫
整理自js中基础数据结构数组去重问题思考？如何去除数组中重复的项例如数组：[1,3,4,3,5]我们在做去重的时候，一开始想到的肯定是，逐个比较，外面一层循环，内层后一个与前一个一比较，如果是久不将当前这一项放进新的数组，挨个比较完之后返回一个新的去过重复的数组不好的实践方式上述方法效率极低，代码量还多，思考？有没有更好的方法这时候不禁一想当然有了！！！hashtable啊，通过对象的hash办法
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
大伟说成语之唉声叹气求索大伟
＊大伟说成语＊【唉声叹气】叹气：因心里不痛快或不如意而吐出长气，发出声音。因为痛苦、憋闷或感伤而发出叹息的声音。【大伟说】情绪外露，非人类所特有，动物亦有情绪，悲哀和欢乐所表示的情绪亦是不一样的，会嗷嗷大叫也会低吟痛哭。不同的是，人类的情绪更复杂，更多样，更丰富。唉声叹气，可以说是最基础的情绪，因为无奈而举足无措，不知该如何如何化解，只有独自一人慢慢承受，长吁短叹不知如何是好，其实是无能无力的表现
Python快速入门 —— 第三节：类与对象孤华暗香 Python快速入门 python 开发语言
第三节：类与对象目标：了解面向对象编程的基础概念，并学会如何定义类和创建对象。内容：类与对象：定义类：class关键字。类的构造函数：__init__()。类的属性和方法。对象的创建与使用。示例：classStudent:def__init__(self,name,age,major):self.name&#
MongoDB Oplog 窗口喝醉酒的小白 MongoDB 运维
在MongoDB中，oplog（操作日志）是一个特殊的日志系统，用于记录对数据库的所有写操作。oplog允许副本集成员（通常是从节点）应用主节点上已经执行的操作，从而保持数据的一致性。它是MongoDB副本集实现数据复制的基础。MongoDBOplog窗口oplog窗口是指在MongoDB副本集中，从节点可以用来同步数据的时间范围。这个窗口通常由以下因素决定：Oplog大小：oplog的大小是有限
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
数据仓库——维度表一致性墨染丶eye 背诵数据仓库
数据仓库基础笔记思维导图已经整理完毕，完整连接为：数据仓库基础知识笔记思维导图维度一致性问题从逻辑层面来看，当一系列星型模型共享一组公共维度时，所涉及的维度称为一致性维度。当维度表存在不一致时，短期的成功难以弥补长期的错误。维度时确保不同过程中信息集成起来实现横向钻取货活动的关键。造成横向钻取失败的原因维度结构的差别，因为维度的差别，分析工作涉及的领域从简单到复杂，但是都是通过复杂的报表来弥补设计
高级 ECharts 技巧：自定义图表主题与样式 SnowMan1993 echarts 信息可视化数据分析
ECharts是一个强大的数据可视化库，提供了多种内置主题和样式，但你也可以根据项目的设计需求，自定义图表的主题与样式。本文将介绍如何使用ECharts自定义图表主题，以提升数据可视化的吸引力和一致性。1.什么是ECharts主题？ECharts的主题是指定义图表样式的配置项，包括颜色、字体、线条样式等。通过预设主题，你可以快速更改图表的整体风格，而自定义主题则允许你在此基础上进行个性化设置。2.
01-Git初识 Meereen Git git
01-Git初识概念：一个免费开源，分布式的代码版本控制系统，帮助开发团队维护代码作用：记录代码内容。切换代码版本，多人开发时高效合并代码内容如何学：个人本机使用：Git基础命令和概念多人共享使用：团队开发同一个项目的代码版本管理Git配置用户信息配置：用户名和邮箱，应用在每次提交代码版本时表明自己的身份命令：查看git版本号git-v配置用户名gitconfig--globaluser.name
ARM驱动学习之基础小知识 JT灬新一 ARM 嵌入式 arm开发学习
ARM驱动学习之基础小知识•sch原理图工程师工作内容–方案–元器件选型–采购（能不能买到，价格）–原理图（涉及到稳定性）•layout画板工程师–layout（封装、布局，布线，log）（涉及到稳定性）–焊接的一部分工作（调试阶段板子的焊接）•驱动工程师–驱动，原理图，layout三部分的交集容易发生矛盾•PCB研发流程介绍–方案，原理图(网表)–layout工程师（gerber文件）–PCB板
Rust基础知识 GRKF15 rust 开发语言后端
1.Rust语言简介1.1基础语法变量声明：let关键字用于声明变量，可以指定或不指定类型，如leta=10;和letmutc=30i32;。函数定义：使用fn关键字定义函数，并指定参数类型及返回类型，如fnadd(i:i32,j:i32)->i32{i+j}。控制流：包括if、else等，控制语句后需要使用;来结束语句。1.2数据类型整数类型：i8、i16、i32、i64、i128，以及无符号的
2019-11-04复盘——飞来山上千寻塔，闻说鸡鸣见日升。那一叶秋
1、大盘篇先上老图，看习惯了，也就知道走势了图1上证指数日线图还是那张老图，自己可以在自己的相关软件上画出来，快变盘了。2、个股篇未加仓、未减仓。分析量能的时候，突然发现这么一个东西：“放量突破年线，缩量回调。”合众科技日线图其实，最近的N只个股，在技术分析上，都到了变盘的临界时候。结合这么久的走势，特别是ZJH不断放开IPO的申请，本质上说是融资难度变大，或者说是为企业的融资开创便利。但现在市场
福袋生活邀请码在哪里填写，福袋生活app邀请码使用教程小小编007
很多人下载福袋生活后，注册使用时需要填写邀请码。因为福袋生活是注册邀请制，所以首次使用填写邀请码才可以正常登录使用。福袋生活是广州市福袋生活信息科技有限公司旗下一家多元化社交电商导购平台，以APP为载体，社群为媒介，汇集衣食住行、吃喝玩乐生活服务板块，使用福袋生活可以领到淘宝，拼多多等电商平台的商品优惠券和返利，还可以兼职去分享赚钱。我为什么从福袋生活转到果冻宝盒呢？当然是因为福袋生活返利更高，注
18、架构-可观测性之聚合度量大树~~ 架构 java python 后端架构
聚合度量聚合度量是指对系统运行时产生的各种指标数据进行收集、聚合和分析，以了解系统的健康状况和性能表现。聚合度量是可观测性的关键组成部分，通过对度量数据的分析，可以及时发现系统中的异常和瓶颈。以下是对聚合度量各个方面的详细解析，并结合具体的数据案例和技术支撑。指标收集收集系统运行时产生的各种指标数据是聚合度量的基础。常见的指标包括CPU使用率、内存使用率、请求处理时间、请求数、错误率等。以下是指标
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
如何选择最适合你的项目研发管理软件？TAPD卓越版全面解析北京云巴巴信息技术有限公司产品经理需求分析
在当今快速发展的科技时代，项目研发管理软件已成为企业不可或缺的重要工具。面对市场上琳琅满目的产品，如何选择一款适合自己团队的项目研发管理软件呢？本文将围绕项目研发管理软件的选择标准，重点介绍TAPD卓越版的特点、优势以及使用体验，让你更好地理解和选择适合自己的项目研发管理软件。项目研发管理软件的选择标准在选择项目研发管理软件时，我们需要考虑以下几个方面的因素：功能全面性：软件是否覆盖了从需求管理、
OPENAIGC开发者大赛企业组AI黑马奖 | AIGC数智传媒解决方案 RPA中国人工智能 AIGC 传媒
在第二届拯救者杯OPENAIGC开发者大赛中，涌现出一批技术突出、创意卓越的作品。为了让这些优秀项目被更多人看到，我们特意开设了优秀作品报道专栏，旨在展示其独特之处和开发者的精彩故事。无论您是技术专家还是爱好者，希望能带给您不一样的知识和启发。让我们一起探索AIGC的无限可能，见证科技与创意的完美融合！创未来AI应用赛-企业组AI黑马奖作品名称：AIGC数智传媒解决方案参赛团队：深圳市三象智能技术
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
ExpRe[25] bash外的其它shell：zsh和fish tritone ExpRe bash linux ubuntu shell
文章目录zsh基础配置实用特性插件`autojump`语法高亮自动补全fish优点缺点时效性本篇撰写时间为2021.12.15，由于计算机技术日新月异，博客中所有内容都有时效和版本限制，具体做法不一定总行得通，链接可能改动失效，各种软件的用法可能有修改。但是其中透露的思想往往是值得学习的。本篇前置：ExpRe[10]Ubuntu[2]准备神秘软件、备份恢复软件https://www.cnblogs
JAVA中的Enum 周凡杨 java enum 枚举
Enum是计算机编程语言中的一种数据类型---枚举类型。在实际问题中，有些变量的取值被限定在一个有限的范围内。例如，一个星期内只有七天我们通常这样实现上面的定义： public String monday; public String tuesday; public String wensday; public String thursday
赶集网mysql开发36条军规 Bill_chen mysql 业务架构设计 mysql调优 mysql性能优化
(一)核心军规 (1)不在数据库做运算 cpu计算务必移至业务层； (2)控制单表数据量 int型不超过1000w，含char则不超过500w；合理分表；限制单库表数量在300以内； (3)控制列数量字段少而精，字段数建议在20以内
Shell test命令 daizj shell 字符串 test 数字文件比较
Shell test命令 Shell中的 test 命令用于检查某个条件是否成立，它可以进行数值、字符和文件三个方面的测试。数值测试参数说明 -eq 等于则为真 -ne 不等于则为真 -gt 大于则为真 -ge 大于等于则为真 -lt 小于则为真 -le 小于等于则为真实例演示： num1=100 num2=100if test $[num1]
XFire框架实现WebService(二) 周凡杨 java webservice
有了XFire框架实现WebService(一)，就可以继续开发WebService的简单应用。 Webservice的服务端(WEB工程)：两个java bean类： Course.java package cn.com.bean; public class Course { private
重绘之画图板朱辉辉33 画图板
上次博客讲的五子棋重绘比较简单，因为只要在重写系统重绘方法paint（）时加入棋盘和棋子的绘制。这次我想说说画图板的重绘。画图板重绘难在需要重绘的类型很多，比如说里面有矩形，园，直线之类的，所以我们要想办法将里面的图形加入一个队列中，这样在重绘时就
Java的IO流西蜀石兰 java
刚学Java的IO流时，被各种inputStream流弄的很迷糊，看老罗视频时说想象成插在文件上的一根管道，当初听时觉得自己很明白，可到自己用时，有不知道怎么代码了。。。每当遇到这种问题时，我习惯性的从头开始理逻辑，会问自己一些很简单的问题，把这些简单的问题想明白了，再看代码时才不会迷糊。 IO流作用是什么？答：实现对文件的读写，这里的文件是广义的； Java如何实现程序到文件
No matching PlatformTransactionManager bean found for qualifier 'add' - neither 林鹤霄
java.lang.IllegalStateException: No matching PlatformTransactionManager bean found for qualifier 'add' - neither qualifier match nor bean name match! 网上找了好多的资料没能解决，后来发现：项目中使用的是xml配置的方式配置事务，但是
Row size too large (> 8126). Changing some columns to TEXT or BLOB aigo column
原文：http://stackoverflow.com/questions/15585602/change-limit-for-mysql-row-size-too-large 异常信息： Row size too large (> 8126). Changing some columns to TEXT or BLOB or using ROW_FORMAT=DYNAM
JS 格式化时间 alxw4616 JavaScript
/** * 格式化时间 2013/6/13 by 半仙 [email protected] * 需要 pad 函数 * 接收可用的时间值. * 返回替换时间占位符后的字符串 * * 时间占位符:年 Y 月 M 日 D 小时 h 分 m 秒 s 重复次数表示占位数 * 如 YYYY 4占4位 YY 占2位<p></p> * MM DD hh mm
队列中数据的移除问题百合不是茶队列移除
队列的移除一般都是使用的remov();都可以移除的,但是在昨天做线程移除的时候出现了点问题,没有将遍历出来的全部移除, 代码如下; // package com.Thread0715.com; import java.util.ArrayList; public class Threa
Runnable接口使用实例 bijian1013 java thread Runnable java多线程
Runnable接口 a. 该接口只有一个方法：public void run(); b. 实现该接口的类必须覆盖该run方法 c. 实现了Runnable接口的类并不具有任何天
oracle里的extend详解 bijian1013 oracle 数据库 extend
扩展已知的数组空间，例： DECLARE TYPE CourseList IS TABLE OF VARCHAR2(10); courses CourseList; BEGIN -- 初始化数组元素，大小为3 courses := CourseList('Biol 4412 ', 'Psyc 3112 ', 'Anth 3001 '); --
【httpclient】httpclient发送表单POST请求 bit1129 httpclient
浏览器Form Post请求浏览器可以通过提交表单的方式向服务器发起POST请求，这种形式的POST请求不同于一般的POST请求 1. 一般的POST请求，将请求数据放置于请求体中，服务器端以二进制流的方式读取数据，HttpServletRequest.getInputStream()。这种方式的请求可以处理任意数据形式的POST请求，比如请求数据是字符串或者是二进制数据 2. Form
【Hive十三】Hive读写Avro格式的数据 bit1129 hive
1. 原始数据 hive> select * from word; OK 1 MSN 10 QQ 100 Gtalk 1000 Skype 2. 创建avro格式的数据表 hive> CREATE TABLE avro_table(age INT, name STRING)STORE
nginx+lua+redis自动识别封解禁频繁访问IP ronin47
在站点遇到攻击且无明显攻击特征，造成站点访问慢，nginx不断返回502等错误时，可利用nginx+lua+redis实现在指定的时间段内，若单IP的请求量达到指定的数量后对该IP进行封禁，nginx返回403禁止访问。利用redis的expire命令设置封禁IP的过期时间达到在指定的封禁时间后实行自动解封的目的。一、安装环境： CentOS x64 release 6.4(Fin
java-二叉树的遍历-先序、中序、后序（递归和非递归）、层次遍历 bylijinnan java
import java.util.LinkedList; import java.util.List; import java.util.Stack; public class BinTreeTraverse { //private int[] array={ 1, 2, 3, 4, 5, 6, 7, 8, 9 }; private int[] array={ 10,6,
Spring源码学习-XML 配置方式的IoC容器启动过程分析 bylijinnan java spring IOC
以FileSystemXmlApplicationContext为例，把Spring IoC容器的初始化流程走一遍： ApplicationContext context = new FileSystemXmlApplicationContext ("C:/Users/ZARA/workspace/HelloSpring/src/Beans.xml&q
[科研与项目]民营企业请慎重参与军事科技工程 comsci 企业
军事科研工程和项目并非要用最先进，最时髦的技术，而是要做到“万无一失” 而民营科技企业在搞科技创新工程的时候，往往考虑的是技术的先进性，而对先进技术带来的风险考虑得不够，在今天提倡军民融合发展的大环境下，这种“万无一失”和“时髦性”的矛盾会日益凸显。。。。。。所以请大家在参与任何重大的军事和政府项目之前，对
spring 定时器-两种方式 cuityang spring quartz 定时器
方式一：间隔一定时间运行 <bean id="updateSessionIdTask" class="com.yang.iprms.common.UpdateSessionTask" autowire="byName" /> <bean id="updateSessionIdSchedule
简述一下关于BroadView站点的相关设计 damoqiongqiu view
终于弄上线了，累趴，戳这里http://www.broadview.com.cn 简述一下相关的技术点前端：jQuery+BootStrap3.2+HandleBars，全站Ajax（貌似对SEO的影响很大啊！怎么破？），用Grunt对全部JS做了压缩处理，对部分JS和CSS做了合并（模块间存在很多依赖，全部合并比较繁琐，待完善）。后端：U
运维 PHP问题汇总 dcj3sjt126com windows2003
1、Dede(织梦)发表文章时,内容自动添加关键字显示空白页解决方法：后台>系统>系统基本参数>核心设置>关键字替换（是/否），这里选择“是”。后台>系统>系统基本参数>其他选项>自动提取关键字，这里选择“是”。 2、解决PHP168超级管理员上传图片提示你的空间不足网站是用PHP168做的，反映使用管理员在后台无法
mac 下安装php扩展 - mcrypt dcj3sjt126com PHP
MCrypt是一个功能强大的加密算法扩展库，它包括有22种算法，phpMyAdmin依赖这个PHP扩展，具体如下：下载并解压libmcrypt-2.5.8.tar.gz。在终端执行如下命令： tar zxvf libmcrypt-2.5.8.tar.gz cd libmcrypt-2.5.8/ ./configure --disable-posix-threads --
MongoDB更新文档 [四] eksliang mongodb Mongodb更新文档
MongoDB更新文档转载请出自出处：http://eksliang.iteye.com/blog/2174104 MongoDB对文档的CURD，前面的博客简单介绍了，但是对文档更新篇幅比较大，所以这里单独拿出来。语法结构如下： db.collection.update( criteria, objNew, upsert, multi) 参数含义参数
Linux下的解压，移除，复制，查看tomcat命令 y806839048 tomcat
重复myeclipse生成webservice有问题删除以前的，干净 1、先切换到：cd usr/local/tomcat5/logs 2、tail -f catalina.out 3、这样运行时就可以实时查看运行日志了 Ctrl+c 是退出tail命令。有问题不明的先注掉 cp /opt/tomcat-6.0.44/webapps/g
Spring之使用事务缘由(3-XML实现) ihuning spring
用事务通知声明式地管理事务事务管理是一种横切关注点。为了在 Spring 2.x 中启用声明式事务管理，可以通过 tx Schema 中定义的 <tx:advice> 元素声明事务通知，为此必须事先将这个 Schema 定义添加到 <beans> 根元素中去。声明了事务通知后，就需要将它与切入点关联起来。由于事务通知是在 <aop:
GCD使用经验与技巧浅谈啸笑天 GC
前言 GCD(Grand Central Dispatch)可以说是Mac、iOS开发中的一大“利器”，本文就总结一些有关使用GCD的经验与技巧。 dispatch_once_t必须是全局或static变量这一条算是“老生常谈”了，但我认为还是有必要强调一次，毕竟非全局或非static的dispatch_once_t变量在使用时会导致非常不好排查的bug，正确的如下： 1
linux（Ubuntu）下常用命令备忘录1 macroli linux 工作 ubuntu
在使用下面的命令是可以通过--help来获取更多的信息1,查询当前目录文件列表：ls ls命令默认状态下将按首字母升序列出你当前文件夹下面的所有内容，但这样直接运行所得到的信息也是比较少的，通常它可以结合以下这些参数运行以查询更多的信息： ls / 显示/.下的所有文件和目录 ls -l 给出文件或者文件夹的详细信息 ls -a 显示所有文件，包括隐藏文
nodejs同步操作mysql qiaolevip 学习永无止境每天进步一点点 mysql nodejs
// db-util.js var mysql = require('mysql'); var pool = mysql.createPool({ connectionLimit : 10, host: 'localhost', user: 'root', password: '', database: 'test', port: 3306 });
一起学Hive系列文章 superlxw1234 hive Hive入门
[一起学Hive]系列文章目录贴，入门Hive，持续更新中。 [一起学Hive]之一—Hive概述，Hive是什么 [一起学Hive]之二—Hive函数大全-完整版 [一起学Hive]之三—Hive中的数据库(Database)和表(Table) [一起学Hive]之四-Hive的安装配置 [一起学Hive]之五-Hive的视图和分区 [一起学Hive
Spring开发利器：Spring Tool Suite 3.7.0 发布 wiselyman spring
Spring Tool Suite(简称STS)是基于Eclipse，专门针对Spring开发者提供大量的便捷功能的优秀开发工具。在3.7.0版本主要做了如下的更新：将eclipse版本更新至Eclipse Mars 4.5 GA Spring Boot(JavaEE开发的颠覆者集大成者，推荐大家学习)的配置语言YAML编辑器的支持(包含自动提示，