Liangjun_Feng

机器学习教程之独立成分分析：PCA的高阶版

有好些天没写博客了，最近一直忙着在看论文，解模型，着实有点头痛。今天趁着又到周末了更一帖（其实是模型解不下去了…），这次来说一下一个在信号分析与数据挖掘领域颇为使实用的算法，独立成分分析（ICA），这个算法的求解方式会让人决定新奇而有所启发，可能会给你带来新的思路，这一篇算法已经有很多大神写过了，比如：
http://blog.csdn.net/neal1991/article/details/45128193
http://blog.csdn.net/u013802188/article/details/40923749
我在这里略作补充，说一下自己的见解，有不合适的地方欢迎大家指出

ICA的起源与最初的目标
独立成分分析的经典假设
中心极限定理的解释——非高斯即独立！
独立成分分析无法确定的因素
独立成分分析的数据预处理
ICA问题的经典解法，FastICA
python-sklearn中的FastICA应用实例

一、ICA的起源与最初的目标

独立成分分析最初所希望解决的是极为复杂与困难的鸡尾酒问题：
在一场鸡尾酒舞会上，有两个人在同时讲话，在房间的不同位置有两个麦克风，而每个麦克风记录下的是两个人声音的混合。问题是：如何利用麦克风的混合声音信息来获得每个讲话者所说的话。
现在我们用x1,x2表示我们观测到的混合声音,s1,s2表示说话者发出的源信号，称为独立成分，则我们可以将鸡尾酒问题表示为

转化为矩阵表示为

其中的A表示混合信号是由独立成分线性组合成的，称A为混合矩阵。通过上式我们可以发现我们需要通过已知的X去推导未知的混合矩阵A和S，这是非常困难的，事实上，如果没有后续强有力的假设，鸡尾酒问题根本无法求解，因为我们不知道关于原独立成分S的任何信息，鸡尾酒这一类问题也被抽象称为盲源分离问题。

二、独立成分分析的经典假设

在上一节中已经说明，如果不做出一些强有力的假设和分析，是无法直接求解盲源分离问题的，为了实现独立成分分析，ICA给出了一下三个假设条件

各个成分之间是相互统计独立的
这是ICA的一个最基本也是最重要的原则，非常有趣的是一旦给出了这个假设，我们便可以通过一定的方式求解这个模型。对此的解释是，如果任意的随机变量序列（x1,x2,…,xn）之间是相互统计独立的，则这就意味着我们不能从其余的变量中获得随机变量xj的任何信息。
随机变量之间的独立性可以通过概率密度来精确刻画，用p(x1,x2,…,xn)表示xi之间的联合概率密度，当xi之间满足下列等式的时候，我们就说，xi是相互统计独立的
独立成分是服从非高斯分布的
ICA要求随机变量服从非高斯分布的原因在于，高斯分布的随机变量就有高阶累积量为零的特性，而对于独立成分分析而言，高阶信息是实现独立成分分析的本质因素。一般的在标准的独立成分分析中最多只允许有一个成分服从高斯分布，因此我们也经常可以使用ICA作为一种去除高斯噪声的手段
假设混合矩阵A是方阵
这一假设是对于标准的独立成分分析而言，这一假设意味着独立成分的个数等于观测信号的个数，从而进一步假设混合矩阵A是可逆的，这可以使得计算简化，求混合矩阵A等价于求它的逆矩阵，原独立信号S可以通过下式得到

当做出一场三个假设之后，我们便可以求解混合矩阵A还有独立成分X，也就是说独立成分分析是可实现的。对于第三个假设，在一些改进算法中可以适当放宽

三、中心极限定理的解释——非高斯即独立！

本文中将要给出的一种ICA模型的解法是基于非高斯性极大化的思想来进行求解的，这里首先描述一下这种解法的思路：
在概率论中，有一个被称为中心极限定理的经典结果，其内容十分简洁明了，是说，在一定条件下，相互统计独立的随机变量的和的分布趋向于高斯分布。对于这一定理，我们可以这样理解，两个相互统计独立的随机变量的和比其中任何一个参与求和的随机变量更加靠近高斯分布。对于标准的独立成分分析模型，独立成分的估计可以通过寻找混合变量正确的线性组合来实现，为了估计一个独立成分，我们考虑观测信号xi的线性组合，有下式

其中bi是我们需要求解的混合向量，又在上式中将x以s表示，我们可以得到

通过这一公式，我们可以看出，如果bT是混合矩阵A的逆矩阵的某一行时，则线性组合bTx实际上就是一个独立成分，因此，在向量q中只能有一个元素为1，其余元素均值为0。同时，又因为qTs = bTx，我们可以求解最优向量b使得bTx的非高斯性极大化，此时的y便为我们所求的独立成分，而为了达到这一目的，我们必须有一种度量随机变量非高斯性的度量，在我们即将讲述的FastICA算法中，使用的是负熵这标准，对于负熵这一概念，我会在讲解FastICA的第六章节详细介绍

四、独立成分分析无法确定的因素

尽管我们建立了盲源分离问题的数学模型，同时还针对模型给出了一系列充分的假设，但是仍然有一些因素是无法在求解过程中确定的

不能确定独立成分的方差（能量）
原因是很明显的，由于混合矩阵和独立成分都是未知的，如果对独立成分乘上某个标量ai ！= 0，同时对混合矩阵相应的列除以一个相同的标量ai，则不影响混合信号的值

因此在独立成分分析算法中，可以固定独立成分的方差，由于独立成分是随机变量，则最自然的方法就是假设独立成分具有单位方差，即E(si^2) = 1，在实际构造这个算法时，往往会考虑这个约束，但这仍不能确定每个独立成分的符号，这是因为当每个独立成分都乘-1后不改变原有模型
不能确定独立成分的顺序
我们可以通过一个置换矩阵来具体说明这个问题，假设P是一个置换矩阵，

这时矩阵Ps就是新的独立成分，他只是与原先的独立成分具有不同的排列顺序。相应的矩阵A（P-1）就是新的混合矩阵，同样的它的每一列只是与矩阵A具有不同的顺序
当然，在独立成分分析的绝大多数应用中，这两个不确定性并不是十分重要，用ICA算法所得到的解能够满足相当多的实际应用，所得到的源信号的幅度和排序对于通常所考虑的问题影响不大，所以我们可以说独立成分分析所求的的解是波形保持解

这里从2000年Hyvarinen提出FastICA算法的论文中截取一些FastICA的应用案例，向大家说明独立成分分析的使用效果与原理

1、信号分离

两组源信号

所观测的混合信号

FastICA分离信号

2、图像滤波

以上四张图从左到右，从上到下分别为：原图像、施加噪声的图像、使用ICA滤波的图像、使用稀疏编码滤波的图像

3、Hyvarinen对于ICA算法的描述

在论文中Hyvarinen这样描述他对ICA的理解，对于两组相互独立的随机变量，它们的联合分布如下

在上图的分布中，我们无法从一个点获得另一个点的任何信息。这两组随机分布点的线性叠加后的分布为

而我们使用ICA模型估计的混合矩阵A实际上就是由上图四边形的边所指向的方向所代表的向量组成，而两个高斯变量线性叠加后是怎样的呢？

它没有任何的边缘信息，因此，我们也就无从对混合矩阵A进行估计。使用ICA对两个非高斯变量解混之后我们可以得到如下

五、独立成分分析的数据预处理

数据的中心化
不失一般性的，我们可以假设混合变量和独立成分都是零均值的。这个假设在相当程度上简化了算法，如果零均值并不成立，我们可以通过预处理，即减去平均值，来达到这个条件。原始的观测混合数据x’可以通过下式进行预处理

这样，因为有

所以独立成分也是零均值的，混合矩阵在预处理前后保持不变，因此我们可以进行中心化而不影响混合矩阵的估计。对于零均值的数据，在用算法估计出混合矩阵和独立成分之后，剪掉的均值可以通过将（A-1）E{x’}加到零均值的独立成分上来进行重构
数据白化
白化的随机向量y指的是它的各分量是不相关的，并且具有单位方差。换句话说，随机向量y的协方差矩阵是单位阵，即 E{yyT} = I,白化意味着我们将观测数据向量x进行线性变换 z = Vx ，使得新向量是白化的随机向量，白化有时也称为球化
白化变换有一种使用特征值分解（EVD）的简便方法，V的获取公式如下

六、ICA问题的经典解法，FastICA

好了，说了这么多，我终于要开始介绍ICA模型的解法了，这里是用的是一种使用负熵作为非高斯性度量的定点迭代解法（敲黑板）

1、负熵

负熵是基于信息论中熵的概念，而随机变量的熵与它所给出的信息有关，随机变量越是没有结构，越无序，它的熵越大。密度函数为py(T)的随机变量y的熵定义为

则负熵定义为

其中ygauss表示服从高斯分布的随机变量，且与随机变量y具有相同的方差。信息论中的一个重要的结果是说，在所有相同方差的随机变量中，高斯随机变量具有最大的熵，因此，负熵总是非负的，当且仅当随机变量y服从高斯分布时，负熵为零。负熵作为非高斯性的度量是一个非常好的标准，因为它在某些判据下是非高斯性的最优估计器。但因为负熵的计算需要求累计分布，比较复杂，因此FastICA给出了负熵的估计式

2.FastICA的单个独立成分解法

我们首先说一下在混合矩阵A中，单个混合向量的求解过程，然后再给出多个混合向量同步求解的计算方法

    1.选择一个初始随机向量W
    2.使用 W(n+1) = E{xg(W(n)Tx)} - E{g'(W(n)Tx)}W(n)更新W
    3.使用W = W/||W||使W方差单位化
    4.如果没有收敛，则返回第二步

这里的收敛指得是W不在变化，更新后仍指向同一个方向，关于更新公式的求解方法，是从以非高斯性极大化为目标的目标函数通过拉格朗日乘子法与牛顿迭代法得到的，具体的推导这里不再赘述。上面迭代过程中使用的函数g()通常选用为

上式的a1常数取值为1～2

3.FastICA多个独立成分同时求解

FastICA多个独立同时求解，其实就是在迭代时同时对多个初始向量进行更新迭代。但要注意的一点是，为了避免有向量同时收敛到同一个最优值，在每次更新结束后，我们需要对得到的新向量做去相关操作，比较简单的方法是使用Gram-Schmidt-like正交化方法。到这里为止我们便可以实现对盲源分离问题的求解

七、python-sklearn中的FastICA应用实例

在python的sklearn库中有现成的FastICA函数，使用方式如下

from sklear.decomposition import FastICA   #导入函数

ica = FastICA(conponents = 70) #conponents为独立元个数，如果不设置默认为训练的样本数
dataICA = ica.fit_transform(data) #拟合并转化数据为独立成分
dataICA2 = ica.transform(data2)   #使用拟合好的ica转化另一份数据为独立成份

将ICA用于语音分离的python实例代码：https://github.com/LiangjunFeng/Machine-Learning/blob/master/9.FastICA.py

语音数据下载地址：
语音1：https://github.com/LiangjunFeng/Machine-Learning/blob/master/pic/ICA/LDC2017S07.clean.wav
语音2：https://github.com/LiangjunFeng/Machine-Learning/blob/master/pic/ICA/LDC2017S10.scaled.wav
语音3：https://github.com/LiangjunFeng/Machine-Learning/blob/master/pic/ICA/LDC93S1.wav
语音4、语音5为噪声信号

初始信号、混合信号、FastICA分离信号依次为：

常州 d8 Rikka's_qwq 算法 c++学习
好难啊哈哈哈大家考得好像都不是很好中午刚出成绩就发了动态了我也真是被自己无语到了t1测试样例时输出的数据没注释掉爆零t2freopen注释掉了爆零啊哈哈t1虽然我写的是最朴素的做法...但好歹能骗40分呢给我炸了正解是这样的#include#defineintlonglong#definedoublelongdouble#definephi(sqrt(5)+1)/2usingnamespacest
hive 使用oracle数据库 sardtass hadoop hive 开源项目
hive使用oracle作为数据源，导入数据使用sqoop或kettle或自己写代码（淘宝的开源项目中有一个xdata就是淘宝自己写的）。感觉sqoop比kettle快多了，淘宝的xdata没用过。hive默认使用derby作为存储表信息的数据库，默认在哪启动就在哪建一个metadata_db文件放数据，可以在conf下的hive-site.xml中配置为一个固定的位置，这样不论在哪启动都可以了。
5个冷门的Adobe系列软件小技巧 reddingtons adobe
在当今数字化时代，许多学生和教育工作者可以利用教育邮箱免费访问Adobe全系列软件。这意味着您不仅可以使用Photoshop、Illustrator等热门软件，还可以体验Adobe的其他强大工具。由于这些技巧涉及到一些收费软件，因此免费用户可能无法使用。接下来，我们将分享五个冷门的Adobe系列软件小技巧，希望能帮助您更好地利用这些工具。1.在AdobeAcrobat中添加水印在处理PDF文件时，
补偿算法之相位补偿算法傻童:CPU Qt 自动控制理论算法 android
补偿算法之相位补偿算法相位补偿算法：在一些控制系统中，系统的相位裕度可能不足，导致系统稳定性变差。相位补偿算法通过增加或减少特定频率下的相角来调整系统的相位特性。例如，在电机调速系统中，为了提高系统在高速运行时的稳定性，可能会采用相位超前补偿算法，通过在控制回路中添加适当的滤波器或控制器结构，使系统在高频段的相位提前，从而增加相位裕度，防止系统出现振荡或失稳现象。相位补偿算法的核心目标是对信号或系
leetcode刷题（javaScript）——栈、单调栈相关场景题总结三月的一天 Leetcode刷题技巧总结 javascript leetcode linux
在LeetCode刷题中，栈是一个常用的数据结构，可以帮助解决很多问题。以下是一些需要使用栈的方法，以及单调栈的应用场景：栈的使用技巧：栈常用于解决与括号匹配相关的问题，如括号序列的有效性、最长有效括号等。栈也常用于解决逆波兰表达式、表达式求值等与计算相关的问题。栈可以用于解决深度优先搜索（DFS）中的回溯问题，如组合、排列等。栈还可以用于解决某些需要“后进先出”（LIFO）特性的问题，如某些遍历
【图论】数组模拟邻接表存储(链式前向星) ars4me 图论数据结构图论邻接表前向星
图的邻接表存储法又叫链式存储法可以用数组模拟定义structedge{intnext;//下一条边的编号intto;//这条边到达的点intdis;//这条边的长度}edge[size];//COYG核心代码加入一条从from到to距离为dis的单向边inlinevoidadd(intfrom,intto,intdis){edge[++num].next=head[from];edge[num].
Netty源码—2.Reactor线程模型一东阳马生架构 Netty应用与源码 Netty Reactor线程模型
大纲1.关于NioEventLoop的问题整理2.理解Reactor线程模型主要分三部分3.NioEventLoop的创建4.NioEventLoop的启动1.关于NioEventLoop的问题整理一.默认下Netty服务端起多少线程及何时启动？答：默认是2倍CPU核数个线程。在调用EventExcutor的execute(task)方法时，会判断当前线程是否为Netty的Reactor线程，也就
src小白入门简介吃饱饭，练球安全网络安全 src
隐雾src01为什么别人挖得到洞你挖不到？相信有很多师傅都有在网上看过不少别人发的挖洞的文章为什么你看完之后感觉自己懂了，但真正去实战的时候却挖不到？这就涉及到一个知识转化率的问题在读完这篇文章之后你有没有抓住细节、抓住该学习的点呢？以前怎么样不重要，现在教你们怎么去读一篇文章，然后学习到自己想要的这里我拿北山的一篇文章做例子：https://mp.weixin.qq.com/s?__biz=Mz
Starrocks使用中一些总结 WYRM_GOLD Starrocks 数据库数据仓库数据库开发
1、实时写入的注意事项数据表如果是每天写入，要创建分区(推荐按天分区)。表模型选择更新模型查询的维度列，整数类型列放在前面，有利于快速的查询表分区要设置过期时间，尽可能保留最近一年的数据。总结：1、分区是为了分区内数据查询时扫描的数据量减少，提高查询效率2、更新模型比组件模型更适合实时数据的写入，使用更新模型后IO和CPU使用都会有明显的下降。3、对应上述第三项中会提高查询效率，字符的扫描没有数值
python爬虫之scrapy框架入门，万字教学，从零开始到实战演练，超详细！！！（21）盲敲代码的阿豪 python之爬虫系统教学 python 爬虫 scrapy
文章目录前言1、scrapy的概念和流程1.1学习目标1.2scrapy的概念1.3scrapy框架的作用1.4scrapy的工作流程1.5总结2、scrapy的入门使用2.1学习目标2.2安装scrapy框架2.3scrapy项目开发流程2.4创建项目2.5创建爬虫文件2.6scrapy项目文件说明2.7案例演示2.8实战案例（抓取链家租房信息，存入本地）2.8.1修改items.py文件，在这
人工智能之数学基础：矩阵的范数每天五分钟玩转人工智能机器学习深度学习之数学基础人工智能矩阵算法线性代数范数
本文重点在前面课程中，我们学习了向量的范数，在矩阵中也有范数，本文来学习一下。矩阵的范数对于分析线性映射函数的特性有重要的作用。矩阵范数的本质矩阵范数是一种映射，它将一个矩阵映射到一个非负实数。矩阵的范数前面我们学习了向量的范数，只有当满足几个条件的时候，此时才可以，那么矩阵也是一样的，当满足下面的条件的时候，才可以定义||A||为矩阵A的范数矩阵范数的性质连续性矩阵范数是连续的函数。即如果矩阵序
【ai】mocap：conda 安装python3.8+ cuda+ pytorch+torchaudio、torchvision 等风来不如迎风去 AI入门与实战人工智能 ubuntu conda
MotionCapubuntu18.04不知道为啥会依赖于ffmpeg、xorg渲染？安装pytorch就是会带上cudacudnn啥的pytorch【ai】tx2nx：安装torch、torchvisionforyolov5这里就发现pytorch和torchvision有依赖关系的，还涉及到rapidjson所以python的环境隔离很重要。核心库-cudatoolkit=11.3-pytor
32.代码随想录算法训练营第三十二天|509. 斐波那契数,70. 爬楼梯，746. 使用最小花费爬楼梯白鹭鸣鸣！算法 java dp
32.代码随想录算法训练营第三十二天|509.斐波那契数,70.爬楼梯，746.使用最小花费爬楼梯DP数组的定义以及下标的含义递推公式动态规划的初始化是很重要的遍历顺序打印数组509.斐波那契数-力扣（LeetCode）斐波那契数（通常用F(n)表示）形成的序列称为斐波那契数列。该数列由0和1开始，后面的每一项数字都是前面两项数字的和。也就是：F(0)=0，F(1)=1F(n)=F(n-1)+F(
西门子PLC S7-1200实例详解：涉及安川机器人通信、伺服电机控制及传感器数据轮询 DMQAfdLc 机器人大数据
西门子PLCS7-1200程序实例解析：电气编程者的技术之旅随着科技的飞速发展，工业自动化已成为现代制造业的核心。西门子PLC以其卓越的性能和广泛的应用，成为了工业控制领域的佼佼者。在本次技术博客中，我们将深入探讨西门子PLCS7-1200在博图版本V15下的应用实例，为电气编程者提供宝贵的学习借鉴。一、西门子PLC与安川机器人TCPIP通讯在工业自动化领域，PLC与机器人之间的通讯至关重要。西门
每日一题——二叉树的深度 tt555555555555 面经 C语言算法题算法数据结构
二叉树的最大深度问题描述示例方法一：递归法代码实现代码解析方法二：层次遍历（广度优先搜索）代码实现代码解析总结问题描述给定一个二叉树的根节点root，返回其最大深度。二叉树的最大深度是指从根节点到最远叶子节点的最长路径上的节点数。示例示例1输入：root=[3,9,20,null,null,15,7]输出：3解释：从根节点到最远叶子节点的最长路径为3->20->15或3->20->7，路径长度为3
python 数据可视化matplotib库安装与使用范哥来了信息可视化 python 开发语言
要使用matplotlib库进行数据可视化，首先你需要确保已经安装了该库。如果你还没有安装，可以通过Python的包管理器pip来安装它。在你的命令行工具中运行以下命令来安装matplotlib：pipinstallmatplotlib安装完成后，你就可以开始使用matplotlib来创建图表了。下面是一个简单的例子，演示如何使用matplotlib绘制一个基本的折线图。这个例子可以被添加到你当前
python读取配置参数的多种方式 WYRM_GOLD python
使用多个配置文件：根据不同的环境（如开发、测试、生产）使用不同的配置文件。使用环境变量：利用操作系统的环境变量来获取参数。使用命令行参数：根据传入的命令行参数选择配置。使用JSON或YAML文件：配置文件可以使用JSON或YAML格式，支持多种环境的变量。方法1、使用多个配置文件假设有两个配置文件：config_dev.ini和config_prod.ini。config_dev.ini:[DEF
HiveMetastore 的架构简析 houzhizhen hive hive
HiveMetastore的架构简析HiveMetastore是Hive元数据管理的服务。可以把元数据存储在数据库中。对外通过api访问。hive_metastore.thrift对外提供的Thrift接口定义在文件standalone-metastore/src/main/thrift/hive_metastore.thrift中。内容包括用到的结构体和枚举，和常量，和rpcService。如分
为了拯救minerU镜像制作过程给大家带来的痛苦，我决定放一个备份到阿里云上几道之旅人工智能智能体及数字员工人工智能
文章目录第零步，如果你只是想用这个镜像，那你后面的都不用看。第一步，搜索阿里云，并进入官网第二步，把光标放在产品上，就会出现所有的产品目录第三步容器中，选择容器镜像服务第四步，点击“免费试用，就会让你登录”第五步，点击管理控制台第六步，示例列表中，选择个人版第七步，访问凭证中，设置固定密码第八步，在命名空间中，创建命名空间第九步：创建一个镜像仓库第十步，它会直接跳转到一个说明文档，告诉你具体该怎么
synchronized 的特性与机制坚持拒绝熬夜 java 开发语言笔记
目录1.synchronized的特性锁策略(1)既是乐观锁也是悲观锁(2)既是轻量级锁,也是重量级锁(3)轻量级锁基于自旋实现,重量级锁基于挂起等待实现(4)不是读写锁(5)是可重入锁(6)是非公平锁2.synchronized的使用3.synchronized的锁机制偏向锁自旋锁和重量级锁4.synchronized的优化策略1.锁的消除2.锁的粗化1.synchronized的特性(1)既是
react-11（自定义hook、useRef）我只是想饮一杯奶茶 react JavaScript react.js javascript 前端 typescript
自定义hook主要是我们利用已有的hook,实现hook的效果，并在其他地方引用。（感觉像是封装了一个方法）//定义constfetchHook=(url)=>{const[data,setData]=useState({})const[loading,setLoading]=useState('')useEffect(()=>{setLoading('loading')axios.get(url
QMap 多重嵌套金色暖阳 qt 算法 QMap 数据结构
QMap多重嵌套，通过迭代器修改内层的mapQMapmap_id;map_id.insert(1,22);map_id.insert(2,44);map_id.insert(5,55);if(map_id.contains(2)){qDebug()>map_test;map_test.insert(1,map_id);qDebug()>::iteratorit=map_test.begin();f
TCP 客户端 - 服务器通信程序搭建 Oracle_666 网络服务器 tcp/ip
一、概述本文档针对TCP客户端程序和TCP服务器程序。客户端程序会连接到服务器并发送带有自定义协议格式的数据，而服务器程序则负责监听客户端连接，接收并处理这些数据。自定义协议格式为：先发送2字节网络字节序的长度头，随后是变长的数据负载。二、客户端程序2.1代码结构#include#include#include#include#include#include#definePORT8080//定义服
高云FPGA的管脚约束文件的复制在岸上走的鱼 fpga开发嵌入式硬件硬件架构
问：Gowin里面能不能直接拷贝一个管脚约束文件进去用？答：可以直接拷贝，但是拷贝前后两个工程对应的芯片必须要是同一个芯片拷贝方法:第一步：按照被拷贝约束文件对应的芯片新建一个工程，然后将原工程文件夹“src”里面的“.cst”文件拷到新建工程的相同目录下，第二步：回到新建工程目录下，点击芯片名右击，如下图：将“.V”文件和“.cst”文件一同加入这个工程，最后综合，布局布线就可以了，注意：有时拷
区块链驱动金融第四章——比特币实用指南：存储与使用全解析小DuDu 区块链金融
在比特币的世界里，存储和使用比特币是每个参与者都必须面对的重要环节。第四章围绕这两个关键方面展开了详细的阐述，为我们提供了全面而深入的见解。现在，就让我们一起走进这一章，探索如何安全、便捷地存储和使用比特币。比特币的存储方式：多样选择，各有优劣简单本地储存：便捷与风险并存把比特币存储在本地设备上是最直接的方式，就像把钱放在钱包里一样方便。人们通常会使用比特币钱包软件来管理比特币和私钥，通过这些软件
让你的 Git 历史更直观 —— 体验 VS Code 的 Interactive Git Log 插件小DuDu 工具 git vscode
在日常开发中，我们离不开Git。但原生的gitlog命令虽然强大，却不够直观，查看历史记录时往往需要一遍遍地翻阅命令行输出，效率并不高。今天，就来介绍一款让你的Git历史更加可视化的VSCode插件——InteractiveGitLog！✨为什么选择InteractiveGitLog？Git版本管理的核心是commit记录，但传统的gitlog命令行方式过于“朴素”，让我们在查找某个特定提交时非常
FlinkCDC实战：将 MySQL 数据同步至 ES 小DuDu flink mysql
当前需要处理的业务场景:将订单表和相关联的表(比如:商品表、子订单表、物流信息表)组织成宽表,放入到ES中,加速订单数据的查询.同步数据到es.概述1.什么是CDC2.什么是FlinkCDC3.FlinkCDCConnectors和Flink的版本映射实战1.宽表查询1.1创建mysql表1.2启动Flink集群和FlinkSQLCLI1.3在FlinkSQLCLI中使用FlinkDDL创建表1.
Spring Boot 3.4.0 发布：功能概览与示例小DuDu Java spring boot java
SpringBoot3.4.0带来了许多增强功能，使现代应用开发更加高效、便捷和强大。以下是最新功能的完整概述，以及一些帮助您快速入门的代码示例。1.应用程序版本管理SpringBoot引入了spring.application.version属性，方便开发者设置和访问应用程序版本。示例在application.properties中：spring.application.version=1.2.
NLU-预训练模型-2018：Bert（二）【“Masked LM”缺点：①预训练与微调不一致；②忽略了掩码位置间的依赖关系】【复杂度：O(n^2·d)；n：输入序列长度（规定最长512）】 u013250861 #NLP/词向量_预训练模型 bert 人工智能深度学习
五、BERT中的词嵌入1、为什么要使用BERT的嵌入使用BERT从文本数据中提取特征，即单词和句子的嵌入向量。我们可以用这些词和句子的嵌入向量做什么？首先，这些嵌入对于关键字/搜索扩展、语义搜索和信息检索非常有用。例如，如果你希望将客户的问题或搜索与已经回答的问题或文档化的搜索相匹配，这些表示将帮助准确的检索匹配客户意图和上下文含义的结果，即使没有关键字或短语重叠。其次，或许更重要的是，这些向量被
洛谷每日1题-------Day25__P1424 小鱼的航程（改进版） __雨夜星辰__ 洛谷每日1题算法 c++数据结构学习笔记
题目描述有一只小鱼，它平日每天游泳250公里，周末休息（实行双休日)，假设从周x开始算起，过了n天以后，小鱼一共累计游泳了多少公里呢？输入格式输入两个正整数x,n，表示从周x算起，经过n天。输出格式输出一个整数，表示小鱼累计游泳了多少公里。输入输出样例输入#1复制310输出#1复制2000说明/提示数据保证，1≤x≤7，1≤n≤106。题解#includeusingnamespacestd;int
scala的option和some 矮蛋蛋编程 scala
原文地址： http://blog.sina.com.cn/s/blog_68af3f090100qkt8.html 对于学习 Scala 的 Java™ 开发人员来说，对象是一个比较自然、简单的入口点。在本系列前几期文章中，我介绍了 Scala 中一些面向对象的编程方法，这些方法实际上与 Java 编程的区别不是很大。我还向您展示了 Scala 如何重新应用传统的面向对象概念，找到其缺点
NullPointerException Cb123456 android BaseAdapter
java.lang.NullPointerException: Attempt to invoke virtual method 'int android.view.View.getImportantForAccessibility()' on a null object reference 出现以上异常.然后就在baidu上
PHP使用文件和目录天子之骄 php文件和目录读取和写入 php验证文件 php锁定文件
PHP使用文件和目录 1.使用include()包含文件 (1)：使用include()从一个被包含文档返回一个值 (2)：在控制结构中使用include() include_once()函数需要一个包含文件的路径，此外，第一次调用它的情况和include()一样，如果在脚本执行中再次对同一个文件调用，那么这个文件不会再次包含。在php.ini文件中设置
SQL SELECT DISTINCT 语句何必如此 sql
SELECT DISTINCT 语句用于返回唯一不同的值。 SQL SELECT DISTINCT 语句在表中，一个列可能会包含多个重复值，有时您也许希望仅仅列出不同（distinct）的值。 DISTINCT 关键词用于返回唯一不同的值。 SQL SELECT DISTINCT 语法 SELECT DISTINCT column_name,column_name F
java冒泡排序 3213213333332132 java 冒泡排序
package com.algorithm; /** * @Description 冒泡 * @author FuJianyong * 2015-1-22上午09:58:39 */ public class MaoPao { public static void main(String[] args) { int[] mao = {17,50,26,18,9,10
struts2.18 +json,struts2-json-plugin-2.1.8.1.jar配置及问题！ 7454103 DAO spring Ajax json qq
struts2.18 出来有段时间了！（貌似是稳定版）闲时研究下下！貌似 sruts2 搭配 json 做 ajax 很吃香！实践了下下！不当之处请绕过！呵呵网上一大堆 struts2+json 不过大多的json 插件都是 jsonplugin.34.jar strut
struts2 数据标签说明 darkranger jsp bean struts servlet Scheme
数据标签主要用于提供各种数据访问相关的功能，包括显示一个Action里的属性，以及生成国际化输出等功能数据标签主要包括： action ：该标签用于在JSP页面中直接调用一个Action，通过指定executeResult参数，还可将该Action的处理结果包含到本页面来。 bean ：该标签用于创建一个javabean实例。如果指定了id属性，则可以将创建的javabean实例放入Sta
链表.简单的链表节点构建 aijuans 编程技巧
/*编程环境WIN-TC*/ #include "stdio.h" #include "conio.h" #define NODE(name, key_word, help) \ Node name[1]={{NULL, NULL, NULL, key_word, help}} typedef struct node { &nbs
tomcat下jndi的三种配置方式 avords tomcat
jndi(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。命名服务将名称和对象联系起来，使得我们可以用名称访问对象。目录服务是一种命名服务，在这种服务里，对象不但有名称，还有属性。 tomcat配置
关于敏捷的一些想法 houxinyou 敏捷
从网上看到这样一句话：“敏捷开发的最重要目标就是：满足用户多变的需求，说白了就是最大程度的让客户满意。” 感觉表达的不太清楚。感觉容易被人误解的地方主要在“用户多变的需求”上。第一种多变，实际上就是没有从根本上了解了用户的需求。用户的需求实际是稳定的，只是比较多，也比较混乱，用户一般只能了解自己的那一小部分，所以没有用户能清楚的表达出整体需求。而由于各种条件的，用户表达自己那一部分时也有
富养还是穷养，决定孩子的一生 bijian1013 教育人生
是什么决定孩子未来物质能否丰盛？为什么说寒门很难出贵子，三代才能出贵族？真的是父母必须有钱，才能大概率保证孩子未来富有吗？-----作者：@李雪爱与自由事实并非由物质决定，而是由心灵决定。一朋友富有而且修养气质很好，兄弟姐妹也都如此。她的童年时代，物质上大家都很贫乏，但妈妈总是保持生活中的美感，时不时给孩子们带回一些美好小玩意，从来不对孩子传递生活艰辛、金钱来之不易、要懂得珍惜
oracle 日期时间格式转化征客丶 oracle
oracle 系统时间有 SYSDATE 与 SYSTIMESTAMP； SYSDATE：不支持毫秒，取的是系统时间； SYSTIMESTAMP：支持毫秒，日期，时间是给时区转换的，秒和毫秒是取的系统的。日期转字符窜：一、不取毫秒： TO_CHAR(SYSDATE, 'YYYY-MM-DD HH24:MI:SS') 简要说明， YYYY 年 MM 月
【Scala六】分析Spark源代码总结的Scala语法四 bit1129 scala
1. apply语法 FileShuffleBlockManager中定义的类ShuffleFileGroup，定义： private class ShuffleFileGroup(val shuffleId: Int, val fileId: Int, val files: Array[File]) { ... def apply(bucketId
Erlang中有意思的bug bookjovi erlang
代码中常有一些很搞笑的bug，如下面的一行代码被调用两次（Erlang beam） commit f667e4a47b07b07ed035073b94d699ff5fe0ba9b Author: Jovi Zhang <[email protected]> Date: Fri Dec 2 16:19:22 2011 +0100 erts:
移位打印10进制数转16进制-2008-08-18 ljy325 java 基础
/** * Description 移位打印10进制的16进制形式 * Creation Date 15-08-2008 9:00 * @author 卢俊宇 * @version 1.0 * */ public class PrintHex { // 备选字符 static final char di
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
利用cmd命令将.class文件打包成jar chenyu19891124 cmd jar
cmd命令打jar是如下实现：在运行里输入cmd，利用cmd命令进入到本地的工作盘符。(如我的是D盘下的文件有此路径 D:\workspace\prpall\WEB-INF\classes) 现在是想把D:\workspace\prpall\WEB-INF\classes路径下所有的文件打包成prpall.jar。然后继续如下操作： cd D: 回车 cd workspace/prpal
[原创]JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 comsci eclipse 设计模式算法工作 swing
JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 &nb
SecureCRT右键粘贴的设置 daizj secureCRT 右键粘贴
一般都习惯鼠标右键自动粘贴的功能，对于SecureCRT6.7.5 ，这个功能也已经是默认配置了。老版本的SecureCRT其实也有这个功能，只是不是默认设置，很多人不知道罢了。菜单： Options->Global Options ...->Terminal 右边有个Mouse的选项块。 Copy on Select Paste on Right/Middle
Linux 软链接和硬链接 dongwei_6688 linux
1.Linux链接概念Linux链接分两种，一种被称为硬链接（Hard Link），另一种被称为符号链接（Symbolic Link）。默认情况下，ln命令产生硬链接。【硬连接】硬连接指通过索引节点来进行连接。在Linux的文件系统中，保存在磁盘分区中的文件不管是什么类型都给它分配一个编号，称为索引节点号(Inode Index)。在Linux中，多个文件名指向同一索引节点是存在的。一般这种连
DIV底部自适应 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
Centos6.5使用yum安装mysql——快速上手必备 dcj3sjt126com mysql
第1步、yum安装mysql [root@stonex ~]# yum -y install mysql-server 安装结果： Installed: mysql-server.x86_64 0:5.1.73-3.el6_5 &nb
如何调试JDK源码 frank1234 jdk
相信各位小伙伴们跟我一样，想通过JDK源码来学习Java，比如collections包，java.util.concurrent包。可惜的是sun提供的jdk并不能查看运行中的局部变量，需要重新编译一下rt.jar。下面是编译jdk的具体步骤： 1.把C:\java\jdk1.6.0_26\sr
Maximal Rectangle hcx2013 max
Given a 2D binary matrix filled with 0's and 1's, find the largest rectangle containing all ones and return its area. public class Solution { public int maximalRectangle(char[][] matrix)
Spring MVC测试框架详解——服务端测试 jinnianshilongnian spring mvc test
随着RESTful Web Service的流行，测试对外的Service是否满足期望也变的必要的。从Spring 3.2开始Spring了Spring Web测试框架，如果版本低于3.2，请使用spring-test-mvc项目（合并到spring3.2中了）。 Spring MVC测试框架提供了对服务器端和客户端（基于RestTemplate的客户端）提供了支持。 &nbs
Linux64位操作系统（CentOS6.6）上如何编译hadoop2.4.0 liyong0802 hadoop
一、准备编译软件 1.在官网下载jdk1.7、maven3.2.1、ant1.9.4，解压设置好环境变量就可以用。环境变量设置如下：（1）执行vim /etc/profile （2）在文件尾部加入: export JAVA_HOME=/home/spark/jdk1.7 export MAVEN_HOME=/ho
StatusBar 字体白色 pangyulei status
[[UIApplication sharedApplication] setStatusBarStyle:UIStatusBarStyleLightContent]; /*you'll also need to set UIViewControllerBasedStatusBarAppearance to NO in the plist file if you use this method
如何分析Java虚拟机死锁 sesame java thread oracle 虚拟机 jdbc
英文资料： Thread Dump and Concurrency Locks Thread dumps are very useful for diagnosing synchronization related problems such as deadlocks on object monitors. Ctrl-\ on Solaris/Linux or Ctrl-B
位运算简介及实用技巧（一）：基础篇 tw_wangzhengquan 位运算
http://www.matrix67.com/blog/archives/263 去年年底写的关于位运算的日志是这个Blog里少数大受欢迎的文章之一，很多人都希望我能不断完善那篇文章。后来我看到了不少其它的资料，学习到了更多关于位运算的知识，有了重新整理位运算技巧的想法。从今天起我就开始写这一系列位运算讲解文章，与其说是原来那篇文章的follow-up，不如说是一个r
jsearch的索引文件结构 yangshangchuan 搜索引擎 jsearch 全文检索信息检索 word分词
jsearch是一个高性能的全文检索工具包，基于倒排索引，基于java8，类似于lucene，但更轻量级。 jsearch的索引文件结构定义如下： 1、一个词的索引由=分割的三部分组成：第一部分是词第二部分是这个词在多少

机器学习教程 之 独立成分分析：PCA的高阶版