蜗牛一步一步往上爬

漫谈 HMM之三：Kalman/Particle Filtering

上次我们讲了 HMM 的 Forward-Backward 算法，得到了关于 α 和 β 的递推公式。不过由于中间需要进行 marginalization，这些式子里有麻烦的积分存在。如果是离散型的随机变量，积分实际上是求和，一般来说就没有什么问题了。但是对于上一次举的火星车移动的例子，实际上随机变量是连续的，比如火星车的位置 z 实际上是一个 R3 （或者其他任何用于火星表面的坐标系）下的连续随机变量，于是我们就面临了求积分的问题。

积分是一件很困难的事情，就算是装备了 Wolfram Mathematica 的 PhD 也不能随便夸海口的，因为有很多积分式本来就没有一个式子可以把结果写下来。当然你可以像 Γ -函数那样自己定义新的符号来隐藏后面算不出来的一大坨式子，不过这对于最终需要做数值计算来说好像是躲得了和尚躲不了庙啊。所以我们就不说这些歪门邪道了，正统的解决方法主要有两种。第一种是把概率分布限制到高斯分布上，由于高斯分布像开了外挂似得，求 marginalization 和 conditioning 之后都还是高斯分布，并且本身只需要用均值和方差两 “个” 量即可描述，所以我们在这里碰到的积分问题都可以解析地计算出来，这里介绍一种代表性的算法叫做 Kalman Filtering；另外一种方法是放弃精确计算，采用近似计算的方法，这里也介绍一种代表性方法叫做 Particle Filtering。

于是一切要从高斯分布说起，高斯分布有几个很好的性质：

一个服从多维联合高斯分布的随机变量 X 的线性投影 AX 仍然服从高斯分布
一个服从多维联合高斯分布的随机变量 X 在对其中一部分维度进行 marginalization 和 conditioning 的时候，结果仍然是多维联合高斯分布

并且这些结果的高斯分布的参数可以通过 X 本身的分布参数带入公式直接得到，这里就不一个一个写出来了，感兴趣的同学可以自行推导或者参考 Wikipedia。于是，我们回顾一下上次推导得到的 Forward-Backward 算法里关于 α 的递推式

α(zt+1)=∫ztα(zt)p(zt+1|zt)dztp(xt+1|zt+1)

以及 β 的递推式：

β(zt)=∫zt+1p(xt+1|zt+1)β(zt+1)p(zt+1|zt)dzt+1

为了用到高斯分布的性质来求积分，我们需要把积分式里的那些东西都限制为高斯分布，其中主要就是有状态转移 p(zt+1|zt) 和观察值 p(xt|zt) 两种情况。当然使用高斯分布的原因是除了高斯分布之外都没法算，但是这个理由多少有点不够响亮，所以我们得找点其他的 justification：看看用高斯分布来进行建模到底有没有道理。

具体来说，对于火星车的例子，把 p(xt|zt) 建模成一个高斯分布实际上是很自然的，因为在给定真实值 z 的情况下，测量误差一般会被建模为一个均值为零，方差为 Σ 的高斯分布，理由当然可以从中心极限定理啊或者各种经验啊之类的扯一大堆，总之这是一个标准做法，这样一来实际上观察值的条件分布就是

p(xt|zt)=N(zt,Σ)

接下来是状态转移，如果 t 时刻的状态 zt 已经是服从高斯分布的了（当然从最初的其实状态 z0 是可以由我们设定的），如何使得 zt+1=f(zt) 也服从高斯分布呢？根据高斯分布随机变量的性质，如果 f 是一个线性函数，亦即存在矩阵 A 使得 f(zt)=Azt ，那么 zt+1 仍然是一个高斯分布。当然，考虑到之前提过的机械装置本身的操作误差，我们并不能完美地得到想要的结果，所以实际上 f 是这样子的： f(zt)=Azt+ϵ ，这里 ϵ 是一个独立的误差随机变量，我们再一次将 ϵ 也建模为一个零均值 Σ′ 方差的高斯分布，原因和刚才一样：高斯分布一向被用来建模误差，更重要的是，如此一来， zt+1 还是一个高斯分布。并且，在这种情况下：

p(zt+1|zt)=N(Azt,Σ′)

值得注意的一点是，这里 f 是线性的这一点非常重要，如果 f 是一个 general 的非线性函数，即使能保证 zt+1|zt 这个条件分布是高斯的，也没法做到 marginal zt+1 是高斯的，那样的话 Forward-Backward 的递推就没有办法走下去。

所以，总结起来，把一切都建模成高斯分布的做法实际上在各个方面都是相当自然和有道理的，唯一的一个缺陷就是状态转移这里被限制成了只能是线性函数。这也是为什么 Kalman Filter 被称为是线性方法。这在有些时候是一个非常大的限制，所以不得不再探索其他的方法和扩展，其中有一个扩展叫做 Extended Kalman Filter，是将非线性的状态转移进行线性化近似，据说这个扩展算法被用在了阿波罗登月计划里。不过就最土的 Kalman Filter 本身已经在非常多的问题中得到了广泛和成功的应用了。

说了半天，其实还没有讲 Kalman Filter 到底是什么，其实 Kalman Filter 就是在我们刚才的描述下将所有的分布全部取成高斯的情况下的连续随机变量 HMM 的 Forward-Backward 算法……的变种。之所以说是一种变种，是因为它并不是计算 α 和 β ，而是计算了 α 和一个叫做 γ 的东西。其中 α 的定义和之前一样的，而 γ 其实也不陌生：

γ(zt)≜p(zt|xT0)=α(zt)β(zt)p(xT0)

也可以推导出一个像 β 一样的从后往前的递推公式。于是整个算法还是 Forward 和 Backward 两轮，Forward 的时候是计算 α(zt)=p(zt|xt0) ，也就是根据到目前为止的观测数据所能得到的对于状态值 zt 的分布估计，其中每一步迭代又被分为两步完成，第一步计算 p(zt|xt−10) 叫做 “Prediction” ，也就是直接根据状态转移预测从 t−1 时刻到 t 时刻之后可能所处的状态了，接下来会计算 p(zt|xt0) ，也就是加入 t 时刻的测量值 xt ，这一步叫做 “Update” 。整个正向的迭代合在一起叫做 “Filtering” 。而 Backward 的迭代则是根据所有时刻 0,…,T 的观察值来对 zt 时刻的状态分布的计算进行修正，也就是计算 p(zt|xT0) ，这个步骤也有个名字，叫做 “Smoothing” 。

那么，如果是任意的连续的随机变量，到底应该怎么做呢？既然精确计算不行了，那么久只有求助于近似计算。首先面临的一个问题是如何去表示一个分布，最直接的近似表达一个分布的方法莫过于所谓的 empirical distribution 了：如果 x1,…,xN 是服从于 Px 的 IID 样本 1 1 突然想起之前有过一次有趣的关于 “样本” 是什么的讨论，结论是，所谓 x 是分布 Px 的一个样本，这句话在数学上的意义其实就是在说 x 是个随机变量并且它的分布是 Px 。的话，那么

P^x(⋅)=1N∑Ni=11xi(⋅)

就是关于原来分布的一个近似（如果是概率密度函数的话则要使用狄拉克 δ 函数），特别地，关于原来分布的期望可以通过这个 empirical distribution 近似为

Ex[f(x)]≈1N∑Ni=1f(xi)

根据强大数定理，当 N→∞ 的时候右边会以概率 1 收敛到左边。也就是说，一个分布可以由一堆 sample 来近似表示，不过这里我们要用一个改良的表示方法，除了 sample 之外，每个 sample xi 还被赋予一个权值 wi 。具体来说，这个东西是来自于 Importance Sampling——本身也是一个非常重要的 sampling 方法，它可以在不知道 partition function 的情况下对一个分布进行采用。

具体来说，如果一个分布

p(x)=p∗(x)Zp

其中 Zp 是 partition function（或者叫做 normalization factor），在概率图模型中经常都会碰到 Zp 很难算的情况，这样采样也会变得很困难，不过 Importance Sampling 可以解决这个问题。具体的办法是先找另一个比较容易采用的分布 q （比如是高斯分布或者平均分布之类的），并从 q 那里采 N 个样本 x1,…,xN ，然后对每个样本定义权值

wi=p∗(xi)q(xi)

在对期望进行近似的时候，不再使用简单的平均而是加权平均：

1N∑Ni=1wif(xi)1N∑Ni=1wi→Ep[f(x)]a.s.,as N→∞

这里的收敛性同样是根据大数定理得到的，对分子分母分别求期望就可以很容易得到想要的结果 2 2 注意这里必须在强大数定理的那种 “以概率 1 收敛” 意义下才能分子分母分别求期望之后再相除，只用弱大数定理似乎不足以得到这样的结论。感谢 XH 同学提供的参考。。而整个过程有效地避开了对 Zp 的计算。当然 Importance Sampling 也并不是随便抓一个平均分布就可以解决世间一切问题的银弹，对采样分布 q 的选取有时候会对近似的好坏收敛速率等产生非常大的影响。

而把这里的权重和样本组成的对叫做 Particle，就成了 Particle Filter 算法，其整体结构和 Kalman Filter 如出一辙，其中 Prediction 是从 p(zt|xt0) 计算 p(zt+1|xt0) ，换句话说，我们已经有了 p(zt|xt0) 分布的 particle {zti,wti}Ni=1 ，现在要通过这些 particle 来生成 p(zt+1|xt0) 的 particle。由于 HMM 结构的特殊性，我们可以令每个 zt+1i 是由 p(zt+1|zti) 中采样出来的一个 sample。我们假设这个步骤是容易实现的，否则可以再用一次 Importance Sampling 或者用其他的 Metropolis-Hastings 之类的近似采样方法。而每个样本的权重则保持不变 w~t+1i=wti 。

假设原来的 zti 本身是采样自分布 q ，而权重递归地等于 wti=p(zti|xt0)/q(zti) 。这里上下标有点混乱了…… -.-bb t 是用于表示时刻的量，而 i 则用于对 particle 进行计数。于是我们有

也就是说 particle zt+1i,w~t+1i 确实是在对分布 p(zt+1|xt0) 在做近似。接下来是 Update step，这次的 particle 是保持 zt+1i 不变，而修改权重

wt+1i=w~t+1ip(xi+1|zt+1i)=wtip(xi+1|zt+1i)

和刚才一样我们可以证明对这样的 particle 加权平均其实是在对 p(zt+1i|xt+10) 在做近似，具体推导就不专门写出来了。总而言之这样不断地迭代就可以一直得到关于 p(zt|xt0) 的一个近似表示，而又不受限于状态转移的具体形式——当然，必须也要使得对 p(zt+1|zti) 的工作可以完成才行。

结束之前再提一句的是，随着迭代的进行有些 particle 的权重可能会变得非常非常小，所以有时候需要进行一下 resampling。而用 particle 对分布进行近似这个思想当然不止适用于 HMM，而是可以用在 general 的 graphical model 的 inference 上，但是对于 general 的 graph，就没有 HMM 那么良好的结构有上面的巧妙的算法可以直接得到迭代下一步的 particle 了，而是需要显式地把几个分布相乘再 marginalize 然后采样新的 particle，其中每一步都并不是 trivial 的，比如 “两个由 particle 表示的分布相乘之后究竟应该会是什么样的” 。还有就是 particle filter 属于 Sequential Monte Carlo 方法的一种。

至于为什么这些算法都叫做什么什么 Filter 嘛……其实我也不知道，估计是因为是一步一步迭代的，并且每次输入 xt 会得到 p(zt|xt0) 所以看起来像一个 filter 一样的？

转自：http://freemind.pluskid.org/machine-learning/hmm-kalman-particle-filtering/

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
简单了解 JVM 记得开心一点啊 jvm
目录♫什么是JVM♫JVM的运行流程♫JVM运行时数据区♪虚拟机栈♪本地方法栈♪堆♪程序计数器♪方法区/元数据区♫类加载的过程♫双亲委派模型♫垃圾回收机制♫什么是JVMJVM是JavaVirtualMachine的简称，意为Java虚拟机。虚拟机是指通过软件模拟的具有完整硬件功能的、运行在一个完全隔离的环境中的完整计算机系统（如：JVM、VMwave、VirtualBox）。JVM和其他两个虚拟机
JVM、JRE和 JDK：理解Java开发的三大核心组件 Y雨何时停T Java java
Java是一门跨平台的编程语言，它的成功离不开背后强大的运行环境与开发工具的支持。在Java的生态中，JVM（Java虚拟机）、JRE（Java运行时环境）和JDK（Java开发工具包）是三个至关重要的核心组件。本文将探讨JVM、JDK和JRE的区别，帮助你更好地理解Java的运行机制。1.JVM：Java虚拟机（JavaVirtualMachine）什么是JVM？JVM，即Java虚拟机，是Ja
自然语言处理_tf-idf _feivirus_ 算法机器学习和数学自然语言处理 tf-idf 逆文档频率词频
importpandasaspdimportmath1.数据预处理docA="Thecatsatonmyface"docB="Thedogsatonmybed"wordsA=docA.split("")wordsB=docB.split("")wordsSet=set(wordsA).union(set(wordsB))print(wordsSet){'on','my','face','sat',
深度 Qlearning：在直播推荐系统中的应用 AGI通用人工智能之禅程序员提升自我硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
深度Q-learning：在直播推荐系统中的应用关键词：深度Q-learning,强化学习,直播推荐系统,个性化推荐1.背景介绍1.1问题的由来随着互联网技术的飞速发展,直播平台如雨后春笋般涌现。面对海量的直播内容,用户很难快速找到自己感兴趣的内容。因此,个性化推荐系统在直播平台中扮演着越来越重要的角色。1.2研究现状目前,主流的个性化推荐算法包括协同过滤、基于内容的推荐等。这些方法在一定程度上缓
管理员权限的软件不能开机自启动的解决方法 ss_ctrl
这是几种解决方法：1.将启动参数写入到32位注册表里面去在64位系统下我们64位的程序访问此HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\CurrentVersion\Run注册表路径，是可以正确访问的，32位程序访问此注册表路径时，默认会被系统自动映射到HKEY_LOCAL_MACHINE\SOFTWARE\WOW6432Node\Microsoft
golang学习笔记--MPG模型 xxzed golang #学习笔记学习笔记 golang
MPG模式：M（Machine）：操作系统的主线程P（Processor）：协程执行需要的资源（上下文context），可以看作一个局部的调度器，使go代码在一个线程上跑，他是实现从N：1到N：M映射的关键G（Goroutine）：协程，有自己的栈。包含指令指针（instructionpointer）和其它信息（正在等待的channel等等），用于调度。一个P下面可以有多个G1、当前程序有三个M,
matlab设置图像窗口大小,matlab 图形窗口大小的设置 weixin_39534002 matlab设置图像窗口大小
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%常用选项和小技巧%%%%%%画等值线[cchh]=contour(peaks(30),'LINESPEC','b-')clabel(cc,hh,'manual')%写文本text(5,10,'\bfmath\slmath\itmath\rmmath\alpha','color',[0.10.10.9],'fonts
FRotation FVector 相互转换我真的不知道该起什么名字了
FVectortoFRotatorFRotatorFVector::Rotation()const{returnToOrientationRotator();}FRotatortoFVectorCORE_APIFVectorFRotator::Vector()const{floatCP,SP,CY,SY;FMath::SinCos(&SP,&CP,FMath::DegreesToRadians(P
【开发环境搭建】Macbook M1搭建Java开发环境 weixin_44329069 java 开发语言
JDK安装与配置下载并安装JDK：ARM64DMG安装包下载链接：JDK21forMac(ARM64)。双击下载的DMG文件，按照提示安装JDK。配置环境变量：打开终端，使用vim编辑.bash_profile文件：vim~/.bash_profile在文件中添加以下内容来设置JAVA_HOME：exportJAVA_HOME=/Library/Java/JavaVirtualMachines/j
云服务业界动态简报-20180128 Captain7
一、青云青云QingCloud推出深度学习平台DeepLearningonQingCloud，包含了主流的深度学习框架及数据科学工具包，通过QingCloudAppCenter一键部署交付，可以让算法工程师和数据科学家快速构建深度学习开发环境，将更多的精力放在模型和算法调优。二、腾讯云1.腾讯云正式发布腾讯专有云TCE(TencentCloudEnterprise)矩阵，涵盖企业版、大数据版、AI
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
ResNet的半监督和半弱监督模型 Valar_Morghulis
Billion-scalesemi-supervisedlearningforimageclassificationhttps://arxiv.org/pdf/1905.00546.pdfhttps://github.com/facebookresearch/semi-supervised-ImageNet1K-models/权重在timm中也有：https://hub.fastgit.org/r
联邦学习 Federated learning Google I/O‘19 笔记努力搬砖的星期五笔记联邦学习机器学习机器学习 tensorflow
FederatedLearning:MachineLearningonDecentralizeddatahttps://www.youtube.com/watch?v=89BGjQYA0uE文章目录FederatedLearning:MachineLearningonDecentralizeddata1.DecentralizeddataEdgedevicesGboard:mobilekeyboa
洛谷水题记录木木ainiks 算法 c++数据结构
P1093[NOIP2007普及组]奖学金sort排序即可注意cmp的写法#include#includeusingnamespacestd;structnode{intid;intchinese;intmath;intenglish;intcount;}a[305];intcmp(node&a,node&b){if(a.count!=b.count){returna.count>b.count;
PCL 怎样可视化深度图像 LeonDL168 PCL 计算机视觉人工智能视觉检测图像处理算法
本小节讲解如何可视化深度图像的两种方法，在3D视窗中以点云形式进行可视化（深度图像来源于点云），另一种是，将深度值映射为颜色，从而以彩色图像方式可视化深度图像。代码首先，在PCL（PointCloudLearning）中国协助发行的书提供光盘的第7章例2文件夹中，打开名为range_image_visualization.cpp的代码文件，同文件夹下可以找到相关的测试点云文件room_scan1.
Java：数学相关类昭关969 java 开发语言
Math类Math类是数学工具类，用于数学计算，构造方法是私有的，方法都是静态的，因此直接类名调用staticintabs(inta)求参数绝对值staticdoubleceil(doublea)向上取整staticdoublefloor(doublea)向下取整staticlonground(doublea)四舍五入staticintmax(inta,intb)求较大值staticintmin(
JS 获取数组对象中某个属性的最大值或最小值 qq_36437172 JS Math.max Math.min sort apply
最近的开发中经常会遇到前端自己生成唯一id，然后在数组中增加删除插入对象，这样一来就要的要当前使用的id的最大值。总结一下，有两种比较简便的方法可以做到：1.将属性值通过map生成一个数组，再使用Math.max取最大值2.使用排序sort，先对数组的项排序，再取排序后的对应的项的值数组对象如下,求id的最大值和最小值list=[{id:1,name:'jack'}, {id:2,name:
FISCO BCOS（十七）——— go SDK的使用林中有神君 #FISCO BCOS 2.8.0 golang 服务器 linux fisco bcos 区块链
1、创建一个工作目录root@wyg-virtual-machine:~/fisco#mkdirgoWorkSpace2、下载go-sdkroot@wyg-virtual-machine:~/fisco/
Python【math数学函数】 Alan_Lowe #Python python
Python【math数学函数】文章目录Python【math数学函数】数论与表示函数1.ceil()和floor()2.comb()3.copysign()4.fabs()5.factorial()6.gcd()7.lcm()幂函数与对数函数1.exp()和math.e和pow()2.log()和log2()和log10()3.sqrt(x)三角函数1.asin、acos()、atan()2.s
Python数学函数 fuying1234 Python
函数返回值(描述)abs(x)返回数字的绝对值，如abs(-10)返回10ceil(x)返回数字的上入整数，如math.ceil(4.1)返回5cmp(x,y)如果xy返回1exp(x)返回e的x次幂(ex),如math.exp(1)返回2.718281828459045fabs(x)返回数字的绝对值，如math.fabs(-10)返回10.0floor(x)返回数字的下舍整数，如math.flo
品读 Java 经典巨著《Effective Java》90条编程法则，第4条：通过私有构造器强化不可实例化的能力 @赵士杰品读《Effective Java》java 开发语言 Effective Java
文章目录【前言】欢迎订阅【品读《EffectiveJava》】系列专栏java.lang.Math类的设计经验总结【前言】欢迎订阅【品读《EffectiveJava》】系列专栏《EffectiveJava》是Java开发领域的经典著作，作者JoshuaBloch以丰富的经验和深入的知识，全面探讨了Java编程中的最佳实践。这本书被公认为Java开发者的必读经典，对提升编码技巧和代码质量具有重要意义
Git报错（一）fatal: Could not read from remote repository. librarycode
解决方案来自CSDN：https://blog.csdn.net/cxwtsh123/article/details/79194263?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-3.control&dist_request_id=&depth_1-utm_source=distr
静态库的制作姜太公钓鲸233 数据结构
静态库是一组对象文件的集合，它们在编译时被链接到可执行文件中。这意味着，静态库中的代码会被复制到每个使用它的程序中，因此静态库不需要在程序运行时被单独加载。制作静态库可以帮助你将常用的代码模块化、重用，简化开发过程。以下是创建静态库的详细步骤：步骤1：编写源代码首先，创建几个C/C++源文件，它们将组成静态库。例如，创建两个c文件math_functions.c和string_functions.
MathType2024官方版数学公式编辑器功能全面介绍 CoCo玛奇朵 MathType编辑器 MathType下载 MathType最新版下载编辑器学习 javascript 前端 ffmpeg microsoft
在数字化学习和科研的浪潮中，数学公式的编辑与展示成为了不可或缺的一部分。MathType，作为一款专业的数学公式编辑器，凭借其强大的功能和便捷的操作，为科研人员、教师、学生等广大用户提供了极大的便利。下面，我们将对MathType进行详细的介绍。MathType绿色永久版安装包下载，来自网盘分享链接：抓紧保存！以防失效！https://pan.quark.cn/s/916e68e44d3aMath
VOC数据集转换为CoCo数据集（亲测有效）情书学长人工智能学习笔记图像处理
#VOC数据集格式VOC格式的数据集分为3部分，Annotations、ImageSets、JPEGImages。（一）Annotations：存放数据标注的xml文件，格式如下：CUMID_train0001.pngC:\Users\86182\Desktop\CUMID_train\0001.pngUnknown2040136830MachineUnspecified0011933491451
【Vesta发号器源码】PropertyMachineIdsProvider DeanChangDM
Vesta发号器源码解析——PropertyMachineIdsProvider属性配置文件持有Id的模式,没啥东西，比单个的多了一个获取下一个的方法封装实现上略有一点点区别privatelong[]machineIds;privateintcurrentIndex;publiclonggetNextMachineId(){returngetMachineId();}publiclonggetMa
Awesome TensorFlow weixin_30594001 人工智能移动开发大数据
AwesomeTensorFlowAcuratedlistofawesomeTensorFlowexperiments,libraries,andprojects.Inspiredbyawesome-machine-learning.WhatisTensorFlow?TensorFlowisanopensourcesoftwarelibraryfornumericalcomputationusin
判断string是否是BigDecimal且大于0 Java知识技术分享 java技术 java 开发语言后端
importjava.math.BigDecimal;publicclassBigDecimalCheckUtils{/***判断string是否是BigDecimal且大于0**@paramstr字符串*@return结果*/publicstaticbooleanisPositiveBigDecimal(Stringstr){try{BigDecimalbigDecimal=newBigDeci
【ShuQiHere】探索人工智能核心：机器学习的奥秘 ShuQiHere 人工智能机器学习
【ShuQiHere】什么是机器学习？机器学习（MachineLearning,ML）是人工智能（ArtificialIntelligence,AI）中最关键的组成部分之一。它使得计算机不仅能够处理数据，还能从数据中学习，从而做出预测和决策。无论是语音识别、自动驾驶还是推荐系统，背后都依赖于机器学习模型。机器学习与传统的编程不同，它不再依赖于人类编写的固定规则，而是通过数据自我改进模型，从而更灵活
Java实现的基于模板的网页结构化信息精准抽取组件：HtmlExtractor yangshangchuan 信息抽取 HtmlExtractor 精准抽取信息采集
HtmlExtractor是一个Java实现的基于模板的网页结构化信息精准抽取组件，本身并不包含爬虫功能，但可被爬虫或其他程序调用以便更精准地对网页结构化信息进行抽取。 HtmlExtractor是为大规模分布式环境设计的，采用主从架构，主节点负责维护抽取规则，从节点向主节点请求抽取规则，当抽取规则发生变化，主节点主动通知从节点，从而能实现抽取规则变化之后的实时动态生效。如
java编程思想 -- 多态百合不是茶 java 多态详解
一: 向上转型和向下转型面向对象中的转型只会发生在有继承关系的子类和父类中（接口的实现也包括在这里）。父类：人子类：男人向上转型： Person p = new Man() ; //向上转型不需要强制类型转化向下转型： Man man =
[自动数据处理]稳扎稳打,逐步形成自有ADP系统体系 comsci dp
对于国内的IT行业来讲,虽然我们已经有了"两弹一星",在局部领域形成了自己独有的技术特征,并初步摆脱了国外的控制...但是前面的路还很长.... 首先是我们的自动数据处理系统还无法处理很多高级工程...中等规模的拓扑分析系统也没有完成,更加复杂的
storm 自定义日志文件商人shang storm cluster logback
Storm中的日志级级别默认为INFO，并且，日志文件是根据worker号来进行区分的，这样，同一个log文件中的信息不一定是一个业务的，这样就会有以下两个需求出现： 1. 想要进行一些调试信息的输出 2. 调试信息或者业务日志信息想要输出到一些固定的文件中不要怕，不要烦恼，其实Storm已经提供了这样的支持，可以通过自定义logback 下的 cluster.xml 来输
Extjs3 SpringMVC使用 @RequestBody 标签问题记录 21jhf
springMVC使用 @RequestBody(required = false) UserVO userInfo 传递json对象数据，往往会出现http 415，400,500等错误，总结一下需要使用ajax提交json数据才行，ajax提交使用proxy，参数为jsonData，不能为params；另外，需要设置Content-type属性为json，代码如下：（由于使用了父类aaa
一些排错方法文强chu 方法
1、java.lang.IllegalStateException: Class invariant violation at org.apache.log4j.LogManager.getLoggerRepository(LogManager.java:199)at org.apache.log4j.LogManager.getLogger(LogManager.java:228) at o
Swing中文件恢复我觉得很难小桔子 swing
我那个草了！老大怎么回事，怎么做项目评估的？只会说相信你可以做的，试一下，有的是时间！用java开发一个图文处理工具，类似word，任意位置插入、拖动、删除图片以及文本等。文本框、流程图等，数据保存数据库，其余可保存pdf格式。ok,姐姐千辛万苦，
php 文件操作 aichenglong PHP 读取文件写入文件
1 写入文件 @$fp=fopen("$DOCUMENT_ROOT/order.txt", "ab"); if(!$fp){ echo "open file error" ; exit; } $outputstring="date:"." \t tire:".$tire."
MySQL的btree索引和hash索引的区别 AILIKES 数据结构 mysql 算法
Hash 索引结构的特殊性，其检索效率非常高，索引的检索可以一次定位，不像B-Tree 索引需要从根节点到枝节点，最后才能访问到页节点这样多次的IO访问，所以 Hash 索引的查询效率要远高于 B-Tree 索引。可能很多人又有疑问了，既然 Hash 索引的效率要比 B-Tree 高很多，为什么大家不都用 Hash 索引而还要使用 B-Tree 索引呢
JAVA的抽象--- 接口 --实现百合不是茶
抽象接口实现接口 //抽象类 ,方法 //定义一个公共抽象的类 ,并在类中定义一个抽象的方法体抽象的定义使用abstract abstract class A 定义一个抽象类例如： //定义一个基类 public abstract class A{ //抽象类不能用来实例化，只能用来继承 //
JS变量作用域实例 bijian1013 作用域
<script> var scope='hello'; function a(){ console.log(scope); //undefined var scope='world'; console.log(scope); //world console.log(b);
TDD实践（二） bijian1013 java TDD
实践题目：分解质因数 Step1：单元测试： package com.bijian.study.factor.test; import java.util.Arrays; import junit.framework.Assert; import org.junit.Before; import org.junit.Test; import com.bijian.
[MongoDB学习笔记一]MongoDB主从复制 bit1129 mongodb
MongoDB称为分布式数据库，主要原因是1.基于副本集的数据备份， 2.基于切片的数据扩容。副本集解决数据的读写性能问题，切片解决了MongoDB的数据扩容问题。事实上，MongoDB提供了主从复制和副本复制两种备份方式，在MongoDB的主从复制和副本复制集群环境中，只有一台作为主服务器，另外一台或者多台服务器作为从服务器。本文介绍MongoDB的主从复制模式，需要指明
【HBase五】Java API操作HBase bit1129 hbase
import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; import org.apache.hadoop.hbase.HColumnDescriptor; import org.apache.ha
python调用zabbix api接口实时展示数据 ronin47
zabbix api接口来进行展示。经过思考之后，计划获取如下内容： 1、获得认证密钥 2、获取zabbix所有的主机组 3、获取单个组下的所有主机 4、获取某个主机下的所有监控项
jsp取得绝对路径 byalias 绝对路径
在JavaWeb开发中，常使用绝对路径的方式来引入JavaScript和CSS文件，这样可以避免因为目录变动导致引入文件找不到的情况，常用的做法如下：一、使用${pageContext.request.contextPath} 　　代码” ${pageContext.request.contextPath}”的作用是取出部署的应用程序名，这样不管如何部署，所用路径都是正确的。
Java定时任务调度：用ExecutorService取代Timer bylijinnan java
《Java并发编程实战》一书提到的用ExecutorService取代Java Timer有几个理由，我认为其中最重要的理由是：如果TimerTask抛出未检查的异常，Timer将会产生无法预料的行为。Timer线程并不捕获异常，所以 TimerTask抛出的未检查的异常会终止timer线程。这种情况下，Timer也不会再重新恢复线程的执行了;它错误的认为整个Timer都被取消了。此时，已经被
SQL 优化原则 chicony sql
一、问题的提出　在应用系统开发初期，由于开发数据库数据比较少，对于查询SQL语句，复杂视图的的编写等体会不出SQL语句各种写法的性能优劣，但是如果将应用系统提交实际应用后，随着数据库中数据的增加，系统的响应速度就成为目前系统需要解决的最主要的问题之一。系统优化中一个很重要的方面就是SQL语句的优化。对于海量数据，劣质SQL语句和优质SQL语句之间的速度差别可以达到上百倍，可见对于一个系统
java 线程弹球小游戏 CrazyMizzz java 游戏
最近java学到线程，于是做了一个线程弹球的小游戏，不过还没完善这里是提纲 1.线程弹球游戏实现 1.实现界面需要使用哪些API类 JFrame JPanel JButton FlowLayout Graphics2D Thread Color ActionListener ActionEvent MouseListener Mouse
hadoop jps出现process information unavailable提示解决办法 daizj hadoop jps
hadoop jps出现process information unavailable提示解决办法 jps时出现如下信息： 3019 -- process information unavailable3053 -- process information unavailable2985 -- process information unavailable2917 --
PHP图片水印缩放类实现 dcj3sjt126com PHP
<?php class Image{ private $path; function __construct($path='./'){ $this->path=rtrim($path,'/').'/'; } //水印函数，参数：背景图，水印图，位置，前缀,TMD透明度 public function water($b,$l,$pos
IOS控件学习：UILabel常用属性与用法 dcj3sjt126com ios UILabel
参考网站： http://shijue.me/show_text/521c396a8ddf876566000007 http://www.tuicool.com/articles/zquENb http://blog.csdn.net/a451493485/article/details/9454695 http://wiki.eoe.cn/page/iOS_pptl_artile_281
完全手动建立maven骨架 eksliang java eclipse Web
建一个 JAVA 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=App [-Dversion=0.0.1-SNAPSHOT] [-Dpackaging=jar] 建一个 web 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=web-a
配置清单 gengzg 配置
1、修改grub启动的内核版本 vi /boot/grub/grub.conf 将default 0改为1 拷贝mt7601Usta.ko到/lib文件夹拷贝RT2870STA.dat到 /etc/Wireless/RT2870STA/文件夹拷贝wifiscan到bin文件夹，chmod 775 /bin/wifiscan 拷贝wifiget.sh到bin文件夹，chm
Windows端口被占用处理方法 huqiji windows
以下文章主要以80端口号为例，如果想知道其他的端口号也可以使用该方法..........................1、在windows下如何查看80端口占用情况?是被哪个进程占用?如何终止等. 这里主要是用到windows下的DOS工具,点击"开始"--"运行",输入&
开源ckplayer 网页播放器，跨平台(html5, mobile)，flv, f4v, mp4, rtmp协议. webm, ogg, m3u8 ！天梯梦 mobile
CKplayer，其全称为超酷flv播放器，它是一款用于网页上播放视频的软件，支持的格式有：http协议上的flv,f4v,mp4格式，同时支持rtmp视频流格式播放，此播放器的特点在于用户可以自己定义播放器的风格，诸如播放/暂停按钮，静音按钮，全屏按钮都是以外部图片接口形式调用，用户根据自己的需要制作出播放器风格所需要使用的各个按钮图片然后替换掉原始风格里相应的图片就可以制作出自己的风格了，
简单工厂设计模式 hm4123660 java 工厂设计模式简单工厂模式
简单工厂模式（Simple Factory Pattern）属于类的创新型模式，又叫静态工厂方法模式。是通过专门定义一个类来负责创建其他类的实例，被创建的实例通常都具有共同的父类。简单工厂模式是由一个工厂对象决定创建出哪一种产品类的实例。简单工厂模式是工厂模式家族中最简单实用的模式，可以理解为是不同工厂模式的一个特殊实现。
maven笔记 zhb8015 maven
跳过测试阶段： mvn package -DskipTests 临时性跳过测试代码的编译： mvn package -Dmaven.test.skip=true maven.test.skip同时控制maven-compiler-plugin和maven-surefire-plugin两个插件的行为，即跳过编译，又跳过测试。指定测试类 mvn test
非mapreduce生成Hfile，然后导入hbase当中 Stark_Summer map hbase reduce Hfile path实例
最近一个群友的boss让研究hbase，让hbase的入库速度达到5w+/s，这可愁死了，4台个人电脑组成的集群，多线程入库调了好久，速度也才1w左右，都没有达到理想的那种速度，然后就想到了这种方式，但是网上多是用mapreduce来实现入库，而现在的需求是实时入库，不生成文件了，所以就只能自己用代码实现了，但是网上查了很多资料都没有查到，最后在一个网友的指引下，看了源码，最后找到了生成Hfile
jsp web tomcat 编码问题王新春 tomcat jsp pageEncode
今天配置jsp项目在tomcat上，windows上正常，而linux上显示乱码，最后定位原因为tomcat 的server.xml 文件的配置，添加 URIEncoding 属性： <Connector port="8080" protocol="HTTP/1.1" connectionTi

漫谈 HMM之三：Kalman/Particle Filtering

漫谈 HMM之三：Kalman/Particle Filtering

你可能感兴趣的:(math,machine,learning)