E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
02_统计学习
【Python】DataFrame学习
02_
聚合与分组、透视表、大数据预处理技术
本人依据上课学习内容,将dataframe内容浓缩为代码块,一下是今天学习的第二部分:1.dataframe聚合函数与分组2.dataframe透视表数据预处理技术:3.数据集成(合并)4.数据清洗5.数据归约(标准化)6.数据转换本文于2021/12/13首发于csdn,如有错误和不足请指出。importpandasaspdimportnumpyasnpimportmatplotlib.pypl
Amakusa_
·
2022-10-25 11:16
数据可视化
python
big
data
数据挖掘
task_2异常检测方法—
统计学习
方法
一、基于统计学方法的异常检测主要原理是:学习一个拟合给定数据集的生成模型,然后识别该模型低概率区域中的对象,把它们作为异常点。也就是说,包括两个步骤,第一,给出概率模型,第二,考虑对象有多大可能符合该模型。根据如何指定和学习模型,异常检测的统计学方法可以划分为两个主要类型:参数方法和非参数方法。参数方法:假定正常的数据对象被一个以Θ\ThetaΘ为参数的参数分布产生。该参数分布的概率密度函数f(x
XYQLTX
·
2022-10-25 11:45
异常检测
学习
python
【
统计学习
算法】朴素贝叶斯算法
朴素贝叶斯算法是一种分类算法,生成学习算法参考链接朴素贝叶斯的主要优点有:1)朴素贝叶斯模型发源于古典数学理论,有稳定的分类效率。2)对小规模的数据表现很好,能个处理多分类任务,适合增量式训练,尤其是数据量超出内存时,我们可以一批批的去增量训练。3)对缺失数据不太敏感,算法也比较简单,常用于文本分类。朴素贝叶斯的主要缺点有:1)理论上,朴素贝叶斯模型与其他分类方法相比具有最小的误差率。但是实际上并
zcz5566719
·
2022-10-24 18:51
统计学习算法
算法
机器学习
人工智能
深度学习
统计学习
方法-朴素贝叶斯法
朴素贝叶斯(naiveByes)法是基于贝叶斯定理与特征条件独立假设的分类方法。对于给定的训练数据集,首先基于特征条件独立于假设学习输入/输出的联合概率分布;然后基于此模型,对给定的输入x,利用贝叶斯定理求出后验概率最大输出y。朴素贝叶斯方法实现很很简单,学习与预测效率都很高,是一种常用的方法。朴素贝叶斯法的学习与分类基本方法:后验证概率最大化含义朴素贝叶斯法将实例分到后验概率最大的类中,这等价于
海伦•
·
2022-10-24 18:19
人工智能相关书籍阅读笔记
概率论
机器学习
算法
统计学习
方法01——概论
原文代码作者:https://github.com/wzyonggege/statistical-learning-method目录1.使用最小二乘法拟和曲线1.1最小二乘拟合(scipy.optimize.leastsq)1.1.1画图显示中文标签和正负号1.1.2正态分布(np.random.randn)1.1.3scipy.linalg(线性代数)2.多项式拟合目标函数2.1利用正则化降低过
Top Secret
·
2022-10-24 18:46
深度学习
学习方法
【
统计学习
方法】朴素贝叶斯
一、前言首先介绍朴素贝叶斯的核心公式:PA∣B)=P(A)P(B∣A)P(B)PA|B)=\frac{{P(A)P(B|A)}}{{P(B)}}PA∣B)=P(B)P(A)P(B∣A)Wikipedia贝叶斯定理朴素贝叶斯是基于贝叶斯定理与特征条件独立假设的分类方法。”朴素贝叶斯“之”朴素“之名即来源于其特征条件独立的假设。对于给定的数据集,首先基于特征条件独立假设学习输入输出的联合概率分布,而后
jyyym
·
2022-10-24 18:45
ml苦手
学习
python
机器学习
统计学习
方法03—朴素贝叶斯算法
目录1.朴素贝叶斯的基本原理2.贝叶斯算法实现2.1数据集的准备与处理2.2GaussianNB高斯朴素贝叶斯2.2.1@staticmethod静态方法2.2.2几种概率统计量的编码2.3scikit-learn高斯贝叶斯实例2.4贝叶斯的伯努利模型和多项式模型3.意犹未尽1.朴素贝叶斯的基本原理2.贝叶斯算法实现2.1数据集的准备与处理importnumpyasnpimportpandasas
Top Secret
·
2022-10-24 18:14
深度学习
学习方法
08_音频录制
02_
编程
通过编程录音开发录音功能的主要步骤是:注册设备获取输入格式对象打开设备采集数据释放资源主要步骤需要用到的FFmpeg库有4个。extern"C"{//设备相关API#include//格式相关API#include//工具相关API(比如错误处理)#include//编码相关API#include}权限申请在Mac平台使用录音设备需要申请权限,不然会出现闪退的情况:项目中新增Info.plist文
咸鱼Jay
·
2022-10-24 13:30
信息论概念详细梳理:信息量、信息熵、条件熵、互信息、交叉熵、KL散度、JS散度
通俗理解条件熵从编码角度直观理解信息熵计算公式浅谈KL散度简单的交叉熵,你真的懂了吗李航《
统计学习
方法》文章目录0.引入:三门问题1.信息量1.1从“不确定度”角度理解1.2从编码角度理解2.信息熵3.
云端FFF
·
2022-10-22 07:24
机器学习
数学
信息量
信息熵
交叉熵
KL散度
互信息
【
统计学习
|书籍阅读】第七章 支持向量机 p95-p133
文章目录思路支持向量机线性支持向量机非线性支持向量机SMO算法思路支持向量机是一种二分类模型,它的基本模型是定义在特征空间上的间隔最大的线性分类器,间隔最大使他有别于感知机。支持向量机还包括核技巧,这使他成为实质上的非线性分类器。支持向量机的学习策略就是间隔最大化,可形式化为一个求解凸二次规划问题,也等价于正则化合页损失函数最小化问题。支持向量机的学习算法是求解凸二次规划的最优化算法。线性可分硬间
Lydia.na
·
2022-10-21 15:51
书籍阅读
机器学习
支持向量机
学习
机器学习
Adaboost Python实现
AdaboostPython实现AdaboostPython实现算法原理简介算法流程实现代码AdaboostPython实现本文是根据李航的《
统计学习
方法》进行复现,按照二分类的Adaboost进行操作
FelixBug
·
2022-10-20 22:02
机器学习
python
机器学习
02_
基于线性回归预测糖尿病
基于线性回归预测糖尿病1、实验描述使用Python编程,利用diabetesdataset,一个糖尿病数据集,主要包括442行数据,10个属性值,分别是:Age(年龄)、性别(Sex)、Bodymassindex(体质指数)、AverageBloodPressure(平均血压)、S1~S6一年后疾病级数指标。Target为一年后患疾病的定量指标。首先将数据集划分为训练集和测试集,创建线性回归模型,
奔腾游子
·
2022-10-19 13:05
人工智能
机器学习
基于scikit-learn支持向量机(Support vector machine)的实现
支持向量机(SVM)是在
统计学习
理论基础上发展起来的一种数据挖掘方法,是机器学习中的方法之一,也是核方法(kernalmethod)中最有名的方法之一,在小样本、非线性和高维的回归、分类问题上有许多优势
生信小兔
·
2022-10-18 10:07
机器学习基础
数据分析
支持向量机
scikit-learn
数据挖掘
01. KNN , CV_example
K近邻算法(K-nearestneighbor,KNN算法)李航博士《
统计学习
方法》最近邻(k-NearestNeighbors,KNN)算法是一种分类算法应用场景:字符识别、文本分类、图像识别思想:对给定的训练实例点和输入实例点
S1406793
·
2022-10-18 07:56
机器学习
python
机器学习
sklearn
KNN算法
计算机视觉入门及资料汇总
未完,持续更新)零、好的博客汇总:一、计算机视觉(图像处理)论文及代码汇总:二、特征提取算法汇总:三、深度学习与计算机视觉汇总:四、C和C++入门汇总:五、数据集汇总:六、目标跟踪:七、模式识别:八、
统计学习
方法
weixin_30662011
·
2022-10-14 07:52
支持向量机SVM(1)——间隔最大化
支持向量机SVM——间隔最大化1.超平面2.函数间隔和几何间隔3.间隔最大化本文主要参考《机器学习》、《
统计学习
方法》。
Donreen
·
2022-10-13 07:20
机器学习入门
机器学习
支持向量机
间隔最大化
SVM
决策树模型实现:ID3,C4.5生成,剪枝,预测
此次算法实现都是基于《
统计学习
方法》的描述,而不是西瓜书,不涉及西瓜书内的”预剪枝“和”后剪枝“,剪枝算法为《
统计学习
方法》算法5.4,计算损失函数时直接计算整棵树的值,没有实现”局部进行”。
_森罗万象
·
2022-10-12 10:38
统计学习方法代码实现
决策树
剪枝
机器学习
算法
关于SVM的那点破事[faruto长期更新整理]
是本科大三的时候参加北师本科科研基金在管理学院系统科学那边做一个有关脑电波EEG模式识别的项目,那时候对于“机器学习”这个概念还是头一次染指,后来使用libsvm工具箱来做分类和回归,在用的过程中来学习SVM底层的
统计学习
理论
xiewenbo
·
2022-10-10 20:34
机器学习和数据挖掘
经典机器学习方法(6)—— 非线性支持向量机器与核技巧
参考:《
统计学习
方法(第二版)》第7章白板机器学习菜菜的sklearn课堂支持向量机器(supportvectormachines,SVM)可以看作之前介绍过的经典机器学习方法(4)——感知机的升级版,
云端FFF
·
2022-10-10 19:45
#
监督学习
#
sklearn
#
实践
支持向量机
非线性
SVM
sklearn
概率论与数理
统计学习
笔记(6)——分布律,分布函数,密度函数
对了宝贝儿们,卑微小李的公众号【野指针小李】已开通,期待与你一起探讨学术哟~摸摸大!目录1离散型随机变量1.1(0-1)分布1.2伯努利试验1.3二项分布1.4几何分布1.5泊松分布2.连续型随机变量2.1分布函数与概率密度函数2.2均匀分布2.3指数分布2.4正态分布2.4.1标准正态分布2.4.2一般正态分布References1离散型随机变量离散型随机变量指的是取到的值时有限个或者可列无限多
野指针小李
·
2022-10-10 19:31
数学
概率论
分布律
分布函数
密度函数
概率论与数理
统计学习
笔记——第7讲——连续型随机变量(2.5.4指数分布及其与泊松分布的关系)
1.指数分布的定义2.指数分布的分布函数3.指数分布的重要性质——无记忆性4.指数分布的应用示例——元器件的寿命与其已使用无关(指数分布又被称为永远年轻分布)5.泊松分布与指数分布的关系6.指数分布的应用示例
预见未来to50
·
2022-10-10 19:01
数学(高数
线代
概率论)
Foundation
NNDL 实验五 前馈神经网络(3)鸢尾花分类
4.5.2数据处理4.5.3模型构建4.5.4完善Runner类4.5.5模型训练4.5.6模型评价4.5.7模型预测思考题总结深入研究鸢尾花数据集画出数据集中150个数据的前两个特征的散点分布图:【
统计学习
方法
HBU_David
·
2022-10-07 12:20
DeepLearning
神经网络
分类
深度学习
05决策树与随机森林(学习笔记)
参考:袁春老师《大数据机器学习公开课》:https://www.xuetangx.com/course/THU08091001026/10333105李航老师《
统计学习
方法》:https://book.douban.com
jialonghao
·
2022-10-06 07:57
机器学习
机器学习
随机森林
决策树
西瓜书研读——第三章 线性模型: 线性判别分析 LDA
西瓜书研读系列:西瓜书研读——第三章线性模型:一元线性回归西瓜书研读——第三章线性模型:多元线性回归西瓜书研读——第三章线性模型:线性几率回归(逻辑回归)主要教材为西瓜书,结合南瓜书,
统计学习
方法,B站视频整理
小白不白白_
·
2022-10-02 07:17
从小白视角研读西瓜书
回归
逻辑回归
机器学习
【图像检测】基于多种特征结合支持向量机实现脑 MRI 肿瘤检测和分类附Matlab 代码
支持向量机(SVM)方法是Vapnik等人提出的一种在
统计学习
理论和结构风险最小化基础上发展起来的
matlab_dingdang
·
2022-09-24 12:56
图像处理
支持向量机
分类
matlab
统计学习
方法学习笔记-07-支持向量机01
包含对三种支持向量机的介绍,包括线性可分支持向量机,线性支持向量机和非线性支持向量机,包含核函数和一种快速学习算法-序列最小最优化算法SMO。线性可分支持向量机与硬间隔最大化线性可分支持向量机假设一个特征空间上线性可分的训练数据集T={(x1,y1),(x2,y2),⋯ ,(xN,yN)}T=\{(x_1,y_1),(x_2,y_2),\cdots,(x_N,y_N)\}T={(x1,y1),(x
尔呦
·
2022-09-23 16:29
统计学习方法
支持向量机
学习
机器学习
机器学习算法——支持向量机SVM1(超平面)
支持向量机(SupportVectorMachines,SVM)是一种基于
统计学习
理论的机器学习算法,是一种二分类模型,它的基本模型是定义在特征空间上的间隔最大的线性分类器。
Vicky_xiduoduo
·
2022-09-22 17:22
支持向量机
决策树
机器学习
svm
算法
人工智能
【
统计学习
方法】k近邻 kd树的python实现
前言代码可在Github上下载:代码下载k近邻可以算是机器学习中易于理解、实现的一个算法了,《机器学习实战》的第一章便是以它作为介绍来入门。而k近邻的算法可以简述为通过遍历数据集的每个样本进行距离测量,并找出距离最小的k个点。但是这样一来一旦样本数目庞大的时候,就容易造成大量的计算。所以需要将数据用树形结构存储,以便快速检索,这也就是本文要阐述的kd树。实现分为两部分,一个是kd树建立,一个是kd
火烫火烫的
·
2022-09-22 07:48
机器学习
统计学习方法
python
kd树
k近邻
【晨读算法】为什么经常看到使用朴素贝叶斯公式的时候把分母忽略了?
我们以李航老师《
统计学习
方法》上面的定义为例:朴素贝叶斯法对条件概率分布做了条件独立性的假设。由于这是一个较强的假设,朴素贝叶斯也由此得名。
旅途中的宽~
·
2022-09-19 07:52
机器学习系列文章
算法
概率论
机器学习
朴素贝叶斯
机器学习——K近邻算法(KNN)及其python实现
spm_id_from=333.788&vd_source=77c874a500ef21df351103560dada737
统计学习
方法(第二版)李航(编著)k近邻法(k-nearestneighbor
清泉_流响
·
2022-09-17 16:08
机器学习——朴素贝叶斯(Naive Bayes)详解及其python仿真
spm_id_from=333.999.0.0&vd_source=77c874a500ef21df351103560dada737
统计学习
方法(第二版)李航(编著)一、朴素贝叶斯(naiveBayes
清泉_流响
·
2022-09-17 16:30
机器学习
算法
人工智能
02_
今日API使用
1、Java8新特性Stream操作liststream().filter()和stream().map()的用法.filter一般适用于list集合,主要作用就是模拟sql查询,从集合中查询想要的数据。filter里面的参数user是指集合里面的每一项。如:过滤得到List中User的身份籍贯信息是山西的数据,并返回数据到list集合.map一般使用于将流中的元素映射到另一个流中,可以将当前流中
AllurezYu
·
2022-09-14 11:51
实践总结
java
【SVM】- 支持向量机基本原理
它源于
统计学习
理论,是我们除了集成算法之外,接触的第一个强学习器。它有多强呢?从算法的功能来看
兀坐晴窗独饮茶
·
2022-09-13 07:59
NLP论文精读
SVM
公式推导
尚品汇
02_
后台商品管理
一、商品管理1、基本信息—分类一般情况可以分为两级或者三级。咱们的项目一共分为三级,即一级分类、二级分类、三级分类。比如:家用电器是一级分类,电视是二级分类,那么超薄电视就是三级分类。数据库结构2、基本信息—平台属性平台属性和平台属性值平台属性和平台属性值主要用于商品的检索,每个分类对应的属性都不同。而每个商品对应的每种属性都有对应的属性值。比如:电脑整机的一级分类下,有笔记本、游戏本、台式机、一
胖ۣۖ虎ۣۖ
·
2022-09-11 07:38
尚品汇
redis
缓存
java
开发语言
jvm
【预测模型-SVM分类】基于算术优化算法优化支持向量机SVM实现数据分类附matlab代码
1内容介绍支持向量机(SupportVectorMachine,简称SVM)是借助于最优化方法解决数据挖掘中若干问题的有力工具,它不仅有着
统计学习
理论的坚实基础,而且具有直观的几何解释和完美的数学形式,
matlab_dingdang
·
2022-09-09 13:43
神经网络预测
支持向量机
算法
分类
时间序列预测浅谈
传统的
统计学习
方法需要结合时序领域特有的统计学分析(e.g.自相关系数ACF、偏相关系数PACF、平稳性检验等),将数据通过差
笔写心城
·
2022-09-08 07:05
人工智能
深度学习
机器学习
时间序列
时间序列预测
机器学习算法-NLP-CV好的学习视频和资料(持续更新~)
小白入门:《图“解”机器学习》-小白10分钟也能搞懂机器学习知乎:深入理解
统计学习
方法(这个可以参考)第四章贝叶斯相关:详解最大似然估计(MLE)、最大后验概率估计(MAP),以及贝叶斯公式的理解(转载
饿了就干饭
·
2022-09-07 10:10
数学
面试问题
机器学习
算法
《
统计学习
方法》笔记
统计学习
方法监督学习
统计学习
基本分类
统计学习
是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测和分析的一门学科。
统计学习
也称为统计机器学习。
统计学习
由监督学习、无监督学习和强化学习组成。
仿生程序员会梦见电子羊吗
·
2022-09-06 07:28
机器学习
学习
机器学习
人工智能
深度学习
算法
朴素贝叶斯分类器python实现_python 实现朴素贝叶斯分类器(离散数据)
朴素贝叶斯算法步骤:贝叶斯估计代码:#-*-coding:utf-8-*-#naiveBayes朴素贝叶斯法#author:Tomator"""算法参考与李航博士《
统计学习
方法》采用贝叶斯估计(拉普拉斯平滑
吕驰宇
·
2022-09-05 19:14
离线数仓搭建_03_Hadoop的配置与优化测试
存储多目录(了解)4.2.2集群数据均衡4.2.3项目经验之支持LZO压缩配置4.2.4项目经验之LZO创建索引4.2.5项目经验之基准测试4.2.6项目经验之Hadoop参数调优上文访问:离线数仓搭建_
02
Fang GL
·
2022-09-05 07:58
#
离线数仓搭建
hadoop
hdfs
大数据
数据仓库
尚好房
02_
用户角色管理
尚好房:用户角色管理一、功能介绍1、角色管理2、用户管理二、后台前端框架1、后台框架选择后台前端框架模板:Hplus下载地址:https://gitee.com/hplus_admin/hplus资料文件中已下载,可以直接使用2、模板页面1、主页2、表单3、表格说明:我们需要的后台模板基本都包含3、集成框架3.1、添加框架静态资源在web-admin模块webapps下新建static文件夹,用于
胖ۣۖ虎ۣۖ
·
2022-08-31 09:41
尚好房
前端
前端框架
javascript
maven
dubbo
【day8】String类、static、Arrays类、Math类
02_
字符串的构造方法和直接创建03_字符串的常量池字符串常量池:程序当中直接写上的双引号字符串,就在字符串常量池中。
饮马翰海
·
2022-08-24 18:53
JAVA学习(网盘版)
jvm
java
数据结构
机器学习之EM算法的原理及推导(三硬币模型)及Python实现
本文主要参考了李航博士的《
统计学习
方法》在此基础上主要依据EM算法原理补充了三硬币模型的推导。1.EM算法的原理1.1从一个例子开始三硬币模型假设有3枚硬币,分别记作A,B和C。
董蝈蝈
·
2022-08-23 15:08
机器学习
NLP
python
nlp
机器学习
人工智能
Logistic回归与最大熵模型
Logistic回归与最大熵模型算法介绍逻辑斯谛分布二项logistic回归模型最大熵模型习题6.1习题6.2算法介绍1.逻辑斯谛回归(logisticregression)是
统计学习
中的经典分类方法。
M1911616095
·
2022-08-22 22:06
学习笔记
回归
机器学习
算法
浅谈自然语言处理(NLP)学习路线(一)--- 概述
资料汇总:引流:大道至简之机器学习系列《流畅的python》:https://pan.baidu.com/s/1l5Tl0yZS0NTixAilH9S2aQ提取码:38qa《
统计学习
方法第二版》:https
尚拙谨言
·
2022-08-20 07:22
学习经验分享
自然语言处理
机器学习
深度学习
经验分享
【李航
统计学习
】第 1 章
统计学习
方法概论 笔记
文章目录1.监督学习(Supervisedlearning)1.1监督学习的实现步骤:1.2训练集1.3实例xxx的特征向量1.4模型2.
统计学习
三要素(Elementofstatisticallearning
lele_ne
·
2022-08-19 12:10
机器学习
机器学习
算法
集成学习上——
统计学习
建模流程
集成学习上——
统计学习
建模流程机器学习的三大任务1.回归2.分类3.无监督学习构建机器学习项目的流程及对基本回归模型和衍生模型的掌握一、以线性回归为例使用sklearn构建机器学习项目的完整流程1.明确项目任务
蓝棠
·
2022-08-18 13:40
机器学习
神经网络与深度学习-7- 支持向量机2 -PyTorch
参考文档:《
统计学习
方法》目录1:SMO算法流程2:SMO推导过程2:pytorch例子一SMO(sequentialminimaloptimizaion)输入:训练数据集其中精度输出:优化过程:1初始值
明朝百晓生
·
2022-08-17 15:30
人工智能
pytorch
深度学习
神经网络
机器学习常见损失函数
统计学习
知识点整理——机器学习常见损失函数损失函数作用:损失函数是用于衡量模型预测值与真实值之间差距的函数,损失函数的值越小越好。
Turned_MZ
·
2022-08-17 13:18
机器学习
统计学习
机器学习
深度学习
人工智能
【数模系列】
02_
三大相关系数+Python代码
文章目录一、皮尔逊相关系数1、公式推导2、使用条件3、Python绘图二、斯皮尔曼秩相关系数1、如何选择皮尔逊和斯皮尔曼三、肯德尔秩相关系数一、皮尔逊相关系数在统计学中,皮尔逊相关系数,是用于度量两个变量X和Y之间的相关(线性相关),其值介于-1与1之间,其绝对值越大说明该两个变量越相关。注意:该系数只能评价两个线性变量之间的相关性。1、公式推导①首先由Pearson相关系数的定义可知,ρx,y=
小温可以再努力一些吗
·
2022-08-17 07:07
数模比赛
python
上一页
19
20
21
22
23
24
25
26
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他