E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
特征工程系列学习
机器学习第一课
文章目录实现流程一、数据基本处理二、
特征工程
三、机器学习(模型)分类:监督学习无监督学习半监督学习强化学习四、模型评估实现流程数据输入->数据基本处理->
特征工程
->训练->模型评估->新数据输入->预测结果数据类型
笔记本IT
·
2023-06-19 03:38
机器学习python
机器学习
python
聚类
记录一次使用LSTM神经网络进行量化交易预测
以下是从
特征工程
建模到实际预测的一些过程,希望能帮助喜欢使用个人技能做交易的同志。
量化小哥
·
2023-06-18 22:06
量化交易
神经网络
lstm
人工智能
自动化
python
B.机器学习实战系列[一]:工业蒸汽量预测(最新版本上篇)含数据探索、
特征工程
、特征降维、决策树、随机森林,lightgbm等
【机器学习入门与实践】入门必看系列,含数据挖掘项目实战:数据融合、特征优化、特征降维、探索性分析等,实战带你掌握机器学习数据挖掘专栏详细介绍:【机器学习入门与实践】合集入门必看系列,含数据挖掘项目实战:数据融合、特征优化、特征降维、探索性分析等,实战带你掌握机器学习数据挖掘。本专栏主要方便入门同学快速掌握相关知识。声明:部分项目为网络经典项目方便大家快速学习,后续会不断增添实战环节(比赛、论文、现
汀、人工智能
·
2023-06-18 07:22
数据挖掘-机器学习
机器学习
python
人工智能
数据挖掘
LightGBM
初识大数据
关联分析模型3.1回归分析3.2关联规则分析3.3相关分析4.分类分析模型4.1判别分析4.2基于机器学习的分类模型5.聚类分析模型6.结构分析模型7.文本分析模型8.大数据分析的数据预处理9.降维9.1
特征工程
小琳猫
·
2023-06-17 16:06
大数据
学习《汉语诗律学》(28):词字的平仄(5)-四字句的平仄之三/四:平脚律句和平脚拗句
本文为我阅读王力先生《汉语诗律学》的
系列学习
笔记。这套书分上下册,我现在分享的学习内容摘选自第二册第三章《词》的部分段落。今天分享:词字平仄部分的四字句的平仄之三/四:平脚律句和平脚拗句。
秋沼芰荷
·
2023-06-17 13:55
【系统服务实战】tomcat服务的安装实战
未来要更新的专栏(此表格后面会继续完善)专栏
系列学习
路线完成情况云原生系列linux基本功系列-基础命令汇总已更新51个命令云原生系列linux基本功系列-系统服务实战正在更新文章目录前言一.tomcat
我是沐风晓月
·
2023-06-17 08:26
#
3.
linux基本功-系统服务实战
linux
运维
TFIDF tfidf 算法+决策树\svm\朴素贝叶斯算法实现文本情感分析 多算法性能对比 Accuracy 、F1_score
朴素贝叶斯算法实现文本情感分析多算法性能对比Accuracy、F1_score_哔哩哔哩_bilibili项目演示:完整代码:importpandasaspdimportpandasaspdimportre#从sklearn的
特征工程
的文本模块导入词频统计函数
qiqi_ai_
·
2023-06-17 07:01
项目实战
tf-idf
决策树
朴素贝叶斯
TFIDF
文本分类
OpenMMlab AI实战营第二期培训
OpenMMlabAI实战营第二期培训OpenMMlab实战营第二次课2023.2.2学习参考一、图像分类任务1.什么是图像分类任务2.问题的数学表示3.视觉任务的难点二、
特征工程
到特征学习1.机器学习的局限
Liuyc-Code boy
·
2023-06-16 03:35
人工智能
机器学习
计算机视觉
基于用户认证数据构建评估模型预测认证行为风险系统(附源码)
文件说明datasets//数据集(训练集、测试集)featureengineering//
特征工程
models//评估模型测试环境Python3.8任务描述项目来自系统认证风险预测https://www.datafountain.cn
CODER8R
·
2023-06-15 20:32
机器学习
python
人工智能
python
机器学习
基于Amazon SageMaker平台部署Stable Diffusion模型实现——图片识别
从数据准备和
特征工程
牧鸯人
·
2023-06-14 20:19
stable
diffusion
机器学习
图片识别
python
Jupyter
R语言 tidyverse
系列学习
笔记(系列5)dplyr 数据分析之across
成绩单scoreinstall.packages("dplyr")library(dplyr)install.packages("tibble")library(tibble)install.packages("stringr")library(stringr)score=tibble(ID=c("1222-1","2001-0","3321-1","4898-0","2782-0","1002-
来份芒果布丁
·
2023-06-14 20:34
r语言
数据分析
tidyverse
dplyr
生信
Kaggle数据竞赛-房价预测
从任务内容上看,这是一个简单的回归任务,但是如果想要获得高分,前期的数据探索与
特征工程
是必不可少的。笔者参考了诸多大佬的博客,构建了最终的方案,目前的结果在Kaggle上大致在前10%左右。
JoinApper
·
2023-06-14 19:24
数据竞赛
机器学习
sklearn
数据挖掘
回归
Kaggle竞赛——房价预测(一)
文章目录任务要求数据说明最终目标评价指标:RMSE实施流程代码实现导包读取并查看数据集保存并删除原有Id列数据预处理和
特征工程
异常值处理目标变量分析缺失值处理1、首先将训练集和测试集合并在一起2、统计各个特征的缺失情况
云流寂川
·
2023-06-14 19:23
kaggle竞赛
python
数据挖掘
Python3数据分析与挖掘建模(14)
特征工程
、数据清洗、特征预处理
1.
特征工程
概念1.1
特征工程
概述
特征工程
是机器学习中至关重要的步骤,它涉及到特征的选择、获取、处理和监控。
鮀城小帅
·
2023-06-14 11:08
python
数据挖掘
人工智能
特征预处理
数据清洗
特征工程
python数据挖掘与机器学习实践技术
旨在掌握Python编程的基础知识与技巧、
特征工程
(数据清洗、变量降维、特征选择、群优化算法)、回归拟合(线性回归、BP神经网络、极限学习机)、分类识别(KNN、贝叶斯分类、支持向量机、决策树、随机森林
科研小白 新人上路
·
2023-06-14 09:09
机器学习
python
数据挖掘
学习《汉语诗律学》(28):词字的平仄(5)-四字句的平仄之二:仄脚拗句
本文为我阅读王力先生《汉语诗律学》的
系列学习
笔记。这套书分上下册,我现在分享的学习内容摘选自第二册第三章《词》的部分段落。今天分享:词字平仄部分的四字句平仄之二:仄脚拗句。
秋沼芰荷
·
2023-06-14 06:55
系列学习
分布式任务调度 XXL-JOB 之第 3 篇 —— SpringBoot 整合 XXL-JOB(完结)
之前我们使用XXL-JOB是使用官方自带的代码模块,我们可以自己将XXL-JOB的核心代码整理出来,整合到我们的实际项目中。比如官网自带的SpringBoot项目的pom.xml配置,使用的parent如图所示,我们在自己的公司里,有自己的parent依赖,因此我们需要把核心的依赖提取出来。我们先创建一个项目:修改pom.xml配置①我们把XXL-JOB的SpringBoot除parent节点以外
流放深圳
·
2023-06-13 20:06
开源项目学习
XXL-JOB
SpringBoot整合
#每天一本书+一页笔记# 1486《学习,就是找对方法》
本书主要介绍了作者从多年教学经验中总结出来的一
系列学习
方法,分为学习的原则、学习策略、应试技巧、阶段性总结实例4个部分。
May终身阅读者
·
2023-06-13 14:33
R语言 tidyverse
系列学习
笔记(系列2)表格的处理
创建一个得分表scoreinstall.packages("dplyr")library(dplyr)install.packages("tibble")library(tibble)install.packages("stringr")library(stringr)score=tibble(ID=c("1222-1","2001-0","3321-1","4898-0","2782-0","1
来份芒果布丁
·
2023-06-13 13:07
r语言
tidyverse
数据分析
dplyr
生信
R语言 tidyverse
系列学习
笔记(系列3)具体任务的处理(成绩单为例)
score成绩单install.packages("dplyr")library(dplyr)install.packages("tibble")library(tibble)install.packages("stringr")library(stringr)score=tibble(ID=c("1222-1","2001-0","3321-1","4898-0","2782-0","1002-
来份芒果布丁
·
2023-06-13 13:07
r语言
tidyverse
数据分析
R语言
dplyr
R语言 tidyverse
系列学习
笔记(系列4)PlantGrowth - percentage table
本篇学习数据分析,Excel表格制作Task:创建一个行百分比表格rowpercentagetable先看一下PlantGrowth数据集library(dplyr)data("PlantGrowth")view(PlantGrowth)给数据集新加一列weight_cat,并用case_when自定义名称PG=PlantGrowth|>mutate(weight_cat=case_when(we
来份芒果布丁
·
2023-06-13 13:36
r语言
生信
tidyverse
数据分析
时间序列-异常检测(Anomaly Detection)(一):时间序列的
特征工程
一.介绍异常检测(Anomalydetection)是目前时序数据分析最成熟的应用之一,定义是从正常的时间序列中识别不正常的事件或行为的过程。有效的异常检测被广泛用于现实世界的很多领域,例如量化交易,网络安全检测、自动驾驶汽车和大型工业设备的日常维护。以在轨航天器为例,由于航天器昂贵且系统复杂,未能检测到危险可能会导致严重甚至无法弥补的损害。异常随时可能发展为严重故障,因此准确及时的异常检测可以提
u013250861
·
2023-06-13 11:42
#
TS/异常检测
人工智能
【Huggingface
系列学习
】Finetuning一个预训练模型
文章目录ProcessingthedataLoadadatasetfromtheHubPreprocessingadatasetDynamicpaddingFine-tuningamodelwiththeTrainerAPITrainingEvaluationTrainer背后的过程训练前的准备ProcessingthedataLoadadatasetfromtheHub我们可以利用下面的代码来训
长命百岁️
·
2023-06-12 17:04
huggingface
人工智能
python
深度学习
中文关键词提取算法
特征工程
方法用一个树模型(如Xgboost)做分类
狮子座明仔
·
2023-06-12 09:16
NLP
算法
人工智能
Hadoop介绍与安装
大量的数据优于好的算法存在的问题“三无数据”数据量太大,对储存和算法要求极高应用数据收集与储存数据预处理
特征工程
构建模型训练预测其他HadoopHadoop是Apa
xieyangxuejun
·
2023-06-11 20:09
机器学习中的
特征工程
(五)---- 特征选择方法
简介大概是今年6月份参加微信大数据挑战赛的时候,我才开始认识到特征选择也是机器学习中非常重要的一环。在诸如CTR等比赛中,原始特征往往是不足以挖掘出数据中隐藏的信息的,因此很多时候需要进行特征组合,衍生出更多的组合特征,但是这随之也带来了一个问题,那就是在成千上百的特征中,其实有很多特征对模型性能的提升是毫无帮助的,我们需要筛选出合适的,相对少量的特征来作为模型的输入,这样有助于模型的训练和提高精
HaloZhang
·
2023-06-11 18:12
ChatGPT
系列学习
(1)transformer基本原理讲解
文章目录1.简介1.1.发展史2.Transformer整体结构3.名词解释3.1.token4.transformer输入4.1.单词Embedding4.2.位置Embedding4.3.TransformerEmbedding层实现5.Attention结构5.1.简介5.2.SelfAttention(自注意力机制)5.2.1.简介5.2.2.SelfAttention结构5.2.3.Q,
我真的爱发明
·
2023-06-11 10:27
chatgpt
transformer
人工智能
《精通
特征工程
》学习笔记(2):文本数据:扁平化、过滤和分块
1.元素袋:将自然文本转换为扁平向量1.1词袋词袋将一个文本文档转换为一个扁平向量。之所以说这个向量是“扁平”的,是因为它文本数据:扁平化、过滤和分块|35不包含原始文本中的任何结构。原始文本是一个单词序列,但词袋中没有任何序列,它只记录每个单词在文本中出现的次数。在词袋特征化中,一篇文本文档被转化为一个计数向量。(向量就是n个数值的集合。)这个计数向量包含词汇表中所有可能出现的单词。如果某个单词
Tony Einstein
·
2023-06-10 23:10
特征工程
学习
笔记
python
基于时序特征处理与LSTM结合的雅虎美股数据预测
时间序列
特征工程
:使用statsmodels库的Ca
深度学习的奋斗者
·
2023-06-10 14:24
可创新代码
时序数据深度学习模型
python
开发语言
UniformML Paper3-MLR《Learning Piece-wise Linear Models from Large Scale Data for Ad Click》
1Introduction线性模型在实际应用中虽然高效,但是实际很多特征空间的分界面未必都是线性的,为了适应这样的场景,我们一般会通过两种方法:1、复杂的
特征工程
(人工制造出非线性组合的特征)TohelpLRmodelcatchthenonlinearity
uniform斯坦
·
2023-06-10 08:18
7.Python数据分析项目之银行客户流失分析
查看数值类型特征与非数值类型特征、一次性绘制所有特征的分布图像、单独绘制目标值与所有数值型参数之间的关系、单独绘制目标值与所有字符型参数之间的关系预处理缺失值处理(填充)拆分数据(获取有需要的值)、统一数据格式、
特征工程
想成为数据分析师的开发工程师
·
2023-06-10 02:40
数据分析-统计分析
python
数据分析
数据挖掘
机器学习
人工智能
阅读笔记《tensorflow技术解析与实战》
当以统计方法为核心的机器学习方法成为主流后,所需要的领域知识相对较少,重要的就是做
特征工程
,调些参数,根据一些领域的经验,不断提取特征,特征的好坏,往往直接决定了模型的好坏。3。
小散哥
·
2023-06-10 01:43
sklearn中的
特征工程
(过滤法、嵌入法和包装法)
目录编辑
特征工程
的第一步:理解业务Filter过滤法编辑方差过滤编辑-相关性过滤-卡方过滤-F检验-互信息法编辑嵌入法(Embedded)包装法(Wrapper)
特征工程
的第一步:理解业务如果特征比较少且容易理解
喜欢吃豆
·
2023-06-09 23:49
机器学习
机器学习
python
人工智能
机器学习实战六步法之数据预处理(五)
数据的预处理通常包括5个步骤,如下:这个是比较完整的一个步骤,不同的算法可能会缺少一些步骤,例如无监督学习中,没有标签也就没有
特征工程
。1、数据可视化数据的可视化,可以帮我们发现数据中的规律和问题。
涛声依旧叭
·
2023-06-09 22:17
机器学习入门与实战
机器学习
人工智能
数据预处理
特征工程
kaggle——泰坦尼克之灾3(基于stacking)
流程观察数据,我们要对数据有所了解,可以参考
特征工程
以及数据清洗介绍模型跑模型修改第二层模型总结1.代码分析首先,导入我们需要用到的库importpandasaspdimportn
andyham
·
2023-06-09 18:37
kmeans及模型评估指标_机器学习评估指标之分类模型
模型评估是模型落地非常重要的环节,评估指标的好坏反映出
特征工程
和模型选型的正确与否,本文将简单归纳常见的模型评估指标,持续更新。
艾合买提·艾合米丁
·
2023-06-09 12:35
kmeans及模型评估指标
零基础入门数据挖掘 - 二手车交易价格预测--EDA
EDAEDA背景代码及讲解EDA背景赛题链接零基础入门数据挖掘-二手车交易价格预测EDA目的熟悉数据集,了解数据集,对数据集进行验证了解变量间的相互关系以及变量与预测值之间的存在关系为下一步的数据处理以及
特征工程
奠定基础代码及讲解引入数据科学以及可视化库
suibianti
·
2023-06-09 11:27
EDA
数据挖掘
数据分析
数据分析案例-二手车价格预测
目录数据获取加载数据数据预处理数据分析
特征工程
建模数据获取我们利用scrapy爬虫框架对58同城上海二手车数据进行抓取,部分数据如下:加载数据#数据分析及可视化的包importpandasaspdimportnumpyasnpimportmatplotlib.pyplotaspltimportseabornassns
艾派森
·
2023-06-09 11:23
数据分析
数据分析
数据挖掘
python
1.Python数据分析项目——二手车价格预测
1.总结流程具体操作基本查看查看缺失值、查看重复值、查看数值类型预处理缺失值处理(确定是否处理后,使用筛选方式删除)拆分数据、标签的特征处理(处理成0/1格式)、
特征工程
(one-hot编码)数据分析groupby
想成为数据分析师的开发工程师
·
2023-06-09 11:22
数据分析-统计分析
python
数据分析
数据挖掘
机器学习
人工智能
chatgpt赋能python:Python下载Pandas库教程
无论您是在进行探索性数据分析,数据可视化,
特征工程
还是建模方面使用Python,您都需要使用Pandas库。它使数
www_xuhss_com
·
2023-06-09 07:13
ChatGpt
python
chatgpt
pip
计算机
NLP学习笔记二 - onehot编码和一般的数值编码
这里其实很重要,如果经常做
特征工程
,做机器学习,做深度学习,或者做一些数据分类的工作,onehot编码不仅仅是一个方法,他更蕴含了一种思想,这种思想是将我们日常我们能够理解的标识符转化为计算机所能理解的
Mr Gao
·
2023-06-09 06:37
自然语言处理
自然语言处理
学习
笔记
06
特征工程
- 特征选择
05
特征工程
-缺省值填充当做完特征转换后,实际上可能会存在很多的特征属性,比如:多项式扩展转换、文本数据转换等等,但是太多的特征属性的存在可能会导致模型构建效率降低,同时模型的效果有可能会变的不好,那么这个时候就需要从这些特征属性中选择出影响最大的特征属性作为最后构建模型的特征属性列表
白尔摩斯
·
2023-06-09 03:42
FFA 2022 专场解读 - 流批一体 & 平台建设 & AI
特征工程
FlinkForwardAsia2022将于11月26-27日在线上举办,议程内容正式上线!FFA2022官网:https://flink-forward.org.cn/流批一体流批一体专场由来自快手、京东、数禾、Shopee、蚂蚁集团等企业的技术专家为你呈现流批一体的大规模应用实践案例,详细拆解落地难点和应对方案。另有来自阿里巴巴的技术专家手把手教你如何基于HiveSQLonFlink构建流批一
Apache Flink
·
2023-06-08 23:26
人工智能
R语言 tidyverse
系列学习
笔记(系列1)
tidyverse译“洁净的宇宙”=>“极乐净土”以iris鸢尾花数据集为例**查看数据集****查看维度dimention**dim(iris)iris数据集有150个对象(observation),5列(Sepal.Length,Sepal.Width,Petal.Length,Petal.Width,Species)数据太多,只想看一部分可以用head和tail,默认展示6个observat
来份芒果布丁
·
2023-06-08 22:28
r语言
tidyverse
数据分析
生信
《精通
特征工程
》学习笔记(4):分类变量:自动化时代的数据计数
1.分类变量分类变量是用来表示类别或标记的。在实际的数据集中,类别的数量总是有限的。类别可以用数字表示,但与数值型变量不同,分类变量的值是不能被排序的。(作为行业类型,石油和旅游之间是分不出大小的。)它们又称为无序变量。2.分类变量的编码分类变量中的类别通常不是数值型的。1例如,眼睛的颜色可以是“黑色”“蓝色”和“褐色”,等等。因此,需要一种编码方法来将非数值型的类别转换为数值。我们很容易想到,可
Tony Einstein
·
2023-06-08 11:50
特征工程
分类
python
特征压缩
数据泄露
特征编码
《精通
特征工程
》学习笔记(7):自动特征生成:图像特征提取和 深度学习
因此,与文本相比,图像和音频上的特征提取和
特征工程
要困难得多。计算机视觉研究的重点是人工定义的用于提取良好图像特征的流程。
Tony Einstein
·
2023-06-08 01:43
特征工程
深度学习
python
图像特征提取
自动特征生成
cv
卷积神经网络python_TensorFlow深度学习之卷积神经网络CNN
CNN作为一个深度学习架构被提出的最初诉求是降低对图像数据预处理的要求,避免复杂的
特征工程
。在卷积神经网络中,第一个卷积层会直接接受图像像素级的输入,每一层卷积(滤波器)都会提取数据
weixin_39929813
·
2023-06-07 23:49
卷积神经网络python
【从零开始学推荐】
特征工程
制作特征和标签,转成监督学习问题我们先捋一下基于原始的给定数据,有哪些特征可以直接利用:文章的自身特征,category_id表示这文章的类型,created_at_ts表示文章建立的时间,这个关系着文章的时效性,words_count是文章的字数,一般字数太长我们不太喜欢点击,也不排除有人就喜欢读长文。文章的内容embedding特征,这个召回的时候用过,这里可以选择使用,也可以选择不用,也可以
小月亮等风来
·
2023-06-07 23:32
Datawhale Task3
特征工程
学习笔记
Datawhale零基础入门数据挖掘-Task3
特征工程
三、
特征工程
目标3.1
特征工程
目标对于特征进行进一步分析,并对于数据进行处理完成对于
特征工程
的分析,并对于数据进行一些图表或者文字总结并打卡。
Wen Yu
·
2023-06-07 20:47
Python
Datawhale 零基础入门数据挖掘-Task3
特征工程
笔记
Datawhale零基础入门数据挖掘-Task3
特征工程
¶三、
特征工程
目标Tip:此部分为零基础入门数据挖掘的Task3
特征工程
部分,带你来了解各种
特征工程
以及分析方法,欢迎大家后续多多交流。
小木屋_doh
·
2023-06-07 20:47
大数据
python
上一页
13
14
15
16
17
18
19
20
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他