E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
dataWhale
Datawhale
-数据分析-泰坦尼克-第二单元4节-数据可视化
**复习:**回顾学习完第一章,我们对泰坦尼克号数据有了基本的了解,也学到了一些基本的统计方法,第二章中我们学习了数据的清理和重构,使得数据更加的易于理解;今天我们要学习的是第二章第三节:数据可视化,主要给大家介绍一下Python数据可视化库Matplotlib,在本章学习中,你也许会觉得数据很有趣。在打比赛的过程中,数据可视化可以让我们更好的看到每一个关键步骤的结果如何,可以用来优化方案,是一个
qq_33128705
·
2022-12-23 11:11
可视化
python
数据分析
数据可视化
DataWhale
会员数据化运营项目(个人练习)
importnumpyasnpimportpandasaspdimportmatplotlib.pyplotaspltimportseabornassnsplt.rcParams['font.family']=['SimHei']#显示中文,解决图中无法显示中文的问题plt.rcParams['axes.unicode_minus']=False#建立sheet_name列表,对应excel种的每
jidongdaoshi
·
2022-12-23 09:05
机器学习个人练习项目
python
pandas
数据分析
Datawhale
& 天池 二手车价格预测(4.12-4.20)
Task1赛题理解(4.12-4.14)打卡一、赛题概况赛题以预测二手车的交易价格为任务,数据集报名后可见并可下载,该数据来自某交易平台的二手车交易记录,总数据量超过40w,包含31列变量信息,其中15列为匿名变量。为了保证比赛的公平性,将会从中抽取15万条作为训练集,5万条作为测试集A,5万条作为测试集B,同时会对name、model、brand和regionCode等信息进行脱敏。二、数据概况
雾瞑
·
2022-12-23 09:05
数据挖掘
python
机器学习
深度学习
人工智能
阿里天池新人赛——二手车交易价格预测(赛题理解)
阿里天池新人赛——二手车交易价格预测-Task2数据分析概述本次新人赛是
Datawhale
与天池联合发起的0基础入门系列赛事第一场——零基础入门数据挖掘之二手车交易价格预测大赛。
Dikuw-0705
·
2022-12-23 09:33
python
Datawhale
计算机视觉基础-图像处理(下)-Task04 HOG特征描述算子-行人检测
Datawhale
计算机视觉基础-图像处理(下)-Task04HOG特征描述算子-行人检测目录
Datawhale
计算机视觉基础-图像处理(下)-Task04HOG特征描述算子-行人检测1.HOG特征介绍
微萧默
·
2022-12-22 17:11
Datawhale
CV入门比赛
人脸检测
深度学习
计算机视觉
opencv
深度学习
人工智能
机器学习
Datawhale
组队学习OpenCV -task6 边缘检测
6.1简介6.1.1什么是边缘?边缘是图像强度函数快速变化的地方6.1.2如何检测边缘?为了检测边缘,我们需要检测图像中的不连续性,可以使用导数来检测不连续性。但是,导数也会受到噪声的影响,因此建议在求导数之前先对图像进行平滑处理。然后我们可以使用遮罩使用卷积来检测边缘。6.2算法理论介绍与推荐6.2.1Sobel算子使用3×33\times33×3的卷积核来进行图像求导:KaTeXparseer
DreamStar_w
·
2022-12-22 17:09
【机器学习】在机器学习中处理大量数据!
作者:牧小熊,华中农业大学,
Datawhale
成员知乎|https://zhuanlan.zhihu.com/p/357361005之前系统梳理过大数据概念和基础知识(可点击),本文基于PySpark在机器学习实践中的用法
风度78
·
2022-12-22 14:24
人工智能
机器学习
大数据
数据分析
python
中国各城市首轮感染高峰期预测
作者:chenqin@知乎,经济学研究者编辑来源:
Datawhale
对台湾地区、香港特别行政区和日本的感染情况与“发烧”搜索指数进行了分析,发现一个可能可以帮助预测感染高峰期的方法:1.将Google搜索指数分为疫情期间和非疫情期间
数据不吹牛
·
2022-12-22 13:28
最新OCR开源神器来了!
Datawhale
开源开源方向:OCR开源项目01导读OCR方向的工程师,之前一定听说过PaddleOCR这个项目,其主要推荐的PP-OCR算法更是被国内外企业开发者广泛应用,短短半年时间,累计Star
Datawhale
·
2022-12-22 06:49
算法
大数据
编程语言
python
计算机视觉
Datawhale
时间序列挖掘学习资金流入流出预测(四)之特征工程
本篇是(四)特征工程学习笔记(一)理论说明基于对数据的分析和探索可以发现潜在的有效特征,在提取潜在有效特征后,我们进一步分析这些特征与因变量的关联以筛选有预测价值的特征。特征越好,模型性能越出色。特征越好,模型越简单。特征越好,模型灵活性越强。特征构建(1)离散型特征(特征编码)可用于设计规则易于拟合模型,比如xgboost,lightgbm,catboost都以决策树为基模型便于理解便于做特征组
Sunburst.
·
2022-12-22 00:59
数据挖掘实践(资金流入流出预测)Task01:数据探索与分析
赛题背景介绍2、赛题任务和评估指标3、赛题方案解析二、数据探索与分析1、数据探索和准备步骤1.1时间序列图1.2数据分布可视化1.3变量相关性分析和独立性分析2、资金流入流出预测的数据探索数据挖掘实践本次跟随
Datawhale
RexT1
·
2022-12-22 00:28
#
零基础入门数据挖掘
数据挖掘
可视化
编程语言
大数据
Datawhale
~数据挖掘实践之序列问题处理~天池·资金流入流出预测-挑战Baseline~Day01~数据探索与分析
写在前面✍本系列笔记基于天池平台上“资金流入流出预测-挑战Baseline”学习赛,记录如何完整的打一次数据挖掘类比赛。同时,该比赛属于序列建模问题,希望学习完成这个任务,可以对序列问题的处理有一定的独立思考能力和实践操作能力,可以将所学理论,用编码的形式和实际的问题得到深入。第一篇,EDA,初步了解以及处理的基本步骤学习前先提问:A.【数据处理】对于一般的数据挖掘类任务,拿到数据之后,首先要对数
小卜妞~
·
2022-12-22 00:27
#
可视化
数据分析
机器学习
数据挖掘
python
可解释机器学习笔记合集
学习打卡01】可解释机器学习之导论Task01预备知识学习task02ZFNet【学习打卡】ZFNet深度学习图像分类算法【学习打卡02】可解释机器学习笔记之ZFNet【算法】可解释机器学习-ZFNet(
Datawhale
爱学习的书文
·
2022-12-21 11:17
人工智能
python
2021-06-16
Datawhale
GNN组队学习--Task01
@[
Datawhale
GNN组队学习——Task02]推荐系统中的图结构数据推荐系统中的涉及到的对象(user、item、feature等)大多数显式或隐式连接,构成天然的图并互相影响。
lingwenzhenjun
·
2022-12-21 00:50
GNN理论与实践
神经网络
pytorch
AI在软硬件开发中的应用落地!
Datawhale
活动方向:AI应用,组织方:百度超市中,品种丰富多样的水果吸引来大量的顾客,但是,面对琳琅满目水果种类,超市老板也遇到了新的挑战,店员不但要给水果打上标签进行分类,还要熟记每一种水果的价格和优惠力度
Datawhale
·
2022-12-20 23:09
百度
人工智能
大数据
ai
consul
目标检测模型从训练到部署!
Datawhale
干货作者:张强,
Datawhale
成员训练目标检测模型并部署到你的嵌入式设备,让边缘设备长“眼睛”。
Datawhale
·
2022-12-20 23:09
嵌入式
python
人工智能
深度学习
机器学习
PyTorch学习
学习资料:开源组织
DataWhale
整理的《深入浅出PyTorch》教程写作目的:记录教程中自己觉得重要的和不熟悉的地方。
Tortoiseshell
·
2022-12-20 21:44
pytorch
pytorch
Datawhale
开源学习——数学建模之动态规划(上)
题目(由2020年国赛B题改编):题目细节不过多赘述,代表厂,代表需要铺设的路,中间的数字代表里程数。其中,运输及铺设每公里需要0.1万元。本题计算最小值,故我认为不需要考虑铺设的成本,因为铺设的成本不含有变量,其值为常数,可在最后加上。钢厂在指定期限内能生产该钢管的最大数量为个单位,钢管出厂销价1单位钢管为万元,如下表:i1234567800800100020002000200030001601
周好蠢
·
2022-12-20 17:45
笔记
建模
数学
开源
学习
java
【算法】可解释机器学习-ZFNet(
Datawhale
)
可解释机器学习-ZFNetZFNet算法介绍:AlexNet的提出使得大型卷积网络开始变得流行起来,但是人们对于CNN网络究竟为什么能表现这么好,以及怎么样能变得更好尚不清楚。因此为了解决上述两个问题,ZFNet提出了一种可视化技术,用于理解网络中间的特征层和最后的分类器层,并且找到改进神经网络的结构的方法。ZFNet是MatthewD.Zeiler和RobFergus在2013年撰写的论文Vis
奥瑞给给~~
·
2022-12-20 17:09
可解释机器学习
深度学习
神经网络
Transformers资料汇总!从原理到应用
↑↑↑关注后"星标"
Datawhale
每日干货&每月组队学习,不错过
Datawhale
干货作者:Elvis,来源:AI公园导读从浅入深学习Transformer的资料汇总。
Datawhale
·
2022-12-20 15:21
人工智能
编程语言
微软
ai
自然语言处理
【算法】可解释机器学习-CAM / Grad_CAM(
Datawhale
)
可解释机器学习-CAM/Grad_CAM一、CAM1.CAM算法介绍2.CAM的特点3.CAM算法的缺点二、Grad_CAM1.Grad_CAM算法介绍2.Grad_CAM算法优点3.Grad_CAM算法缺点4.Grad_CAM算法的变种1)Grad_CAM++算法2)ScoreCAM算法3)LayerCAM算法一、CAM1.CAM算法介绍ClassActivationMapping,CAM类激活
奥瑞给给~~
·
2022-12-20 15:46
可解释机器学习
算法
深度学习
全网唯一,不忽悠的ChatGPT
Datawhale
干货作者:Ben,中山大学,
Datawhale
成员最近ChatGPT火出圈了,它和前阵子的StableDiffusion(AIGC)一样成为社交媒体上人们津津乐道的话题。
Datawhale
·
2022-12-20 15:08
chatgpt
人工智能
八月组队学习,吃瓜课程学习笔记打卡 Task1
这里写目录标题机器学习第一章第二章小结本次学习是
Datawhale
发起的组队学习系列——吃瓜教程|八月份组队学习学习内容由开源学习组织
Datawhale
提供相关课程链接:https://www.bilibili.com
miskirito
·
2022-12-20 12:13
1
机器学习
吃瓜笔记:Task02 线性模型
Datawhale
2022年5月吃瓜教程Task02所用教程:《机器学习》(周志华),《机器学习公式详解》(谢文睿,秦州)学习内容:一元线性回归与多元线性回归(2天)预习:西瓜书3.1、3.2一元线性回归直播回放
余舍
·
2022-12-20 12:07
吃瓜笔记
概率论
机器学习模型评估指标总结!
Datawhale
干货作者:太子长琴,
Datawhale
优秀学习者本文对机器学习模型评估指标进行了完整总结。机器学习的数据集一般被划分为训练集和测试集,训练集用于训练模型,测试集则用于评估模型。
zenRRan
·
2022-12-20 12:05
机器学习
深度学习
人工智能
twitter
数据挖掘
CV比赛入门
CV比赛入门赛事模型搭建配置环境自定义dataset预处理数据模型搭建模型验证赛事本文主要借鉴
DataWhale
的“如何打一个CV比赛”,项目来源于华为2022全球校园AI精英大赛,赛题二:车道渲染数据智能质检赛题这次比赛是一个缺陷检测方面的图像分类赛
zhaoaxi
·
2022-12-20 12:04
python
深度学习
pytorch
【机器学习基础】非常详细!机器学习模型评估指标总结!
作者:太子长琴,
Datawhale
优秀学习者本文对机器学习模型评估指标进行了完整总结。机器学习的数据集一般被划分为训练集和测试集,训练集用于训练模型,测试集则用于评估模型。
风度78
·
2022-12-20 12:03
机器学习
人工智能
深度学习
python
算法
datawhale
课程《transformers入门》笔记5:BERT代码总结
如何应用BERT文章目录如何应用BERT1.BERT代码总结:1.1BertTokenizer(Tokenization分词)1.2BertModel1.3BertEmbeddings1.4BertEncoder1.4.1BertAttention1.4.2BertIntermediate1.4.3BertOutput1.5BertPooler1.6总结 尝试BERT的最佳方式是通过托管在Goo
神洛华
·
2022-12-20 09:34
NLP
机器学习
nlp
datawhale
课程《transformers入门》笔记4:BERT代码讲解
BERT代码实现文章目录1-Tokenization分词-BertTokenizer1.1Tokenization代码1.2Tokenization代码讲解2-Model-BertModel2.1BertModel前向传播过程2.2BertPreTrainedModel完整代码2.3BertEmbeddings3BertEncoder3.2BertAttention3.3BertSelfAtten
神洛华
·
2022-12-20 09:33
NLP
nlp
深度学习
Reinforcement Learning 强化学习(一)
Task01本次学习主要参照
Datawhale
开源学习及强化学习蘑菇书EasyRL部分内容参考ShusenWang的github开源项目DRL。
黑小板
·
2022-12-20 08:50
强化学习
人工智能
机器学习
算法
深度学习推荐模型-DeepCrossing
深度学习推荐模型-DeepCrossing本文参考链接,仅供个人学习:https://github.com/
datawhale
china/team-learning-rs/tree/master/DeepRecommendationModel
GoAI
·
2022-12-19 12:46
推荐系统
深度学习
人工智能
机器学习
深度学习
大数据
2020算法工程师超实用技术路线图
↑↑↑关注后"星标"
Datawhale
每日干货&每月组队学习,不错过
Datawhale
干货作者:周远,来源:机器之心这是一份写给公司算法组同事们的技术路线图,其目的主要是为大家在技术路线的成长方面提供一些方向指引
Datawhale
·
2022-12-19 11:25
算法
大数据
编程语言
机器学习
人工智能
三、CAM可解释性分析——可解释性机器学习(
DataWhale
组队学习)
文章目录前言CAM算法的精妙之处相关工作CAM算法其它相关问题为什么不用池化操作?CAM的优点CAM算法的缺点扩展阅读和思考题前言CAM算法奠定了可解释分析的基石CAM算法的精妙之处对深度学习实现可解释性分析、显著性分析可扩展性强,后续衍生出各种基于CAM的算法每张图片的每个类别,都能生成CAM热力图弱监督定位:使用图像分类模型解决定位问题,将定位信息保留到模型的最后一层潜在的“注意力机制”展示在
卡拉比丘流形
·
2022-12-19 11:25
深度学习
可解释性机器学习
学习
深度学习
Tianchi发布最新AI知识树!
来源:
Datawhale
干货来源:Tianchi,方向:AI内容近期Tianchi开放了9大训练营、26门课程、历届大赛和7大顶会论文解读。
Python数据之道
·
2022-12-19 08:51
算法
数据库
大数据
编程语言
人工智能
Matplotlib_one
Matplotlib_one在此借鉴
datawhale
的Matplotlib进行学习Matplotlib初识Matplotlib是python的2D绘图库,用来绘制静态,动态,交互式的图标。
叁..
·
2022-12-19 07:28
matplotlib
python
开发语言
图解 Attention(完整版)!
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达
Datawhale
干货译者:张贤,哈尔滨工程大学,
Datawhale
原创作者本文约4000字,建议阅读11分钟审稿人:Jepson,
小白学视觉
·
2022-12-19 03:46
可视化
编程语言
python
神经网络
机器学习
深度学习的发展方向: 深度强化学习!
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达作者:莫凡&马晶敏,上海交通大学转载自:
Datawhale
深度学习不够智能,强化学习又太抽象。
小白学视觉
·
2022-12-18 18:21
算法
游戏
大数据
编程语言
python
【
Datawhale
可解释性机器学习笔记】CAM
CAM是什么论文:LearningDeepFeaturesforDiscriminativeLocalizationCAM全称ClassActivationMapping,既类别激活映射图,也被称为类别热力图、显著性图等。是一张和原始图片等同大小图,该图片上每个位置的像素取值范围从0到1,一般用0到255的灰度图表示。可以理解为对预测输出的贡献分布,分数越高的地方表示原始图片对应区域对网络的响应越
JeffDingAI
·
2022-12-18 14:15
学习
二、ZFNet可视化卷积神经网络——可解释性机器学习(
DataWhale
组队学习)
目录引言ZFNet的网络结构可视化反卷积反池化反激活反卷积训练细节特征可视化特征演化特征不变性局部遮挡测试敏感性分析相关性分析消融实验宽度影响深度影响迁移学习能力有效性分析总结引言纽约大学ZFNet,2013年ImageNet图像分类竞赛冠军模型。对AlexNet进行改进的基础上,提出了一系列可视化卷积神经网络中间层特征的方法,并巧妙设置了对照消融实验,从各个角度分析卷积神经网络各层提取的特征及对
卡拉比丘流形
·
2022-12-18 14:41
深度学习
可解释性机器学习
学习
深度学习
【
datawhale
202203】深入浅出PyTorch:PyTorch可视化
前情回顾PyTorch的模型定义及模型搭建PyTorch进阶训练小结本节内容非常实用,涉及网络结构的可视化,卷积神经网络的可视化,以及使用tensorboard实现训练过程可视化。卷积神经网络的可视化包含卷积核,特征图,以及CAM的可视化,三者都可以用基础的代码实现,也可以调用现有的库(FlashTorch和pytorch-grad-cam实现)。tensorboard是训练过程可视化的好帮手~目
SheltonXiao
·
2022-12-18 13:43
笔记
学习
深度学习
pytorch
卷积神经网络
[
Datawhale
-李宏毅机器学习-39期]-002-回归+003-误差和梯度下降+004-反向传播机制
咋说嘞,神经网络就是一个函数,拟合线性非线性的数据。改了一个小程序(代码修改自:https://blog.csdn.net/weixin_42318554/article/details/121940694),构建了一个两层convnet和两层的mlp看看效果如何,003-是介绍了SGD的基本原理004-是介绍深度学习的相关知识有趣的点:回顾一下deeplearning的历史:1958:Perce
deyiwang89
·
2022-12-17 17:16
自学李宏毅机器学习
机器学习
回归
python
Jeff Dean长文展望:2021年后,机器学习领域的五大潜力趋势!
Datawhale
干货编辑:杜伟、蛋酱,来源:机器之心2021年之后,机器学习将会对哪些领域产生前所未有的影响?在过去的数年,见证了机器学习(ML)和计算机科学领域的许多变化。
Datawhale
·
2022-12-17 07:23
大数据
编程语言
python
计算机视觉
机器学习
DataWhale
OpenCV -task3 彩色空间互转 小白学习笔记
Datawhale
计算机视觉基础-图像处理(上)-Task03彩色空间互转3.1简介图像彩色空间互转在图像处理中应用非常广泛,而且很多算法只对灰度图有效;另外,相比RGB,其他颜色空间(比如HSV、HSI
DreamStar_w
·
2022-12-17 05:11
DataWhale
OpenCV - task5 小白学习笔记
5.1简介该部分的学习内容是对经典的阈值分割算法进行回顾,图像阈值化分割是一种传统的最常用的图像分割方法,因其实现简单、计算量小、性能较稳定而成为图像分割中最基本和应用最广泛的分割技术。它特别适用于目标和背景占据不同灰度级范围的图像。它不仅可以极大的压缩数据量,而且也大大简化了分析和处理步骤,因此在很多情况下,是进行图像分析、特征提取与模式识别之前的必要的图像预处理过程。图像阈值化的目的是要按照灰
DreamStar_w
·
2022-12-17 05:11
【
DataWhale
组队学习】吃瓜教程(西瓜书+南瓜书)Task05-SVM函数间隔问题
本次任务是周志华老师《机器学习》第六章支持向量机的内容,个人觉得本章是截至目前所有章节任务中难度相对最大且花时间最多的部分,也看了不少资料(还有一部分还没看完)。目前对SVM学习过程中花费时间最多去思考的一个问题——超平面函数间隔设置为1进行整理。首先给出需要用到的数学表达式和符号:样本集,线性可分;是一个能够将正负样本恰好隔开的超平面,并且使得正样本在分隔超平面“上方”,负样本在分隔超平面“下方
哒卜琉歪歪
·
2022-12-16 19:41
支持向量机
机器学习
神经网络
机器学习算法备忘单!
来源:
Datawhale
干货 作者:AnthonyBarrios,编译:追风者机器学习(ML)是人工智能(AI)和计算机科学的一个子领域,主要是利用数据和算法来模仿人的学习方式,逐步提高其准确性。
Python数据之道
·
2022-12-16 18:40
算法
神经网络
大数据
数据挖掘
编程语言
基于图神经网络的聚类研究与应用
Datawhale
干货本文编辑:
Datawhale
用手机上网的时候,总有种感觉,推荐的视频是我爱看的,推荐的美食是我爱吃的,大家长的又好看,说话又好听。有时候会对自己发出灵魂拷问:难道隐私被记录了?
Datawhale
·
2022-12-16 10:43
广告推荐CTR点击率预测实践项目!
Datawhale
干货作者:鱼佬,武汉大学硕士,
Datawhale
成员与报纸、杂志、电视、广播这些传统的传播媒体广告相比,新生的互联网广告拥有天然优势:它能够追踪、研究用户的偏好,并在此基础上进行精准广告推荐和营销
Datawhale
·
2022-12-16 02:01
算法
python
机器学习
人工智能
大数据
DataWhale
集成学习(上)——Task01
目录1.导论1.1回归1.2分类1.3无监督学习1.导论机器学习的一个重要的目标就是利用数学模型来理解数据,发现数据中的规律,用作数据的分析和预测。根据数据是否有因变量,机器学习的任务可分为:有监督学习和无监督学习。根据因变量是否连续,有监督学习又分为回归和分类。科学计算相关包numpypandasmatplotlibseaborn1.1回归基于sklearn内置数据集Boston房价数据集来了解
x___xxxx
·
2022-12-15 18:43
Datawhale零基础入门
集成学习入门
机器学习
DataWhale
集成学习Task9--Boosting的思路与Adaboost算法
1.导论在前面的学习中,我们探讨了一系列简单而实用的回归和分类模型,同时也探讨了如何使用集成学习家族中的Bagging思想去优化最终的模型。Bagging思想的实质是:通过Bootstrap的方式对全样本数据集进行抽样得到抽样子集,对不同的子集使用同一种基本模型进行拟合,然后投票得出最终的预测。我们也从前面的探讨知道:Bagging主要通过降低方差的方式减少预测误差。那么,本章介绍的Boostin
程序员狐小李
·
2022-12-15 18:38
人工智能
机器学习
上一页
13
14
15
16
17
18
19
20
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他