E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
dataWhale
(
DataWhale
组队学习)集成学习之机器学习基础——机器学习三大主要任务
有监督学习和无监督学习的区别有监督学习:对具有标记的训练样本进行学习,以尽可能对训练样本集外的数据进行分类预测。常用的方法有线性回归(LR),支持向量机(SVM),置信度传播(BP),随机森林(RF),梯度提升迭代决策树(GBDT)无监督学习:对未标记的样本进行训练学习,并发现这些样本中的结构知识。常用方法K均值聚类(KMeans),深度学习(DL)。回归和分类(有监督学习)回归:因变量是连续型变
起名字什么的好难
·
2021-03-15 20:04
人工智能
跟着
Datawhale
学习集成学习
集成学习1、机器学习的主要任务1.1监督学习1.1.1回归1.1.2分类1.2无监督学习2.掌握基本的回归模型2.1理论简介2.2代码实现3.模型优化3.1偏差与方差理论(Variance-BiasTradeoff)3.2特征筛选3.2.1根据指标去进行特征筛选3.2.2根据LASSO进行特征筛选3.3利用交叉验证进行模型评价3.4参数调优4.掌握基本的分类问题4.1分类问题的评价指标4.2常见的
hello_JeremyWang
·
2021-03-15 16:31
机器学习
Datawhale
第23期组队集成学习上-Task1
Datawhale
第23期组队集成学习上-Task1机器学习的三大主要任务机器学习的一个重要的目标就是利用数学模型来理解数据,发现数据中的规律,用作数据的分析和预测。
DreamStar_w
·
2021-03-15 16:34
【特征选择】特征选择的通俗讲解!
文章作者:佚名内容来源:
DataWhale
导读:据《福布斯》报道,每天大约会有250万字节的数据被产生。然后,可以使用数据科学和机器学习技术对这些数据进行分析,以便提供分析和作出预测。
zenRRan
·
2021-03-09 21:06
算法
大数据
python
机器学习
人工智能
【机器学习基础】5种数据同分布的检测方法!
作者:小雨姑娘,康涅狄格大学,
Datawhale
成员在数据挖掘比赛中,很重要的一个技巧就是要确定训练集与测试集特征是否同分布,这也是机器学习的一个很重要的假设。
风度78
·
2021-03-01 11:00
人工智能
决策树
机器学习
深度学习
数据挖掘
机器学习的通俗讲解!
↑↑↑关注后"星标"
Datawhale
每日干货&每月组队学习,不错过
Datawhale
干货译者:Ahong,来源:dataxon机器学习人人都在谈论,但除了老师们知根知底外,只有很少的人能说清楚怎么回事
Datawhale
·
2021-02-28 20:00
大数据
编程语言
python
机器学习
人工智能
datawhale
-布匹疵点智能识别baseline踩坑
datawhale
-布匹疵点智能识别baseline踩坑赛题背景:本赛场聚焦布匹疵点智能检测,要求选手研究开发高效可靠的计算机视觉算法,提升布匹疵点检验的准确度,降低对大量人工的依赖,提升布样疵点质检的效果和效率
星辰 JACK
·
2021-02-22 00:37
docker
深度学习
python
天池热身_布匹疵点智能识别
使用了YOLOV5模型,代码参考https://github.com/
datawhale
china/team-learning-cv/tree/master/DefectDetection的baseline
wo88de
·
2021-02-21 23:51
深度学习
天池热身赛布匹疵点检测
天池热身赛布匹疵点检测一、数据处理二、开始训练三、训练结果参考:https://github.com/
datawhale
china/team-learning-cv/tree/master/DefectDetection
Thomson Tang
·
2021-02-21 22:06
机器学习
数据科学竞赛 | 记一次天池大赛热身赛-NLP实践-文本分类
特别感谢
Datawhale
组织的组队比赛学习活动以及提供的baseline等开源代码,感谢各位伙伴的无私分享~下面将简单记录我在比赛过程的参考的教程、遇到的问题及解决方案前期准备赛题地址https://
Lenox1001
·
2021-02-21 16:03
全球人工智能技术创新大赛【热身赛一】布匹疵点智能识别:比赛全流程体验(baseline训练+Docker提交)
首先在阿里云容器服务平台创建本次比赛的镜像仓库2.2准备所需的文件2.3创建镜像2.4往容器中安装必要的包2.5保存镜像相关链接:天池:全球人工智能技术创新大赛【热身赛一】布匹疵点智能识别阿里云容器镜像服务平台
datawhale
菊头蝙蝠
·
2021-02-21 01:01
Datawhale学习打卡
计算机视觉
docker
目标检测
深度学习
pytorch
天池
天池热身赛-布匹瑕疵目标检测
1、检测代码代码源自
datawhale
官方提供baseline:https://github.com/
datawhale
china/team-learning-cv/tree/master/DefectDetection
*pprp*
·
2021-02-20 23:17
工具
环境配置
比赛
人工智能
深度学习
docker
python
Datawhale
——城市管理大数据算法模型(DCIC)专题组队学习——task01
运行时候遇到的问题与解决方法安装folium后无法import——更换python的kernel后可以import,怀疑是之前的环境里装了太多?安装geohash后无法import——找到库将Geohash改为geohash,修改文件夹下的init.py文件中的fromgeohash—>from.geohash如下报错将for循环里的folium.Marker(data[0,::-1]).add_
Yuano42
·
2021-02-19 23:04
Datawhale_learn
机器学习
大数据
python
踩坑记录——记一次训练提交baseline全过程
sklearn数据文件及bert配置模型训练过程数据准备训练更改batch_size适配主机生成结果打包预测结果Docker提交Docker安装本机Docker推送走通的路比赛提交致谢参考目的 根据
Datawhale
面包猎人
·
2021-02-19 03:36
开发踩坑
笔记
docker
windows
python
pytorch
bert
全球人工智能技术创新大赛【热身赛一】布匹疵点智能识别 笔记
主要代码参考了https://github.com/
datawhale
china/team-learning-cv/tree/master/DefectDetection的baseline,使用的YOLOv5
Monet66
·
2021-02-18 21:24
深度学习
人工智能
深度学习
pytorch
精度87%!业内首个动静统一的图像分割套件重磅推出
Datawhale
干货方向:图像分割技术图像分割技术是计算机视觉领域的一个重要的研究方向,早在2019年开源的图像分割套件PaddleSeg已经广泛被企业与开发者应用在实际生产当中。
Wang_AI
·
2021-02-09 10:53
网络
人工智能
深度学习
python
大数据
【数据分析-学术前沿趋势分析】 Task5 作者信息关联
Task5作者信息关联1.任务说明2.数据处理步骤3.社交网络分析3.1图类型3.1图统计指标4.networkx库5.代码实现
Datawhale
一月份的组队学习~关键词:数据分析、爬虫、文本分析开源地址
一一张xi
·
2021-01-26 00:40
数据分析
异常值检测
今天,我跟随着
Datawhale
团队的步伐,学习数据挖掘中的异常值检验。1.1异常值检验的类型:1.1.1点异常:指的是少数个体是异常的,大多数个体是正常的。
Jeremy__Wang
·
2021-01-23 21:32
【数据分析-学术前沿趋势分析】 Task4 论文种类分类
Task4论文种类分类1.任务说明2.数据处理步骤3.文本分类思路4.具体代码实现4.2使用TF-IDF+机器学习分类器进行文本分类4.2使用深度学习模型
Datawhale
一月份的组队学习~关键词:数据分析
一一张xi
·
2021-01-23 00:32
数据分析
【20210122期AI简报】保姆级深度学习环境配置指南、寒武纪首颗AI训练芯片亮相...
(Windows、Mac、Ubuntu全讲解)|极市平台该文章是市面上比较详细的一篇环境配置文章了文章来源于
Datawhale
,作者
Datawhale
俗话说,环境配不对,学习两行泪。
RT-Thread物联网操作系统
·
2021-01-22 18:37
芯片
编程语言
人工智能
深度学习
java
DataWhale
组队学习之异常检测task01
参考
datawhale
开源组织:https://github.com/
datawhale
china/team-learning-data-mining/blob/master/AnomalyDetection
YANJINING
·
2021-01-22 09:27
【数据分析-学术前沿趋势分析】 Task3 论文代码统计
Task3论文代码统计1.任务说明2.数据处理步骤3.正则表达式4.具体代码实现以及讲解
Datawhale
一月份的组队学习~关键词:数据分析、爬虫、文本分析开源地址:https://github.com
一一张xi
·
2021-01-20 00:16
数据分析
Datawhale
LeetCode腾讯精选练习50题 Task06
043字符串相乘题号:43难度:中等链接:https://leetcode-cn.com/problems/multiply-strings/思路:题目要求不能直接将输入转换为整数来处理,那么可以模拟作乘法时草稿纸上竖式乘法的计算过程。注意进位和稿纸上错位时是乘10的几次方。python代码:classSolution:defmultiply(self,num1:str,num2:str)->st
小陈学Python
·
2021-01-17 16:36
DataWhale组队学习
Leetcode
50题
leetcode
【数据分析-学术前沿趋势分析】 Task2 论文作者统计
Task2论文作者统计1.任务说明2.数据处理步骤3.字符串处理4.具体代码实现以及讲解4.1数据读取4.2数据统计
Datawhale
一月份的组队学习~关键词:数据分析、爬虫、文本分析开源地址:https
一一张xi
·
2021-01-16 22:54
数据分析
Day02-数据分析实战-论文作者统计(
DataWhale
)
主题:论文作者统计统计所有论文作者出现频率Top10的姓名importseabornassnsfrombs4importBeautifulSoupimportreimportrequestsimportjsonimportpandasaspdimportmatplotlib.pyplotasplt1.数据读取defreadArxivFile(path,columns=['id','submitte
liying_tt
·
2021-01-16 00:29
数据分析实战
python
可视化
数据分析
2021年1月学习清单
有了不少体会和感悟,清晰的认识到了自己的不足,要学的东西还有非常多,公司内部的学习资料也很丰富,在这里列一份学习清单:学习清单数据库原理;sql性能优化;spark权威指南1~4章复习一遍python深度学习跟一边
datawhale
dancingmind
·
2021-01-15 18:24
生活
大数据
Datawhale
LeetCode腾讯精选50——Task04
LeetCode021:最接近的三数之和Givenanarraynumsofnintegersandanintegertarget,findthreeintegersinnumssuchthatthesumisclosesttotarget.Returnthesumofthethreeintegers.Youmayassumethateachinputwouldhaveexactlyonesolu
that-little-girl
·
2021-01-14 17:14
算法
Python
task1论文数据统计
1.1任务说明任务主题:论文数量统计,即统计2019年全年计算机各个方向论文数量;任务内容:赛题的理解、使用Pandas读取数据并进行统计;任务成果:学习Pandas的基础操作;可参考的学习资料:开源组织
Datawhale
joyful-pandas
lb_rainbow
·
2021-01-14 00:38
datawhale
Day01-数据分析实战-论文数量统计(
DataWhale
)
一、论文数量统计统计2019年全年计算机各个方向论文数量步骤:1.找到update为2019年的数据2.找出categories为计算机的数据3.统计数量1.读取原始数据#导入包importseabornassns#用于画图frombs4importBeautifulSoup#爬取数据importre#正则,匹配字符串模式importrequests#网络连接,发送网络请求,使用域名获取对应信息i
liying_tt
·
2021-01-14 00:24
数据分析实战
数据分析
python
【JP】Task Special & Task 11 综合练习(2020.12)
source:http://
datawhale
.club/t/topic/579【任务四】显卡日志下面给出了3090显卡的性能测评日志结果,每一条日志有如下结构:Benchmarking#2##4#precisiontype
叶小刀_b59f
·
2021-01-14 00:57
Datawhale
LeetCode腾讯精选50——Task03
LeetCode11:盛最多水的容器Givennnon-negativeintegersa1,a2,...,an,whereeachrepresentsapointatcoordinate(i,ai).nverticallinesaredrawnsuchthatthetwoendpointsofthelineiisat(i,ai)and(i,0).Findtwolines,which,togeth
that-little-girl
·
2021-01-14 00:52
算法
Python
学术前沿趋势分析Task1:论文数据统计
2019年往后的论文a.读取arXiv数据集b.筛选2019年往后的论文c.拆分categories*(教程以外的东西)(2)爬取所有类别(3)合并前两步的结果(4)数据分析a.饼图b.查看细分子类信息
DataWhale
木得脑袋
·
2021-01-13 23:09
学术前沿趋势分析
数据分析
python
Task1 论文数据统计
任务说明任务主题:论文数量统计,即统计2019年全年计算机各个方向论文数量;任务内容:赛题的理解、使用Pandas读取数据并进行统计;任务成果:学习Pandas的基础操作;可参考的学习资料:开源组织
Datawhale
joyful-pandas
Tinali_127
·
2021-01-13 22:05
数据分析
DataWhale
组队数据分析 TASK 01-论文数据统计
文章目录1任务主题2数据集2.1数据集来源2.2数据集的格式2.3arxiv论文类别3数据处理3.1数据导入3.2数据预处理3.3数据分析和可视化4小结1任务主题论文数量统计,即统计2019年全年计算机各个方向论文数量。2数据集2.1数据集来源数据源2.2数据集的格式id:arXivID,可用于访问论文;submitter:论文提交者;authors:论文作者;title:论文标题;comment
Smile_L77
·
2021-01-13 22:38
DA
数据分析—学术前沿趋势分析—task1 论文数据统计
学术前沿趋势分析—task1论文数据统计1背景简介2数据介绍2.1数据来源2.2数据介绍3数据统计思路与代码实现3.1导入数据并读取3.2数据预处理3.3数据分析与可视化4总结1背景简介本篇博客是来自
datawhale
铁川
·
2021-01-13 22:19
数据分析
python
数据分析
学术前沿趋势分析
TASK1任务说明任务主题:论文数量统计,即统计2019年全年计算机各个方向论文数量;任务内容:赛题的理解、使用Pandas读取数据并进行统计;任务成果:学习Pandas的基础操作;可参考的学习资料:开源组织
Datawhale
joyful-pandas
m0_50171776
·
2021-01-13 22:17
python
数据分析
python
大数据
数据分析
Day12-Python综合练习2(
DataWhale
)
一、显卡日志下面给出了3090显卡的性能测评日志结果,每一条日志有如下结构:Benchmarking#2##4#precisiontype#1##1#modelaverage#2#time:#3#ms其中#1#代表的是模型名称,#2#的值为train(ing)或inference,表示训练状态或推断状态,#3#表示耗时,#4#表示精度,其中包含了float,half,double三种类型Bench
liying_tt
·
2021-01-13 22:32
Python
python
数据分析
组队学习笔记Task1:论文数据统计
数据分析第一次组队学习笔记——Lizzy@
Datawhale
Task1:论文数据统计学习主题:论文数量统计(数据统计任务),统计2019年全年,计算机各个方向论文数量;学习内容:赛题理解、Pandas读取数据
Lizzy_0323
·
2021-01-13 21:06
DataWhale组队学习
python
数据分析
Datawhale
-学术前沿趋势分析-Task01
Datawhale
-学术前沿趋势分析-Task01任务说明任务主题:论文数量统计,即统计2019年全年计算机各个方向论文数量;任务内容:赛题的理解、使用Pandas读取数据并进行统计;任务成果:学习Pandas
NoFear-Zhang
·
2021-01-13 21:43
NoFear的数据分析之路
python
数据分析
【数据分析-学术前沿趋势分析】 Task1 论文数据统计
task1论文数据统计1.任务说明2.数据集介绍3.代码实现3.1导入包并读取原始数据3.2数据预处理3.2数据分析及可视化
Datawhale
一月份的组队学习~关键词:数据分析、爬虫、文本分析开源地址:
一一张xi
·
2021-01-13 21:09
数据分析
Datawhale
组队学习 Task 1
任务说明任务主题:论文数量统计,即统计2019年全年计算机各个方向论文数量;任务内容:赛题的理解、使用Pandas读取数据并进行统计;任务成果:学习Pandas的基础操作;可参考的学习资料:开源组织
Datawhale
joyful-pandas
CaisL_gfl
·
2021-01-13 21:52
Task1|
Datawhale
:论文数量统计
Task1:论文数量统计#-*-coding:utf-8-*-"""CreatedonMonJan1116:07:312021@author:Zoeytask1:论文数量统计,即统计2019年全年计算机各个方向论文数量"""#######1.1导⼊package并读取原始数据importseabornassnsfrombs4importBeautifulSoup#用于爬取arxiv数据import
南极姑娘qyz
·
2021-01-13 21:09
笔记
python
数据分析
Datawhale
数据分析学习——学术前沿趋势分析 任务1
数据分析学习——学术前沿趋势分析任务1前言赛题背景任务1:论文数据统计1.1任务说明1.2数据集介绍1.3arxiv论文类别介绍1.4任务整体思路1.5具体代码实现以及讲解1.5.1导入package并读取原始数据1.5.2数据预处理1.5.3数据分析及可视化附录拓展学习/问题解答附1基于pandas模块json与dataframe的相互转换附2如何理解查看独立paper类别的代码附3如何理解处理
Jo乘风破浪
·
2021-01-13 20:54
数据分析练习
数据分析
python
pandas
Task 3 Neo4j图数据库导入数据
Datawhale
知识图谱组队学习QASystemOnMedicalGraph1,Neo4j简介(1)基本概念:Neo4j使用图相关的概念来描述数据模型,把数据保存为图中的节点以及节点之间的关系。
xp1990
·
2021-01-13 20:30
知识图谱
知识图谱
数据可视化之饼状图(原理+Python代码)
数据来源于Kaggle数据集,链接:https://www.kaggle.com/Cornell-University/arxiv目录00、前言一、原理介绍二、代码实现三、结果解释00、前言这是
Datawhale
data learning
·
2021-01-13 16:33
数据可视化
可视化
python
机器学习
数据可视化
数据分析
【
DataWhale
数据分析】Task1学习报告
DataWhale
数据分析|Task1任务介绍:任务要求:统计2019年全年计算机各个方向论文数量任务流程:下载kaggle数据集安装所需package:seaborn(数据可视化),BeautifulSoup4
幻世至上
·
2021-01-13 10:46
DataWhale数据分析
大数据
python
数据分析
学术前沿趋势分析 Task1:论文数据统计
、任务说明任务主题:论文数量统计,即统计2019年全年计算机各个方向论文数量;任务内容:赛题的理解、使用Pandas读取数据并进行统计;任务成果:学习Pandas的基础操作;可参考的学习资料:开源组织
Datawhale
joyful-pandas
AnnoraJiao
·
2021-01-13 09:10
数据分析实战
数据分析
DataWhale
第21期组队学习自然语言处理实践(知识图谱)task2— 基于医疗知识图谱的问答系统操作介绍
一、搭建知识图谱运行该过程,请确保已经安装好neo4j和jdk运行以下命令:pythonbuild_graph.py注:由于数据量比较大,所以该过程需要运行几个小时运行介绍之后,打开浏览器进入网址:http://localhost:7474/browser/,可以看到我们导入的数据的知识图谱二、启动问答测试运行以下命令:pythonkbqa_test.py
冰城孤阳
·
2021-01-13 00:57
Datawhale
知识图谱 Task2 基于医疗知识图谱的问答系统操作介绍
该部分的具体讲解将在
Datawhale
知识图谱组队学习之Task3Neo4j图数据库导入数据进行介绍;第二部分:启动问答测试。
Denis.Zzzzzzzz?
·
2021-01-13 00:56
datawhale
笔记
知识图谱
[
Datawhale
Camp] Task02- 基于医疗知识图谱的问答系统操作介绍
Content1.Intro1.1任务理解2.实战练习2.1数据读取2.2实现步骤2.3熟悉Cypher语法的操作2.4问答系统操作参考来源1.Intro1.1任务理解需要将医疗数据导入到Neo4j数据库,并成功建立节点、主要以疾病名称(name)为实体所延伸的栏位,例如:疾病的症状描述(Symptom)、好發群体(Age)、發生部位(part)…etc。建立而成的医疗知识图谱,将能帮助我们看到:
monarch 漾名
·
2021-01-13 00:03
知识图谱
python
neo4j
上一页
29
30
31
32
33
34
35
36
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他