E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
DataWhale天池数据挖掘
datawhale
大模型学习 第四章-新模型架构
一、现状GPT3是一个通过96个Transformerblock堆叠在一起的神经网络.即:每一个TransformerBlock是一个多头注意力层的Block目前大模型的规模已经到了极限(模型越大,需要训练资源和时间也就越长)二、混合专家模型混合专家模型通俗点讲就是:有N个专家,每个专家有各种的不同领域能力和模型参数,通过一个门控制机制来给不同专家分配权重,最终汇总所有专家的结果。优点:1.专家与
fan_fan_feng
·
2024-01-22 21:48
学习
大模型
【毕设选题指导】2024 数据分析与挖掘方向毕业设计选题推荐
目录前言
数据挖掘
方向选题迷茫选题的重要性更多选题指导最后前言大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学做准备,一边要为毕业设计耗费大量精力。
Mini_hailang_IT
·
2024-01-22 20:42
毕设选题指导
人工智能
毕业设计
算法
数据挖掘
数据分析
毕设
浅谈大数据智能化技术在多个领域的应用实践
技术实践、架构设计、指标体系、数据质量、数据分析、
数据挖掘
、数据采集、数据智能化应用、BI、AI等方面,大数据智能化技术在不同领域的应用场景和代码编写。
shinelord明
·
2024-01-22 17:45
大数据
人工智能
算法
数据挖掘
实战-基于机器学习的电商文本分类模型
♂️个人主页:@艾派森的个人主页✍作者简介:Python学习者希望大家多多支持,我们一起进步!如果文章对你有帮助的话,欢迎评论点赞收藏加关注+目录1.项目背景2.数据集介绍3.技术工具4.实验步骤4.1数据探索4.2数据预处理4.3文本归一化4.4特征工程4.5训练模型1.项目背景随着电子商务的蓬勃发展,电商平台上产生了海量的文本数据,包括商品描述、用户评价、客服对话等。这些文本数据包含了丰富的
艾派森
·
2024-01-22 16:52
数据挖掘
python
数据挖掘
人工智能
美丽的天山
怀中一个大水池,也就是著名的
天池
了。放眼望去,一片大大的湖水,水的颜色五彩
联合小学刘彦君
·
2024-01-22 14:31
数据挖掘
1-走进数据科学
1.概述DRIP:DataRich,InformationPoor(现状)DRIP指的是现实生活中普遍存在的“数据充沛而信息不足”的问题,原因在于对原始数据没有进行必要的处理和分析,没有发挥出其应有的价值。学科知识数据是定量或定性的属性值类型:连续型,离散型,二进制;物理,逻辑结构;问题:数据类型转化;错误与变体corruption大数据的定义为3V,即容量大,速度快,类型多扩展:5VBigdat
九桢
·
2024-01-22 11:36
深度强化学习Task2:策略梯度算法
本篇博客是本人参加
Datawhale
组队学习第二次任务的笔记【教程地址】文章目录基于价值算法和基于策略算法的比较策略梯度算法策略梯度算法的直观理解策略梯度算法REINFORCE算法基于平稳分布的策略梯度算法
卡拉比丘流形
·
2024-01-22 07:16
深度学习
算法
机器学习
人工智能
强化学习
深度学习
HNU-
数据挖掘
-作业1
数据挖掘
课程作业作业1计科210X甘晴void202108010XXX第一题假设所分析的数据包括属性age,它在数据元组中的值(以递增序)为13,15,16,16,19,20,20,21,22,22,25,25,25,25,30,33,33,35,35,35,35,36,40,45,46,52,70
甘晴void
·
2024-01-22 06:37
#
【专选】数据挖掘
数据挖掘
人工智能
HNU-
数据挖掘
-实验3-图深度学习
数据挖掘
课程实验实验3图深度学习计科210X甘晴void202108010XXX文章目录
数据挖掘
课程实验实验3图深度学习实验背景实验要求数据集解析实验内容(0)基础知识:基于图的深度学习方法浅识:图卷积网络
甘晴void
·
2024-01-22 06:36
#
【专选】数据挖掘
数据挖掘
深度学习
人工智能
HNU-
数据挖掘
-实验1-实验平台及环境安装
数据挖掘
课程实验实验1实验平台及环境安装计科210X甘晴void202108010XXX文章目录
数据挖掘
课程实验实验1实验平台及环境安装实验背景实验目标实验步骤1.安装虚拟机和Linux平台,熟悉Ubuntu
甘晴void
·
2024-01-22 06:36
#
【专选】数据挖掘
数据挖掘
人工智能
HNU-
数据挖掘
-实验4-链接预测
数据挖掘
课程实验实验4链接预测计科210X甘晴void202108010XXX文章目录
数据挖掘
课程实验实验4链接预测实验背景实验要求数据集解析实验建模实验探索过程失败的探索——DGL库DGL库简介读取基因并构建图构建
甘晴void
·
2024-01-22 06:32
#
【专选】数据挖掘
数据挖掘
人工智能
HNU-
数据挖掘
-实验2-数据降维与可视化
数据挖掘
课程实验实验2数据降维与可视化计科210X甘晴void202108010XXX文章目录
数据挖掘
课程实验实验2数据降维与可视化实验背景实验目标实验数据集说明实验参考步骤实验过程1.对数据进行初步降维
甘晴void
·
2024-01-22 06:31
#
【专选】数据挖掘
数据挖掘
人工智能
褪去一身雪白,美的低调的它才是夏季小众避暑胜地!
很多人多次前去只为一睹
天池
全貌,但能不能看到还得看人品。↑↑↑趁着这个最佳观景季节,先一睹它的真面容
lejing姜
·
2024-01-22 04:53
Weka在
数据挖掘
中的运用 02 Getting Started with Weka
Weka的发音不是Weaker安装Weka研究“Explorer”接口研究一些数据集创建一个分类器解释输出使用filters(过滤器)可视化数据集安装Wekajava环境安装包选择适合你电脑系统的版本。Explorer界面对于这门课程指用到Exploer界面。Experimenter界面针对基于不同数据集的不同机器学习方法的大规模性能比较。KnowlegeFlow界面是Weka的图形界面和命令行界
jenye_
·
2024-01-22 03:00
【学习笔记】-使用LSTM算法实现余额宝资金流入流出预测
使用LSTM算法实现余额宝资金流入流出预测关键词:LSTM、基于大规模历史数据预测、MSE数据来源:[
天池
大赛-资金流入流出预测-挑战Baseline]数据预处理:根据数据集进行数据预处理生成每日购入资金总量
Michelle F
·
2024-01-21 23:02
lstm
python
算法
情深不寿四海平
天池
边,树木森森,万物生长,灵韵弥漫。祥端之上,仙人驾彩云飞掠,端方如玉。世间纤尘不染,清灵正义,天地明朗,一派安宁祥和。
林寒灯
·
2024-01-21 18:08
一文梳理金融风控建模全流程(Python)
数据筛选六、数据划分七、变量分箱卡方分箱手动调整分箱八、建立模型相关性分析多重共线性检验VIFKS和AUC评分映射PSI稳定性指标九、关键指标说明WOE值IV值逻辑回归KS值PSI▍风控信用评分卡简介通过运用
数据挖掘
算法
风控小兵突击
·
2024-01-21 18:30
智能风控
python
数据分析
算法
机器学习
数据挖掘
概率论
借我点钱,让我去远方
借我点钱让我去远方我会搭上南下的飞机穿过朵朵白云到海南岛上呼吸海风让椰子结结实实地落在我的脑袋上在沙滩上漫步看那天真的孩子和姑娘的酒窝借我点钱让我去远方我会骑上西进的牦牛沿着崎岖山路到青藏高原放声高歌燃烧牛粪的浓烟会呛得我涕泪横流在草地上打滚听那动人的故事和美丽的传说借我点钱让我去远方我会坐上北上的火车穿过片片山林到长白山麓纵情嬉笑山中的狗熊会追得我狼狈而逃在
天池
畅游捞那池中的游鱼和悠闲的水草借我
98357e9c0172
·
2024-01-21 13:26
datawhale
第三章-模型架构
一、大模型的分词器1.1什么是分词?分词的目的是将输入文本分成一个个词元,保证各个词元拥有相对完整和独立的语义,以供后续任务(比如学习embedding或者作为高级模型的输入)使用。1.2分词的三种粒度词粒度在英文等语言中有着天然的空格分隔,但是对于中文等语言可能需要额外的分词算法来进行处理(比如中文的jieba分词)词粒度的缺点:词粒度的词表由于长尾效应可能会非常大,并且稀有词往往很难学好;OO
fan_fan_feng
·
2024-01-21 08:41
人工智能
2022-10-07读《应科目时与人书》——看韩愈委婉求人的艺术
应科目(1)时与人书韩愈月日愈再拜(2):
天池
之滨,大江之濆(3),曰有怪物焉(韩愈自
Thinker
·
2024-01-21 03:14
小荷尖尖
问:在第几
天池
塘中的荷花开了一半?很多人都会很肯定的回答是第15天,对吗?错!是第29天。这就是著名的荷花定律,也叫30天定律。
肖楠语
·
2024-01-21 03:45
大数据技术原理及应用课实验5 :MapReduce初级编程实践
实验总结五、优化及改进(选做)实验5MapReduce初级编程实践一、实验目的1.通过实验掌握基本的MapReduce编程方法;2.掌握用MapReduce解决一些常见的数据处理问题,包括数据去重、数据排序和
数据挖掘
等
Blossom i
·
2024-01-21 02:20
大数据编程
大数据
mapreduce
荷花定律,微习惯,告诉我们坚持就是胜利
如果到第30天,荷花就开满了整个池塘,那么请问:在第几
天池
塘中的荷花开了一半?第15天?错!是第29天。这就是著名的荷花定律,也叫30天定律。
玉谦先生
·
2024-01-21 02:05
(202401)深度强化学习基础2:策略梯度
文章目录前言策略梯度1基于价值算法的缺点2策略梯度算法3REINFORCE算法本章小结前言感谢
Datawhale
成员的开源本次学习内容的文档地址为第九章策略梯度策略梯度这个章节会开始介绍基于策略梯度的算法
早上真好
·
2024-01-20 22:27
参与dw开源学习
深度学习
(202401)深度强化学习基础与实践1:马尔科夫过程、DNQ算法回顾
文章目录序言马尔科夫决策过程含义性质回报状态转移矩阵DQN算法深度网络经验回放目标网络实战DQN算法DQN算法进阶DoubleDQNDuelingDQNNoisyDQNPERDQNC51算法序言本文章记录
Datawhale
早上真好
·
2024-01-20 22:56
参与dw开源学习
pytorch
深度学习
【大数据分析与挖掘技术】概述
目录一、
数据挖掘
简介(一)
数据挖掘
对象(二)
数据挖掘
流程(三)
数据挖掘
的分析方法(四)经典算法二、Mahout(一)Mahout简介(二)主要特性(三)Mahout安装与配置一、
数据挖掘
简介需要是发明之母
Francek Chen
·
2024-01-20 21:18
大数据技术基础
数据分析
数据挖掘
Mahout
datawhale
大模型理论基础 引言
学习地址:大模型理论基础一、什么是语言模型(LanguageModel)语言模型其实是一个概率模型,给每一个句子列表计算一个概率值:p(x1,…,xL)例如:p(the,mouse,ate,the,cheese)=0.02,p(the,cheeseate,the,mouse)=0.01,p(the,cheeseate,the,mouse)=0.01自回归语言模型(Autoregressivelan
fan_fan_feng
·
2024-01-20 19:49
大模型
人工智能
大模型
datawhale
第二章-大模型的能力
一、概述GPT-3作为一个语言模型,被训练来预测下一个词。并未明确针对特定任务进行训练。在某些任务上,比如语言建模,GPT-3大幅度超越了现有技术的最高水平;在其他任务上,GPT-3与训练有素,拥有大量标签数据的系统竞争时,却明显落后二、语言模型的适应性:从语言模型到任务模型的转化将要给语言模型往特定任务模型转换的过程中,需要以下两个输入:任务描述:即解释一下你这个任务是要干嘛的训练实例:也就是通
fan_fan_feng
·
2024-01-20 19:49
大模型
人工智能
大模型
Datawhale
强化学习笔记(二)马尔可夫过程,DQN 算法
函数如何用梯度下降的方式更新网络参数强化学习vs深度学习提高训练稳定性的技巧经验回放目标网络代码实战DQN算法进阶DoubleDQNDuelingDQN算法代码实战参考在线阅读文档github教程开源框架JoyRL
datawhale
china
RessCris
·
2024-01-20 17:54
强化学习
笔记
算法
DataWhale
组队学习之知识图谱task04
参考
datawhale
开源组织:https://github.com/
datawhale
china/team-learning-nlp/blob/master/KnowledgeGraph_Basic/
YANJINING
·
2024-01-20 16:28
【python】
数据挖掘
分析清洗——特征选择(特征筛选)方法汇总
目录前言一、过滤法1.1基于方差1.2相关系数二、包裹式2.1随机森林2.2XGBoost重要性分析2.3SFS序列前向选择算法(SequentialForwardSelection)三、嵌入式3.1SVC总结本文链接:https://blog.csdn.net/weixin_47058355/article/details/130400400?spm=1001.2014.3001.5501数据挖
程序员老冉
·
2024-01-20 16:41
python
数据挖掘
动画
开发语言
数据分析
计算机毕业设计 基于SpringBoot的餐厅点餐管理系统的设计与实现 Java实战项目 附源码+文档+视频讲解
博主介绍:✌从事软件开发10年之余,专注于Java技术领域、Python人工智能及
数据挖掘
、小程序项目开发和Android项目开发等。
IT学长编程
·
2024-01-20 13:29
计算机毕业设计1000套
毕业设计
毕业论文
课程设计
Java
spring
boot
Vue
Datawhale
AI夏令营 机器学习组学习日记(任务2.1-2.2)
一、任务2.11.1任务内容字段x1至x8为用户相关的属性,为匿名处理字段。添加代码对这些数据字段的取值分析,那些字段为数值类型?那些字段为类别类型?对于数值类型的字段,考虑绘制在标签分组下的箱线图。从common_ts中提取小时,绘制每小时下标签分布的变化。对udmap进行onehot,统计每个key对应的标签均值,绘制直方图。1.2代码解析1.2.1字段x1至x8属性分析#导入库importp
m0_49558200
·
2024-01-20 06:11
机器学习
学习
人工智能
数据挖掘
python
数据分析
Datawhale
AI夏令营 机器学习组学习日记(任务1)
一、赛题内容本次大赛提供了讯飞开放平台海量的应用数据作为训练样本,参赛选手需要基于提供的样本构建模型,预测用户的新增情况。赛题数据由约62万条训练集、20万条测试集数据组成,共包含13个字段。其中uuid为样本唯一标识,eid为访问行为ID,udmap为行为属性,其中的key1到key9表示不同的行为属性,如项目名、项目id等相关字段,common_ts为应用访问记录发生时间(毫秒时间戳),其余字
m0_49558200
·
2024-01-20 06:10
人工智能
机器学习
学习
python
数据挖掘
大数据
数据挖掘
第四章 分类:基本概念、决策树与模型分析
分类任务就是确定对象属于那个与定义的目标类4.1预备知识分类任务的输入数据时记录的集合。每条记录也称实例,用元组(x,y)表示,其中x是属性的集合,而y是一个特殊的属性,指出实例的类标号。属性主要是离散的,但可以是连续的。但类标号必须是离散的,这是区别分类与回归的关键特性。回归是一种预测建模任务,其中y属性是连续的
啦啦啦_9a5f
·
2024-01-20 02:35
贷款违约预测-Task5 模型融合
赛题:零基础入门
数据挖掘
-零基础入门金融风控之贷款违约预测项目地址:https://github.com/
datawhale
china/team-learning-data-mining/tree/master
致Great
·
2024-01-19 21:45
干货:自助分析BI产品实践指南
百度百科上BI的定义是:商业智能(BusinessIntelligence,简称:BI),指用现代数据仓库技术、线上分析处理技术、
数据挖掘
和数据展现技术进行数据分析以实现商业价值。
e73fe7dcce95
·
2024-01-19 19:18
【
Datawhale
x 财务学习笔记】用智谱清言的代码沙盒进行分析
体验网址智谱清言:https://chatglm.cn/prompt帮我分析一下这个excel文件,从财务角度给出利润情况,并给出优化建议体验结果首先,我将查看上传的Excel文件的内容,以便了解其结构和包含的数据。然后,我将基于这些数据进行分析,并提供财务角度的利润情况和优化建议。让我们开始吧。importpandasaspd#LoadtheExcelfilefile_path='/mnt/da
JeffDingAI
·
2024-01-19 16:21
学习
笔记
看完这28个python爬虫项目,你离爬虫高手就不远了,不够来找我
2.作为机器学习、
数据挖掘
的原始数据比如你要做一个推荐系统,那么你可以去爬取更多维度的数据,做出更好的模型。3.爬取优质的
再不会python就不礼貌了
·
2024-01-19 15:59
python
爬虫
开发语言
Python入门
02.这一次连上帝都“方”了!谢慧霖《婴儿暴风雨》
药水配好了,他连忙去
天池
,把药水都倒
Linda妞妈
·
2024-01-19 14:52
清华毕业生去哪了?
Datawhale
分享2023届就业情况,来源:清华大学近日,清华就业工作会召开清华2023届档案在校本科毕业生3200多人档案在校研究生毕业生5200多人这些清华学生毕业后都去哪了?就业还是深造?
Datawhale
·
2024-01-19 09:03
ICLR 2024接收率31%,清华LCM论文作者:讲个笑话,被拒了!
Datawhale
分享顶会:ICLR2024,编辑:机器之心你被拒了吗?ICLR2024国际学习表征会议已经来到了第十二届,将于今年5月7日-11日在奥地利维也纳会展中心举行。
Datawhale
·
2024-01-19 09:33
超过GPT3.5?Mixtral 8*7B 模型结构分析
Datawhale
干货作者:宋志学,
Datawhale
成员前言2023年12月11日,MistralAI团队发布了一款高质量的稀疏专家混合模型Mixtral8x7B。
Datawhale
·
2024-01-19 09:00
gpt-3
计算机毕业设计 基于MVC的自习室管理和预约系统的设计与实现 Java实战项目 附源码+文档+视频讲解
博主介绍:✌从事软件开发10年之余,专注于Java技术领域、Python人工智能及
数据挖掘
、小程序项目开发和Android项目开发等。
IT学长编程
·
2024-01-19 09:56
计算机毕业设计1000套
毕业设计
毕业论文
课程设计
Java
javaweb
spring
boot
前后端分离
计算机毕业设计 基于SpringBoot的红色革命文物征集管理系统的设计与实现 Java实战项目 附源码+文档+视频讲解
博主介绍:✌从事软件开发10年之余,专注于Java技术领域、Python人工智能及
数据挖掘
、小程序项目开发和Android项目开发等。
IT学长编程
·
2024-01-19 09:22
计算机毕业设计1000套
毕业设计
课程设计
毕业论文
Java
spring
boot
前后端分离
AI时代的财富创造:人工智能科技在金融领域的应用
机器学习、自然语言处理、
数据挖掘
等技术的融合,使得金融机构能够更加智能地处理大规模数据,提高
21CN科技
·
2024-01-19 08:10
人工智能
科技
金融
基于
数据挖掘
机器学习的心脏病患者分类建模与分析
首先,读取数据集,该数据集是UCI上的心脏病患者数据集,其中包含了303条患者信息,每一名患者有13个字段记录其基本信息(年龄、性别等)和身体健康信息(心率、血糖等),此外有一个类变量记录其是否患有心脏病。详细的字段信息可见此处。类别字段target有两个取值,代表预测类别,1=患病,2=不患病。2.训练/测试集划分对数据集进行划分,设置划分比例为训练集:测试集=4:1。由于数据集的同一类标签集中
mqdlff_python
·
2024-01-19 08:13
机器学习实战
数据挖掘
分类
人工智能
心脏病
机器学习
2020-12-10
研一下学期开了一门《
数据挖掘
与分析》的课,虽然我也不知道经济学为什么会开这种课,也许是因为学院顶了一个“大数据”的高大上(假大空)头衔,无论怎样,我与机器学习的缘分从此结下。
PrinceKare
·
2024-01-19 05:35
逍遥游(节选)| 庄子
南冥者,
天池
也。《齐谐》者,志怪者也。《谐》之言曰:“鹏之徙于南冥也,水击三千里,抟扶摇而上者九万里,去以六月息者也。”野马也,尘埃也,生物之以息相吹也。天之苍苍,其正色邪?其远而无所至极邪?
舞英社
·
2024-01-19 00:04
数据库系统原理总结之——数据管理技术的发展
第八章数据管理技术的发展第八章数据管理技术的发展一、数据库技术发展★★二、数据仓库★★★三、
数据挖掘
的功能★★★四、大数据的定义★★五、大数据存储★六、NoSQL系统支持的数据存储模型★★★★七、MapReduce
润小仙女
·
2024-01-19 00:45
数据库系统原理总结
数据库
数据库系统
上一页
5
6
7
8
9
10
11
12
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他