E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
数据仓库数据挖掘
大数据开发(Hive面试真题-卷二)
跟
数据仓库
区别?3、Hive架构?4、Hive数据倾斜以及解决方案?5、Hive如果不用参数调优,在map和reduce端应该做什么?6、Hive的三种自定义函数是什么?实现步骤与流程?
Key-Key
·
2024-03-20 05:14
大数据
hive
面试
R语言microeco:一个用于微生物群落生态学
数据挖掘
的R包(构建microeco对象。
R语言microeco:一个用于微生物群落生态学
数据挖掘
的R包。主要功能R6类;分类群丰度图,维恩图,Alpha多样性,Beta多样性,差异丰度分析,环境数据分析,零模型分析,网络分析,功能分析。
还是要前进啊
·
2024-03-18 20:30
R语言
r语言
数据挖掘
数据挖掘
-数据预处理的必要性及主要任务
低质量的数据导致低质量的
数据挖掘
。2、数据预处理技术(1)数据清理:可以用来清除数据中的噪声,纠正不一致。(2)数据集成:将数据由多个数据源合并成一个一致的数据存储,如
数据仓库
。
嘣嘣嚓
·
2024-03-17 10:16
数据挖掘
数据仓库
数据库
数据分析
人工智能
数据挖掘
中的【数据预处理】
学习参考链接:[整理一份详细的数据预处理方法(https://zhuanlan.zhihu.com/p/51131210)数据预处理有两种不同的理解:1、
数据挖掘
中的预处理改善数据质量,有利于后期分析数据去重数据异常
ZFour_X
·
2024-03-17 09:15
文本挖掘学习
数据分析
大数据
MySQL建表以及excel内容导入
一个数据库从逻辑上来说是由一个或多个表空间所组成,表空间是数据库中物理编组的
数据仓库
。每一个表空间是由段所组成,一个表空间存放一个或多个数据库的物理文件。一个数据库中的
jameszjd
·
2024-03-17 00:03
mysql
excel
oracle
数据仓库
的设计开发应用(三)
目录五、
数据仓库
的实施(一)
数据仓库
的创建(二)数据抽取转换加载六、
数据仓库
系统的开发(一)开发任务(二)开发方法(三)系统测试七、
数据仓库
系统的应用(一)用户培训(二)决策支持(三)维护评估 五、
数据仓库
的实施
Francek Chen
·
2024-03-16 14:22
数据仓库与数据挖掘
数据仓库
大数据
数据仓库设计
数据库开发
科技革新的引擎-2024年AI辅助研发趋势
在研发过程中,AI可以通过自动化流程、
数据挖掘
和深度学习等技术,加速实验和设计的过程,从而缩短研发周期。同时,AI还可以优化资源配
lzyever
·
2024-03-15 20:54
科技
人工智能
03hive数仓安装与基础使用
hiveHive概述Hive是基于Hadoop的一个
数据仓库
工具。
daydayup9527
·
2024-03-14 13:39
hadoop_hive
运维
hadoop
R语言及其开发环境简介
R语言使用人员为数学研究工作者设计的一种数学编程语言,主要用于统计分析、绘图、
数据挖掘
。R语言特点一种解释型的面向
luohaha66
·
2024-03-11 02:56
R
常规
r语言
Spark从入门到精通29:Spark SQL:工作原理剖析以及性能优化
SparkSQL工作原理剖析1.编写SQL语句只要是在数据库类型的技术里面,例如MySQL、Oracle等,包括现在大数据领域的
数据仓库
,例如Hive。
勇于自信
·
2024-03-11 00:20
ETL策略
数据仓库
平台,ETL是很重要一环,看ETL的发展史,最初使用表格,人工从系统下载,在excel匹配,然后加载到
数据仓库
平台,到后来开始出现ETL工具,大概分为两个派别,以ETL架构的datastage,
朱先生_hfm
·
2024-03-10 13:11
etl
数据仓库
R语言简介,R语言开发环境搭建步骤,R基础语法以及注释详解
R语言是一种自由、免费、源代码开放的软件,属于GNU系统的一个分支,如今被广泛地应用于统计分析、
数据挖掘
等领域。
黑夜照亮前行的路
·
2024-03-08 20:47
r语言
【
数据仓库
作业】第1章 绪论
三、简述
数据仓库
的定义。四、简述
数据仓库
的特征。五、简述主题的定义。六、简述元数据的概念。七、简述
数据挖掘
的主要任务。八、简述
数据挖掘
的主要步骤。九、下列活动是否属于
数据挖掘
任务,并简述其理由。
Francek Chen
·
2024-03-06 06:28
数据仓库与数据挖掘
数据仓库
数据库
数据挖掘
数据挖掘
与python实践中国慕课答案_中国大学MOOC(慕课)_
数据挖掘
与python实践_慕课答案...
纸浆中的颜色主要来源于()纺锤丝分为三种类型:_、_和_。纵轴为good,另一轴为bad的无异曲线,其效用递增方向是?只能选择一个:纽扣电池是锌银电池。纽约股灾爆发,日本银行推行的政策是()。尼西土陶在装饰纹饰中以()纹占主导地位。纸质密码本与电子密码本相比其优点是更换较为方便。纹沟发育形成()纺织文化在下面哪个方面表现?纽扣电池是锌银电池。纸艺手工制作时为省事可以选用双面胶粘合,因为双面胶也可以
weixin_39962285
·
2024-03-06 02:24
让数据用起来:数据中台建设的评估与选择(第4章)
开始构建企业级
数据仓库
,使用BI工具、大屏等。第三个阶段:数据驱动。加强业务与数据融合,利用大数据、机器学习、深度学习等技术进行精准营销、信用风险控制等。第四个阶段:运营优化。
小阳阳兄
·
2024-03-03 02:20
读书笔记
产品经理
数据分析
大数据
Hive
数据仓库
行转列
查了很多资料发现网上很多文章都是转发和抄袭,有些问题。这里分享一个自己项目中使用的行转列例子,供大家参考。代码如下:SELECTmy_id,nm_cd_map['A']ASmy_cd_a,nm_cd_map['B']ASmy_cd_b,nm_cd_map['C']ASmy_cd_c,nm_num_map['A']ASmy_num_a,nm_num_map['B']ASmy_num_b,nm_num
XueminXu
·
2024-02-28 07:47
大数据
hive
行转列
str_to_map
COLLECT_LIST
STRUCT
数据仓库
和数据湖的区别
数据仓库
和数据湖是两种不同的数据存储和管理架构,它们有以下区别:1.数据结构:
数据仓库
采用结构化的数据模型,通常是规范化的关系型数据库,其中数据以表格形式组织,使用预定义的模式和架构。
图灵追慕者
·
2024-02-28 02:10
中台
数据仓库
数据湖
数据中台
算法平台
【云学院干货】
数据仓库
服务:在冗余海量数据中找到正确决策
数据仓库
服务:在冗余海量数据中找到正确决策目前
数据仓库
分析解决方案在金融,电信,零售等多个行业发展迅速,很多企业在关键决策中需要对自身海量数据进行多样化,深层次的分析。
舒意从生
·
2024-02-24 07:21
21、什么是
数据挖掘
和KDD(知识发现)
我认为研究
数据挖掘
是有用的,因为它是一个从数据中发现的过程。在这篇文章中,您将从教科书和论文中探索“
数据挖掘
”的权威定义。由于
数据挖掘
是一个过程,因此定义将包括对过程的许多解释。
攻城狮笔记
·
2024-02-23 18:58
每天一个数据分析题(一百六十四)
关于OLAP系统,下列选项不正确的是()A.是基于
数据仓库
的信息进行分析处理过程B.用户数量相对较少,其用户主要是业务决策人员与管理人员C.对响应时间要求非常高。
紫色沙
·
2024-02-22 22:43
数据分析题库
数据分析
大数据
数据挖掘
大数据计算技术秘史(上篇)
其实在大数据技术兴起之前,对于用户来讲并没有存储和计算的区分,都是用一套数据库或
数据仓库
的产品来解决问题。而在数据量爆炸性增长后,情况就变得不一样了。
·
2024-02-22 20:33
人工智能
为什么要使用纯净住宅代理?
随着互联网的快速发展,代理服务器已经成为许多在线活动的关键组成部分,从
数据挖掘
到网络安全。然而,随着技术的不断发展,住宅IP代理正崭露头角,因其在保障隐私、提升性能和应对封锁方面的卓越优势而备受瞩目。
Snow跨境日记
·
2024-02-20 22:56
代理IP
ip
tcp/ip
网络协议
网络
开源ETL工具
ETL是构建
数据仓库
的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的
数据仓库
模型,将
SkTj
·
2024-02-20 20:15
ETL、ELT区别以及如何正确运用
这种方法适用于需要对数据进行加工和整合后再加载到目标系统的场景,如
数据仓库
构建、商业智能报表制作等。相比之下,ELT(Extract,Load,Transform)则是先将数据从源系统抽取出来,直
·
2024-02-20 18:00
etl数据处理
Google Earth Engine(GEE)——GHSL 全球人口网格数据集250米分辨率
正式开始数据介绍:GHSL依赖于新的空间
数据挖掘
技术的设计和实施,允许从大量异构数据中自动处理和提取分析和知识,这些数据包括:全球、精细规模的卫星图像数据流、人口普查数据和人群来源或自愿地理信息来源。
此星光明
·
2024-02-20 18:43
GEE数据集专栏
大数据
人口
数据集
网格
gee
基于人工智能的期权量化交易
基于实时/历史期权行情大
数据挖掘
,通过自行开发的人工智能多agent强化学习模型及评估系统(基于Python/Linux),对接实时交易接口进行了实盘环境的交易回测和评估。
阿岛格
·
2024-02-20 17:23
人工智能.量化投资
人工智能
机器学习
大数据
强化学习
零基础入门金融风控-贷款违约预测Task2 数据分析
赛题:零基础入门
数据挖掘
-零基础入门金融风控之贷款违约目的:1.EDA价值主要在于熟悉了解整个数据集的基本情况(缺失值,异常值),对数据集进行验证是否可以进行接下来的机器学习或者深度学习建模.2.了解变量间的相互关系
一缕阳光lyz
·
2024-02-20 13:45
数据分析
数据挖掘
【机器学习笔记】13 降维
维数灾难涉及数字分析、抽样、组合、机器学习、
数据挖掘
和数据库
RIKI_1
·
2024-02-20 11:13
机器学习
机器学习
笔记
人工智能
BI 数据分析,数据库,Office,可视化,
数据仓库
AIGCChatGPT职场案例AI绘画与短视频制作PowerBI商业智能68集Mysql8.054集Oracle21C142集Office2021实战应用Python数据分析实战,ETLInformatica
数据仓库
案例实战
阿里数据专家
·
2024-02-20 07:29
数据分析
数据库
数据仓库
excel
AIGC
powerpoint
数据挖掘
怎么用ETL工具实现MQ消息同步
而在一些特定场景下,需要将MQ中的消息同步到
数据仓库
或其他存储系统中,以便进行更深入的数据分析和挖掘。这时候,ETL工具可以成为实现MQ消息同步的利器。
RestCloud
·
2024-02-20 06:30
ETL
数据集成
MQ
ETL数据集成工具DataX、Kettle、ETLCloud特点对比
ETL数据集成工具对于
数据仓库
,大数据集成类应用,通常会采用ETL工具辅助完成。
RestCloud
·
2024-02-20 05:28
ETL
数据集成
datax
kettle
数据仓库
、大数据平台、数据中台的区别
2、
数据仓库
、大数据平台、数据中台都是什么?3、大数据平台硬件架构如何设计?4、
数据仓库
、大数据平台、数据中台架构如何理解?
000X000
·
2024-02-20 05:30
数据中台
我该建数仓、大数据平台还是数据中台?看完脑子终于清醒了
:顶层的有数字城市、智慧地球、智慧城市、城市大脑;企业层面的有数字化转型、互联网经济,数字经济、数字平台;平台层面的有物联网,云计算,大数据,5G,人工智能,机器智能,深度学习,知识图谱;技术层面的有
数据仓库
zl1zl2zl3
·
2024-02-20 05:30
大数据
中台
大数据
中台
数据挖掘
十大经典算法之KNN
一、knn介绍1.K最近邻(k-NearestNeighbor,KNN)分类算法,属于有监督学习中的分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。2.KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样本
我姓许啊
·
2024-02-20 01:41
机器学习
(在很大程度上忽视计算的考虑)到广泛的学科(该学科产生了基本的学习过程的统计-计算理论)已经设计了许多学习算法,这些算法通常应用在商业系统中,例如语音识别,计算机视觉,和其他各种各样的任务,并已剥离了
数据挖掘
中的工业来发掘网上不断增长的数据量中隐藏的规律
会敲键盘的猩猩
·
2024-02-19 23:23
PRML
机器学习
大数据架构体系(
数据仓库
)
1、传统大数据架构优点缺点使用场景简单,易懂,对于BI系统来说,基本思想没有发生变化,变化的仅仅是技术选型,用大数据架构替换掉BI的组件1、没有BI下如此完备的Cube架构,虽然目前有kylin,但是kylin的局限性非常明显,远远没有BI下的Cube的灵活度和稳定度,因此对业务支撑的灵活度不够,2、存在大量报表,或者复杂的钻取的场景,需要太多的手工定制化3、同时该架构依旧以批处理为主,缺乏实时的
Shaw_Bigdata
·
2024-02-19 21:52
技术学习分享
数据仓库
大数据
纯净住宅代理详细解析与应用
随着互联网的快速发展,代理服务器已经成为许多在线活动的关键组成部分,从
数据挖掘
到网络安全。然而,随着技术的不断发展,住宅IP代理正崭露头角,因其在保障隐私、提升性能和应对封锁方面的卓越优势而备受瞩目。
做跨境的红姐
·
2024-02-19 20:19
代理IP
ip
tcp/ip
阿里云
企业如何选择一款高效的ETL工具
在企业发展至一定规模后,构建
数据仓库
(DataWarehouse)和商业智能(BI)系统成为重要举措。
·
2024-02-19 19:23
etl
ETL数据集成工具DataX、Kettle、ETLCloud特点对比
ETL数据集成工具对于
数据仓库
,大数据集成类应用,通常会采用ETL工具辅助完成。
·
2024-02-19 19:52
etlkettle
广告欺诈
最后,你要有熟练的
数据挖掘
能力。分析这个问题,前前后后有一个月,从不同角度去思考,去尝
Liam_ml
·
2024-02-19 19:30
python学爬虫还是人工_0基础如何学python,如何学爬虫,如何学数据分析,如何学人工智能并转到这些行业?(亲身经验)...
最近1年的主要学习时间,都投资到了python据分析和
数据挖掘
上面来了,虽然经验并不是十分丰富,但希望也能把自己的经验分享下,最近也好多朋友给我留言,和我聊天,问我python该如何学习,才能少走弯路,
weixin_39852647
·
2024-02-19 18:25
python学爬虫还是人工
R语言Apriori关联规则、kmeans聚类、决策树挖掘研究京东商城网络购物用户行为数据可视化|附代码数据
项目计划使用
数据挖掘
的方法,以京东商城网购用户的网络购物数据为基础,对网络购物行为的三
·
2024-02-19 18:42
数据挖掘
解读 EventBridge Transform,数据转换和处理的灵活能力
除此之外,它还可以作为流式的数据管道,在不同的
数据仓库
和数据处理或分析程序之间快速构建ETL系统。本文将从以下几个方面展开对阿里云EventBridgeTran
·
2024-02-19 18:08
见世面的成本有多低?这几个技术公众号告诉你答案
大数据分析挖掘和Python机器学习商业智能BI、数据分析、
数据挖掘
、大数据、Python、机器学习、深度学习、算法等技术分享
傅一平
·
2024-02-19 16:19
数据脱敏(四)脱敏算法-替换算法
这种技术在数据分析、
数据挖掘
、数据共享等领域有广泛应用。在实际操作中,替换脱敏通常包括以下几个步骤:1.识别敏感信息:首先需要确定哪些信息是敏感的,例如个人信息、财务
colorknight
·
2024-02-19 14:24
低代码
数据脱敏
替换脱敏
字典替换
随机替换
Kimen
Python环境下基于深度判别迁移学习网络的轴承故障诊断
目前很多机器学习和
数据挖掘
算法都是基于训练数据和测试数据位于同一特征空间、拥有相同数据分布的假设。然而在现实应用中,该假设却未必存在。
哥廷根数学学派
·
2024-02-19 12:36
故障诊断
信号处理
深度学习
python
迁移学习
开发语言
数据系统架构-10.数仓开发平台
数仓开发平台1.背景
数据仓库
是存储各种数据的仓库,形同于现实当中存储货物的仓库,不可避免的存在“乱放”、“不方便存取”、“浪费空间”等情况。
·
2024-02-19 11:45
大数据系统架构数据仓库
RapidMiner缺失数据处理——去掉数据大量缺失的变量
最近做
数据挖掘
,发现RapidMiner是一款数据清洗、处理和转换的好工具,尤其在数据量不大的情况下。和R语言相比,RapidMiner在数据处理方面要简单直观得多。
carlwu
·
2024-02-19 11:59
数据挖掘
RapidMiner
数据挖掘
RapidMiner
Java
R语言
RapidMiner
数据挖掘
RapidMiner
数据挖掘
入门之一:概要1简介RapidMiner原名Yale,它是用于
数据挖掘
、机器学习、商业预测分析的开源计算环境。
arrow8071
·
2024-02-19 11:28
data
mining
数据挖掘
RapidMiner
数据挖掘
2 —— 初识RapidMiner
大多数练习都是关于图表技术,通常用于
数据挖掘
。为此,我们将使用RapidMiner软件。请求的工作包括发现应用程序的图形用户界面(GUl),以及检查和处理示例数据集的不同元素。
思诺学长
·
2024-02-19 11:23
RapidMiner数据挖掘
数据挖掘
人工智能
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他