E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
数据中台数据仓库
sklearn中tfidf的计算与手工计算不同详解
sklearn中tfidf的计算与手工计算不同详解引言:本周
数据仓库
与数据挖掘课程布置了word2vec的课程作业,要求是手动计算corpus中各个词的tfidf,并用sklearn验证自己计算的结果。
stay_foolish12
·
2023-12-02 02:17
sklearn
tf-idf
人工智能
开源多组件
数据中台
整体框架设计
本文参考该论证思维工具,结合自身的工作经验,来论证下当前为什么“开源多组件
数据中台
”是政务数据应用的选择之一。一、什么是
数据中台
?
开源数据中台
·
2023-12-02 01:50
开源
数据挖掘
数据仓库
数据中台
架构原理与开发实战:
数据中台
项目管理流程
作者:禅与计算机程序设计艺术1.背景介绍数据架构概述数据架构(DataArchitecture)作为IT企业运用新型信息技术(IT)技术革命带来的变革,已经成为越来越重要的领域。随着互联网、移动互联网、物联网、云计算等新一代技术的发展,人类活动产生的数据量正在以指数级增长。而数据架构就成为了构建和维护这些海量数据的基石。由于数据量的爆炸性增长,传统单体数据库已无法满足业务需求的同时,还面临新的挑战
禅与计算机程序设计艺术
·
2023-12-02 01:49
AI大模型应用实战
大数据
人工智能
语言模型
Java
Python
架构设计
数据中台
架构原理与开发实战:数据可视化与数据报表
2017年,阿里巴巴集团发布了"支付宝
数据中台
",该平台旨在打通数据分析、决策制定和营
禅与计算机程序设计艺术
·
2023-12-01 23:48
AI大模型应用实战
大数据
人工智能
语言模型
Java
Python
架构设计
直播电商
数据仓库
直播电商
数据仓库
一.数仓及其维度什么是数仓
数据仓库
,简称数仓,(DataWarehouse)。
李昊哲小课
·
2023-12-01 21:31
数据分析
大数据
数据库
数据仓库
大数据
数据分析
数据可视化
数据库
数据库开发
finebi
缓慢变化维 (Slowly Changing Dimension) 常见的三种类型及原型设计
开篇介绍在从OLTP业务数据库向DW
数据仓库
抽取数据的过程中,特别是第一次导入之后的每一次增量抽取往往会遇到这样的问题:业务数据库中的一些数据发生了更改,到底要不要将这些变化也反映到
数据仓库
中?
叫我老村长
·
2023-12-01 16:57
数据中台
之核心调度模块的设计
目录1.DAG图的设计1.1功能设计要点1.2数据库设计要点2.调度器设计2.1XXL-JOB调度架构特点
数据与后端架构提升之路
·
2023-12-01 12:51
数据中台
调度系统
数据中台
之OneService
OneService定义数据服务(OneService)作为统一的数据服务出口,实现了数据的统一市场化管理,有效地降低数据开放门槛的同时,保障了数据开放的安全。如何构建OneService●第一步:API定义API的定义包括:快速配置参数、选择排序字段、API类型多样性、数据预览、复制字段等方面。API的类型又包括生成API、注册API、服务分组及服务编排这4个方面。●第二步:API发布API的发
数据与后端架构提升之路
·
2023-12-01 12:50
数据中台
大数据
一文读懂:制造业头部企业如何构建经营分析数字化体系
用BI数据分析手段,通过SAPBW/4HANA、SAPSACPlanning、
数据中台
、Hadoop等构建大数据平台,实现企业经营分析的数字化在近年逐步被认可和推崇,尤其是数字化场景的经营分析会成为数字化转型的亮点应用之一
智扬信达
·
2023-12-01 09:11
业务
big
data
数据挖掘
数据分析
制造
(免费领源码)java#ssm#mysql 招聘客户管理系统78049-计算机毕业设计项目选题推荐
摘要由于数据库和
数据仓库
技术的快速发展,招聘客户管理系统建设越来越向模块化、智能化、自我服务和管理科学化的方向发展。
2301_3224142804
·
2023-11-30 21:53
python
django
mysql
java
小程序
php
c#
c语言知识
一、内存what从硬件形态上讲,内存就是一个物理设备,从功能上讲,内存是一个
数据仓库
,程序在执行前都有被装载到内存中,才能被中央处理器处理(CPU)执行。
快乐的tomato
·
2023-11-30 18:35
基于Apache doris怎么构建
数据中台
(五)-数据质量管理
上一次我们讲了,数据怎么进行快速的接入,这次我们讲在接入及后续的数据处理中质量怎么控制如何更加合理、高效的监控每类作业的运行状态,并将原本分散、孤岛式的监控日志信息通过规则引擎集中共享、关联、处理;洞察关键信息,形成事前预判、事中监控、事后跟踪的质量管理闭环流程;沉淀故障问题,搭建解决方案的知识库体系。在数据质量监管平台的规划建设中,面临如下挑战:缺乏统一监控视图,离线和实时作业监控分散,影响性、
张家锋
·
2023-11-30 17:48
数据中台
具体是怎么解决数据孤岛的?_光点科技
为了解决这一问题,
数据中台
应运而生。
数据中台
是一种新型的数据管理架构,旨在打破数据孤岛,通过集中处理和管理数据,提高数据的可访问性和可用性。具体来说,
光点数据治理
·
2023-11-30 14:22
科技
大数据
数据中台
光点
数据中台
能干啥?怎么做?用在哪?_光点科技
数据中台
的支持是企业中任何高层次的业务应用不可或缺的。数据中心面向的公司业务不再是单一业务线,而是从公司整体角度审视业务全景,寻找可重用的沉淀能力。今天,让我们来了解一下。
光点数据治理
·
2023-11-30 14:52
数据仓库
数据库
大数据
企业的
数据中台
到底指的是什么?_光点科技
随着数据技术的不断发展和企业数据应用的广泛应用,越来越多的企业开始将
数据中台
作为数字化转型的核心战略之一。那么,企业的
数据中台
到底指的是什么呢?
光点数据治理
·
2023-11-30 14:52
科技
大数据
人工智能
光点高校
数据中台
,助力高校信息化迎来发展新格局_光点科技
数据是教育信息化改革创新过程中的核心资产。从大数据的角度构建高校数据治理体系,支持高校管理信息向智能化服务和教育数字化转型,已成为必然趋势。然而,高校拥有更大的数据规模、更复杂的数据类型、更密集的数据交换和对数据治理的需求。因此,数据的应用仍然或多或少困扰着许多学校。为了清除这些信息问题,充分满足高校的数据进行应用市场需求,光点科技基于在大数据研究领域积累的技术优势和实施经验,为高校提供相关数据中
光点数据治理
·
2023-11-30 14:51
科技
大数据
人工智能
企业
数据中台
(CDP)为什么突然火了?_光点科技
数据中台
CDP其实是从2019年开始火的。
光点数据治理
·
2023-11-30 14:21
科技
电商平台
数据仓库
搭建02-Hadoop集群搭建
1,项目说明本项目来源于github电商平台
数据仓库
搭建。项目为个人学习记录,项目代码及文件可访问电商平台
数据仓库
搭建获得。2,项目准备虚拟机准备虚拟机开发工具为VMware15。
王小磊~
·
2023-11-30 13:04
电商数据仓库搭建
hadoop
数据仓库
hive
sql
大数据
数据仓库
搭建
目录1
数据仓库
概念1.1什么是
数据仓库
1.2OLTP与OLAP2项目需求及架构设计3项目框架4框架版本选型4.1Hadoop版本综述4.2社区版与第三方发行版的比较4.2.1.Apache社区版4.2.2
赵广陆
·
2023-11-30 13:32
bigdata
数据仓库
00Hadoop
数据仓库
平台
在这里是学习大数据的第一站什么是
数据仓库
常见大数据平台组件及介绍什么是
数据仓库
在计算领域,
数据仓库
(DW或DWH)也称为企业
数据仓库
(EDW),是一种用于报告和数据分析的系统,被认为是商业智能的核心组件
kk_io
·
2023-11-30 13:29
数据仓库
hadoop
数据仓库
大数据
数据仓库
数据管理模型
数据仓库
分为贴源层、
数据仓库
层、数据服务层,有人叫做数仓数据模型,或者叫"数据管理模型”。
zhulangfly
·
2023-11-30 13:52
数据仓库
大数据
历史拉链表
介绍历史拉链表历史拉链表是一种数据模型,主要针对
数据仓库
设计中表存储数据的方式而定义的。它记录一个事物从开始到当前状态的所有变化的信息。
zealscott
·
2023-11-30 12:03
2019-12-11
Hive是基于Hadoop的一个
数据仓库
工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。
diedfish_qyf
·
2023-11-30 11:41
【物联网与大数据应用】Hadoop数据处理
Hadoop利用分而治之的思想为大数据提供了一整套解决方案,如分布式文件系统HDFS、分布式计算框架MapReduce、NoSQL数据库HBase、
数据仓库
工具Hive等。
Bosenya12
·
2023-11-30 09:06
大数据
hadoop
分布式
AntDB“超融合+流式实时数仓”——快速实现企业全链路实时化
实时数据平台,快速实现企业全链路实时化引入
数据仓库
、数据挖掘、HTAP等先进理念,通过实时数据应用平台来装载庞大的信息量,进行实时分析处理,克服数据处理过程中的困难,是当下各企事业单位、互联网、金融,政务等行业核心系统建设的重点
亚信安慧AntDB数据库
·
2023-11-30 03:01
大数据
antdb数据库
antdb
数据库
数据中台
架构原理与开发实战:
数据中台
的数据索引与搜索
作者:禅与计算机程序设计艺术1.背景介绍随着互联网的蓬勃发展,社会数据越来越多地被收集、处理、分析并呈现出来。如何在快速变化的社会环境下有效管理、发现和利用这些海量数据,是一个非常重要的问题。2017年,英国政府发布了“数字转型”的新数据指南,要求各级政府在年底前推出基于数据的决策支持工具,对社会数据进行采集、处理、存储、分析、呈现、利用,形成信息经济。而最近十几年里,随着数据产业的兴起,数据中心
禅与计算机程序设计艺术
·
2023-11-30 01:38
AI大模型应用实战
大数据
人工智能
语言模型
Java
Python
架构设计
数据中台
为什么不好搞?
从2015年阿里提出“大中台”的
数据中台
战略,到2019年大厂及中台服务商“大兴”
数据中台
,再到2021年大厂又开始拆中台。
数据中台
从小甜甜变成牛夫人仅仅用了2年时间,为什么这么快
数据中台
就不香了?
码农code之路
·
2023-11-30 00:03
数据库
编程语言
java
大数据
人工智能
数据中台
·实时开发计算平台
什么是
数据中台
·实时计算平台?实时计算(实时开发)是为构建一套一站式、高性能实时大数据处理平台,广泛适用于流式数据处理场景。
数据先生
·
2023-11-30 00:33
数据仓库
大数据
职场和发展
数据库
数据挖掘
数据中台
整体设计思路复盘
首先,什么是
数据中台
,由于每个企业每种项目对中台的定义不同,这里仅仅给一个概念:
数据中台
是指通过数据技术,对海量数据进行采集、计算、存储、加工,同时统一标准和口径。
qq_33744471
·
2023-11-30 00:32
产品设计
产品设计
大数据
数据架构
业务分析
数据中台
:数据模型设计
但是在
数据中台
构建之前,分析师经常发现⾃⼰没有可以复⽤的数据,不得不使⽤原始数据进⾏清洗、加⼯、计算指标。由于他们⼤多是⾮技术专业出⾝,写的SQL质量⽐较差,甚⾄⻅过5层以上的嵌套。这种SQ
小晨说数据
·
2023-11-30 00:31
数据库
数据仓库
阿里云
数据中台
核心引擎
核心引擎MaxCompute阿里离线数据计算平台(离线数仓)原名ODPS,阿里巴巴自主研发的海量数据处理平台MaxCompute处理存储在TableStore的数据(不负责收集数据到TableStore中),使用Fluentd服务(类似的服务还有kafka、LogHub、DataX等,都大同小异,这里我用Fluentd作描述只是方便),通过Fluentd我们轻松的创建任务去按时读取各台服务器上的日
hsabrina
·
2023-11-30 00:30
工程架构
big
data
大数据
奇点云
数据中台
技术汇(三)| DataSimba系列之计算引擎篇
随着移动互联网、云计算、物联网和大数据技术的广泛应用,现代社会已经迈入全新的大数据时代。数据的爆炸式增长以及价值的扩大化,将对企业未来的发展产生深远的影响,数据将成为企业的核心资产。如何处理大数据,挖掘大数据的价值,让大数据为企业的发展保驾护航,将是未来信息技术发展道路上关注的重点。传统的数据处理方式通常是将数据导入至专门的数据分析工具中,这样会面临两个问题:1、如果源数据非常大时,往往数据的移动
cuba7764
·
2023-11-30 00:00
数据库
大数据
数据结构与算法
数据中台
架构原理与开发实战:
数据中台
的数据分析工具与平台
然而,对于
数据中台
的设计、搭建、运维、应用等工作仍存在一定的难度。如何快速、高效地构建出一个满足多变性、变化快、数据量大、并发访问量大的数据服务,是一个值得研究的问题。在本文中,作者通过从用户视角
禅与计算机程序设计艺术
·
2023-11-30 00:30
AI大模型应用实战
大数据
人工智能
语言模型
Java
Python
架构设计
元数据管理|Hive Hooks和Metastore监听器介绍
元数据管理是
数据仓库
的核心,它不仅定义了
数据仓库
有什么,还指明了
数据仓库
中数据的内容和位置,刻画了数据的提取和转换规则,存储了与
数据仓库
主题有关的各种商业信息。
大数据技术与数仓
·
2023-11-29 21:58
【数据挖掘】国科大刘莹老师数据挖掘课程作业 —— 第一次作业
homewrok11.假定
数据仓库
中包含4个维:date,product,vendor,location;和两个度量:sales_volume和sales_cost。
不牌不改
·
2023-11-29 20:00
【国科大】
数据挖掘
spark
大数据
大数据管理平台(
数据中台
)方案及重难点技术分析
1.大数据管理平台(
数据中台
)1.1.系统概述需求描述建设大数据管理中台,按照统一的数据规范和标准体系,构建统一数据采集-治理-共享标准、统一技术开发体系、统一接口API,实现数据采集、平台治理,业务应用三层解耦
打码人的日常分享
·
2023-11-29 14:30
软件开发文档
大数据
【
数据仓库
】Spark算子
第一关:转换算子之map和distinct算子输出每个元素及其长度并去重。//第一步:通过获取rdd中每个元素的长度创建新的rdd1valrdd1=rdd.map(x=>x.length())//第二步:通过zip把rdd1和rdd组合创建rdd2valrdd2=rdd.zip(rdd1)//第三步:去重valrdd3=rdd2.distinct()//第四步:输出结果rdd3.foreach(p
「已注销」
·
2023-11-29 12:05
数据仓库高级技术
scala
Spark
如何进行指标质量治理——指标系统(提质篇)
作者介绍@小风
数据中台
产品负责人;UBDC全域大数据峰会“灯塔人物”;擅长埋点模型、指标治理,数仓架构等;“数据人创作者联盟”成员。01指标质量治理概述指标质量治理主要分为两个部分:提质与增效。
一个数据人的自留地
·
2023-11-29 08:26
HCIA-Big Data华为认证大数据工程师 习题册 含答案
查看课堂笔记(含习题册)目录1.大数据发展趋势与鲲鹏大数据2.HDFS分布式文件管理系统和ZooKeeper3.Hive分布式
数据仓库
4.HBase技术原理5.MapReduce和Yarn技术原理6.Spark
k Chivalrous man
·
2023-11-29 08:16
大数据
大数据
华为
华为认证大数据工程师(HCIA-Big Data)--练习题
BCDA.实时数据处理B.基于行业领域知识库快速构建
数据中台
C.云上数据平台快速搭建D.一站式的数据运营治理平台2、A
大沙头三马路
·
2023-11-29 08:05
Linux
ICT认证
大数据
华为
HCIA
bigdata
ANT324 | 升级
数据仓库
ANT324|升级
数据仓库
关键字:[AmazonWebServicesre:Invent2023,AmazonRedshift,DataWarehouseModernization,RedshiftCapabilities
just2gooo
·
2023-11-29 02:57
aws
数据中台
行业发展概况及展望
随着企业业务创新不断加快,对数据开发的响应速度提出更高的要求,
数据中台
就诞生在这样的大背景下。
大数据v
·
2023-11-29 01:20
大数据
编程语言
机器学习
人工智能
数据分析
使用Kafka、Flink、Druid构建实时数据系统架构
等待数据发送到ETL工具,等待数据批量处理,等待数据加载到
数据仓库
中,甚至等待查询完成运行。
guohuang
·
2023-11-28 23:51
kafka
flink
系统架构
大数据
数据中台
能力成熟度评估模型
会上,中国信息通信研究院云计算与大数据研究所大数据与区块链部高级业务主管王卓发布了《
数据中台
能力成熟度模型》框架。一.
数据中台
的相关背景首先,我们来介绍一下这项工作的背景。从
公众号:肉眼品世界
·
2023-11-28 19:25
大数据
数据仓库
hive总结
Hive是基于Hadoop的
数据仓库
工具,提供了类似SQL的查询功能,可查询存储在HDFS中的数据。Hive的架构和组件包括用户接口、驱动、元数据存储和存储处理层。Hive将HQL转
墨苏玩电脑
·
2023-11-28 18:26
hive
hadoop
数据仓库
【
数据中台
】开源项目(2)-Davinci可视应用平台
1平台介绍Davinci是一个DVaaS(DataVisualizationasaService)平台解决方案,面向业务人员/数据工程师/数据分析师/数据科学家,致力于提供一站式数据可视化解决方案。既可作为公有云/私有云独立部署使用,也可作为可视化插件集成到三方系统。用户只需在可视化UI上简单配置即可服务多种数据可视化应用,并支持高级交互/行业分析/模式探索/社交智能等可视化功能。开源地址:htt
码农丁丁
·
2023-11-28 18:25
后端技术
#
数据中台
开源
数据中台
细说
数据仓库
上篇
用空间换时间,通过大量的预处理来提升应用系统的用户体验(效率),因此
数据仓库
会存在大量冗余的数据;不分层的话,如果源业务系统的业务规则发生变化将会影响整个数据清洗过程,工作量巨大。
派可数据
·
2023-11-28 18:53
数据仓库
数据要素
商业智能
spark
大数据
分布式
商业智能BI
数据仓库
数据仓库
建模下篇
在实际业务中,给了我们一堆数据,我们怎么拿这些数据进行数仓建设呢,数仓工具箱作者根据自身多年的实际业务经验,给我们总结了如下四步。数仓工具箱中的维度建模四步走:维度建模四步走这四步是环环相扣,步步相连。下面详细拆解下每个步骤怎么做1、选择业务过程维度建模是紧贴业务的,所以必须以业务为根基进行建模,那么选择业务过程,顾名思义就是在整个业务流程中选取我们需要建模的业务,根据运营提供的需求及日后的易扩展
派可数据
·
2023-11-28 18:10
商业智能
数据要素
数据仓库
数据仓库
大数据
信息可视化
数据库
HDFS与Hive实战 + 滴滴出行数据分析
HDFS与Hive实战+滴滴出行数据分析1.HDFS1.1分布式文件系统1.2HDFS的Shell命令行1.3启动Hadoop集群1.4大数据环境清单2.
数据仓库
2.1
数据仓库
与数据库区别3.Hive3.1
jialun0116
·
2023-11-28 16:41
大数据
Hive
数据仓库
数据库
数据仓库
数据挖掘
hadoop
大数据
大数据开发:实时数仓架构层次设计
在大数据实时计算处理领域,
数据仓库
提供重要的支持,从传统的离线数仓到实时数仓,大数据带动了相应的市场需求,而从架构层次来说,实时数仓也有新的值得挖掘的技术点。
成都加米谷大数据
·
2023-11-28 16:52
上一页
11
12
13
14
15
16
17
18
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他