E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
数仓模型设计
同一份数据全域共享,HashData UnionStore实时性背后的故事
时至今日,数据已经被越来越多的企业视为发展的战略资源,而云
数仓
则是数据发挥重要价值的关键媒介。
·
2023-09-22 16:27
数据库postgresql
ByConity 技术详解之 ELT
传统的数据转换过程一般采用Extract-Transform-Load(ETL)来将业务数据转换为适合
数仓
的数据模型,然而,这依赖于独立于
数仓
外的ETL系统,因而维护成本较高。ByConity作为云原
·
2023-09-22 16:27
实时
数仓
混沌演练实践
一、背景介绍目前实时
数仓
提供的投放实时指标优先级别越来越重要,不再是单独的报表展示等功能,特别是提供给下游规则引擎的相关数据,直接对投放运营的广告投放产生直接影响,数据延迟或者异常均可能产生直接或者间接的资产损失
·
2023-09-22 16:55
运维后端
Flink Batch SQL Improvements on Lakehouse
内容主要分为三个部分:FlinkBatchonPaimon挑战FlinkBatch核心优化后续规划点击查看原文视频&演讲PPT一、FlinkBatchonPaimon挑战众所周知,Paimon在创立之初就是为了解决流式
数仓
场景的问题
·
2023-09-22 12:29
后端flink大数据
BD就业复习第三天
以下是一种可能的实现思路:1.数据
模型设计
:首先,您需要设计一个数据模型来存储连续活跃区间。通常,这个表包含以下字段:用户/实体ID:标识活跃实体的唯一标识符。开始日期:活跃区间的开始日期或时间戳。
密斯特.张先生
·
2023-09-22 11:42
数据仓库
人工智能大语言模型微调技术:SFT 监督微调、LoRA 微调方法、P-tuning v2 微调方法、Freeze 监督微调方法
目标模型复制了源模型上除了输出层外的所有
模型设计
及其参数。这些模型参数包含了源数据集上
·
2023-09-22 01:08
Apache Druid 数据结构及架构原理介绍
由于Druid能够同时提供离线和实时数据的查询,因此Druid最常用作为GUI分析、业务监控、实时
数仓
的数据存储系统。
zxf126126
·
2023-09-21 18:04
druid
apache
Tapdata Connector 实用指南:云原生
数仓
场景之数据实时同步到 Databend
【前言】作为中国的“Fivetran/Airbyte”,Tapdata是一个以低延迟数据移动为核心优势构建的现代数据平台,内置60+数据连接器,拥有稳定的实时采集和传输能力、秒级响应的数据实时计算能力、稳定易用的数据实时服务能力,以及低代码可视化操作等。典型用例包括数据库到数据库的复制、将数据引入数据仓库或数据湖,以及通用ETL处理等。引用随着TapdataConnector的不断增长,我们最新推
·
2023-09-21 14:28
数据库mysql
ELT in ByteHouse 实践与展望
传统的数据转换过程一般采用Extract-Transform-Load(ETL)来将业务数据转换为适合
数仓
的数据模型
·
2023-09-21 12:18
大数据数据库云原生
ELT in ByteHouse 实践与展望
传统的数据转换过程一般采用Extract-Transform-Load(ETL)来将业务数据转换为适合
数仓
的数据模型
·
2023-09-21 12:46
大数据数据库云原生
电商
数仓
学习笔记(一)
第一章数据仓库概念第二章项目需求及架构设计项目需求项目框架第三章数据生成模块目标数据数据埋点服务器和jdk准备编写集群分发脚本xsync模拟数据集群日志生成脚本第四章数据采集模块集群所有进程查看脚本Hadoop安装LZO压缩配置LZO创建索引Hadoop参数调优Zookeeper安装ZK集群启停脚本Kafka安装Kafka集群安装安装部署Kafka集群启动停止脚本Kafka常用命令Kafka机器数
芝士雪豹.
·
2023-09-21 06:01
大数据
hadoop
数仓
主题域和数据域、雪花模型,星型模型和星座模型
数仓
模型和领域划分一、主题域和数据域的差别二、雪花模型,星座模型和星型模型一、主题域和数据域的差别明确数据域作为
数仓
搭建的重要一环,能够让
数仓
的数据便于管理和应用。
Aimyon_36
·
2023-09-20 23:23
数据仓库
spark
大数据
分布式
Hologres揭秘:优化COPY,批量导入性能提升5倍+
Hologres(中文名交互式分析)是阿里云自研的一站式实时
数仓
,这个云原生系统融合了实时服务和分析大数据的场景,全面兼容PostgreSQL协议并与大数据生态无缝打通,能用同一套数据架构同时支持实时写入实时查询以及实时离线联邦分析
阿里云Hologres
·
2023-09-20 20:38
第三章 数据同步
但是当数据量较大时,此方法抽取数据较慢,不适合用于从数据库同步到
数仓
。2.数据文件同步源数据库以约定的格式,编码,大小等信息生成对应的文件,再通过
发呆的熊猫
·
2023-09-20 18:46
如何快速从 ETL 到 ELT?火山引擎 ByteHouse 做了这三件事
在
数仓
及分析领域,海量数据则主要采按列的方式储存。因此,将数据从行级转换成列级存储是建立企业
数仓
的基础能力。传统方式是采用Extract-Transform-Load
字节数据平台
·
2023-09-20 18:41
etl
火山引擎
数据仓库
【大数据】Doris 构建实时
数仓
落地方案详解(三):Doris 实时
数仓
设计
本系列包含:Doris构建实时
数仓
落地方案详解(一):实时数据仓库概述Doris构建实时
数仓
落地方案详解(二):Doris核心功能解读Doris构建实时
数仓
落地方案详解(三):Doris实时
数仓
设计Doris
G皮T
·
2023-09-20 08:10
大数据
大数据
数据仓库
Doris
流批一体
Lambda
Kappa
实时数仓
【大数据】Doris 构建实时
数仓
落地方案详解(一):实时数据仓库概述
本系列包含:Doris构建实时
数仓
落地方案详解(一):实时数据仓库概述Doris构建实时
数仓
落地方案详解(二):Doris核心功能解读Doris构建实时
数仓
落地方案详解(三):Doris实时
数仓
设计Doris
G皮T
·
2023-09-20 08:40
大数据
大数据
数据仓库
Doris
实时数仓
MPP架构
Hadoop
HDFS
【大数据】Doris 构建实时
数仓
落地方案详解(二):Doris 核心功能解读
本系列包含:Doris构建实时
数仓
落地方案详解(一):实时数据仓库概述Doris构建实时
数仓
落地方案详解(二):Doris核心功能解读Doris构建实时
数仓
落地方案详解(三):Doris实时
数仓
设计Doris
G皮T
·
2023-09-20 08:40
大数据
大数据
数据仓库
Doris
实时数仓
MPP架构
Hadoop
HDFS
【大数据】Doris 构建实时
数仓
落地方案详解(三):Doris 实时
数仓
设计
本系列包含:Doris构建实时
数仓
落地方案详解(一):实时数据仓库概述Doris构建实时
数仓
落地方案详解(二):Doris核心功能解读Doris构建实时
数仓
落地方案详解(三):Doris实时
数仓
设计Doris
G皮T
·
2023-09-20 08:38
大数据
大数据
数据仓库
Doris
流批一体
Lambda
Kappa
实时数仓
分类预测 | MATLAB实现CNN卷积神经网络数据分类预测
分类预测|MATLAB实现CNN卷积神经网络数据分类预测目录分类预测|MATLAB实现CNN卷积神经网络数据分类预测基本介绍
模型设计
学习总结参考资料基本介绍使用卷积网络的潜在好处是更好的并行性、更好地控制感受野大小
机器学习之心
·
2023-09-20 06:42
#
CNN卷积神经网络
CNN
卷积神经网络
分类预测
MatrixDB数据库学习——筑梦之路
为万物互联的智能时代提供坚实、简洁的智能数据核心基础设施,为物联网应用、工业互联网、智能运维、智慧城市、实时
数仓
、智能家居、车
筑梦之路
·
2023-09-20 05:55
数据库技术
数据库
big
data
数据仓库
奇富科技获颁国内首个金融行业大模型标准编制证书
这一标准的问世,将为金融行业大
模型设计
、研发、应用以及后续验收提供重要依据与参照范本。作为标准的牵头编写单位,奇富科技已在大模型的支持下,开发了多种与具体业务相关的大模型场景应用。
CSDN云计算
·
2023-09-20 03:15
科技
数仓
规范随记
数仓
分层以《大数据之路:阿里巴巴大数据实践》中五层(ods/dwd/dws/dim/ads)分类为基础划分,有序列表记录是分层大类,分层大类下的无需列表是分层小类或者说真正落地的:ods:近源层/贴源层
mizuhokaga
·
2023-09-20 00:56
总结
大数据
深度解读 Flink 1.11:流批一体 Hive
数仓
2020-06-02
Flink1.11中流计算结合Hive批处理
数仓
,给离线
数仓
带来Flink流处理实时且Exactly-once的能力。
会飞的鱼go
·
2023-09-19 14:06
Flink 离线批处理 Mysql to Hive 离线
数仓
flinkmysqltohive我本地用的版本是flink1.13.2scala2.11,hive3.1.2环境配置1,source端读取mysql导入FLINK_HOME/lib,flink-connector-jdbc.jar2.sink端写入Hive,导入FLINK_HOME/lib,flink-sql-connector-hive注意如果没有找到自己对应版本的flinkhive包的话就导入
aaaak_
·
2023-09-19 11:56
大数据
hive
flink
mysql
Databend 开源周报第 111 期
Databend是一款现代云
数仓
。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:https://app.databend.cn。
Databend
·
2023-09-19 09:51
开源
数据库
支持多数据源联合查询的本地运行SQL执行引擎syncnany-SQL安装和配置
在微服务和云原生愈发流行的今天,数据的分布也愈发脱离单库单机而更加复杂,使用的数据库类型也会更多,但业务的复杂依然会带来了大量的数据查询和导出需求,而很多时候我们很难为数据量的大部分系统创建完整的BI
数仓
系统
·
2023-09-19 09:22
支持多数据源联合查询的SQL运行引擎sycnany-SQL添加使用自定义函数
在微服务和云原生愈发流行的今天,数据的分布也愈发脱离单库单机而更加复杂,使用的数据库类型也会更多,但业务的复杂依然会带来了大量的数据查询和导出需求,而很多时候我们很难为数据量的大部分系统创建完整的BI
数仓
系统
·
2023-09-19 09:22
幸福里基于 Flink & Paimon 的流式
数仓
实践
幸福里业务是一种典型的交易、事务类型的业务场景,这种业务场景在实时
数仓
建模中遇到了诸多挑战。
Apache Flink
·
2023-09-19 07:26
Flink
大数据
实时计算
flink
大数据
Flink相关
知乎实时
数仓
架构演进_天池技术圈-阿里云天池关于flink实时
数仓
的实际问题_flinkdatastream按天,小时写入hdfs_一个写湿的程序猿的博客-CSDN博客基于Flink+Hudi的实时
数仓
在
丢雷劳谋
·
2023-09-19 07:24
大数据
flink
大数据
【直播预约中】 腾讯大数据 x StarRocks|构建新一代实时湖仓
随着信息时代的兴起,数据已成为推动业务决策和创新的核心要素;结构化、半结构化等多种类型的数据呈现爆炸式增长,如何高效处理和分析海量数据已经成为关键挑战,结合传统
数仓
与数据湖优势的湖仓一体(Lakehouse
StarRocks_labs
·
2023-09-19 04:34
后端
【大数据】Doris 构建实时
数仓
落地方案详解(一):实时数据仓库概述
Doris构建实时
数仓
落地方案详解(一):实时数据仓库概述1.数据仓库的发展历程2.数据仓库技术的发展3.
数仓
的相关技术栈4.OLAP查询5.MPP架构6.实时
数仓
定义7.实时
数仓
的难点数据仓库的概念可以追溯到
G皮T
·
2023-09-19 04:45
大数据
大数据
数据仓库
Doris
实时数仓
MPP架构
Hadoop
HDFS
【大数据】Doris 构建实时
数仓
落地方案详解(二):Doris 核心功能解读
Doris构建实时
数仓
落地方案详解(二):Doris核心功能解读1.Doris发展历程2.Doris三大模型3.Doris数据导入4.Doris多表关联5.Doris核心设计6.Doris查询优化7.Doris
G皮T
·
2023-09-19 04:14
大数据
大数据
数据仓库
Doris
实时数仓
MPP架构
Hadoop
HDFS
日更80
代码看这里:https://github.com/SeuTao/Kaggle_TGS2018_4th_solutionSolutiondevelopment:1.单
模型设计
:input:101randompadto128
深度学习模型优化
·
2023-09-19 01:54
数据湖调研
数据湖调研1什么是数据湖2数据湖能解决什么问题3数据湖与
数仓
的区别4数据湖生态5当前常见的数据湖实现方案5.1基于Hudi5.2基于Iceberg5.2.1Iceberg应用场景:5.3数据湖基本实现:
Direction_Wind
·
2023-09-19 00:30
技术调研
big
data
知识图谱
nosql
第三章 零售业务(一)
维度
模型设计
的4步过程第1步:选择业务过程业务过程是由组织完成的微观活动,(如:获得订单、开具发票、注册学生等)。
小冕
·
2023-09-19 00:29
基于贝叶斯优化CNN-LSTM混合神经网络预测(Matlab实现)
模型设计
:设计CNN-LSTM混合神经网络模型,包括卷积层、池化层、LSTM层和全连接层等。贝叶斯优化:使用贝叶斯优化算法对模型进行超参数调优,包括学习率、批量大小、卷积核大小、LST
小P学长
·
2023-09-18 23:09
小P学长编程分享
深度学习
机器学习
人工智能
【直播预约中】 腾讯大数据 x StarRocks|构建新一代实时湖仓
随着信息时代的兴起,数据已成为推动业务决策和创新的核心要素;结构化、半结构化等多种类型的数据呈现爆炸式增长,如何高效处理和分析海量数据已经成为关键挑战,结合传统
数仓
与数据湖优势的湖仓一体(Lakehouse
·
2023-09-18 21:54
后端
如何快速从 ETL 到 ELT?火山引擎 ByteHouse 做了这三件事
在
数仓
及分析领域,海量数据则主要采按列的方式储存。因此,将数据从行级转换成列级存储是建立企业
数仓
的基础能力。传统方式是采用Extract-Transform-Load
·
2023-09-18 18:39
大数据云原生数据仓库数据库
幸福里基于 Flink & Paimon 的流式
数仓
实践
幸福里业务是一种典型的交易、事务类型的业务场景,这种业务场景在实时
数仓
建模中遇到了诸多挑战。
·
2023-09-18 17:57
后端flink大数据
HashData 云
数仓
上线华为蓝鲸应⽤商城
近⽇,经过华为对企业技术、产品和服务能⼒的综合评估,酷克数据企业级云原⽣数据仓库HashData通过与华为OceanStorPacific分布式存储的适配与优化,形成⼀体化解决⽅案,成功上线华为蓝鲸应⽤商城。图1:华为蓝鲸商城HashData产品⻚⾯华为蓝鲸应⽤商城是华为数据存储产品线与合作伙伴联合打造的⼀站式IT应⽤解决⽅案集成平台,通过对企业应⽤与IT基础设施的深度融合,构建了应⽤快速上线、应
·
2023-09-18 16:34
数据库运维
【遇见Doris】Doris在作业帮实时
数仓
中的应用&实践
9月20日的ApacheDoris线上Meetup——壹佰案例峰会预热沙龙圆满成功,现在为大家带来这次Meetup的内容回顾。本次Meetup请到了来自作业帮和百度画像团队的技术大牛带来ApacheDoris应用与实践上的经验分享,了解更多详情请关注Doris官方公众号。嘉宾分享回顾会陆续放出,公众号后台回复“0920”立即get回放录像。糜利敏作业帮大数据查询引擎负责人伴随着业务的快速发展,由于
ApacheDoris
·
2023-09-18 08:07
大数据
分布式
编程语言
hadoop
数据库
真实的产品开发中,后端的设计规约可以写哪些
真实的产品开发中,后端的设计规约可以写哪些产品开发的后端设计规约通常包括以下内容:数据
模型设计
:详细描述数据库的结构,包括数据表的设计、字段的定义和关系的设置等。
舒一笑
·
2023-09-18 06:00
Java代码的微搜索
设计规范
3D资讯|扫盲篇-增材制造(1)
从CAD软件
模型设计
到最终实物成型,增材制造技术一般分为如下几步。1、CAD创建数字模型是增材制造的第一步。通常来说使用计算机辅助设计软件computeraideddesign
Jayden_xue
·
2023-09-17 17:32
数据仓库
模型设计
(收藏版)
一、数据仓库构建需要考虑的问题与数据库的单表基于ER模型构建思路不同,其面向特定业务分析的特性,决定了它的构建需要整合多套数据输入系统,并输出多业务条线的、集成的数据服务能力,需要考虑更全面的因素,包括:业务需求:从了解业务需求着手分析业务特点和业务期望;系统架构:从系统架构和数据分布、数据特性等角度,分析系统架构设计上是否有问题;逻辑设计:从数据模型逻辑设计出发是否设计合理,是否符合数据库开发和
000X000
·
2023-09-17 15:13
数据仓库
实战
数据建模
数据仓库
数据库
系统架构
Day69 Kafka 设计原理详解
Storm/Spark流式处理引擎web/nginx,访问日志消息服务开放统一接口给consumerhadoop,hbase等.装载到hadoop,
数仓
etl做离线分析和数据挖掘.ScreenShot2022
小周爱吃瓜
·
2023-09-17 12:39
企业级数据仓库-
数仓
实战
数仓
实战安装包大小安装清单环境搭建一、环境搭建01(机器准备)准备好三台虚拟机,并进行修改hostname、在hosts文件增加ip地址和主机名映射。
beyond_champion
·
2023-09-17 03:06
数据仓库
数据仓库
数据库
hadoop
big
data
如何利用Power BI的模版格式来进行数据的保密?
在使用PowerBI进行
模型设计
,数据整理等操作,最终保存的大部分都是以PBIX作为文件名,就像使用Excel进行保存的文件大多数都是以xlxs保持的格式一样。但是如果仔细观察在保
Data_Skill
·
2023-09-17 01:55
数据仓库
模型设计
V2.0
一、
数仓
建模的意义数据模型就是数据组织和存储方法,它强调从业务、数据存取和使用角度合理存储数据。只有将数据有序的组织和存储起来之后,数据才能得到高性能、低成本、高效率、高质量的使用。
000X000
·
2023-09-16 21:46
数据仓库
数据建模
实战
数据仓库
spark
大数据
数据仓库模型设计V2.0
Hive参数与性能调优-V2.0
但是如果我们只局限于会使用Hive,而不考虑性能问题,就难搭建出一个完美的
数仓
,所以Hive性能调优是我们大数据从业者必须掌握的技能。本文将给大家讲解Hive性能调优的一些方法及技巧。
000X000
·
2023-09-16 21:54
数据仓库
HIVE
大数据
hive
数据仓库
Hive参数与性能调优
上一页
18
19
20
21
22
23
24
25
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他