E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
数仓主要特征
flume案例
在构建
数仓
时,经常会用到flume接收日志数据,通常涉及到的组件为kafka,hdfs等。下面以一个flume接收指定topic数据,并存入hdfs的案例,大致了解下flume相关使用规则。
不加班程序员
·
2024-01-23 06:48
ETL
kafka
Hadoop相关
flume
大数据
etl
数仓
建设 - 维度建模 - DIM维度
文章目录前置:准备数据库一、商品维度表1.1表结构设计1.2建表语句1.3ETL任务脚本二、优惠券维度表2.1表结构设计2.2ETL任务脚本三、活动维度表3.1表结构设计3.2ETL任务脚本四、地区维度表4.1表结构设计4.2ETL任务脚本五、日期维度表六、用户维度表6.1表结构设计6.2ETL任务脚本前置:准备数据库[
[email protected]
]$
m0_46218511
·
2024-01-23 05:14
大数据基础设施搭建
维度建模
数据仓库
Databend 开源周报第 128 期
Databend是一款现代云
数仓
。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:https://app.databend.cn。
Databend
·
2024-01-23 03:01
开源
Databend 开源周报第 129 期
Databend是一款现代云
数仓
。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:https://app.databend.cn。
Databend
·
2024-01-23 03:31
开源
【读书】《突破瓶颈》2
细节是描述事件的
主要特征
,因为人们把关键事件放到更大的背景中去理解时,不可避免地要涉及到对细节的概
龙之崛起
·
2024-01-22 12:02
目标检测数据集 - MS COCO
/arxiv.org/abs/1405.0312官网:https://cocodataset.org/1.数据集介绍MSCOCO是一个非常大型,且常用的数据集,其中包括了目标检测、分割、图像描述等,其
主要特征
如下
mango1698
·
2024-01-22 09:21
AI
目标检测
计算机视觉
目标跟踪
Flink背景
数仓
简介在信息爆炸的时代,为了从海量数据中洞察业务价值,驱动运营决策,企业通常会构建用于数据分析的数据仓库。
201001070
·
2024-01-22 08:31
Flink
flink
大数据
大数据开发之电商
数仓
(hadoop、flume、hive、hdfs、zookeeper、kafka)
第1章:数据仓库1.1数据仓库概述1.1.1数据仓库概念1、数据仓库概念:为企业制定决策,提供数据支持的集合。通过对数据仓库中数据的分析,可以帮助企业,改进业务流程、控制成本,提高产品质量。数据仓库并不是数据的最终目的地,而是为数据最终的目的地做好准备,这些准备包括对数据的:清洗、转义、分类、重组、合并、拆分、统计等。2、数据仓库的数据通常包括:业务数据、用户行为数据和爬虫数据等3、业务系统数据库
Key-Key
·
2024-01-22 07:29
大数据
hadoop
flume
kafka
hive
hdfs
感受黑白装饰画独特的艺术美感体会创作乐趣
要善于抓住形象的
主要特征
,删繁求简,画面上只要极其简练的形象,力求达到黑白对比强烈明快的艺术效果。黑白装饰画是用黑色和白色来塑造
装饰画暖宝
·
2024-01-22 07:55
伤春悲秋不是矫情,季节性情感障碍了解一下
季节性情感障碍(SAD),是指在特定季节(尤其是冬季)发生的以抑郁为
主要特征
的心理障碍,它会让人们的记忆力和学习能力下降并出现嗜睡的症状,季节性情感障碍的主要原因是冬季光照时间短,因此季节性情感障碍多发于中
天马心理工作室
·
2024-01-21 15:14
数据仓库简介、数据仓库的发展、
数仓
理论简介
数仓
理论简介数据仓库解决方案诞生至今,也有2、30年的发展历史了,在这个过程中,
数仓
理论不断被更新和完善,逐步形成了目前大家普通遵守的
数仓
开发理论(概念)。
yida&yueda
·
2024-01-21 11:48
大数据
数据仓库
big
data
数据库
数据仓库简介
一、
数仓
概念数据仓库,英文名称为DataWarehouse,可简写为DW或DWH。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。
水坚石青
·
2024-01-21 11:46
数据仓库
mysql
数据库
java
数据仓库
oracle
大数据
熬夜脱发怎么办?
脱发的
主要特征
是头发油腻,如同擦油一样,亦有焦枯发蓬,缺乏光泽,有淡黄色鳞屑固着难脱,或灰白色鳞屑飞扬,自觉瘙痒。
小黛vlog
·
2024-01-21 05:34
Hologres V2.1版本发布,新增计算组实例构建高可用实时
数仓
Highlight产品介绍Hologres是阿里云自研一站式实时
数仓
,统一数据平台架构,将OLAP查询、即席分析、在线服务、向量计算多个数据应用构建在统一存储之上,实现一份数据,多种计算场景。
阿里云大数据AI技术
·
2024-01-20 21:07
网络
java
数据库
我们应该了解的⽤户画像
当我们谈⽤户画像时,到底在谈什么对于互联⽹公司来说,企业的增⻓、内容、活动、产品等⼯作基本上都是围绕着“⽤户”来做的,可以说都是在做“⽤户运营”这个⼯作,⽽⽤户画像是⽤户运营⼯作中⾮常重要的⼀环⽤户画像的
主要特征
是
yayun_kg
·
2024-01-20 17:48
用户运营
用户画像
巴别时代基于 Apache Paimon 的 Streaming Lakehouse 的探索与实践
我们基于ApachePaimon(Incubating)构建StreamingLakehouse的落地实践主要分为三期:第一期是在调研验证的基础上进行
数仓
分层,并且上线一些简单的业务验证效果;第二期是实现流式
数仓
的基础设施建设
Apache Flink
·
2024-01-20 12:21
Flink
大数据
实时计算
apache
kafka
大数据
java
分布式
程序员必备的面试技巧——大数据工程师面试必备技能
目录前言一、不同工程师的职责和技能要求1、
数仓
开发工程师2、算法挖掘工程师3、大数据平台开发工程师4、大数据前端开发工程师二、大数据技术架构图三、大数据相关的技术内容四、大数据面试经验1、大数据开发岗位
Francek Chen
·
2024-01-20 11:22
话题征文
面试
职场和发展
大数据
RabbitMQ简介,安装,Spring集成 demo,以及使用(spring集成在最下面)
AMQP的
主要特征
是面向消息、队列、路由(包括点对点和发布/订阅)、可靠性、安全。RabbitMQ是一个开源的AMQP实现,服务器端用Erlang语言
四大天王闹洞房
·
2024-01-20 07:30
linux
windows
rabbitmq
中间件
rabbitmq
超融合之道:亚信安慧AntDB 8.0版本引领数据库创新
在当今多变的数据应用场景中,AntDB作为行业领先的超融合流式实时
数仓
,秉承着“融合+实时”的研发理念,全面应对企业日益复杂的数据处理需求。
亚信安慧AntDB数据库
·
2024-01-20 01:00
数据库
antdb数据库
antdb
华为外包数据库面试问题分享20211225
数仓
的东西了解多少。数据库开发支持这方面你做过哪些。你现在的工作中的SQL开发,具体是作了哪些。你的工作意愿是哪个方向(这么问是因为知道了我没做过DBA)在
数仓
的设
钦䲹
·
2024-01-19 16:05
数据库
华为
面试
某小外包公司线上面试-大数据开发
1.
数仓
和数据库的区别2.
数仓
建模3.hive用到的函数4.rank,dense_rank,row_number的区别5.hive数据倾斜的原因有哪些7.如何理解数据质量?
劝学-大数据
·
2024-01-19 16:03
大数据面试题
大数据
基于 Hologres+Flink 的曹操出行实时
数仓
建设
本文整理自曹操出行实时计算负责人林震基于Hologres+Flink的曹操出行实时
数仓
建设的分享,内容主要分为以下六部分:曹操出行业务背景介绍曹操出行业务痛点分析Hologres+Flink构建企业级实时
数仓
曹操出行实时
数仓
实践曹操出行业务成果分析未来展望一
Apache Flink
·
2024-01-19 08:54
flink
大数据
CodeIgniter vs Laravel:深入对比两大PHP框架的架构、
主要特征
及关键差异
在网络上,PHP的宝座是没有竞争对手的。它在某种程度上为79%的网站提供动力。开发人员将一些常用的PHP功能组织和打包,以捆绑的形式称为PHP框架,使PHP更加灵活。CodeIgniter和Laravel是当今最有影响力的两个PHP框架。他们卓越的产品极大地促进了当今互联网的发展。如果你正在寻找网络开发技术来构建你的网络应用程序,或者想从事网络开发的职业,其中一个是你的最佳选择。这就引出了一个问题
WPHunter
·
2024-01-19 05:12
后端编程技巧&教程
php
laravel
开发语言
CodeIgniter
FineBI实战项目一(25):实战项目一总结
实在项目使用mysql做
数仓
库的ODS层,这仅仅是带领大家入门,用mysql做
数仓
存在很多问题。
不死鸟.亚历山大.狼崽子
·
2024-01-19 02:39
FineBI
finebi
数仓
架构图
阿里巴巴的数据团队把表数据模型分为三层:操作数据层(ODS)、公共维度模型层(DM)和应用数据层(DS),其中公共维度模型层包括明细数据层(DWD)和汇总数据层(DWS)。模型层次关系如9.9所示。image.png公共维度模型层(CDM):存放明细事实数据、维表数据及公共指标汇总数据其中明细事实数据、维表数一般根据ODS层数据加工生成:公共指标汇总数据般根据维表数据和明细事实数据加工生成。CDM
liuxiaolin
·
2024-01-19 01:27
Hologres + Flink 流式湖仓建设
Flink流式湖仓建设1Flink+Hologres特性1.2实时维表Lookup1.3高性能实时写入与更新1.4多流合并1.5Hologres作为Flink的数据源1.6元数据自动发现与更新2传统实时
数仓
分层方案
Direction_Wind
·
2024-01-18 21:56
hologres
技术调研
flink
大数据
”秋老虎”来了别大意,防病保健很关键
长夏湿邪盛,注意防病湿为长夏的
主要特征
,特别容易伤害脾胃功
番茄小蛋仔
·
2024-01-18 19:24
白山云基于StarRocks数据库构建湖仓一体
数仓
的实践
背景随着每天万亿级别的业务数据流向数据湖,数据湖的弊端也逐渐凸显出来,例如:数据入湖时效性差:数据湖主要依赖于离线批量计算,通常不支持实时数据更新,因此无法保证数据的强一致性,造成数据不及时、不准确;查询性能差:在传统架构下,数据湖的查询速度较差,小时粒度的数据查询往往需要数分钟才能得到响应,在多个业务方同时执行数据湖查询任务时,查询响应慢的劣势更加明显;查询体验差:数据存储在多个地方,在进行联邦
StarRocks_labs
·
2024-01-18 17:04
社区投稿
数据库
大数据
日更88 九型人格测试
【
主要特征
】有极强的原则性、不易妥协、常说“应该”及“不应该”、黑白分明、对自己和别人要求甚高、追求完美、不断改进、感情世界薄弱;希望把每件事都做得尽善尽美,希望自己或是这个世界都更进步。
行走的平头哥
·
2024-01-18 10:18
技术选型|开源大数据OLAP引擎最佳实践
一、开源OLAP综述二、开源
数仓
解决方案三、ClickHouse介绍四、StarRocks介绍五、Trino介绍六、客户案例01开源OLAP综述如今的开源数据引擎多种多样,不同种类的引擎满足了我们不同的需求
浪尖聊大数据-浪尖
·
2024-01-18 08:14
运维
大数据
分布式
数据库
人工智能
数仓
项目6.0配置大全(hadoop/Flume/zk/kafka/mysql配置)
配置背景我使用的root用户,懒得加sudo所有文件夹在/opt/module所有安装包在/opt/software所有脚本文件在/root/bin三台虚拟机:hadoop102-103-104分发脚本fenfa,放在~/bin下,chmod777fenfa给权限#!/bin/bash#1.判断参数个数if[$#-lt1]thenechoXXXXXXXXXNoArguementXXXXXXXXX!
Int mian[]
·
2024-01-18 06:57
hadoop
flume
kafka
如何设计实时数据平台(设计篇)
在上篇设计篇中,我们首先从两个维度介绍实时数据平台:从现代
数仓
架构角度看待实时数据平台,从典型数据处理角度看待实时数据处理;接着我们会探讨实时数据平台整体设计架构、对具体问
longLiveData
·
2024-01-18 05:11
系统架构07 - 信息系统(下)
基本模式结构功能特点组成专家系统(ES)概述专家系统人工智能特点组成应用领域办公自动化系统(OAS)概述主要功能组成企业资源规划(ERP)概述企业的资源计划结构功能综合性信息系统典型信息系统架构模型政府信息化与电子政务概述组成主体
主要特征
发展应用领域企业信息化与电子商务概
银龙丶裁决
·
2024-01-18 01:24
软考系统架构
系统架构
离线
数仓
二
数据仓库维度模型设计维度建模基本概念维度模型是数据仓库领域大师RalphKimall所倡导,他的《数据仓库工具箱》,是数据仓库工程领域最流行的
数仓
建模经典。
pauls
·
2024-01-18 00:26
知识普及:面瘫
面神经炎俗称面神经麻痹(即面神经瘫痪)、“歪嘴巴”、“吊线风”,是以面部表情肌群运动功能障碍为
主要特征
的一种疾病。它是一种常见病、多发病,不受年龄限制。
林霓
·
2024-01-17 23:01
尚硅谷离线
数仓
之采集平台
1.用户行为日志数据流向流程图如下,其中红框表示用户行为日志数据的流向图。1.1行为日志内容行为日志主要包括以下几个内容页面浏览记录动作记录曝光记录启动记录错误记录页面浏览记录动作记录曝光记录启动记录1.2用户行为日志格式页面日志启动日志页面日志,以页面浏览为单位,即一个页面浏览记录,生成一条页面埋点日志。一条完整的页面日志包含,一个页面浏览记录,用户在该页面所做的若干个动作记录,若干个该页面的曝
韩顺平的小迷弟
·
2024-01-17 21:56
大数据
python
开发语言
数据仓库面试题
1思维导图&
数仓
常见面试题2题目1.数据仓库是什么?
韩顺平的小迷弟
·
2024-01-17 21:53
大数据面试题
数据仓库
大数据
数据分析与挖掘简介
20世纪40年代第一台数字计算机出现到90年代中期之前,信息化建设可归为以单机应用为
主要特征
的数字化阶段(可称为信息化1.0),而第一次的信息化浪潮,始自20世纪80年代个人计算机的大规模普及应用。
数据蜗牛
·
2024-01-17 20:40
2024.1.16 用户画像day01 - 项目介绍
技术选型:技术架构:项目架构:二.名词解释一.项目介绍整体流程:项目介绍-elasticSearch-业务数据源导入-离线指标开发-Flume实时采集-Nginx日志埋点数据-结构化流实时指标-制作报表
数仓
开发用户画像实时开发
白白的wj
·
2024-01-17 15:40
spark
大数据
分布式
python
kafka
zookeeper
hive
关于CarbonData+Spark SQL的一些应用实践和调优经验分享
行业亟需一个高效、统一的融合
数仓
,从海量数据中快速获取有效信息,从而洞察机遇、规避风险。
weixin_34075551
·
2024-01-17 15:31
大数据
人工智能
后端
数仓
数据含有特殊字符,如何更方便的导出成excel文件
如果遇到数据中含有特殊字符,"\n","\r","\t",或者其他的特殊分隔符在数据导出时造成错位,都用sql替换,但是需求是导出的数据要保持原有内容格式,就不能替换剔除这些特殊字符,这种情况下使用json方式1,在hive
数仓
建一个临时的
第一次看海
·
2024-01-17 15:00
1024程序员节
spark sql实践开发后端引擎
-------------“何以解忧,唯有暴富”需求开发一个系统,主要是将
数仓
中治理完用于检索的数据灌入Elasticsearch中,一般情况,开源的一些系
第一次看海
·
2024-01-17 14:28
spark
sql
大数据
有源滤波装置在水处理行业配电系统中的应用
关键词:水处理行业供配电系统;谐波;电能质量1、水处理行业电能质量
主要特征
:1.1水处理行业发展平稳,厂房建设逐年稳步增加;1.2电
安科瑞彭姝麟
·
2024-01-16 19:04
系统安全
性能优化
Hive知识点
基本概念:由Facebook开源,构建在Hadoop之上的数据仓库,数据计算是mapreduce,数据存储是HDFS目的是构建面向分析的集成的数据环境,为企业提供决策支持(面向分析的存储系统)
主要特征
:
꧁༺朝花夕逝༻꧂
·
2024-01-16 07:25
hive
hadoop
数据仓库
Hive使用shell调用命令行特殊字符处理
1.场景分析数据处理常用hive-e的方式,通过脚本操作
数仓
,过程中常常遇到特殊字符的处理,如单双引号、反斜杠、换行符等,现将特殊字符用法总结使用如下,可直接引用,避免自行测试的繁琐。
tuoluzhe8521
·
2024-01-16 07:17
Hive相关
hive
hadoop
数据仓库
教资高中信息技术知识点复习
嘉师行教资笔试学科资料中学信息技术第一部分目录【考点1】信息的概念和
主要特征
…1【考点2】信息技术及其发展简史…1【考点3】前端技术…1【考点4】搜索引擎及其类型…2【考点5】计算机的特点…3【考点6】
想要打 Acm 的小周同学呀
·
2024-01-16 03:22
教资科目三
高中信息技术
ClickHouse - 01
批处理会将源业务系统中的数据通过数据抽取工具(例如Sqoop)将数据抽取到HDFS中,这个过程可以使用MapReduce、Spark、Flink技术对数据进行ETL清洗处理,也可以直接将数据抽取到Hive
数仓
中
ArthurHC
·
2024-01-16 02:17
数据库, 数据仓库, 数据集市,数据湖,数据中台
数据仓库和数据库的区别作者:南宫蓉出处:简书第一篇:数据仓库概述第二篇:数据库关系建模作者:穆晨出处:CNBLOS数据仓库、数据湖、数据集市、和数据中台的故事作者:Murkey学习之旅出处:csdn数据中台和
数仓
的关系作者
cxzhq2002
·
2024-01-16 01:26
数据库
mysql/oracle 数据库delete操作太慢(where ... in ...),不加索引,一招让性能提升百倍
比如在
数仓
项目中,软删虽然更快更安全,但是缺点也很多:1、软删造成数据冗余,甚至快速膨胀的后果。比如一些中间表,只是作为中转站,过两天数据就分配其他表了,不硬删的话就会造成数据快速膨胀。
大壮001
·
2024-01-15 23:30
大数据
数据库
数据库
mysql
oracle
sql
大数据
EAP专员告诉你怎样缓解焦虑症
焦虑症(anxiety),又称为焦虑性神经症,是神经症这一大类疾病中最常见的一种,以焦虑情绪体验为
主要特征
。
莹仔陪你说晚安
·
2024-01-15 21:21
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他