E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
数仓电商项目
大数据必备shell工具
awksedsortcut2)易出错的地方''单引号不解析里面变量的值""双引号解析里面变量的值嵌套:看谁在最外面3)经常使用的场景a.分发脚本(搭建集群)b.启停脚本(启动集群)c.与mysql的导入导出(数据同步)d.
数仓
层级内部
jiedaodezhuti
·
2023-10-08 15:46
大数据技术
hadoop
2020-05-13关于数据需求的分类
从应用场景划分:监控场景报表场景分析场景决策场景从产出时效划分:实时准实时离线从研发角度划分:数据接入需求:业务接入、日志接入、埋点接入数据开发需求:
数仓
建模、统计开发、算法开发数据输出需求:离线报表、
Simple701
·
2023-10-08 09:37
浅谈如何建设指标监控体系
对于数据人尤其是数据产品和分析师,最难排查(头疼)的问题就是指标为什么升/降/没数,一旦业务方提出这种问题就意味着有大半天的时间要花在确认指标口径+计算逻辑+埋点采集上,而且要同时跟业务方、分析师、数据产品、
数仓
甚至是负责埋点的开发沟通
一个数据人的自留地
·
2023-10-07 21:44
数仓
的DW、ODS、DM概念及其区别
ODS层ODS(OperationalDataStore)操作性数据,是作为数据库到数据仓库的一种过渡,ODS的数据结构一般与数据来源保持一致,便于减少ETL的工作复杂性,而且ODS的数据周期一般比较短。ODS的数据最终流入DW(就是接收到的最原始的数据)DWD层+DW(DataWarehouse)数据仓库,是数据的归宿,这里保持这所有的从ODS到来的数据,并长期报错,而且这些数据不会被修改。(将
焱行软件科技计算机毕设
·
2023-10-07 13:14
数据仓库
大数据
数据库
基于Impala的高性能
数仓
实践之执行引擎模块
导读:本系列文章将结合实际开发和使用经验,聊聊可以从哪些方面对
数仓
查询引擎进行优化。Impala是Cloudera开发和开源的
数仓
查询引擎,以性能优秀著称。
浪尖聊大数据-浪尖
·
2023-10-07 11:10
大数据
分布式
数据库
mysql
java
Python数据攻略-Mongodb
数仓
无法写入方法汇总
Mongodb作为一个非结构化的NoSQL数据库,能存储各种复杂和多变的数据格式,如JSON。这使得Mongodb在实时数据分析和高性能查询中具有优势。在使用Mongodb的过程中,可能会遇到写入失败的问题。常见的几种情况包括无法建立连接、认证失败和存储限制。文章目录诊断问题日志分析错误码解析常见写入失败原因及解决方案连接问题认证问题存储限制预防措施合理设计Schema数据备份实践案例:《三国志》
Mr数据杨
·
2023-10-07 05:36
Python
数据攻略
python
mongodb
开发语言
2018-12-15
店铺淘客应该是2017年最火爆的
电商项目
之一了,传统的淘客发展了将近10年的时间,也让不少淘宝客赚到了第一桶金,但是随着电商的不断发展升级,淘宝联盟这块大
f94c8171e4ca
·
2023-10-06 21:06
数据中台实战(06)-数据模型无法复用,归根结底还是设计问题
由于他们非技术出身,SQL较差,多层嵌套,不择手段,资源消耗大,造成队列阻塞,影响其他
数仓
任务,引起数据开发不满。数据开发要求收回分析师的原始数据读取权限
JavaEdge.
·
2023-10-06 20:19
数据中台
数据库
基于 Kafka 的实时
数仓
在搜索的实践应用
一、概述ApacheKafka发展至今,已经是一个很成熟的消息队列组件了,也是大数据生态圈中不可或缺的一员。ApacheKafka社区非常的活跃,通过社区成员不断的贡献代码和迭代项目,使得ApacheKafka功能越发丰富、性能越发稳定,成为企业大数据技术架构解决方案中重要的一环。ApacheKafka作为一个热门消息队列中间件,具备高效可靠的消息处理能力,且拥有非常广泛的应用领域。那么,今天就来
谁叫我土豆了
·
2023-10-06 14:30
如何接手一个
电商项目
,这是我的一些思考
电商项目
曾是B公司的战略级项目,但在投入人力物力后依然不见起色。尽管电商市场已成红海竞争,但老板看到不断地有新的电商机会涌现,再加上B公司手握巨大流量,电商是流量变现的最好方式。
lisawlc
·
2023-10-06 04:05
大数据项目之电商
数仓
(3电商数据仓库系统)V6.1.3
第1章
数仓
分层1.1为什么要分层1.2数据集市与数据仓库概念1.3
数仓
命名规范1.3.1表命名ODS层命名为ods_表名DWD层命名为dwd_dim/fact_表名DWS层命名为dws_表名DWT
okbin1991
·
2023-10-06 00:19
大数据
数据仓库
数据库
ssm分布式架构
电商项目
(五)
功能分析2.1.后台系统所用的技术框架:Spring+SpringMVC+Mybatis+dubbo前端:EasyUI数据库:mysql2.2.创建数据库1、安装mysql数据库2、在mysql中创建一个taotao数据库3、导入数据库脚本。2.3.系统间通信由于淘淘商城是基于soa的架构,表现层和服务层是不同的工程。所以要实现商品列表查询需要两个系统之间进行通信。如何实现远程通信?1、使用Web
改变世界始于改变自己
·
2023-10-06 00:36
框架
分布式
ssm
系统架构
电商
集合框架
数据湖|Flink + Iceberg 全场景实时
数仓
的建设实践
整理|路培杰(Flink社区志愿者)摘要:ApacheFlink是目前大数据领域非常流行的流批统一的计算引擎,数据湖是顺应云时代发展潮流的新型技术架构,以Iceberg、Hudi、Delta为代表的解决方案应运而生,Iceberg目前支持Flink通过DataStreamAPI/TableAPI将数据写入Iceberg的表,并提供对ApacheFlink1.11.x的集成支持。本文由腾讯数据平台部
大数据技术架构
·
2023-10-05 13:31
运维
大数据
分布式
编程语言
hadoop
数据仓库规范全解
3、
数仓
规范有哪些?4、设计规范5、流程规范6、质量管控规范推荐读一读。正文开始这是数据仓库系列的第三个话题,排序在架构之后、建模之前。为什么会提的这么靠前呢?
程序员的隐秘角落
·
2023-10-05 09:13
数据仓库建模理论——总结
四种模型:ER模型维度模型DataVault模型Anthor模型以上四种模型,当前最流行建模方法为:ER模型、维度模型ER模型ER模型常用于OLTP数据库建模,应用到构建
数仓
时更偏重数据整合,站在企业整体考虑
尼小摩
·
2023-10-05 08:50
大数据-玩转数据-Flink+Hologres构建实时
数仓
企业最常见的做法就是通过构建实时
数仓
来满足对数据的快速探索。
人猿宇宙
·
2023-10-03 21:18
大数据-玩转数据-阿里系
大数据
flink
运维
java毕业设计
电商项目
mybatis+源码+调试部署+系统+数据库+lw
java毕业设计
电商项目
mybatis+源码+调试部署+系统+数据库+lwjava毕业设计
电商项目
mybatis+源码+调试部署+系统+数据库+lw本源码技术栈:项目架构:B/S架构开发语言:Java语言开发软件
銮銮科技
·
2023-10-03 01:16
数据库
java
mybatis
【
数仓
建设系列之六】
数仓
管理利器-数据中台
【
数仓
建设系列之六】
数仓
管理利器-数据中台介绍相信看过前面几篇
数仓
建设系列文章的同学已经对什么是
数仓
以及如何建设
数仓
有了充分的认知和了解了,那么问题很多的小明就要问了,既然
数仓
已经建设起来了,那企业如何管理运营
数仓
呢
码猿小站
·
2023-10-02 23:43
数据仓库
数仓建设
数据中台
大数据
数据仓库
深入解析数据仓库中的缓慢变化维
前言最近公司在招聘
数仓
开发,笔者负责技术方面的一些问题,缓慢变化维自然是是不可缺少的环节。
秋夜雨凉
·
2023-10-02 23:01
大数据Flink(九十四):DML:TopN 子句
文章目录DML:TopN子句DML:TopN子句TopN定义(支持Batch\Streaming):TopN其实就是对应到离线
数仓
中的row_number(),可以使用row_number()对某一个分组的数据进行排序应用场景
Lansonli
·
2023-10-02 07:19
大数据入门核心技术
#
Flink
大数据
flink
数仓
精品理论-做大数据还有没有前途?
数仓
精品理论-做大数据还有没有前途?做大数据还有没有前途?大数据三要三不要我来讲讲大数据前景做大数据还有没有前途?先说,答案是肯定的,但一定要记住三要三不要。
辉常努腻
·
2023-10-02 02:42
大数据
数据仓库基本概念
转载自:https://www.cnblogs.com/traditional/p/9205300.html
数仓
分层都分哪些层?
Jimmy2019
·
2023-10-01 21:33
数据仓库(DW)的分层架构
目录1说明2数据仓库“分层”的优势3离线
数仓
的数据分层4实时
数仓
的数据分层1说明离线过程与实时过程的
数仓
的分层一般有所不同2数据仓库“分层”的优势(1)把复杂的问题简单化;通过把复杂的问题分解成多层,每次只处理简单任务
芋辕-
·
2023-10-01 12:22
大数据开发
大数据
数据仓库
数仓
(DW)的架构
文章目录事实表分:事务型事实表,周期性快照事实表,累计快照事实表维度表维度表设计方法星型模型和OLAP多维数据库Kimball的
数仓
架构独立数据集市架构辐射状企业信息工厂Inmon架构混合架构事实表每行数据对应的是一个粒度的事件
maxlove1111
·
2023-10-01 12:51
数仓
数据仓库
电商项目
中高流量大并发的一揽子解决思路
1.硬件升级普通的P4服务器一般最多能支持每天10万独立IP,如果访问量比这个还要大,那么必须首先配置一台更高性能的专用服务器才能解决问题,否则怎么优化都不可能彻底解决性能问题。2.负载均衡它是根据某种负载策略把请求分发到集群中的每一台服务器上,让整个服务器群来处理网站的请求。公司比较有钱的,可以购买专门负责负载均衡的硬件(如:F5),效果肯定会很好。对于大部分公司,会选择廉价有效的方法扩展整个系
Jack爱258
·
2023-10-01 11:16
大并发
分布式
高并发解决方案
数据中台实战(00)-大数据的尽头是数据中台吗?
与
数仓
、数据湖、大数据平台啥区别?来深入大数据发展史,先从
数仓
出现讲起,途径数
JavaEdge.
·
2023-10-01 03:18
数据中台
大数据
数据仓库
数据仓库实践杂谈-(四)-元数据
整体数据分层第三章:整体实现框架第四章:元数据第五章:ETL第六章:数据校验第七章:数据标准化第八章:去重第九章:增量/全量第十章:拉链处理第十一章:分布式处理增量第十二章:列式存储第十三章:逻辑数据模型(
数仓
模型
老程序员一叶知秋
·
2023-09-30 19:13
数据仓库实践
元数据
数据仓库
大数据
数据模型
ETL
电商项目
高级篇-02 elasticsearch-下
电商项目
高级篇-02elasticsearch-下4.2、QueryDSL返回指定字段4.2、QueryDSL返回指定字段返回单个字段GETbank/_search{"query":{"match_all
厚学
·
2023-09-30 16:23
elasticsearch
jenkins
大数据
離線數倉:用戶拉鏈錶推導過程
1.維度表維度表有兩類:1.全量快照表离线
数仓
的计算周期通常为每天一次,可以每天保存一份全量的维度数据优点是:简单有效,开发和维护成本都比较低,方便理解和使用缺点是:浪费存储空间,尤其是当数据量比较大,
m0_37759590
·
2023-09-30 08:12
HQL
离线数仓
拉链表
畅购商城项目,面试问答,项目详解及全部代码
商城项目商城—微服务技术栈1商城介绍1.1项目介绍此
电商项目
属于B2C模式的线上商城,支持用户在线浏览商品,在线搜索商品,并且可以将喜欢的商品加入购物车从而下单购买商品,同时支持线上支付,支付模式支持支付宝
@邢先生
·
2023-09-29 17:37
JAVA面试题大全
JAVA实战项目
畅购商城
面试问答
项目详解
JAVA代码
怎么使用 Go 语言操作 Apache Doris
基于此,ApacheDoris能够较好的满足报表分析、即席查询、统一
数仓
构建、数据湖联邦查询加速等使用场景,用户可以在此之上构建用户行为分析、AB实验平台、日志检索分析、用户画像分析、订单
hf200012
·
2023-09-29 12:29
golang
apache
开发语言
Vue3 仿京东
电商项目
| 首页开发【项目初始化】
完整原文地址见更多完整Vue笔记目录敬请见《前端Web笔记汇总目录(Updating)》本文内容提要项目初始化装ESLint插件装Vetur插件目录|node_modules、package.json目录|public目录目录|.editorconfig文件目录|package-lock.json目录|src样式兼容浏览器使用移动端模拟器iconfont.cn阿里矢量图标库的使用【采集icon到项
凌川江雪
·
2023-09-29 11:17
【数据仓库设计基础(四)】数据仓库实施步骤
文章目录1.定义范围2.确定需求3.逻辑设计1)建立需要的数据列表2)识别数据源3)制作实体关系图4.物理设计1)性能优化2)
数仓
的拓展性5.装载数据6.访问数据7.管理维护实施一个数据仓库项目的主要步骤是
roman_日积跬步-终至千里
·
2023-09-29 09:56
数据仓库
数据仓库
spark
大数据
大数据学习笔记2:现代数据湖之Iceberg
数据湖的定义就不说了,不了解的小伙伴可以看我之前做的笔记大数据学习笔记1:
数仓
、数据湖、数据中台。1.数据湖发展现状从广义上来说数据湖系统主要包括数据湖村处和数据湖分析现有数据湖技术主要
泊浮目
·
2023-09-29 02:17
Java
电商项目
购物车功能实现流程
创建购物车对象:创建一个购物车类,包含购物车的属性和方法。购物车的属性可以包括购物车项列表、购物车总价等。添加商品到购物车:在购物车类中实现一个方法,用于将商品添加到购物车中。该方法需要接收商品的信息,创建购物车项对象,并将购物车项添加到购物车的购物车项列表中。从购物车中删除商品:在购物车类中实现一个方法,用于从购物车中删除指定的购物车项。该方法可以通过购物车项的唯一标识符(如商品ID)来找到并删
LOY244
·
2023-09-29 00:07
spring
如何用中台思路治理指标——数据指标中心
作者介绍@小风数据中台产品负责人;UBDC全域大数据峰会“灯塔人物”;擅长埋点模型、指标治理,
数仓
架构等;《大数据实践之路:数据中台+数据分析+产品应用》作者;“数据人创作者联盟”成员。
一个数据人的自留地
·
2023-09-28 23:33
数仓
概念 | 逻辑 | 物理模型
ConceptualDataModelADatawarehouseconceptualdatamodelisnothingbutahighest-levelrelationshipsbetweenthedifferententities(inotherworddifferenttable)inthedatamodel.thefeaturesofconceptualdatamodelFollowin
胖胖胖胖胖虎
·
2023-09-28 13:15
数据仓库
数据库
sql
Flink Batch SQL Improvements on Lakehouse
内容主要分为三个部分:FlinkBatchonPaimon挑战FlinkBatch核心优化后续规划点击查看原文视频&演讲PPT一、FlinkBatchonPaimon挑战众所周知,Paimon在创立之初就是为了解决流式
数仓
场景的问题
Apache Flink
·
2023-09-28 12:55
Flink
大数据
实时计算
flink
batch
sql
大数据
开发语言
实时
数仓
Hologres:推出计算组实例/支持JSON数据/向量计算+大模型等新能力
阿里云ODPS系列产品以MaxCompute、DataWorks、Hologres为核心,致力于解决用户多元化数据的计算需求问题,实现存储、调度、元数据管理上的一体化架构融合,支撑交通、金融、科研、等多场景数据的高效处理,是目前国内最早自研、应用最为广泛的一体化大数据平台。本期将重点介绍Hologres推出计算组实例Hologres支持JSON数据Hologres向量计算+大模型能力Hologre
阿里云云栖号
·
2023-09-28 10:34
云栖号技术分享
json
云计算
阿里云
大数据
大数据架构师——音乐数据中心平台离线
数仓
综合项目(三)
文章目录音乐数据中心平台离线
数仓
综合项目第二个业务:机器详细信息统计需求模型设计数据处理流程1.将数据导入MySQL业务库2.使用Sqoop工具抽取数据到HiveODS层3.使用SparkSQL对ODS
讲文明的喜羊羊拒绝pua
·
2023-09-27 23:11
大数据
大数据
hive
hadoop
Azkaban
Superset
离线
数仓
搭建_09_ODS层数据导入
文章目录11.0
数仓
搭建ODS层11.1ODS层(用户行为数据11.1.1创建日志表ods_log11.1.2Shell中单引号和双引号区别11.1.3ODS层日志表加载数据脚本11.2ODS层(业务数据
Fang GL
·
2023-09-27 23:39
离线数仓项目
hadoop
hive
大数据
数据仓库
1——Hive
数仓
项目完整流程(在线教育)
目录前言一、项目架构二、软件相关作用1.大数据相关软件2.
数仓
2.1数据仓库与数据库2.2数据仓库和数据集市2.3维度分析2.4指标3.
数仓
建模3.1建模理论3.2维度建模3.3维度建模的三种模型3.4
@—笨小孩—@
·
2023-09-27 23:39
python大数据
数仓实战
大数据
数据仓库
python
Hive+Spark离线
数仓
工业项目--ODS层及DWD层构建(1)
目标:自动化的ODS层与DWD层构建实现-掌握Hive以及Spark中建表的语法规则-实现项目开发环境的构建-自己要实现所有代码注释-ODS层与DWD层整体运行测试成功
数仓
分层回顾目标:回顾一站制造项目分层设计实施
骨灰级收藏家
·
2023-09-27 23:38
hive
大数据
Spark
hive
spark
hadoop
数仓工业项目
DWD层构建
一百八十三、大数据离线
数仓
完整流程——步骤二、在Hive的ODS层建外部表并加载HDFS中的数据
一、目的经过6个月的奋斗,项目的离线
数仓
部分终于可以上线了,因此整理一下离线
数仓
的整个流程,既是大家提供一个案例经验,也是对自己近半年的工作进行一个总结。
天地风雷水火山泽
·
2023-09-27 23:07
Hadoop
大数据
hive
hdfs
储存过程之拉链表
很多做
数仓
的朋友在面试的时候都会被问到,你写过的最难的存储过程是什么,这时候我们都会想到拉链表,拉链表真的那么难吗,下面我简单介绍一下拉链表作用,以及制作思路,希望可以帮到你。
yuxiu_1191610370
·
2023-09-27 20:47
etl
etl
数据仓库
链表
数仓
_Hive全部基础知识点
文章目录1Hive入门1.1什么是Hive1.2Hive的优缺点1.2.1优点1.2.2缺点1.3Hive架构原理1.4Hive和数据库的比较1.4.1查询语言1.4.2数据存储位置1.4.3数据更新1.4.4索引1.4.5执行1.4.6执行延迟1.4.7可扩展性1.4.8数据规模2Hive安装2.1Hive安装地址2.2Hive安装部署3Hive数据类型3.1基本数据类型3.2集合数据类型3.3
oifengo
·
2023-09-27 20:45
#
爬梯
Hive
数仓
项目之
数仓
分层、
数仓
工具的使用
往期内容:Hive
数仓
项目架构说明、环境搭建及数据仓库基础知识今日内容:1)教育项目
数仓
分层(知道,明确每一层的作用)2)
数仓
工具的相关的使用(操作)2.1HUE相关的使用(操作HDFSHIVE,OOZIE
黑马程序员官方
·
2023-09-27 20:14
数据仓库
大数据
python
Hive电商
数仓
实战
项目描述以电商数据为基础,详细介绍数据处理流程,结合hive
数仓
、spark开发采用多种方式实现大数据分析。
GoAI
·
2023-09-27 20:14
数据仓库
大数据
python
hive
电子商务
数仓
开发常用hive命令
在做
数仓
开发或指标开发时,是一个系统工程,要处理的问题非常多,经常使用到下面这些hive命令:内部表转外部表altertable${tablename}settblproperties('EXTERNAL
大模型大数据攻城狮
·
2023-09-27 20:41
hive
hadoop
数据仓库
大型网站架构演变
同时结合自己多年电商领域经验,尝试完成从0到1的
电商项目
,从单体应用到逐步实现集群、分布式、再到微服务的架构演变~希望能有所沉淀,温故而知新,下面我们开始吧~什么是大型网站?
张丰哲
·
2023-09-27 19:46
上一页
14
15
16
17
18
19
20
21
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他