E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
数仓架构搭建
【第17章】亿级电商订单系统架构设计-概要设计
电商平台订单系统学习路径1.高层架构设计细化阶段分为两个核心部分:概要设计(本章重点)详细设计2.本章学习目标(1)概要设计方法论理解设计阶段的核心任务掌握具体实施方法建立设计思想指导体系(2)项目实践应用项目工程
架构搭建
环境配置规范组件关系梳理客户端
cherry5230
·
2025-07-23 16:26
亿级流量架构设计与落地
系统架构
架构
分布式
中间件
Paimon对比基于消息队列(如Kafka)的传统实时
数仓
方案的优势
弊端:数据重复->优势:Paimon主键表原生去重原方案弊端(Kafka)问题:消息队列(Kafka)是仅支持追加(Append-Only)的日志流。当Flink作业发生故障恢复(Failover)或业务逻辑迭代重跑数据时,同样的数据会被再次写入消息队列,形成重复数据。影响:下游应用(如DWS层、ADS层或直接对接的BI报表)必须自己实现复杂的去重逻辑,这不仅消耗大量计算资源(“资源消耗至少增加一
lifallen
·
2025-07-20 05:58
Paimon
大数据
数据库
数据结构
java
分布式
apache
数据仓库
[特殊字符] 实时数据洪流突围战:Flink+Paimon实现毫秒级分析的架构革命(附压测报告)——日均百亿级数据处理成本降低60%的工业级方案
某电商平台借助Flink+Paimon重构实时
数仓
后,端到端延迟从分钟级压缩至800ms,计算资源节省5.6万核/月。
Lucas55555555
·
2025-07-12 17:24
flink
大数据
准备
数仓
实习面试中回顾SQL题
550-game-play-analysis-ivhttps://leetcode.com/problems/game-play-analysis-iv/description/连续两天登录的比率,2025年6月10日星期二,date_sub#编写解决方案,报告在首次登录的第二天再次登录的玩家的比率,四舍五入到小数点后两位。换句话说,你需要计算从首次登录日期开始至少连续两天登录的玩家的数量,然后除
zhuiQiuMX
·
2025-07-05 19:23
sql
阿里云SelectDB:开启实时
数仓
新时代
一、引言在当今大数据时代,数据如同企业的“石油”,蕴含着巨大的价值。随着数据量呈指数级增长,企业对于实时数据分析的需求愈发迫切。实时数据分析能够帮助企业及时捕捉市场动态,快速做出决策,从而在激烈的市场竞争中占据优势。无论是电商企业需要实时分析用户购买行为以进行精准营销,还是金融机构需要实时监测风险以保障资金安全,实时数据分析都发挥着关键作用。阿里云SelectDB作为一款专为实时数据分析打造的云原
云资源服务商
·
2025-07-04 10:09
阿里云
云计算
数据库
云原生
【Python爬虫实战】全面抓取网页资源(图片、JS、CSS等)——超详细教程与源码解析
本篇文章将带你从零开始,系统讲解如何使用Python最新技术,一步步实现抓取网页中所有静态资源的完整流程,包括:页面结构分析爬虫基本
架构搭建
异步爬取
Python爬虫项目
·
2025-07-03 18:19
python
爬虫
javascript
新浪微博
开发语言
css
旅游
储能业 | 低成本部署!DolphinDB 打造抽水蓄能一体化解决方案
导语在电力行业抽水蓄电场景中,电力集团可以基于DolphinDB搭建轻量化实时
数仓
,有效破解高频数据写入、万亿级数据存储和秒级实时计算等核心难题。
DolphinDB智臾科技
·
2025-06-29 03:55
物联网
数据库
大数据
DolphinDB
实时计算
抽水蓄能
电力
实时
数仓
工具-SelectDB
一、SelectDB简介官网:https://www.selectdb.com/1、ApacheDorisApacheDoris是一款采用MPP架构的实时分布式OLAP数据仓库,专注于高效的实时数据分析。Doris项目于2013年内部开发,2017年正式开源,目前在GitHub上获得了接近13,000星,全球已有超过5,000家企业采用,社区活跃度极高,累计贡献者超过650人,且曾连续数月在大数据
清平乐的技术博客
·
2025-06-27 04:25
实时数仓
数据仓库
针对数据仓库方向的大数据算法工程师面试经验总结
建模实战题:例如设计电商销售
数仓
,需明确事实表(订单流水)、维度表(商品、用户、时间),并解释粒度选择(如订单级)。ETL流程与优化增量抽取方案:面试高频题。需掌握基于时间戳、CD
巴基海贼王
·
2025-06-27 01:05
数据仓库
大数据
算法
现代数据湖架构全景解析:存储、表格式、计算引擎与元数据服务的协同生态
一、数据湖架构演进与核心价值数据湖架构演进历程现代数据湖核心价值矩阵维度传统
数仓
现代数据湖存储成本高(专有硬件)低(对象存储)数据时效性小时/天级分钟/秒级
讲文明的喜羊羊拒绝pua
·
2025-06-26 00:46
大数据
架构
数据湖
Spark
Iceberg
Amoro
对象存储
Linux-高性能Web集群实践 day02
Linux-高性能Web集群实践Day02.中小规模Web集群规划与环境准备1.集群概念2.企业网站集群架3.网站集群
架构搭建
规划3.1中小规模基础网站集群架构规划3.2网站集群搭建顺序规划3.3主机IP
胖可仃
·
2025-06-25 16:48
Linux
Day38-50-200台中等规模集群
架构搭建
开始
Day38-50-200台中等规模集群
架构搭建
开始1.什么是集群?2.为什么企业要用集群?3.集群特点4.集群架构是什么样子的?形象描述集群5.集群内服务软件说明1.什么是集群?
我心中有一片海
·
2025-06-25 16:48
#
ob-笔记(77)
架构
linux
运维
服务器
湖仓一体实时数据采集与存储实践
文章目录湖仓一体实时数据采集与存储实践1.实时
数仓
演进:从传统
数仓
到湖仓一体1.1传统
数仓
的局限性:批处理延迟与数据孤岛1.2湖仓一体(Lakehouse)的核心价值1.3典型行业场景解析案例1:金融实时风控案例
danny-IT技术博客
·
2025-06-25 08:17
企业级SQL
Server深度实践
spring
boot
spark
CDC
DATALAKE
零基础深入SpringCloud
架构搭建
与源码解析第五节
本文还有配套的精品资源,点击获取简介:本教程第五节深入讲解从零开始搭建SpringCloud项目,包括源码解析和实践操作。SpringCloud是一个微服务框架,利用SpringBoot简化Java应用的服务配置和管理,提供了服务发现、配置中心等核心功能。教程将介绍项目初始化、服务注册与发现、微服务创建、路由服务配置、断路器实现和测试验证的完整流程,通过源码解析和操作截图帮助学习者深刻理解其工作原
Hsmiau
·
2025-06-24 03:27
智慧零工平台后端开发进阶:Spring Boot 3结合MyBatis-Flex的技术实践与优化【无标题】
在完成智慧零工平台基础
架构搭建
后,如何进一步提升系统性能、简化开发流程并增强系统的可维护性成为新的挑战。
广州山泉婚姻
·
2025-06-23 22:54
spring
爬虫
人工智能
maxcomputer 和 hologres中的EXTERNAL TABLE 和 FOREIGN TABLE
在阿里云的大数据和实时
数仓
产品中,MaxCompute和Hologres都支持类似于EXTERNALTABLE和FOREIGNTABLE的机制,但它们的实现和语义有所不同。
静听山水
·
2025-06-23 06:37
#
Hologres
大数据
前端技术体系全景详解
一、前端技术体系全景与主流程1.1前端主流程全景图现代前端开发通常按如下主流程推进:需求分析与UI设计技术选型与
架构搭建
组件开发与页面构建状态管理与数据流接口对接与数据处理测试与调试打包构建与发布性能优化与监控高阶集成与演进简要解释
北漂老男人
·
2025-06-23 00:58
前端
前端
学习方法
开发语言
【StarRocks系列】StarRocks vs Mysql
它诞生于解决现代企业对海量数据进行快速、复杂分析的需求,尤其是在实时数据仓库、用户行为分析、日志分析、统一
数仓
等场景下表现卓越。核心特性MPP架构:采用无共享架构,计算和
漫步者TZ
·
2025-06-21 12:05
StarRocks
mysql
数据库
StarRocks
分布式数据库
SPL轻量级多源混合计算
经常要借助逻辑数据仓库,但基于SQL的逻辑
数仓
不仅能力有限,而且体系过于沉重,经常会比应用本身还复杂,只适合应用于大型场景中,并不适合众多日常的轻量多源混算场景。S
LuckJudy
·
2025-06-20 13:31
数据计算
多源混算
esProcSPL
云原生
数仓
vs 传统
数仓
:深度拆解区别、优劣势及主流选型
云原生
数仓
vs传统
数仓
:深度拆解区别、优劣势及主流选型在数据驱动业务的当下,数据仓库作为企业数据中枢,承载着核心决策支持使命。随着云技术普及,云原生
数仓
与传统
数仓
的选型博弈愈发关键。
limnade
·
2025-06-19 22:47
云原生
数据仓库
《Techporters
架构搭建
》-Day02 集成Mybatis-plus
集成Mybatis-plusMybatis-plus集成Mybatis-plus步骤小结Mybatis-plusMybatis-plus官网MyBatisPlus(简称MP)是一个MyBatis的增强工具,在MyBatis的基础上只做增强不做改变,为简化开发、提高效率而生。它引入了一些新的特性,如自动填充、乐观锁插件、逻辑删除等,同时还内置了一些常用的CRUD操作,极大地减少了开发人员的工作量。集
请叫我技术型项目经理
·
2025-06-19 18:13
从零搭建企业级框架
架构
mybatis
2025 年电商发展策略与方向
技术
架构搭建
采用微服务架构:将电商系统拆分成多个可独立运行、扩展和维护的微服务,如用户管理、商品管理、订单管理、支付系统等。这样可以提高系统的灵活性、可扩展性和稳定性,便于应对高并发和业务的快速变化。
subuq
·
2025-06-19 15:23
人工智能
大数据
亚马逊,temu采购拍单技术砍单问题怎么解决
在Temu,高砍单率往往与账号关联、异常环境、购买行为异常、黑名单账号、注册与使用环境问题以及风控模型算法等因素有关测评系统底层
架构搭建
1.网络环境隔离硬件参数伪装:采用服务器部署虚拟终端技术,通过技术手段伪装设备底层参数
zcwz009V
·
2025-06-14 23:14
temu采购
代采
亚马逊测评
自养号技术
血缘系统 datahub + Sqllineage
使用方一般为对
数仓
表结构不太熟悉的业务/数据经理想要了解有哪些数据。
CesarChoy
·
2025-06-13 23:10
linux
大数据
从 GreenPlum 到镜舟数据库:杭银消费金融湖仓一体转型实践
作者:吴岐诗,杭银消费金融大数据应用开发工程师本文整理自杭银消费金融大数据应用开发工程师在StarRocksSummitAsia2024的分享引言:融合数据湖与
数仓
的创新之路在数字金融时代,数据已成为金融机构的核心竞争力
镜舟科技
·
2025-06-13 23:08
金融
湖仓一体
镜舟数据库
数据仓库
StarRocks
存算分离
Fusion引擎赋能:流利说如何用阿里云Serverless Spark实现
数仓
计算加速
作者:流利说Ibson(大数据负责人)/Bruce(数据工程师)背景介绍行业流利说是领先的科技驱动的教育公司,公司自主研发了领先的英语口语评测、写作打分引擎和深度自适应学习系统,致力于为用户提供一整套系统性的英语学习解决方案,从听、说、读、写多个维度提升用户的英语水平。业务特征AI打分:利用大数据和人工智能算法对用户英语口语评测、写作打分。个性化推荐:根据用户学习目标及评级,自动推荐专项和强化课程
阿里云大数据AI技术
·
2025-06-11 23:29
阿里云
serverless
spark
云计算
大数据
人工智能
Fusion 引擎赋能:流利说如何用阿里云 Serverless Spark 实现
数仓
计算加速
作者:流利说Ibson(大数据负责人)/Bruce(数据工程师)01背景介绍行业流利说是领先的科技驱动的教育公司,公司自主研发了领先的英语口语评测、写作打分引擎和深度自适应学习系统,致力于为用户提供一整套系统性的英语学习解决方案,从听、说、读、写多个维度提升用户的英语水平。业务特征AI打分:利用大数据和人工智能算法对用户英语口语评测、写作打分。个性化推荐:根据用户学习目标及评级,自动推荐专项和强化
Apache Spark中国社区
·
2025-06-11 23:28
阿里云
serverless
spark
云计算
云原生
HAWQ 取代传统
数仓
实践(十八) —— 层次维度
目录一、层次维度简介二、固定深度的层次三、多路径层次四、参差不齐的层次五、递归一、层次维度简介大多数维度都具有一个或多个层次,例如,示例数据仓库中的日期维度就有一个四级层次:年、季度、月和日,这些级别用date_dim表里的列表示。日期维度是一个单路径层次,因为除了年-季度-月-日这条路径外,它没有任何其他层次。为了识别数据仓库里一个维度的层次,首先要理解维度中列的含义,然后识别两个或多个列是否具
wzy0623
·
2025-06-10 16:11
更好的
Hadoop
数据仓库解决方案——HAWQ
实战演练
HAWQ
数据仓库
数据仓库——如何量化评价一个数据仓库的好坏?
为了回答这个问题,小编特意邀请了我司的
数仓
专家FrankLi。
辉哥大数据
·
2025-06-10 16:10
【大数据面试宝典】
数据仓库
数据库
大数据
分布式
数仓
多源异构数据整合策略:融合与分离的实践指南
目录引言第一章问题分析与决策框架1.1典型业务场景1.2关键矛盾点1.3三维决策模型
莫叫石榴姐
·
2025-06-06 17:46
数字化建设通关指南
#
数据建模
人工智能
数据仓库
数据分析
大数据
记一次·Spark读Hbase
记一次·Spark读Hbase一、背景过年回来,
数仓
发现hive的一个表丢数据了,需要想办法补数据。这个表是flume消费kafka写hive。
·
2025-06-06 00:55
IT培训课程内容
架构搭建
基本思路
第一步:课程设计三步法搭骨架(课程结构)基础课:教"是什么"(比如编程基础、网络原理)核心课:教"怎么用"(比如项目开发、故障排查)实战课:教"怎么选"(比如技术方案设计、架构决策)填血肉(内容组织)把每个技术点变成"积木块"(比如把数据库知识拆成10个模块)给每块积木配"说明书"(学习目标)+"拼装图"(项目案例)允许学员自由组合积木(个性化学习路径)加引擎(学习动力)设置闯关任务(每学完一个模
盘古云课堂
·
2025-06-05 04:05
洞察IT培训
学习方法
改行学it
创业创新
程序员创富
程序人生
Flink进阶之路:解锁大数据处理新境界
基础回顾二、Flink进阶知识深入2.1数据类型与序列化2.2双流Join操作2.3复杂事件处理(CEP)2.4状态管理与优化三、Flink在实际场景中的应用3.1实时智能推荐3.2实时欺诈检测3.3实时
数仓
与
£菜鸟也有梦
·
2025-06-05 04:33
大数据基础
flink
大数据
hadoop
spark
Doris实践——叮咚买菜基于OLAP引擎的应用实践
目录前言一、业务需求二、选型与对比三、架构体系四、应用实践4.1实时数据分析4.2B端业务查询取数4.3标签系统4.4BI看板4.5OLAP多维分析五、优化经验六、总结原文大佬介绍的这篇Doris
数仓
建设实践有借鉴意义的
吵吵叭火
·
2025-06-04 20:05
大数据
大数据
数据仓库
开源免费数据同步工具全景解析与实战指南
1.1工具分类矩阵类型代表工具核心能力适用场景开源协议ETL工具DataX、SeaTunnel异构数据源批量同步数据仓库构建Apache2.0CDC工具FlinkCDC、Canal实时数据变更捕获实时
数仓
社恐码农
·
2025-06-04 13:39
Hive
mysql
postgres
开源
数据同步工具
架构、框架、设计模式:一篇文章讲透三者区别
例如,ECS
架构搭建
游戏骨架,Unity框架处理渲染与物理,状态模式管理角色行为。理解其分工与协作,能高效构建高质量系统。1.架构(Archite
你一身傲骨怎能输
·
2025-06-02 22:49
架构设计
架构
设计模式
最全Doris实战——结合Flink构建极速易用的实时
数仓
_flink doris
3.6.4执行层查询加速四、行业最佳实践4.1跨境电商4.2运营服务商4.3供应链企业原文大佬的这篇Doris+Flink构建实时
数仓
的实战文章整体写的很深入,这里直接摘抄下来用作学习和知识沉淀。
2301_82241942
·
2025-06-01 06:36
程序员
flink
linq
大数据
实时
数仓
flick+clickhouse启动命令
FlinkCDC环境部署启动flink-yarn模式1、启动zookeeperzk.shstart2、启动DFS,Hadoop集群start-dfs.sh3、启动yarnstart-yarn.sh4、启动kafka(如果需要在启用)启动Kafka集群bin/kafka-server-start.sh-daemonconfig/server.properties查看Kafkatopic列表bin/k
遥遥领先zzl
·
2025-06-01 06:06
服务器
数据库
运维
实时数据仓库存储引擎革新:从Lambda到Kappa++架构的底层技术演进
引言:实时
数仓
的存储革命迫在眉睫在数字化转型浪潮中,企业对数据时效性的需求正从T+1小时向秒级演进。据Gartner最新报告显示,到2025年将有75%的企业将实时数据分析能力作为核心竞争力指标。
尘烬海
·
2025-06-01 04:20
数据仓库
架构
service_mesh
网络协议
深度学习
平面
分布式
基础入门-Web应用&
架构搭建
&域名源码&站库分离&MVC模型&解析受限&对应路径
网站的组成1.主站1.宝塔面板的网站搭建(宝塔、phpStudy)2.中间件套件的安装(nginx、Apache。。)3.域名解析服务器IP(DNS解析)2.分站(主要做网站扫描来找出分站拿出信息)1.收集更多的分站对分站的攻击有概率影响到主站2.分站可能也解析到主站的IP3.通过子域名收集3.端口站1.http默认解析到80端口2.https默认解析到443端口3.不同端口可能指向的是不同网站4
m0_64332920
·
2025-05-31 20:24
前端
架构
mvc
未来
数仓
的构想
未来
数仓
的构想周日再北京参加亚马逊云科技的开发者usergroup会议,下面是一个会议演讲内容,对我很有启发随着大数据的蓬勃发展,数据仓库的架构逐渐从传统的、单一的数据存储结构转向更加智能、灵活的分布式架构
小Tomkk
·
2025-05-31 19:19
论坛
大数据
大数据
未来数仓
重构开发范式!飞算JavaAI革新Spring Cloud分布式系统开发
SpringCloud作为Java生态最主流的分布式开发框架,虽被广泛应用于微服务
架构搭建
,但其传统开发模式却面临效率瓶颈——从服务注册中心配置到网关路由规则编写,从熔断机制实现到分布式事务处理,每一个环节都需要开发者投入大量时间攻克技术细节
飞算JavaAI开发助手
·
2025-05-30 23:56
重构
spring
cloud
spring
数据仓库实践:使用SQL汇总BOM数据分析维度
将BOM主数据引入
数仓
,可以保证数据流转和分析过程中保证与制造过程的一致,以确保分析结果的准确。
The_Singing_Towers
·
2025-05-30 13:37
数据仓库实践
数据仓库
数据分析
python
sql
数据库
笔记
数据仓库建设 : 主题域简介
以下是常见的
数仓
主题域及其对应的功能:1.客户管理
goTsHgo
·
2025-05-30 06:19
数据仓库
大数据
大数据
数据仓库
实时
数仓
和离线
数仓
的区别是什么?企业如何选择合适的
数仓
架构?
实时
数仓
和离线
数仓
的区别是什么?企业如何选择合适的
数仓
架构?时
数仓
和离线
数仓
都是数据仓库的不同类型,用于存储和管理企业的数据,但它们在数据处理和使用的时间、速度以及用途方面有明显的区别。
数字天下
·
2025-05-29 05:17
架构
数据库
大数据
《Spark/Flink/Doris离线&实时
数仓
开发》目录
欢迎加入《Spark/Flink/Doris离线&实时
数仓
开发》付费专栏!
大模型大数据攻城狮
·
2025-05-25 12:32
spark
flink
大数据
数据面试
离线数仓
实时数仓
调度器
大模型的应用中A2A(Agent2Agent)架构的部署过程,A2A架构实现不同机器人之间的高效通信与协作
文章目录1.项目背景1.1A2A协议的提出背景1.2目标与愿景2.项目应用场景2.1多智能体协作场景2.2企业级应用案例2.3开发者社区支持3.
架构搭建
3.1环境准备3.2获取示例代码3.3运行示例4.
微学AI
·
2025-05-25 11:30
架构
机器人
人工智能
A2A
电商
数仓
项目(八) Flume(3) 生产者和消费者配置
目录一、生产数据写到kafka二、消费kafka数据写到hdfs本节讲解Flume生产者和消费者配置。源码下载一、生产数据写到kafka将上节生成的flume-interceptor-1.0.0.jar文件上传到$FLUME_HOME/lib目录下在$FLUME_HOME/conf目录中创建file-flume-kafka.conf文件,文件目录:/u01/gmall/data/in/log-da
涛2021
·
2025-05-24 02:19
数据仓库:
Hadoop+Hive
flume
kafka
数仓
开发面试题汇总-数据建模&数据治理
1.如何建设
数仓
,如何构建主题域数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。
话数Science
·
2025-05-20 17:56
1024程序员节
大数据
【数据仓库面试题合集③】实时
数仓
建模思路与实践详解
一、建模原则与
数仓
分层认知1.实时
数仓
与离线
数仓
建模有什么区别?答:维度离线建模实时建模数据来源批量导入,数据快照流式数据,如Kafka数据一致性可批量补数,强一致性补数困难,更强调最终一致
晴天彩虹雨
·
2025-05-20 17:24
数据仓库面试解析集锦
数据仓库
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他