gjggw123

数据中台-实施篇：数据接入相关规范

xxx数据接入相关规范

1 文件内容规范

每个EXECL保留一个SHEET页。

注：目前解析程序只解析第一个sheet页。如果与其他sheet页关联可能将导致数据不准确风险。

1.1 HDFS目录规范

1.1.1 文件命名规范

数据文件名称为自定义数据表文件名称，要有实在意义，取名简单，遵守企业命名规范,hdfs

文件命名和ftp缓存服务器英文件命名保持一致。

规范: 数据文件命名构成为: 8位日期数字_原表英文名称-批次号(3位数值).后缀名

注明：

8位日期数字: 前八位日期用来确认数据分区。
原表英文名称:描述实体业务源数据表英文简称。
批次号:用来描述数据文件存储上传的次数顺序,规定3位有效数值位(如:001)。
后缀名:主要由业务和数据团队视角协商来自定义即可，描述ftp缓存层源数类型(如xlsx、xlsb), hdfs目录文件类型统一为csv格式。
8位日期数字与原表英文名称使用下划线链接, 原表英文名称、批次号之间是有中划线链接。

例如

ftp文件名:

8位日期数字_原表英文名称-批次号.后缀名

20190831-packing_list-001.xlsx

Hdfs文件名：

20190831-packing_list-001.csv

1.1.2 SFTP目录路径规范

存储介质	远程FTP本地服务器文件目录	状态
人力数据	/data/recv_t_dev/业务系统简称/时间/数据文件名	日全量数据

1.1.3 hdfs目录路径规范

源数接入类型： i:增量(Increment)、 t:全量(Total)、 p:区间(Period)

数据类型：全量数据标识字母为t，增量数据标识字母为i，区间数据标识字母为p
环境类型：测试数据标识名称为dev，正式数据标识名称为pro

命名规范: /data/recv_{ 数据类型}_{环境类型}/业务系统简称/数据时间/表名称/数据文件

存储介质	目录（生产:pro 开发:dev）	状态
sftp本地目录	/data/recv_*_环境/业务系统简称/时间/文件名	临时文件存储
HDFS集群目录	/data/recv_t_pro/业务系统简称/时间/库表名/文件名	清洗后数据目录(全),生产
HDFS集群目录	/data/ftpdata_t_dev/业务系统简称/时间/库表名/文件名	源数据接入(全),生产
ODS仓库目录	/user/hive/warehouse/库名/表名	业务库表

业务系统简称(和hive业务库名称对应)：环境 _业务系统英文简称(3位字母位)

接入类型	HDFS目录划分（生产:pro 开发:dev）	数据层级	数据周期
全量数据接入	/data/recv_t_dev/data_hrg/20190829/表名/数据文件	tmp层	人力按日接入

注：1. 上述依据生产环境HDFS目录和FTP服务器目录统一相同为例！

集团人力资源英文业务名(简称:hrg )

特殊说明：

实例规范解析：

数据接入SFTP文件实例(财务按月刷入整月数据)：

生产环境数据源目录：/data/recv_*_pro/data_hrg/20190829/数据

数据接入HDFS实例(财务按月刷入整月数据)：

生产环境数据源目录：/data/recv_*_pro/data_hrg/20190829/表名/数据

实例1：sftp目录(财务按月刷入整月数据):

sftp目录: /data/recv_t_dev/data_hrg/201908/20190831-packing_list-001. xlsx

hdfs源数据目录: /data/ftpdata_t_dev/data_hrg/201908/packing_list /20190831-packing_list-001.csv

hdfs清洗后目录: /data/recv_t_dev/data_hrg/201908/packing_list /20190831-packing_list-001.csv

1.2 HIVE规范

1.2.1 数据库命名规范

在金博士平台(数据中台系统)建TMP层数据库和层数据表，都采用不同数据库数据。

数据库命名规则由两部分组成，命名规范：环境_库状态_业务系统英文简称

环境分类：pro、dev

例如（测试环境外部库）：整理库如下(开发库为例)：

	数据表接入库级命名-登记册		库名（生产:pro 开发:dev）
序列号	业务系统描述	业务代码简称	HIVE库名
1	测试	test	dev_test
2	集团人力数据	HRG(SF)	dev_hrg

1.2.2 数据表命名规范

表层级前缀命名规则

环境	模型层	库类型	数据加工分类入库
开发环境:dev 生产环境:pro	贴源模型层	外部数据源（tmp层）	外部表:源数据接入缓存层(表名规范: tmp_* )
	贴源模型层	贴源层数据库（ODS层）	内部表:增量更新、全量刷新、初始化库、源数据入库 (表名规范: ods_* )
	公共模型层	明细层数据库（DWD 层）	明细整合表、明细宽表 (表名规范: dwd_* )
	公共模型层	轻度汇总层数据库（DWS 层）	轻度汇总数据、维度数据表、二次量值统计数据 (表名规范: dws_* )
	标签模型层	标签层数据库（TDM 层）	前台应用标签数据表 (表名规范: tdm_* )
	应用模型层	应用层数据库（ADM 层）	应用集市、场景集市、对外发布的数据表 (表名规范: adm_* )
	营销模型层	数据营销层库（RDM 层）	数据应用多维幅度计算层监控指标 (表名规范: rdm_* )

例如：{ 数据层/数据层级}_{业务系统}_{业务库}_源系统表_{表状态}{加工频率}{加工类型}

表后缀命名规则

数据表状态:

u:更新表update、 s:流水表stream

数据加工频率:

h:小时(hour)、d:天(day)、w:周(week)、 m:月(momth)、q:季度(quarter)、 y:年(year)

数据加工类型：

i:增量(Increment)、 t:全量(Total)、 p:区间(Period)

后缀命名规范： _{数据表状态}{数据加工频率}{数据加工类型}

数据表设计：

*表后缀名*	描述
**_dt***	dt 后缀，日刷新、每个分区是一份全量
**_di***	di 后缀，日刷新、每个分区是一份增量
**_hi***	hi 后缀，小时刷新、每个分区是一份增量
**_wi***	wi 后缀，周刷新、每个分区是一份增量
**_mi***	mi 后缀，月刷新、每个分区是一份增量
**_qi***	qi 后缀，季度刷新、每个分区是一份增量
**_yi***	yi 后缀，年度刷新、每个分区是一份增量

说明：

以上未加入数据表状态(以上”*”代表: 数据表状态: u:更新表update、 s:流水表stream)。

一共能组合成种类数据表： 2x6*5*4*3*2x3*2=8640

源系统表重组命名规则：

源系统名: 指源系统英文简称代码

源系统库名: 指源系统表所在的库英文简称

源系统表名: 指源系统英文表名

数据层_{业务系统}_{业务库}_源系统表_{表状态}{加工频率}{加工类型}

ODS_{业务系统}_{业务库}_源系统表_{表状态}{加工频率}{加工类型}

如:

ods_ {业务系统}_{业务库}_{业务表名缩写/自定义表命名标签缩写}_{u/s}{h/d/w/m/q/y}{i/t/p}

更新表日增量命名取法: ods_eam_maximo_user_udi

流水表日全量命名取法: ods_eam_maximo_user_sdt

如:

ods层表名：

ods_agt_loan_app_sdi (贷款申请信息表，贴源层、每个分区是一份流水表每日刷增量)

ods_agt_loan_app_udt (贷款申请信息表，贴源层、每个分区是一份更新表每日刷全量)

CDW(DWD/DWS)/AMD层表重组命名规则：

业务系统: 指源系统业务线英文简称代码

再生业务表:是经过多表融合后再生的新业务表名，要有实在含义

AMD/DWS/DWD_{业务系统}_{再生业务表}_{表状态}{加工频率}{加工类型}

如：

DWD_SF_ PERSONINFO_SDT

SF: 集团人力数据库是SAP云端的数据中心,集中在上海,统称DC15

HRG: 人力资源

PERSONINFO：员工基础明细数据表(员工表+合同表+教育表)

1.2.3 数据字段命名规范

1.1 基本原则

命名以表述实体的真实含义、方便辨认为目的，数据库表名首字母大写，能用一个单词就用一个，需要多个的则只用关键单词，同一字段名在数据库中应保持含义相同，标识这个表是什么就行，每个单词都采用单数形式，每个单词首字母要大写(除此第一个单词)，命名规则：表名+单词或单词缩写，如 firstName，startDate，endDate。

注意点:禁止使用中文或拼音缩写进行命名，表名、字段名、视图名长度控制在5个单词之内，总长度小于30个字符。

1.2 如遇单词太长，可采用缩写，选择顺序如下:

a)首选在命名规范"常用缩写"中列示的缩写。

b)行业约定被广泛接受的缩写。

c)元音字母剔除法生成的缩写，缩写后长度应控制在5个字符以内，大写表示，但需在项目词汇表列示。

d)提取表名前4个字母,使用拼接后面有实在意义的字段名，如 userName、userPwd等。

1.3 与字段有关，默认的一些特殊字段，非常多表中：

比方一些业务处理表中，除了加入生成的自己主动编号ID（一般作为主键用），该记录创建的时间CreateDate(创建时间)与updateDate(更新时间),该记录的创建人CreatBy (注意这里。没UI_ID(用户信息表User_Info的主键UI_ID),由于还有改动人)，最后改动人LastEditBy。最后改动时间LastEditDate。(这些能够直接使用中文字符，而不使用编码，提高查询的效率)

　　同一时候有的时候须要注意，删除的时候并不真的删除该记录，而是加入一个标识位，比方XX_DeleteStaus删除状态。1是有效的，0则是无效的。

列如：

-- 1、ODS层内部表

DROP TABLE IF EXISTS DEV_HRG.ODS_SAPDC15_HRG_JOBTRANSFERS_UDT;

CREATE TABLE DEV_HRG.ODS_SAPDC15_HRG_JOBTRANSFERS_UDT (

serial string COMMENT '序号'

,empId string COMMENT '员工编号'

,firstName string COMMENT '姓名'

,startDate string COMMENT '生效日期'

,customString20Old string COMMENT '原业务单元'

) COMMENT '员工岗位异动报表' PARTITIONED BY (dt STRING)

ROW FORMAT DELIMITED NULL DEFINED AS ''

STORED AS ORCFILE;

1.4 主建定义

每一个表都应该有一个主键，这个主键最好是数字。并且是递增的，有非常多表的主键用32位字符编码，这样做的目的很多其它的是从安全考虑的。由于字符多时索引时效率低，而使用自增列也不是非常少，比方加入主表和从表操作时。主表的主键是从表的外键，这个时候还有取返回值，然后再加入，不能够同一时候加入。

主键能够用自己定义的规则，大部分用MAX（ID）的做法，也能够自己定义一个序列表，有点像序列。或者用时间的年月日秒详细到毫秒。关于列的命名,建议对数据类型也做一些规范，由于非常easy确定。仅仅有四种主要类型：数字，字符，时间，逻辑值，这些在类型上和长度上都能够定好规范，统一起来。

1.5 冲突字段

字段名与 hive 保留字冲突时处理规则：加一个”_col”后缀，即：源字段名_col。

1.2.4 分区命名规范

*分区英文名*	*含义描述*	*分区描述*
dt	当天日期，格式为：20191010	一级分区, 当日维度
dh	当日小时，格式为：2019101001(24小时制)	二级分区, 小时维度
dm	当月时间，格式为：201910	二级分区, 月度维度
dy	当年日期，格式为：2019	二级分区, 年度维度
dw	当年自然周, 格式为：52	二级分区，自然周维度
dq	当年自然季度(共4季度), 格式为：1	二级分区，自然季度维度
$*自定义分区*	定制化分区,格式取对应场景有意义简称	二级分区，定制化场景维度

1.2.5 时间取法规范

变量表示	实际值	业务含义
$dh	当日小时时间，格式为：2199123001	分区：小时维度
$dt	当天日期，格式为：20151231	分区：一级分区,天维度
$dm	当日小时时间，格式为：219912	分区：月维度
$dy	当日小时时间，格式为：2199	分区：年维度
$TXDATE	当天日期，格式为：2099-12-31	业务日期格式
$TXDATE	当天日期，格式为：2099-12-31 12:00:00	业务时间格式
$START_DT	当天日期，格式为：21991230	开始时间
$END_DT	当天日期，格式为：21991231	结束时间
$cycTime	日期型, yyyyMMddHHmmss	分区参数：作业的定时运行时间
$bizDate	日期型, yyyyMMdd	分区参数：业务日期，即作业调度日期的前一天
$bizMonth	日期型, yyyyMM	分区参数：作业调度日期的前一月

1.2.6 数据类型命名规范

Oracle与hive之间转换：

Oracle字段类型	Hive改造字段类型	改造规则
LONG	STRING	LONG类型是Oracle中存储可变长度字符串，最大长度限制是2GB，可使用Hive库STRING存储，STRING最大长度限制4GB。
VARCHAR	VARCHAR	数据取值范围和Oracle系统保持一致，可满足长度限制。
STRING	STRING	数据取值范围和Oracle系统保持一致，可满足长度限制。
NVARCHAR2	VARCHAR	NVARCHAR2是包含UNICODE格式数据的变长字符串，可使用HIVE库VARCHAR替代。
FLOAT	FLOAT	数据取值范围和Oracle系统保持一致
CHAR	CHAR	数据取值范围和Oracle系统保持一致，可满足长度限制。
CLOB	STRING	CLOB类型是Oracle中用于存储非结构化二进制数据，可使用Hive库STRING存储。
INTEGER	INT	数据取值范围和Oracle系统保持一致
DECIMAL(p,s)	DECIMAL(p,s)	数据取值范围和Oracle系统保持一致
alpha	CHAR/INT	目前oracle库中数据情况： ods_ccd.CDPP表13字段均为空 ods_ccd.AREQU表2字段均为数字 ods_ccd.CDPP表13字段均为空 ods_ccd.AREQU表2字段均为数字
NCHAR	CHAR	无需转换,Hive库VCHAR可以存储中英文字节
RAW	STRING	RAW用于存储二进制或字符类型数据，变长二进制数据，这种类型最多可以存储2,000字节的信息，可以使用STRING替代
VARCHAR2	VARCHAR	VARCHAR2基本等同于VARCHAR，不同在于VARCHAR2使用null代替VARCHAR的空字符串
BLOB	STRING	BLOB用于存储二进制数据，可使用Hive库STRING存储。目前库中所有表及字段都是空和空格。
SMALLINT	smallint	int是整型的,smallint是短整型
BIT取值为0或1	INT/CHAR
TINYINT	INT/smallint	存储从 0 到 255 的整型数据。存储大小为 1 字节
LONG RAW	STRING	LONG RAW类型是Oracle中用来存储二进制数据的，最大长度限制是2GB，可使用Hive库STRING存储。
NUMBER	DECIMAL(24,2)	hive暂将number此两种类型数据置为decimal。
NUMBER(x)	DECIMAL(24,2)	hive暂将number此两种类型数据置为decimal。
NUMBER(p,s)	DECIMAL(p,s)	源系统字段类型为可变精度的NUMBER(p,s)类型，需要根据实际数据具体分析,hive默认设置为decimal(p,s)
TIMESTAMP	Varchar(32)	目前由于生产上线前看不到数据，且源系统时间类型的数据格式较为复杂，暂将时间类型数据置为Varchar(32)，以保证使用。
DATE(20161231)
DATE(2016-12-31 12:12:12）
DATE(2016-12-31 12:12:12.0）

Mysql与hive之间转换：

Mysql 数据类型	Hive 数据类型
TINYINT/SMALLINT/ MEDIUMINT/ INTEGER / BIGINT	Bigint
FLOAT / DOUBLE / DECIMAL	Double
LONGTEXT /TEXT/VARCHAR/CHAR	String
DATE/ DATETIME	String(格式:YYYY-MM-DD HH24:MI:SS)

Hbase与hive之间转换：

Hbase 数据类型	Hive 数据类型
TINYINT/SMALLINT/ MEDIUMINT/ INTEGER / BIGINT	Bigint
FLOAT / DOUBLE / DECIMAL	Double
LONGTEXT /TEXT/VARCHAR/CHAR/ VARBINARY	String
DATE/ DATETIME	String(格式:YYYY-MM-DD HH24:MI:SS)

CDM/ADM 数据公共层如果是引用 ODS 层数据，默认使用 ODS 层字段数据类型；

衍生加工数据字段按以下标准执行：

Ø 模型、金额类及其它小数点数据：double

Ø 字符类数据：string

Ø ID 类和整形数值、数值指标：bigint

Ø 时间类型数据：string(如果有特殊的格式强制要求，可以统一使用 Datetime )

Ø 状态、其他字段，统一用 string

1.2.7 注释命名规范

Sql脚本标题头模板：

-- #*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#
-- # 金博士数据服务平台 HIVE SQL 脚本
-- #*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#
-- # BUSIMESS NAME(源业务系统) :集团人才发展 SF
-- # SCRIPT NAME (脚本名称) :ODS_SF_HRG_JOBTRANSFERS_UDT.sql
-- # TARGET TABLE (目标表名) :ODS_SF_HRG_JOBTRANSFERS_UDT
-- # INTERFACE (源业务系统表):员工岗位异动表
-- # MODEL HIERARCHY(模型层级) :TMP(层级:TMP、ODS、CDW(DWD/DWS/DIM)、TDM、ADM、RDM)
-- # TABLE TYPE (状态类型) :U (UPDATE:非流水 STREAM:流水)
-- # INTERFACE TYPE (接口频率) :D (S:实时、H:小时、D:天、W:周、M:月、Q:季度、Y:年)
-- # Data magnitude (数据量级) :T (I:增量、T:全量、P:区间)
-- # PRIMARY KEY (逻辑主键) :2(1.英文逗号分隔 2.hive默认分隔符 3.其他自定义分隔符)
-- # SPLIT TYPE (拆分类型) :2 (1.增量依据字段 2.全字段比对 3.MD5 4.增量表无拆分)
-- # SPLIT COLUMNS (拆分字段) :无 (适用于存在增量依据字段)
-- # PHYSIC DELETE (物理删除) :1( 1.不存在物理删除 2.存在物理删除 )
-- # CREATE DATE (创建日期) :2019-10-20
-- # MODIFIED DATE (修改日期) :2019-10-20
-- # AUTHOR (开发人员) :gjggw123
-- # VERSION (版本) :v1.0
-- # DESCRIPTION (功能描述) :数据更新全量库
-- # REMARK (备注) :集团人力数据库是SAP云端的数据中心,集中在上海,统称DC15
-- #*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#*#

其他程序脚本描述文件头模板：

#-*-coding: utf-8 -*-

"""

# ============================================================

# 作业名称: 集团人才发展 SF

# 责任人: gjggw123

# 源表:

# 目标表:

# 功能描述: 1.

# 2.

# 3.

# 备注:

# 版本号: v 1.0

# 修订日期: 2019-10-10

# 更改人:

# 更改说明: 1. 2. 3.

# ============================================================="""

1.2.8 脚本命名规范

工作流节点类型及脚本命名

节点类型	命名规范	示例	备注
虚拟节点	vt_{虚拟节点含义}	vt_ap_start	集群任务根节点
同步节点导入任务	imp_{表名}_[{源库标示}]	imp_ods_r360_cell_basic_delta	如果存在多个源库表名重复的情况，可以增加源库标示后缀
同步节点导出任务	exp_{表名}_[{目标库标示}]	exp_dws_mbr_user_pr file_dd	如果存在多个目标库，可以增加目标库标示后缀
数据处理节点	{输出表名}	dwd_mbr_tbl_user_dd	1. 单个任务只能输出一个目标表，禁止单个任务往多个表写入数据(临时表除外) 2. 多个任务插入同一张表的不同分区，后面建一个虚拟目标表任务
Shell 节点	sh_{脚本命名}	sh_upt_comm_log
MR 节点	mr_{脚本命名}	mr_cbu_ilog_parse
跨调度依赖或检查	chk_{源表名}	chk_dim_tbl_user	检查该任务是否完成
清洗任务	cln_{源表名}	cln_ods_loan_tbl_user_delta	过滤脏数据
合并任务	mrg_{ODPS 的表名}	mrg_ods_loan_tbl_user
极限存储	exst_{ODPS 的表名}	exst_dwd_mbr_tbl_user_dd

说明：

a)、项目中所有的资源文件建议放在 RESOURCE 目录中，资源名称需有后缀表示

资源类型，如.java、.py、.sh 等。

b)、DDL 资源全部以 *.sql 结尾标识。

c)、脚本内临时表命名规范：tmp_{产出表表名}_{n} 。

d)、备份表：统一后缀 _bakyyyymmdd，只是用作临时备份，如果数据需要永久备份保留，表名加后缀 _his , 并将生命周期设置为 999999 。

e)、下线表：生产任务下线后的表重命名统一前缀 delete_，30天后自动删除。

f)、回流表：数仓离线加工的表，由于工具不支持，需要建一个以 _exp后缀的回流表。

g)、垃圾表：统一后缀 _trashyyyymmdd, 默认 YYYYMMDD 的一个月以后自动删除。

h)、中间表：M_{数仓表名}，为了任务优化拆分并行计算方便，引入中间表，但只能被一个计算任务所依赖，不开放给分析师和其他任务使用；这是个临时方案，未来需要工具层面或调度层面解决单个任务内的多段SQL 并行执行。

j)、外部数据引入：引入的数据不论落地还是不落地，产出表或视图都应该遵循公司模型设计规范，原则上我们尽量使用集团中间层数据对于外部数据，命名不符合模型设计规范的，需要从 ODS 层开始建设。

你可能感兴趣的:(数据中台,架构设计)

lvs、nginx、haproxy区别和使用场景？企鹅侠客 linux 聊聊运维 lvs nginx 运维
0.运维干货分享软考系统架构设计师三科备考经验附学习资料信息安全管理体系（ISMS）制度模板分享免费文档翻译工具(支持word、pdf、ppt、excel)PuTTY中文版安装包MobaXterm中文版安装包pinginfoview网络诊断工具中文版LVS（LinuxVirtualServer）、Nginx和HAProxy都是常见的负载均衡工具，它们在不同的场景中各有优势。以下是它们的区别、特点及
图解AUTOSAR_CP_ComM KaiGer666 图解AUTOSAR_CP 嵌入式硬件单片机汽车
AUTOSARComM模块详解AUTOSAR通信管理模块详细解析目录1.概述1.1.ComM模块的作用1.2.ComM模块的位置2.架构设计2.1.模块上下文视图2.2.内部组件结构3.状态机3.1.通道状态机3.2.PNC状态机4.配置模型4.1.配置结构4.2.用户-PNC-通道映射5.服务接口5.1.API概述5.2.主要功能6.通信序列<
VM架构设计文档初稿v0.01 weixin_34128839 devops 大数据系统架构
VM架构设计文档初稿v0.01文档介绍本文档是经过讨论，作为VM新架构设计开发中的重要依据。对该架构的整个系统的结构进行详实细致的描述。阐述框架结构，说明该架构所采取的设计策略和所有技术，并对相关内容作出统一的约定。为设计，编码，测试提供可以参考的模板和帮助。提高设计变更开发的效率，将头脑风暴的结果进行的具体的书面呈现。架构设计思想该架构VM以微服务思想为核心进行衍化，兼容DevOps作为主要基础
HarmonyNext 鸿蒙架构深度解析与 ArkTS 编程实践披光人 harmonyOS harmonyos 华为
引言HarmonyNext作为鸿蒙操作系统的下一代核心架构，带来了全新的开发体验和性能优化。本文将深入探讨HarmonyNext的架构设计，并通过ArkTS语言进行实战案例的编写，帮助开发者快速掌握鸿蒙应用开发的核心技术。一、HarmonyNext架构概述1.1架构设计理念HarmonyNext的架构设计秉承了“轻量、高效、安全”的理念，旨在为开发者提供一个稳定、高效的开发环境。其核心架构包括以下
HarmonyNext深度解析：ArkUI高效渲染与性能优化实战披光人 harmonyOS ubuntu linux 运维
一、HarmonyNext渲染引擎技术演进（约1200字技术解析）HarmonyOSNext在UI渲染架构层面实现了重大突破，其创新的ArkUI渲染引擎采用分层异步架构设计。核心改进包括：原子化渲染管线采用基于Vulkan的跨平台渲染后端，通过原子化渲染指令拆分技术，实现绘制指令的并行执行能力。在华为Mate60系列实测中，复杂界面渲染延迟降低42%智能脏区检测机制基于机器学习的区域更新预测算法，
系统架构设计师【第5章】: 软件工程基础知识 (核心总结) 数据知道系统架构软件工程软考高级系统架构设计师软件工程基础
文章目录5.1软件工程5.1.1软件工程定义5.1.2软件过程模型5.1.3敏捷模型5.1.4统一过程模型（RUP）5.1.5软件能力成熟度模型5.2需求工程5.2.1需求获取5.2.2需求变更5.2.3需求追踪5.3系统分析与设计5.3.1结构化方法5.3.2面向对象方法5.4软件测试5.4.1测试方法5.4.2测试阶段5.5净室软件工程5.5.1理论基础5.5.2技术手段5.5.3应用与缺点5
C#实现动态验证码生成器：安全防护与实际应用场景 WangMing_X C#实现各种功能工具集 c#安全开发语言验证码图片
一、核心应用场景用户登录/注册验证：防止恶意程序批量注册表单提交防护：确保关键操作由真人执行API接口限流：抵御自动化脚本攻击敏感操作验证：如支付、信息修改等关键步骤数据防爬机制：保护网站内容不被爬虫抓取二、技术实现方案1.基础架构设计//验证码服务架构+------------------------+|验证码生成模块|←随机字符|(CaptchaGenerator)|+------------
2025年Python后端开发指南：从基础到云原生实践 ctrl_cv工程师￥云原生 django flask pycharm
在2025年，Python后端开发已全面进入云原生与智能化时代。开发者不仅需要掌握传统后端技术栈，还需融合容器化、AI辅助编程等新兴技术。本文基于行业最新趋势与最佳实践，系统梳理Python后端开发的核心要点与进阶方向，涵盖开发环境、架构设计、性能优化等关键领域。一、开发环境与工具链1.环境配置标准化Python版本：推荐Python3.12+，支持模式匹配（PatternMatching）和更优
A800架构设计与实战智能计算研究中心其他
内容概要《A800架构设计与实战》围绕新一代计算架构的技术演进与工程落地展开系统性论述。全书以分布式运算优化原理为切入点，通过对核心模块的层级化拆解，深入剖析多节点协同计算中的资源分配、任务调度及通信瓶颈突破方法。为强化理论与实践的结合，书中引入智能制造与云渲染两大典型场景的完整案例，覆盖从需求分析、架构设计到性能调优的全生命周期。技术维度实现路径应用价值架构设计核心模块拆分与重组降低系统耦合度分
基于PySide6与PyCatia的CATIA几何体智能重命名工具开发实践 Python×CATIA工业智造 python 开发语言 CATIA二次开发
一、工具概述本工具基于CATIAV5/V6的二次开发接口，结合PySide6图形界面框架与PyCatia自动化库，实现了三大核心功能模块：几何体前缀批量添加、后缀动态追加、智能文本替换。该工具显著提升了工程师在大型零件体设计中的几何体命名管理效率，解决了传统手动操作易出错、耗时长的问题。二、技术架构解析1.分层架构设计classStats(QMainWindow):def__init__(self
微信小程序脚本自动化测试方案测试工程师成长之路测试工程师成长之路微信小程序 UI自动化测试小程序自动化
这篇文章主要讲述了微信小程序脚本自动化测试方案，包括方案产生的初衷，选型Minium的原因，分阶段目标，架构设计（底层服务层、页面功能Case、流程测试），数据Mock方式及流程，最后提到结合工具提升效率，实现配置化测试等。一段痛苦的日子从开始负责小程序开始，基本每两周发一次版本，并且是在10点半后开始发版。经常遇到的场景是等到10点，以为测试的差不多了，没有什么问题。啪啪，打脸来的太快，总会发现
AI 大模型应用数据中心的数据分析架构 AI天才研究院计算 AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
《AI大模型应用数据中心的数据分析架构》关键词：数据中心、AI大模型、数据分析、架构设计、应用实践摘要：本文深入探讨了AI大模型在数据中心数据分析架构中的应用，从数据中心背景、AI大模型架构与技术、数据处理与分析技术、AI大模型应用与实践等多个方面，全面解析了AI大模型如何助力数据中心实现高效数据分析和智能处理，为读者提供了系统的理论指导和实际案例分析。第一部分:数据中心背景与AI大模型概述第1章
软考高级架构师/分析师论文【论基于架构的软件设计方法/ABSD】 saikey0379 架构软考高级论文系统架构设计师系统分析师计算机软件资格考试 ABSD
一、摘要 2020年4月，某互联网公司开始了基础架构管理平台项目的实施，该项目主要为基础架构团队提供基础设施、中间件、负载均衡、任务管理等功能，我作为该项目的架构师，主要负责架构设计、架构评估等工作。本文以该项目为例，主要论述基于架构的软件设计方法在该项目中的具体应用与实现效果。在架构需求阶段，通过访谈、原型、JRP等方式获得了系统需求，并在标识构件后完成了需求评审。在架构设计阶段，对架构进行了
电力行业中实现“电力一张图” 可行方案小赖同学啊人工智能智能硬件能源物联网
在电力行业中实现“电力一张图”，需构建覆盖全业务场景的统一可视化平台，整合电网资源、设备状态、运行数据及地理信息，实现电力系统的数字化、智能化管理。以下是具体的技术实现方案：一、系统架构设计采用分层架构，涵盖数据采集、通信、处理、可视化及应用层：感知层设备部署：在变电站、杆塔、线路、分布式能源等节点部署智能传感器（如温湿度传感器、振动传感器、电流互感器）、智能终端（如FTU/DTU/TTU）、无人
一文搞懂MCU和SoC的核心差异：从架构到应用场景全解析 Electron-er 单片机架构嵌入式硬件
目录引言一、从“芯片大脑”看本质：架构设计的哲学差异1.MCU：单一任务的执行专家2.SoC：系统级集成的超级平台二、实战对比：六大维度拆解差异1.性能指标对比2.开发模式对比三、选型指南：如何选择MCU或SoC？1.选择MCU的场景2.选择SoC的场景四、技术演进：MCU与SoC的融合趋势1.MCU的进化方向2.SoC的突破方向五、开发者避坑指南结语标签：MCUvsSOC、嵌入式系统、芯片选型、
.net 插件式开发——实现web框架中大数据算法嵌入(BP算法逼近) weixin_34219944 json 人工智能
关于算法的引入：插件式架构设计，可移植性强，利于算法的升级。【插件式开发相关资料】https://www.cnblogs.com/lenic/p/4129096.html以BP算法为例：1、首先定义一个接口规范////////插件的统一入口///publicinterfaceIPluginPerfrom{//////统一算法插件入口//////输出参数的个数///输出参数///输入参数///str
【系统架构设计师】论文：论信息系统的安全风险评估数据知道系统架构安全系统架构设计师论文软考高级架构
论文：论信息系统的安全风险评估文章目录摘要正文总结摘要2023年3月，我参加了某石化公司的实验室信息管理系统项目的开发工作，该系统作为该石化公司产品质量信息管理平台，将实验室的自动化分析仪器与计算机网络进行联结，实现自动采集样品分析数据，对样品检验过程、实验室资源进行严格管理，实现从原料进厂、生产、中间控制直至成品出厂的全过程质量数据管理，以及全公司范围内质量数据的快速传递与共享。我作为项目负责人
Redis- 秒杀场景左灯右行的爱情 redis 数据库缓存
秒杀什么是秒杀场景秒杀场景挑战有哪些高并发与性能挑战数据一致性挑战安全性挑战秒杀系统的架构设计前端策略服务层设计库存控制策略订单处理流程技术实现缓存设计与优化分布式锁与一致性保证消息队列应用安全防护措施什么是秒杀场景秒杀场景的本质是在极短时间内承受大量并发请求，同时保证有限商品的正确售卖。它具有三个核心特征：高并发（短时间内大量用户涌入）、资源有限（商品数量有限）和时效性强（活动在特定时间开始和结
Spring Boot中实现多租户架构 java技术小馆 spring boot 架构后端 java
SpringBoot中实现多租户架构在当今的企业级应用开发中，多租户架构已经成为一项关键技术，尤其是对于需要服务多个客户群体的SaaS（软件即服务）系统。多租户架构的核心思想是通过共享资源来降低运营成本，同时确保各个租户的数据和功能互不干扰。从架构设计的角度看，多租户有三种常见模式：独立数据库、表级隔离和共享表。不同的模式适用于不同的业务场景。例如，独立数据库适合对安全性要求极高的客户，表级隔离和
系统架构设计师—系统架构设计篇—轻量级架构洛北辰南系统架构设计师系统架构架构轻量级架构 SSH SSM
文章目录基本概念轻量级架构持久层的优点SSHSSMHibernate与Mybatis的区别基本概念轻量级架构J2EE环境下，分层架构：表现层业务逻辑层持久层持久层的优点屏蔽数据库平台的变化对业务逻辑层的影响。通过持久层的封装处理，可以在持久层实现支持多种数据库平台，而对业务逻辑层提供统一的接口。代码可重用性高，能够完成所有的数据库访问操作。通过持久层，分离业务逻辑和数据逻辑，降低系统的耦合程度，结
STM32驱动OLED屏幕全解析：从原理到温度显示实战（中） | 零基础入门STM32第五十四步触角01010001 STM32入门教程（100步）stm32 嵌入式硬件单片机驱动开发物联网
主题内容教学目的/扩展视频OLED显示屏重点课程电路原理，手册分析，驱动程序。初始化，清屏，ASCII字库，显示分区。调用显示函数。做带有加入图形和汉字显示的RTC时钟界面。讲字库的设计原理。师从洋桃电子，杜洋老师文章目录一、OLED驱动架构设计二、关键函数解析（oled0561.c）2.1初始化函数OLED0561_Init2.2显示控制函数2.3清屏函数三、字符显示原理3.1单字符显示函数3.
2024年上半年系统架构设计师论文真题任铄软考2024年上半年真题系统架构设计师架构设计软考 2024 论文范文真题
一、论大数据lambda架构大数据处理架构是专门用于处理和分析巨量复杂数据集的软件架构。它通常包括数据收集、存储、处理、分析和可视化等多个层面，旨在从海量、多样化的数据中提取有价值的信息。Lambda架构是大数据平台里最成熟、最稳定的架构，它是一种将批处理和流处理结合起来的大数据处理系统架构，其核心思想是将批处理作业和实时流处理作业分离，各自独立运行，资源互相隔离，解决传统批处理架构的延迟问题和流
2024上半年软考系统架构设计师论文--模型驱动架构设计方法及其应用不对法计算机软考机考系统架构
模型驱动架构设计方法及其应用摘要随着信息技术的迅猛发展，软件在现代企业中的作用日益关键。然而，与硬件技术的快速进步相比，软件技术的发展相对滞后，传统的以代码为中心的软件开发方式面临生产效率、可移植性、互操作性等多方面问题。模型驱动架构（ModelDrivenArchitecture,MDA）作为一种新的软件开发框架，旨在通过模型构造、模型转换和精化等核心步骤，提高软件开发效率，已成为当前软件工程领
领域驱动设计（DDD）与业务驱动划分宋发元架构设计
下面教程，综合介绍领域驱动设计（DDD）和业务驱动划分的基本概念、区别、如何区分及如何在实际项目中使用两者的最佳实践。领域驱动设计与业务驱动划分1.引言在软件开发中，架构设计直接影响系统的灵活性、可维护性和扩展性。两种常见的设计思路——业务驱动划分和领域驱动设计（DDD）——各有侧重点：业务驱动划分：强调从业务功能、流程或组织角度将系统划分为多个模块，适合快速搭建业务框架。领域驱动设计（DDD）：
2024架构设计师论文题目数字化信息化智能化解决方案 2024架构
论文1大数据lamda架构1、简要说明你参开发的软件项目,吸你所承担的主要作2、lamada体系架构将数据流分为批处理层(对应的英文、加速层文、服务层。简要叙这三个层次的用途和特点3、详细阐述你参与开发的软件项目如何基于lamada体系架构进行大数据处理的架构论文2模型驱动架构设计方法及其用1、简要说明你参与分析和研发的软件项目,吸你所承担的要工作2、简要阐述采用模型驱动架构思想进行软件开发的全过
【系统架构设计师】2024年上半年真题论文: 论大数据lambda架构（包括解题思路和素材）数据知道系统架构架构系统架构设计师软考高级论文
更多内容请见：备考系统架构设计师-专栏介绍和目录文章目录真题题目（2024年上半年试题1）解题思路论文素材参考真题题目（2024年上半年试题1）大数据处理架构是专门用于处理和分析巨量复杂数据集的软件架构。它通常包括数据收集、存储、处理、分析和可视化等多个层面，旨在从海量、多样化的数据中提取有价值的信息。Lambda架构是大数据平台里最成熟、最稳定的架构，它是一种将批处理和流处理结合起来的大数据处理
图解AUTOSAR_CP_EthernetStateManager KaiGer666 图解AUTOSAR_CP 嵌入式硬件单片机汽车
AUTOSAR以太网状态管理器详解AUTOSAR通信栈以太网状态管理组件详细解析目录AUTOSAR以太网状态管理器详解目录1.概述1.1.以太网状态管理器的作用1.2.以太网状态管理器在AUTOSAR中的位置2.架构设计2.1.模块架构2.2.接口定义2.3.依赖关系3.状态机设计3.1.状态定义3.2.状态转换3.3.事件处理4.通信序列4.1.初始化序列4.2.启动通信序列4.3.链路断开处理
【AI 天才研究院】火爆全网的 Manus 技术实现调研报告 By DeepSeek & Manus Agents AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型计算 ChatGPT 人工智能 ai Agent
火爆全网的Manus技术实现调研报告文章目录火爆全网的Manus技术实现调研报告【AI天才研究院】火爆全网的Manus技术实现调研报告**1.引言****2.Manus的技术架构与核心能力****2.1系统架构设计****2.2核心技术突破****2.3性能优势****3.应用场景与商业化落地****3.1典型应用案例****3.2商业化模式****4.市场反响与行业影响****4.1资本与用户热
SaaS+AI应用架构：业务场景、智能体、大模型、知识库、传统工具系统公众号-AI架构师汤师爷后端架构设计 Java SaaS
SaaS+AI应用架构：业务场景、智能体、大模型、知识库、传统工具系统大家好，我是汤师爷~在SaaS与AI应用的演进过程中，合理的架构设计至关重要。本节将详细介绍其五个核心层次：业务场景层：发现和确定业务场景智能体层：构建可复用的智能应用大模型层：采用最合适的大模型，作为思考推理的核心知识库：管理企业的核心知识资产传统工具：传统的运营工具和业务系统业务场景层：发现和确定业务场景业务场景层是整个Sa
造价算量审图多元化融合软件开发实战：技术架构与核心代码解析夏末之花架构
——从BIM模型解析到AI智能审图的完整实现路径1.技术架构设计该软件需融合以下模块：BIM/CAD模型解析引擎（支持Revit/DWG文件一键导入）智能算量核心算法（基于规则引擎与机器学习）协同审图平台（多人实时标注与版本控制）AI辅助决策系统（材料价格预测、工程量误差检测）技术栈推荐：前端：Three.js（3D模型渲染）+React（协同界面）后端：Python（算量算法）+Java（业务逻
SQL的各种连接查询 xieke90 UNION ALL UNION 外连接内连接 JOIN
一、内连接概念：内连接就是使用比较运算符根据每个表共有的列的值匹配两个表中的行。内连接（join 或者inner join ） SQL语法： select * fron
java编程思想--复用类百合不是茶 java 继承代理组合 final类
复用类看着标题都不知道是什么,再加上java编程思想翻译的比价难懂,所以知道现在才看这本软件界的奇书一:组合语法:就是将对象的引用放到新类中即可代码: package com.wj.reuse; /** * * @author Administrator 组
[开源与生态系统]国产CPU的生态系统 comsci cpu
计算机要从娃娃抓起...而孩子最喜欢玩游戏.... 要让国产CPU在国内市场形成自己的生态系统和产业链,国家和企业就不能够忘记游戏这个非常关键的环节.... 投入一些资金和资源,人力和政策,让游
JVM内存区域划分Eden Space、Survivor Space、Tenured Gen，Perm Gen解释商人shang jvm内存
jvm区域总体分两类，heap区和非heap区。heap区又分：Eden Space（伊甸园）、Survivor Space(幸存者区)、Tenured Gen（老年代-养老区）。非heap区又分：Code Cache(代码缓存区)、Perm Gen（永久代）、Jvm Stack(java虚拟机栈)、Local Method Statck(本地方法栈)。 HotSpot虚拟机GC算法采用分代收
页面上调用 QQ oloz qq
<A href="tencent://message/?uin=707321921&Site=有事Q我&Menu=yes"> <img style="border:0px;" src=http://wpa.qq.com/pa?p=1:707321921:1></a>
一些问题文强chu 问题
1.eclipse 导出 doc 出现“The Javadoc command does not exist.” javadoc command 选择 jdk/bin/javadoc.exe 2.tomcate 配置 web 项目 ..... SQL:3.mysql * 必须得放前面否则 select&nbs
生活没有安全感小桔子生活孤独安全感
圈子好小，身边朋友没几个，交心的更是少之又少。在深圳，除了男朋友，没几个亲密的人。不知不觉男朋友成了唯一的依靠，毫不夸张的说，业余生活的全部。现在感情好，也很幸福的。但是说不准难免人心会变嘛，不发生什么大家都乐融融，发生什么很难处理。我想说如果不幸被分手(无论原因如何)，生活难免变化很大，在深圳，我没交心的朋友。明
php 基础语法 aichenglong php 基本语法
1 .1 php变量必须以$开头 <?php $a=” b”; echo ?> 1 .2 php基本数据库类型 Integer float/double Boolean string 1 .3 复合数据类型数组array和对象 object 1 .4 特殊数据类型 null 资源类型(resource) $co
mybatis tools 配置详解 AILIKES mybatis
MyBatis Generator中文文档 MyBatis Generator中文文档地址： http://generator.sturgeon.mopaas.com/ 该中文文档由于尽可能和原文内容一致，所以有些地方如果不熟悉，看中文版的文档的也会有一定的障碍，所以本章根据该中文文档以及实际应用，使用通俗的语言来讲解详细的配置。本文使用Markdown进行编辑，但是博客显示效
继承与多态的探讨百合不是茶 JAVA面向对象继承对象
继承 extends 多态继承是面向对象最经常使用的特征之一：继承语法是通过继承发、基类的域和方法 //继承就是从现有的类中生成一个新的类，这个新类拥有现有类的所有extends是使用继承的关键字：在A类中定义属性和方法； class A{ //定义属性 int age； //定义方法 public void go
JS的undefined与null的实例 bijian1013 JavaScript JavaScript
<form name="theform" id="theform"> </form> <script language="javascript"> var a alert(typeof(b)); //这里提示undefined if(theform.datas
TDD实践（一） bijian1013 java 敏捷 TDD
一.TDD概述 TDD：测试驱动开发，它的基本思想就是在开发功能代码之前，先编写测试代码。也就是说在明确要开发某个功能后，首先思考如何对这个功能进行测试，并完成测试代码的编写，然后编写相关的代码满足这些测试用例。然后循环进行添加其他功能，直到完全部功能的开发。
[Maven学习笔记十]Maven Profile与资源文件过滤器 bit1129 maven
什么是Maven Profile Maven Profile的含义是针对编译打包环境和编译打包目的配置定制，可以在不同的环境上选择相应的配置，例如DB信息，可以根据是为开发环境编译打包，还是为生产环境编译打包，动态的选择正确的DB配置信息 Profile的激活机制 1.Profile可以手工激活，比如在Intellij Idea的Maven Project视图中可以选择一个P
【Hive八】Hive用户自定义生成表函数(UDTF) bit1129 hive
1. 什么是UDTF UDTF，是User Defined Table-Generating Functions，一眼看上去，貌似是用户自定义生成表函数，这个生成表不应该理解为生成了一个HQL Table，貌似更应该理解为生成了类似关系表的二维行数据集 2. 如何实现UDTF 继承org.apache.hadoop.hive.ql.udf.generic
tfs restful api 加auth 2.0认计 ronin47
　　目前思考如何给tfs的ngx-tfs api增加安全性。有如下两点：　　一是基于客户端的ip设置。这个比较容易实现。　　二是基于OAuth2.0认证，这个需要lua，实现起来相对于一来说，有些难度。　　现在重点介绍第二种方法实现思路。　　前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGe
jdk环境变量配置 byalias java jdk
进行java开发，首先要安装jdk，安装了jdk后还要进行环境变量配置： 1、下载jdk（http://java.sun.com/javase/downloads/index.jsp），我下载的版本是：jdk-7u79-windows-x64.exe 2、安装jdk-7u79-windows-x64.exe 3、配置环境变量：右击"计算机"-->&quo
《代码大全》表驱动法-Table Driven Approach-2 bylijinnan java
package com.ljn.base; import java.io.BufferedReader; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.Collections; import java.uti
SQL 数值四舍五入小数点后保留2位 chicony 四舍五入
1.round() 函数是四舍五入用，第一个参数是我们要被操作的数据，第二个参数是设置我们四舍五入之后小数点后显示几位。 2.numeric 函数的2个参数，第一个表示数据长度，第二个参数表示小数点后位数。例如：　　select cast(round(12.5,2) as numeric(5,2))
c++运算符重载 CrazyMizzz C++
一、加+，减-，乘*，除/ 的运算符重载 Rational operator*(const Rational &x) const{ return Rational(x.a * this->a); } 在这里只写乘法的，加减除的写法类似二、<<输出,>>输入的运算符重载 &nb
hive DDL语法汇总 daizj hive 修改列 DDL 修改表
hive DDL语法汇总１、对表重命名 hive> ALTER TABLE table_name RENAME TO new_table_name; 2、修改表备注 hive> ALTER TABLE table_name SET TBLPROPERTIES ('comment' = new_comm
jbox使用说明 dcj3sjt126com Web
参考网址：http://www.kudystudio.com/jbox/jbox-demo.html jBox v2.3 beta [ 点击下载] 技术交流QQGroup：172543951 100521167 [2011-11-11] jBox v2.3 正式版 - [调整&修复] IE6下有iframe或页面有active、applet控件
UISegmentedControl 开发笔记 dcj3sjt126com
// typedef NS_ENUM(NSInteger, UISegmentedControlStyle) { // UISegmentedControlStylePlain, // large plain &
Slick生成表映射文件 ekian scala
Scala添加SLICK进行数据库操作，需在sbt文件上添加slick-codegen包 "com.typesafe.slick" %% "slick-codegen" % slickVersion 因为我是连接SQL Server数据库，还需添加slick-extensions，jtds包 "com.typesa
ES-TEST gengzg test
package com.MarkNum; import java.io.IOException; import java.util.Date; import java.util.HashMap; import java.util.Map; import javax.servlet.ServletException; import javax.servlet.annotation
为何外键不再推荐使用 hugh.wang mysql DB
表的关联，是一种逻辑关系，并不需要进行物理上的“硬关联”，而且你所期望的关联，其实只是其数据上存在一定的联系而已，而这种联系实际上是在设计之初就定义好的固有逻辑。在业务代码中实现的时候，只要按照设计之初的这种固有关联逻辑来处理数据即可，并不需要在数据库层面进行“硬关联”，因为在数据库层面通过使用外键的方式进行“硬关联”，会带来很多额外的资源消耗来进行一致性和完整性校验，即使很多时候我们并不
领域驱动设计 julyflame VO DAO 设计模式 DTO po
概念： VO（View Object）：视图对象，用于展示层，它的作用是把某个指定页面（或组件）的所有数据封装起来。 DTO（Data Transfer Object）：数据传输对象，这个概念来源于J2EE的设计模式，原来的目的是为了EJB的分布式应用提供粗粒度的数据实体，以减少分布式调用的次数，从而提高分布式调用的性能和降低网络负载，但在这里，我泛指用于展示层与服务层之间的数据传输对
单例设计模式 hm4123660 java Singleton 单例设计模式懒汉式饿汉式
单例模式是一种常用的软件设计模式。在它的核心结构中只包含一个被称为单例类的特殊类。通过单例模式可以保证系统中一个类只有一个实例而且该实例易于外界访问，从而方便对实例个数的控制并节约系统源。如果希望在系统中某个类的对象只能存在一个，单例模式是最好的解决方案。 &nb
logback zhb8015 log logback
一、logback的介绍 Logback是由log4j创始人设计的又一个开源日志组件。logback当前分成三个模块：logback-core,logback- classic和logback-access。logback-core是其它两个模块的基础模块。logback-classic是log4j的一个改良版本。此外logback-class
整合Kafka到Spark Streaming——代码示例和挑战 Stark_Summer spark storm zookeeper PARALLELISM processing
作者Michael G. Noll是瑞士的一位工程师和研究员，效力于Verisign，是Verisign实验室的大规模数据分析基础设施（基础Hadoop）的技术主管。本文，Michael详细的演示了如何将Kafka整合到Spark Streaming中。期间， Michael还提到了将Kafka整合到 Spark Streaming中的一些现状，非常值得阅读，虽然有一些信息在Spark 1.2版
spring-master-slave-commondao 王新春 DAO spring dataSource slave master
互联网的web项目，都有个特点：请求的并发量高，其中请求最耗时的db操作，又是系统优化的重中之重。为此，往往搭建 db的一主多从库的数据库架构。作为web的DAO层，要保证针对主库进行写操作，对多个从库进行读操作。当然在一些请求中，为了避免主从复制的延迟导致的数据不一致性，部分的读操作也要到主库上。（这种需求一般通过业务垂直分开，比如下单业务的代码所部署的机器，读去应该也要从主库读取数