不急吃口药

数据仓库全流程

数仓建设的思路流程：

1 梳理业务流程

2 梳理数据流

3 数据类型、存储介质、样例数据

4 需求-功能性需求、非功能性需求(性能、时效性)

-------------------------------------数据来源

rdbms

log

nginx

https third api mongoDB ：第三方数据http请求，访问第三方API，第三方数据可能存储在mongoDB中

----------------------------------------数据采集方案

mysql

1,表的数据量、每日增量、updated_ time \created time, 自增的id,源表的索引情况

--split-by id

--split-by updated time

select min(id) , max(id) from tab where ...

2,数据采集方案

增量(流水、updated)、全量

user:全量采集

申请授信:增量采集

额度:全量采集

借款、还款计算:增量采集

-------------------------------------------数据仓库模型设计

1.维度建模

===============================================================================

一、为什么构建数据仓库？
业务系统和分析系统分离（不可能在业务系统去分析吧！）
数据源来自多个系统，跨系统整合分析很难
为企业决策做依据

-------

数据仓库的定义：
   1、面向主题的
   2、集成的（数据来源多方）
           消除不一致的现象
           需要考虑的问题：数据格式计量单位数据代码含义混乱数据名称混乱
   3、非易失的（指的是数据一旦进入数据仓库，数据就不应该再有改变，数据基本是静态的；也有变化的，看业务，如scd）
   4、随变的（反映历史变化的数据集合）
       电商交易频繁的可能是2年。金融一般客户类、账户类等信息要保留7年，交易类流水类信息要保留至少13个月以上，保险行业交易比较少的5年；
       太老的数据对于数据分析没多大作用，你想10年前的电商交易数据对于现在的电商能有多大帮助，价格、产品、用户都已经完全不同了

           保留历史数据时长2年：
           basic（tmp）：（七天）
           ods（30天，每天都会备份到其它）
           dw（1年，每天都会备份到其它）

--------

数据库与数据仓库的区别：
   数据库是面向事务的设计，数据仓库是面向主题设计。
   数据库设计是尽量避免冗余，一般采用符合范式的规则来设计，数据仓库在设计是有意引入冗余，采用反范式的方式来设计。
   数据库是为捕获和存储数据而设计，数据仓库是为分析数据而设计

二、数仓的建设流程
数仓构建：确认主题，确认粒度，确认维度事实

建模产品业务部门做的，已经界定好；从中我们得出主题都包含哪些！

------

1）业务建模：（确定系统规范、建设目标，时间节点），架构选型，主题，泛泛的表关系
如.操作出现的频率，即业务部门每隔多长时间做一次查询分析。
       ∙在系统中需要保存多久的数据，是一年、两年还是五年、十年。
       ∙用户查询数据的主要方式，如在时间维度上是按照自然年(12月31结束)，还是财政年(顺延12个月)。
       ∙用户所能接受的响应时间是多长、是几秒钟，还是几小时。
2）领域建模（概念建模）：抽取关键业务概念，并将之抽象化，E-R图（实体关系属性）
概念建模建模步骤
   局部模型 ① 确定局部概念模型的范围； ② 定义实体； ③ 定义联系； ④ 确定属性； ⑤ 逐一画出所有的局部ER图，并附以相应的说明文件。
   全局模型建立全局E‐R图的步骤如下： ① 确定公共实体类型； ② 合并局部E‐R图； ③ 消除不一致因素； ④ 优化全局E‐R图； ⑤ 画出全局E‐R图，并附以相应的说明文件。
   模型评审概念模型的评审分两部分进行：第一部分是用户评审。第二部分是开发人员评审。
3）逻辑建模：业务概念实体化，并考虑其具体的属性，形成表与表关系模型（为什么这么设计这些度量值，形成这样的宽表，根据粒度、维度一致性，整合到一张宽表中），按照最小粒度去划分，如按天；
4）物理建模：对逻辑建模的具体实现（逻辑建模中的东西可能没有），表模型的实现
（1）删除非战略性数据：数据仓库模型中不需要包含逻辑数据模型中的全部数据项，某些用于操作处理的数据项要删除。
               （2）增加时间主键：数据仓库中的数据一定是时间的快照，因此必须增加时间主键。
               （3）增加派生数据：对于用户经常需要分析的数据，或者为了提高性能，可以增加派生数据。
               （4）加入不同级别粒度的汇总数据：数据粒度代表数据细化程度，粒度越大，数据的汇总程度越高。
               粒度是数据仓库设计的一个重要因素，它直接影响到驻留在数据仓库中的数据量和可以执行的查询类型。
                   显然，粒度级别越低，则支持的查询越多；反之，能支持的查询就有限。

----------

数据模型

   数据存储方式：
   1）虚拟存储方式（如，视图）
   2）基于关系表的存储方式

   星型模型（性能高，一个事实表围绕一层维度，常用）、
   雪花模型（灵活性能低，一个事实表围绕多层维度）、
   星座模型（多个事实表决定）

Data Vault模型：一种综合了第三范式（3NF）和星型模型

中心表、链接表(事实表)、附属表（维度表）、PIT表（Point—In—Time表是由附属表派生而来的，多层次维度表）

   表的分类（一般事实表、维度表），更细分：
   实体表，一般是指一个现实存在的业务对象，比如用户，商品，商家，销售员等等 --- 商品表、用户表
   维度表，一般是指对应一些业务状态，编号的解释表。也可以称之为码表。 ----- 商品一二三级分类
           ---- 比如地区表，订单状态，支付方式，审批状态，商品分类等等
   事务型事实表，一般指随着业务发生不断产生的数据。特点是一旦发生不会再变化。 ------ 支付流水表、订单详情表
           ----一般比如，交易流水，操作日志，出库入库记录等等。
   周期型事实表，一般指随着业务发生不断产生的数据。 ----- 订单表
       ----比如订单，其中订单状态会周期性变化。再比如，请假、贷款申请，随着批复状态在周期性变化。

拉链表：维护历史状态，以及最新状态数据的一种表（scd：缓慢变化维场景，数据变化不是很大，翻旧账场景

流水表，用于统计业务相关情况(如，交易流水。。。)，拉链表用于统计账户及客户的情况

周期快照表 周期快照事实表的粒度是每个时间段一条记录，通常比事务事实表的粒度要粗，是在事务事实表之上建立的聚集表。周d期快照是在一个给定的时间对事实表进行一段时期的总计。例如，一个月销售订单周期快照是每个月底时总的销售订单金额。

累计快照表 累计快照适用于较短周期，有着明确的开始和结束状态的过程，如一个订单执行的过程，并记录过程中每个步骤的执行时间，使分析人员对执行的过程有整体的把握。

新增的数据与数仓中的历史数据进行合并，得到最新的历史数据，然后覆盖数仓中原有的数据！

   实体表、事实表、维度表三者区别：
   实体表：实体表就是一个实际对象的表，实体表它放的数据一定是一条条客观存在的事物数据，比如说设备
   事实表（中心表）：事实表其实质就是通过各种维度和一些指标值得组合来确定一个事实的，比如通过时间维度，地域组织维度，指标值可以去确定在某时某地的一些指标值怎么样的事实。事实表的每一条数据都是几条维度表的数据和指标值交汇而得到的。
   维度表（附属表）：维度表可以看成是用户用来分析一个事实的窗口，它里面的数据应该是对事实的各个方面描述，比如时间维度表，它里面的数据就是一些日，周，月，季，年，日期等数据，维度表只能是事实表的一个分析角度。

缓慢变化维(变化不是很频繁)：拉链表实现（在原有基础上增加一行）
周期型事实表(频繁变化，要管理它的生命周期) ：累积快照表实现（放到一张表的同一行中）

---------
数据仓库数据模型优化
经常对其性能进行监控，并随着需求和数据量的变更进行调整。
   优化数据仓库设计的主要方法是：合并不同的数据表。
   通过增加汇总表避免数据的动态汇总。
                                   通过冗余字段减少表连接的数量，不要超过3~5个。
                                   用ID代码而不是描述信息作为键值。
                                   对数据表做分区。




三、数据装载（etl）

1、建立逻辑映射（规划阶段、元数据管理）

逻辑数据映射是指源系统中表和数据仓库中的表的对应关系，一般使用excel进行记录

逻辑映射文件归纳为元数据，源数据结构（如，数据库信息），目标结构（数据仓库中的表），数据转换规则，映射关系，数据的上下文等，
逻辑数据映射中还应该标识出一些需要引起重视的操作，比如隐式转换引起长度变化时，可能会丢失数据，比如utf8转换为Latin1时，字符集的变化会引起字节数量的增减，因此要在文档中标识出来，提醒开发人员注意

2、数据抽取

从源数据导入到数据仓库或者贴源层有两种方式：
push：一般需要增加业务系统的功能，一般不采取（业务系统编写个定时器功能，把发生变化的数据拉取到另外一张表，然后再全量导入这张表的数据）

pull：
全量（数据量少）

   增量（四种实现方式，cdc）：（数据量大）
       CDC大体分为两种侵入式和非侵入式。侵入式是指CDC操作会给源系统带来性能影响
       1）基于时间戳的CDC
               时间戳：要求源数据里有插入时间和更新时间列，取新增数据根据插入时间，取修改数据根据更新时间
               自增列：根据自增列取新增数据

               缺点,不能记录删除操作；无法识别过多次更新,只能拿到最后一次的；具有侵入性

       2）基于触发器的CDC
               a）当执行insert,update,delete这些SQL语句是,可以使用数据库的触发器来执行一些动作,比如触发器将变更的数据保存到临时表中,然后从临时表中抽取数据到贴源层,大多数情况下,触发器会降低业务系统的性能,因此这种方式使用的不多.

               b）作为替代方案,可以使用源数据库的复制功能,复制一份数据到备库上,在备库上建立触发器,是个很有效的方法,而且没有侵入性.
               这个方式需要额外的存储空间,看起来是冗余数据,实际上对业务库来讲,实现主库上进行写操作,备库上进行读操作,实现读写分离,是提高性能和高可用一个手段.

       3）基于快照的CDC
           如果没有时间戳也不允许使用触发器,就要使用快照表了，通过比较原表和快照表来获得变化数据。
           所谓快照就是一次性抽取源数据中的全部数据，把这些数据加载到ODS层，下次需要同步的时候，再从源数据抽取全部的数据，并把这些数据放到ODS层，比较这两个版本的数据，找出变化数据。

           缺点：浪费存储空间

       4）基于日志的CDC
           最复杂和最没有入侵的CDC方式就是基于日志的方式。数据库会把每个插入、更新和删除操作记录在日志里。
           只要在数据库中开启事务日志，再将日志读取出来，就可以还原这部分变化数据了。可以考虑用canal监听mysql的 binlog，实时接入即可
           缺陷，即只能用来处理一种特定的数据库。

实现的方式：
1）使用sqoop抽取数据（append和lastmodified）
   Sqop中提供了 hive-overwrite参数实现覆盖导入。
       hive-overwrite的另一个作用是提供了一个幂等操作的选择。
       所谓幂等操作指的是其执行任意多次所产生的影响均与次执行的影响相同。
           这样就能在导入失败或修复bug后可以再次执行该操作,而不用担心重复执行会对系统造成数据混乱。
2）导出为文本方式
   hdfs命令或者使用hive的load data local inpath

数据同步策略的类型包括：全量表、增量表、新增及变化表、拉链表（处理SCD）
全量表：存储完整的数据。
增量表：存储新增加的数据。
新增及变化表：存储新增加的数据和变化的数据。
拉链表：对新增及变化表做定期合并。

实体表数据量比较小，每日全量 --- 商品表、用户表
维度表数据量比较小，每日全量（没变化的客观世界的维度（比如性别，地区，民族，政治成分，鞋子尺码）可以只存一份固定值，用增量导入） ----- 商品一二三级分类
事务型事实表同步策略：数据不会变化，而且数据量巨大，所以每天只同步新增数据即可，所以可以做成每日增量表，即每日创建一个分区存储。 ---------支付流水表、订单详情表
周期型事实表同步策略：利用每日新增和变化表，制作一张拉链表（对新增及变化表做定期合并） ----- 订单表
---存每日全量的话，数据量太大，冗余也太大。如果用每日增量的话无法反应数据变化。

kettle示范根据时间的增量导入：
   实现增量导出步骤：
       1、times里的原始记录（t0, t0）,获取当前时间，记录到中间表（t0, now()）
       2、获取users数据，指定获取条件
       3、数据同步完毕后，更新times表（now(), now()）
       4、重复以上步骤，now时间需要不断更新

sqoop先导入到hdfs中（mr清洗再到ods。。。）：
关系型数据库，表的字段不一致、数据需要清洗

sqoop直接导入到hive中：
字段类型一致，如时间维度表

-----------------------------------------

3、转换

数据转换是将数据进行重构以及标准化，消除数据的不一致，处理缺失数据，转换最主要的任务就是数据清洗。
数据清洗：按照一定的规则处理脏数据的过程。(目的在于删除重复信息，纠正存在的错误，并提供数据一致性)

数据清洗流程通常包括如下内容:
   a）预处理: 对于大的数据文件的加载，特别是新的文件，要进行预先诊断和尖刺，不能贸然加载
   b)标准化处理: 根据标准化对照表，将不一致的数据进行统一(如，json数据，提取出一个个字段值)
   c)去重处理：对于是否过滤，是否修正一般要求业务方确认
       一种是整行数据完全重复（使用distinct或者group by 进行处理）
       一种是有重复的字段，这种一般需要子查询来进行处理
   d)错误值：错误值产生的原因是业务系统不够健全，在接收输入后没有进行判断直接写入后台数据库造成的，比如数值数据输成全角数字字符、字符串数据后面有一个回车操作、日期格式不正确、日期越界等。
           对于类似于全角字符、数据前后有不可见字符的问题，通过转换进行处理
           对于值的格式不正确或者越界或者一些主外键对应不上数据，需要将这些数据写入日志文件中，跟业务方确定这些数据的处理方式，是丢弃，还是修正，还是标准化等。
   e)缺失值：
       确定缺失值范围：对每个字段都计算其缺失值比例，然后按照缺失比例和字段重要性，分别制定策略

       去除不需要的字段：这一步很简单，直接删掉即可，但强烈建议清洗每做一步都备份一下，或者在小规模数据上试验成功再处理全量数据，不然删错了会追悔莫及(多说一句，写SQL的时候delete一定要配where!)
       填充缺失内容：某些缺失值可以进行填充，方法有以下三种：
                   以业务知识或经验推测填充缺失值(如,性别)
                   以同一指标的计算结果(均值、中位数、众数等)填充缺失值
                   以不同指标的计算结果填充缺失值，例子：年龄字段缺失，但是有身份证号，可以通过截取身份证号来获取年龄
       重新取数：如果某些指标非常重要又缺失率高，那就需要和取数人员或业务人员了解，是否有其他渠道可以取到相关数据
   f)格式内容清洗：如果数据是由系统日志而来，那么通常在格式和内容方面，会与元数据的描述一致。
               如果数据是由人工收集或用户填写而来，则有很大可能性在格式和内容上存在一些问题，
               比如同一个值，有空格和没空格统计出来结果就不正确了、统计值不全(数字里掺个字母当然求和时结果有问题)、模型输出失败或效果不好(数据对错列了，把日期和年龄混了等)
               格式内容问题有以下几类：
                       1、时间、日期、数值、全半角等显示格式不一致
                           这种问题通常与输入端有关，在整合多来源数据时也有可能遇到，将其处理成一致的某种格式即可。
                       2、内容中有不该存在的字符
                           某些内容可能只包括一部分字符，比如身份证号是数字+字母，中国人姓名是汉字(赵C这种情况还是少数)。
                           最典型的就是头、尾、中间的空格，也可能出现姓名中存在数字符号、身份证号中出现汉字等问题。这种情况下，需要以半自动校验半人工方式来找出可能存在的问题，并去除不需要的字符。
                       3、内容与该字段应有内容不符
                           姓名写了性别，身份证号写了手机号等等，均属这种问题。但该问题特殊性在于：并不能简单的以删除来处理，因为成因有可能是人工填写错误，也有可能是前端没有校验，还有可能是导入数据时部分或全部存在列没有对齐的问题，因此要详细识别问题类型。
   g)逻辑错误清洗
   比如年龄超过200岁，日期越界，这种的就要么删掉，要么按缺失值处理。
   h)修正矛盾内容
   有些字段是可以互相验证的，比如身份证号和年龄，当年龄跟身份证号上的出生日期不匹配的时候，
   在这种时候，需要根据字段的数据来源，来判定哪个字段提供的信息更为可靠，去除或重构不可靠的字段
   i)非需求数据清洗
   如果数据量没有大到不删字段就没办法处理的程度，那么能不删的字段尽量不删，另外必须要删的时候，一定要做好数据的备份
   j)关联性验证
   如果你的数据有多个来源，那么有必要进行关联性验证。发现这种不一致，需要跟业务方确认，如何需要调整或去除数据。

------------------------------------

4、Load 数据装载

1）预装载：不从源数据中获取（时间维度，数仓生命周期）

2）初始装载：没有数据，第一次加载
确定加载过程中需要做的处理过程，进行实现，装载完成要验证数据的正确性！
如，需要生成sk键
sk的生成方式有两种，使用row_number()函数，或者创建hive的用户自定义函数，

3）定期装载：全量、增量覆盖之前的数据

-------------------------------

5、ETL自动化

把每天需要跑的任务编写完了，这个任务需要每天定时去执行，一般来讲需要制定一个任务计划表，来记录所有的任务的执行周期，执行时间，负责人，联系方式等信息，
关于调度的执行周期，一般选在业务量的低峰，上线也是一样，在业务量最低的时候去进行操作，这个时候如果出现问题，进行回滚，业务影响不大，所以一般选择在凌晨2-4点之间，

----------------------

四、数仓分层
ods--->dwd--->dws---->dm

源数据->ods->dw : ETL
dw开始数据分析：BI

ods/sda 与源数据基本保持一致（log数据、埋点数据、第三方数据）
dwd/dwi 细粒度拆分数据（如，log：公共字段、事件名称、事件数据、服务器时间），一条条的详细的数据
dws/dwa 粗粒度聚合（按日月聚合，如，每日新增设备）
dm/ads/app 指标分析层，基于上述各层进行指标的聚合分析（如留存率）

dim 维度层：将这些维度表放到单独的一个库中，形成维度库，即可看成是维度层，意在让数仓数据清晰明了

阿里数据体系中，数据仓库分为三层：

ODS、CDM（数据公共层,包含DIM、DWD、DWS）、ADS

DIM：建立一致数据分析维表，在划分数据域、构建总线矩阵时，需要结合对业务过程的分析定义维度。

DWD：明细层

DWS：公共汇总层

---------------------
五、数仓管理：

1）数据库管理
安全管理：权限管理
   数据仓库的备份和恢复
   数据老化：设计数据仓库中数据的存放时间周期和对过期数据的老化方法，如历史数据只保存汇总数据，当年数据保存详细记录

2）元数据管理：
元数据管理贯穿于整个系统的建设过程中，元数据是描述数据的数据
   元数据不但是独立存放，而且对用户是透明的，标准元数据之间可以互相转换

   元数据：
       1）技术元数据：表怎么创建的，字段类型、外部表还是内部表、分区表。。。
       2）业务元数据：表与表之间的转换依赖关系，业务规则
       3）管理元数据：表有哪些人管理维护；谁拥有该表的权限，

       源数据的描述定义：类型、位置、结构。
               ∙数据转换规则：编码规则、行业标准。
               ∙目标数据仓库的模型描述：星型/雪花模型定义，维/事实结构定义。
               ∙源数据到目标数据仓库的映射关系：函数/表达式定义。
               ∙代码：生成转换程序、自动加载程序等。
           在数据管理阶段，元数据主要包括下列信息：
               ∙汇总数据的描述：汇总/聚合层次、物化视图结构定义。
               ∙历史数据存储规则：位置、存储粒度。
               ∙多维数据结构描述：立方体定义、维结构、度量值、钻取层次定义等。
           在数据展现阶段，元数据主要包括以下信息：
               ∙报表的描述：报表结构的定义。
               ∙统计函数的描述：各类统计分析函数的定义。
               ∙结果输出的描述：图、表输出的定义。


数据质量管理、元数据管理有专门人员管理，专门工具管理

将整个项目的实施分成若干个阶段，以“总体规划、分步实施、步步见效”为原则

----------------------------------------------------------

六、元数据管理
元数据：
   1）技术元数据：表怎么创建的，字段类型、外部表还是内部表、分区表。。。
   2）业务元数据：表与表之间的转换依赖关系，业务规则
   3）管理元数据：表有哪些人管理维护；谁拥有该表的权限，

详细见文档！

----------------------------------------------------------

七、数据治理

1、建立完善的管理制度、管理规则
2、元数据管理

3、数据质量管理
4、数据规则管理

空值、规范格式、阈值、业务逻辑、重复性、波动性、相关性、平衡性

----------------------------------------------------------

八、数据中台

即数据平台，依赖于数据仓库，可供第三方调用的统一标准

数据中台是指通过数据技术，对海量数据进行采集、计算、存储、加工，同时统一标准和口径

“数据中台”一般包含以下几个部分：

1、数据仓库：用来存储数据的，结构性数据、非结构性数据等，还有离线数据和实时数据等；

2、大数据中间件：包含了大数据计算服务、大数据研发套件、数据分析及展现工具；

3、数据资产管理：按照阿里的体系应该分为垂直数据、公共数据和萃取数据3层；

----------------------------------------------------------

九、数仓架构


inmon架构
   即从数据源到数据仓库再到数据集市的（先有数据仓库再有数据市场）一种瀑布流开发方法。
缺点：   从数据源开始，数仓架构比较复杂
kimball架构（从需求、dm层反推，知道要得到什么数据，然后从ods开始导；）
   即从数据集市到数据仓库再到数据源(先有数据集市再有数据仓库)的一种敏捷开发方法
   Kimball往往意味着快速交付、敏捷迭代，不会对数据仓库架构做过多复杂的设计，在变换莫测的互联网行业，这种架构方式逐渐成为一种主流范式。
缺点：需求多变的话，表可能会频繁变更

你可能感兴趣的:(大数据资料笔记整理)

设计模式笔记10 | 适配器模式在源码中的应用 | Spring源码的 AOP 注册中心存储了不同的适配器实现 | SpringMVC源码doDisPatch方法里的 HandlerAdapter 「已注销」设计模式设计模式适配器模式 spring
文章目录一、适配器模式知识回顾二、类适配器使用案例之拓展登陆业务2.1模拟登陆的旧系统2.2旧系统拓展【类适配器】2.3旧系统拓展【接口适配器】三、适配器模式在Spring源码中的应用四、SpringMVC中的适配器模式五、总结参考资料一、适配器模式知识回顾适配器定义：将一个类的接口转换成另一种目标接口，使得原本由于接口不兼容而不能一起工作的类能一起工作适配器分类：类结构型模式（耦合读较高）和对象
【人工智能】AI现状分析 || 神经网络的数学基础 || 人工智能交叉领域的发展和技术应用 || 附：小白入门人工智能学习步骤追光者♂ Python从入门到人工智能百题千解计划(项目实战案例）人工智能交叉领域神经网络的数学基础 AI现状分析
声明：仅学习使用~资料整理分析不易，点个赞吧！目录1.AI现状分析（人工智能基础入门概念）1.1人工智能基础概念1.2人工智能的技术发展路线1.3产业发展的驱动因素1.4人工智能薪资岗位介绍2.神经网络的数学基础2.1神经网络的生物表示2.2神经网络的数学表示2.3神经网络必备的一些数学基础2.3.1Sigmoid函数2.3.2偏置2.4总结3.人工智能交叉领域的发展和技术应用3.1人工智能应用交
哈希表总结-C语言版 vanguard2021 Leetcode刷题哈希表
目录1、哈希表的原理2、自己实现的hash表--C语言版3、C语言开源项目uthash.h中的hash接口使用指南3.1uthash.h头文件说明3.2常见的uthash.h接口以及使用方法4、实践应用参考资料：1、哈希表的原理哈希表的关键思想是使用哈希函数将键映射到存储桶。更确切地说，当我们插入一个新的键时，哈希函数将决定该键应该分配到哪个桶中，并将该键存储在相应的桶中；当我们想要搜索一个键时，
【matlab】大小键盘对应的Kbname 有点傻的小可爱计算机外设
matlab中可以通过Kbname来识别键盘上的键。在写范式的时候，遇到一个问题，我想用大键盘上排成一行的数字按键评分，比如Kbname('1')表示键盘上的数字1，但是这种写法只能识别小键盘上的数字，无法达到我的目的，网上也没找到相关的资料，于是自己尝试。在尝试的过程中，我注意到大键盘上的数字shift之后是一些标点符号，于是我分别尝试了两种思路：1）Kbname('数字对应的标点符号')，比如
浅聊读写分离不全数据库 JAVA C#相关数据库读写分离 C#JAVA
一、前言最近工作很繁忙，同事的离职给我带来了很多的事情，投身于博客的时间比较少，另外在宿舍住可能部分的时间要随大流，鹤立鸡群有一些不好，当然这也是给自己找借口和理由，趁着周末整理下最近的感悟；另外公司用的ElasticSearch，最近我也在探索，微服务方面暂时搁浅，待到搬出宿舍的时候在开始一波666的操作；另外随着数据量增加自己还需要去接触波大数据东西，不得说真是有些挑战和机遇，看自己如何把握了
python正则表达式必知必会的基础豆子前端 python基础 python 正则表达式
文章目录正则表达式re.match()和re.search()SRE_Matchobjectre.match()re.search()（重点）re.flags小结re.sub()re.split()re.findall()re.fullmatch()re.compile()小结方法分类注意细节正则表达式网站参考资料正则表达式本文主要讲的是正则表达式在python中的简单使用，只介绍关键的几个方法函
电力知识图谱与大模型的结合：从构建到行业应用的深度解析 Cc不爱吃洋葱知识图谱人工智能自然语言处理大模型大语言模型 LLM 语言模型
随着大数据和人工智能技术的飞速发展，电力行业迎来了智能化转型的全新契机。电力知识图谱作为一种将数据转化为结构化知识的技术，正在赋能故障诊断、设备管理、运维优化等核心场景。而当知识图谱与大模型相结合，更能释放强大的知识推理和智能预测能力，为行业智慧化发展注入新动力。本文将从专业视角，深入探讨电力知识图谱的构建过程、大模型的融入方法，以及它们在实际应用中的落地场景。通过具体案例剖析与技术解读，帮助你了
基于STM32大棚检测控制物联网系统(全部资料+APP）科创工作室li 毕业设计0 stm32 物联网嵌入式硬件
功能详解基于STM32大棚检测控制物联网系统。功能如下：1)检测功能：系统检测周围环境温度数据、土壤温湿度数据、光照强度Lux。2)显示功能：将检测到的环境数据显示在oled屏幕上。3)控制功能：当光照强度低于设定值时，开启灯光；温度高于设定值，开启风扇；土壤湿度低于设定值，开启水泵。4）无线通信：通过WiFi模块与手机APP可实时检测环境。5）分为自动模式和手动模式。全部资料如下：基于STM32
Fatal error in launcher: Unable to create process报错萧若珮笔记
完整报错是这样的：Fatalerrorinlauncher:Unabletocreateprocessusing'"c:\jenkins\workspace\deepview-python_2.5.14\python\python.exe""D:\software\eIQ\python\Scripts\pip.exe"showtensorflow':???????????查资料可以知道这种情况出现
免登录H5快手商城系统/抖音小店商城全开源运营版本云深不知处㊣源码专区免登录商城源码
内容目录一、详细介绍二、效果展示1.部分代码2.效果图展示三、学习资料下载一、详细介绍最近因为直播需要然后在互站花500买了一套仿抖音的商城系统，感觉确实还可以，反正都买了所以就分享给有需要的人以下是互站那边的网站介绍可以了看一下，还是很不错的1、无需登录直接可以购买商品2、独立后台支持分站3、修复已知问题完美运营4、支持对接第三方支付：易支付、码支付、虎皮椒等。二、效果展示1.部分代码代码如下（
有趣幽默彩虹屁文案生成工具微信小程序源码云深不知处㊣源码专区微信小程序文案小程序源码
内容目录一、详细介绍二、效果展示1.部分代码2.效果图展示三、学习资料下载一、详细介绍有趣幽默彩虹屁文案生成工具小程序源码此文案小程序主要功能为分享各种有趣幽默的文案免服务器免域名，源码只提供彩虹屁，朋友圈，毒鸡汤API接口，其他需自行查找替代小程序拥有复制收藏功能，可自行体验，设置流量主可自行查看代码进行更换id二、效果展示1.部分代码代码如下（示例）：">￥已售:2.效果图展示三、学习资料下载
360智算中心：万卡GPU集群落地实践 ZVAyIVqt0UFji
360智算中心是一个融合了人工智能、异构计算、大数据、高性能网络、AI平台等多种技术的综合计算设施，旨在为各类复杂的AI计算任务提供高效、智能化的算力支持。360智算中心不仅具备强大的计算和数据处理能力，还结合了AI开发平台，使得计算资源的使用更加高效和智能化。360内部对于智算中心的核心诉求是性能和稳定性，本文将深入探讨360智算中心在万卡GPU集群中的落地实践过程，包括算力基础设施搭建、集群优
DeepSeek 从入门到精通 DS_Watson ai AI
DeepSeek火了,资料分享给大家通过网盘分享的文件：DeepSeek链接:https://pan.baidu.com/s/1NHpM2E3m6bvLMoEfa-HAgg?pwd=h3if提取码:h3if我用夸克网盘分享了「DeepSeek」链接：https://pan.quark.cn/s/8a4654b23504提取码：ip6S
使用Python编写你的第一个算法交易程序盼达思文体科创 Python量化金融 python 算法 numpy conda pandas 金融
背景Background最近想学习一下量化金融，总算在盈透投资者教育（IBKRCampus）板块找到一篇比较好的算法交易入门教程。我在记录实践过程后，翻译成中文写成此csdn博客，分享给大家。如果你的英语好可以直接看原文。原文在数据准备阶段，采用了pandas_datareader.data读取网络数据，实际中出现了很多问题，我换成了yfinance。可以参考文末完整代码。参考资料：https:/
springboot学生宿舍信息的系统（11574） codercode2022 spring boot 后端 java 开发语言 spring gulp 前端框架
有需要的同学，源代码和配套文档领取，加文章最下方的名片哦一、项目演示项目演示视频二、资料介绍完整源代码（前后端源代码+SQL脚本）配套文档（LW+PPT+开题报告）远程调试控屏包运行三、技术介绍Java语言SSM框架SpringBoot框架Vue框架JSP页面Mysql数据库IDEA/Eclipse开发四、项目截图有需要的同学，源代码和配套文档领取，加文章最下方的名片哦!
AWS Solutions Architect Associate 备考大纲 apa45866 数据库
脑子一热决定学个AWS的证书。以下是Lynda.com的培训课程给出的学习大纲，我参考了一下别的学习资料，感觉靠谱，于是整理出来贴在这里。太长不看版：AWS最主要的4个服务类别是Storage,Compute,Database和Network。其中Storage和Compute的各项服务是SolutionsArchitect考试的重中之重。EC2和IAM估计是考的最多的。下面给出各个服务类别的考试
字节跳动后端或大数据基础知识面试题及参考答案（2万字长文）大模型大数据攻城狮大数据大厂面试数据结构算法 leetcode
目录Redis的数据类型Redis数据类型的底层数据结构三次握手、四次挥手Redis持久化机制购物车为什么用Redis存，是永久存储吗MySQL的InnoDB索引数据结构哪些SQL的关键字会让索引失效队列、栈、数组、链表有什么不同讲讲爬虫的构成爬虫抓到的数据不清洗吗？不去重吗？对爬虫的更多了解Linux进程间通信机制进程和线程的区别线程私有的数据讲一下堆排序，每次调整的时间复杂度？堆排序是稳定的吗
栈（Stack）教学资料羊儿~ python 开发语言数据结构线性回归
目录1.栈的基本概念2.栈的操作3.栈的实现4.C++实现栈1.使用C++STL实现栈2.手动实现栈（基于数组）5.栈的复杂度分析6.栈的扩展7.练习题练习1.练习2.练习3.8.总结1.栈的基本概念栈（Stack）是一种常见的数据结构，它遵循后进先出（LIFO,LastInFirstOut）的原则。这意味着最后进入栈的元素会最先被取出。栈的操作主要发生在栈的顶部。2.栈的操作栈的基本操作包括：P
《2025：中国行业新方向与民营企业的使命》晚风る传媒
2025年，中国经济正站在新的历史节点上，科技创新、数字经济、绿色经济等成为发展的核心驱动力。在这样的背景下，2025年民营企业座谈会的召开，无疑为中国未来行业的发展指明了方向。本文将结合座谈会内容，探讨中国未来行业发展的新方向。一、数字经济：创新驱动的核心引擎数字经济已成为全球经济增长的重要引擎，而民营企业在其中扮演着关键角色。2025年，数字经济将继续深化，涵盖云计算、大数据、人工智能、物联网
网络安全：挑战、技术与未来发展一ge科研小菜鸡运维网络运维
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注1.引言在数字化时代，网络安全（Cybersecurity）已成为全球关注的焦点。随着云计算、大数据、人工智能（AI）、物联网（IoT）等技术的发展，企业和个人的敏感数据在互联网上的流通日益增加，黑客攻击、数据泄露、勒索软件等网络安全威胁也日趋严峻。本文将从网络安全的核心概念、常见攻击手段、防御技术、企业安全策略以及未来发展趋势等方面，深入探讨如
Debian/Ubuntu云服务器配置最速实践笔记[1] 打磨怪最速实践 linux debian ubuntu 腾讯云
在腾讯云购买了一台轻量云服务器跑几个机器人用,一篇基础配置的实践笔记系统是Debian11,理论上Ubuntu等衍生版本基本可以无修改地参考添加普通用户安装Docker安装Node.js安装miniconda安装JupyterNotebook及后台启动Q&A参考资料先关机;重置密码(设定root密码);开机添加用户//先切换到rootsuroot//添加一个普通用户sudoadduser//确定该
Selenium自动化测试入门：浏览器多窗口切换测试杂货铺 selenium 测试工具软件测试自动化测试 python 职场和发展测试用例
点击文末小卡片，免费获取软件测试全套资料，资料在手，涨薪更快有时web应用会打开多个浏览器窗口，当我们要定位新窗口中的元素时，我们需要将webDriver的handle（句柄）指定到新窗口。什么意思？假设我们打开web应用，在系统运行过程中重新打开一个新窗口（可以是页签，当前浏览器存在两个窗口），这时我们webDriver对浏览器的操作指针（句柄）还再原窗口，如果需要操作新窗口元素就要将handl
接口自动化测试框架设计之参数传递测试杂货铺 python 软件测试自动化测试测试工具职场和发展测试用例接口测试
点击文末小卡片，免费获取软件测试全套资料，资料在手，涨薪更快在我们设计自动化测试框架的时候，我们会经常将测试数据保存在外部的文件（如Excel、YAML）中，实现测试脚本与测试数据解耦，方便后期维护。当涉及到业务场景接口用例时，由于接口与接口存在关联关系，需要从上游接口取出来相关字段传递给下游接口作为入参使用，比如在Excel中我们会这样做：在excel中新增一列【提取响应】，将上游接口的响应字段
Redis：深入理解阻塞列表弹出与消息发布订阅机制_brpop原理高级工程师2024 2024年程序员学习 redis bootstrap 数据库
先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！因此收集整理了一份《2024年最新Linux运维全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶
DolphinScheduler环境搭建、服务启动等常见问题及解决方案数据库
ApacheDolphinScheduler作为一款分布式易扩展的工作流调度系统，广泛应用于大数据任务编排。然而，在实际使用中，用户可能会遇到环境搭建、服务启动、工作流执行等问题。本文结合社区文档与用户实践经验，整理以下高频问题及详细解决方案，帮助用户快速定位并解决问题。一、安装与部署问题环境依赖配置错误问题：部署时因缺少JDK、Maven或数据库配置导致失败。解决方案：安装JDK1.8+并配置J
文心快码智能体不断发展，真正与AI协同工作
文心快码(BaiduComate)是基于百度文心大模型，在研发全流程全场景下为开发者提供辅助建议的智能代码助手。结合百度积累多年的编程现场大数据、外部优秀开源数据，可为开发者生成更符合实际研发场景的优秀代码，提升编码效率，释放“十倍”软件生产力。如果您对【文心快码企业版】感兴趣，希望获取更多详细信息，点击进入企业服务咨询我们会尽快安排专业人员与您取得联系！我们期待与您建立联系，为您的企业带来更高效
HTML CSS整理笔记（建议收藏）程序员的生活1 js web前端 html+css css javascript html css3
点击链接后退页面：回到上一个网页——修改placeholder提示的样式：打造全网web前端全栈资料库（总目录）看完学的更快，掌握的更加牢固，你值得拥有（持续更新）1.除IE外通用写法类名或标签名::placeholder{color:red;}2.加兼容前缀写法css超出一行显示省略号：给定宽度(width:100px)、超出隐藏（overflow:hidden）、强制在同一行显示（white-
2025【修复版】红娘金媒10.3.1婚恋相亲系统源码+PC+微信小程序+抖音小程序+公众号+接入三端+安装教程百创科技源码与教程源码下载小程序微信小程序
1.红娘服务红娘服务模块是该系统的一大特色。专业红娘会通过分析用户的个人资料和偏好，为用户提供精准的配对建议和个性化服务。用户可以预约红娘服务，通过红娘的介入，提升配对成功率。2.相亲活动相亲活动模块用于组织和管理线下或线上相亲活动。用户可以报名参加系统组织的各类相亲活动，通过集体活动认识更多异性。系统会发布活动信息，审核报名用户，并向报名成功的用户推送活动通知和后续反馈。3.交友匹配交友匹配模块
智能城市：科技驱动的未来城市给生活加糖！热门知识科技语音识别人工智能
随着科技的不断发展和城市化进程的加速，传统城市面临着诸多挑战，包括交通拥堵、环境污染、资源浪费和公共服务不足等问题。为了解决这些问题，智能城市（SmartCity）的概念应运而生。智能城市是利用现代信息技术、物联网、大数据、云计算、人工智能等手段，对城市的各个方面进行全面的智能化管理与优化，从而提高城市运行效率、改善居民生活质量，并实现可持续发展的城市目标。一、什么是智能城市？智能城市是指通过信息
推动AI云产业向深向实，云·AI·算力创新发展大会即将启幕科技云报道云计算 AI 云计算
近年来，以AIGC为代表的新兴技术正加速演进，全球站在智能化变革的起点，人工智能与云计算的深度融合，也驱动云计算进入第三次发展浪潮，迎来前所未有的机遇。伴随AI的快速发展，2024年《政府工作报告》明确提出，制定支持数字经济高质量发展政策，深化大数据、人工智能等研发应用，开展“人工智能+”行动。这意味着AI正在成为产业创新的核心抓手和驱动新质生产力的关键引擎，而云计算作为基础底座将在其中扮演至关重
[星球大战]阿纳金的背叛 comsci
本来杰迪圣殿的长老是不同意让阿纳金接受训练的......... 但是由于政治原因,长老会妥协了...这给邪恶的力量带来了机会所以......现代的地球联邦接受了这个教训...绝对不让某些年轻人进入学院
看懂它，你就可以任性的玩耍了！ aijuans JavaScript
javascript作为前端开发的标配技能，如果不掌握好它的三大特点：1.原型 2.作用域 3. 闭包 ,又怎么可以说你学好了这门语言呢？如果标配的技能都没有撑握好，怎么可以任性的玩耍呢？怎么验证自己学好了以上三个基本点呢，我找到一段不错的代码，稍加改动，如果能够读懂它，那么你就可以任性了。 function jClass(b
Java常用工具包 Jodd Kai_Ge java jodd
Jodd 是一个开源的 Java 工具集，包含一些实用的工具类和小型框架。简单，却很强大！写道 Jodd = Tools + IoC + MVC + DB + AOP + TX + JSON + HTML < 1.5 Mb Jodd 被分成众多模块，按需选择，其中工具类模块有： jodd-core &nb
SpringMvc下载 120153216 springMVC
@RequestMapping(value = WebUrlConstant.DOWNLOAD) public void download(HttpServletRequest request,HttpServletResponse response,String fileName) { OutputStream os = null; InputStream is = null;
Python 标准异常总结 2002wmj python
Python标准异常总结 AssertionError 断言语句（assert）失败 AttributeError 尝试访问未知的对象属性 EOFError 用户输入文件末尾标志EOF（Ctrl+d） FloatingPointError 浮点计算错误 GeneratorExit generator.close()方法被调用的时候 ImportError 导入模块失
SQL函数返回临时表结构的数据用于查询 357029540 SQL Server
这两天在做一个查询的SQL，这个SQL的一个条件是通过游标实现另外两张表查询出一个多条数据，这些数据都是INT类型，然后用IN条件进行查询，并且查询这两张表需要通过外部传入参数才能查询出所需数据，于是想到了用SQL函数返回值，并且也这样做了，由于是返回多条数据，所以把查询出来的INT类型值都拼接为了字符串，这时就遇到问题了，在查询SQL中因为条件是INT值，SQL函数的CAST和CONVERST都
java 时间格式化 | 比较大小| 时区个人笔记 7454103 java eclipse tomcat c MyEclipse
个人总结！不当之处多多包含！引用 1.0 如何设置 tomcat 的时区：位置：(catalina.bat---JAVA_OPTS 下面加上) set JAVA_OPT
时间获取Clander的用法 adminjun Clander 时间
/** * 得到几天前的时间 * @param d * @param day * @return */ public static Date getDateBefore(Date d,int day){ Calend
JVM初探与设置 aijuans java
JVM是Java Virtual Machine（Java虚拟机）的缩写，JVM是一种用于计算设备的规范，它是一个虚构出来的计算机，是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机包括一套字节码指令集、一组寄存器、一个栈、一个垃圾回收堆和一个存储方法域。 JVM屏蔽了与具体操作系统平台相关的信息，使Java程序只需生成在Java虚拟机上运行的目标代码（字节码）,就可以在多种平台
SQL中ON和WHERE的区别 avords
SQL中ON和WHERE的区别数据库在通过连接两张或多张表来返回记录时，都会生成一张中间的临时表，然后再将这张临时表返回给用户。 www.2cto.com 在使用left jion时，on和where条件的区别如下： 1、 on条件是在生成临时表时使用的条件，它不管on中的条件是否为真，都会返回左边表中的记录。
说说自信 houxinyou 工作生活
自信的来源分为两种,一种是源于实力,一种源于头脑.实力是一个综合的评定,有自身的能力,能利用的资源等.比如我想去月亮上,要身体素质过硬,还要有飞船等等一系列的东西.这些都属于实力的一部分.而头脑不同,只要你头脑够简单就可以了!同样要上月亮上,你想,我一跳,1米,我多跳几下,跳个几年,应该就到了!什么?你说我会往下掉?你笨呀你!找个东西踩一下不就行了吗? 无论工作还
WEBLOGIC事务超时设置 bijian1013 weblogic jta 事务超时
系统中统计数据，由于调用统计过程，执行时间超过了weblogic设置的时间，提示如下错误：统计数据出错! 原因：The transaction is no longer active - status: 'Rolling Back. [Reason=weblogic.transaction.internal
两年已过去，再看该如何快速融入新团队 bingyingao java 互联网融入架构新团队
偶得的空闲，翻到了两年前的帖子该如何快速融入一个新团队，有所感触，就记下来，为下一个两年后的今天做参考。时隔两年半之后的今天，再来看当初的这个博客，别有一番滋味。而我已经于今年三月份离开了当初所在的团队，加入另外的一个项目组，2011年的这篇博客之后的时光，我很好的融入了那个团队，而直到现在和同事们关系都特别好。大家在短短一年半的时间离一起经历了一
【Spark七十七】Spark分析Nginx和Apache的access.log bit1129 apache
Spark分析Nginx和Apache的access.log，第一个问题是要对Nginx和Apache的access.log文件进行按行解析，按行解析就的方法是正则表达式： Nginx的access.log解析正则表达式 val PATTERN = """([^ ]*) ([^ ]*) ([^ ]*) (\\[.*\\]) (\&q
Erlang patch bookjovi erlang
Totally five patchs committed to erlang otp, just small patchs. IMO, erlang really is a interesting programming language, I really like its concurrency feature. but the functional programming style
log4j日志路径中加入日期 bro_feng java log4j
要用log4j使用记录日志，日志路径有每日的日期，文件大小5M新增文件。实现方式 log4j: <appender name="serviceLog" class="org.apache.log4j.RollingFileAppender"> <param name="Encoding" v
读《研磨设计模式》-代码笔记-桥接模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 个人觉得关于桥接模式的例子，蜡笔和毛笔这个例子是最贴切的：http://www.cnblogs.com/zhenyulu/articles/67016.html * 笔和颜色是可分离的，蜡笔把两者耦合在一起了：一支蜡笔只有一种
windows7下SVN和Eclipse插件安装 chenyu19891124 eclipse插件
今天花了一天时间弄SVN和Eclipse插件的安装，今天弄好了。svn插件和Eclipse整合有两种方式，一种是直接下载插件包，二种是通过Eclipse在线更新。由于之前Eclipse版本和svn插件版本有差别，始终是没装上。最后在网上找到了适合的版本。所用的环境系统：windows7JDK：1.7svn插件包版本：1.8.16Eclipse：3.7.2工具下载地址：Eclipse下在地址：htt
[转帖]工作流引擎设计思路 comsci 设计模式工作应用服务器 workflow 企业应用
作为国内的同行，我非常希望在流程设计方面和大家交流，刚发现篇好文(那么好的文章，现在才发现，可惜)，关于流程设计的一些原理，个人觉得本文站得高，看得远，比俺的文章有深度，转载如下 ================================================================================= 自开博以来不断有朋友来探讨工作流引擎该如何
Linux 查看内存，CPU及硬盘大小的方法 daizj linux cpu 内存硬盘大小
一、查看CPU信息的命令 [root@R4 ~]# cat /proc/cpuinfo |grep "model name" && cat /proc/cpuinfo |grep "physical id" model name : Intel(R) Xeon(R) CPU X5450 @ 3.00GHz model name :
linux 踢出在线用户 dongwei_6688 linux
两个步骤： 1.用w命令找到要踢出的用户，比如下面： [root@localhost ~]# w 18:16:55 up 39 days, 8:27, 3 users, load average: 0.03, 0.03, 0.00 USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
放手吧,就像不曾拥有过一样 dcj3sjt126com
内容提要：静悠悠编著的《放手吧就像不曾拥有过一样》集结“全球华语世界最舒缓心灵”的精华故事，触碰生命最深层次的感动，献给全世界亿万读者。《放手吧就像不曾拥有过一样》的作者衷心地祝愿每一位读者都给自己一个重新出发的理由，将那些令你痛苦的、扛起的、背负的，一并都放下吧！把憔悴的面容换做一种清淡的微笑，把沉重的步伐调节成春天五线谱上的音符，让自己踏着轻快的节奏，在人生的海面上悠然漂荡，享受宁静与
php二进制安全的含义 dcj3sjt126com PHP
PHP里，有string的概念。 string里，每个字符的大小为byte（与PHP相比，Java的每个字符为Character，是UTF8字符，C语言的每个字符可以在编译时选择）。 byte里，有ASCII代码的字符，例如ABC，123，abc，也有一些特殊字符，例如回车，退格之类的。特殊字符很多是不能显示的。或者说，他们的显示方式没有标准，例如编码65到哪儿都是字母A，编码97到哪儿都是字符
Linux下禁用T440s，X240的一体化触摸板(touchpad) gashero linux ThinkPad 触摸板
自打1月买了Thinkpad T440s就一直很火大，其中最让人恼火的莫过于触摸板。 Thinkpad的经典就包括用了小红点(TrackPoint)。但是小红点只能定位，还是需要鼠标的左右键的。但是自打T440s等开始启用了一体化触摸板，不再有实体的按键了。问题是要是好用也行。实际使用中，触摸板一堆问题，比如定位有抖动，以及按键时会有飘逸。这就导致了单击经常就
graph_dfs hcx2013 Graph
package edu.xidian.graph; class MyStack { private final int SIZE = 20; private int[] st; private int top; public MyStack() { st = new int[SIZE]; top = -1; } public void push(i
Spring4.1新特性——Spring核心部分及其他 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
配置HiveServer2的安全策略之自定义用户名密码验证 liyonghui160com
具体从网上看 http://doc.mapr.com/display/MapR/Using+HiveServer2#UsingHiveServer2-ConfiguringCustomAuthentication LDAP Authentication using OpenLDAP Setting
一位30多的程序员生涯经验总结 pda158 编程工作生活咨询
1.客户在接触到产品之后，才会真正明白自己的需求。　　这是我在我的第一份工作上面学来的。只有当我们给客户展示产品的时候，他们才会意识到哪些是必须的。给出一个功能性原型设计远远比一张长长的文字表格要好。 2.只要有充足的时间，所有安全防御系统都将失败。　　安全防御现如今是全世界都在关注的大课题、大挑战。我们必须时时刻刻积极完善它，因为黑客只要有一次成功，就可以彻底打败你。 3.
分布式web服务架构的演变自由的奴隶 linux Web 应用服务器互联网
最开始，由于某些想法，于是在互联网上搭建了一个网站，这个时候甚至有可能主机都是租借的，但由于这篇文章我们只关注架构的演变历程，因此就假设这个时候已经是托管了一台主机，并且有一定的带宽了，这个时候由于网站具备了一定的特色，吸引了部分人访问，逐渐你发现系统的压力越来越高，响应速度越来越慢，而这个时候比较明显的是数据库和应用互相影响，应用出问题了，数据库也很容易出现问题，而数据库出问题的时候，应用也容易
初探Druid连接池之二——慢SQL日志记录 xingsan_zhang 日志连接池 druid 慢SQL
由于工作原因，这里先不说连接数据库部分的配置，后面会补上，直接进入慢SQL日志记录。 1.applicationContext.xml中增加如下配置： <bean abstract="true" id="mysql_database" class="com.alibaba.druid.pool.DruidDataSourc