帆软商业智能技术

传统数仓不够怎么办？不妨看看这个银行的混合数仓实践，建议收藏

随着银行业务规模和交易数量的增长，为了实现全行统一的数据存储及分析，各商业银行普遍实施了以Teradata、GreenPlum等为代表的中高端数据仓库系统项目，通过汇总银行内部各交易系统的数据，并根据数据标准化要求，进行清洗、转换，最终统一存储用于行内数据统计与分析。

但近几年，面对互联网金融的挑战，银行业务已经发生巨大变化，各种结构化、非结构化海量数据蜂拥而至，而基于海量数据下的精细化管理以及快速业务决策需求正成为一种普遍情况，对数据应用的时效性、复杂性提出了巨大的挑战。

因此形成了对传统数据仓库解决方案的质疑：难以支持实时数据服务、过高的海量数据存储成本、无法支持非结构化数据处理等等。

由此银行创新的提出了混合型数据仓库架构，将数据仓库定义扩大为全行统一的数据服务中心，整合了内存数据库、关系型数据库、Hadoop等多种数据处理技术，根据不同业务场景对数据应用的需求，灵活提供数据服务，同时满足低成本、安全性、可用性、敏捷性、自动化的需求。

目前该混合架构已在该银行实现了第一阶段的功能落地，对商业银行特别是中小型商业银行具有重大的借鉴意义。

▍一、数据应用的发展方向

随着金融服务的不断创新，以及互联网技术的快速发展，金融机构对于数据的应用已不再局限于经营报表、管理决策等传统数据分析需要，而是期望在更多的金融服务场景发掘数据的应用价值。

在这样的背景下，除了企业内部产生的各类交易和管理数据，部分金融机构已开始通过从互联网，以及第三方合作机构获取外部数据进行补充；同时除了已明确定义的结构化数据外，也开始尝试挖掘音频、视频、地理信息、文件、资讯信息等无法直接进行分析的非结构化数据的价值。

从各个渠道所获取的数据数量庞大、种类多样、实时性强，传统的数据仓库技术难以完全支持相应数据的处理，因此近几年大数据的概念逐渐流行起来，同时针对大数据的存储、处理和分析技术也得到了迅速的发展，例如Hadoop等开源大数据项目。

但大数据技术也存在其局限性，例如Hadoop技术在超大文件、流数据处理、分布处理等方面具有较大优势，但在低延迟数据访问、数据多次写入、大量小文件处理的支持上还存在较大缺陷。

在进行数据仓库项目的建设选型中，采取传统数据仓库技术难以支持大数据的处理，而采取Hadoop等大数据技术又在传统数据应用支持上存在缺陷，因此，银行提出一种混合型数据仓库架构，以发挥各类数据技术的优势，同时形成技术短板的互补，以应对金融机构的各种数据应用场景需求。

▍二、数据仓库的能力设计

传统数据仓库更多用于支撑数据分析和数据挖掘应用，通过分析各种常见业务需求，并考虑数据仓库为全行数据中心的定位，可以扩充数据仓库对于各类业务场景的应用支持：

（1）实时数据共享：支持各业务系统通过接口查询数据仓库的各类实时数据，例如支持各渠道系统实时展示客户全资产负债视图，由数据仓库实时汇集客户最新的资产负债信息，则各类渠道系统（如网上银行、手机银行等）只需访问数据仓库实时获取信息，无需分别到各个产品系统获取客户产品余额再组合；

（2）批量数据获取：支持通过接口或文件方式获取批量数据，例如综合报表系统通过文件方式批量获取数据仓库的每日数据，用于进行各类经营管理报表的生成和展示；

（3）历史数据查询：支持通过接口或文件方式查询金融机构开业以来的各类报表、回单、单据等静态数据，以及支持查询开业以来的各系统的归档数据；

（4）非结构化数据处理：支持对文件、影像、视频、音频等非结构化数据进行存储及查询访问。

考虑到以上的各类数据应用场景，数据仓库架构应提供以下核心能力支持：

（1）数据时间范围：可在数据仓库中访问各个时点的数据，包括当日实时数据和所有历史数据；

（2）数据访问性能：可根据访问需求保证数据的访问性能，如当天的数据用于实时交易要求在毫秒级响应；历史数据用于分析挖掘可在分钟级响应；

（3）数据类型支持：可支持正常结构化数据的存储和处理，也可支持视频、音频、文件等非结构化数据的存储和处理；

（4）访问方式支持：可支持数据的实时报文查询，也可支持数据的批量文件查询；

（5）数据标准支持：数据仓库的结构化数据应遵循数据标准，以保证外部数据使用的易用性和一致性。

▍三、混合数据仓库的整体架构

基于数据仓库的核心能力设计，并针对各类数据仓库方案的技术优势，可按以下架构开展数据仓库的建设：

数据仓库整体架构

根据数据时间范围、数据访问性能、访问方式支持、数据类型支持等不同，数据仓库的整体架构可分为实时数据仓库、历史数据仓库、归档数据仓库、数据总线这四大模块：

（1）实时数据仓库

实时数据仓库所存储数据时间范围为T日的实时数据及近期（T+7日），主要提供业务系统需高访问频度数据，并包含实时的轻度汇总数据（如客户资产总额）。其通过源系统信息推送方式实时获取交易系统及外部的数据，实现价值信息实时而高效的获取，为业务系统的数据查询和分析型系统的实时决策等提供数据支持。

由于实时数据仓库需要支持数据的实时更新和实时访问，其应对场景为需及时响应、高并发的交易场景，因此在技术选型上可采用内存数据库，利用高效内存计算技术，进行实时汇总、整合处理，同时可以支持高频读写的应用访问场景。

（2）历史数据仓库

历史数据仓库所存储数据时间范围为T+1日至3年，每日日终从全行各源系统批量获取T+1的数据，采用统一模型策略，集成全行各业务系统有商业价值的基础数据，实现对基础明细数据的存储、整合和加工处理。

历史数据仓库的定位和能力要求与传统的数据仓库一致，主要是为经营分析和管理决策提供全方位、多角度、深层次的数据支持，满足分析型应用需求，因此可采取传统的数据仓库技术搭建。

（3）归档数据仓库

归档数据仓库所存储数据时间范围为3年以上的历史数据，以及各类文件、音频、视频、图像等非结构化数据，主要用于在线长期保存历史数据仓库、文服和下游各应用系统的离线归档数据，为客户交易明细历史查询等历史数据查询提供支持，同时可支持非结构化数据的存储、查询和处理。

归档数据仓库存储的数据量巨大，且涉及非结构化数据的支持，应用上较为符合大数据的处理要求，因此可采用Hadoop等大数据平台搭建，除满足基本的数据归档和查询需求外，还可支持后续对非结构化数据及大数据处理的扩展。

（4）数据总线

数据总线定位为针对外围应用系统访问实时、历史、归档数据仓库的数据查询服务，通过统一的接口服务，实现外围应用对跨系统、跨周期数据的查询。数据总线提供联机的查询服务，满足高并发、小数据量的查询；对于大数据量的查询，采取异步方式，在数据总线中生成数据文件后，通过通用文件服务平台进行文件的传输和处理。

数据总线主要是向外围应用提供访问数据仓库的服务，因此在功能要求上与企业服务总线（ESB）类似，可采用企业服务总线类似的架构和技术。

▍四、混合数据仓库的详细设计和实现

1、实时数据仓库设计

（1）详细设计

实时数据仓库需要满足实时数据的大量并发读写和毫秒级响应要求，因此在核心技术选型上选择基于Redis数据库（一款开源的Key-Value内存数据库）搭建，架构设计如下图：

实时数据仓库架构设计

实时数据仓库的架构主要分为两层，数据存储层和应用层：

数据存储层

数据存储层使用最基本的数据库功能进行数据模型的落地和数据存储，Redis数据库用于存储交易明细和轻度汇总数据，MySQL数据库用于每日日终与历史数据仓库进行明细数据和汇总数据的核对，以保证可自动发现由于交易实时推送出错导致的数据不不一致问题。

其中Redis数据库采用主从集群方式提高读写性能和系统可用性，此外也使用Redis数据库的AOF（掉电保护文件）模式来确保服务器宕机后可通过物理文件进行数据库的恢复。

应用层

由于数据存储层不支持数据的逻辑处理，需通过应用层部署各类数据服务功能，包括数据服务池模块、事务处理模块、批处理模块、SQL适配器、管理后台功能等。

数据服务池：提供对外接口服务的管理，包括处理标准服务数据的标准组件、处理特殊服务或业务逻辑的专用组件、接口及组件定义的参数配置和对外服务的管理发布。

事务处理模块：由于Redis不支持事务，需通过应用层的事务处理模块实现事务提交或回滚，在明细同步和轻度汇总处理中如果出错，需控制进行数据回滚，保证数据的一致性。

批处理模块：提供日终批次处理服务，主要用于与历史数据仓库的明细和汇总数据核对处理。

SQL适配器：封装对Reids和MySQL等数据库的访问。

管理后台：向管理员提供系统参数配置、日志查看、系统运行情况监控的管理界面功能。

（2）关键技术总结

由于实时数据仓库采用的Redis数据库为Key-Value类型数据库，与传统的关系型数据库无论在数据存储结构还是数据查询语言上都有极大的不同，如果每类数据在Redis数据库上的落地都需要进行特殊设计和开发，将导致后续的维护成本非常高。为解决该问题，在方案中实现了传统关系型数据库表结构和Key-Value类型结构的转换模型，以保证关系型数据库的任意表结构均可直接在Redis数据库上落地；此外也针对Redis数据库设计了专用SQL适配器，让开发人员可以直接使用标准SQL操作和查询Reids数据库的数据。

数据存储模型

a. 关系型数据表的每行记录在Redis中存储为一个Key-Value值；

b. Key值字符串格式为“Detail:表名:主键字段1值||主键字段2值||…”；如果数据表并无主键，则自动生成一个不重复的自增序号作为主键，以便可区分记录并进行数据访问；

c. Value存储的是一个Hash类型，存放1行表记录的所有“字段名-字段值”键值对（Key-Value）；

d. 如果可确定要访问数据的主键值，可通过“HGETALL key”命令直接访问行记录的hash对象，或通过“HGET key field”命令获取记录指定字段的值；

索引模型

对于检索非主键字段值的查询需求，需要建立相应的字段索引，以提高数据的访问速度。

a. 关系型数据表的每个字段的每一类值，可建立一个Key-Value键值对存储相应的索引信息；

b. 每插入一行数据，需在现有索引值Key-Value上增加对应的key字符串，或新增一类索引值Key-Value键值对；

c. 字符型字段的索引Key值字符串格式为“Index:表名:主键名:字段名:字段值”，Value值为对应记录主键字符串列表；

d. 数字类型字段的索引Key值字符串格式为“Index:表名:主键名:字段名”，Value为sorted-sets结构，其中字段值直接作为sorted-sets结构的分数(score)，对应记录的主键字符串为sorted-sets结构的值，通过对分数(score)排序来提高检索数据的效率；

2、历史数据仓库设计

历史数据仓库基本沿用传统数据仓库的技术方案，方案上与传统数据仓库的区别仅在于数据标准转换的落地工作在源系统实现，历史数据仓库内部直接使用经过数据标准转换后的数据，无需转标的处理，架构设计如下图：

历史数据仓库架构设计

历史数据仓库的设计基本采用传统数据仓库的方案，说明如下：

（1）使用Oracle数据库，通过Oracle RAC实现数据库的高可用性；

（2）在数据仓库的建设过程中同步制定相关的数据标准，以及设计对应的数据标准接口，由源系统按数据标准要求实现标准转换后，再将已实现标准转换的数据供给数据仓库进行处理；

（3）由于数据标准已在源系统落地，数据仓库内部的层级只设计4层，与传统数据仓库的5层结构有所区别；

（4）ETL过程与传统数据仓库方案一致，通过统一调度服务实现ETL的调度。

3、归档数据仓库设计

归档数据仓库主要存储两大类数据，第一是来源于历史数据仓库的明细数据归档，该归档为结构化的数据，通过数据总线提供查询服务；第二是非结构化数据归档，针对对账单、报表等非结构化数据，可以通过数据总线进行查询。

归档数据仓库的总体架构设计如下图：

归档数据仓库架构设计

归档数据仓库的核心技术是利用开源的Hadoop集群及相应组件，提供数据库存储、文件存储、数据检索、分布计算等功能，同时在对外的应用层中封装数据交互接口、文件处理、文档检索、数据查询等常用功能，对外提供相应数据服务。

4、数据总线设计

数据总线功能要求上与企业服务总线（ESB）类似，因此采用企业服务总线类似的架构和技术实现，总体架构设计如下图：

数据总线架构设计

数据总线的架构说明如下：

（1）外部服务接口层

接收外部WebService请求，经过安全模块检查通过，发送报文消息给消息服务层，等待消息服务层返回响应交易报文消息，取回响应报文返回外部。

接受流量监控接口层流量进行控制。

（2）安全模块层

进行交易报文的检查，操作人员权限检查，系统安全检查。

（3）服务控制层

接收消息服务层指定消息队列消息，分拆请求报文，发出调用数据接口交易的消息给消息服务层，等待消息服务层返回消息，解析返回消息，组合成响应交易报文，发送响应消息报文至消息服务层。

接受流量监控服务层流量进行控制。

（4）消息服务层

接收消息服务层指定队列消息，转发至指定消息队列。对阻塞的消息进行缓存，并在适当时候重新载入消息队列。

（5）数据访问层

接收消息服务层指定消息队列消息，解析数据访问信息，调用指定的数据访问适配器，访问对应数据仓库，得到返回数据，组织成返回消息，发送至消息服务层。

接受流量监控访问层流量进行控制。

（6）流量控制模块

监控接口层、服务层、接口层的报文，依据设定的参数进行流量控制。超出流量的直接返回系统流量控制超出信息。

负载均衡在系统接近流量控制时，启动备机资源，进行负载均衡。

（7）公共模块

配置化管理、参数管理、文件管理。

▍五、混合数据仓库的应用

银行在2015年按照混合数据仓库的架构进行了可行性研究，并于当年按照混合架构启动了数据仓库项目，该项目于2016年5月完成建设，实现了混合架构中的数据总线、实时数据仓库、历史数据仓库的投产和实际应用。

在历史数据仓库的建设中，尝试了源系统落地数据标准，以标准接口向数据仓库供转换后数据的实施方式，目前已按该模式顺利完成了贷款类数据的数据标准制定及数据入仓，并对应完成了贷款类数据报送集市的投产应用，主要效果如下：

（1）由于入仓数据均在源系统进行标准转换，可通过该模式推动源系统建设中注重对数据标准落地执行，以应对传统数据仓库建设无法推动数据标准在全行各系统落地执行的难点；

（2）由于入仓的数据均已完成了数据标准转换，历史数据仓库的开发人员无需熟悉源系统数据结构，只需专注于业务数据的处理和应用本身，可降低开发人员的经验和能力要求，降低项目实施难度；

（3）源系统建设过程中的数据结构变更，只需在该源系统上对应调整标准转换逻辑，数据仓库及下游应用无需进行改造，可有效降低源系统数据变更的业务影响，并减少数据仓库及下游应用的成本投入。

混合型数据仓库架构的应用，不仅改变了数据仓库项目的实施方式和技术选型，更重要的是扩展了数据仓库的在实时数据和大数据两方面的服务能力，让数据仓库的应用不再局限于报表展示、分析决策等交易后的业务场景，而是可以直接为交易前、交易中的业务处理提供数据支持，进一步扩大了数据应用的价值体现。

欢迎关注我的公众号“商业智能研究”，私信回复“资料包”，即可领取大数据、数据中台、商业智能、数据仓库等6G精华资料！

DDD 洋葱架构才是 yyds！阿里大牛手记（DDD）领域驱动设计应对之道肥肥技术宅 java 架构数据库
虽然身为架构师，设计一个高质量的架构依然是复杂与困难的。简单来说，动用大量的资源只为了一套优质的三高架构并不正确，而是该在了解当前业务现状的情况下，创造出灵活、可维护、健硕能成长的。就拿近两年程序员行业饱受争议的DDD（领域驱动设计）来说，事实上，领域驱动设计的思维可以很好的解决企业的大型架构所遇到的绝大部分难题（理论层面至少是这样），例如上下映射，就可以在本质上把业务的架构模块解耦，最高程度做到
Perf-linux服务器性能测试进阶的小猫压测和性能测试 linux 运维 python
1.压测基础数据准备：压测的环境：2.压测时关注服务端性能内存：50%以下CPU：一般小于75%，平均每核CPU的load小于1网络带宽：磁盘：IO：数据库：JVM：小于80%fullGC频率：小于半小时一次响应时间：小于期望值20,30,50,100ms错误率：低于0.5‰如何做服务器压测-入门级-简书https://www.jianshu.com/p/0b1f2f3b4bbd实现一个简单的压测
常见问题This application failed to start because not Qt platform plugin could be initialized. 季截 qt qt 开发语言
ThisapplicationfailedtostartbecausenotQtplatformplugincouldbeinitialized.Reinstallingtheapplicationmayfixthisproblem.从qt安装目录将依赖dll和plugins下的文件夹放在可执行程序目录下
对领域驱动设计(DDD)的学习成果 huaishu 架构
领域驱动设计之领域模型2004年EricEvans发表Domain-DrivenDesign–TacklingComplexityintheHeartofSoftware（领域驱动设计），简称EvansDDD。领域驱动设计分为两个阶段：以一种领域专家、设计人员、开发人员都能理解的“通用语言”作为相互交流的工具，在不断交流的过程中不断发现一些主要的领域概念，然后将这些概念设计成一个领域模型；由领域模
jQuery和CSS3响应式网站导航幻灯片插件 �时过境迁，物是人非 jquery css3 前端
这是一款即实用又炫酷的jQuery和CSS3响应式网站导航幻灯片插件。该插件将幻灯片制作为网站的hero导航，在幻灯片中展示网站各主要板块的内容，使用户可以非常容易的了解网站的主要信息。在线演示下载该幻灯片插件是响应式的，幻灯片中可以嵌入图片背景、视频及文本信息。为了提高与用户的互动，幻灯片中将前后导航按钮替换为导航按钮。按钮和导航箭头的区别是：每个按钮是一个标题，它会提示用户该页幻灯片所对应的网
30秒知识快学插件指南瞿旺晟
30秒知识快学插件指南30_seconds_of_knowledgeGoogleChromeExtensionthatletsyougainnewdeveloperskills,everytimeyouopenaNewTab.项目地址:https://gitcode.com/gh_mirrors/30/30_seconds_of_knowledge项目介绍30秒知识快学是一款专为开发者设计的Goo
模板-富文本晓风残月Yuperman nginx 运维
博主介绍：大家好，我是想成为Super的Yuperman，互联网宇宙厂经验，17年医疗健康行业的码拉松奔跑者，曾担任技术专家、架构师、研发总监负责和主导多个应用架构。近期专注：RPA应用研究，主流厂商产品使用，开源RPA应用，包括UI.Vision、taskUI、taskt、OpenRpa、RobotFramework等技术范围：长期专注java体系，软件架构，DDD，多年java、golang、
【归属地】批量号码归属地查询按城市高速的分流，基于WPF的解决方案沉到海底去吧Go 号码归属地查询按城市高速分流批量号码归属地查询高速分流实现批量号码归属地查询批量手机号码归属地查询方法号码归属地查询与城市高速分流分流实现批量号码归属地查询技巧批量号码归属地查询按城市
在现代商业活动中，企业为了提高营销效果和资源利用效率，需要针对不同地区的市场特点开展精准营销。通过批量号码归属地查询并按城市分流，可以为企业的营销决策提供有力支持。短信营销：一家连锁餐饮企业计划开展促销活动，希望通过短信向潜在客户推广新菜品。企业收集了大量手机号码，通过批量号码归属地查询，将号码按城市进行分流。对于不同城市的客户，根据当地的消费习惯和市场需求，制定不同的营销短信内容。例如，在一线城
python 用matplotlib作图，报错not Qt platform plugin could be initialized aLagrange python bug
重装Pycharm后，用matplotlib画图ThisapplicationfailedtostartbecausenotQtplatformplugincouldbeinitialized.##标题背景：重新安装pycharm后使用matplotlib画图弹出错误窗口全程又没有调用过Pyside2或pyqt5.新建了一个Project,导入matplolib，运行一个最简单的程序importm
996引擎 -地图-动态创建副本地图笑虾 996引擎 996引擎
996引擎-地图-动态创建副本地图添加测试NPC效果参考资料添加测试NPCNPC面板--NPC入口函数functionmain(player)--获取玩家的用户名localUSERNAME=getconst(player,"$USERNAME"
使用Colpali架构掌握多模态RAG技术大模型之路 RAG RAG 多模态多模态RAG 检索增强生成 LLM
传统的LLM面临着“幻觉”问题，即它们可能生成听起来合理但实际上错误或未经证实的信息。为了解决这个问题，检索增强生成（RAG）模型应运而生。RAG（语义缓存：提升RAG性能的关键策略）通过将LLM的生成能力与外部知识检索系统相结合，实现了更准确、更可靠的输出。然而，传统的RAG主要局限于文本数据，无法充分利用多模态信息。为了应对这一挑战，多模态RAG应运而生，其中Colpali架构成为这一领域的佼
Flutter 新春第一弹，Dart 宏功能推进暂停，后续专注定制数据处理支持恋猫de小郭 Android开发 flutter android java
在去年春节，Flutter官方发布了宏（Macros）编程的原型支持，同年的5月份在GoogleI/O发布的Dart3.4宣布了宏的实验性支持，但是对于Dart内部来说，从启动宏编程实验开始已经过去了几年，但是从目前的推进趋势看，完全的宏功能支持并不理想，结论大概是：能用是能用，但是质量和性能都达不到一开始的预期。具体原来在于Dart的静态语言提前编译和有状态的热重载等方面，对于元编程而言，需要建
网络安全之云架构南卿安全云服务架构
云架构的发展史阶段一：传统基础设施构建阶段背景：以前构建系统的时候，需要购买设备，租用数据中心机柜，然后搭建基础设施。特点：在这个阶段，构建系统需要购买大量的硬件设备，租用数据中心机柜，并手动搭建基础设施。这种方式不仅成本高昂，而且灵活性差，难以适应快速变化的市场需求。限制：资源利用率低，扩展性差，难以满足大规模、高并发的业务需求。阶段二：虚拟化技术阶段背景：随着处理器的不断进化，虚拟机出现了。它
数控领域 - NC（Numerical Control，数控）极简理解我命由我12345 行业 -简化概念数控自动化行业职场和发展职场发展求职招聘需求分析
NC概述NC全称是NumericalControl，即数控NC是一种通过数字化信号控制机床或其他制造设备的技术NC利用计算机或专用控制器执行预编程指令，实现自动化加工NC的特点硬件控制：NC系统依赖于硬件控制器，通常不具备编程和存储能力介质存储：加工程序存储在穿孔纸带或磁带上，修改程序需要重新制作介质功能有限：NC系统的功能较为简单，通常只能执行基本的加工任务精度较低：由于硬件限制，NC系统的加工
Webpack 模块加载、动态引入机制源码解读 AIGC小陈正则表达式 javascript 开发语言 react.js 前端
今天的文章简单探讨一下Vue和React的不同。本人Vue2和React都用过，但不熟悉Vue3，没用它做过项目。其实我对这两大框架也没有认真钻研过它们的细节，也就是工作上用它们写一些简单业务，或偶尔看看相关的博客文章，但还是有一些浅显的认识的，写下来记录一下。Vue和React都是用于构建UI界面的流行框架。它们的哲学也有很多相似的地方，我们可以认为这些特性是流行前端框架的一个趋势。它们是：组件
词汇积累之去媚、祛魅极简理解我命由我12345 中文 -词汇积累学习学习方法笔记经验分享生活其他
去媚去除或摆脱媚态、媚俗、媚上的行为强调独立自主，拒绝讨好或迎合他人，不随波逐流，不盲目跟风“去媚”通常与“巴结”等贬义词相对应祛魅去除或消除某种事物或现象的神秘感、魅力、吸引力，使其变得不再神秘或引人入胜强调摆脱对某种事物或现象的迷恋和崇拜，对其重新认识或评价也可写作“去魅”
tf.Keras (tf-1.15)使用记录4-model.fit方法及其callbacks参数普通攻击往后拉 NN技巧 tf.keras keras 人工智能深度学习
model.fit()方法是TensorFlowKeras中用于训练模型的核心方法。其中里面的callbacks参数是实现模型保存、监控、以及和tensorboard联动的重要API1model.fit()方法的参数及使用必需参数x:训练数据的输入。可以是NumPy数组、TensorFlowtf.data.Dataset、Python生成器或keras.utils.Sequence实例。y:训练数
macbook自带python保存文件夹_在mac下查找python包存放路径site-packages的实现方法在Mac系统下python如何安装第三方函数库?... Charnychi
mac怎么查看python的site-package位置世界上最伤心的事，不是你爱的人不爱你，而是他爱你过后，最后却不爱你。可以通过find命令查看，参考demo如下：sudofind/-name"site-package"小编们总是对最亲近的家人视而不见，甚至还有许多抱怨，却对外人”的一点小惠感激不已。mac自带的python安装在/usr/bin/python目录下进入终端直接键入python
Python 框架之 Anaconda 下 Django 环境的快速搭建与验证的相关说明仙魁XAN python python anaconda django
Python框架之Anaconda下Django环境的快速搭建与验证的相关说明目录Python框架之Anaconda下Django环境的快速搭建与验证的相关说明一、简单介绍二、实现原理三、环境四、涉及命令五、搭建具体步骤1、打开AnacondaNavigator2、Create构建一个环境，选择自己需要的python版本即可3、AnacondaPrompt打开命令行操作4、condainfo--e
探索前端可观察性：如何使用Telemetry提高用户体验桂月二二前端 ux
随着前端应用变得日益复杂，可观察性（Observability）在前端开发中的重要性正逐步显现。通过实现Telemetry（遥测）功能，开发者能够收集、分析应用的运行数据，从而更好地了解用户行为、定位问题，并持续优化用户体验。什么是Telemetry？**Telemetry（遥测）**是指通过自动化手段远程采集系统或应用运行时的状态数据和行为信息。这些数据通常包括性能指标、错误日志、用户交互事件等
while循环 Along丶WG #Java 基础 java
介绍语法：循环变量初始化；while(循环条件){循环体；循环变量迭代;}while也有四要素，只是四要素的位置和for不一样。代码演示publicstaticvoidmain(String[]args){//输出10次Hello,World!inti=1;//循环变量初始化while(i=40&&k<=endNum2){if(k%2==0){System.out.println(k);}k++;
修改当前Git仓库的地址、用户名、密码 Along丶WG 中间件 Linux git
1.修改仓库地址gitremoteset-urlorigin新的仓库地址2.修改用户名和密码2.1修改用户名和密码1分两步操作：修改用户名：gitconfig--globaluser.name"YourNewName"修改密码：如果是HTTPS访问方式，并且需要修改密码，可以通过Git凭据存储区（credentialstorage）来更新密码。gitconfig--globalcredential
解决：npm : 无法加载文件 D:\Node\node_global\npm.ps1，因为在此系统上禁止运行脚本小李搬砖 npm 前端 node.js
1.原因有一次下载了pnpm并配置环境后，不知道是不是配置环境的时候操作错了还是其他什么原因。再次打开一个项目使用npm或pnpm命令的时候就报错了。首先理解一下报错信息的意思，无法加载npm下载时文件存放的路径（D:\Node\node_global）下的npm.ps1这个文件，打开一看是关于执行在powershell上，node环境下执行npm相关命令的脚本，当我们使用npm命令的时候，操作系
解决 npm install 卡住不动或执行失败 XT4625 npm 前端 node.js
近期Vue项目在执行npminstall时，总是出现特别慢，等半天结果执行失败更换NPM源，使用国内的镜像源可以显著提高下载速度。例如，可以使用淘宝的NPM镜像npmconfigsetregistryhttps://registry.npmmirror.com/npmconfiggetregistry确认是否生效清理缓存，有时候缓存中的数据可能会导致问题，清理缓存后重新安装可能有助于解决问题npm
SQLAlchemy 介绍与实践 cliffordl python python 数据库
postgresql实践pydantic实践1.SQLAlchemy介绍SQLAlchemy是一个ORM框架。SQLAlchemy是一个用于Python的SQL工具和对象关系映射（ORM）库。它允许你通过Python代码来与关系型数据库交互，而不必直接编写SQL语句。简单介绍一下对象关系映射吧，对象关系映射（英语：ObjectRelationalMapping，简称ORM，或O/RM，或O/Rma
python dist-packages 和 site-packages ECHOutopia linux python site-packages dist-packages ubuntu python
dist-packages和site-packages在我的ubuntu12上都在/usr/local/lib/python2.7目录下今天安装django时发现一个奇怪的现象：我使用pipinstallDjango==1.8.4安装的django，安装成功，直接在终端使用django-admin也成功，但是进入python：importdnango，却提示nomodulenameddjango，
FastDFS实用笔记（Docker 搭建环境 + 整合 SpringBoot）字节全栈_kYu 笔记 docker spring boot
解决了大容量存储和负载均衡的问题，特别适合中小文件（4KB>文件路径为空…”);return“文件路径不能为空”;}try{StorePathstorePath=StorePath.parseFromUrl(fileUrl);storageClient.deleteFile(storePath.getGroup(),storePath.getPath());}catch(Exceptione){l
MySQL基础学习总结（二）_select round(3 字节全栈_kYu mysql 学习数据库
|abc ||abc ||abc ||abc ||abc ||abc ||abc ||abc ||abc ||abc |+---------+selectabcfromemp;ERROR1054(42S22):Unknowncolumn'abc'in'fieldlist'这样肯定报错，因为会把abc当做一个字段的名字，去emp表中找abc字段去了。**结论：select后面可以
Java高级：mysql创建用户密码字节全栈_kYu java mysql 开发语言
为查询缓存优化你的查询EXPLAIN你的SELECT查询当只要一行数据时使用LIMIT1为搜索字段建索引在Join表的时候使用相当类型的例，并将其索引千万不要ORDERBYRAND()避免SELECT*永远为每张表设置一个ID使用ENUM而不是VARCHAR从PROCEDUREANALYSE()取得建议尽可能的使用NOTNULLPreparedStatements无缓冲的查询把IP地址存成UNSI
Hadoop的基础操作_hadoop常用操作字节全栈_kYu hadoop eclipse 大数据
####下载文件语法：hadoopfs-gethadoopfs-copyToLocal示例：将user/text.txt文件下载到本地/usr/local/下-copyToLocal：复制到本地[root@master~]#hadoopfs-copyToLocal/user/text.txt/usr/local/[root@master~]#cd/usr/local/[root@masterloc
mongodb3.03开启认证 21jhf mongodb
下载了最新mongodb3.03版本，当使用--auth 参数命令行开启mongodb用户认证时遇到很多问题，现总结如下：（百度上搜到的基本都是老版本的，看到db.addUser的就是，请忽略） Windows下我做了一个bat文件，用来启动mongodb，命令行如下： mongod --dbpath db\data --port 27017 --directoryperdb --logp
【Spark103】Task not serializable bit1129 Serializable
Task not serializable是Spark开发过程最令人头疼的问题之一，这里记录下出现这个问题的两个实例，一个是自己遇到的，另一个是stackoverflow上看到。等有时间了再仔细探究出现Task not serialiazable的各种原因以及出现问题后如何快速定位问题的所在，至少目前阶段碰到此类问题，没有什么章法 1. package spark.exampl
你所熟知的 LRU(最近最少使用) dalan_123 java
关于LRU这个名词在很多地方或听说，或使用，接下来看下lru缓存回收的实现 1、大体的想法 a、查询出最近最晚使用的项 b、给最近的使用的项做标记通过使用链表就可以完成这两个操作，关于最近最少使用的项只需要返回链表的尾部；标记最近使用的项，只需要将该项移除并放置到头部，那么难点就出现你如何能够快速在链表定位对应的该项？这时候多
Javascript 跨域周凡杨 JavaScript jsonp 跨域 cross-domain
linux下安装apache服务器 g21121 apache
安装apache 下载windows版本apache，下载地址：http://httpd.apache.org/download.cgi 1.windows下安装apache Windows下安装apache比较简单，注意选择路径和端口即可，这里就不再赘述了。 2.linux下安装apache：下载之后上传到linux的相关目录，这里指定为/home/apach
FineReport的JS编辑框和URL地址栏语法简介老A不折腾 finereport web报表报表软件语法总结
JS编辑框： 1.FineReport的js。作为一款BS产品，browser端的JavaScript是必不可少的。 FineReport中的js是已经调用了finereport.js的。大家知道，预览报表时，报表servlet会将cpt模板转为html，在这个html的head头部中会引入FineReport的js，这个finereport.js中包含了许多内置的fun
根据STATUS信息对MySQL进行优化墙头上一根草 status
mysql 查看当前正在执行的操作，即正在执行的sql语句的方法为: show processlist 命令 mysql> show global status;可以列出MySQL服务器运行各种状态值，我个人较喜欢的用法是show status like '查询值%';一、慢查询mysql> show variab
我的spring学习笔记7-Spring的Bean配置文件给Bean定义别名 aijuans Spring 3
本文介绍如何给Spring的Bean配置文件的Bean定义别名？原始的 <bean id="business" class="onlyfun.caterpillar.device.Business"> <property name="writer"> <ref b
高性能mysql 之性能剖析 annan211 性能 mysql mysql 性能剖析剖析
1 定义性能优化 mysql服务器性能，此处定义为响应时间。在解释性能优化之前，先来消除一个误解，很多人认为，性能优化就是降低cpu的利用率或者减少对资源的使用。这是一个陷阱。资源时用来消耗并用来工作的，所以有时候消耗更多的资源能够加快查询速度，保持cpu忙绿，这是必要的。很多时候发现编译进了新版本的InnoDB之后，cpu利用率上升的很厉害，这并不
主外键和索引唯一性约束百合不是茶索引唯一性约束主外键约束联机删除
目标;第一步;创建两张表用户表和文章表第二步;发表文章 1,建表; ---用户表 BlogUsers --userID唯一的 --userName --pwd --sex create
线程的调度 bijian1013 java 多线程 thread 线程的调度 java多线程
1. Java提供一个线程调度程序来监控程序中启动后进入可运行状态的所有线程。线程调度程序按照线程的优先级决定应调度哪些线程来执行。 2. 多数线程的调度是抢占式的（即我想中断程序运行就中断，不需要和将被中断的程序协商） a)
查看日志常用命令 bijian1013 linux 命令 unix
一.日志查找方法，可以用通配符查某台主机上的所有服务器grep "关键字" /wls/applogs/custom-*/error.log 二.查看日志常用命令1.grep '关键字' error.log：在error.log中搜索'关键字'2.grep -C10 '关键字' error.log：显示关键字前后10行记录3.grep '关键字' error.l
【持久化框架MyBatis3一】MyBatis版HelloWorld bit1129 helloworld
MyBatis这个系列的文章，主要参考《Java Persistence with MyBatis 3》。样例数据本文以MySQL数据库为例，建立一个STUDENTS表，插入两条数据，然后进行单表的增删改查 CREATE TABLE STUDENTS ( stud_id int(11) NOT NULL AUTO_INCREMENT,
【Hadoop十五】Hadoop Counter bit1129 hadoop
1. 只有Map任务的Map Reduce Job File System Counters FILE: Number of bytes read=3629530 FILE: Number of bytes written=98312 FILE: Number of read operations=0 FILE: Number of lar
解决Tomcat数据连接池无法释放 ronin47 tomcat 连接池　优化
近段时间，公司的检测中心报表系统(SMC)的开发人员时不时找到我，说用户老是出现无法登录的情况。前些日子因为手头上有Jboss集群的测试工作，发现用户不能登录时，都是在Tomcat中将这个项目Reload一下就好了，不过只是治标而已，因为大概几个小时之后又会再次出现无法登录的情况。今天上午，开发人员小毛又找到我，要我协助将这个问题根治一下，拖太久用户难保不投诉。简单分析了一
java-75-二叉树两结点的最低共同父结点 bylijinnan java
import java.util.LinkedList; import java.util.List; import ljn.help.*; public class BTreeLowestParentOfTwoNodes { public static void main(String[] args) { /* * node data is stored in
行业垂直搜索引擎网页抓取项目 carlwu Lucene Nutch Heritrix Solr
公司有一个搜索引擎项目，希望各路高人有空来帮忙指导，谢谢！这是详细需求：（1）通过提供的网站地址(大概100-200个网站)，网页抓取程序能不断抓取网页和其它类型的文件（如Excel、PDF、Word、ppt及zip类型），并且程序能够根据事先提供的规则，过滤掉不相干的下载内容。（2）程序能够搜索这些抓取的内容，并能对这些抓取文件按照油田名进行分类，然后放到服务器不同的目录中。
[通讯与服务]在总带宽资源没有大幅增加之前,不适宜大幅度降低资费 comsci 资源
降低通讯服务资费，就意味着有更多的用户进入，就意味着通讯服务提供商要接待和服务更多的用户，在总体运维成本没有由于技术升级而大幅下降的情况下，这种降低资费的行为将导致每个用户的平均带宽不断下降，而享受到的服务质量也在下降，这对用户和服务商都是不利的。。。。。。。。 &nbs
Java时区转换及时间格式 Cwind java
本文介绍Java API 中 Date, Calendar, TimeZone和DateFormat的使用，以及不同时区时间相互转化的方法和原理。问题描述：向处于不同时区的服务器发请求时需要考虑时区转换的问题。譬如，服务器位于东八区（北京时间，GMT+8:00），而身处东四区的用户想要查询当天的销售记录。则需把东四区的“今天”这个时间范围转换为服务器所在时区的时间范围。
readonly,只读，不可用 dashuaifu js jsp disable readOnly readOnly
readOnly 和 readonly 不同，在做js开发时一定要注意函数大小写和jsp黄线的警告！！！我就经历过这么一件事：使用readOnly在某些浏览器或同一浏览器不同版本有的可以实现“只读”功能，有的就不行，而且函数readOnly有黄线警告！！！就这样被折磨了不短时间！！！（期间使用过disable函数，但是发现disable函数之后后台接收不到前台的的数据！！！）
LABjs、RequireJS、SeaJS 介绍 dcj3sjt126com js Web
LABjs 的核心是 LAB（Loading and Blocking）：Loading 指异步并行加载，Blocking 是指同步等待执行。LABjs 通过优雅的语法（script 和 wait）实现了这两大特性，核心价值是性能优化。LABjs 是一个文件加载器。RequireJS 和 SeaJS 则是模块加载器，倡导的是一种模块化开发理念，核心价值是让 JavaScript 的模块化开发变得更
[应用结构]入口脚本 dcj3sjt126com PHP yii2
入口脚本入口脚本是应用启动流程中的第一环，一个应用（不管是网页应用还是控制台应用）只有一个入口脚本。终端用户的请求通过入口脚本实例化应用并将将请求转发到应用。 Web 应用的入口脚本必须放在终端用户能够访问的目录下，通常命名为 index.php，也可以使用 Web 服务器能定位到的其他名称。控制台应用的入口脚本一般在应用根目录下命名为 yii（后缀为.php），该文
haoop shell命令 eksliang hadoop hadoop shell
cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge get getmerge ls lsr mkdir movefromLocal mv put rm rmr setrep stat tail test text
MultiStateView不同的状态下显示不同的界面 gundumw100 android
只要将指定的view放在该控件里面，可以该view在不同的状态下显示不同的界面，这对ListView很有用，比如加载界面，空白界面，错误界面。而且这些见面由你指定布局，非常灵活。 PS：ListView虽然可以设置一个EmptyView，但使用起来不方便，不灵活，有点累赘。 <com.kennyc.view.MultiStateView xmlns:android=&qu
jQuery实现页面内锚点平滑跳转 ini JavaScript html jquery html5 css
平时我们做导航滚动到内容都是通过锚点来做，刷的一下就直接跳到内容了，没有一丝的滚动效果，而且 url 链接最后会有“小尾巴”，就像#keleyi，今天我就介绍一款 jquery 做的滚动的特效，既可以设置滚动速度，又可以在 url 链接上没有“小尾巴”。效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/37.htmHTML文件代码： &
kafka offset迁移 kane_xie kafka
在早前的kafka版本中（0.8.0），offset是被存储在zookeeper中的。到当前版本（0.8.2）为止，kafka同时支持offset存储在zookeeper和offset manager（broker）中。从官方的说明来看，未来offset的zookeeper存储将会被弃用。因此现有的基于kafka的项目如果今后计划保持更新的话，可以考虑在合适
android > 搭建 cordova 环境 mft8899 android
1 , 安装 node.js http://nodejs.org node -v 查看版本 2, 安装 npm 可以先从 https://github.com/isaacs/npm/tags 下载源码解压到
java封装的比较器，比较是否全相同，获取不同字段名字 qifeifei
非常实用的java比较器，贴上代码： import java.util.HashSet; import java.util.List; import java.util.Set; import net.sf.json.JSONArray; import net.sf.json.JSONObject; import net.sf.json.JsonConfig; i
记录一些函数用法 .Aky. 位运算 PHP 数据库函数 IP
高手们照旧忽略。想弄个全天朝IP段数据库，找了个今天最新更新的国内所有运营商IP段，copy到文件，用文件函数，字符串函数把玩下。分割出startIp和endIp这样格式写入.txt文件，直接用phpmyadmin导入.csv文件的形式导入。（生命在于折腾，也许你们觉得我傻X，直接下载人家弄好的导入不就可以，做自己的菜鸟，让别人去说吧）当然用到了ip2long()函数把字符串转为整型数
sublime text 3 rust wudixiaotie Sublime Text
1.sublime text 3 => install package => Rust 2.cd ~/.config/sublime-text-3/Packages 3.mkdir rust 4.git clone https://github.com/sp0/rust-style 5.cd rust-style 6.cargo build --release 7.ctrl

传统数仓不够怎么办？不妨看看这个银行的混合数仓实践，建议收藏

你可能感兴趣的:(传统数仓不够怎么办？不妨看看这个银行的混合数仓实践，建议收藏)