cuanshouying2016

数据仓库心得

一、为什么要推动data warehouse

自然演化体系会带来很多的问题：

1、数据可信性（两个部门提供的数据是不一样的，让管理者无所适从）；

a、时间的基准不一；b、算法差异；（认知不一致）c、无公共的起始数据源

要靠推动data warehouse使各部门之间对相同元素认知、定义和算法一致或者趋于一致；

2、报表的生产率的问题；由于oltp的单项系统导致数据的分散性和相同元素定义不一致所致；

3、oltp的系统中无法保留很久的历史数据；单项系统之间保留的历史数据时间范围不一致；无法满足dss分析的需要；

4、oltp的单项系统中对维表的关键栏位的更改很少有记录；（如：客户的业务员的变更问题）

5、面向应用的设计无法满足面向主题的分析的需求；oltp和dw对后台设计要求的重点不同，oltp主要在意的是update和insert，而dw主要在意的是select；

6、因为决策的需求大多是“灵光一现”的，是“前无古人”，“后无来者”的，是启发式的，而非固定式的；

7、分散的系统导致业务行为不可控，dw能够对各地的业务行为进行事后的监控；（如：产品代号，折让的问题）；

8、dw能够把user从复杂的统计工作中解放出来，从而提升企业的管理，让user有时间从事对企业更有益的事情。还可以精简企业的人员；

9、降低企业获取信息的费用；提高企业的决策速度，加快企业对市场的反应能力；

10、没有dw，IT部门总是处在鞭梢的位置，总是在被动的响应状态；（因为主管感兴趣的事情总是不时的变化的）；

11、可以透过dw来观察公司的新的政策或者新的行销活动给公司带来的变化；(事件映射)

12、dw是EIS和数据挖掘的基础；

二、推动以前IT人员要有的观念

1、首先满足用户的需求，再在用户使用过程中去引导用户朝正确的方向走；

2、老板看的投资回报；

3、永远比user考虑的明细；因为管理是一步步精细的；

4、dw是反复才能建成的，所以dw的版本要不停的迭代开发；

5、olap 软件可以是dw的组成部分，但不是必选的，大多的olap的软件数据库是多维的，从dw中把资料刷新至多维的数据库中会比较慢，但对多维的数据库查询起来速度必二维的速度快的多；所以是要根据user需求来进行合理的选择；

6、前端的展现工具一定要有向上和向下钻取的功能；

三、和老板沟通的观念

1. dw不可能满足所有的需求，Data warehouse 项目同样需要界定边界；

2. 同样的资料，角度不同（如财务，销售，市场，管理），结果就不一致，所以允许差异的存在，但差异要在可解释的范围内；通过定义不同的规则来玩这个游戏；

3. 问题的关键不在工具的好坏，而在于资料的可信度，原始数据和业务行为的规范；

4. 业务术语的定义和解释应由专门的单位来处理，从而保证集团自上至下的对术语定义的一致性；

（如销售业务行为中“铺货率”的定义）

5. 企业高层的支持非常重要；

6. 公司内的oltp系统数据是动态的，总是在变的，所以dw中的数据也会随之变化，dw中昨天看到的数据和今天看到看到的不一样，不要大惊小怪；

7. dw是用来做趋势分析、预测和提供数据挖掘的，对数据的要求不是非常精确，所以千万不要拿dw中的数据来计算sales的奖金；

8. 集团上下对为什么要推动dw及dw的作用的认知一致是非常重要的；

9. 最终用户专业化，要花很多的时间对end user进行培训，提高user的认知，最终的目标是user自己设计报表；当然是在前端，而不是在“厨房”(后台)中；

10．软件选择宜横向联合，强强联手，不是一家的软件可以搞定一切的；

四、dw设计模式和方法

1．dw应建立在RDBMS(关系型数据库)中，而dm可以建立在一个RDBMS或者MDDB(多维数据库)中；

2．dm采用星型设计是原则，雪花模型是可选的；

3．dw的设计模式和oltp的设计模式不一样的，oltp的设计模式是以需求为驱动的，而dw的设计模式是以数据为驱动（分析处理为驱动）的；

4．面向主题的设计，数据从操作型的环境流入dw中时，数据必须是集成的，而不仅仅是将数据扔到dw中；

5．一次开发一个主题的原则；

6．在dm中逆规范化的设计是必要的，以空间的冗余换取响应速度的加快；

7．遵循给“用户想要的东西，然后用户才能告诉你需求是什么”的发现模式来开发，成功的关键在于结构设计人员和dss分析人员（user）之间的反馈循环, 迭代开发的模式；

8．开发流程：首先应建立企业数据模型（描述企业的信息需求，明确了企业主要的主题域，不一定是企业已有的东西，不考虑任何的技术问题）→ 分解至中间层模型→ 定义记录系统（数据源的定义） → 设计数据仓库→ 设计oltp与dw之间的接口；

9．5％的dss处理的需求在原子层，95％的在概要层；（查询分离的设计）；

10．从fact表开始设计，然后开始设计dimension表；维表的设计要逆规范化，事实表的设计要3nf；

11．弹性的设计（建立规则库，通过规则解析引擎解释规则至最小的粒度的设计）

12．资料可信度的设计；

13．规则库和规则转换设计；

14．各地的对相同的栏位定义不一致（如：有的地方用0和1表示男女，有的地方用m和f表示男女）没有关系，但dw中的定义要一致，通过清洗程式转换成dw中的规则；

15．有限的使用的代理健；

16．有限的使用外健来保证参照完整性；可以使用procedure检查；

17． Slowly changing dimension（慢速变化维）表的处理：不要使用oltp系统中的business key（业务健）作为维表的primary key（主健），而使用代理健，当慢速变化维的关键栏位发生变化时，不要update原来的记录，而插入一条新的记录；这样能够dw不会出现错误而且可以跟踪维的历史；

18．字段级映射（field level mapping）一定要建立;

19．集团总部dw的资料可以回流至各分公司的数据库中，这样可以灵活的处理需求，一致的需求，总部处理，特殊需求，各地处理；

20．dw中无论是fact table还是dimension table，强烈建议给每条记录加上时间戳；

五、粒度的选择

1、资料的粒度级别需要权衡，采用多重粒度的设计；在磁盘允许的情况下，建议尽可能的按最细粒度存储数据；因为dw中存储的粒度越细，dw回答问题的能力就越强；要先估算事实表的行数（一年内的最少行数和最多行数乘以字段长度）

2、对于不活跃的数据可以分离（至磁带或者备份的磁盘上）；减轻dw刷新和管理的难度；

3、dw的特性之一，表现为汇总数据还是细节数据是由观察者的不同角度决定的；

六、dw的安全

1、根据user的不同的权限看到的数据也不一样；

2、数据库放在内网的是原则；

3、通过profile限制并行的用户数；

4、在brio server中限制帐号一个月不使用者封帐号（更改密码为当天的日期）；

5、装载阶段限制ip和user登陆（通过trigger）；

七、dw 性能增强方案和oracle的技术的运用

1、可以使用的技术有：materialized view（物化视图），星型查询，专用大回退段, QUERY REWRITE(查询重写),partition table，organization index table（索引组织表），PARALLEL（并行）

2、充分的index，建立必要的概要表（summary table），大表必须分区，query rewrite和mv均可大大提高dw

的性能；

3、小技巧：加载前drop一些index以提高加载的性能，加载完毕后重建index；还可以通过view来实现和简化查询重写；

4、oracle优化模式rbo和cbo的选择：建议尽量使用cbo；

5、作为数据仓库的后台数据库，oracle的安装方式和init参数的是有别于oltp系统的后台的数据库；

6、加载阶段和访问阶段采用不同的参数设置来启动db；

7、访问阶段使db只读，减少db的本身的管理损耗；

8、由于dw特性，不用在数据块上保留很多的自由空间用于以后的记录的更新和插入；

9、修改os的参数，如：加大os的串行预读参数，异步io，甚至修改cpu的时间片；

10、磁盘阵列的选择：条件允许的情况下建议raid01；

八、规则库的定义和设计

1、业绩公式规则；

2、单位对资料可信度影响的权数的规则；

3、业绩归属的定义；

4、上级组织在不同的角度是不同的（如：财务和销售）

九、dw运用的％

2％的bpm、kpi的管理；3％的数据挖掘；15％的数据分析；80％的report；

十、让我头疼的几个问题及解决方法

1、由于是从分散的系统中抽取资料，所以各个公司相同的系统中基本资料中对基本数据定义可能会不一样；如：A这个产品代号在华东表示冰红茶，在华南可能表示冰绿茶；抽取至dw中的数据失去可比性；

我的对策：

a、如果是关键性的基本资料，在集团总部和各个公司建立一个公共系统（PUB），把各系统基本资料抽取出来，并规划出哪些栏位是总部必须要控管的，然后放入PUB系统在集团总部控管，所有系统的基本资料的总部控管栏位的来源只有从PUB系统中来，集团总部有修改和新增的权利，下属各公司只有查询的权利，下属各公司如要新增和修改必须至总部申请；对于非总部控管的栏位各公司可以自己更改；PUB系统的table资料定期的同步至各公司的数据库中；

b、如果是非关键性的基本资料，建立对照表翻译成dw中的定义；只不过抽取程序设计会麻烦一点；

2、业务的术语定义集团内没有共识；

如：华东区认为销售铺货率应该这样计算，而东北区认为应该那样计算，而集团总部又是一种说法；

我的对策：请集团的高层建立或者指定相关的权威部门协调各方并给出标准的定义；不要迁就于各分公司的不同的算法而客制出不同的报表，那样只会让各分公司看到的报表数据失去可比性且让各方因为数据的问题吵的不可开交；

3、由于lotp系统老化且分散在各分公司中，所以导致各分公司相同的系统其中的运行的逻辑会有差异，相同的table相同的栏位存储的数据计算规则不一致；

我的对策：没有什么好的方法，要修改老化的系统使大家一致不太实际；因为会牵涉的系统的太多，并且老的语言精通的人不多，如果修改不知道会发生不可预测的问题；

所以我只有请各公司了解自己的规则并填入我们规划的规则库，我们的抽取程序依照规则库中的规则来抽取，并且各分公司的规则更改时，也请他们更新规则库；

4、各分公司IT部门以前替各自分公司的开发的类似dw系统在使用并且数据可能会与总部的dw中数据不一致，各分公司对集团总部推的dw系统有抗拒心理；

我的对策：首先请集团的高层向各分公司做说服，并且向集团的高层申请“上方宝剑”，其次通过dw的资料回流至各分公司数据库，使各分公司的自己开发的类似的系统的数据源来源于dw中，这样就把集团总部和各分公司捆绑在一起；

5、dw中资料刷新的问题，因为oltp系统的可变性，导致抽取程序在从oltp系统中抽取资料时不知道应该扫描哪些资料，oltp哪些资料自上次抽取后被更新了(变化数据捕获的问题)；

我的对策：这个应该是所有的做dw项目均会碰到的问题；

a、如果抽取的table是比较小的table，在不影响可以oltp系统性能的情况下，可以在oltp的系统的table 上加入trigger来记录更新；抽取程序可以根据记录来只抽取更新的记录；如果加trigger有困难，每次把table的全部资料抽取回来也可；

b、上面的方法只能解决小部分的问题，大部分是要通过时间戳的比较，或者充分理解oltp系统的规则，如oltp系统不会更改多久以前资料，oltp系统是否有结转的概念，如果要更改已结转的资料是不是在什么地方有记录之类；根据具体情况具体解决；我现在负责的这个项目的销售这一块在oltp系统中有结转的概念，如果要更改已结转的资料必须要进行结转回复；所以我们在设计抽取程序时有一个抽取记录的table，用来记录该分公司的销售系统资料日期、该日是否已结转、抽取的次数等等；并且要求oltp系统中日结的程序加入，如果做日结回复必须update抽取记录的table其中的抽取次数为0；我们的抽取规则就是：抽取抽取次数为0的日期的资料，但未日结的资料不管次数为多少均抽取；抽取完毕后update该table相关栏位；

十一、其他

1、后台的程式执行出错时，log记录至table中；并自动发出mail通知相关的人；

2、执行成功，成功的记录至succmsg中；

来自 “ ITPUB博客 ” ，链接：http://blog.itpub.net/10979666/viewspace-675354/，如需转载，请注明出处，否则将追究法律责任。

转载于:http://blog.itpub.net/10979666/viewspace-675354/

数据仓库——维度表一致性墨染丶eye 背诵数据仓库
数据仓库基础笔记思维导图已经整理完毕，完整连接为：数据仓库基础知识笔记思维导图维度一致性问题从逻辑层面来看，当一系列星型模型共享一组公共维度时，所涉及的维度称为一致性维度。当维度表存在不一致时，短期的成功难以弥补长期的错误。维度时确保不同过程中信息集成起来实现横向钻取货活动的关键。造成横向钻取失败的原因维度结构的差别，因为维度的差别，分析工作涉及的领域从简单到复杂，但是都是通过复杂的报表来弥补设计
如何在心上用功？余超林AIA财富管家
思考：如何在心上用功？学习心得：心-道-德-事的理解心-道-德-事这四部曲，本质上就是一个人的思维智慧的四个层面：事是最底层，这是所有人在这个社会谋求生存的基础，一个人能够把事情彻底做好，保质保量的完成，才会有真正的结果，但是这个层面要获得真正成功很困难，因为会做事的人很多，最终会出现恶性竞争；德是第三层，如果说整个社会做事的竞争激烈程度为100%，那么上升到德上的竞争激烈程度降低为80%，德是一
2022-05-22光印随思60学习要与现实打通无名之米8
20220522光印随思60学习要与现实打通今天在匆忙中完成了新网师课程的第七次预习作业。每次完成预习作业的过程都是一次艰难的学习，先要学习相关的文本和文件，了解作业需要的理论知识，之后需要把理论知识运用于实际工作和生活中。这也是学习的真正价值所在。在很多时候，会有这样的感觉，读了很多书为什么没有啥长进？现在回想应该就是，当只有阅读和感受，没有把阅读心得转化为文字，没有把阅读的知识运用到实际的场景
2021-10-22 c6a82911a6e5
致良知线上正心班学习第11天时间：2021年10月21日姓名：李克聪地区：山东淄博志愿：修己度人，自省利他｜当｜下｜即｜未｜来｜【自省利他致良知】今日功课1、读原文✔：2分2、准时交功课✔：2分3、日行一善✔：2分4、每日自省✔：2分（1）时刻保持恩悲敬（2）不抱怨，不说谎5、读书践行心得✔:2分菩萨为因，凡夫为果，因上努力，成果必达。自然的规律是天道，人和自然的规律是一样的。我们平时经常讲做人做
大模型训练数据库Common Crawl WindyChanChan 数据集语言模型数据库
CommonCrawl介绍‌‌CommonCrawl是一个非营利组织，致力于通过大规模分布式爬虫系统定期抓取整个Web并将其存储在一个可公开访问的数据库中。CommonCrawl的数据收集和处理过程包括使用Python开源爬虫工具收集全球范围内的网站数据，并将其上传到‌CommonCrawl基金会的数据仓库中。该项目从2008年开始，至今已经积累了大量的原始网页数据、元数据和文本提取数据。这些数据
你一定可以，遇见更好的自己随心予一
遇见更好的自己你总要学会一个人选择一个人，不代表选择了孤独一个人吃饭，也可以很有仪式感一个人看电影，分析写影评一个人阅读，鉴赏写心得一个人逛街，随心而行图片发自App遇见更好的自己就是选择最惬意的仪式感就是选择以最肆意的方式拥抱青春。特别喜欢的一本书《摆渡人》里面有一句话:“如果我真的存在，也是因为你需要我”但是现在的我不是很赞同遇见更好的自己前提是你要找到你自己自爱，自先沉稳，而后爱人图片发自A
息县一中第二期心理咨询培训第四组分享第五天 bcf0473e009c
今天在组长的带领下我们一组6人在五楼小会议室进行了一次复盘学习，大家都发表了自己的学习心得，令我感触良多。经过第一次的学习，初次了解聚焦正向的含义，朱老师说的两句话让我印象很深“不以改变为目的，才有改变的机会”“关系大于方式，方式大于内容”遇到学生的问题时，不要想着上来就去改变他，对他的说教只会让他更加封闭自己，更不要想着会去改变他，要换种思维方式，试着把关系搞好，可以从兴趣爱好入手，打开他的内心
24营2组锋妈11月13日作业及阅读笔记锋妈
第一部分，听课心得在《时间管理目标模型课程》中，主要学到了如下四点：一、为什么要制定目标二、怎么样制定目标三、制定目标后要做些什么四、立刻行动起来听完后，对照讲课提纲，是自身的存在的弱点，觉着最大的绊脚石是第四点立刻行动起来。因为再宏伟的目标，再强大的驱动力下，如果没有行动去执行，一切都是空谈。为了避免执行力弱化，结合自己目前实际情况，觉着尽量把目标制定的简单明了、可执行、可衡量、可反馈回顾的。只
数据仓库介绍阿龙的代码在报错数据分析数据仓库数据库
数据仓库数据仓库的概念数据仓库的主要特征数据仓库的主流开发语言-sql结构化数据sql语句数据仓库的概念数据仓库（英语：DataWarehouse，简称数仓、DW）,是一个用于存储、分析、报告的数据系统。数据仓库的目的是构建面向分析的集成化数据环境，分析结果为企业提供决策支持（DecisionSupport）。就是数据仓库只分析数据并不产生数据数据仓库的主要特征1、面向主题主题是一个抽象的概念，是
心得随笔小记 GuangHui
1.人要想把一件事情做好，往往需要分两步，第一步是让自己处于可以把事情做好的状态，第二步才是把事情做好。当你不在状态，不想做事时，你此时需要做的不是硬着头皮继续做，而是应该调整一下姿势，做一些放松休息的事情，以让自己的状态重新在线。唯有这样，你才能持续做好一件事。2.遇见一个正确的远远高于你认知的人，就像是为自己的世界开了一个天窗一样。电视剧《天道》里面，肖亚文关于丁元英如是说，不求和他做朋友，但
在家学习的第73天—日更20天九肙
大家好，我是九肙，今天是我在家学习的第73天。来自网友在连续更文20天，昨天成功获得日更20日徽章。对自己来说，是一份极大的鼓励。因为自己在写作上不是天赋型的选手，加上自己情感不丰富不细腻，写的文章自己都很干。一直想让自己能够写打动人的东西，一直在受挫和爬起来中努力前行。看到上很多人发的优秀文章，看到她说自己运营公众号的心得，自己很是羡慕。大二就想运营公众号一直到现在都没有开始。下周，我决定开始运
学习共产主义心得桥心隧梦
近期我认真学习了共产主义相关理论，收获颇多，具体如下：通过学习，我认识到社会主义经过长期的发展，在高度发达的基础上，最终将走向共产主义，共产主义不仅是一种科学的理论和这种理论指导下的现实的运动，而且是一种未来社会制度和社会形态。实现共产主义是人类历史发展的必然趋势，是马克思主义最崇高的理想，当代青年应该把握好历史发展规律，树立中国特色社会主义共同理想和共产主义远大理想，从自我做起，从现在做起，在追
继续探索通往桃花源的路-我为何参加进阶写作特训营安晴兰
记得一个月前写了一篇为何参加21天爱上写作训练营，我开始了这个写作的旅程。一个月后写了一篇参与课程的心得。我发现这段很短的时间，21天，回首一望，其实，自己才迈开了一步。老师给我们一些方法与技巧，告诉我们补给的重要，老师看着我们继续前行，因为这条写作路，是自己的选择。我相信老师一定希望我们勇往直前，笔从心的继续写下去，做个终生的写作者。这段时间我的写作产出量的确比不上其他多产的小伙伴，但我已达到老
复盘2019-09-20 飞翔的毛毛虫lh
昨日计划：1.学审核的知识，审核两个小时√（心得：审核规范里只是关于审核的基本规则，具体详细的还需要自己摸索。）2.锻炼一次，公园健走半小时；仰卧起坐30个3.跟进PDCA的进程，催促各个环节的进度。√4.完成每日复盘√5.每日听书10分钟打卡√6.每日读书10分钟√（读书半个小时）7.背单词百词斩8.给二子做早教，每天至少讲一本书，√学数数1-10，√识字卡片2个，（大、人、小）五官的英文单词，
《信号与线性系统分析》学习心得 GFeverything 个人学习感想信号与线性系统分析吴大正课本信号分析
《信号与线性系统分析》学习心得通过本学期上网课的学习，大致对信号有了一定的了解认知，下面对该课程的理解发表粗浅认知，说起信号，大家都不陌生，比如老师写的幻灯片，朋友的一个眼色，经常使用的WiFi信号......总之，信号就是信息的载体，它包含着信息！从数学的角度，信号可以说是一个时间函数/序列；从电路角度来说，信号就是各种激励与响应与系统的作用；从模电数电的角度来看，信号有连续时间信号与离散时间信
CSP-J(/S) 2020爆炸记【游记】 JA_yichao 比赛and游记and总结游记 csp CSP-J
文章目录前言Day-xx训练Day-26初赛Day-18初赛成绩Day-5Day-1Day0Day1总结前言这次CSP−J(/S)CSP-J(/S)CSP−J(/S)的考试我的发挥非常差，该拿的分都没拿到.写一下自己的训练历程和心得感悟吧！Day-xx训练最近学了一大堆算法，在博客里我都有记录，有点应接不暇，但确实是长见识了，发现自己到现在都还没学入门（菜）Day-26初赛考前和gyx，cxy一直
幸福感恩日记第15篇豫豫妈
2018.7.3豫豫妈早课心得：1、这个世界外面没有别人，只有自己。一切都是自己的问题。2、每个人都不是完美的，学会转念，高效沟通。3、讲好每句话也是阴阳并存的，一阴一阳之谓道。4、坚持读经，早起学习，记笔记及时内化，学以致用才能正确的引导孩子。5、一个工具，二个方法，一个核心；五个步骤，僵化学习、固化学习、内化学习、优化学习、变化学习运用易经思维进行学习总结。方法：如果----那么----有点像
◆日精进◆2/200 记得晚㫨
文|萍萍很多事情一个人做着坚持不下去时，找个人监督效果就不一样了。这一年里我写的感悟也不少，但唯独只有在跟伙伴一起写，被监督的时候才连续坚持记录了每天的收获和感悟。包括这次暑假实习期间也是，平时的时候就是断断续续的。昨天看了一个很优秀的人的朋友圈，一周一篇文章，每日精进，每日早间分享自己心得，每日复利生长，还不断跟优秀的人接触，不断自我思考总结，分享出来。我开始反省自己，为什么他会那么优秀？而我却
学习《菜根谭》（272）｜一身了一身，天下还天下快乐的子亿
【原文】就一身了[1]一身者，方能以万物付[2]万物；还[3]天下于天下者，方能出[4]世间于世间。[1]了：明白、觉悟。[2]付：托付，赋与。[3]还：归还。[4]出：超出，出越。【译文】能够通过自身了悟自我的人，才可根据自然规则，使万物按照本性去发展而各尽其用；能够把天下交还给天下万民所共有的人，才能身处尘世而心灵超越到尘世之外。【学习心得】要学会醒悟。
日更58天，我的公号有1000+的收入了/2023第8周复盘林清子
你好呀，我是清子，一个爱折腾的80后远嫁姑娘，40+决定重新出发，愿景是用自己的文字去疗愈自己，和那些想要改变，却找不到出口的姐妹们！今天是我早起写作坚持日更的第58天了，时间过得真的很快啊，本周居然输出了14000字了，这是我第一次这么久的高产出日更了，说说我本周的收获和心得哈！本周我会从以下几个方面做重点复盘：1：本周收获2：不断更的几点心得3：本周学到的新知4：本周的有待提升的地方5;下周工
参加私董会感悟星琪_ec35
我昨天有幸参加了一场我的一个学习社群组织的私董会，私董会的成员大都是创业者。私董会的成员分为三种类型，主持人、案主和幕僚，首先由幕僚向案主提问，案主回答，时间由主持人控制，不超过60秒。幕僚对案主的三轮提问结束后，然后由案主向幕僚提问。最后使用头脑风暴，让幕僚不评判，给案主给出具体可操作的建议和行动方案，也可以用自己曾经经历的经验或心得，帮助案主打开思路，心态，方法，资源。我是一个打工者。通过参加
第一次作业（请老师点评）小九儿_y
姓名:小九儿_y日期:20180422作业:图片发自App心得:以前我特别羡慕那些在公共场合可以随意自如的人，很期待活成那样真实敢想敢做的人，正好听了北北老师的课，我知道我下决心的时候到了，打破舒适的自己，逼着自己入绝境。之前也曾独自改变过，不过一直停留在“想”的阶段，第1课，让我找到了自信，敢说，会说，爱说，相信这次有了这么多优秀的伙伴的陪伴，我能成为那个敢于真实表达自己的人。我坚信改变思维，提
大数据之flink与hive 星辰_mya 大数据 flink hive
其实吧我不太想写flink，因为线上经验确实不多，这也是我需要补的地方，没有条件创造条件，先来一篇吧flink：高性能低延迟流批一体的分布式计算框架基于事件时间对实时数据精准处理快速响应支持批处理，高效离线分析和数据挖掘数据仓库的引擎丰富数据源/接收器，集成多种数据存储格式和源，比较常见就是咱们今天的主题hive了checkpoint恢复机制，故障恢复快速恢复计算任务分布式弹性扩展，据业务灵活增加
hive血缘关系之输入表与目标表的解析 zxfBdd hive 大数据治理大数据
接了一个新需求：需要做数据仓库的血缘关系。正所谓兵来将挡水来土掩，那咱就动手吧。血缘关系是数据治理的一块，其实有专门的第三方数据治理框架，但考虑到目前的线上环境已经趋于稳定，引入新的框架无疑是劳民伤财，伤筋动骨，所以就想以最小的代价把这个事情给做了。目前我们考虑做的血缘关系呢只是做输入表和输出表，最后会形成一张表与表之间的链路图。这个东西的好处就是有助于仓库人员梳理业务，后面可能还会做字段之间的血
SQL Server 6.5 配置使用要点 rc_cdeoo_com sql server server security manager 网络协议 sql
SQLServer6.5在安装使用时的默认配置并不能带来系统性能的最大优化，某些使用方法没有具体的说明，在具体应用过程中感觉非常不便。下面结合本人在使用中的心得，就SQLServer6.5的一些安装使用方法作了简要介绍，各位可以针对自己的情况进行修改。1．安装中的要点安装时要求系统使用WindowsNTServer4.0，并且加装SP4。a)网络安装过程中选择网络时，安装程序默认不使用TCP/IP
宇宙公民第10期高效阅读营第2课收获宇宙公民Cathy
第二节课学习了冥想，校长传授了很多很多的知识和自己的心得体会，非常感谢她的无私分享。课程由八部分组成，一是校长的冥想学习历程，二是冥想的重要性。三世冥想的含义，四是冥想的类别，五是初学者入门的方法，六是冥想的步骤，七是冥想的误区，八是冥想的练习。结合今天的作业内容，我先谈一谈今天冥想环节，脑海里出现的画面。我躺在沙滩的树荫下，细腻柔软的沙子传来阵阵温暖，树叶在海风的吹拂下沙沙作响。耳边传来的是大海
2022-04-14 奉法如天
学习《民法典》心得（四十二）——债权人与债务人变更债务数量未经保证人同意的，保证人免责作者:奉法如天2022年4月12日《民法典》第六百九十五条规定：“债权人和债务人未经保证人书面同意，协商变更主债权债务合同内容，减轻债务的，保证人仍对变更后的债务承担保证责任；加重债务的，保证人对加重的部分不承担保证责任。债权人和债务人变更主债权债务合同的履行期限，未经保证人书面同意的，保证期间不受影响。”举例说
猿创征文｜【FreeSwitch开发实践】使用sipp对FreeSwitch进行压力测试一马途追 FreeSwitch开发实践 sipp 压力测试 FreeSwitch 压测
✨博客主页：小小马车夫的主页✨所属专栏：FreeSwitch开发实践✨专栏介绍：主要介绍博主在实际项目中使用FreeSwitch开发外呼类项目的一些经验心得，主要涉及FreeSwitch的基本安装编译、基本配置、ESL、WSS、录音、自定义模块、mediabug、语音播放、MRCP及对接AI机器人等内容。内容在持续更新中，如果感兴趣可以对专栏进行订阅~文章目录前言1、sipp编译安装2、sipp命
【32、乙未学习模式】思考空间
透过五行学说，了解学习模式。学习是对知识吸收和消化的过程，这方面每个人都有不同的习惯和不一样的效率，随着时日的转移，一个人对学习的态度也会发生转变，因此文章标题说的学习模式，并非指某个人在学习上的固定模式，而只是阶段性的描述。六十甲子的干支关系涵盖了天地人事物的运转法则，以之分析学习模式，就会得到相关范畴的针对性指引。下文纯属个人研习心得，仅供大家参考。32、乙未乙未五行概略：乙：五行属性：木。特
心得与感受黄辉亮家庭营养顾问
按照老师教的，在群里互动当你发的东西跟其他人不一样的时候，感觉他们的注意力都好像投放在你身上了。而且他们对你的认识跟印象是跟其他人不一样的，因为其他人都没有这样去介绍跟聊天的，突然间好像被很多认识了
Algorithm 香水浓 java Algorithm
冒泡排序 public static void sort(Integer[] param) { for (int i = param.length - 1; i > 0; i--) { for (int j = 0; j < i; j++) { int current = param[j]; int next = param[j + 1];
mongoDB 复杂查询表达式开窍的石头 mongodb
1:count Pg: db.user.find().count(); 统计多少条数据 2:不等于$ne Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 查询id不等于3的数据。 3：大于$gt $gte(大于等于) &n
Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space 0624chenhong jvm jboss
转自 http://blog.csdn.net/zou274/article/details/5552630 解决办法： window->preferences->java->installed jres->edit jre 把default vm arguments 的参数设为-Xms64m -Xmx512m ----------------
文件上传下载解析相对路径不懂事的小屁孩文件上传
有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。下面总结一下遇到的问题：文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。在上传图片，或者文件时，使用form表单来操作。前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: <form action=&
怎么实现qq空间批量点赞换个号韩国红果果 qq
纯粹为了好玩！！逻辑很简单 1 打开浏览器console；输入以下代码。先上添加赞的代码 var tools={}; //添加所有赞 function init(){ document.body.scrollTop=10000; setTimeout(function(){document.body.scrollTop=0;},2000);//加
判断是否为中文灵静志远中文
方法一： public class Zhidao { public static void main(String args[]) { String s = "sdf灭礌 kjl d{';\fdsjlk是"; int n=0; for(int i=0; i<s.length(); i++) { n = (int)s.charAt(i); if((
一个电话面试后总结 a-john 面试
今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结：在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。然后对list和map分别举几个类型： list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
MSSQL中Escape转义的使用 aijuans MSSQL
IF OBJECT_ID('tempdb..#ABC') is not null drop table tempdb..#ABC create table #ABC ( PATHNAME NVARCHAR(50) ) insert into #ABC SELECT N'/ABCDEFGHI' UNION ALL SELECT N'/ABCDGAFGASASSDFA' UNION ALL
一个简单的存储过程 asialee mysql 存储过程构造数据批量插入
今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： DELIMITER $$ DROP PROCEDURE IF EXISTS inse
annot convert from HomeFragment_1 to Fragment 百合不是茶 android 导包错误
创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 创建类时引入包是:import android.app.Fragment; 创建队列和对象时使用的包是:import android.support.v4.ap
Weblogic10两种修改端口的方法 bijian1013 weblogic 端口号配置管理 config.xml
一.进入控制台进行修改 1.进入控制台: http://127.0.0.1:7001/console 2.展开左边树菜单域结构->环境->服务器-->点击AdminServer(管理) &
mysql 操作指令征客丶 mysql
一、连接mysql 进入 mysql 的安装目录； $ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 输入密码，回车，接连；二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 1、赋权 mys
【Hive一】Hive入门 bit1129 hive
Hive安装与配置 Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 Hive安装和配置的步骤 1. 从如下地址下载Hive0.14.0 http://mirror.bit.edu.cn/apache/hive/ 2.解压hive，在系统变
ajax 三种提交请求的方法 BlueSkator Ajax jqery
1、ajax 提交请求 $.ajax({ type:"post", url : "${ctx}/front/Hotel/getAllHotelByAjax.do", dataType : "json", success : function(result) { try { for(v
mongodb开发环境下的搭建入门 braveCS 运维
linux下安装mongodb 1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 2）linux 解压 gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
编程之美-最短摘要的生成 bylijinnan java 数据结构算法编程之美
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class ShortestAbstract { /** * 编程之美最短摘要的生成 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
json数据解析及typeof chengxuyuancsdn js typeof json解析
// json格式 var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},' +' {"firstName": "CCC&
流程系统设计的层次和目标 comsci 设计模式数据结构 sql 框架脚本
流程系统设计的层次和目标
RMAN List和report 命令 daizj oracle list report rman
LIST 命令使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的信息。使用此命令可列出： • RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 • 可用的且可以用于还原操作的数据文件备份和副本 • 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 • 包含指定名称或范围的所有归档日志备份的备份集和副本 • 由标记、完成时间、可
二叉树:红黑树 dieslrae 二叉树
红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 红黑树必须遵循红黑规则,规则如下 1、每个节点不是红就是黑。 2、根总是黑的 &
C语言homework3，7个小题目的代码 dcj3sjt126com c
1、打印100以内的所有奇数。 # include <stdio.h> int main(void) { int i; for (i=1; i<=100; i++) { if (i%2 != 0) printf("%d ", i); } return 0; } 2、从键盘上输入10个整数，
自定义按钮, 图片在上, 文字在下, 居中显示 dcj3sjt126com 自定义
#import <UIKit/UIKit.h> @interface MyButton : UIButton -(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
MySQL查询语句练习题，测试足够用了 flyvszhb sql mysql
http://blog.sina.com.cn/s/blog_767d65530101861c.html 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR
转：MyBatis Generator 详解 happyqing mybatis
MyBatis Generator 详解 http://blog.csdn.net/isea533/article/details/42102297 MyBatis Generator详解 http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
让程序员少走弯路的14个忠告 jingjing0907 工作计划学习
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 1.不要害怕在工作中学习。只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
nginx和NetScaler区别流浪鱼 nginx
NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 3.策略灵活度方
第11章动画效果（下） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
FAQ - SAP BW BO roadmap blueoxygen BO BW
http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq Besides, I care that how to integrate tightly. By the way, for BW consultants, please just focus on Query Designer which i
关于java堆内存溢出的几种情况 tomcat_oracle java jvm jdk thread
【情况一】：　　 java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：　　<jvm-arg>-Xms3062m</jvm-arg> 　　<jvm-arg>-Xmx
Manifest.permission_group权限组阿尔萨斯 Permission
结构继承关系 public static final class Manifest.permission_group extends Object java.lang.Object android. Manifest.permission_group 常量 ACCOUNTS 直接通过统计管理器访问管理的统计 COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 D

数据仓库心得

你可能感兴趣的:(数据仓库心得)