此木Y

有赞数据治理之路

导读：有赞是通过 SaaS 起家的，经过多年的数据沉淀，有大量数据，可以说是一家大数据公司，但是有赞的最终目标是成为 AI 公司。在这个阶段，数据积累到一定体量，数据治理是非常有必要的。数据治理的最终目的也是服务 AI、做智能应用，发挥数据的价值，而质量和成本是数据价值的核心所在。在有赞，是如何衡量质量好坏、成本高低的？又是如何依靠产品，结合运营的手段，提升质量，降低成本的？本文，为你揭晓。
1. 数据治理是什么

数据：复杂业务场景下，由系统或人沉淀下来的大数据
治：为整治，关注数据质量，保障数据稳定性、准确性，合理控制数据的生命周期，降低成本。
理：为梳理和管理，数据的基本信息、状态、关联关系等，目标是搞清有哪些数据、从哪来到哪去，最终用到什么地方。
2. 有赞是怎么做数据治理的
① 数据资产化
通过数据采集、数据管理，然后做各种质量监控和安全审计，把我们各种数据相关的东西当做是数据资产。
② 数据量化和运营
包括衡量资产等级、安全等级，做质量分和成本。让大家直观地感受到数据的质量以及成本是怎样的。然后去构建个人工作台，用户可以知道自己的数据资产有哪些。
③ 发挥数据价值
比如说通过数据地图高效地发现数据，挖掘有效、有价值的数据，然后通过地图的能力做关键路径分析、一键通知、行业透视等。

目前有赞的数据治理，处在量化和运营阶段。上图是有赞数据资产平台的简化图，可以看出数据治理涉及到的方方面面。从这个图也可以看出，质量和成本最直接影响业务和应用。
二：质量保障体系
1.什么是数据质量

说到数据质量，大家最先涌到脑海的可能是数据内容质量。也就是说，怎么去保证数据内容的准确性，这是比较狭义的质量。质量其实还包括很多方面，比如说准确性、规范性、及时性和认可度，称为广义的质量。我们为广义的质量去做了一个产品，叫质量分。狭义的质量会影响业务的稳定性，比如说哪个数据出错了，比如说商家的 GMV 肯定是不能出错的，出错了会影响业务的稳定。而广义的质量会影响用户，且最终会影响数据价值的挖掘。
2.内容质量校验
数据和任务强相关，因为数据是由任务加工产出的。所以，内容质量校验也和任务强相关，每个任务完成之后，我们都会对产出的数据做各种质量校验。
质量校验包括两个方面，预定义校验和自定义校验。预定义校验，我们系统自动执行的，不需要人工做任何的配置，包括数据量的波动、文件还有组件唯一性的校验等等。自定义校验需要每个数据 owner 做一些配置，在我们系统上也支持了很多，比如说非空校验、数值范围校验、还支持自定义 SQL 校验。

质量校验的结果正常的话，下游任务就可以正常进行；如果是可接受的异常，这时候会触发邮件和企业微信的报警；如果是不可接受的异常，结果数据是有问题的，则阻断下游的任务执行以避免数据资源的浪费，同时触发电话报警，通知相关人去处理。
3.质量分

我们把这四项定义好，确定分类和细则、定义好权重，通过简单的公式就可以算出一个质量分。如上图所示，不同颜色代表不同的分类，最右边是细则的得分以及权重，通过得分加权重的计算方式，就可以最终算出一个数据的总得分。为了模型的可扩展性，有一个小细节，就是权重自动凑百，比如橙色框里的权重，一个是 30 一个是 20，总分是 50，实际上算权重的时候，我们会去给它折算到 100。通果加减规则，不需要做很多的调整，权重都能自适应。
4. 提质手段
我们的质量提升手段，是从这几个方面去做的：
第一是预防，就是事前我们会去做 DDL 入口的限制。比如说你的表的命名不规范或者注释显得不够，或者说该有的属性缺失了，我们会在第一 DDL 的入口去做限制。还有 deadline 预警，每天白天的时候进行检测，并提前发出告警。同时也会去做静态检查，所有的数据、任务变更的时候，都会进行静态检查，提前发现问题。
第二是发现异常，事后任务超时，或者说检验失败的时候，我们会去触发告警，提醒到相关的人。
第三是质量大盘，目的是为了让质量分引起大家的关注，同时在集团大盘里做很多优化的提示，让大家用起来，最终把质量提升上去。
最后是推进优化，其实做完前面那几步，大家可能只是对质量有一个比较明显的感知，但是真正去做质量的提升其实还需要很多运营动作，这就是我们在推进优化这块做的事情。
5. 提质效果
定义完质量分之后，经过一段时间推动，以及大家自觉地做一些提升之后，规范性上，消除了 99%的同义不同名表，业务率和归属率提升到 95%以上。准确性上，消灭了 95%以上的屡败规则，屡败规则指的一些经常失败的数据检验规则，或者最近一段时间经常失败，但是没有人去关注。在做质量分之前，有大量这样的规则存在，不仅是浪费了计算资源，同时也会让告警接收人对异常情况产生麻木情绪，所以说这个收敛是非常有必要的。另外一个指标是失败率，也从 11%降到1.25%，有比较大的提升。稳定性和技术性，这是我们的一个提质效果。

上图是我们的质量大盘，最上边会有几大模块，一个是质量分数，然后是质量告警，还有超时任务，每个模块里面都会有具体的一些细节展现。
三：降本运营机制
1. 资产成本量化
前面提过数据资产会有很多类型，对于开发人员来讲，他们看到的是一张张表，但是对于管理者或者运维人员，他们看到的是一堆堆机器，这些机器都是有成本的。我们的目标就是把成本分摊到表，让人感受到每张表的成本是多少。
首先，我们对机器资源去做分类，因为机器资源其实就是一堆 CPU、内存和磁盘，不同的资源，也有不同的稀缺性，我们需要对每种资源定价。就跟一头猪的不同部位，价格是不一样的，因为它们的稀缺性是不一样的。从表的角度去看，每个表的产出都对应一个任务，同时也对应一些存储，它们占用计算资源和存储资源。我们大的思路就是对每一类资源去做一个定价，形成一个单价，然后采集到每个表占用的资源的量。单价乘以数量，就是成本。
数据成本是由资源单价和消耗资源这两个最关键因素决定的。
资源单价有四个方面：总成本、资源总量、稀缺性和合理水位。下面分别解释一下：

对于离线计算，比如 Hadoop 集群的总成本是多少，它的资源总量是多少，我们最关心的是 CPU 和内存资源，这个我们是可以采集到的。
稀缺性，可以从资源瓶颈的角度来考量，对于离线计算，CPU 会比内存更稀缺。
合理水位，是说为了保证性能和稳定性，资源的负载需要维持在一定水平。比如 CPU，我们不可能把它用满，可能用到 80%左右就到极限了，再往上就是非常危险的状态。所以说我们去算有效资源的时候，不会按资源真正的总量去算，而是按它的总量去乘以合理水位计算的。合理水位因不同的数据而异，需要具体去分析确定。

消耗资源有三个方面，存储和计算比较好理解。时间怎么理解？以离线计算为例，大多数离线计算场景可能都是 T+1 的，然后大家可能也能感受到凌晨的时候资源是非常稀缺的，但是白天的时候往往是空闲的。所以凌晨的时候资源应该是贵一点的，白天的时候稍微便宜一些。我们去采集计算资源的时候，也会去考虑任务的计算资源占用的时间段。在凌晨我们会去给他打一个系数，比如说 1.3、1.5，但在白天我们会给他一个折扣，比如 0.6、0.8。

按照上面的原理很容易得出一个计算公式，每个 CPU 的单价是多少，内存单价是多少，然后采集到使用到的资源数据，就可以算出数据的成本。

cpu 单价， cpu_price = total_cost * cpu_weight / (total_cpu * cpu_load)
内存单价， memory_price = total_cost * memory_weight /
(total_memory * memory_load)  任务成本， cost = cpu_price * use_ cpu + memory_price * use_memory + disk_price * use_disk

2. 成本账单建设
成本量化之后，只是有了一个比较直观的成本数据。为了让各个层级的人都能直观的去看他们有多少数据、成本分布以及趋势是怎样的，我们做了成本账单，支持了三大类能力。
第一是分析，支持全类型多视角、灵活的分析，有三类分析手段、有多种降本的方式、有五维视图。五维视图指的是说个人的、部门的、业务域的、业务线的以及全局视角的成本，都可以看。此外，账单也支持钻取、级联和趋势分析。因为大家看账单的时候，可能不光只想看到一个数。如果我看到这个数差距特别大，或者说我们这个波动特别明显，就要去分析为什么会出现这种情况，所以需要支持很多分布分析、下钻分析、甚至展现一些成本的细节。
第二是降本，给大家看到成本之后，希望说大家做一些降本的工作，减少浪费。所以我们也做了很多降本的挖掘，包括怎么挖出哪些数据可以下线、哪些数据可以做延迟启动。延迟就跟上面我们讲的运行时间段有关，比如不重要的任务，不一定要在凌晨的时候跟那些高优先级的任务抢占资源，可以把它挪到白天的时候执行，这样我们在算成本的时候会给一些折扣，这也算是降本的一种方式。还有很多任务，可能是小时级、甚至分钟级调度的，小时调度的任务，一天跑 24 次，它成本就是每天调度任务的 24 倍。实际有没有必要？未必，通过我们的调研发现存在很多这样的人物，是可以做调度周期的优化。此外，还有一些调优的具体手段，怎么去避免数据倾斜，怎么去减少数据量的使用等等。
第三是我们把账单算到业务线上。数据中台在很多人看来是一个成本大户，消耗了资源，但是离业务比较远，很难讲出价值。但其实我们消耗的资源都是为业务服务的，所以我们要想办法把成本也分摊到业务线，让业务线也关注到，原来在创造价值的同时，其实也消耗了这么多成本。

上图是分摊业务线的大致逻辑，底层是数据、任务和平台服务。成本有两类，独占成本和分摊成本。独占成本就是有些集群平台或者任务就是为某个业务服务的，这些成本全部归到业务。分摊成本，比如说数仓中间层，它的订单交易或者店铺可能有很多业务线都用到了，数仓去建立这些能力需要的成本，就需要分摊到这些业务线。

上图是数据成本账单的截图，这是一个部门视角，每个部门都可以看到自己成本是怎么样的，部门视角可以看到部门里边每个人的成本情况。最上面是一些数据指标的概览，可以看到我的成本情况、降本情况、资产的数量。然后中间是成本的趋势，在趋势图的每一个点都可以点击，右侧会有成本的榜单分析。比如说我看到 12 月 6 号成本特别高，点一下就可以在右边看具体的成本是怎么样的。最下边是成本分析模块，我们可以看到成本分布。分成平台的成本、表的成本、还有各种各样的成本的分类，同时也支持按成员去分析它的成本。比如说条形图，它其实是可以点击下钻看某个具体的人，有哪些表。右下角的模块是一个可降本分析，上面讲过给他们看成本，是希望他们去做降本的事情，所以很多挖掘降本的点也在平台上去支持。
3. 成本分摊

在成本分摊的时候，怎么做默认的分摊，怎么设置分摊的比例？大概的过程三步，首先设定一个默认的分摊比例，按照各个业务线的订单量算比例，算是默认分摊比，这个数据通用层的分摊，加上一些独占的成本的分摊，会生成第二个比例。然后再结合平台域的分摊成本生成第三个比例。最后我们再把平台工具独占成本结合进去，形成了一个最终的比例。
4. 持续运营
建了很多规范后，计算出质量分、成本、账单，但如果不运营是很难把这个事情跑起来的。因为大家对这个东西的感觉不深，也没有特别强的动力，所以我们也做了很多运营的事情。
① 强化意识
我们从多渠道进行成本意识的宣传，比如每次上线产品通过海报或者小视频，进行产品宣传，告诉大家用法，鼓励大家多去使用。还有上文提到的，挖掘出一些改进的空间给到大家，让大家很明确的就可以去做一些事情。
② 奖惩机制
有赞内部有一个“有赞币”文化，可以把有赞币送给自己欣赏的人、或者帮助到
自己的人，给他们一些鼓励。
③ 跟踪反馈
比如说意见箱、答疑群，还有怎么关注降本的一些实际的数据等等。这些事情其实是平台围绕着用户，为降本去做事情的，运营的目的是为了让平台用户和成本之间形成一个良性的互动。我们通过运营去推动用户去做降本的事情，跟踪这些动作同时反馈在平台上面，这样的话就形成了一个正向的循环，最终达到一个比较好的降本效果。

5. 运营成绩

经过大半年的努力，我们也有一些小小的成绩。上图是实际运营的数据情况，第一个参与用户，是说目前有成本的用户中，超过 32%的用户采取了降本相关动作。降本动作累计有 1400 多次，并且自主降本的比例超过了 38%，这个也反映出大家对成本的意识已经有非常大的提升。在做这个事情过程中，我们也清理了超过2P 的数据、下线超过 300 个任务，在成本方面每年节省了 300 多万。
四：总结与展望
质量成本，其实是围绕着量化、产品以及运营这三个方面进行的，这也是数据治理的三辆马车。量化是为了让大家更直观地感受到当前的质量、成本现状，有哪些问题。让大家了解之后需要通过产品作为载体去支持大家做降本以及分析的需求。有了产品之后，还需要通过有效的运营手段，把这一套降本机制，以及提升大家成本意识的意图，给跑起来，最终形成一个良性的循环。
成本和质量的发展方向，如下图：

大质量
首先，我们目前的质量主要集中在离线表，我们可以去扩展数据类型（实时数据，如 Kafka；在线数据，如 Hbase）。其次是服务的质量，我们现在有很多数据相关的平台系统，它们的服务稳定性、效率延迟是怎么样的？其实是没有统一关注的，这块也需要关注起来。最后是深入业务质量，包括线上服务，比如商家后台，它的服务的稳定性，接口的延迟等等。这些就是大质量。
全成本
我们的成本已经做得很全了，各种各样的数据类型平台、成本都做到了量化、以及能做到成本账里面去了。但是还有一些更上游的 MySQL 表等等，这些还没有去做量化，也可以去做扩展，然后粒度更细致，分摊更灵活。
重运营
我们已经意识到运营是成本治理达到较好的效果必不可少的，而且应该是加大投入的一个环节，我们首先要从态度上重视，继续加大投入。

最后送给大家一句话，也是我们团队比较喜欢的一句话：高质量，低成本，让数据更有价值。

站不起来怎么办？张书宁日更践行者
阅读下面的文字，根据要求作文。人，只有在自己站起来之后，这个世界才能属于他。这句话引发了你那些思考?请自选角度写一篇不少于800字的文章1、标题自定，文体自选；2、不得抄袭，不得套作；3、用规范汉字书写。抱歉，我一直不太会用规范汉字书写，请见谅。你看，首先这个就不过关，哎！当初为什么学文的？老师是怎么忍受我的呢？人，只有在自己站起来之后，这个世界才能属于他。我极度同意这样的说法，古有扶不起来的阿斗
女儿名字的由来流走的沙
算算日子我的女儿来到这个世上，有半个多月了。说起来在我生下女儿的前一刻时。我还都不知道是男孩儿是女孩儿！老是听小区的那些上了年纪的老人，说我的肚子是尖的可能是男孩儿。刚生下那的一刻我婆婆说是女孩的时候我心松了一口。在没有生下小孩之前，还在想如果再生个男孩该怎么办！在生下女儿后喜悦，让我忘了生孩子的疼痛和生之前的阵痛。同一产房的产妇还说儿女双全啦！称心了。婆婆说了一句称心了。在三天后出院的时候取名字
520 Cy_f233
上周六，小红子去枇杷之乡摘枇杷，然后也给我准备了一箱。当日小红子说要把枇杷送到我家，念及她家在城东，我家却在城西，太远了，我委婉拒绝。哪知小红子坚持相送，我只好说周一吧，带到单位。今早，我车子进了停车位，然后下车，锁门，一个转身，小红子拎着一个袋子笑意盈盈地朝我走来。天哪，真的是盛情难却！一进办公室，马上做事，等到空下来，我才想到还有枇杷。打开盒子，拿一个，剥了皮，放进嘴里，甜甜的汁水在我的嘴里四
解决方案架构手册第三版（二）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/767f6c16a82c581ed50af87f92c3fe8f译者：飞龙协议：CCBY-NC-SA4.0第五章：5云原生架构设计模式在数字化转型快速发展的时代，企业越来越多地转向云平台，提供可扩展、具备弹性且具成本效益的解决方案。采用云原生架构正成为寻求敏捷性、创新和运营效率的组织的战略必需。本章将引导您设计和实施云原生架构的旅程，重点介绍架构模
敞开自己，拥抱惊喜倪说我听
现在我所在的公司，是由一个大学毕业直接创业的boss带领的80多人的团队，是一家创业20年仍在不停成长的创业公司。当时在面试前浏览公司网站的时候，先是被网站的设计所吸引，后是被其中丰富的内容吸引。网页中有一段描述公司特别重视员工之间的合作共赢的文字，而且特意说明了公司内部的7种合作模式。其中一个模式，是这样说的，OPENお互いに本音を隠し合って、場が硬直する。自分の保身を優先して、素直になれない。
我的闺蜜雪儿（12）晓百姓
我愣在宿舍中间，足足有几分钟，才反应过来：雪儿会被王庆怎么样？我赶紧跑出宿舍，往大门方向跑，只匆匆看到：大门外停着一辆面包车，雪儿被王庆推搡着上了车。哐的一声，车门关上了，车开走了。这……？会发生什么？我心里没底，觉得很难受，赶紧回宿舍拿IC卡，给宋姐打电话。宋姐听了之后，仔细想了想，说：“应该没啥问题，你别着急，收拾收拾睡吧。”那一夜，我睡得非常不踏实：一会儿梦见雪儿被王庆打死了；一会儿梦见王庆
七律·落雪时节（新韵）侧帽风流
紫烟赊作远天苔，簌簌飞鸢过院皑。含籁梅边留客嗅，窗头呵字向谁猜。将出米酒三分醉，看取梨花一树开。疑是江南春绪早，不知衣上有寒来。雪是天空与大地缔结的约定，在最萧瑟的天气飘然而下，与世界进行了一场悄无声息又声势浩大的拥抱。想来或许是一年到头，天空的心事太重，白云受不住了，缓缓沉下，便排开了一字雪色。图片发自App
到底要什么左可
还记得小时候那个令人发指的名人吗？“别人家的孩子”有时候或许是因为大人也不知道自己希望孩子成为什么样的人很多人都不知道自己想要什么看到别人有的就想自己有看到别人炫耀的就想自己也拥有同样的炫耀自己无法做到便寄托给某个不需要成本又能顺理成章要求的人孩子
Tabman 2迁移指南：从旧版本升级到全新架构陆欣瑶
Tabman2迁移指南：从旧版本升级到全新架构前言Tabman作为iOS平台上功能强大的分页视图控制器，在2.0版本中进行了全面重构。本文将从技术实现角度，深入解析Tabman2的架构变化，帮助开发者顺利完成迁移工作。环境要求在开始迁移前，请确保开发环境满足以下要求：iOS9及以上系统版本Xcode10及以上开发工具Swift4.2及以上语言版本核心架构变化Tabman2进行了彻底的重构，主要改进
喜欢他就亲他？南风知我驿
靳长风突然感觉到自己以前的坚持都有了意义。有人在等他，有人会温柔的对着他笑，有人爱他，虽然她从来没有说过，但是她的眼里泛着爱意。他心里甜甜的，也暖暖的。比昨天他的小姑娘送来的奶茶还要甜。练球劲头更足了。莹莹小朋友在房间里很早的睡着了，可能昨天跑的太累了。小朋友的睡颜恬静可爱，南诗在桌子上留了纸条，就继续到球场看球去了。全场最佳非靳长风莫属。她看着看着觉得有些眼花缭乱，就从随身的袋子里摸出一本书，，
linux-日志服务 Code Rhythm Linux linux 运维服务器
linux-日志服务一、rsyslog1.配置文件2.消息级别3.设备类型二、日志轮转1.主配置文件2.配置日志轮转功能3.结合cron使用总结一、rsyslogrsyslog是Linux/Unix系统上的一款高性能、模块化的日志管理服务，用于收集、处理、过滤和转发系统日志及应用程序日志。支持多种协议（如TCP/UDP/TLS）、数据库存储（MySQL/PostgreSQL）、远程日志转发等高级功
508 季正爸爸
508，周二右二小脚趾日，不引人注目，继续默默坚持，有时也觉得平淡，好想仗剑走天涯，指点江山。早上穿衣拖，不远睡醒似的，想法刺激也效果不好，在妈妈的帮助下选好穿好衣服，不知二人各做了什么，还有本来是我的任务，现在成了妈妈参与了，希望妈妈不要参与，刚开始肯定有各种的情况。起床后自己爬在客厅地毯上听我读书，自己看书，而没有洗漱和吃早餐，有些奇怪。一直在拖时间不及时上学，一会儿说语文资料袋我昨晚看了，现
野兽多出来的零余者
正如所有的光明下都有阴影一样所有的阴影下也指向着光明野兽也一样出于光明，溺于阴影向往那飞蛾之火照亮斑珀的身体可是世人厌恶野兽野兽停在三步之外眼神凝住那火光当小草流下泪水时野兽回归沉寂又一夜又反复树木一天天的倒下土地一天天的流走黑夜扔下轻纱在方与圆之内离火三步之外野兽一个猛扑撕咬那火光他的眼睛化为了石头已看不见任何光亮当小草再次流下泪水时鲜血洒满了整片绿茵
2022-08-05日学录当年观棋
月的最后一天，睡了很长的时间。外面的天气是燥热的，在宿舍的房间里有一丝微凉。实验说到底来说还是想法的验证，但在远远超出自己知识和能力范围的假设，自己也奈何估算不出来。对一些高级仪器的使用还在处于一个基本的阶段。后续在研二的这个阶段，要全身心投入到毕业论文的内容撰写之中去。其实想法有很多，但是真正估计出来可以做的其实也就一两个。这就最终决定了自己毕业论文的宽度。哈哈哈哈哈哈哈哈哈哈
基于ArcPy将HDF格式栅格文件批量转为TIFF格式疯狂学习GIS
本文介绍基于Python中ArcPy模块，实现大量HDF格式栅格图像文件批量转换为TIFF格式的方法。首先，来看看我们想要实现的需求。在一个名为HDF的文件夹下，有五个子文件夹；每一个子文件夹中，都存储了大量的.hdf格式的栅格遥感影像数据。我们在其中任选一个子文件夹，来看看其中所含的文件。我们要做的，就是将HDF文件夹下的全部子文件夹中的全部.hdf格式图像文件，一次性转换为
[go] binary.Write 小坑一个兼论go的错误处理哲学勤奋happyfire
有如下go代码：const(foo=123)buffer:=new(bytes.Buffer)binary.Write(buffer,binary.BigEndian,foo)fmt.Println(buffer.Len())输出结果是0，foo没有写入到buffer中。原因在于，binary包的Write内部调用了intDataSize函数获取foo的长度：funcintDataSize(dat
口红排行榜前十名是谁口红排行榜前10名高端品牌有哪些优惠券高省
经专业评测的2023年口红十大品牌名单发布啦！居前十的有：Dior迪奥、CHANEL香奈儿、YSL圣罗兰美妆、GIORGIOARMANI、TOMFORD汤姆福特、Givenchy纪梵希、ChristianLouboutin、M.A.C魅可、LANCOME兰蔻、EsteeLauder雅诗兰黛等，上榜口红十大品牌榜单和著名口红品牌名单的是口碑好或知名度高、有实力的品牌，排名不分先后，仅供借鉴参考，想知
最新虚拟串口 Virtual Serial Port Driver V11.0.1068 已经汉化中游鱼虚拟串口汉化虚拟串口 VSPD11.0.1047
最新虚拟串口VirtualSerialPortDriverV11.0.1068已经汉化1、简介1.1、项目技术分析1.2、项目及技术应用场景1.3、项目特点1.4、总结2、软件功能2.1、创建任意数量的虚拟串口对（pairs）2.2、回环(loopback)端口捆绑2.3、串口分割（Splitting）2.4、结合COM端口（Joining）2.5、创建捆绑连接（bundles）2.6、自动切换端
CrystalDiskInfo小巧全面开源的硬盘检测工具中游鱼 VC2022 C++源代码 CrystalDiskInfo C++硬盘信息 CrystalDiskInfo VC2022
CrystalDiskInfo小巧全面开源的硬盘检测工具1、简介2、功能和代码3、官方网站4、官方源代码4、采用CrystalDiskInfo版本8.17.14内核读取硬盘型号和序列号的DLL库5、包含分别采用CrystalDiskInfo版本8.17.14、9.2.2、9.6.3、9.7内核的VC++源代码。6、CrystalDiskInfo版本8.17.14内核读取硬盘型号和序列号的DLL库项
学《梁宁产品思维30讲》有槽——微信为什么成为了今天的微信神秘的尹先生
缘起：朋友圈的高分评价文档由搜狗录音助手录制并转写，简单整理后发出，纯属一时兴起吐槽发出。搜狗录音提供了11个小时的免费的转写时长，相比于科大讯飞，搜狗在互联网产品的运营上面的确是更能够讨我们这些C端客户的芳心。他至少让我完整地试一下，如果我觉得效果真的非常好，我才会花这个钱，而讯飞那个就太急功近利了，一两分钟的体验真白瞎了我们去下载APP，希望他们能够换一批运营，关于有道云笔记、讯飞系列的对比吐
在Docker容器中修改PostgresSQL最大连接数 itzixiao SQL docker postgresql 数据库
在Docker容器中修改PostgresSQL最大连接数目录在Docker容器中修改PostgresSQL最大连接数1.首先查询当前最大连接数2.然后找到你的postgresql.conf文件3.修改配置文件4.然后重启postgres服务附Postgres中常用sql命令解决bash:vim:commandnotfound1.首先查询当前最大连接数--查看最大连接数showmax_connect
FTP考点之凹の鸥笔记
在网络工程师、运维工程师、系统管理员等岗位的面试中，FTP（FileTransferProtocol，文件传输协议）是基础但高频的考点，尤其在涉及文件共享、数据传输、服务器管理等场景中。以下是系统化的核心考点梳理，涵盖FTP基础概念、工作模式、安全特性及应聘高频问题。一、FTP基础考点1.FTP的核心概念（必会）(1)FTP的定义与作用定义：FTP是应用层协议，用于在客户端和服务器之间可靠地传输文
DNS考点
在网络工程师、系统工程师、运维工程师、安全工程师等岗位的面试中，DNS（DomainNameSystem，域名系统）是高频必考知识点。DNS作为互联网的“电话簿”，负责将人类可读的域名（如www.example.com）解析为机器可识别的IP地址（如192.0.2.1），是网络通信的基础组件。以下是系统化的核心考点梳理，涵盖DNS基础概念、工作原理、协议细节及应聘高频问题。一、DNS基础考点1.D
社交新电商——轻创街公子向北走
过去三年，有两家奇葩电商公司，都是通过社交模式交易规模跨过百亿，迅速挤入电商第一阵营，一个是众所周知的某拼，一个就是某云，目前10亿级的公司每日一淘生鲜方向、蜜芽专注宝妈群体、贝店全品类、网易推手、近期的小米推手都逐渐步入社交电商这个领域，在这时代大背景下轻创街将专注大学生这个全新的市场，做校园社交电商一哥。数千万天使投资，资本（资云资产）看好轻创街什么？轻创街安身立命之本是什么？它解决了哪个群体
得到三周年直播收获简记张照浩
好久没有节奏性的学习得到了，我体会的结论是--一旦停止，前功尽弃，此言不虚啊~哈哈。学的少，进步的少，这就是我的代价。幸好在中午看到朋友分享海报，点进了得到三周年的直播，信息量很大，干货满满，当时没有记笔记，复盘一下，固化下知识，也便于今后再学习。我理解的这场直播为什么会有的原因如下：1、强化仪式感和节奏感。2、正向引导，尊重付出，给予反馈和获得感。3、价值吸引，强化品牌影响力，做推广。4、践行价
小教师的感悟随笔365【36】不帅的张老师
忙碌的一天，在回家的路上。突然想到身为班主任带好的班级，老师都会带，学生具有一定的自觉性，稍微管理就会取得一定的成绩。对于非常差的班级如果带好才能真正的考验班主任，如何协调老师对班级空闲时间的管理、如何做学生的思想，如何激发学生学习的积极性等，这才是真正的考验！在今年管理学生班级中，对待学校布置的部分任务，如布置向家长要求一些的任务，我不是那么一定的为了学校的任务而去要求家长，这一点我稍微的改变，
恋爱十年，我在婚礼当天分手(沈晴陈序)免费小说全集_阅读免费小说恋爱十年，我在婚礼当天分手沈晴陈序免费阅读全文恋爱十年，我在婚礼当天分手沈晴陈序_恋爱十年，我在婚礼当天分手(沈晴陈序)热门小说大全 d036fb3b3d05
小说：《恋爱十年，我在婚礼当天分手》主角：沈晴陈序简介：我跟陈序十年恋爱长跑，陪他创业白手起家。婚礼前两天，却发现他存了长达60页有关其他女生的备忘录。我悄悄撤销了公司所有合作。订下婚礼当天出国的机票。逃婚后，他却疯了。“沈晴，这项目可是你一手促成的，眼看改改细节就能落地了，你确定不签了？”身为上市公司高管的朋友询问我的语气里有些不确定。“嗯，不签了，以前签合同的那些也得撤约，实在不好意思，给你添
2023-05-15 越来越好崔
2023-05-15中原焦点网中级36学员李灵芝坚持分享第364儿童技能教养法的学习过程中，我们要帮助孩子建立信心。让孩子相信他有能力学会这个技能。无论我们说的理由是多么的理性或者是无厘头。重要的是让孩子听到有这么多人才告诉他。有这么多人都确信他能学会。我们告诉孩子，你对他有信心的时候，并把你的信心传递给他。并帮助他建立了信心。这是点燃孩子学习激情的不可或缺的火花。但掌握技能的唯一方法就是一遍一遍
舍得让你爱的人受苦北上的路上没有你
今天看了一本书《舍得让你爱的人受苦》。在书中，作者提出：有时候我们在自己的情绪模式和互动惯性的遮蔽下，会看不清楚我们和爱人、亲人、家人、好友、同事之间到底发生了什么事情。而这本书可以帮助我们穿越各种错综复杂的关系，穿越自我的障碍，通过学习如何面对自己最好以及最糟的特质，学会接纳、臣服和放手，来修复和重塑我们与亲密爱人、友人及自己之间的关系，并最终找到通往爱和幸福的路径。作者说：想幸福，要能断、舍、
OSPF知识之凹の鸥网络智能路由器
在网络工程师、系统工程师等岗位的面试中，OSPF（OpenShortestPathFirst，开放最短路径优先）是高频考点，尤其是对中高级网络岗位（如网络架构师、运维工程师）。以下是OSPF的核心考点和必须掌握的知识点，按优先级分类整理，帮助你高效备考：一、基础概念与核心机制OSPF的定义与特点定义：OSPF是一种基于链路状态（Link-State）的内部网关协议（IGP），用于在自治系统（AS）
LeetCode[位运算] - #137 Single Number II Cwind java Algorithm LeetCode 题解位运算
原题链接：#137 Single Number II 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现三次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：与#136类似，都是考察位运算。不过出现两次的可以使用异或运算的特性 n XOR n = 0, n XOR 0 = n，即某一
《JavaScript语言精粹》笔记 aijuans JavaScript
0、JavaScript的简单数据类型包括数字、字符创、布尔值（true/false）、null和undefined值，其它值都是对象。 1、JavaScript只有一个数字类型，它在内部被表示为64位的浮点数。没有分离出整数，所以1和1.0的值相同。 2、NaN是一个数值，表示一个不能产生正常结果的运算结果。NaN不等于任何值，包括它本身。可以用函数isNaN(number)检测NaN,但是
你应该更新的Java知识之常用程序库 Kai_Ge java
在很多人眼中，Java 已经是一门垂垂老矣的语言，但并不妨碍 Java 世界依然在前进。如果你曾离开 Java，云游于其它世界，或是每日只在遗留代码中挣扎，或许是时候抬起头，看看老 Java 中的新东西。 Guava Guava[gwɑ:və]，一句话，只要你做Java项目，就应该用Guava（Github）。 guava 是 Google 出品的一套 Java 核心库，在我看来，它甚至应该
HttpClient 120153216 httpclient
/** * 可以传对象的请求转发，对象已流形式放入HTTP中 */ public static Object doPost(Map<String,Object> parmMap,String url) { Object object = null; HttpClient hc = new HttpClient(); String fullURL
Django model字段类型清单 2002wmj django
Django 通过 models 实现数据库的创建、修改、删除等操作，本文为模型中一般常用的类型的清单，便于查询和使用： AutoField：一个自动递增的整型字段，添加记录时它会自动增长。你通常不需要直接使用这个字段；如果你不指定主键的话，系统会自动添加一个主键字段到你的model。(参阅自动主键字段) BooleanField：布尔字段,管理工具里会自动将其描述为checkbox。 Cha
在SQLSERVER中查找消耗CPU最多的SQL 357029540 SQL Server
返回消耗CPU数目最多的10条语句 SELECT TOP 10 total_worker_time/execution_count AS avg_cpu_cost, plan_handle, execution_count, (SELECT SUBSTRING(text, statement_start_of
Myeclipse项目无法部署，Undefined exploded archive location 7454103 eclipse MyEclipse
做个备忘！错误信息为： Undefined exploded archive location 原因：在工程转移过程中，导致工程的配置文件出错；解决方法：
GMT时间格式转换 adminjun GMT 时间转换
普通的时间转换问题我这里就不再罗嗦了，我想大家应该都会那种低级的转换问题吧，现在我向大家总结一下如何转换GMT时间格式，这种格式的转换方法网上还不是很多，所以有必要总结一下，也算给有需要的朋友一个小小的帮助啦。 1、可以使用 SimpleDateFormat SimpleDateFormat EEE-三位星期 d-天 MMM-月 yyyy-四位年
Oracle数据库新装连接串问题 aijuans oracle数据库
割接新装了数据库，客户端登陆无问题，apache/cgi-bin程序有问题，sqlnet.log日志如下： Fatal NI connect error 12170. VERSION INFORMATION: TNS for Linux: Version 10.2.0.4.0 - Product
回顾java数组复制 ayaoxinchao java 数组
在写这篇文章之前，也看了一些别人写的，基本上都是大同小异。文章是对java数组复制基础知识的回顾，算是作为学习笔记，供以后自己翻阅。首先，简单想一下这个问题：为什么要复制数组？我的个人理解：在我们在利用一个数组时，在每一次使用，我们都希望它的值是初始值。这时我们就要对数组进行复制，以达到原始数组值的安全性。java数组复制大致分为3种方式：①for循环方式 ②clone方式 ③arrayCopy方
java web会话监听并使用spring注入 bewithme Java Web
在java web应用中，当你想在建立会话或移除会话时，让系统做某些事情，比如说，统计在线用户，每当有用户登录时，或退出时，那么可以用下面这个监听器来监听。 import java.util.ArrayList; import java.ut
NoSQL数据库之Redis数据库管理(Redis的常用命令及高级应用) bijian1013 redis 数据库 NoSQL
一 .Redis常用命令 Redis提供了丰富的命令对数据库和各种数据库类型进行操作，这些命令可以在Linux终端使用。 a.键值相关命令 b.服务器相关命令 1.键值相关命令 &
java枚举序列化问题 bingyingao java 枚举序列化
对象在网络中传输离不开序列化和反序列化。而如果序列化的对象中有枚举值就要特别注意一些发布兼容问题: 1.加一个枚举值新机器代码读分布式缓存中老对象，没有问题，不会抛异常。老机器代码读分布式缓存中新对像，反序列化会中断，所以在所有机器发布完成之前要避免出现新对象，或者提前让老机器拥有新增枚举的jar。 2.删一个枚举值新机器代码读分布式缓存中老对象，反序列
【Spark七十八】Spark Kyro序列化 bit1129 spark
当使用SparkContext的saveAsObjectFile方法将对象序列化到文件，以及通过objectFile方法将对象从文件反序列出来的时候，Spark默认使用Java的序列化以及反序列化机制，通常情况下，这种序列化机制是很低效的，Spark支持使用Kyro作为对象的序列化和反序列化机制，序列化的速度比java更快，但是使用Kyro时要注意，Kyro目前还是有些bug。 Spark
Hybridizing OO and Functional Design bookjovi erlang haskell
推荐博文： Tell Above, and Ask Below - Hybridizing OO and Functional Design 文章中把OO和FP讲的深入透彻，里面把smalltalk和haskell作为典型的两种编程范式代表语言，此点本人极为同意，smalltalk可以说是最能体现OO设计的面向对象语言，smalltalk的作者Alan kay也是OO的最早先驱，
Java-Collections Framework学习与总结-HashMap BrokenDreams Collections
开发中常常会用到这样一种数据结构，根据一个关键字，找到所需的信息。这个过程有点像查字典，拿到一个key，去字典表中查找对应的value。Java1.0版本提供了这样的类java.util.Dictionary(抽象类)，基本上支持字典表的操作。后来引入了Map接口，更好的描述的这种数据结构。 &nb
读《研磨设计模式》-代码笔记-职责链模式-Chain Of Responsibility bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 业务逻辑：项目经理只能处理500以下的费用申请，部门经理是1000，总经理不设限。简单起见，只同意“Tom”的申请 * bylijinnan */ abstract class Handler { /*
Android中启动外部程序 cherishLC android
1、启动外部程序引用自： http://blog.csdn.net/linxcool/article/details/7692374 //方法一 Intent intent=new Intent(); //包名包名+类名（全路径） intent.setClassName("com.linxcool", "com.linxcool.PlaneActi
summary_keep_rate coollyj SUM
BEGIN /*DECLARE minDate varchar(20) ; DECLARE maxDate varchar(20) ;*/ DECLARE stkDate varchar(20) ; DECLARE done int default -1; /* 游标中注册服务器地址 */ DE
hadoop hdfs 添加数据目录出错 daizj hadoop hdfs 扩容
由于原来配置的hadoop data目录快要用满了，故准备修改配置文件增加数据目录，以便扩容，但由于疏忽，把core-site.xml, hdfs-site.xml配置文件dfs.datanode.data.dir 配置项增加了配置目录，但未创建实际目录，重启datanode服务时，报如下错误： 2014-11-18 08:51:39,128 WARN org.apache.hadoop.h
grep 目录级联查找 dongwei_6688 grep
在Mac或者Linux下使用grep进行文件内容查找时，如果给定的目标搜索路径是当前目录，那么它默认只搜索当前目录下的文件，而不会搜索其下面子目录中的文件内容，如果想级联搜索下级目录，需要使用一个“-r”参数： grep -n -r "GET" . 上面的命令将会找出当前目录“.”及当前目录中所有下级目录
yii 修改模块使用的布局文件 dcj3sjt126com yii layouts
方法一：yii模块默认使用系统当前的主题布局文件，如果在主配置文件中配置了主题比如: 'theme'=>'mythm', 那么yii的模块就使用 protected/themes/mythm/views/layouts 下的布局文件；如果未配置主题，那么 yii的模块就使用 protected/views/layouts 下的布局文件，总之默认不是使用自身目录 pr
设计模式之单例模式 come_for_dream 设计模式单例模式懒汉式饿汉式双重检验锁失败无序写入
今天该来的面试还没来，这个店估计不会来电话了，安静下来写写博客也不错，没事翻了翻小易哥的博客甚至与大牛们之间的差距，基础知识不扎实建起来的楼再高也只能是危楼罢了，陈下心回归基础把以前学过的东西总结一下。 *********************************
8、数组豆豆咖啡二维数组数组一维数组
一、概念数组是同一种类型数据的集合。其实数组就是一个容器。二、好处可以自动给数组中的元素从0开始编号，方便操作这些元素三、格式 //一维数组 1,元素类型[] 变量名 = new 元素类型[元素的个数] int[] arr =
Decode Ways hcx2013 decode
A message containing letters from A-Z is being encoded to numbers using the following mapping: 'A' -> 1 'B' -> 2 ... 'Z' -> 26 Given an encoded message containing digits, det
Spring4.1新特性——异步调度和事件机制的异常处理 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
squid3(高命中率)缓存服务器配置 liyonghui160com
系统:centos 5.x 需要的软件:squid-3.0.STABLE25.tar.gz 1.下载squid wget http://www.squid-cache.org/Versions/v3/3.0/squid-3.0.STABLE25.tar.gz tar zxf squid-3.0.STABLE25.tar.gz &&
避免Java应用中NullPointerException的技巧和最佳实践 pda158 java
1) 从已知的String对象中调用equals()和equalsIgnoreCase()方法，而非未知对象。　　总是从已知的非空String对象中调用equals()方法。因为equals()方法是对称的，调用a.equals(b)和调用b.equals(a)是完全相同的，这也是为什么程序员对于对象a和b这么不上心。如果调用者是空指针，这种调用可能导致一个空指针异常 Object unk
如何在Swift语言中创建http请求 shoothao http swift
概述：本文通过实例从同步和异步两种方式上回答了”如何在Swift语言中创建http请求“的问题。如果你对Objective-C比较了解的话，对于如何创建http请求你一定驾轻就熟了，而新语言Swift与其相比只有语法上的区别。但是，对才接触到这个崭新平台的初学者来说，他们仍然想知道“如何在Swift语言中创建http请求？”。在这里,我将作出一些建议来回答上述问题。常见的
Spring事务的传播方式 uule spring事务
传播方式：新建事务 required required_new - 挂起当前非事务方式运行 supports &nbs

有赞数据治理之路

你可能感兴趣的:(大数据技术在大厂的应用,数据治理)