Go中国

如何基于Go搭建一个大数据平台

大家下午好！我是来自七牛云大数据团队的党合萱。今天向大家介绍一下我们是如何基于Go搭建大数据平台的。

七牛的大数据的产品——Pandora

首先介绍一下七牛的大数据的产品——Pandora，我们的目的是提供简单、高效和开放的大数据平台。图 1 是我们的工作流，提供实时计算和离线计算。我们的数据流实时进来之后可以到下游的实时数据服务，最常见的场景是提供日志搜索和机器性能监控，就是看到的仪表盘（图2），还有就是基于 spark 做一些实时数据分析。

图1

图 2

图 3

图 4 是整个Pandora业务上的架构图。数据打进系统之后先落地到消息队列，落地之后有一个计算任务，数据经过计算之后还可以再次落地到消息队列。这个过程很灵活，比如可以选择最左边的一条线把数据直接倒出到下游的系统，图1上的示例是一个HTTP导出，除此之外还可以导出到实时数据库、日志检索服务，或者到七牛云存储上。日志检索服务上可以生成图3的柱状图，时序数据库可以生成上面的仪表盘分析（图 2）。

图 4

系统设计分析和架构

今天要和大家分享的是其中的一个环节——从消息队列导出数据到下游系统，即图 4 中的 Export Service 模块。这是一个连接上下游，有承上启下功能的系统，在实现过程中我们遇到了很多挑战。接下来，我们将从最初的设计开始，来看一下中间有哪些具体的挑战。

图 5

最开始做这个系统的时候，我们梳理了一下可能会遇到的一些问题，如图 5 所示。一个好的系统不仅要解决当下的问题，更要考虑到未来可预期时间里业务上或者数据规模上可能面临的一些挑战。这六点当中左边三点是我们在业务上考虑的，右边三点是从具体的实现或者架构上考虑的问题。可以看到最核心的要求就是系统要有高吞吐、低延时的能力。

图 6

图 6 是export service的系统全貌。这个系统最核心的是图中的红色和蓝色框部分，这是一个master/server结构的系统，经过master的分配和调度，把数据拉到下游的各个业务模块里。最右边的绿色框图是我们的监控系统，这个监控系统从最上层的业务指标、链路性能，以及机器的健康状况都可以收集和监控。黄色框图部分可以对业务和监控做可视化的展示。在图 1 的可视化的界面中，用户可以通过鼠标式的拖拽创建工作流，这个工作流的导出部分体现在导出系统当中就是做数据的拉取、处理和推送的工作。

多种上下游数据适配

图 7

图 8

我们对整个系统的要求，除了了高吞吐低延时之外，还必须能将数据传送到多种下游，比如说七牛云存储、数据库服务、实时数据库、日志检索当中去。这要求要考虑多种导出业务逻辑上的相同和不同的点。我们整理出两种模型，第一种是通用导出模型，一个任务开始执行之后，要从上游拉取数据，经过一些处理和过滤之后，将数据推送到下游系统，比如说图中的日志检索、时序数据和远端的http服务等。除此之外有一个特例，就是七牛云存储，系统数据导出到云存储之后不要有太多的小文件，也不要占用太多的空间，否则从存储费用和下游系统二次处理这些数据的角度看都有不少弊端。所以，我们增加了中间的两步，就是把数据存储在本地，进行一次压缩之后再存到云存储，这样的话可以有效的减少文件的个数，也能减小云存储空间的使用，降低了用户的成本。

高吞吐/低延迟问题探究

这个问题是比较困难的，尤其是在数据量比较大的时候，高吞吐和低延迟各自有一些困难的点。根据我们的实践过程来看，吞吐量方面遇到最大的问题就是资源的利用率不够高，或者上下游系统的吞吐量能力不一致，存在短板效应，我们需要做好几个系统之间的衔接。低延迟问题在很多情况下其实是对服务稳定性的一个要求，或者说要规避热点，就是如果真的有一个任务比较热、比较重，怎么做才能合理切分和规避热点。最后就是一些环节上可能过度消耗资源，这在很大的程度上就是代码写的好不好的问题。在所有问题当中，如果有那么一个两个没有得到很好的解决，就会出现lag，比如说用户打到消息队列里面的数据，半个小时都没能导出，对用户来讲这就是灾难性的结果，尤其是那些对我们业务有强依赖的产品。

为了逐步减轻高吞吐和低延迟方面的问题，我们做了一些优化。第一个优化就是在消费数据的过程中做预取。从下游取数据的时候，需要拉取数据过来。一开始看到是简单的模型，先拉取再推送，但数据量打了之后我们发现机器的资源利用率并不高，lag以肉眼可见的速度在上涨。观察后发现任务中数据的拉和推应该同时进行，在推数据的同时预取下一批数据，这样从单位时间处理数据量上来看效率有一倍的提升。

图 9

第二个就是我们做了数据推送协议的优化。我们从export service推送数据的时候用了Json格式，但是它的序列化和反序列化的性能比较差，影响服务的整体性能，经过调研我们将Json格式换成了Protobuf格式，经观察带宽消耗减少了近一倍，吞吐量提升了，CPU消耗也降低了一倍以上。

我们还优化了资源的使用方式，在数据导出到云存储时，为了节省空间，而且考虑到下游系统使用数据的便利，我们使用了parquet压缩。parquet的压缩效率是随着文件的大小而改变的，经过观察，大约1GB左右的文件压缩效果是最优，可以达到8：1左右。后来业务量逐渐增大以后，我们发现parquet压缩的CPU使用情况超过了我们的预期，如果同时有十到二十个文件一起做压缩，CPU就会打满，这时候网络拉取也会受到比较大的影响，速度会降低到总带宽的三分之一或者四分之一，总体来看，这种情况会影响导出的性能，对外表现出来就是数据可能来不及导出从而出现lag。观察到这个情况之后我们就对parquet压缩的并发度进行了限制，比如说最多只允许八个或者十个parquet压缩，这样做可以相对有效的降低CPU的峰值，但我们还没有更精确、更平滑的使用CPU资源，虽然限制了并发度，但偶尔也会出现CPU飙高的情况，我们后续会继续在CPU的平滑使用上做一些工作，彻底的规避掉这个情况。

提升了导出的性能之后，上下游系统的处理能力之间不匹配就有可能出现木桶效应，一方面数据吞吐量难以再进行提升，另一方面可能会将连接的上游或者下游打垮。那么该如何感知上下游系统的压力，压力到一定程度之后，如何做一些退避，我们采用了一些实践比较好的指标。第一个是退避时间，我们从kafka拉数据的时候，如果拉取过慢（1秒或者是2秒以上）我们就将两个批次之间的休眠时间扩大一倍，但这种策略对我们的效率影响很大。还有特定的错误码，这可以视作下游系统的一个负载过大的信号，需要少发一些数据。再就是超时，我们拉数据的时候并不是一个数据点，而是一个批次，有些数据点比较大，有些数据点就有1M、2M，如果同时拉2万个点，就没办法等到这个数据，30秒可能就超时了，针对这个就认为对上游的数据影响比较大。

刚才说我们是一个批次一个批次来做，批次的数量有个上限和下限，怎么设置上限和下限呢？有快启动和慢启动两种方式。我们先尝试了慢启动，发现这个资源的使用率变得很低。因为一个批次是从比较小的数量开始，增加到一个合理的大小是需要时间的，但是线上的实际情况当中，大部分的用户数据点比较小，没必要使用慢启动慢慢寻找这个合理批次的大小，时间上浪费比较大，所以我们采用了快启动方式。只有极个别的任务数据点比较大，可能遇到批次需要减小的问题。

还有退避策略，如果上游或者是下游，遇到繁忙、没有数据或者说数据比较稀疏的时候，怎么做一些退避，避免不停的造成压力。一旦出现这种情况，前5次拉取和到处的过程中会休眠1秒钟，如果休眠结束后还是需要退避，我们会对休眠时间做指数极的增大，直到它增加到一个上限值，比如说32秒为止。

高可用和水平拓展

我们的系统是一个master/server的结构，要达到低延迟和高吞吐的目标，节点的高可用和系统的可扩展行是一个必须考虑的问题。

master负责的任务、切分和server的感知，以及任务的调度和分发。比如说T1、T2、T3，如何进行任务的切分，切分之后分配在不同的机器上，才能将热点进行拆分。

图 10

我们看一下master如何做到高可用，在设计的时候master尽可能做成一个无状态的节点，它的所有身份信息包括一些中间的调度状态，我们把它定期放在zookeeper上。系统启动的时候，多个master实例通过抢锁的方式决定谁成为主master，其他没抢到锁的master就会成为备选的节点。如果这时网络断掉，或者主master宕机，master就会发生主备切换。由于master的身份信息都注册在zookeeper上，所有的sever通过监听zookeeper就能感知到master切换的这个事件，这就是master高可用的实现原理。

图 11

图 12

那么server是如何实现高可用的呢？server要通过上报心跳的方式表明自己的存在，以及自己正在执行哪些任务。比如说server1正在执行三个任务，现在网络断联，master在两个心跳周期内一直都没有发现server1的存在，那么server1上面的T1、T2、T3就被master调度到其他的机器上，server1就从集群中摘掉了。这里的server也是无状态的设计，某一台机器的宕机不会对服务造成影响。

除了高可用之外，水平扩展也是影响系统可用性的重要因素，水平扩展的需求经常出现在系统资源水位比较高的时候，比如说现在有3台机器，由于业务量的增大，CPU、网络等资源接近满载，实在不堪重负，这时候可以增加1台机器。增加机器之后，master通过心跳发现了新的server，对各个服务器之间的压力做出评估之后，发现新加的server4处于空闲的状态，就会尝试从比较繁忙的server1和server2上调度一些任务过来，分配到server4上。因为我们是通过心跳的方式来感觉新的server，所以水平扩展的复杂程度很低，只要把新的server按照同样的配置启动就可以，它会自动加入到集群当中去。

图 13

看完了刚才的高可用和水平扩展之后，可以看一下整个Export Service。export master有个任务扫描器、执行计划发送器和心跳收集器。心跳收集器会收到每台机器的心跳，形成server列表，server列表包括了所有资源的使用，包括CPU、跑的任务等。经过一次评话之后，信息被传送到执行器，执行器里有好几个调度组。每一个调度组中有各自的export server，以及各自不同的任务，各个调度组之间是完全隔离的。各个调度组调度的结果会统一传送给发送器，发送器会周期性的把计划下发给每个server。

这里一定有人会问为什么还有M个调度组，调度组的出现是刚才已经看到了下游系统有好几种，比如说实时数据库、云存储。我们对每个任务组使用的资源方式不同，所以在每个调度组里可以看到一些调度的参数，包括对一些不同的资源权重可以单独进行设置，包括调度的间隔以及平滑机的平滑方式都可以单独设置。其实平滑器是嵌在调度组里的。还有一些大任务，这些大任务过来之后独占一个机器，就和小任务做了物理上的隔离，避免相互干扰导致的数据延迟。我们看到图的最上方有个RESTful的管理接口，下面有一个调度执行器可以看到任务的执行情况和调度组的情况，作为工程师可以通过调度接口了解集群的情况。还有监控报警，包括下游系统，也可以通过接口查看系统的状况，对系统资源做一些调整。

图 14

在了解了调度的框架之后，接下来我们看一下是系统是如何调度任务的。我们的目标是提高资源的利用率，减少任务之间的影响，包括说尽量把降低任务的延迟。最后一点比较特殊，我们要尝试用各种异构的机器。最开始设置的时候，发现我们的服务器有好几种不同的规格，比如说CPU、网络，甚至硬盘的规格以及数量差异都很大。我们怎么才能合理的去调度，利用这些机器呢？我们对整个调度做了一些抽象，就是怎么去评估资源的需求和余量。比如说一台四核16G的机器和一台两核的机器差别是什么，应该怎么用它呢？就涉及到第一个问题，就是它的需求和余量评估，还有任务的轻和重。并不是每个任务都一样，总是有一些任务数据来得又快又猛，有一些相对比较空闲，量化它也是一个调量。

第三个是任务间的影响，大任务和小任务，大任务对小任务冲击，怎么才能不影响小任务，或者他们之间不要互相影响，我们在这个过程中做了一些抽象抽象之后定量，比如说CPU的余量。假设现在这个机器控制了一个核，CPU的资源就有1分，网络也是一样，10M就是一个资源的力度。

还有就是一些资源和打分，比如说任务有多重，过去的一段时间里，到底使用了多少个CPU，有多少数据，使用了多少网卡都考虑进去。还有就是分布度的打分，我们发现任务分布的不均匀会对导出效率产生影响，所以我们要平均分配在不同的机器上，所以会有分布度的打分。

最后是指标之间的权重，比如说CPU的使用和网卡到底哪个比较重要，哪个对我们的影响比较大。我们在每个调度组里有不同的权重进行控制。最后通过任务的打分、分布度评估机器，在任务的分布时候做一些任务的调整，轻松一点的就多分配一点任务，重一点的机器就会让它空闲一点，通过分担让任务尽量不要有延迟，不要有资源的过度消耗。

自动化运维

图 15

做完上面的事情之后总有运维的过程，写代码突然被打断了，会感觉很不爽，所以我们希望尽量自动化一点。我们是如何做自动化运维的，首先从监控来看，我们使用了一个比较有力的工具就是logkit，这是我们大数据团队用纯Golang开发的工具，这个工具可以采集机器上的一些信息，比如说网卡、CPU都可以采集，同时也支持多种下游系统的推送，推送到Pandora本身以及时序数据库。通过grafana进行实时的推送。还有slack，我们工作经常会用这个沟通，如果有出现问题，第一时间会有反馈。还有就是email。我们还有自己写的监控脚本，对数据进行一些聚合或者说分析处理之后，会给下游的系统，或者说通过邮件的方式，让每个人都可以看到。

系统热点自动感知与调整。在logkit收集数据之后，全部转到Pandora或者七牛云存储之上，基于xspark服务进行分析，看一下历史的流量，比如从昨天1点、2点、3点每个时间段资源的使用以及任务的分配，究竟是怎样的。从历史数据做一个基本的预测，比如说今天究竟流量可能会达到什么样的程度。然后，我们的master和server之间会上报心跳，心跳之中会包含很多的实时数据。通过实时数据和历史预测数据的结合，我们会考虑是不是暂时，或者说数据真的会热起来，提供参考对系统进行调整。

经过了所有的工作之后，现在的系统现状就是每天处理超过千亿的数据点，超过百TB的数据量。正常的业务导出延迟都在1分之内，用户导出数据之后可以在日志里检索数据，可以在grafana里面看到。就是刚才说的不希望在写代码的时候被打断，极少的人工介入。我们秒级的扩容，我们直接把服务器进去就登载master的调度，把热度切过来就比较容易。还有就是实时了可视化监控系统和报警，其实主要是通过logkit。还会生成自动生成线上日报，看哪些的延迟是比较大的，包括有些错误都会发出来。其实除此之外，还有一些小时级的邮件，通过它来看是不是真的有问题，看线上的状况如何。

Go的应用

在整个开发和设计过程中，我们是怎么用Go的呢？Pandora的流式计算、离线计算、日志检索、时序数据库等一整套服务的核心代码都是用Go开发的，还有刚才提到的logkit、还有一整套的脚本语言工具都是用Go来开发的。

为什么选择Go？真的是比较容易上手，入门也简单，我之前一直是写C++，到了七牛之后，原本我以为会有一些C++，看到全部是Go的时候，刚开始也略有担心，实际上一天就可以写出可以用的代码。就是因为这个语言的特性，它的语法相对比较简单，而且由于提供了更容易的并发模型，降低了整个程序员的心智负担，可以让大家把精力集中在业务逻辑上，不用像过去一样纠结这个地方要怎么写，或者总是编译不过的事情已经很少了。还有就是它有比较丰富的库，一般遇到的问题，在官方的库中都可以找到解决方案，除此之外github上也有很丰富的资源可以使用。七牛是国内第一批在Go语言方面进行实践的公司。七牛内部的RPC、缓存系统等都已经打磨的很成熟，基于这些已有的东西进行系统开发确实比较容易，所以我们选择了Go语言。事实证明我们的开发节奏比较快，对于需求的反应比较灵敏，所以Go语言是很好的选择。

了解更多大数据玩法，点击“阅读原文”

与会者：我有两个问题，第一个是刚才看您的架构是双股的玩法，这个双股的策略是怎么样的呢？就是里面有双master的。

党合萱：现在我们是通过抢锁的方式，同一时间只有一个master，如果出现问题，就立马自杀，进入抢锁的逻辑，所以不会出现双master的情况。

与会者：这样会带来一个问题，一台永远是忙着，另一台备着永远是空闲。

党合萱：是有这个可能。

与会者：另外我们会做多个数据源的抽取，抽取了之后，我看有一个实时数据过来的，你们的任务策略是怎么安排的？

党合萱：我们到云存储是作为单独的分组，对于其他的实时数据库或者是http都是绑在一起的，因为这样的数据量和导出模型类似，基本上没有相互的影响，所以都放在一起。

与会者：你好！我想问一下，你们的产品是你们自己内部用还是外部使用？

党合萱：现在我们内部在使用，外部也在逐渐使用。

与会者：刚才讲的分组量和lag的问题，刚才你说数据预取怎么操作？因为Kafka的并发速度超过了效用，和你刚才说的预取怎么处理？

党合萱：这个预取是基于单个的流做，这涉及到outsinde进行处理。如果这个数据没有处理，其他数据还在往上走，会出现数据空洞，是这难以处理。所以我们是一个每一个contion（音），有一个线程的数据，拿到一批数据就从这里取一个数据过来，一对一的处理。

与会者：我想问一下这个产品整个系统QPS是多少？Kafka需要多少个集群？

党合萱：我们现在QPS是每分钟有接近200万个。

与会者：200万个QPS？

党合萱：就是请求个数，就是每个请求会有多少处理。

与会者：刚才你的架构图里有一个report studio

党合萱：这和garafa不一样。

与会者：所以是你们自己开发的报表系统？

党合萱：对。

芦花鞋一四许叶晗
又是在一个寒冷的夏日里，青铜和葵花决定今天一起去卖芦花鞋，奶奶亲手给他们做了一碗热乎乎的粥对他们说:“就靠你们两挣生活费了这碗粥赶紧趁热喝了吧！”于是青铜和葵花喝完了奶奶给她们做的粥，就准备去镇上卖卢花鞋，这回青铜和葵花穿着新的芦花鞋来到了镇上。青铜这回看到了很多人都在卖，用手势表达对葵花说:“这回有好多人在抢我们生意呢！我们必须得吆喝起来。”葵花点了点头。可是谁知他们也大声的叫，卖芦花喽！卖芦花
关于沟通这件事，项目经理不需要每次都面对面进行流程大师兄
很多项目经理都会遇到这样的问题，项目中由于事情太多，根本没有足够的时间去召开会议，那在这种情况下如何去有效地管理项目中的利益相关者？当然，不建议电子邮件也不需要开会的话，建议可以采取下面几种方式来形成有效的沟通，这几种方式可以帮助你努力的通过各种办法来保持和各方面的联系。项目经理首先要问自己几个问题，项目中哪些利益相关者是必须要进行沟通的？可以列出项目中所有的利益相关者清单，同时也整理出项目中哪些
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说造命者说
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说我叫吴起，生于公元前440年的战国初期，正是群雄并起、天下纷争不断的时候。后人说我是军事家、政治家、改革家，是兵家代表人物。评价我一生历仕鲁、魏、楚三国，通晓兵家、法家、儒家三家思想，在内政军事上都有极高的成就。周安王二十一年（公元前381年），因变法得罪守旧贵族，被人乱箭射死。我出生在卫国一个“家累万金”的富有家庭，从年轻时候起就不甘平凡
2020-01-25 晴岚85
郑海燕坚持分享590天2020.1.24在生活中只存在两个问题。一个问题是：你知道想要达成的目标是什么，但却不知道如何才能达成；另一个问题是：你不知道你的目标是什么。前一个是行动的问题，后一个是结果的问题。通过制定具体的下一步行动，可以解决不知道如何开始行动的问题。而通过去想象结果，对结果做预估，可以解决找不着目标的问题。对于所有吸引我们注意力，想要完成的任务，你可以先想象一下，预期的结果究竟是什
随笔 | 仙一般的灵气海思沧海
仙岛今天，我看了你全部，似乎已经进入你的世界我不知道，这是否是梦幻，还是你仙一般的灵气吸引了我也许每一个人都要有一份属于自己的追求，这样才能够符合人生的梦想，生活才能够充满着阳光与快乐我不知道，我为什么会这样的感叹，是在感叹自己的人生，还是感叹自己一直没有孜孜不倦的追求只感觉虚度了光阴，每天活在自己的梦中，活在一个不真实的世界是在逃避自己，还是在逃避周围的一切有时候我嘲笑自己，嘲笑自己如此的虚无，
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
OC语言多界面传值五大方式 Magnetic_h ios ui 学习 objective-c 开发语言
前言在完成暑假仿写项目时，遇到了许多需要用到多界面传值的地方，这篇博客来总结一下比较常用的五种多界面传值的方式。属性传值属性传值一般用前一个界面向后一个界面传值，简单地说就是通过访问后一个视图控制器的属性来为它赋值，通过这个属性来做到从前一个界面向后一个界面传值。首先在后一个界面中定义属性@interfaceBViewController:UIViewController@propertyNSSt
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
10月|愿你的青春不负梦想-读书笔记-01 Tracy的小书斋
本书的作者是俞敏洪，大家都很熟悉他了吧。俞敏洪老师是我行业的领头羊吧，也是我事业上的偶像。本日摘录他书中第一章中的金句：『一个人如果什么目标都没有，就会浑浑噩噩，感觉生命中缺少能量。能给我们能量的，是对未来的期待。第一件事，我始终为了进步而努力。与其追寻全世界的骏马，不如种植丰美的草原，到时骏马自然会来。第二件事，我始终有阶段性的目标。什么东西能给我能量？答案是对未来的期待。』读到这里的时候，我便
地推话术，如何应对地推过程中家长的拒绝校师学
相信校长们在做地推的时候经常遇到这种情况：市场专员反馈家长不接单，咨询师反馈难以邀约这些家长上门，校区地推疲软，招生难。为什么？仅从地推层面分析，一方面因为家长受到的信息轰炸越来越多，对信息越来越“免疫”；而另一方面地推人员的专业能力和营销话术没有提高，无法应对家长的拒绝，对有意向的家长也不知如何跟进，眼睁睁看着家长走远；对于家长的疑问，更不知道如何有技巧地回答，机会白白流失。由于回答没技巧和专业
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
小丽成长记（四十三）玲玲54321
小丽发现，即使她好不容易调整好自己的心态下一秒总会有不确定的伤脑筋的事出现，一个接一个的问题，人生就没有停下的时候，小问题不断出现。不过她今天看的书，她接受了人生就是不确定的，厉害的人就是不断创造确定性，在Ta的领域比别人多的确定性就能让自己脱颖而出，显示价值从而获得的比别人多的利益。正是这样的原因，因为从前修炼自己太少，使得她现在在人生道路上打怪起来困难重重，她似乎永远摆脱不了那种无力感，有种习
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
瑶池防线谜影梦蝶
冥华虽然逃过了影梦的军队，但他是一个忠臣，他选择上报战况。败给影梦后成逃兵，高层亡尔还活着，七重天失守......随便一条，即可处死冥华。冥华自然是知道以仙界高层的习性此信一发自己必死无疑，但他还选择上报实情，因为责任。同样此信送到仙宫后，知道此事的人，大多数人都认定冥华要完了，所以上到仙界高层，下到扫大街的，包括冥华自己，全都准备好迎接冥华之死。如果仙界现在还属于两方之争的话，冥华必死无疑。然而
《投行人生》读书笔记小蘑菇的树洞
《投行人生》----作者詹姆斯-A-朗德摩根斯坦利副主席40年的职业洞见-很短小精悍的篇幅，比较适合初入职场的新人。第一部分成功的职业生涯需要规划1.情商归为适应能力分享与协作同理心适应能力，更多的是自我意识，你有能力识别自己的情并分辨这些情绪如何影响你的思想和行为。2.对于初入职场的人的建议，细节，截止日期和数据很重要截止日期，一种有效的方法是请老板为你所有的任务进行优先级排序。和老板喝咖啡的好
《策划经理回忆录之二》路基雅虎
话说三年变六年，飘了，飘了……眨眼，2013年5月，老吴回到了他的家乡——油城从新开启他的工作幻想症生涯。很庆幸，这是一家很有追求，同时敢于尝试的，且实力不容低调的新星房企——金源置业(前身泰源置业)更值得庆幸的是第一个盘就是油城十路的标杆之一:金源盛世。2013年5月，到2015年11月，两年的陪伴，迎来了一场大爆发。2000个筹，5万/筹，直接回笼1个亿！！！这……让我开始认真审视这座看似五线
Long类型前后端数据不一致 igotyback 前端
响应给前端的数据浏览器控制台中response中看到的Long类型的数据是正常的到前端数据不一致前后端数据类型不匹配是一个常见问题，尤其是当后端使用Java的Long类型（64位）与前端JavaScript的Number类型（最大安全整数为2^53-1，即16位）进行数据交互时，很容易出现精度丢失的问题。这是因为JavaScript中的Number类型无法安全地表示超过16位的整数。为了解决这个问
如何在 Fork 的 GitHub 项目中保留自己的修改并同步上游更新？github_fork_update iBaoxing github
如何在Fork的GitHub项目中保留自己的修改并同步上游更新？在GitHub上Fork了一个项目后，你可能会对项目进行一些修改，同时原作者也在不断更新。如果想要在保留自己修改的基础上，同步原作者的最新更新，很多人会不知所措。本文将详细讲解如何在不丢失自己改动的情况下，将上游仓库的更新合并到自己的仓库中。问题描述假设你在GitHub上Fork了一个项目，并基于该项目做了一些修改，随后你发现原作者对
扫地机类清洁产品之直流无刷电机控制悟空胆好小清洁服务机器人单片机人工智能
扫地机类清洁产品之直流无刷电机控制1.1前言扫地机产品有很多的电机控制，滚刷电机1个，边刷电机1-2个，清水泵电机，风机一个，部分中高端产品支持抹布功能，也就是存在抹布盘电机，还有追觅科沃斯石头等边刷抬升电机，滚刷抬升电机等的，这些电机有直流有刷电机，直接无刷电机，步进电机，电磁阀，挪动泵等不同类型。电机的原理，驱动控制方式也不行。接下来一段时间的几个文章会作个专题分析分享。直流有刷电机会自动持续
绘本讲师训练营【24期】8/21阅读原创《独生小孩》 1784e22615e0
24016-孟娟《独生小孩》图片发自App今天我想分享一个蛮特别的绘本，讲的是一个特殊的群体，我也是属于这个群体，80后的独生小孩。这是一本中国绘本，作者郭婧，也是一个80厚。全书一百多页，均为铅笔绘制，虽然为黑白色调，但并不显得沉闷。全书没有文字，犹如“默片”，但并不影响读者对该作品的理解，反而显得神秘，梦幻，給读者留下想象的空间。作者在前蝴蝶页这样写到：“我更希望父母和孩子一起分享这本书，使他
30天风格练习-DAY2 黄希夷
Day2（重义）在一个周日/一周的最后一天，我来到位于市中心/市区繁华地带的一家购物中心/商场，中心内人很多/熙熙攘攘。我注意到/看见一个独行/孤身一人的年轻女孩/，留着一头引人注目/长过腰际的头发，上身穿一件暗红色/比正红色更深的衣服/穿在身体上的东西。走下扶梯的时候，她摔倒了/跌向地面，在她正要站起来/让身体离开地面的时候，过长/超过一般人长度的头发被支撑身体/躯干的手掌压/按在下面，她赶紧用
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
消息中间件有哪些常见类型 xmh-sxh-1314 java
消息中间件根据其设计理念和用途，可以大致分为以下几种常见类型：点对点消息队列（Point-to-PointMessagingQueues）：在这种模型中，消息被发送到特定的队列中，消费者从队列中取出并处理消息。队列中的消息只能被一个消费者消费，消费后即被删除。常见的实现包括IBM的MQSeries、RabbitMQ的部分使用场景等。适用于任务分发、负载均衡等场景。发布/订阅消息模型（Pub/Sub
html 中如何使用 uniapp 的部分方法某公司摸鱼前端 html uni-app 前端
示例代码：Documentconsole.log(window);效果展示：好了，现在就可以uni.使用相关的方法了
高级编程--XML+socket练习题 masa010 java 开发语言
1.北京华北2114.8万人上海华东2,500万人广州华南1292.68万人成都华西1417万人（1）使用dom4j将信息存入xml中（2）读取信息，并打印控制台（3）添加一个city节点与子节点（4）使用socketTCP协议编写服务端与客户端，客户端输入城市ID，服务器响应相应城市信息（5）使用socketTCP协议编写服务端与客户端，客户端要求用户输入city对象，服务端接收并使用dom4j
抖音乐买买怎么加入赚钱?赚钱方法是什么测评君高省
你会在抖音买东西吗?如果会，那么一定要免费注册一个乐买买，抖音直播间，橱窗，小视频里的小黄车买东西都可以返佣金!省下来都是自己的，分享还可以赚钱乐买买是好省旗下的抖音返佣平台，乐买买分析社交电商的价值，乐买买属于今年难得的副业项目风口机会，2019年错过做好省的搞钱的黄金时期，那么2022年千万别再错过乐买买至于我为何转到高省呢？当然是高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自
那个抄袭的大张伟猫小努
最近一直在追《即刻电音》这个综艺，除了觉得出场节目的音乐制作人有意思之外，也觉得有两个导师挺有趣的（另外一个就忽略了吧）。孙艺兴在上一篇文章里面已经说过了，那么这篇就说说我们的大老师，大张伟吧。其实在节目刚开始大张伟出来的时候，我以为他是属于导师里面来活跃气氛负责搞笑的，毕竟孙艺兴属于卖萌卖傻卖老实的，尚雯婕一般负责装逼耍狠的，而大张伟一贯以来上综艺的形象基本上都是蹦蹦跳跳带动气氛的。谁知道，两期
java解析APK 3213213333332132 java apk linux 解析APK
解析apk有两种方法 1、结合安卓提供apktool工具，用java执行cmd解析命令获取apk信息 2、利用相关jar包里的集成方法解析apk 这里只给出第二种方法，因为第一种方法在linux服务器下会出现不在控制范围之内的结果。 public class ApkUtil { /** * 日志对象 */ private static Logger
nginx自定义ip访问N种方法 ronin47 nginx 禁止ip访问
　　　因业务需要，禁止一部分内网访问接口，　由于前端架了F5，直接用deny或allow是不行的，这是因为直接获取的前端Ｆ５的地址。　　　所以开始思考有哪些主案可以实现这样的需求，目前可实施的是三种：　　　一：把ip段放在redis里，写一段lua 二：利用geo传递变量，写一段
mysql timestamp类型字段的CURRENT_TIMESTAMP与ON UPDATE CURRENT_TIMESTAMP属性 dcj3sjt126com mysql
timestamp有两个属性，分别是CURRENT_TIMESTAMP 和ON UPDATE CURRENT_TIMESTAMP两种，使用情况分别如下： 1. CURRENT_TIMESTAMP 当要向数据库执行insert操作时，如果有个timestamp字段属性设为 CURRENT_TIMESTAMP，则无论这
struts2+spring+hibernate分页显示 171815164 Hibernate
分页显示一直是web开发中一大烦琐的难题，传统的网页设计只在一个JSP或者ASP页面中书写所有关于数据库操作的代码，那样做分页可能简单一点，但当把网站分层开发后，分页就比较困难了，下面是我做Spring+Hibernate+Struts2项目时设计的分页代码，与大家分享交流。　　1、DAO层接口的设计，在MemberDao接口中定义了如下两个方法： public in
构建自己的Wrapper应用 g21121 rap
我们已经了解Wrapper的目录结构，下面可是正式利用Wrapper来包装我们自己的应用，这里假设Wrapper的安装目录为:/usr/local/wrapper。首先，创建项目应用 &nb
[简单]工作记录_多线程相关 53873039oycg 多线程
最近遇到多线程的问题,原来使用异步请求多个接口(n*3次请求) 方案一使用多线程一次返回数据,最开始是使用5个线程,一个线程顺序请求3个接口,超时终止返回缺点测试发现必须3个接
调试jdk中的源码，查看jdk局部变量程序员是怎么炼成的 jdk 源码
转自：http://www.douban.com/note/211369821/ 学习jdk源码时使用-- 学习java最好的办法就是看jdk源代码，面对浩瀚的jdk（光源码就有40M多，比一个大型网站的源码都多）从何入手呢，要是能单步调试跟进到jdk源码里并且能查看其中的局部变量最好了。可惜的是sun提供的jdk并不能查看运行中的局部变量
Oracle RAC Failover 详解 aijuans oracle
Oracle RAC 同时具备HA(High Availiablity) 和LB(LoadBalance). 而其高可用性的基础就是Failover(故障转移). 它指集群中任何一个节点的故障都不会影响用户的使用，连接到故障节点的用户会被自动转移到健康节点，从用户感受而言，是感觉不到这种切换。 Oracle 10g RAC 的Failover 可以分为3种： 1. Client-Si
form表单提交数据编码方式及tomcat的接受编码方式 antonyup_2006 JavaScript tomcat 浏览器互联网 servlet
原帖地址：http://www.iteye.com/topic/266705 form有2中方法把数据提交给服务器，get和post,分别说下吧。（一）get提交 1.首先说下客户端（浏览器）的form表单用get方法是如何将数据编码后提交给服务器端的吧。对于get方法来说，都是把数据串联在请求的url后面作为参数，如：http://localhost:
JS初学者必知的基础百合不是茶 js函数 js入门基础
JavaScript是网页的交互语言,实现网页的各种效果, JavaScript 是世界上最流行的脚本语言。 JavaScript 是属于 web 的语言，它适用于 PC、笔记本电脑、平板电脑和移动电话。 JavaScript 被设计为向 HTML 页面增加交互性。许多 HTML 开发者都不是程序员，但是 JavaScript 却拥有非常简单的语法。几乎每个人都有能力将小的
iBatis的分页分析与详解 bijian1013 java ibatis
分页是操作数据库型系统常遇到的问题。分页实现方法很多，但效率的差异就很大了。iBatis是通过什么方式来实现这个分页的了。查看它的实现部分，发现返回的PaginatedList实际上是个接口，实现这个接口的是PaginatedDataList类的对象，查看PaginatedDataList类发现，每次翻页的时候最
精通Oracle10编程SQL(15)使用对象类型 bijian1013 oracle 数据库 plsql
/* *使用对象类型 */ --建立和使用简单对象类型 --对象类型包括对象类型规范和对象类型体两部分。 --建立和使用不包含任何方法的对象类型 CREATE OR REPLACE TYPE person_typ1 as OBJECT( name varchar2(10),gender varchar2(4),birthdate date ); drop type p
【Linux命令二】文本处理命令awk bit1129 linux命令
awk是Linux用来进行文本处理的命令，在日常工作中，广泛应用于日志分析。awk是一门解释型编程语言，包含变量，数组，循环控制结构，条件控制结构等。它的语法采用类C语言的语法。 awk命令用来做什么？ 1.awk适用于具有一定结构的文本行，对其中的列进行提取信息 2.awk可以把当前正在处理的文本行提交给Linux的其它命令处理，然后把直接结构返回给awk 3.awk实际工
JAVA(ssh2框架)+Flex实现权限控制方案分析白糖_ java
目前项目使用的是Struts2+Hibernate+Spring的架构模式，目前已经有一套针对SSH2的权限系统，运行良好。但是项目有了新需求：在目前系统的基础上使用Flex逐步取代JSP，在取代JSP过程中可能存在Flex与JSP并存的情况，所以权限系统需要进行修改。【SSH2权限系统的实现机制】权限控制分为页面和后台两块：不同类型用户的帐号分配的访问权限是不同的，用户使
angular.forEach boyitech AngularJS AngularJS API angular.forEach
angular.forEach 描述: 循环对obj对象的每个元素调用iterator, obj对象可以是一个Object或一个Array. Iterator函数调用方法: iterator(value, key, obj), 其中obj是被迭代对象，key是obj的property key或者是数组的index，value就是相应的值啦. (此函数不能够迭代继承的属性.)
java-谷歌面试题-给定一个排序数组，如何构造一个二叉排序树 bylijinnan 二叉排序树
import java.util.LinkedList; public class CreateBSTfromSortedArray { /** * 题目:给定一个排序数组，如何构造一个二叉排序树 * 递归 */ public static void main(String[] args) { int[] data = { 1, 2, 3, 4,
action执行2次 Chen.H JavaScript jsp XHTML css Webwork
xwork 写道 <action name="userTypeAction" class="com.ekangcount.website.system.view.action.UserTypeAction"> <result name="ssss" type="dispatcher">
[时空与能量]逆转时空需要消耗大量能源 comsci 能源
无论如何,人类始终都想摆脱时间和空间的限制....但是受到质量与能量关系的限制,我们人类在目前和今后很长一段时间内,都无法获得大量廉价的能源来进行时空跨越..... 在进行时空穿梭的实验中,消耗超大规模的能源是必然
oracle的正则表达式(regular expression)详细介绍 daizj oracle 正则表达式
正则表达式是很多编程语言中都有的。可惜oracle8i、oracle9i中一直迟迟不肯加入，好在oracle10g中终于增加了期盼已久的正则表达式功能。你可以在oracle10g中使用正则表达式肆意地匹配你想匹配的任何字符串了。正则表达式中常用到的元数据(metacharacter)如下： ^ 匹配字符串的开头位置。 $ 匹配支付传的结尾位置。 *
报表工具与报表性能的关系 datamachine 报表工具 birt 报表性能润乾报表
在选择报表工具时，性能一直是用户关心的指标，但是，报表工具的性能和整个报表系统的性能有多大关系呢？要回答这个问题，首先要分析一下报表的处理过程包含哪些环节，哪些环节容易出现性能瓶颈，如何优化这些环节。一、报表处理的一般过程分析 1、用户选择报表输入参数后，报表引擎会根据报表模板和输入参数来解析报表，并将数据计算和读取请求以SQL的方式发送给数据库。 2、
初一上学期难记忆单词背诵第一课 dcj3sjt126com word english
what 什么 your 你 name 名字 my 我的 am 是 one 一 two 二 three 三 four 四 five 五 class 班级，课 six 六 seven 七 eight 八 nince 九 ten 十 zero 零 how 怎样 old 老的 eleven 十一 twelve 十二 thirteen
我学过和准备学的各种技术 dcj3sjt126com 技术
语言VB https://msdn.microsoft.com/zh-cn/library/2x7h1hfk.aspxJava http://docs.oracle.com/javase/8/C# https://msdn.microsoft.com/library/vstudioPHP http://php.net/manual/en/Html
struts2中token防止重复提交表单蕃薯耀重复提交表单 struts2中token
struts2中token防止重复提交表单 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月12日 11:52:32 星期日 ht
线性查找二维数组 hao3100590 二维数组
1.算法描述有序（行有序，列有序，且每行从左至右递增，列从上至下递增）二维数组查找，要求复杂度O(n) 2.使用到的相关知识：结构体定义和使用，二维数组传递（http://blog.csdn.net/yzhhmhm/article/details/2045816） 3.使用数组名传递这个的不便之处很明显，一旦确定就是不能设置列值 //使
spring security 3中推荐使用BCrypt算法加密密码 jackyrong Spring Security
spring security 3中推荐使用BCrypt算法加密密码了，以前使用的是md5， Md5PasswordEncoder 和 ShaPasswordEncoder，现在不推荐了，推荐用bcrpt Bcrpt中的salt可以是随机的，比如： int i = 0; while (i < 10) { String password = "1234
学习编程并不难,做到以下几点即可! lampcy java html 编程语言
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
架构师之mysql----------------用group+inner join,left join ,right join 查重复数据（替代in) nannan408 right join
1.前言。如题。 2.代码 (1)单表查重复数据,根据a分组 SELECT m.a,m.b, INNER JOIN （select a,b,COUNT(*) AS rank FROM test.`A` A GROUP BY a HAVING rank>1 )k ON m.a=k.a （2）多表查询，使用改为le
jQuery选择器小结 VS 节点查找（附css的一些东西） Everyday都不同 jquery css name选择器追加元素查找节点
最近做前端页面，频繁用到一些jQuery的选择器，所以特意来总结一下：测试页面： <html> <head> <script src="jquery-1.7.2.min.js"></script> <script> /*$(function() { $(documen
关于EXT tntxia ext
ExtJS是一个很不错的Ajax框架，可以用来开发带有华丽外观的富客户端应用，使得我们的b/s应用更加具有活力及生命力。ExtJS是一个用 javascript编写，与后台技术无关的前端ajax框架。因此，可以把ExtJS用在.Net、Java、Php等各种开发语言开发的应用中。 ExtJs最开始基于YUI技术，由开发人员Jack
一个MIT计算机博士对数学的思考 xjnine Math
在过去的一年中，我一直在数学的海洋中游荡，research进展不多，对于数学世界的阅历算是有了一些长进。为什么要深入数学的世界？作为计算机的学生，我没有任何企图要成为一个数学家。我学习数学的目的，是要想爬上巨人的肩膀，希望站在更高的高度，能把我自己研究的东西看得更深广一些。说起来，我在刚来这个学校的时候，并没有预料到我将会有一个深入数学的旅程。我的导师最初希望我去做的题目，是对appe

如何基于Go搭建一个大数据平台

你可能感兴趣的:(如何基于Go搭建一个大数据平台)