Java3y

别写秒杀系统了，我告诉你消息管理平台实现原理吧

前言

文本已收录至我的GitHub：https://github.com/ZhongFuCheng3y/3y，有300多篇原创文章，最近在连载面试和项目系列！

我，三歪，最近要开始写项目系列文章。我给这个系列取了一个名字，叫做《揭秘》

没错，我又给自己挖了个坑。

为什么想写项目相关的文章呢？原因有以下：

当我还没正式开始工作时，我经常会想：”网上的视频项目我是看过了，但真正的商业项目究竟长什么样？会不会很难？“我是挺想知道真正的商业项目跟自己练习的项目区别在哪。我估摸还没工作的同学应该也有跟我类似的思考吧？
变相推动自己持续输出，在这个过程中学习和成长。关注我可能有小白，也可能有跟我做同一领域的大佬。我把我所了解的写下来：可能我这边的实现方案被大佬们唾弃，交流和学习后，改善了我系统的实现方案。也有可能给正准备踏进该领域的同学提供一些参考价值。岂不美哉？

这个系列就以「消息管理平台」来打个样吧，这是我维护近一年的系统了。这篇文章可以带你全面认识「消息管理平台」是怎么设计和实现的，有兴趣的同学欢迎在评论区下留言和交流。

这篇文章可能稍微会有些许长，我是打算一篇就把该系统给讲清楚。「消息管理平台」原理并不难，没有很多专业名词，实现起来也不会复杂，你要是觉得学到了，欢迎给我点个赞

简单认识《消息管理平台》

「消息管理平台」可能在不同的公司会有不同的叫法，有的时候我会叫它「推送系统」，有的时候我会叫它「消息管理平台」，也有的同事叫它「触达平台」，甚至浮夸点我也可以叫它「消息中台」

但是不管怎么样，它的功能就是给用户发消息。在公司里它是怎么样的定位？只要以官方名义发送的消息，都走消息管理平台。

一般你注册一个APP/网站，你可以收到该APP/网站给你发什么消息呢？一般就以下吧？

站内信（IM）消息：其实就是APP内聊天的消息
通知栏（PUSH）消息：系统弹窗消息
邮件（Email）消息
短信（Sms）消息
微信服务号消息
微信小程序（服务通知）消息

好了，我相信你已经知道这个系统是用来干嘛的了。那为什么要有这个系统呢？

为什么要有消息管理平台？

可以说，只要是做APP的公司几乎都会有消息管理平台。

我们很多时候都会想给用户发消息：

有可能是用户想要这样的功能（预约活动提醒通知）
也有可能是我们想通过发消息来「唤醒」/「告知」等操作，告诉用户我们还在（大爷来玩啊）

那么问题来了，发消息困难吗？发消息复杂吗？

显然，发消息非常简单，一点儿也不复杂。

发短信无非就是调用第三方短信的API、发邮件无非就是调用邮件的API、发微信类的消息（手Q/小程序/微信服务号）无非就是调用微信的API、发通知栏消息（Push）无非就是调APNS/手机厂商的API、发IM消息也可以使用云服务，调云服务的API…

可能很多人的项目都是这么干的，无非发条消息，自己实现也不是不可以。

但这样会带来的问题就是在一个公司内部，会有很多个项目都会有「发送消息」的代码实现。假设发消息出了问题，还得去自己解决。

首先是系统不好维护，其次是没必要。我一个搞广告的，虽然我要发消息，凭什么要我自己去实现？

我们在写代码时，可能会把公用的代码抽成方法，供当前的项目重复调用。如果该公用的代码被多个项目使用，可能我们又会抽成组件包，供多个项目使用。只要该公用的代码被足够多的人去用，那它就很有可能从组件上升为一个平台（系统）级的东西。

如何实现消息管理平台？

回到消息管理平台的本质，它就是一个可以发消息的系统。那怎么设计和实现呢？我们从接口说起吧。

接口设计

消息管理平台是一个提供消息发送服务的平台，如果让我去实现，我的想法可能是把每种类型的消息都写一个接口，然后把这些接口对外暴露。

所以，可能会有以下的接口：

/**
* content：发送的文案
* receiver：接收者
*/

sendSms(String content,String receiver);
sendIm(String content,String receiver);
sendPush(String content,String receiver);
sendEmail(String content,String receiver);
sendTencent(String content,String receiver);
//....

这样实现好像也不是不可以，反正每个接口都挺清晰的，要发什么类型的消息，你调用哪个接口就好了。

假设我们定义了如上的接口，现在我们要发消息了，我们会有以下的场景：

文案：「你好，我是三歪」，接收人：「woshisanwai」（一次只发给一个人）
文案：「你好，我是三歪」，接收人：「woshisanwai,java3y,javayyy」（相同的文案发给多个人）

假如你是新手，你可能会想：这简单，我每种类型分开两个接口，分别是单发和批量接口。

sendSingleSms();
sendBatchSms();
//...

上面这样设计有必要吗？其实没啥必要。我将接收人定义为一个Array不就得了？Array的size==1，那我就把该文案发给这个人，Array的size>1，那我就把这个文案发给Array里边的所有人。

所以我们的接口还是只有一个：

/**
* content：发送的文案
* receiver：接收者（可多个，可单个）
*/
sendSms(String content,Set<String> receiver);

其实在我们这也不是定义Array，我的接口receiver仍然是String，如果有多个用,号分隔就可以了。

/**
* content：发送的文案
* receiver：接收者（可多个，可单个），多个用逗号分隔开
*/
sendSms(String content,String receiver);

现在还有个场景，不同的文案发给不同的人怎么办？有的人就说，这不已经实现了吗？直接调用上面的接口就完事了啊。你又不是不能重复调用，比如说：

文案：「你好，我是Java3y」，接收人：「woshisanwai」
文案：「你好，我是三歪」，接收人：「3y」
文案：「你好，woshisanwai」，接收人：「三歪」
…

确实如此，本来就可以这样做的。但不够好

举个真实的场景：现在有一个主播开播了，得发送一条消息告诉订阅该主播的人赶紧去看。为了提高该条通知的效果，在文案上我们是这样设计的：{用户昵称}，你订阅的主播三歪已经开播了，赶紧去看吧！

这种消息我们肯定是要求实时性的（假设推送消息的速度太慢了，等到用户收到消息了，主播都下播了，那用户不得锤死你？）

画外音：显然这种情况属于不同的文案发给不同的人

这种消息在业务层是怎么做的呢？可能是扫DB表，遍历出订阅该主播的粉丝，然后给他们推送消息。

那现在我们只能每扫出一个订阅该主播的粉丝，就得调用send()接口发送消息。如果该主播有500W的粉丝，那就得调用500W次send接口，这不是很可怕？这调用次数，这网络开销…

于是乎，我们得提供一个“批量”接口，可以让调用方一次传入不同文案所携带不同的人。那怎么做呢？也很简单，实际上就是上面接口再封装一层，让调用方能“批量”传进来就好了。所以代码可以是这样的：

/**
* 一次传入多个（文案以及发送者）的“组”进来
* List
* SendParam 里边 定义了 content 和receiver
*/
sendBatchSms(List<SendParam> sendParam);

现在接口的“雏形”已经出现了，到这里我们实现了消息管理平台最基本的功能：发消息

我们先不管内部的实现是如何，假设我们已经适配好调通好对应的API了，现在我们的接口在发消息层面上已经有充分必要的条件了：只要你传入接收者和发送内容，我就可以给你发消息。

但我们对外称可是一个平台啊，怎么能搞得像是只封装了几个方法似的，平台就该有平台的样子。

我举个日常最最最基本的功能：有人调用了我的接口发了条短信，这条短信的文案是一条内容为验证码类型，他问我这条短信到底下发到用户手上了没有。

如果接入过短信的同学就会知道：发送短信到用户收到是一个异步的过程

调用短信提供商的API，假设你的入参没有问题，它会告诉你“调用”成功。你想真正地知道此条内容到底有没有下发到用户手上，你有两种办法：一、提供一个接口给短信服务商调用，等真正处理完了，短信服务商会调用你的接口，告诉你最终的结果是什么。二、你去轮询短信服务商的接口，获取最终的结果。

回到问题上，他想要他调用我的接口有没有把短信发送成功，那我只要问他拿到手机号和文案，然后有以下步骤：

判断该手机号和文案在下发时是否正常（有没有真正调用下发短信的接口）
假设调用短信接口下发成功，那看下返回的回执（下发结果）是否正常

那目前我们在现有的接口，还是很完美地支持上面的问题的，对吧？只要我们记录了下发的结果和回执的信息，我们就可以告诉他所提供的手机号和文案究竟有没有下发到用户手上。

那今天他又过来问了：今天有很多人来反馈收不到验证码短信（不是全部人收不到，是大部分人），我想了解一下今天验证码短信下发的成功率是多少。

此时的我，只能去匹配(like %%)他的文案调用我的接口下发了多少人，调用短信服务商的API下发成功多少人，收到的成功回执（结果）有多少人。

通过匹配文案的方式最终也是可以告诉他结果的，但是这种是很傻X的做法。归根到底还是因为系统提供的服务还是太薄弱了。

那怎么解决上面所讲的问题呢？其实也很简单，匹配文案很傻X，那我给他这一批验证码的短信取个唯一的Id那不就可以了吗？

像我们去接入短信服务商一样，我们需要去新建一个短信模板，这个模板代表了你要发送的内容，新建模板后会给你个模板Id，你下发的时候指定这个模板Id就好了。

那我们的平台也可以这样玩啊，你想发消息对吧？可以，先来我的平台新建一个”模板“，到时候把模板Id发给我就行。

于是，我们就完美地解决上面所提到的问题了。

我们现在再来讨论一下有没有必要不同的消息类型（短信、邮件、IM等）需要分开不同的的接口，其实是没必要的了。因为只要抽象了”模板“这个概念，消息类型自然我们就可以在模板上固化掉，只要传了模板Id，我就知道你发的是什么类型消息。

这样一来，我们最终会有两个接口：批量与单个发送接口。

/**
 * 发送消息接口
 * @author java3y
 */
public interface SendService {
     

    /**
     * 相同文案，发给0~N 人
     * @param sendParam
     */
    void send(SendParam sendParam);

    /**
     * 不同文案，发给不同人，一次可接收多组
     * @param sendParam
     */
    void batchSend(BatchSendParam sendParam);
}

public class SendParam {
     

    /**
     * 模板Id
     */
    private String templateId;

    /**
     * 消息参数
     */
    private MsgParam msgParam;
}

public class MsgParam {
     

    /**
     * 接收者：假设有多个，则用「,」分隔开
     */
    private String receiver;

    /**
     * 自定义参数（文案）
     */
    private Map<String, String> variables;

}

单个接口指的是：一次给1~N人发送消息，这批人收到的是相同的文案

批量接口指的是：一次给1个人发送一个文案，但一次调用可以传N个人及对应的文案

这里的单个和批量不是以发送人的维度去定义的，而是人所对应的消息文案。

再再再举个例子，现在我给关注我的同学都发一条消息：「大哥大嫂新年好」，这种情况我只需要使用send方法就好了，相同的文案我给一批人发，这批人收到的文案是一模一样的。

一次单推接口调用的请求参数：

{
     
    "templateId": 12345,
    "msgParam": 
        {
      
            "receivers": "三歪,敖丙,鸡蛋,米豆",
            "variables": {
     
                "content": "大哥大哥新年好",
                "title": "来个赞吧，亲"
            }
        }
}

如果我要给关注我的同学都发一条消息：「{微信用户名}，大哥大哥新年好」，这种情况我一般用batchSend方法，在发送之前组合人所对应的文案封装成一个List，一次调用接口对调用方而言就是一次发了List.size()组人。

一次批量接口调用的请求参数：

{
     
    "templateId": 12345,
    "msgParam": [
        {
      
            "receivers": "敖丙",
            "variables": {
     
                "content": "敖丙，大哥大哥新年好",
                "title": "来个赞吧，亲"
            }
        },
        {
     
            "receivers": "鸡蛋",
            "variables": {
     
                "content": "鸡蛋，大哥大哥新年好",
                "title": "来个赞吧，亲"
            }
        }
    ]
}

没想到单单接口这块我这篇就写了这么长，主要是照顾没有经验的同学哈~

回顾设计接口的思路：

起初是想每种消息类型分开不同的接口
考虑到同一个文案会下发给多个人，所以接收者参数得是支持”批量“的传入
考虑到会有批量调用接口的场景，所以需要一个批量接口
考虑到需要统计下发消息的场景，所以需要抽象出”模板“，在平台下发的消息都得有”模板“
有了”模板“，可以将很多信息固化到模板中，所以最终我们抽象出两个接口：单推和批量。

再来聊聊模板

在前面我们已经定义好接口了，跟简单你们所实现的发消息功能最主要的区别就是多了”模板“的概念。

在上面提到了一点：有了”模板“，可以将很多信息固化到模板中。那我们固化了什么东西到模板中呢？

能够发送的消息种类。消息管理平台是可以发多种类型的消息的，所以我们模板是需要有字段区分不同的消息类型。别想得这么难，其实我们就用1表示短信，2表示邮件…
模板创建者信息（手机号、姓名），这个跟发消息的实质内容没有任何关系，只是如果模板出现了什么不可描述的问题，背锅侠总得找出来吧，如果模板创建者离职了怎么办？没事，我会根据创建者把所在部门给找到，那就找部门背锅（嘿嘿）
消息的文案。综合上面所看到的消息，我们可以看到一条消息无非由以下部分所组成：内容、标题、图片、链接、视频…不同的消息能发的文案也不一样，像短信顶多就只有内容和链接，而像通知栏消息(Push)就可以有标题、内容、图片、链接所组成。所以，我们会把消息的文案用json的格式存储在一个字段中。
消息的业务规则。这里所讲的业务规则并不是真正的细节业务，而是对不同消息类型上的平台性约束。比如说，在产品层面上，希望晚上用户收不到通知栏推送（毕竟会对用户进行打扰）；希望用户一个小时内不会接收到两条，一天最多收到N条通知栏推送（也是出于用户的体验）。这些平台性的约束就适合放在消息管理平台上做，你可以理解为是一个兜底的功能。
发送账号。什么？发条消息还有账号的概念？你搞错了吧，三歪？。其实是真的有的，在发邮件的时候可以选取不同的邮件账号，在发微信公众号消息时可以选取不同的微信公众号（小程序同理），在发IM消息时可以使用不同的账号发送。而在接入短信的时候其实是分了两种类型的：通知和营销。我们会把这些都抽象为账号。
接收者Id类型。站内的IM消息用的是站内的userId，发通知栏消息(PUSH)用的是did，发短信用的是手机号，发微信类的消息用的是openId。指定接收者的Id类型，表明这个模板你要传入哪种类型的id。假设你指明是userId，但你要发短信，消息管理平台就需要将userId转成手机号。这里也是用一个字段标识，1表示userId，2表示did …

可以发现的是，我们把一条消息所需要的信息（甚至不需要的信息）都塞进模板里面了，等调用方传入模板Id时，我就能拿到我想要的所有信息了。

这是一个模板的全部了吗？当然不是咯。上面提到的是模板共性的内容，我们按模板的使用场景还划分两种类型：

运营模板：运营要给指定一批人在某时某刻发送消息。（这一批人是T+1离线的）。例子：如果用户注册登录了APP，可以隔一天（甚至更长时间）给用户发消息。这种属于非实时（离线）推送，这种就不需要技术来承接，去圈选人群后设置对应的时间即可推送。
技术模板：系统根据业务条件自动触发一批消息，接收者名单也依赖业务场景（这批人一般是实时的）。例子：如果用户注册登录了APP，就立马需要给该用户发消息。这种属于实时推送，需要对应的技术来承接。

随着系统和业务的演进，运营模板和技术模板的界限会越来越模糊。从本质上就是提供了两种发消息的方式：

圈定一批人群，通过使用定时任务到点调用接口触发（接收者、文案、发送时间都已明确）。
技术调用接口发送消息（接收者，文案，发送时间均由业务逻辑所产生）。例子：欢迎关注三歪，你的验证码是：888。有内鬼，终止交易。（当你关注三歪时，系统触发一条消息。发送时间、验证码值、人员均不确定）

用户在平台创建模板时，不同类型的模板需要填写的字段是不一样的：运营模板需要填写人群和任务触发时间，而技术模板压根就不需要填人群和任务触发时间，所以我们模板会有一个字段标识该模板是运营类型还是技术类型。1表示运营类型，2表示技术类型…

你觉得已经完了吗？nonono，还没有。我们还会区分消息的类型，目前最主要由三类组成：通知、营销和验证码。

问题来了，为什么我们要区分消息的类型呢？做统计用吗？当然不是了，就这几个粒度的类型有什么好统计的。

还是以例子来说明吧：在2020-02-30日，运营同学圈选了一个5000W的人群选择在晚上8点发送一条短信，大致的情况就是告诉用户三歪文章更新了，不看血亏。系统在晚上8点准时执行任务，读取该模板的模板信息下发。5000W人，系统能秒发吗？显然是不行的

画外音：除了考虑自身的系统能力，还得考虑下游能承受的能力。你瞎搞，人家就不带你玩了。

所以，这5000W人肯定是需要一定的时间才能完全下发的，现在我们假设是15分钟完全下发完毕吧。在8点2分触发了一条验证码的短信，结果因为这个5000W的人群所导致验证码的消息延迟发送，这合理吗？显然不合理。

怎么导致的？原因是这5000W的消息和验证码的消息走的是同一个通道，导致验证码的消息被阻塞掉了。我们将不同的消息类型走不同的通道，就可以解决掉上面的问题。

所以，我们的系统在设计层面上就把运营模板默认设置为营销类型的消息，而技术模板的消息类型由调用者自行选择。在现实场景中，能堵的就只有营销类的消息。

画外音：上面所讲的这些实践都是跟使用场景和具体业务所关联的，肯定不是一朝一夕就可以全想出来的。

模板也已经聊完了，还有些细节的东西我这就不赘述了。我再来简要总结一下：

我们把发送一条消息所必要的信息（文案、发送账号、传入的接收者Id类型、消息类型：通知、营销和验证码）、平台性的信息（业务规则：是否去重、屏蔽、展示逻辑等）和基本信息（业务方信息、消息名称）全都塞到模板中
由于使用场景，模板会分为运营模板和技术模板。运营模板主要的特点是需要填写人群信息和发送时间，运营模板由消息管理平台自身进行调度发送消息。

接口实现

BB了这么久了，可能很多人只是想来看看：三歪这逼在标题还敢还写个揭秘，发消息谁不会，不就调个API嘛，还能给你玩出花来？

别急嘛，现在就写。前面已经铺垫了接口的设计和模板究竟是什么了，现在我们还是回到接口的实现上吧。

首先我们简单来看看消息管理平台的系统架构链路图：

画外音：上面我们所说的接口定义在统一调用层（接入层）中

调用者调用我们的send/batchSend方法，会直接调用下游的API下发消息吗？不会

直接调用下游的API下发消息风险太大了，接口1W+QPS都是很正常的事，所以我们接收到消息后只是做简单的参数校验处理和信息补全就把消息发到消息队列上。这样做的好处就是接口接入层十分轻量级，只要Kafka抗得住，请求就没问题。

发到消息队列时，会根据不同的消息类型发到不同的topic上，发送层监听topic进行消费就好了。架构大致如下：

发送层消费topic后，会把消息放在各自的内存队列上，多个线程消费内存队列的消息来实现消息的下发。

可以看到的是：从接入层发到消息队列上我们就已经做了分topic来实现业务上的隔离，在消费时我们也是放到各自的内存队列中来进行消费。这就实现了：不同渠道和同渠道的不同类型的消息都互不干扰。

看到上面这张图，如果思考过的同学肯定会问：这要内存队列干啥啊？反正你在上层已经分了topic了，不用内存队列也可以实现你所讲的“业务隔离”啊。

也的确，这里使用内存队列的主要原因是为了提高并发度。提高了并发度，这意味着下发速度可以更快（在下发消息的过程中，最耗时的还是网络交互，像短信这种可以多开点线程进行消费）。

在前面所提到的业务规则就是在下发层这儿做的，包括夜间屏蔽、1小时去重和Id转换等

夜间屏蔽就是判断是否在晚上，如果勾选了夜间屏蔽并且在晚上，过滤掉就好了
1小时去重就是拿userId+消息渠道作为Key，看是否存在Redis上，假设存在，则过滤掉
id转换这功能我们做成了个系统，这块我放在下面简单说一下吧，这就不在赘述了。

画外音：这种场景最好使用Pipeline来读写Redis

随后就是适配各个渠道的接口，调用API下发消息了，这块就跟你们单个的实现没什么大的区别了，调用个接口还能给你玩出花来？（代码风格会稍好一些，模板方法模式、责任链、生产者与消费者模式等在项目中都有对应的应用）

总结一下接口的实现：

调用方调用接口时，接口不会同步直接调用下游的API发送消息，而是放入消息队列上（支持高并发）
放入队列时，会根据不同渠道以及不同类型的消息进行分类，放到不同的topic（业务隔离）
消费队列时，会在本地使用阻塞队列来提高并发度（加快消费的速度）

Id转换（扩展）

在前面也提到了，发不同类型的消息会需要有不同的id类型：微信类需要openId、短信需要手机号、push通知栏推送需要did。

在大多数情况下，一般调用者就传入userId给到我，我这边需要根据不同的消息类型对userId进行转换。

那在我们这边是怎么实现该系统的呢？主要的步骤和逻辑有以下：

监听用户变更和微信公众号订阅/取关的topic，在Flink清洗出一个统一的数据模型，将清洗后的数据写到另一个的topic。
Id映射系统监听Flink清洗出的topic，实时写到数据源（这里我们用的是搜索引擎）

看着也不会很难，对吧？

有没有想过一个问题，为什么要用一个Id映射系统去监听Flink洗出来的topic，而不是在Flink直接写到数据源呢？

其实通过Flink直接写到数据源也是完全没问题的，而封装了一个Id映射系统，就可以把这活做得更细致。

从描述可以发现的是：在上面只实现了实时增量。很多时候我们会担心增量存在问题，导致部分数据的不准确或者丢失，都会写一份全量，Id映射也是同样的。

那Id映射的全量是怎么做的呢？用户数据通过各种关联关系会在Hive形成一张表，而Id映射的全量就是基于这张Hive表来实现全量（每天凌晨会读取Hive表的信息，再写一遍数据源）。

基于上面这些逻辑，专门给Id映射做了个后台管理（可以手动触发全量、是否开启增量/全量、修改全量触发的时间）

数据统计

我觉得这块是消息管理平台最最最精华的一部分。

梦回我们当初的接口设计环节，我们就是因为有“数据统计”的需求，才引入了模板的概念。现在我们已经有了一个模板Id了，在我们这边是怎么实现数据的统计的呢？我们对消息的统计都是基于模板的维度来实现的。

在创建模板时就会有一个模板Id生成，基于这个模板Id，我们生成了一个叫做umpId的值：第一位分为技术/运营推送，最后八位是日期，中间六位是模板Id

因为所有的消息都会经过接入层，只要消息带有链接，我们就会给链接后加上umpid参数，链接会一直下发透传，直至用户点击

每个系统在执行消息的时候都会可能导致这条消息发不出去（可能是消息去重了，可能是用户的手机号不正确，可能是用户太久没有登录了等等都有可能）。我们在这些『关键位置』都打上日志，方便我们去排查。

这些「关键位置」我们都给它用简单的数字来命个名。比如说：我们用「11」来代表这个用户没有绑定手机号，用「12」来代表这个用户10分钟前收到了一条一模一样的消息，用「13」来代表这个用户屏蔽了消息…

「11」「12」「13」「14」「15」「16」这些就叫做「点位」，把这些点位在关键的位置中打上日志，这个就叫做「埋点」

有了埋点，我们要做的就是将这些点位收集起来，然后统一处理成我们的数据格式，输出到数据源中。

收集日志
清洗日志
输出到数据源

有logAgent帮我们收集日志到Kafka，实时清洗日志我们用的是Flink，清洗完我们输出到Redis(实时)/Hive（离线）。

Hive表的数据样例（主要用于离线报表统计）：

Redis会以多维度来进行存储，以便支撑我们的业务需要。比如，要查一条消息为何发送失败，通过userId搜一下，直接完事（实时的都记录在Redis中，所以这里读取的是Redis的数据）

比如，通过模板Id，查某条消息的整体下发情况：

为什么我说这是消息管理平台最最最精华的呢？umpId贯穿了所有消息管理平台经过的系统，只要是在消息管理平台发的消息，都会被记录下来发送，可以通过点位来快速追踪消息的下发情况。

总结一下数据统计：

设计出业务上的umpid，给所有的消息推送链接都加上umpdId 参数
打通上下游，共同设计和维护关键点位，统一日志格式来实现跨平台的收集和清洗
兼顾实时和离线需求写到不同的数据源，实时以多维度统计来快速定位问题

聊聊运营层面

前面提到了，运营的模板是需要圈选一批人群，然后下发消息的，那这群人从哪里来？

在很久之前，消息管理平台也把人群给做掉了，大致的思路就是可以支持文件上传和hivesql上传两种方式去圈选人群，圈出来上传到hdfs进行读取，支持对人群的更新/切分/导出等功能。

有了人群的概念，你会发现你收到的消息其实都是跟你息息相关的（不是瞎给你推送的，你在里面，才能圈到你）。可能是因为你看了几天的连衣裙，所以给你推送连衣裙的消息，吸引去你购买。

后来，由于公司内部DMP系统崛起，人群就都交由DMP给管理了。但实现的思路也都是类似的，只不过还是同样的：人家做的是平台，功能肯定比会自己写几个接口要完善不少。

做推送就免不了发错了消息，特别是在运营侧（分分钟就推送千万人），我们平台又做了什么措施去尽可能避免这种问题的发生呢？

在运营圈定人群后，我们会有单独的测试功能去「测试单个用户」是否能正常下发消息，文案链接是否存在问题。

这一个步骤是必须要做的，给用户发出的消息，首先要经过自己的校验。如果确认链接和文案都无问题后，则提交任务，走工单审批后才能发送。

如果在启动之后发现文案/链接存在问题，还可以拦截剩余未发的消息。

针对于（技术方推送），我们在预发环境下配置了「白名单」才能收到消息。

线上消息有「去重」的逻辑：

在某段时间内，过滤掉重复消息
运营类消息推送（圈定人群的方式去下发消息）同一个用户需要相隔一段时间才能下发一次。

虽然说，我们制定了很多的规则去尽量避免事故的发生，但不得不说推送还是一个容易出现事故的功能。我的牛逼已经吹完了，如果某天发现我的推送出了事故，不要@我，当没见过这篇文章就好。

总结

不知道大家看完之后觉得消息管理平台难不难，从理解上的角度而言，这系统应该是很好理解的，没有掺杂很多业务的东西，都是做平台性相关的内容。

这个系统能支持数W的QPS，每天亿级的流量推送，一篇文章也不可能把消息管理平台的所有功能点都讲完，内容也不止上面这些，但核心我应该是讲清楚的了。

发送消息可以做得很简单，也可以做得很平台化，如果你觉得你学到了些许东西，希望可以给我点个点赞和转发一波。如果你对我写的内容有疑问，欢迎评论区交流。

后续可能会更多写广告系统相关的内容，会以一些小的问题切入，不得不说，广告系统比消息管理平台还是要复杂和有趣得多。提前关注预定最新文章，不会让你希望的！

我是三歪，下期揭秘-广告系统再见

三歪把【大厂面试知识点】、【简历模板】、【原创文章】全部整理成电子书，共有1263页！点击下方链接直接取就好了

GitHub
Gitee访问更快

PDF文档的内容均为手打，有任何的不懂都可以直接来问我

你可能感兴趣的:(后端,Java,JavaEE,Java项目,消息管理平台)

搭建Hadoop与Hive环境达达玲玲 hadoop hive 大数据
当搭建Hadoop与Hive环境时，以下是每个步骤的详细操作说明：1.安装并配置CentOS7操作系统：-下载CentOS7ISO镜像文件，并通过虚拟机或物理机安装CentOS7操作系统。-在安装过程中，为系统分配必要的网络、用户和权限。2.安装Java开发环境：-下载适合您的系统的JavaJDK版本。-使用命令或GUI工具安装JavaJDK。-配置JAVA_HOME环境变量：-打开终端，输入以下
Python编写Modbus详细指南与示例达达玲玲 python 开发语言
Python编写Modbus：详细指南与示例理解ModbusModbus是一种串行通信协议，广泛用于工业自动化领域。它定义了一系列消息结构，用于在多个设备之间交换数据。Python由于其易用性和丰富的库，成为了编写Modbus应用程序的热门选择。安装PyModbus库PyModbus是Python中一个功能强大的Modbus协议栈实现，支持RTU和TCP两种模式。Bashpipinstallpym
javascript中toFixed()四舍五入计算bug，及解决方法，四舍六入，五看奇偶并不精准，重新toFixed方法才是万全之策呀叫我小月儿字符串 js bug javascript
问题描述：最近做一个项目涉及金额计算保留两位小数，以前一直以为toFixed方法就是四舍五入的，上线后用户用户反馈计算出来的金额少了一分钱，跟其票面金额不一致，深入研究后发现使用toFixed保留两位小数是大坑呀。请看下面的例子：3.135.toFixed(2)**本以为是3.14，然而却是3.13！！！**网上有人整理出toFixed方法“四舍六入，五看奇偶”的原则：当舍去位的数值=6时，在舍去
数据包的发送流程 sumatch 网络
以绿皮聊天软件为例：首先，我们两个手机的绿皮聊天软件客户端，要通信，中间会通过它们家服务器。大概长这样。但为了简化模型，我们把中间的服务器给省略掉，假设这是个端到端的通信。且为了保证消息的可靠性，我们盲猜它们之间用的是TCP协议进行通信。为了发送数据包，两端首先会通过三次握手，建立TCP连接。一个数据包，从聊天框里发出，消息会从聊天软件所在的用户空间拷贝到内核空间的发送缓冲区（sendbuffer
rabbitmq和redis用作消息队列的区别 rlk512974883 JAVA基础
将redis发布订阅模式用做消息队列和rabbitmq的区别：可靠性redis：没有相应的机制保证消息的可靠消费，如果发布者发布一条消息，而没有对应的订阅者的话，这条消息将丢失，不会存在内存中；rabbitmq：具有消息消费确认机制，如果发布一条消息，还没有消费者消费该队列，那么这条消息将一直存放在队列中，直到有消费者消费了该条消息，以此可以保证消息的可靠消费；实时性redis:实时性高，redi
web自动化——前端知识大哥喝阔落前端自动化运维
是HTML中的一个元素，用于在当前网页中嵌入另一个网页或文档。它就像一个“窗口”，可以在页面中显示其他内容。主要特点：嵌入外部内容：可以在网页中嵌入其他网页、视频、地图等。独立上下文：嵌入的内容与主页面相互独立，拥有自己的JavaScript和CSS环境。可定制：可以通过属性调整大小、边框等。常用属性：src：指定要嵌入内容的URL。width和height：设置iframe的宽度和高度。fram
MQ和多线程异步有什么区别？大唐雨夜分布式 java 分布式经验分享
在系统调用时，我们可能使用MQ实现自产自销。此处直接使用多线程异步是否也可以实现？使用多线程异步也可以实现，但是不够优雅。主要在于多线程和MQ的区别。CPU消耗。多线程异步可能存在CPU竞争，而MQ不会消耗CPU.可靠性。MQ可以保证可靠性，而多线程不能保证，当前系统宕机可能导致任务丢失。削峰或者消息堆积能力。当业务系统处于高并发，MQ可以将消息堆积在Broker实例中，而多线程会创建大量线程，甚
Python标准库 subprocess 模块多进程编程详解好像要长脑子了1 程序员 python 开发语言
1.1基本功能subprocess模块，允许生成新的进程执行命令行指令，python程序，以及其它语言编写的应用程序,如java,c++,rust应用等。subprocess可连接多个进程的输入、输出、错误管道，并且获取它们的返回码。asyncio也支持subprocess.许多知名库都在使用此模块创建进程，以及做为跨语言粘合工具。典型如ansible,celery，selenium等。1.2与m
智能工厂的设计软件应用场景的一个例子：为AI聊天工具添加一个知识系统之6 三端架构的本质/内在/外观：自明性/信念/bank词扇一水鉴天软件智能智能制造人工语言人工智能
本文提要一些补充在为前端和后端锁定的两个中心词“概念”（命题“作文”的程序公共逻辑语言）和“描述”（谓词“描述”的自然描述语言）的基础上，暂时将中端的中心词锁定在“环境”（情境“意义”的人工语义网络语言）。三者的共同性--都需要通过“演算”得到（命题演算/谓词演算/情境演算）。每种演算都以本地或局部的this此岸为输入（A-box，最初是一个条件分支符--条件表达式），远处或全局的彼岸that（T
Node.js 中的中间件：概念与应用 JJCTO袁龙 Node.js node.js 中间件
Node.js中的中间件：概念与应用在当今的网络开发中，Node.js作为一种高效、可扩展的JavaScript运行环境，正在快速占领开发者的心智。而在Node.js的生态中，中间件（Middleware）是一个不可或缺的概念，它为构建灵活而高效的应用程序提供了强大的支持。在这篇文章中，我们将详细探讨Node.js中的中间件的概念、工作原理以及实际应用，帮助你更好地理解和使用这一强大工具。什么是中
系统设计面试题慢慢慢时光面试准备面试系统设计
比较开放，需要灵活应对，列出基本的一些思路。文章目录**设计一个短网址服务**：如何将长网址转换为短网址，并支持短网址的生成、存储、解析和重定向等功能**设计一个分布式文件系统**：考虑如何实现文件的存储、访问、备份、容错等功能，以及如何处理大规模数据和高并发访问。**设计一个聊天系统**：包括消息的发送、接收、存储、展示等功能，以及如何处理实时通信、离线消息、群聊等需求设计一个推荐系统：根据用户
JVM学习总结——十一、JVM的JIT 技术分子深入理解Java虚拟机 jvm
JIT的全称是Justintimecompilation，中文称之为即时编译。JIT编译器作用当虚拟机发现某个方法或代码块运行特别频繁时，就会把这些代码认定为HotSpotCode热点代码，为了提高热点代码的执行效率，在运行时，虚拟机将会把这些代码编译成与本地平台相关的机器码，并进行各层次的优化。为什么引入JIT?通常Javac将程序源码编译，转换成java字节码，JVM通过解释字节码将其翻译成相
【JVM】调优日月星宿～ #jvm jvm java 开发语言
目的：减少minorgc、fullgc的次数，也就是减少STW的时间，因为java虚拟机在做后台垃圾收集线程的时候，会停掉其他线程，专门做垃圾收集，这样会影响网站的性能，以及用户的体验。调优位置：1%的调优在方法区，99%的调优在堆内存。JVM常见调优参数-Xms初始堆大小-Xmx最大堆大小-Xss设置每个线程的堆栈大小-XX:NewSize设置新生代最小空间大小-XX:MaxNewSize设置新
JVM 堆内存分配过程富士康质检员张全蛋运维必须知道的JVM知识 jvm
设置堆内存大小和OOMJava堆用于存储Java对象实例，那么堆的大小在JVM启动的时候就确定了，我们可以通过-Xmx和-Xms来设定-Xms用来表示堆的起始内存，等价于-XX:InitialHeapSize-Xmx用来表示堆的最大内存，等价于-XX:MaxHeapSize如果堆的内存大小超过-Xmx设定的最大内存，就会抛出OutOfMemoryError异常。我们通常会将-Xmx和-Xms两个参
Java转Go入门学习丙麟 java golang 学习
大家好，最近感觉java有点难了，决定重新找门语言再重新学习一下，提升一下自己。于是，听公司一个十年经验的老大哥说，目前rust和golang语言是比较不错的，刚好周末有空去图书馆借了本《Go语言入门经典》这本书，看完总结了一下，废话不多书说，这篇博客呢，适用于有编程经验的童鞋，之前接触过的，从Java的角度来快速学习的go语言。Golang语言的吉祥物Gopher:首先，先简单介绍下Go语言，又
【Java Web】JSON 以及 JSON 转换一二¬ #Java Web java json
JSON（JavaScriptObjectNotation）一种灵活、高效、轻量级的数据交换格式，广泛应用于各种数据交换和存储场景。基本特点1、简单易用：JSON格式非常简单，易于理解和使用。2、轻量级：相比XML等其他数据格式，JSON占用的空间更小，传输效率更高。3、跨平台：JSON是一种纯文本格式，可以轻松地在不同的系统和编程语言之间交换数据。4、可读性强：JSON格式的数据结构清晰，易于阅
JVM性能：堆的参数配置大力海棠 JVM JVM 堆参数配置
目录初始堆和最大堆偏差问题新生代配置指定绝对大小Java程序中的最重要的内存空间就是堆了，基本上所有的对象都分配在堆中，这些堆空间根据不同功能和GC回收分配成几种的结构，例如存放新创建对象的新生代，经过多次GC后仍然存活的老年对象则存放在老年代中，新生代区域又分为eden区和from区，to区，通风常在eden区中的新生代经历了一次GC后仍然存活的话，便会进入from区或to区，每一次GC都会让对
JVM学习总结-集合北山璎珞 JVM JVM JVM学习 jvm总结深入了解JVM JVM调优
1.聊聊JVM2.JVM内存管理：深入Java内存区域与OOM3.java线程安全（总结）4.JVM内存管理：深入垃圾收集器（六种垃圾收集器）与内存分配策略5.JVM调优总结（一）
Java学习day002 Java程序设计环境（下载安装JDK、使用命令行工具、使用集成开发环境、运行图形化应用程序） Z zehao Java基础学习 java 后端
使用的教材是java核心技术卷1，我将跟着这本书的章节同时配合视频资源来进行学习基础java知识。day002Java程序设计环境（下载安装JDK、使用命令行工具、使用集成开发环境、运行图形化应用程序）第一部分安装java开发工具包下载JDK要想下载Java开发工具包，可以访问Oracle网站：www.oracle.com/technetwork/java/javase/downloads,在得到
一文讲解Java中的equals和hashCode方法 Journey_CR JavaSE java 哈希算法散列表
什么是hashCode方法？hashCode()方法的作用是获取哈希码，它会返回一个int整数，定义在Object类中，是一个本地方法；publicnativeinthashCode();为什么要有hashCode方法呢？hashCode方法主要用来获取对象的哈希码，哈希码是由对象的内存地址或者对象的属性计算出来，它是一个int类型的整数，通常是不会重复的，因此可以用来作为键值对的键，来提高查询效
TaskManager的JVM OOM退出配置艾丽丝的爱情 jvm 大数据
在大数据领域中，TaskManager是执行并行任务的关键组件之一。它负责管理任务的执行和资源分配。在处理大规模数据时，内存管理是一个重要的考虑因素。当TaskManager的Java虚拟机（JVM）遇到内存不足的情况时，可以通过配置相应的参数来控制其行为。本文将介绍如何配置TaskManager的JVM，以便在OOM（内存溢出）发生时退出。OOM（OutofMemory）是指在程序运行过程中，J
Node.js 技术学习指南：从入门到实战应用小码快撩 node.js
引言Node.js®是一个开源的、跨平台的JavaScript运行环境，它允许开发人员使用JavaScript编写服务器端代码。基于GoogleChrome浏览器强大的V8JavaScript引擎构建，Node.js引入了异步I/O模型和事件驱动编程机制，使得JavaScript能够在服务器环境中高效处理高并发网络请求。一、异步I/O和事件驱动Node.js的异步I/O和事件驱动机制是其高性能的核
JVM堆空间 silver687 jvm
JVM（Java虚拟机）堆空间是Java内存管理的核心区域之一，用于存储Java对象实例。以下是关于JVM堆空间的详细介绍：1.堆空间的作用•存储对象实例：几乎所有的Java对象实例（通过new关键字创建的对象）都存储在堆空间中。例如，当你创建一个String对象、一个ArrayList对象或其他任何类的实例时，它们都会被分配到堆空间。•支持垃圾回收：堆空间是垃圾回收的主要区域。垃圾回收器（GC）
【面试题】构建高并发、高可用服务架构：技术选型与设计言之。 redis python 面试架构
监控系统消息队列缓存层数据存储层应用层Web层负载均衡与流量分配GrafanaPrometheusAlertmanager消息队列Kafka/RabbitMQ集群/镜像队列缓存层Redis/Memcached数据库MySQL/PostgreSQL主从复制/主主复制应用服务器SpringBoot/Node.js应用服务器SpringBoot/Node.js应用服务器SpringBoot/Node.j
性能测试丨JVM 性能数据采集霍格沃兹测试开发学社测试人社区 jvm 测试工具测试开发软件测试
什么是JVM性能数据采集？JVM性能数据采集是指通过一些工具和技术采集与Java虚拟机相关的性能数据。这些数据包括但不限于内存使用、CPU使用、垃圾回收（GC）行为、线程活动等。合理地分析这些数据，可以帮助我们找出系统的瓶颈，从而进一步优化我们的Java应用。具体来说，性能数据采集使得我们能够监控和诊断Java应用的健康状态，定位性能问题，评估优化方案的效果。使用JVM性能数据采集的好处使用JVM
利用IDEA反编译jar包 star9595 Java 实用技能
有时使用jd-gui进行反编译不太靠谱，可以通过idea反编译方式，两者进行对比：1.利用IDEA反编译jar包(idea需要安装插件JavaBytecodeDecomplier)2.在需要编译的jar包的目录下，打开命令行界面，输入以下命令：java-cp"D:/ProgramFiles/JetBrains/IntelliJIDEA2019.1.3/plugins/java-decompiler
JavaFX - 文本遗憾皆是温柔 JavaFX学习区学习 java 开发语言 ide
JavaFX应用程序可以包含许多元素，包括各种媒体，如图像、视频、GIF和所有维度的形状、文本等。这是为了提高应用程序的用户体验质量。所有这些元素都由JavaFX场景图上的节点表示。在本章中，我们将学习如何使用JavaFX在应用程序上显示Text节点。JavaFXText节点JavaFX中的文本节点由名为Text的类表示，该类属于包javafx.scene.text。此类包含多个属性，用于在Jav
ERROR: Could not install packages due to an OSError: [Errno 2] No such file or directory解决方案爱编程的喵喵 Python基础课程 python pip OSError 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了ERROR:Couldnotinst
Dubbo 支持分布式事务吗？思维导图代码示例（java 架构) 用心去追梦 dubbo 分布式 java
Dubbo本身并不直接提供分布式事务的支持，但可以通过集成其他分布式事务解决方案来实现。常见的分布式事务管理方案包括TCC（Try-Confirm-Cancel）、Saga、XA和基于消息的事务等。在Dubbo应用中，最常用的分布式事务框架之一是Seata（以前称为Fescar），它提供了对多种分布式事务模式的支持。思维导图概述Dubbo分布式事务概念分布式系统中确保多个服务之间的操作要么全部成功
javax.validation.constraints.NotNull找不到大叔是90后大叔 spring boot Java java spring boot
javax.validation.constraints.NotNull找不到javax.validation.constraints.NotNull找不到使用范例附录javax.validation.constraints.NotNull找不到解决方案：需要在pom.xml中引入依赖org.springframework.bootspring-boot-starter-validation使用范
mongodb3.03开启认证 21jhf mongodb
下载了最新mongodb3.03版本，当使用--auth 参数命令行开启mongodb用户认证时遇到很多问题，现总结如下：（百度上搜到的基本都是老版本的，看到db.addUser的就是，请忽略） Windows下我做了一个bat文件，用来启动mongodb，命令行如下： mongod --dbpath db\data --port 27017 --directoryperdb --logp
【Spark103】Task not serializable bit1129 Serializable
Task not serializable是Spark开发过程最令人头疼的问题之一，这里记录下出现这个问题的两个实例，一个是自己遇到的，另一个是stackoverflow上看到。等有时间了再仔细探究出现Task not serialiazable的各种原因以及出现问题后如何快速定位问题的所在，至少目前阶段碰到此类问题，没有什么章法 1. package spark.exampl
你所熟知的 LRU(最近最少使用) dalan_123 java
关于LRU这个名词在很多地方或听说，或使用，接下来看下lru缓存回收的实现 1、大体的想法 a、查询出最近最晚使用的项 b、给最近的使用的项做标记通过使用链表就可以完成这两个操作，关于最近最少使用的项只需要返回链表的尾部；标记最近使用的项，只需要将该项移除并放置到头部，那么难点就出现你如何能够快速在链表定位对应的该项？这时候多
Javascript 跨域周凡杨 JavaScript jsonp 跨域 cross-domain
linux下安装apache服务器 g21121 apache
安装apache 下载windows版本apache，下载地址：http://httpd.apache.org/download.cgi 1.windows下安装apache Windows下安装apache比较简单，注意选择路径和端口即可，这里就不再赘述了。 2.linux下安装apache：下载之后上传到linux的相关目录，这里指定为/home/apach
FineReport的JS编辑框和URL地址栏语法简介老A不折腾 finereport web报表报表软件语法总结
JS编辑框： 1.FineReport的js。作为一款BS产品，browser端的JavaScript是必不可少的。 FineReport中的js是已经调用了finereport.js的。大家知道，预览报表时，报表servlet会将cpt模板转为html，在这个html的head头部中会引入FineReport的js，这个finereport.js中包含了许多内置的fun
根据STATUS信息对MySQL进行优化墙头上一根草 status
mysql 查看当前正在执行的操作，即正在执行的sql语句的方法为: show processlist 命令 mysql> show global status;可以列出MySQL服务器运行各种状态值，我个人较喜欢的用法是show status like '查询值%';一、慢查询mysql> show variab
我的spring学习笔记7-Spring的Bean配置文件给Bean定义别名 aijuans Spring 3
本文介绍如何给Spring的Bean配置文件的Bean定义别名？原始的 <bean id="business" class="onlyfun.caterpillar.device.Business"> <property name="writer"> <ref b
高性能mysql 之性能剖析 annan211 性能 mysql mysql 性能剖析剖析
1 定义性能优化 mysql服务器性能，此处定义为响应时间。在解释性能优化之前，先来消除一个误解，很多人认为，性能优化就是降低cpu的利用率或者减少对资源的使用。这是一个陷阱。资源时用来消耗并用来工作的，所以有时候消耗更多的资源能够加快查询速度，保持cpu忙绿，这是必要的。很多时候发现编译进了新版本的InnoDB之后，cpu利用率上升的很厉害，这并不
主外键和索引唯一性约束百合不是茶索引唯一性约束主外键约束联机删除
目标;第一步;创建两张表用户表和文章表第二步;发表文章 1,建表; ---用户表 BlogUsers --userID唯一的 --userName --pwd --sex create
线程的调度 bijian1013 java 多线程 thread 线程的调度 java多线程
1. Java提供一个线程调度程序来监控程序中启动后进入可运行状态的所有线程。线程调度程序按照线程的优先级决定应调度哪些线程来执行。 2. 多数线程的调度是抢占式的（即我想中断程序运行就中断，不需要和将被中断的程序协商） a)
查看日志常用命令 bijian1013 linux 命令 unix
一.日志查找方法，可以用通配符查某台主机上的所有服务器grep "关键字" /wls/applogs/custom-*/error.log 二.查看日志常用命令1.grep '关键字' error.log：在error.log中搜索'关键字'2.grep -C10 '关键字' error.log：显示关键字前后10行记录3.grep '关键字' error.l
【持久化框架MyBatis3一】MyBatis版HelloWorld bit1129 helloworld
MyBatis这个系列的文章，主要参考《Java Persistence with MyBatis 3》。样例数据本文以MySQL数据库为例，建立一个STUDENTS表，插入两条数据，然后进行单表的增删改查 CREATE TABLE STUDENTS ( stud_id int(11) NOT NULL AUTO_INCREMENT,
【Hadoop十五】Hadoop Counter bit1129 hadoop
1. 只有Map任务的Map Reduce Job File System Counters FILE: Number of bytes read=3629530 FILE: Number of bytes written=98312 FILE: Number of read operations=0 FILE: Number of lar
解决Tomcat数据连接池无法释放 ronin47 tomcat 连接池　优化
近段时间，公司的检测中心报表系统(SMC)的开发人员时不时找到我，说用户老是出现无法登录的情况。前些日子因为手头上有Jboss集群的测试工作，发现用户不能登录时，都是在Tomcat中将这个项目Reload一下就好了，不过只是治标而已，因为大概几个小时之后又会再次出现无法登录的情况。今天上午，开发人员小毛又找到我，要我协助将这个问题根治一下，拖太久用户难保不投诉。简单分析了一
java-75-二叉树两结点的最低共同父结点 bylijinnan java
import java.util.LinkedList; import java.util.List; import ljn.help.*; public class BTreeLowestParentOfTwoNodes { public static void main(String[] args) { /* * node data is stored in
行业垂直搜索引擎网页抓取项目 carlwu Lucene Nutch Heritrix Solr
公司有一个搜索引擎项目，希望各路高人有空来帮忙指导，谢谢！这是详细需求：（1）通过提供的网站地址(大概100-200个网站)，网页抓取程序能不断抓取网页和其它类型的文件（如Excel、PDF、Word、ppt及zip类型），并且程序能够根据事先提供的规则，过滤掉不相干的下载内容。（2）程序能够搜索这些抓取的内容，并能对这些抓取文件按照油田名进行分类，然后放到服务器不同的目录中。
[通讯与服务]在总带宽资源没有大幅增加之前,不适宜大幅度降低资费 comsci 资源
降低通讯服务资费，就意味着有更多的用户进入，就意味着通讯服务提供商要接待和服务更多的用户，在总体运维成本没有由于技术升级而大幅下降的情况下，这种降低资费的行为将导致每个用户的平均带宽不断下降，而享受到的服务质量也在下降，这对用户和服务商都是不利的。。。。。。。。 &nbs
Java时区转换及时间格式 Cwind java
本文介绍Java API 中 Date, Calendar, TimeZone和DateFormat的使用，以及不同时区时间相互转化的方法和原理。问题描述：向处于不同时区的服务器发请求时需要考虑时区转换的问题。譬如，服务器位于东八区（北京时间，GMT+8:00），而身处东四区的用户想要查询当天的销售记录。则需把东四区的“今天”这个时间范围转换为服务器所在时区的时间范围。
readonly,只读，不可用 dashuaifu js jsp disable readOnly readOnly
readOnly 和 readonly 不同，在做js开发时一定要注意函数大小写和jsp黄线的警告！！！我就经历过这么一件事：使用readOnly在某些浏览器或同一浏览器不同版本有的可以实现“只读”功能，有的就不行，而且函数readOnly有黄线警告！！！就这样被折磨了不短时间！！！（期间使用过disable函数，但是发现disable函数之后后台接收不到前台的的数据！！！）
LABjs、RequireJS、SeaJS 介绍 dcj3sjt126com js Web
LABjs 的核心是 LAB（Loading and Blocking）：Loading 指异步并行加载，Blocking 是指同步等待执行。LABjs 通过优雅的语法（script 和 wait）实现了这两大特性，核心价值是性能优化。LABjs 是一个文件加载器。RequireJS 和 SeaJS 则是模块加载器，倡导的是一种模块化开发理念，核心价值是让 JavaScript 的模块化开发变得更
[应用结构]入口脚本 dcj3sjt126com PHP yii2
入口脚本入口脚本是应用启动流程中的第一环，一个应用（不管是网页应用还是控制台应用）只有一个入口脚本。终端用户的请求通过入口脚本实例化应用并将将请求转发到应用。 Web 应用的入口脚本必须放在终端用户能够访问的目录下，通常命名为 index.php，也可以使用 Web 服务器能定位到的其他名称。控制台应用的入口脚本一般在应用根目录下命名为 yii（后缀为.php），该文
haoop shell命令 eksliang hadoop hadoop shell
cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge get getmerge ls lsr mkdir movefromLocal mv put rm rmr setrep stat tail test text
MultiStateView不同的状态下显示不同的界面 gundumw100 android
只要将指定的view放在该控件里面，可以该view在不同的状态下显示不同的界面，这对ListView很有用，比如加载界面，空白界面，错误界面。而且这些见面由你指定布局，非常灵活。 PS：ListView虽然可以设置一个EmptyView，但使用起来不方便，不灵活，有点累赘。 <com.kennyc.view.MultiStateView xmlns:android=&qu
jQuery实现页面内锚点平滑跳转 ini JavaScript html jquery html5 css
平时我们做导航滚动到内容都是通过锚点来做，刷的一下就直接跳到内容了，没有一丝的滚动效果，而且 url 链接最后会有“小尾巴”，就像#keleyi，今天我就介绍一款 jquery 做的滚动的特效，既可以设置滚动速度，又可以在 url 链接上没有“小尾巴”。效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/37.htmHTML文件代码： &
kafka offset迁移 kane_xie kafka
在早前的kafka版本中（0.8.0），offset是被存储在zookeeper中的。到当前版本（0.8.2）为止，kafka同时支持offset存储在zookeeper和offset manager（broker）中。从官方的说明来看，未来offset的zookeeper存储将会被弃用。因此现有的基于kafka的项目如果今后计划保持更新的话，可以考虑在合适
android > 搭建 cordova 环境 mft8899 android
1 , 安装 node.js http://nodejs.org node -v 查看版本 2, 安装 npm 可以先从 https://github.com/isaacs/npm/tags 下载源码解压到
java封装的比较器，比较是否全相同，获取不同字段名字 qifeifei
非常实用的java比较器，贴上代码： import java.util.HashSet; import java.util.List; import java.util.Set; import net.sf.json.JSONArray; import net.sf.json.JSONObject; import net.sf.json.JsonConfig; i
记录一些函数用法 .Aky. 位运算 PHP 数据库函数 IP
高手们照旧忽略。想弄个全天朝IP段数据库，找了个今天最新更新的国内所有运营商IP段，copy到文件，用文件函数，字符串函数把玩下。分割出startIp和endIp这样格式写入.txt文件，直接用phpmyadmin导入.csv文件的形式导入。（生命在于折腾，也许你们觉得我傻X，直接下载人家弄好的导入不就可以，做自己的菜鸟，让别人去说吧）当然用到了ip2long()函数把字符串转为整型数
sublime text 3 rust wudixiaotie Sublime Text
1.sublime text 3 => install package => Rust 2.cd ~/.config/sublime-text-3/Packages 3.mkdir rust 4.git clone https://github.com/sp0/rust-style 5.cd rust-style 6.cargo build --release 7.ctrl