欧阳文斌

实时分析之客户画像项目实践

客户画像的背景描述

原来的互联网，以解决用户需求为目的，衍生出众多的网联网产品，以及产生呈数量级递增的海量数据。当用户需求基本得到满足的时候，需要分析这些海量的数据，得以达到最高效的需求实现，最智能的功能服务，以及最精准的产品推荐，最后提升产品的竞争力。简言之，产品由原来的需求驱动转换成数据驱动。
客户画像就是数据驱动的代表作之一。具体点讲，客户画像就是用户的标签（使用该产品的群体），程序能自动调整、组合、生成这些标签，最后再通过这些标签，达到精准营销的目的。

当前流行的实时分析框架

首先一提到大数据，大家脑海中浮现的肯定是Hadoop，但是需要实时分析出结果的话，那Hadoop就力不从心了（先不讲数据多少，单单启动一个M/R就要几分钟的时间），如果没有实时性需求的产品分析则另当别论。
当下最流行的三大实时分析框架分别是Apache Spark，Apache Samza，Apache Storm。下面是网上找到的三大框架的说明和对比：

三者的整体框架相似，只是各个节点的名字和术语不一样罢了

Storm和Samza在消息发送处理的机制上是至少一次，而Spark是有且仅此一次，换句话讲，Storm和Samza可能存在重复发送数据的情况；在消息处理上，Spark是秒级的，而Storm和Samza是压秒级的（性能都不错，压秒级的也还是可以接受^_^）；在语言支持上，这个Storm貌似多点。另外，Storm开源的也比较早，社区比较活跃，版本迭代的比较快，文档相对来说也比较多，Storm相对Spark也比较轻量级，上手简单，这就是作者选择Storm的原因，不过个人还是推荐Spark的。

环境准备、搭建和运行

下面是作者使用的软件版本
1. kafka2.11
2. zookeeper3.5.1
3. storm0.9.5

JDK的环境，这个都不明白的人也不用继续看下去了。
作者在测试环境准备了4台虚拟机，修改每台虚拟机的/etc/hosts

172.16.2.235 master
172.16.2.231 slave1
172.16.2.236 slave2
172.16.2.241 slave3

235是主节点，其余三个是子节点，在主节点做好子节点免登录权限设置
主机运行

    ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
    mv id_dsa.pub authorized_keys
    chmod 600 authorized_keys
    scp ~/.ssh/authorized_keys root@slave1:/root/.ssh/
    scp ~/.ssh/authorized_keys root@slave2:/root/.ssh/
    scp ~/.ssh/authorized_keys root@slave3:/root/.ssh/

(拷贝到各个从机上去)
每个从机都ssh进入一次记录从机信息

zookeeper

zookeeper是大数据必备的框架之一，它是一个分布式的，开放源码的分布式应用程序协调服务，你可以理解成每个子节点的任务控制中心
解压

tar -zxvf zookeeper-3.5.1-alpha.tar.gz

配置
conf/zoo.cfg

initLimit=10
syncLimit=5
clientPort=2181
tickTime=2000
autopurge.purgeInterval=12
autopurge.snapRetainCount=3
dataDir=/home/zookeeper-3.5.1-alpha/data
server.0=master:2888:3888
server.1=slave1:2888:3888
server.2=slave2:2888:3888
server.3=slave3:2888:3888

注意：需要在/home/zookeeper-3.5.1-alpha/data目录下创建一个myid文件，写入该机的序列号,虚拟机就1，2累加下去

echo 0 >> /home/zookeeper-3.5.1-alpha/data/myid

启动

/home/zookeeper-3.5.1-alpha/bin/zkServer.sh start &

jps一下，列表中出现QuorumPeerMain进程则代表启动OK（各个子节点也启动起来，下面的服务都依赖zookeeper）。

kafka

kafka,中文名叫卡夫卡，是一种高吞吐量的分布式发布订阅消息系统，它可以处理消费者规模的网站中的所有动作流数据。简言之，就是数据采集、发送器。
解压

tar -zxvf kafka_2.11-0.8.2.0.tgz

配置，修改
config/server.properties

broker.id=0
port=9092
num.network.threads=3
num.io.threads=8
host.name=master
socket.send.buffer.bytes=102400
socket.receive.buffer.bytes=102400
socket.request.max.bytes=104857600
log.dirs=/home/kafka_2.11-0.8.2.0/kafka-logs
num.partitions=1
num.recovery.threads.per.data.dir=1
log.retention.hours=168
log.segment.bytes=1073741824
log.retention.check.interval.ms=300000
log.cleaner.enable=false
zookeeper.connect=master:2181,slave1:2181,slave2:2181,slave3:2181
zookeeper.connection.timeout.ms=6000
#真正删除topic
delete.topic.enable=true

注意：这里的broker.id在各个子节点也不能重复
启动

/home/kafka_2.11-0.8.2.0/bin/kafka-server-start.sh /home/kafka_2.11-0.8.2.0/config/server.properties &

jps一下，列表中出现Kafka进程则代表启动OK。
验证kafka集群运行是否正常：
订阅日志
在log服务器上安装kafka，只解压就好了，不需要配置，然后订阅log

tail -0f /home/bigdata/logs/analytics.log | /home/kafka_2.11-0.8.2.0/bin/kafka-console-producer.sh --broker-list master:9092,slave1:9092,slave2:9092,slave3:9092 --topic bigdata_app_logs &

将最新一行的日志文件传输到kafka集群，消息队列叫做bigdata_app_logs（这个ID在kafka集群中唯一）
再查询队列列表

./kafka-topics.sh --list --zookeeper master:2181,slave1:2181,slave2:2181,slave3:2181

将会出现刚刚订阅的topic：bigdata_app_logs
再

./kafka-console-consumer.sh --zookeeper master:2181,slave1:2181,slave2:2181,slave3:2181 --topic topic：bigdata_app_logs --from-beginning

将会实时同步log服务器上面的日志。这样，kafka集群环境就搭建OK了

下面是作者自己整理的kafka流程图：

这里日志采集有两种方式，一种是网站程序通过log4j记录的log文件，然后再客户端运行，也就是上面介绍的那种。
另一种就是通过KafkaLog4jAppender之间讲日志传输到kafka集群，需要引入一个jar包

        <dependency>
            <groupId>org.apache.kafkagroupId>
            <artifactId>kafka_2.11artifactId>
            <version>0.8.2.0version>
        dependency>

在log4j的两种配置配置

log4j.logger.com.jjshome.bigdata.controller.CommonController=INFO,KAFKA_HIVE_AUDIT
log4j.appender.KAFKA_HIVE_AUDIT=kafka.producer.KafkaLog4jAppender
log4j.appender.KAFKA_HIVE_AUDIT.BrokerList=master:9092,slave1:9092,slave2:9092,slave3:9092
log4j.appender.KAFKA_HIVE_AUDIT.Topic=bigdata_app_logs
log4j.appender.KAFKA_HIVE_AUDIT.layout=org.apache.log4j.PatternLayout
log4j.appender.KAFKA_HIVE_AUDIT.layout.ConversionPattern=%m%n
log4j.appender.KAFKA_HIVE_AUDIT.ProducerType=async

    
    <appender name="KAFKA_HIVE_AUDIT" class="kafka.producer.KafkaLog4jAppender">
        <param name="DatePattern" value="'.'yyyy-MM-dd"/>
        <param name="BrokerList" value="master:9092,slave1:9092,slave2:9092,slave3:9092"/>
        <param name="Topic" value="jjs-fang-web-bigDatas"/>
        <param name="ProducerType" value="async"/>
        <layout class="org.apache.log4j.PatternLayout">
            <param name="ConversionPattern" value="%d{yyyy-MM-dd HH:mm:ss,SSS} %-5p %x - %m%n"/>
        layout>
    appender>

个人建议使用第二种，但是要做好服务器之间的容错机制，作者前期就吃过亏，在采集日志的时候，直接影响了业务流程。

storm

这里就不介绍了
解压

tar -zxvf apache-storm-0.9.5.tar.gz

配置
conf/storm.yaml

 storm.zookeeper.servers:
     - "master"
     - "slave1"
     - "slave2"
     - "slave3"

 storm.local.dir: "/home/storm/data"
 nimbus.host: "master"
 supervisor.slots.ports:
    - 6700
    - 6701
    - 6702
    - 6703
 ui.port: 80

子节点配置都一样，直接丢过去就好了
启动
作者是在主节点启动nimbus和ui、supervisor,其他的三个节点启动supervisor
主节点

storm nimbus &
storm ui &
storm supervisor &

jps后出现nimbus和core、supervisor的进程，或者直接访问http://master即可（端口配置的是80）

注：这里作者配置了环境变量，所以可以直接storm
子节点分别都运行

storm supervisor &

下面是作者画的storm结构图

后面的数据落地，是结合业务，将数据存储起来
好了，到此环境以及准备完毕。
若是要关闭各种进程，直接jps后直接kill掉。

Topology开发

topology是storm中job的别名，它的工作流程大概如图：

这里spout消息发送源，bolt是数据处理节点，计算出来的记过可以多次使用
项目准备：
storm-lib.zip
[big-data-client]
[big-data-storm]
第一个作者开发的Topology需要的lib包，将该lib替换到所有storm集群的storm/lib下
第二个作者开发环境需要的中间件，第三个storm项目。
项目中有两个案例，一个TopN案例，一个客户画像案例（针对自自有业务的客户画像）

bolt是工作节点，remote是外部调用的数据接口，spout是消息源，topology是job主目录。
下面是客户画像的
Topology

package com.jjshome.storm.topology;

import java.util.List;

import org.slf4j.Logger;
import org.slf4j.LoggerFactory;

import storm.kafka.BrokerHosts;
import storm.kafka.KafkaSpout;
import storm.kafka.SpoutConfig;
import storm.kafka.StringScheme;
import storm.kafka.ZkHosts;
import backtype.storm.Config;
import backtype.storm.spout.SchemeAsMultiScheme;
import backtype.storm.topology.TopologyBuilder;
import backtype.storm.tuple.Fields;

import com.google.common.collect.ImmutableList;
import com.jjshome.storm.bolt.house.BoltFCWSplit;
import com.jjshome.storm.bolt.house.BoltLogFormat;
import com.jjshome.storm.bolt.house.BoltLogFormat4App;
import com.jjshome.storm.bolt.house.BoltSave;
import com.jjshome.storm.bolt.house.BoltThreshold;
import com.jjshome.storm.utils.CommonConstant;
import com.jjshome.storm.utils.StormRunner;

/**
 * @功能描述: 用户行为分析的Topology
 * @项目版本: 1.0.0
 * @项目名称: 大数据
 * @相对路径: com.jjshome.storm.topology.UserLogTopology.java
 * @创建作者: 欧阳文斌
 * @问题反馈: [email protected]
 * @创建日期: 2015年12月7日 上午10:20:27
 */ 
public class UserLogTopology {
    private static Logger logger = LoggerFactory.getLogger(UserLogTopology.class);
    /** 本地调试运行时间单位（秒） */
    private static final int DEFAULT_RUNTIME_IN_SECONDS = 60*30;
    /** kafka集群 */
    private static final String kafka_zookeeper_local = "master:2181,slave1:2181,slave2:2181,slave3:2181";
    private static final String kafka_zookeeper_online = "bigdata-99-51-master.jjshome.com:2181,bigdata-99-52-slave.jjshome.com:2181,bigdata-99-53-slave.jjshome.com:2181,bigdata-99-54-slave.jjshome.com:2181";
    /** Storm集群列表 */
    private static final List zk_servers_local = ImmutableList.of("master","slave1", "slave2", "slave3");
    private static final List zk_servers_online = ImmutableList.of("bigdata-99-51-master.jjshome.com","bigdata-99-52-slave.jjshome.com", "bigdata-99-53-slave.jjshome.com", "bigdata-99-54-slave.jjshome.com");

    private static Config createTopologyConfiguration() {
        Config conf = new Config();
        //是否是本地模式
        conf.setDebug(CommonConstant.IS_LOCAL?true:false);
        //设置工作机数量
        conf.setNumWorkers(CommonConstant.IS_LOCAL?4:16);
        return conf;
    }

    /**  
     * @功能描述: 获取KafkaConfig
     * @创建作者: 欧阳文斌
     * @创建日期: 2015年12月11日 下午2:08:36
     * @return
     */ 
    private static KafkaSpout getKafkaSpout(){
        // 房产网 bigdata日志的消息
        String kafkaZookeeper = CommonConstant.IS_LOCAL?kafka_zookeeper_local:kafka_zookeeper_online;
        BrokerHosts brokerHosts = new ZkHosts(kafkaZookeeper);
        SpoutConfig kafka_config_fang = new SpoutConfig(brokerHosts,
                "jjs-fang-web-bigDatas", "/jjs-fang-web-bigDatas", "jjs-fang-web-bigDatas");
        kafka_config_fang.scheme = new SchemeAsMultiScheme(new StringScheme());
        kafka_config_fang.zkServers = CommonConstant.IS_LOCAL?zk_servers_local:zk_servers_online;
        kafka_config_fang.zkPort = 2181;
        return new KafkaSpout(kafka_config_fang);
    }


    /**  
     * @功能描述: 获取KafkaConfig
     * @创建作者: 欧阳文斌
     * @创建日期: 2015年12月11日 下午2:08:36
     * @return
     */ 
    private static KafkaSpout getKafkaSpout_App(){
        // 房产网 bigdata日志的消息
        String kafkaZookeeper = CommonConstant.IS_LOCAL?kafka_zookeeper_local:kafka_zookeeper_online;
        BrokerHosts brokerHosts = new ZkHosts(kafkaZookeeper);
        SpoutConfig kafka_config_fang = new SpoutConfig(brokerHosts,
                "bigdata_app_logs", "/bigdata_app_logs", "bigdata_app_logs");
        kafka_config_fang.scheme = new SchemeAsMultiScheme(new StringScheme());
        kafka_config_fang.zkServers = CommonConstant.IS_LOCAL?zk_servers_local:zk_servers_online;
        kafka_config_fang.zkPort = 2181;
        return new KafkaSpout(kafka_config_fang);
    }

    public static void main(String[] args) {
        //Topology构造器
        TopologyBuilder builder = new TopologyBuilder();
        String topologyName = "UserLogTopology";
        //配置器
        Config topologyConfig = createTopologyConfiguration();
        int runtimeInSeconds = DEFAULT_RUNTIME_IN_SECONDS;

        final String app_index = "s_app";
        final String pc_index = "s_pc";
        final String fcwsplit_index = "b_fcwsplit";
        final String logformat_index = "b_logformat";
        final String logformatapp_index = "b_logformatapp";
        //final String mongodb_index = "b_mongodb";
        final String threshold_index = "b_threshold";
        final String save_index = "b_save";
        //设置 手机app log日志源
        builder.setSpout(app_index, getKafkaSpout_App(), 4).setNumTasks(4);
        //设置 房产网日志源
        builder.setSpout(pc_index, getKafkaSpout(), 8).setNumTasks(8);

        //房产网日志切割和过滤
        builder.setBolt(fcwsplit_index, new BoltFCWSplit(), 8).setNumTasks(8).shuffleGrouping(pc_index);

        //日志格式化
        builder.setBolt(logformat_index, new BoltLogFormat(), 4).setNumTasks(4).shuffleGrouping(fcwsplit_index);
        //手机日志格式化
        builder.setBolt(logformatapp_index, new BoltLogFormat4App(), 4).setNumTasks(4).shuffleGrouping(app_index);

        //存储 _USER_INTENTION 到mongoDB
        /*builder.setBolt(mongodb_index, new BoltMongo(), 2)
        .shuffleGrouping(logformat_index)
        .shuffleGrouping(logformatapp_index);*/

        //数据 阀 控制
        builder.setBolt(threshold_index, new BoltThreshold(2,60), 6).setNumTasks(6)
        .fieldsGrouping(logformat_index, new Fields("ip"))
        .fieldsGrouping(logformatapp_index, new Fields("ip"));

        //数据落地
        builder.setBolt(save_index, new BoltSave(), 4).setNumTasks(4).fieldsGrouping(threshold_index, new Fields("ip"));
        try {
            StormRunner.runTopologyLocally(builder.createTopology(), topologyName,
                    topologyConfig, runtimeInSeconds);
        } catch (Exception e) {
            logger.error("UserLogTopology@main", e);
        } 
    }
}

builder的整个构建过程，实际上也就是数据流的加工过程。kafka的spout是引用第三方的jar,pom中有配置。
bolt

package com.jjshome.storm.bolt.house;

import java.util.Map;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

import org.apache.commons.lang.StringUtils;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;

import backtype.storm.task.OutputCollector;
import backtype.storm.task.TopologyContext;
import backtype.storm.topology.IRichBolt;
import backtype.storm.topology.OutputFieldsDeclarer;
import backtype.storm.tuple.Fields;
import backtype.storm.tuple.Tuple;
import backtype.storm.tuple.Values;

import com.jjshome.bigdata.entity.log._JJS_Log;
import com.jjshome.bigdata.util.SystemConstant;

/**
 * @功能描述: 房产网日志解析
 * @项目版本: 1.0.0
 * @项目名称: 大数据
 * @相对路径: com.jjshome.storm.bolt.BoltFCWSplit.java
 * @创建作者: 欧阳文斌
 * @问题反馈: [email protected]
 * @创建日期: 2015年12月11日 下午2:20:07
 */ 
public class BoltFCWSplit implements IRichBolt {
    private static final long serialVersionUID = 1L;
    private Logger logger = LoggerFactory.getLogger(BoltFCWSplit.class);
    private OutputCollector collector;

    /** 用户行为分析的LOG正则 */
    private static Pattern s = Pattern.compile(""
            //时间
            + "(.*?),.*"
            //类别
            + "(YslHouseController|EsfHouseController|ZfHouseController|AgentInfoController|YywtController).*"
            //ip
            + "ip=(.*?),.*"
            //cityCode
            + "cityCode=(.*?),.*"
            //userId
            + "userId=(.*?),.*"
            //phone
            + "phone=(.*?),.*"
            //refererAddress
            + "refererAddress=(.*?),.*"
            //accessAddress
            + "accessAddress=(.*?),.*"
            //tags
            + "tags=(.*?),.*"
            //keyWord
            + "keyWord=(.*?),.*"
            //cookiesId
            + "cookiesId=(.*?),.*");

    @Override
    public void declareOutputFields(OutputFieldsDeclarer declarer) {
        declarer.declare(new Fields("object"));
    }

    @SuppressWarnings("rawtypes")
    @Override
    public void prepare(Map stormConf, TopologyContext context,
            OutputCollector collector) {
        this.collector = collector;
    }

    @Override
    public void execute(Tuple input) {
        String msg = "NOTHING";
        try {
            //获取消息流
            msg = input.getString(0);
            //异常日志判断
            if(msg!=null&&msg.length()<1000){
                //正则匹配
                Matcher sm = s.matcher(msg);
                if(sm.find()){
                    //LOG日志格式转换这对象
                    _JJS_Log jjsLog = new _JJS_Log();
                    log2entity(sm, jjsLog);
                    if (jjsLog.getUrl_type() == 5) {
                        if (jjsLog.getNew_url() != null 
                                && jjsLog.getNew_url().indexOf("saveReserveOrderInfo") > -1  
                                && !"".equals(jjsLog.getUserId()) 
                                && null != jjsLog.getUserId()) {
                            //发送消息到下一个bolt
                            collector.emit(new Values(jjsLog));
                        }
                    } else {
                        //发送消息到下一个bolt
                        collector.emit(new Values(jjsLog));
                    }
                }
            }
        } catch (Exception e) {
            //错误记录做记录  不需要重复发送
            logger.error("BoltFCWSplit@execute "+msg, e);
        } finally {
            //消息处理成功
            collector.ack(input);
        }
    }

    @Override
    public void cleanup() {
        // TODO Auto-generated method stub
    }

    @Override
    public Map getComponentConfiguration() {
        // TODO Auto-generated method stub
        return null;
    }

    /**  
     * @功能描述: log日志转化 
     * @创建作者: 欧阳文斌
     * @创建日期: 2015年12月15日 上午11:34:45
     * @param sm
     * @param jjsLog
     */ 
    private void log2entity(Matcher sm, _JJS_Log jjsLog){
        if(sm!=null&&jjsLog!=null){
            int i=0;
            jjsLog.setS_date(sm.group(++i));
            jjsLog.setType(SystemConstant.FCW_INDEX);
            String type = sm.group(++i);
            if(StringUtils.isNotEmpty(type)){
                if(type.equals("YslHouseController")){
                    jjsLog.setUrl_type(1);
                }else if(type.equals("EsfHouseController")){
                    jjsLog.setUrl_type(2);
                }else if(type.equals("ZfHouseController")){
                    jjsLog.setUrl_type(3);
                }else if(type.equals("AgentInfoController")){
                    jjsLog.setUrl_type(4);
                } else if(type.equals("YywtController")){
                    jjsLog.setUrl_type(5);
                }
            }
            jjsLog.setIp(sm.group(++i));
            jjsLog.setCityCode(sm.group(++i));
            jjsLog.setUserId(sm.group(++i));
            jjsLog.setTel_num(sm.group(++i));
            jjsLog.setOld_url(sm.group(++i));
            jjsLog.setNew_url(sm.group(++i));
            jjsLog.setTags(sm.group(++i));
            jjsLog.setKeyWord(sm.group(++i));
            jjsLog.setCookies(sm.group(++i));
        }
    }
}

bolt中就是数据的逻辑处理，关键的方法是input.getString(0);获取数据，collector.emit(new Values(jjsLog));发送数据，collector.ack(input);告诉前一个发送者，信息处理成功。
在topology的grouping策略就是在Spout与Bolt、Bolt与Bolt之间传递Tuple的方式。总共有七种方式：
1）shuffleGrouping（随机分组）
2）fieldsGrouping（按照字段分组，在这里即是同一个单词只能发送给一个Bolt）
3）allGrouping（广播发送，即每一个Tuple，每一个Bolt都会收到）
4）globalGrouping（全局分组，将Tuple分配到task id值最低的task里面）
5）noneGrouping（随机分派）
6）directGrouping（直接分组，指定Tuple与Bolt的对应发送关系）
7）Local or shuffle Grouping
8）customGrouping （自定义的Grouping）
常用的也就是随机分组、按字段分组以及全局分组。
在自己Topology开发完成后，可以讲运行模型修改成本地，然后运行Topology,方便进行调试。若是要发布到进群环境中，则将Storm项目打包，maven install(作者是maven项目)，将打好的jar上传到nimbus服务器。

storm jar storm-kafka-topology.jar com.jjshome.storm.topology.UserLogTopology

在jar的根目录上传jar到storm集群中，后面的类名是一个带main的topology,也就是上面的客户画像的topology。
发布成功后，可以在UI界面看到topology的运行情况，各个节点的日志处理数量，延迟时间

topology运行起来后，可以在各个数据存储的节点中，获取storm实时分析的结果。通过分析的结构，得到各个用户实时的各种标签，最后通过这些标签，在产品库中筛选最匹配的产品。
下面是作者的客户画像架构图

数据流程
1.用户操作产生日志
2.kafka收集日志
3.Storm分析处理日志
1)日志详情存储到mongoDB
2)半小时外意向模型存储到mongoDB
3)半小时内意向模型存储到redis
4)如果用户登录后的操作，则唤醒mongodb中所有的半小时意向模型，重新组装模型更新到mysql热表中
5)监控日志，如果发生预警事件操作，则触发意向模型以及精准推荐的生成
模型构建
在生成各种标签集合时，要加入权重因子（可变），针对不同产品，构建不同标签，再对各种操作以及权重因子，来生产用户标签。深度分析可以考虑加入机器学习在里面。

开发问题和运维问题的分析和解决

Q:在搭建集群的时候，通过UI看到各个节点的主机名一样，都是localhost，导致topology完全不工作。
A:检测各个虚拟机的hostname，保持和hosts中配置的一致，再重启zookeeper和storm集群

Q:在发布topology到集群上后，在UI界面中看到各种class找不到的错误
A:将storm项目中的lib打包统一都放到storm中lib,这里要注意jar包冲突和版本问题

Q:在日志累加的时候，fail的日志越来越多，导致延迟越来越大
A:这个问题跟业务处理有关系，检查出现问题的bolt，通过删剪法，反复提交测试，找出有问题的代码

Q:发现设置的works节点不生效，实际的比设置的少很多
A:检查topology的配置器，是不是本地模式。

Q:数据实时处理，怎么才能高效的让数据落地
A:作者这里用了滚筒模式，累积半小时的数据，再统一存储，半小时以内的，直接存放在redis集群中

Q:在使用kafka的producer命令监控日志的时候，老是出现日志终端的现象
A:看看log4j是否配置了日志时间戳，因为开启了时间戳，日志将会定时或不定时的将文件重命名，然后新开硬盘地址做存储，这样kafka是没有办法获取新的log硬盘地址。解决办法：换用KafkaLog4jAppender方式，或者让log文件不替换，每天定时清理一次就好了

Q:kafka集群服务器硬盘空间满了
A:在没有什么设定的操作下，kafka收到的日志会存储在硬盘中，终究有一天，硬盘会满掉。解决办法：在各个节点添加crontab计划

0 6 * * * /home/zookeeper/bin/zkCleanup.sh -n 3

你可能感兴趣的:(大数据,实时分析,storm,客户画像,实时分析,kafka)

【Springboot知识】开发属于自己的中间件健康监测HealthIndicate 问道飞鱼微服务相关技术 spring boot 中间件后端 HealthIndicate
文章目录**一、技术栈****二、项目结构****三、依赖配置(pom.xml)****四、配置文件(application.yml)****五、自定义健康检查实现****1.Redis健康检查****2.Elasticsearch健康检查****3.Kafka健康检查****4.MySQL健康检查****六、自定义健康检查接口(可选)****七、测试与验证****八、高级功能扩展****九、部署
守护网站安全的隐形卫士——SSL证书全解析安全
在网络世界中，保护用户数据的安全至关重要。无论你是经营一家小型网店还是管理大型企业网站，确保客户信息的安全性都是不可忽视的任务。今天，我们就来揭开一个默默守护网站安全的重要角色——SSL证书的神秘面纱。什么是SSL证书？SSL（SecureSocketsLayer）证书是一种数字证书，用于加密客户端与服务器之间的通信，确保数据传输过程中的安全性。简单来说，当您访问一个启用SSL证书的网站时，您的浏
高并发系统的艺术：如何在流量洪峰中游刃有余架构
作者：京东物流赵勇萍前言我们常说的三高，高并发、高可用、高性能，这些技术是构建现代互联网应用程序所必需的。对于京东618备战来说，所有的中台系统服务，无疑都是围绕着三高来展开的。而对于京东庞大的客户群体，高并发的要求尤为重要。用户对在线服务的需求和期望不断提高，系统的并发处理能力成为衡量其性能和用户体验的关键指标之一。高并发系统不仅仅是大型互联网企业的专利，对于任何希望在市场中占据一席之地的公司来
DeepSeek API 客户端使用文档老大白菜 python 人工智能数据库
1.简介deep.py是一个用于与DeepSeekAPI交互的Python客户端封装。它提供了简单易用的接口，支持对话历史管理、日志记录等功能，使得与DeepSeekAPI的交互更加便捷和可靠。2.功能特点简单的接口设计自动管理对话历史完整的日志记录灵活的配置选项异常处理机制3.安装依赖pipinstallopenai4.配置环境在项目根目录创建.env文件：#WindowssetDEEPSEEK
android 新闻客户端和springboot后台开发-网络接口封装（三） mmsx android 作业源码分享 android spring boot
一、前言android新闻客户端和springboot后台开发（一）-CSDN博客android新闻客户端和springboot后台开发（二）-CSDN博客这篇接前面，写android客户端接口这样方面的实现。okhttp简易封装，方便使用。二、例如注册接口示例UsermUser=newUser(account,password,UserTypeEnum.User.getDesc());Okhtt
大数据学习（67）- Flume、Sqoop、Kafka、DataX对比 viperrrrrrr 大数据学习 flume kafka sqoop datax
大数据学习系列专栏：哲学语录:用力所能及，改变世界。如果觉得博主的文章还不错的话，请点赞+收藏⭐️+留言支持一下博主哦工具主要作用数据流向实时性数据源/目标应用场景Flume实时日志采集与传输从数据源到存储系统实时日志文件、网络流量等→HDFS、HBase、Kafka等日志收集、实时监控、实时分析Sqoop关系型数据库与Hadoop间数据同步关系型数据库→Hadoop生态系统（HDFS、Hive、
大数据技术【7】星绘搜题 big data 数据挖掘大数据
1.目前所获取的总数据量的80%以上都是（）数据。。A.结构化B.非结构化C.文本D.半结构化2.Kmeans算法包括如下步骤：①在第j次迭代中，对于每个样本点，选取最近的中心点，归为该类；②更新中心点为每类的均值；③随机选取k个中心点；④j选择一项：a.③①②④b.①②③④c.①④③②d.④③②①A.③①②④B.①②③④C.①④③②D.④③②①3.利用先验原理可以帮助减少频繁项集产生时需要探查的
数据分析大数据面试题大杂烩01 爱学习的菜鸟罢了大数据 flink 大数据面试 hive hadoop kafka
互联网:通过埋点实时计算用户浏览频次用优惠券等措施吸引用户,通过历史信息用非智能学习的title方式构造用户画像(抖音,京东)电信,银行统计营收和针对用户的个人画像:处理大量非实时数据政府:健康码,扫码之后确诊,找出与确诊对象有关联的人订单订单表(除商品以外所有信息),商品详情表,通过搜集用户title进行定制化推荐点击流数据通过埋点进行用户点击行为分析FLINK一般用来做实时SPARK一般用来做
一个完整的python webSockets游戏服务器，每100ms接收并广播玩家位置小宝哥Code Python基础及AI开发 python 游戏服务器
PythonWebSockets游戏服务器下面是一个完整的PythonWebSockets游戏服务器实现，它每100ms接收并广播玩家位置信息。这个服务器使用websockets和asyncio库来处理WebSocket连接和异步操作。完整代码#!/usr/bin/envpython3"""实时游戏位置广播服务器每100ms接收玩家位置并广播给所有连接的客户端"""importasyncioimp
计算机网络原理第七章,北大计算机网络原理第七章.pdf weixin_39716043 计算机网络原理第七章
北大计算机网络原理第七章计算机网络计算机网络北京大学计算中北京大学计算中心王竹威王竹威zhuweiw@zhuweiw@第七章应用层应用层要做什么？应用层要做什么？180zhuweiw@第七章应用层应用层概述应用层概述应用进程交互方式应用进程交互方式在在IInternet应用层中应用层中,最主要的应用进程交最主要的应用进程交互方式就是客户—服务器(client/server,C/S)C/S)模式模式
海量数据查询加速：Presto、Trino、Apache Arrow 晴天彩虹雨 apache 大数据 hive 数据仓库
1.引言在大数据分析场景下，查询速度往往是影响业务决策效率的关键因素。随着数据量的增长，传统的行存储数据库难以满足低延迟的查询需求，因此，基于列式存储、向量化计算等技术的查询引擎应运而生。本篇文章将深入探讨Presto、Trino、ApacheArrow三种主流的查询优化工具，剖析其核心机制，并通过案例分析展示它们在实际业务中的应用。2.Presto：分布式SQL查询引擎2.1Presto介绍Pr
Cookie，Session，JWT .晚安. java web
Cookie，Session，JWT前言由于早期的网页被设计出来只是为了满足人们浏览网络资源的需求，几乎没有交互，所以HTTP在设计之初就是无状态的，无法携带信息。随着互联网的发展，为了满足人们对于网络交互的需求，需要一种技术来保存用户信息，用于登录认证等。目前常见的技术便是Cookie，Session，JWT。CookieCookie存储于客户端（浏览器），当用户访问一个页面时，客户端将用户填好
拿下多家头部车企定点，芯驰新一代旗舰智控MCU抢跑「整车智能」高工智能汽车单片机网络嵌入式硬件
近日，芯驰科技对外公布，旗下新一代旗舰智控MCU——E3650已开启客户送样，并且获得了多家头部车企的定点。据了解，E3650是专为区域控制器（ZCU）和域控（DCU）应用而设计的高端车规MCU，是自主高端车规MCU芯片的新标杆。众所周知，在整车电子电气架构的快速变革下，汽车不仅需要中央计算（区域处理器）提供聪明的大脑，也需要区域控制器（ZCU）打通和协调复杂的通信协议和中间层，从而实现真正的高阶
银河麒麟V10ServerSP3中Redis7源码编译与安装详细教程小猿搬码 Redis Redis7 KylinV10 银河麒麟国产操作系统
银河麒麟V10ServerSP3中Redis7源码编译与安装详细教程文章目录银河麒麟V10ServerSP3中Redis7源码编译与安装详细教程1.下载2.安装过程1.解压2.编译源码3.测试编译结果（可选）4.安装Redis5.安装位置6.复制配置文件7.修改redis.conf文件8.启动Redis服务9.客户端测试10.设置开机自启动3.开启远程访问1.编辑redis.conf2.开启防火墙
怎么使用jwt，token以及redis进行续期？曦月不可及? java
怎么使用jwt，token以及redis进行续期？什么是jwt?什么是token?结合JWT、Token和Redis进行续期的一般步骤：生成JWT：用户登录成功后，服务器生成一个JWT，并返回给客户端。importio.jsonwebtoken.Jwts;importio.jsonwebtoken.SignatureAlgorithm;publicclassJwtUtil{privatestati
科技创新：改变生活的力量与未来趋势 jiemidashi 科技生活人工智能经验分享
人工智能在智能客服中的应用越来越普遍。它改变了传统的客服模式。AI可以快速回答用户的问题，提高了客服效率和服务质量。首先，人工智能能够处理大量信息。智能客服可以在几秒钟内回应客户的请求。这比人工客服快得多。客户不需要等待很久就能得到答案。举个例子，某电商平台使用AI聊天机器人来处理用户咨询。这个机器人能够24小时工作，随时解决问题。这样，顾客体验得到了显著提升。其次，人工智能能提供个性化服务。通过
向量库集成指南三月七꧁ ꧂ langchain+llm 集成学习自然语言处理语言模型机器学习人工智能 gpt llama
文章目录向量库集成指南Chroma集成Pinecone集成MiLvus集成向量库集成指南向量库是一种索引和存储向量嵌入以实现高效管理和快速检索的数据库。与单独的向量索引不同，像Pinecone这样的向量数据库提供了额外的功能，例如，索引管理、数据管理、元数据存储和过滤，以及水平扩展。特别是在处理大数据和复杂查询时，向量库在多种应用场景中发挥着关键作用。其中，语义文本搜索是一个典型的应用，用
计算机毕业设计springboot基于BS的驾校在线学习考试系统43i2x9【附源码+数据库+部署+LW】゛花昔计算机毕设源码程序课程设计 spring boot 学习
本项目包含程序+源码+数据库+LW+调试部署环境，文末可获取一份本项目的java源码和数据库参考。系统的选题背景和意义选题背景：随着社会的发展和交通工具的普及，驾驶证成为了越来越多人的需求。然而，传统的驾校学习考试方式存在一些问题，如时间和空间限制、学习资源不足等。为了解决这些问题，基于BS（Browser/Server）架构的驾校在线学习考试系统应运而生。该系统利用互联网浏览器作为客户端，通过服
AI Agent代理框架与直接 API 调用的选择、构建块、工作流与代理的模式 AI Echoes 人工智能
建立有效的代理代理与工作流的概念什么是代理？代理可以有多种定义。一部分客户将其视为能够独立运行、利用多种工具完成复杂任务的全自主系统；而另一部分客户则认为代理是按照预定义工作流程执行任务的系统。我们将这两种实现统称为“代理系统”，但在架构上做出区分：工作流是指通过预定义代码路径协调LLM与工具的组合；代理则是让LLM自主决定流程和工具使用，保持对任务执行过程的动态控制。何时使用代理？在使用LLM构
输入URL到页面展示的核心逻辑链賢843 软件测试理论基础 python
浏览器输入url到页面展示过程（https请求过程）DNS解析域名得到服务器ip地址TCP三次握手TCP三次握手-CSDN博客客户端发送http请求服务器响应请求客户端渲染页面TCP四次挥手两个核心概念FIN包：FIN=1，表示请求终止连接（相当于说“我要挂电话了！”）。ACK包：ACK=1，表示确认收到数据（相当于说“我收到了！”）。四次挥手流程第一次挥手：客户端发送FIN=1的包给
JAVA简单实现国密双向认证 [email protected] JAVA 安全相关 java 开发语言国密
要实现国密双向认证的数据发送，需要使用支持国密算法的Java库，并且确保HTTP客户端能够处理SSL/TLS连接时的客户端证书验证。在这个例子中，使用Java标准库结合BouncyCastle作为提供国密算法的支持。下面是一个简化的示例，展示如何使用Java实现国密双向认证的数据发送。请注意，实际开发中可能需要更多的错误处理和配置细节。首先，确保你已经添加了BouncyCastle作为安全提供者，
【python】网络编程socket TCP UDP 草莓泰面包 python 网络 python tcp/ip
文章目录socket常用方法TCP客户端服务器UDP客户端服务器网络编程就是实现两台计算机的通信互联网协议族即通用标准协议，任何私有网络只要支持这个协议，就可以接入互联网。socketsocke模块的socket()函数importsocketsock=socket.socket(AddressFamily,type)参数说明：AddressFamily：指定套接字家族（AddressFamily
Java SSLSocket TLS 1.3示例 cyan20115 java 数据库网络
该Java11JEP332添加了对TLS1.3协议的支持。SSLSocket+TLS1.3具有TLS1.3协议和TLS_AES_128_GCM_SHA256流密码的SSLSocket客户端，用于将请求发送到https://google.com并打印响应。JavaTLS13.javapackagecom.mkyong.java11.jep332;importjavax.net.ssl.SSLSock
C语言Socket编程：实现TCP通信 ArqLoop tcp/ip c语言网络信息与通信
Socket编程是一种在计算机网络中实现通信的常用方法。它提供了一种可靠的、面向连接的通信方式，可以用于在不同的计算机之间进行数据传输。本文将介绍如何使用C语言编写Socket程序，实现TCP通信。在开始编写Socket程序之前，我们需要了解一些基本的概念和术语。TCP（传输控制协议）是一种可靠的、面向连接的协议，它提供了端到端的数据传输。服务器和客户端通过建立连接来进行通信。服务器监听特定的端口
kafka 中的 rebalance 百里自来卷 kafka 数据库分布式
Kafka的Rebalance（重平衡）机制本质上是一个协调过程，用于在消费者组内动态分配分区，以保证消费任务均匀分布。Rebalance主要由KafkaConsumerGroup协议（GroupMembershipProtocol）驱动，涉及多个关键组件和步骤。以下是KafkaRebalance底层的核心实现逻辑：1.触发Rebalance的原因Kafka的Rebalance可能会在以下几种情况
[Java实战]性能优化qps从1万到3万曼岛_ 国密实战 java 性能优化开发语言
一、问题背景事情起因是项目上springboot项目提供的tps达不到客户要求，除了增加服务器提高tps之外，作为团队的技术总监，架构师，技术扛把子，本着我不入地狱谁入地狱的原则，决心从代码上优化，让客户享受到飞一般的感觉。虽然大多数编程工作在写下第一行代码时已经完成，但本着谦虚使人进步，骄傲使人落后的原则还是一步一个脚印的把问题慢慢展开，慢慢分析。以下内容是抽丝剥茧的心路历程，请君欣赏。二、TP
Java面试精选：Kafka+Zookeeper+redis+JVM+RabbitMQ，最全总结我叫小迁W：bjmsb2019 Java 架构面试数据库 java redis mysql 分布式
大家开始准备金九银十了吗？不知是跳槽还是找工作的朋友，趁现在增进一下自己的技术何尝不是一件好事呢？一、RabbitMQ1.rabbitmq的使用场景有哪些？2.rabbitmq有哪些重要的角色？3.rabbitmq有哪些重要的组件？4.rabbitmq中vhost的作用是什么？5.rabbitmq的消息是怎么发送的？6.rabbitmq怎么保证消息的稳定性？7.rabbitmq怎么避免消息丢失？8
【经验分享】SpringBoot集成Websocket开发之使用由 Jakarta EE 规范提供的 API开发 Xcong_Zhu 学习笔记经验分享 spring boot websocket
在SpringBoot中整合、使用WebSocketWebSocket是一种基于TCP协议的全双工通信协议，它允许客户端和服务器之间建立持久的、双向的通信连接。相比传统的HTTP请求-响应模式，WebSocket提供了实时、低延迟的数据传输能力。通过WebSocket，客户端和服务器可以在任意时间点互相发送消息，实现实时更新和即时通信的功能。WebSocket协议经过了多个浏览器和服务器的支持，成
程序员副业变现的三种模式：我的实践分享程序员
程序员副业变现的三种模式：我的实践分享大家好，今天想和大家分享我作为程序员在探索副业道路上的三种不同变现模式。每种模式都有其特点和优势，希望能给想要开启副业之路的程序员朋友一些启发。一、ToB技术服务：与科技公司的直接合作这是最直接的技术变现模式，通过与其他科技公司的现场对接获取收益。特点：直接面对企业客户谈判周期较短项目需求明确付款相对及时优势：技术门槛高，议价能力强合作方式灵活可以建立长期合作
Gone v2 提供 gRPC服务 dapeng-大鹏 Gone框架介绍 golang gRPC gone
项目地址：https://github.com/gone-io/gone原文地址：https://github.com/gone-io/goner/blob/main/grpc/README.md文章目录编写proto文件，生成golang代码编写服务端代码注册客户端编写配置文件测试总结首先创建一个grpc目录，在这个目录中初始化一个golangmod：mkdirgrpccdgrpcgomodin
java杨辉三角 3213213333332132 java基础
package com.algorithm; /** * @Description 杨辉三角 * @author FuJianyong * 2015-1-22上午10:10:59 */ public class YangHui { public static void main(String[] args) { //初始化二维数组长度 int[][] y
《大话重构》之大布局的辛酸历史白糖_ 重构
《大话重构》中提到“大布局你伤不起”，如果企图重构一个陈旧的大型系统是有非常大的风险，重构不是想象中那么简单。我目前所在公司正好对产品做了一次“大布局重构”，下面我就分享这个“大布局”项目经验给大家。背景公司专注于企业级管理产品软件，企业有大中小之分，在2000年初公司用JSP/Servlet开发了一套针对中
电驴链接在线视频播放源码 dubinwei 源码电驴播放器视频 ed2k
本项目是个搜索电驴（ed2k）链接的应用,借助于磁力视频播放器（官网： http://loveandroid.duapp.com/ 开放平台），可以实现在线播放视频，也可以用迅雷或者其他下载工具下载。项目源码： http://git.oschina.net/svo/Emule,动态更新。也可从附件中下载。项目源码依赖于两个库项目，库项目一链接： http://git.oschina.
Javascript中函数的toString()方法周凡杨 JavaScript js toString function object
简述 The toString() method returns a string representing the source code of the function. 简译之，Javascript的toString()方法返回一个代表函数源代码的字符串。句法 function.
struts处理自定义异常 g21121 struts
很多时候我们会用到自定义异常来表示特定的错误情况，自定义异常比较简单，只要分清是运行时异常还是非运行时异常即可，运行时异常不需要捕获，继承自RuntimeException，是由容器自己抛出，例如空指针异常。非运行时异常继承自Exception，在抛出后需要捕获，例如文件未找到异常。此处我们用的是非运行时异常，首先定义一个异常LoginException: /** * 类描述：登录相
Linux中find常见用法示例 510888780 linux
Linux中find常见用法示例 ·find path -option [ -print ] [ -exec -ok command ] {} \; find命令的参数；
SpringMVC的各种参数绑定方式 Harry642 springMVC 绑定表单
1. 基本数据类型(以int为例，其他类似)： Controller代码： @RequestMapping("saysth.do") public void test(int count) { } 表单代码： <form action="saysth.do" method="post&q
Java 获取Oracle ROWID aijuans java oracle
A ROWID is an identification tag unique for each row of an Oracle Database table. The ROWID can be thought of as a virtual column, containing the ID for each row. The oracle.sql.ROWID class i
java获取方法的参数名 antlove java jdk parameter method reflect
reflect.ClassInformationUtil.java package reflect; import javassist.ClassPool; import javassist.CtClass; import javassist.CtMethod; import javassist.Modifier; import javassist.bytecode.CodeAtt
JAVA正则表达式匹配查找替换提取操作百合不是茶 java 正则表达式替换提取查找
正则表达式的查找;主要是用到String类中的split(); String str; str.split();方法中传入按照什么规则截取,返回一个String数组常见的截取规则: str.split("\\.")按照.来截取 str.
Java中equals()与hashCode()方法详解 bijian1013 java set equals()hashCode()
一.equals()方法详解 equals()方法在object类中定义如下： public boolean equals(Object obj) { return (this == obj); } 很明显是对两个对象的地址值进行的比较（即比较引用是否相同）。但是我们知道，String 、Math、I
精通Oracle10编程SQL(4)使用SQL语句 bijian1013 oracle 数据库 plsql
--工资级别表 create table SALGRADE ( GRADE NUMBER(10), LOSAL NUMBER(10,2), HISAL NUMBER(10,2) ) insert into SALGRADE values(1,0,100); insert into SALGRADE values(2,100,200); inser
【Nginx二】Nginx作为静态文件HTTP服务器 bit1129 HTTP服务器
Nginx作为静态文件HTTP服务器在本地系统中创建/data/www目录，存放html文件(包括index.html) 创建/data/images目录，存放imags图片在主配置文件中添加http指令 http { server { listen 80; server_name
kafka获得最新partition offset blackproof kafka partition offset 最新
kafka获得partition下标，需要用到kafka的simpleconsumer import java.util.ArrayList; import java.util.Collections; import java.util.Date; import java.util.HashMap; import java.util.List; import java.
centos 7安装docker两种方式 ronin47
第一种是采用yum 方式 yum install -y docker
java-60-在O(1)时间删除链表结点 bylijinnan java
public class DeleteNode_O1_Time { /** * Q 60 在O(1)时间删除链表结点 * 给定链表的头指针和一个结点指针(!!)，在O(1)时间删除该结点 * * Assume the list is: * head->...->nodeToDelete->mNode->nNode->..
nginx利用proxy_cache来缓存文件 cfyme cache
user zhangy users; worker_processes 10; error_log /var/vlogs/nginx_error.log crit; pid /var/vlogs/nginx.pid; #Specifies the value for ma
[JWFD开源工作流]JWFD嵌入式语法分析器负号的使用问题 comsci 嵌入式
假如我们需要用JWFD的语法分析模块定义一个带负号的方程式，直接在方程式之前添加负号是不正确的，而必须这样做： string str01 = "a=3.14;b=2.71;c=0;c-((a*a)+(b*b))" 定义一个0整数c,然后用这个整数c去
如何集成支付宝官方文档 dai_lm android
官方文档下载地址 https://b.alipay.com/order/productDetail.htm?productId=2012120700377310&tabId=4#ps-tabinfo-hash 集成的必要条件 1. 需要有自己的Server接收支付宝的消息 2. 需要先制作app，然后提交支付宝审核，通过后才能集成调试的时候估计会真的扣款，请注意
应该在什么时候使用Hadoop datamachine hadoop
原帖地址：http://blog.chinaunix.net/uid-301743-id-3925358.html 存档，某些观点与我不谋而合，过度技术化不可取，且hadoop并非万能。 --------------------------------------------万能的分割线-------------------------------- 有人问我，“你在大数据和Hado
在GridView中对于有外键的字段使用关联模型进行搜索和排序 dcj3sjt126com yii
在GridView中使用关联模型进行搜索和排序首先我们有两个模型它们直接有关联: class Author extends CActiveRecord { ... } class Post extends CActiveRecord { ... function relations() { return array( '
使用NSString 的格式化大全 dcj3sjt126com Objective-C
格式定义The format specifiers supported by the NSString formatting methods and CFString formatting functions follow the IEEE printf specification; the specifiers are summarized in Table 1. Note that you c
使用activeX插件对象object滚动有重影蕃薯耀 activeX插件滚动有重影
使用activeX插件对象object滚动有重影 <object style="width:0;" id="abc" classid="CLSID:D3E3970F-2927-9680-BBB4-5D0889909DF6" codebase="activex/OAX339.CAB#
SpringMVC4零配置 hanqunfeng springmvc4
基于Servlet3.0规范和SpringMVC4注解式配置方式，实现零xml配置，弄了个小demo，供交流讨论。项目说明如下： 1.db.sql是项目中用到的表，数据库使用的是oracle11g 2.该项目使用mvn进行管理，私服为自搭建nexus,项目只用到一个第三方 jar，就是oracle的驱动； 3.默认项目为零配置启动，如果需要更改启动方式，请
《开源框架那点事儿16》：缓存相关代码的演变 j2eetop 开源框架
问题引入上次我参与某个大型项目的优化工作，由于系统要求有比较高的TPS，因此就免不了要使用缓冲。该项目中用的缓冲比较多，有MemCache，有Redis，有的还需要提供二级缓冲，也就是说应用服务器这层也可以设置一些缓冲。当然去看相关实现代代码的时候，大致是下面的样子。 [java] view plain copy print ? public vo
AngularJS浅析 kvhur JavaScript
概念 AngularJS is a structural framework for dynamic web apps. 了解更多详情请见原文链接：http://www.gbtags.com/gb/share/5726.htm Directive 扩展html，给html添加声明语句，以便实现自己的需求。对于页面中html元素以ng为前缀的属性名称，ng是angular的命名空间
架构师之jdk的bug排查(一)---------------split的点号陷阱 nannan408 split
1.前言. jdk1.6的lang包的split方法是有bug的,它不能有效识别A.b.c这种类型,导致截取长度始终是0.而对于其他字符,则无此问题.不知道官方有没有修复这个bug. 2.代码 String[] paths = "object.object2.prop11".split("'"); System.ou
如何对10亿数据量级的mongoDB作高效的全表扫描 quentinXXZ mongodb
本文链接: http://quentinXXZ.iteye.com/blog/2149440 一、正常情况下，不应该有这种需求首先，大家应该有个概念，标题中的这个问题，在大多情况下是一个伪命题，不应该被提出来。要知道，对于一般较大数据量的数据库，全表查询，这种操作一般情况下是不应该出现的，在做正常查询的时候，如果是范围查询，你至少应该要加上limit。说一下，
C语言算法之水仙花数 qiufeihu c 算法
/** * 水仙花数 */ #include <stdio.h> #define N 10 int main() { int x,y,z; for(x=1;x<=N;x++) for(y=0;y<=N;y++) for(z=0;z<=N;z++) if(x*100+y*10+z == x*x*x
JSP指令 wyzuomumu jsp
jsp指令的一般语法格式： <%@ 指令名属性 =”值 ” %> 常用的三种指令： page,include,taglib page指令语法形式： <%@ page 属性 1=”值 1” 属性 2=”值 2”%> include指令语法形式： <%@include file=”relative url”%> (jsp可以通过 include