与李

Java版Spark离线统计分析实战

写在前面

本文系统环境：在windows中安装VMware，VMware中装CentOS7.9.2009系统为。

本文中需要用到的大数据组件有Hadoop、Spark及MongoDB数据库。均在CentOS中安装。

本文中运行的程序是在windows中的Idea编辑器中进行编写，且为用Java编写，非Scala。

版本说明

Hadoop 2.10.1
Spark 3.1.1
MongoDB 3.4.3
JDK 1.8

功能概述

本文设计两类信息，一类是产品信息，另一类是评分信息。

产品
- 产品id
- 标签
- 图片
- 名称
- 分类
评分
- 产品id
- 用户id
- 分数
- 评分时间

本分主要实现功能点：

历史热门商品统计
最近热门商品统计
商品平均得分统计

环境搭建

Hadoop

参考文章《分布式处理框架Hadoop的安装与使用》

Spark

参考文章《Spark3.1.1入门》

MongoDB

本例中使用wget命令进行包下载，所以需要使用wget命令。

检查系统中是否有wget命令：

rpm -qa|grep wget

如果搜出来内容，就不必再安装wget。

如果没有安装，需要先用yum安装wget。

yum install -y wget

安装成功之后，切换到hadoop用户（安装hadoop的时候创建的）

su hadoop

进入hadoop用户家目录

cd ~

使用wget下载MongoDB资源

wget https://fastdl.mongodb.org/linux/mongodb-linux-x86_64-rhel62-3.4.3.tgz

解压资源

tar -zxf mongodb-linux-x86_64-rhel62-3.4.3.tgz -C ./

重命名

mv mongodb-linux-x86_64-rhel62-3.4.3 ./mongodb

在mongodb目录中创建data文件夹存放日志与数据

mkdir ./mongodb/data

创建数据文件夹

mkdir ./mongodb/data/db

创建日志文件夹

mkdir ./mongodb/data/logs

在logs文件夹下创建log文件

touch ./mongodb/data/logs/mongodb.log

在data文件夹下创建mongodb.conf配置文件

touch ./mongodb/data/mongodb.conf

编辑mongodb.conf配置文件

vim ./mongodb/data/mongodb.conf

加入以下内容

#端口
port=27017
#数据库存文件存放目录
dbpath= /home/hadoop/mongodb/data/db
#日志文件存放路径
logpath= /home/hadoop/mongodb/data/logs/mongodb.log
#使用追加的方式写日志
logappend=true
#以守护进程的方式运行，创建服务器进程
fork=true
#最大同时连接数
maxConns=100
#不启用验证
noauth=true
#每次写入会记录一条操作日志（通过journal可以重新构造出写入的数据）。
#即使宕机，启动时wiredtiger会先将数据恢复到最近一次的checkpoint点，然后重放后续的journal日志来恢复。
journal=true
#存储引擎，有mmapv1、wiretiger、mongorocks
storageEngine=wiredTiger
#设置成全部ip可以访问，这样就可以在windows中去连虚拟机的MongoDB，也可以设置成某个网段或者某个ip1234567891011
bind_ip = 0.0.0.0

启动MongoDB服务器

./mongodb/bin/mongod -config ./mongodb/data/mongodb.conf

访问MongoDB服务器

./mongodb/bin/mongo

输入exit退出。

停止MongoDB服务器

./mongodb/bin/mongod -shutdown -config ./mongodb/data/mongodb.conf

如果系统开启了防火墙，则需要开启27017端口，详细操作可见《CentOS7 中端口命令》。

在windows中可以使用Navicat Premium连接MongoDB。

程序设计

项目结构设计

总体分为两个项目，一个用于数据加载，一个用于数据分析。项目使用maven结构。

- BigData #父项目
	- DataLoader #加载业务数据
	- StatisticsRecommender #数据分析

代码开发

BigData

作为一个父项目，我们需要在里面引入全局依赖与定义依赖版本。


<project xmlns="http://maven.apache.org/POM/4.0.0"
         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0modelVersion>

    <groupId>cn.javayuligroupId>
    <artifactId>BigDataartifactId>
    <version>1.0version>
    <modules>
        <module>DataLoadermodule>
        <module>StatisticsRecommendermodule>
    modules>
    <packaging>pompackaging>

    <properties>
        <log4j.version>1.2.17log4j.version>
        <slf4j.version>1.7.22slf4j.version>
        <mongodb-spark.version>3.0.1mongodb-spark.version>
        <spark.version>3.1.1spark.version>
        <hutool.version>5.6.3hutool.version>
        <mongo-java-driver.version>3.12.8mongo-java-driver.version>
    properties>
    <dependencies>
        
        <dependency>
            <groupId>org.slf4jgroupId>
            <artifactId>jcl-over-slf4jartifactId>
            <version>${slf4j.version}version>
        dependency>
        <dependency>
            <groupId>org.slf4jgroupId>
            <artifactId>slf4j-apiartifactId>
            <version>${slf4j.version}version>
        dependency>
        <dependency>
            <groupId>org.slf4jgroupId>
            <artifactId>slf4j-log4j12artifactId>
            <version>${slf4j.version}version>
        dependency>
        <dependency>
            <groupId>log4jgroupId>
            <artifactId>log4jartifactId>
            <version>${log4j.version}version>
        dependency>
        
        <dependency>
            <groupId>cn.hutoolgroupId>
            <artifactId>hutool-allartifactId>
            <version>${hutool.version}version>
        dependency>

    dependencies>

    <dependencyManagement>
        <dependencies>
            
            <dependency>
                <groupId>org.apache.sparkgroupId>
                <artifactId>spark-core_2.12artifactId>
                <version>${spark.version}version>
            dependency>
            <dependency>
                <groupId>org.apache.sparkgroupId>
                <artifactId>spark-sql_2.12artifactId>
                <version>${spark.version}version>
            dependency>
            <dependency>
                <groupId>org.apache.sparkgroupId>
                <artifactId>spark-streaming_2.12artifactId>
                <version>${spark.version}version>
            dependency>
            <dependency>
                <groupId>org.apache.sparkgroupId>
                <artifactId>spark-mllib_2.12artifactId>
                <version>${spark.version}version>
            dependency>
            <dependency>
                <groupId>org.apache.sparkgroupId>
                <artifactId>spark-graphx_2.12artifactId>
                <version>${spark.version}version>
            dependency>
        dependencies>
    dependencyManagement>

    <repositories>
        <repository>
            <id>nexus-aliyunid>
            <name>Nexus aliyunname>
            <layout>defaultlayout>
            <url>http://maven.aliyun.com/nexus/content/groups/publicurl>
            <snapshots>
                <enabled>falseenabled>
            snapshots>
            <releases>
                <enabled>trueenabled>
            releases>
        repository>
    repositories>
    <build>
        <plugins>
            <plugin>
                <groupId>org.apache.maven.pluginsgroupId>
                <artifactId>maven-compiler-pluginartifactId>
                <version>3.6.1version>
                
                <configuration>
                    <source>1.8source>
                    <target>1.8target>
                configuration>
            plugin>
        plugins>
        <pluginManagement>
            <plugins>
                <plugin>
                    <groupId>org.apache.maven.pluginsgroupId>
                    <artifactId>maven-assembly-pluginartifactId>
                    <version>3.0.0version>
                    <configuration>
                        <descriptorRefs>
                            <descriptorRef>jar-with-dependenciesdescriptorRef>
                        descriptorRefs>
                    configuration>
                    <executions>
                        <execution>
                            <id>make-assemblyid>
                            <phase>packagephase>
                            <goals>
                                <goal>singlegoal>
                            goals>
                        execution>
                    executions>
                plugin>
            plugins>
        pluginManagement>
    build>
project>

DataLoader

此项目功能为从csv文件中加载数据，用spark按照具体规则处理后，将数据写入MongoDB数据库中。

在resources目录下新建log4j.properties，写入以下内容

log4j.rootLogger=info, stdout
log4j.appender.stdout=org.apache.log4j.ConsoleAppender
log4j.appender.stdout.layout=org.apache.log4j.PatternLayout
log4j.appender.stdout.layout.ConversionPattern=%d{yyyy-MM-dd HH:mm:ss,SSS}  %5p --- [%50t]  %-80c(line:%5L)  :  %m%n

项目pom.xml


<project xmlns="http://maven.apache.org/POM/4.0.0"
         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <parent>
        <artifactId>BigDataartifactId>
        <groupId>cn.javayuligroupId>
        <version>1.0version>
    parent>
    <modelVersion>4.0.0modelVersion>

    <groupId>cn.javayuligroupId>
    <artifactId>DataLoaderartifactId>
    <version>1.0version>

    <properties>
        <maven.compiler.source>1.8maven.compiler.source>
        <maven.compiler.target>1.8maven.compiler.target>
    properties>

    <dependencies>
        
        <dependency>
            <groupId>org.apache.sparkgroupId>
            <artifactId>spark-core_2.12artifactId>
        dependency>
        <dependency>
            <groupId>org.apache.sparkgroupId>
            <artifactId>spark-sql_2.12artifactId>
        dependency>
        
        <dependency>
            <groupId>org.mongodbgroupId>
            <artifactId>mongo-java-driverartifactId>
            <version>${mongo-java-driver.version}version>
        dependency>
        <dependency>
            <groupId>org.mongodb.sparkgroupId>
            <artifactId>mongo-spark-connector_2.12artifactId>
            <version>${mongodb-spark.version}version>
        dependency>
    dependencies>
    <build>
        <plugins>
            <plugin>
                <groupId>org.apache.maven.pluginsgroupId>
                <artifactId>maven-assembly-pluginartifactId>
            plugin>
        plugins>
    build>
project>

Products数据集

Products数据集（products.csv）有7个字段，每个字段之间通过“^”符号进行分割。其中的categoryIds、amazonId对于内容特征没有实质帮助，我们只需要其它5个字段:

字段名	字段类型	字段描述	字段备注
productId	Integer	商品ID
name	String	商品名称
categories	String	商品分类	每一项用“\|”分割
imageUrl	String	商品图片URL
tags	String	商品UGC标签	每一项用“\|”分割

Ratings数据集

Ratings数据集（ratings.csv）有4个字段，每个字段之间通过“,”符号进行分割。

字段名	字段类型	字段描述
userId	Integer	用户ID
productId	Integer	商品ID
score	Double	评分值
timestamp	Integer	评分时间

根据上述数据模型，我们建了Product，Rating两个实体

package cn.javayuli.entity;

/**
 * 产品实体
 *
 * @author hanguilin
 */
public class Product {

    /**
     * product集合名称
     */
    public static final String COLLECTION_PRODUCT = "Products";

    /**
     * 商品id
     */
    private Integer productId;

    /**
     * 商品名称
     */
    private String name;

    /**
     * 商品分类
     */
    private String categories;

    /**
     * 商品图片url
     */
    private String imageUrl;

    /**
     * 商品UGC标签
     */
    private String tags;

    public Product(Integer productId, String name, String categories, String imageUrl, String tags) {
        this.productId = productId;
        this.name = name;
        this.categories = categories;
        this.imageUrl = imageUrl;
        this.tags = tags;
    }

    public Integer getProductId() {
        return productId;
    }

    public void setProductId(Integer productId) {
        this.productId = productId;
    }

    public String getName() {
        return name;
    }

    public void setName(String name) {
        this.name = name;
    }

    public String getCategories() {
        return categories;
    }

    public void setCategories(String categories) {
        this.categories = categories;
    }

    public String getImageUrl() {
        return imageUrl;
    }

    public void setImageUrl(String imageUrl) {
        this.imageUrl = imageUrl;
    }

    public String getTags() {
        return tags;
    }

    public void setTags(String tags) {
        this.tags = tags;
    }
}

package cn.javayuli.entity;

/**
 * 评分实体
 *
 * @author hanguilin
 */
public class Rating {

    /**
     * rating集合名称
     */
    public static final String COLLECTION_RATING = "Ratings";

    /**
     * 用户id
     */
    private Integer userId;

    /**
     * 商品id
     */
    private Integer productId;

    /**
     * 评分值
     */
    private Double score;

    /**
     * 评分时间
     */
    private Integer timestamp;

    public Rating(Integer userId, Integer productId, Double score, Integer timestamp) {
        this.userId = userId;
        this.productId = productId;
        this.score = score;
        this.timestamp = timestamp;
    }

    public Integer getUserId() {
        return userId;
    }

    public void setUserId(Integer userId) {
        this.userId = userId;
    }

    public Integer getProductId() {
        return productId;
    }

    public void setProductId(Integer productId) {
        this.productId = productId;
    }

    public Double getScore() {
        return score;
    }

    public void setScore(Double score) {
        this.score = score;
    }

    public Integer getTimestamp() {
        return timestamp;
    }

    public void setTimestamp(Integer timestamp) {
        this.timestamp = timestamp;
    }
}

主程序

package cn.javayuli.processor;


import cn.hutool.json.JSONUtil;
import cn.javayuli.entity.Product;
import cn.javayuli.entity.Rating;
import com.google.common.collect.Maps;
import com.mongodb.spark.MongoSpark;
import com.mongodb.spark.config.WriteConfig;
import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaRDD;
import org.apache.spark.api.java.JavaSparkContext;
import org.apache.spark.api.java.function.Function;
import org.bson.Document;

import java.util.HashMap;


/**
 * 加载数据类
 *
 * @author hanguilin
 */
public class Loader {

    /**
     * 创建SparkContext
     *
     * @return
     */
    private static JavaSparkContext createJavaSparkContext() {
        String uri = "mongodb://192.168.1.43:27017/bigData.coll";
        SparkConf sparkConf = new SparkConf()
                .setAppName("DataLoader")
                .setMaster("local[*]")
                .set("spark.app.id", "DataLoader")
                .set("spark.mongodb.input.uri", uri)
                .set("spark.mongodb.output.uri", uri);
        JavaSparkContext sparkContext = new JavaSparkContext(sparkConf);
        return sparkContext;
    }

    /**
     * 加载数据写入mongodb
     *
     * @param context spark context
     * @param filePath 文件路径
     * @param collection mongodb中集合名称
     * @param mapFunc String RDD转换为Entity RDD的转换函数
     * @param  泛型T
     */
    private static <T> void writeDataToMongo(JavaSparkContext context, String filePath, String collection, Function<String,T> mapFunc) {
        // 读取文件成RDD
        JavaRDD<String> stringRDD = context.textFile(filePath);
        // String类型RDD调用map函数转换成实体类的RDD
        JavaRDD<T> entityRDD = stringRDD.map(mapFunc);
        // 实体类的RDD调用map函数转换成MongoDB中Document的RDD
        JavaRDD<Document> documentRDD = entityRDD.map((Function<T, Document>) entityDocument -> Document.parse(JSONUtil.toJsonStr(entityDocument)));
        // 配置MongoDB写入参数
        HashMap<String, String> writeOverrides = Maps.newHashMap();
        writeOverrides.put("collection", collection);
        writeOverrides.put("writeConcern.w", "majority");
        WriteConfig writeConfig = WriteConfig.create(context).withOptions(writeOverrides);
        // 插入数据库
        MongoSpark.save(documentRDD, writeConfig);
    }

    public static void main(String[] args) {
        JavaSparkContext sparkContext = createJavaSparkContext();
        // Product转换函数
        Function<String, Product> productMapFunc = (item) -> {
            String[] split = item.split("\\^");
            return new Product(Integer.valueOf(split[0]), split[1].trim(), split[4].trim(), split[5].trim(), split[6].trim());
        };
        writeDataToMongo(sparkContext, "F:\\workspace\\BigData\\DataLoader\\src\\main\\resources\\products.csv", Product.COLLECTION_PRODUCT, productMapFunc);
        // Rating转换函数
        Function<String, Rating> ratingMapFunc = (item) -> {
            String[] split = item.split(",");
            return new Rating(Integer.valueOf(split[0]), Integer.valueOf(split[1]), Double.valueOf(split[2]), Integer.valueOf(split[3]));
        };
        writeDataToMongo(sparkContext, "F:\\workspace\\BigData\\DataLoader\\src\\main\\resources\\ratings.csv", Rating.COLLECTION_RATING, ratingMapFunc);
    }
}

运行main函数即可将csv数据导入到MongoDB数据库中。

StatisticsRecommender

此项目功能为从MongoDB数据库中读取数据，利用SparkSql进行数据分析，将分析结果写入MongoDB。

在resources目录下新建log4j.properties，写入以下内容

log4j.rootLogger=info, stdout
log4j.appender.stdout=org.apache.log4j.ConsoleAppender
log4j.appender.stdout.layout=org.apache.log4j.PatternLayout
log4j.appender.stdout.layout.ConversionPattern=%d{yyyy-MM-dd HH:mm:ss,SSS}  %5p --- [%50t]  %-80c(line:%5L)  :  %m%n

项目pom.xml


<project xmlns="http://maven.apache.org/POM/4.0.0"
         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <parent>
        <artifactId>BigDataartifactId>
        <groupId>cn.javayuligroupId>
        <version>1.0version>
    parent>
    <modelVersion>4.0.0modelVersion>

    <artifactId>StatisticsRecommenderartifactId>

    <properties>
        <maven.compiler.source>1.8maven.compiler.source>
        <maven.compiler.target>1.8maven.compiler.target>
    properties>

    <dependencies>
        
        <dependency>
            <groupId>org.apache.sparkgroupId>
            <artifactId>spark-core_2.12artifactId>
        dependency>
        <dependency>
            <groupId>org.apache.sparkgroupId>
            <artifactId>spark-sql_2.12artifactId>
        dependency>
        
        <dependency>
            <groupId>org.mongodbgroupId>
            <artifactId>mongo-java-driverartifactId>
            <version>${mongo-java-driver.version}version>
        dependency>
        <dependency>
            <groupId>org.mongodb.sparkgroupId>
            <artifactId>mongo-spark-connector_2.12artifactId>
            <version>${mongodb-spark.version}version>
        dependency>
    dependencies>
    <build>
        <plugins>
            <plugin>
                <groupId>org.apache.maven.pluginsgroupId>
                <artifactId>maven-assembly-pluginartifactId>
            plugin>
        plugins>
    build>
project>

主程序

package cn.javayuli.processor;

import com.mongodb.spark.MongoSpark;
import org.apache.spark.api.java.JavaSparkContext;
import org.apache.spark.sql.Dataset;
import org.apache.spark.sql.Row;
import org.apache.spark.sql.SparkSession;
import org.apache.spark.sql.api.java.UDF1;
import org.apache.spark.sql.types.DataTypes;

import java.time.Instant;
import java.time.ZoneId;
import java.time.format.DateTimeFormatter;

/**
 * 统计类
 *
 * @author hanguilin
 */
public class Statistics {

    /**
     * 历史热门商品集合
     */
    private static final String COLLECTION_HOT = "RateHotProducts";

    /**
     * 历史热门商品集合
     */
    private static final String COLLECTION_HOT_RECENTLY = "RateHotRecentlyProducts";

    /**
     * 商品平均得分集合
     */
    private static final String COLLECTION_AVERAGE = "AverageProducts";

    /**
     * 时间序列化
     */
    private static DateTimeFormatter YEAR_MONTH = DateTimeFormatter.ofPattern("yyyyMM");

    /**
     * 创建SparkSession
     *
     * @return
     */
    private static SparkSession createSparkSession() {
        String uri = "mongodb://192.168.1.43:27017/bigData.Ratings";
        SparkSession sparkSession = SparkSession.builder()
                .appName("DataLoader")
                .master("local[*]")
                .config("spark.app.id", "DataLoader")
                .config("spark.mongodb.input.uri", uri)
                .config("spark.mongodb.output.uri", uri)
                .getOrCreate();
        return sparkSession;
    }

    public static void main(String[] args) {
        SparkSession sparkSession = createSparkSession();
        JavaSparkContext sparkContext = new JavaSparkContext(sparkSession.sparkContext());
        Dataset<Row> rowDataset = MongoSpark.load(sparkContext).toDF();
        // 打印schema
        rowDataset.printSchema();
        // 打印数据
        rowDataset.show();
        // 内存中创建一个临时表Ratings
        rowDataset.createOrReplaceTempView("Ratings");

        // *****************历史热门商品统计******************
        Dataset<Row> rateHotProducts = sparkSession.sql("select productId, count(productId) as count from Ratings group by productId");
        MongoSpark.write(rateHotProducts).option("collection", COLLECTION_HOT).mode("overwrite").format("com.mongodb.spark.sql").save();

        // *****************最近热门商品统计******************
        // 注册一个UDF函数，用于将timestamp转换成年月格式
        sparkSession.udf().register("changeDate", (UDF1<Integer, Integer>) (parameter) -> Integer.valueOf(Instant.ofEpochSecond(parameter).atZone(ZoneId.systemDefault()).toLocalDate().format(YEAR_MONTH)), DataTypes.IntegerType);
        // 将原来的Rating数据集中的时间转换成年月的格式
        Dataset<Row> ratingOfYearMonth = sparkSession.sql("select productId, score, changeDate(timestamp) as yearmonth from Ratings");
        // 将新的数据集注册成为一张表
        ratingOfYearMonth.createOrReplaceTempView("RatingOfMonth");
        // 根据月份和商品进行统计，并按年月与数量进行倒序排序
        Dataset<Row> rateHotRecentlyProducts = sparkSession.sql("select productId, count(productId) as count ,yearmonth from RatingOfMonth group by yearmonth,productId order by yearmonth desc, count desc");
        MongoSpark.write(rateHotRecentlyProducts).option("collection", COLLECTION_HOT_RECENTLY).mode("overwrite").format("com.mongodb.spark.sql").save();

        // *****************商品平均得分统计******************
        Dataset<Row> averageProducts = sparkSession.sql("select productId, avg(score) as avg from Ratings group by productId");
        MongoSpark.write(averageProducts).option("collection", COLLECTION_AVERAGE).mode("overwrite").format("com.mongodb.spark.sql").save();
    }
}

运行main函数，就可以将数据写入到各个MongoDB的集合中去

以上就是Spark程序在本地的开发与调试。现在需要打包到服务器中运行。

服务器运行

hadoop

启动hadoop:

# 启动hdfs
start-dfs.sh
# 启动yarn
start-yarn.sh
# 启动历史服务器
mr-jobhistory-daemon.sh start historyserver

查看是否启动成功：

jps

出现上述列表即为成功，其他情况请查看《分布式处理框架Hadoop的安装与使用》。

Jar

我们修改一下csv文件路径，使其从hdfs中读取数据。修改后的DataLoader项目中的Loader.java中的main函数：

public static void main(String[] args) {
        JavaSparkContext sparkContext = createJavaSparkContext();
        // Product转换函数
        Function<String, Product> productMapFunc = (item) -> {
            String[] split = item.split("\\^");
            return new Product(Integer.valueOf(split[0]), split[1].trim(), split[4].trim(), split[5].trim(), split[6].trim());
        };
        writeDataToMongo(sparkContext, "hdfs://localhost:9000/user/hadoop/input/products.csv", Product.COLLECTION_PRODUCT, productMapFunc);
        // Rating转换函数
        Function<String, Rating> ratingMapFunc = (item) -> {
            String[] split = item.split(",");
            return new Rating(Integer.valueOf(split[0]), Integer.valueOf(split[1]), Double.valueOf(split[2]), Integer.valueOf(split[3]));
        };
        writeDataToMongo(sparkContext, "hdfs://localhost:9000/user/hadoop/input/ratings.csv", Rating.COLLECTION_RATING, ratingMapFunc);
    }

只修改了两处文件路径。

通过idea的maven将DataLoader、StatisticsRecommender项目打包。

将两个包及products.csv、ratings.csv上传至服务器的/home/hadoop/sparkapp中。

将两个文件上传至hdfs文件系统中：

cd ~/sparkapp
hdfs dfs -put ./*.csv /user/hadoop/input

查看hdfs中的文件：

hdfs dfs -ls /user/hadoop/input

还原

为了测试程序运行结果，请先将MongoDB中本地测试数据清除。

提交任务

运行数据加载任务：

spark-submit --class "cn.javayuli.processor.Loader" DataLoader-1.0-jar-with-dependencies.jar

此时数据加载成功：

运行数据分析任务：

spark-submit --class "cn.javayuli.processor.Statistics" StatisticsRecommender-1.0-jar-with-dependencies.jar

此时数据分析和写入成功：

资源链接

源代码git地址：https://github.com/hanguilin/BigData-demo/tree/main/Recommender
MongoSpark文档：https://docs.mongodb.com/spark-connector/current/java/datasets-and-sql/

你可能感兴趣的:(大数据,spark,hadoop,大数据,centos)

数据分析：低代码平台助力大数据时代的飞跃发展快乐非自愿数据分析低代码大数据
随着信息技术的突飞猛进，我们身处于一个数据量空前增长的时代——大数据时代。在这个时代背景下，数据分析已经成为企业决策、政策制定、科学研究等众多领域不可或缺的重要工具。然而，面对海量的数据和日益复杂多变的分析需求，传统的数据分析方法往往捉襟见肘，难以应对。幸运的是，低代码平台的兴起为大数据分析注入了新的活力，成为推动大数据时代发展的重要力量。低代码平台，顾名思义，是一种通过少量甚至无需编写代码，就能
linux安装docker及docker-compose 部署spring boot项目时而有事儿 docker linux docker linux spring boot
linux系统环境：centos5.14本篇描述的是在centos系统版本下安装docker，如果是ubuntu版本，请看这篇文章：linuxubuntu20安装docker和docker-compose-CSDN博客正文：安装docker和docker-compose安装docker---------运行命名等待安装完成遇到选择直接输入yyuminstall-yyum-utilsdevice-m
Apache Kafka的伸缩性探究：实现高性能、弹性扩展的关键 i289292951 kafka kafka
引言ApacheKafka作为当今最流行的消息中间件之一，以其强大的伸缩性著称。在大数据处理、流处理和实时数据集成等领域，Kafka的伸缩性为其在面临急剧增长的数据流量和多样化业务需求时提供了无与伦比的扩展能力。本文将深入探讨Kafka如何通过其独特的架构设计实现高水平的伸缩性，以及在实际部署中如何优化和利用这一特性。一、Kafka伸缩性的核心设计分区（Partitioning）与水平扩展Kafk
Azkaban各种类型的Job编写 __元昊__
一、概述原生的Azkaban支持的plugin类型有以下这些：command：Linuxshell命令行任务gobblin：通用数据采集工具hadoopJava：运行hadoopMR任务java：原生java任务hive：支持执行hiveSQLpig：pig脚本任务spark：spark任务hdfsToTeradata：把数据从hdfs导入TeradatateradataToHdfs：把数据从Te
Linux（centos7）部署hive 灯下夜无眠 Linux linux hive 运维 dbeaver hive客户端
前提环境：已部署完hadoop(HDFS、MapReduce、YARN)1、安装元数据服务MySQL切换root用户#更新密钥rpm--importhttps://repo.mysql.com/RPM-GPG-KEY-mysqL-2022#安装Mysqlyum库rpm-Uvhhttp://repo.mysql.com//mysql57-community-release-el7-7.noarch.
centos7 安装influxdb+telegraf+grafana 监控服务器吕吕-lvlv grafana 服务器运维
influxdbinfluxdb是一个时间序列数据库,所有数据记录都会打上时间戳,适合存储数字类型的内容telegraftelegraf可以用于收集系统和服务的统计数据并发送到influxdbgrafanagrafana是一个界面非常漂亮,可直接读取influxdb数据展示成各种图表的开源可视化web软件安装并启动influxdb数据库vim/etc/yum.repos.d/influxdb.re
山东省大数据局副局长禹金涛一行莅临聚合数据走访调研聚合数据 API 大数据人工智能 API
3月19日，山东省大数据局党组成员、副局长禹金涛莅临聚合数据展开考察调研。山东省大数据局数据应用管理与安全处处长杨峰，副处长都海明参加调研，苏州市大数据局副局长汤晶陪同。聚合数据董事长左磊等人接待来访。调研组一行参观了聚合数据展厅，了解了聚合数据的发展历程、数据产品、应用案例、奖项荣誉等情况。并就企业在数据处理和应用方面取得的成绩进行了深入交流。作为最早一批进入大数据行业的企业，聚合数据深耕行业十
CentOS7使用firewalld打开关闭防火墙与端口 gurlan
1、firewalld的基本使用启动：systemctlstartfirewalld关闭：systemctlstopfirewalld查看状态：systemctlstatusfirewalld开机禁用：systemctldisablefirewalld开机启用：systemctlenablefirewalld2.systemctl是CentOS7的服务管理工具中主要的工具，它融合之前service
centos7中的MySQL安装老伙子53 mysql 数据库
centos7中的MySQL安装一、MySQL5.7.17安装脚本#!/bin/bashcd/rootmkdirmysql_tarwgethttps://downloads.mysql.com/archives/get/p/23/file/mysql-community-server-5.7.17-1.el7.x86_64.rpmwgethttps://downloads.mysql.com/ar
智慧公厕的先进技术应用中期科技ZONTREE 智慧厕所智慧公厕智慧城市
公共厕所一直以来都是城市管理中一个重要的工作，但设施老化、环境脏乱、服务质量低下等问题一直困扰着城市居民。然而，随着科技的进步和数字技术的应用，智慧公厕的建设正在改变这一现状。智慧公厕通过对所在辖区内所有公共厕所的全域感知、全网协同、全业务融合和全场景智慧的赋能，“千厕一云”的公共厕所云管理模式应运而生。智慧公厕的云端多屏管理，将各个公厕连接在一起，实现信息的共享和管理的集中化。通过大数据、云计算
Elasticsearch8 - Docker安装Elasticsearch8.12.2 王谷雨_ ElasticSearch elasticsearch docker
前言最近在学习ES，所以需要在服务器上装一个单节点的ES服务器环境：centos7.9安装下载镜像目前最新版本是8.12.2dockerpulldocker.elastic.co/elasticsearch/elasticsearch:8.12.2创建配置新增配置文件elasticsearch.ymlhttp.host:0.0.0.0http.cors.enabled:truehttp.cors.
关于HDP的20道高级运维面试题编织幻境的妖运维
1.描述HDP的主要组件及其作用。HDP（HortonworksDataPlatform）的主要组件包括Hadoop框架、HDFS、MapReduce、YARN以及Hadoop生态系统中的其他关键工具，如Spark、Flink、Hive、HBase等。以下是对这些组件及其作用的具体描述：Hadoop框架:Hadoop是一个开源的分布式计算框架，用Java语言编写，用于存储和处理大规模数据集。它广义
【Hadoop】使用Scala与Spark连接ClickHouse进行数据处理音乐学家方大刚 Scala Hadoop hadoop scala spark
风不懂不懂得叶的梦月不听不听闻窗里琴声意难穷水不见不曾见绿消红霜不知不知晓将别人怎道珍重落叶有风才敢做一个会飞的梦孤窗有月才敢登高在夜里从容桃花有水才怕身是客身是客此景不能久TieYann(铁阳)、薄彩生《不知晓》在大数据分析和处理领域，ApacheSpark是一个广泛使用的高性能、通用的计算框架，而ClickHouse作为一个高性能的列式数据库，特别适合在线分析处理（OLAP）。结合Scala语
Centos 7 yum安装php5.6.X DomyloveR
检查当前安装的PHP包yumlistinstalled|grepphp如果有安装的PHP包，先删除他们yumremovephp.x86_64php-cli.x86_64php-common.x86_64php-gd.x86_64php-ldap.x86_64php-mbstring.x86_64php-mcrypt.x86_64php-mysql.x86_64php-pdo.x86_64配置yum
【CentOS7】【Nginx】CentOS7源码编译并安装nginx 小丛的知识窝 nginx 运维服务器
更新yumsudoyumupdate-y安装必要的编译工具和依赖项sudoyuminstall-ygccpcre-developenssl-develzlib-devel下载Nginx源代码wgethttp://nginx.org/download/nginx-1.20.1.tar.gz解压源代码包tar-zxvfnginx-1.20.1.tar.gz进入解压后的目录cdnginx-1.20.1配
centos7安装jdk17 小丛的知识窝 java
AmazonCorretto是亚马逊提供的一个免费的、兼容OpenJDK的JDK发行版。以下是在CentOS7系统上安装AmazonCorrettoJDK17的步骤：下载AmazonCorrettoJDK：wgethttps://corretto.aws/downloads/latest/amazon-corretto-17-x64-linux-jdk.tar.gz解压JDK17文件：在服务器上执
关于虚拟机下安装CentOS7及C++开发环境的搭建 dllmayday C++
由于平时工作的环境就是在服务器端的CentOS上进行C++的开发，所以周末闲来无事就在自己的电脑上安装了虚拟机，然后再虚拟机上安装的CentOS的操作系统。虚拟机软件用的是VMwareworkstation12版本的，安装按照引导直接进行安装即可，没有太大的问题。产品密钥可以在网上找。虚拟机安装完之后接下来是CentOS7系统的安装。CentOS系统是RedHat系统的开源系统，在Linux的各个
一文详解大数据时代与低代码开发应用快乐非自愿大数据低代码
随着信息技术的飞速发展，我们迎来了一个崭新的时代——大数据时代。在这个时代，数据成为了一种新的资源，大数据技术的应用成为了推动社会进步的关键力量。而在大数据技术的浪潮中，低代码开发应用也逐渐崭露头角，以其高效、灵活的特点，成为大数据时代的重要支撑。大数据时代的来临随着科技的飞速发展和互联网的广泛普及，我们迎来了一个被称为“大数据时代”的全新时代。这个时代，数据无处不在，无时不刻不在增长，其规模之大
Spark面试整理-Spark是什么？不务正业的猿面试 Spark spark 大数据分布式
ApacheSpark是一个开源的分布式计算系统，它提供了一个用于大规模数据处理的快速、通用、易于使用的平台。它最初是在加州大学伯克利分校的AMPLab开发的，并于2010年开源。自那时起，Spark已经成为大数据处理中最受欢迎和广泛使用的框架之一。下面是Spark的一些关键特点：速度：Spark使用了先进的DAG（有向无环图）执行引擎，可以支持循环数据流和内存计算。这使得Spark在数据处理方面
hadoop配置免密登录我干开发那十年 ssh 服务器 linux
1.生成密钥ssh-keygen-trsa所有节点都要执行2.所有节点执行ssh-copy-id-i~/.ssh/id_rsa.pub用户名1@主机名1ssh-copy-id-i~/.ssh/id_rsa.pub用户名2@主机名2ssh-copy-id-i~/.ssh/id_rsa.pub用户名3@主机名33.目录授权chmod700~/.sshchmod600~/.ssh/authorized_
请介绍一下大数据主要是干什么的？决策支持预测分析用户行为分析个性化服务操作优化风险管理创新与产品开发加拿大卡尔加里大学历史背景学术结构研究和创新校园设施盛溪的猫猫感悟大数据英语加拿大
目录请介绍一下大数据主要是干什么的？决策支持预测分析用户行为分析个性化服务操作优化风险管理创新与产品开发加拿大卡尔加里大学历史背景学术结构研究和创新校园设施国际化学生生活大语言模型目前的问题卡尔加里经济地理和气候文化和活动教育交通绿色城市AVL树的旋转单右旋（LL旋转）单左旋（RR旋转）左右旋（LR旋转）右左旋（RL旋转）请介绍一下大数据主要是干什么的？大数据是一个涉及从极其庞大和复杂的数据集中提
centos7安装Rstudio Vin0sen 环境搭建 linux 运维服务器
RStudio分为Desktop和Server，服务器版通过Web界面进行操作，与桌面客户端体验一致#installR#yuminstallepel-release#可能需要安装并启用EPELyuminstall-yR#installR-studiowgethttps://download2.rstudio.org/server/centos7/x86_64/rstudio-server-rhel
GEE在灾害预警中的遥感云大数据应用及GPT模型辅助分析 AIzmjl GPT 生态遥感大数据 gpt gee 灾害预警水体湿地遥感
随着遥感技术的快速发展，云大数据在灾害、水体与湿地领域的应用日益广泛。通过遥感云大数据，我们能够实时获取灾害发生地的影像信息，为灾害预警、应急响应提供有力支持。同时，在水体与湿地监测方面，遥感云大数据也发挥着重要作用，帮助我们了解水体的分布、变化以及湿地的生态状况。近年来，GPT模型在自然语言处理领域取得了显著成果，其强大的文本生成和理解能力为遥感云大数据的应用提供了新的可能。通过将GPT模型与遥
大数据毕设图像识别-人脸识别与疲劳检测 - python opencv fawubio_A python 算法
文章目录0前言1课题背景2Dlib人脸识别2.1简介2.2Dlib优点2.3相关代码2.4人脸数据库2.5人脸录入加识别效果3疲劳检测算法3.1眼睛检测算法3.2打哈欠检测算法3.3点头检测算法4PyQt54.1简介4.2相关界面代码0前言这两年开始毕业设计和毕业答辩的要求和难度不断提升，传统的毕设题目缺少创新和亮点，往往达不到毕业答辩的要求，这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师
docker jdk1.8+字体镜像 wcy10086 docker jdk 字体
FROMcentos:7MAINTAINERwcy# 修改成东八区RUNln-sf/usr/share/zoneinfo/Asia/Shanghai/etc/localtime&&echo'Asia/Shanghai'>/etc/timezoneRUNyum-yinstallkde-l10n-Chinesetelnet&&\yum-yreinstallglibc-common&&\yumclean
大数据开发（Hive面试真题-卷二） Key-Key 大数据 hive 面试
大数据开发（Hive面试真题）1、举几个Hive开窗函数例子？什么要有开窗函数，和聚集函数区别？2、说下Hive是什么？跟数据仓库区别？3、Hive架构？4、Hive数据倾斜以及解决方案？5、Hive如果不用参数调优，在map和reduce端应该做什么？6、Hive的三种自定义函数是什么？实现步骤与流程？它们之间的区别？作用是什么？7、Hive分区和分桶的区别？8、Hive的执行流程？9、Hive
【大数据面试题】014 Flink CDC 用过吗，请简要描述 Jiweilai1 一天一道面试题 flink 大数据面试 flink cdc
一步一个脚印，一天一道面试题。FlinkCDC的诞生背景FlinkCDC的全称是ChangeDataCapture（变更数据捕获）每一项技术的诞生都是为了解决某个问题，某个痛点。而FlinkCDC的诞生就是为了解决在读取，监控MySQL这样的数据库时，不会因为读取数据库，对数据库本身造成压力，影响性能。同时，保证了数据源的准确，正确。FlinkCDC原理方式一：通过查询来获取更新的数据。如查询数据
【笔记】HDFS基础笔记哇咔咔哇咔 Hadoop hdfs 笔记 hadoop 大数据 ubuntu
启动hadoop命令（未配环境变量）：进入hadoop安装目录输入./sbin/start-dfs.sh已配环境变量：start-dfs.sh关闭hadoop命令：stop-dfs.sh启动完成后，可以通过命令jps来判断是否成功启动，若成功启动则会列出如下进程:"NameNode"、"DataNode"和"SecondaryNameNode"三种Shell命令方式：1.hadoopfs2.had
【笔记】Linux常用命令哇咔咔哇咔 Linux 笔记 linux 运维 ubuntu
命令含义cd/home/hadoop#把/home/hadoop设置为当前目录cd..#返回上一级目录cd~#进入到当前Linux系统登录用户的主目录（或主文件夹）。在Linux系统中，~代表的是用户的主文件夹，即“/home/用户名”这个目录，如果当前登录用户名为hadoop，则~就代表“/home/hadoop/”这个目录ls#查看当前目录中的文件ls-l#查看文件和目录的权限信息touch文
openGauss+KeepAlived openGaussMan openGauss 数据库
openGauss+KeepAlived实验环境操作系统：CentOS7.6数据库版本：openGauss1.1.0Primary主机/IP：opengaussdb1/...1(openGauss主备已部署完毕)Standby主机/IP：opengaussdb2/...2(openGauss主备已部署完毕)说明：不建议在云环境(如：华为云)下搭建Keepalived进行测试，本人在云环境下测试发现
ASM系列四利用Method 组件动态注入方法逻辑 lijingyao8206 字节码技术 jvm AOP 动态代理 ASM
这篇继续结合例子来深入了解下Method组件动态变更方法字节码的实现。通过前面一篇，知道ClassVisitor 的visitMethod()方法可以返回一个MethodVisitor的实例。那么我们也基本可以知道，同ClassVisitor改变类成员一样，MethodVIsistor如果需要改变方法成员，注入逻辑，也可以
java编程思想 --内部类百合不是茶 java 内部类匿名内部类
内部类;了解外部类并能与之通信内部类写出来的代码更加整洁与优雅 1,内部类的创建内部类是创建在类中的 package com.wj.InsideClass; /* * 内部类的创建 */ public class CreateInsideClass { public CreateInsideClass(
web.xml报错 crabdave web.xml
web.xml报错 The content of element type "web-app" must match "(icon?,display- name?,description?,distributable?,context-param*,filter*,filter-mapping*,listener*,servlet*,s
泛型类的自定义麦田的设计者 java android 泛型
为什么要定义泛型类，当类中要操作的引用数据类型不确定的时候。采用泛型类，完成扩展。例如有一个学生类 Student{ Student(){ System.out.println("I'm a student....."); } } 有一个老师类
CSS清除浮动的4中方法 IT独行者 JavaScript UI css
清除浮动这个问题，做前端的应该再熟悉不过了，咱是个新人，所以还是记个笔记，做个积累，努力学习向大神靠近。CSS清除浮动的方法网上一搜，大概有N多种，用过几种，说下个人感受。 1、结尾处加空div标签 clear:both 1 2 3 4 .div 1 { background : #000080 ; border : 1px s
Cygwin使用windows的jdk 配置方法 _wy_ jdk windows cygwin
1.[vim /etc/profile] JAVA_HOME="/cgydrive/d/Java/jdk1.6.0_43" (windows下jdk路径为D:\Java\jdk1.6.0_43) PATH="$JAVA_HOME/bin:${PATH}" CLAS
linux下安装maven 无量 maven linux 安装
Linux下安装maven(转) 1.首先到Maven官网下载安装文件，目前最新版本为3.0.3，下载文件为 apache-maven-3.0.3-bin.tar.gz，下载可以使用wget命令； 2.进入下载文件夹，找到下载的文件，运行如下命令解压 tar -xvf apache-maven-2.2.1-bin.tar.gz 解压后的文件夹
tomcat的https 配置,syslog-ng配置 aichenglong tomcat http跳转到https syslong-ng配置 syslog配置
1) tomcat配置https,以及http自动跳转到https的配置 1)TOMCAT_HOME目录下生成密钥(keytool是jdk中的命令) keytool -genkey -alias tomcat -keyalg RSA -keypass changeit -storepass changeit
关于领号活动总结 alafqq 活动
关于某彩票活动的总结具体需求，每个用户进活动页面，领取一个号码，1000中的一个；活动要求 1，随机性，一定要有随机性； 2，最少中奖概率，如果注数为3200注，则最多中4注 3，效率问题，（不能每个人来都产生一个随机数，这样效率不高）； 4，支持断电（仍然从下一个开始），重启服务；（存数据库有点大材小用，因此不能存放在数据库）解决方案 1，事先产生随机数1000个，并打
java数据结构冒泡排序的遍历与排序百合不是茶 java
java的冒泡排序是一种简单的排序规则冒泡排序的原理：比较两个相邻的数，首先将最大的排在第一个，第二次比较第二个，此后一样；针对所有的元素重复以上的步骤，除了最后一个例题；将int array[]
JS检查输入框输入的是否是数字的一种校验方法 bijian1013 js
如下是JS检查输入框输入的是否是数字的一种校验方法： <form method=post target="_blank"> 数字：<input type="text" name=num onkeypress="checkNum(this.form)"><br> </form>
Test注解的两个属性：expected和timeout bijian1013 java JUnit expected timeout
JUnit4：Test文档中的解释：　　The Test annotation supports two optional parameters. 　　The first, expected, declares that a test method should throw an exception. 　　If it doesn't throw an exception or if it
[Gson二]继承关系的POJO的反序列化 bit1129 POJO
父类 package inheritance.test2; import java.util.Map; public class Model { private String field1; private String field2; private Map<String, String> infoMap
【Spark八十四】Spark零碎知识点记录 bit1129 spark
1. ShuffleMapTask的shuffle数据在什么地方记录到MapOutputTracker中的 ShuffleMapTask的runTask方法负责写数据到shuffle map文件中。当任务执行完成成功，DAGScheduler会收到通知，在DAGScheduler的handleTaskCompletion方法中完成记录到MapOutputTracker中
WAS各种脚本作用大全 ronin47 WAS 脚本
　　　http://www.ibm.com/developerworks/cn/websphere/library/samples/SampleScripts.html 　　　无意中，在WAS官网上发现的各种脚本作用，感觉很有作用，先与各位分享一下　　　获取下载这些示例 jacl 和 Jython 脚本可用于在 WebSphere Application Server 的不同版本中自
java-12.求 1+2+3+..n不能使用乘除法、 for 、 while 、 if 、 else 、 switch 、 case 等关键字以及条件判断语句 bylijinnan switch
借鉴网上的思路，用java实现： public class NoIfWhile { /** * @param args * * find x=1+2+3+....n */ public static void main(String[] args) { int n=10; int re=find(n); System.o
Netty源码学习-ObjectEncoder和ObjectDecoder bylijinnan java netty
Netty中传递对象的思路很直观： Netty中数据的传递是基于ChannelBuffer（也就是byte[]）；那把对象序列化为字节流，就可以在Netty中传递对象了相应的从ChannelBuffer恢复对象，就是反序列化的过程 Netty已经封装好ObjectEncoder和ObjectDecoder 先看ObjectEncoder ObjectEncoder是往外发送
spring 定时任务中cronExpression表达式含义 chicony cronExpression
一个cron表达式有6个必选的元素和一个可选的元素，各个元素之间是以空格分隔的，从左至右，这些元素的含义如下表所示：代表含义是否必须允许的取值范围 &nb
Nutz配置Jndi ctrain JNDI
1、使用JNDI获取指定资源： var ioc = { dao : { type :"org.nutz.dao.impl.NutDao", args : [ {jndi :"jdbc/dataSource"} ] } } 以上方法,仅需要在容器中配置好数据源,注入到NutDao即可.
解决 /bin/sh^M: bad interpreter: No such file or directory daizj shell
在Linux中执行.sh脚本，异常/bin/sh^M: bad interpreter: No such file or directory。分析：这是不同系统编码格式引起的：在windows系统中编辑的.sh文件可能有不可见字符，所以在Linux系统下执行会报以上异常信息。解决： 1）在windows下转换：利用一些编辑器如UltraEdit或EditPlus等工具
[转]for 循环为何可恨？ dcj3sjt126com 程序员读书
Java的闭包(Closure)特征最近成为了一个热门话题。一些精英正在起草一份议案，要在Java将来的版本中加入闭包特征。然而，提议中的闭包语法以及语言上的这种扩充受到了众多Java程序员的猛烈抨击。不久前，出版过数十本编程书籍的大作家Elliotte Rusty Harold发表了对Java中闭包的价值的质疑。尤其是他问道“for 循环为何可恨？”[http://ju
Android实用小技巧 dcj3sjt126com android
1、去掉所有Activity界面的标题栏　　修改AndroidManifest.xml 　　在application 标签中添加android:theme="@android:style/Theme.NoTitleBar" 2、去掉所有Activity界面的TitleBar 和StatusBar 　　修改AndroidManifes
Oracle 复习笔记之序列 eksliang Oracle 序列 sequence Oracle sequence
转载请出自出处：http://eksliang.iteye.com/blog/2098859 1.序列的作用序列是用于生成唯一、连续序号的对象一般用序列来充当数据库表的主键值 2.创建序列语法如下： create sequence s_emp start with 1 --开始值 increment by 1 --増长值 maxval
有“品”的程序员 gongmeitao 工作
完美程序员的10种品质　　完美程序员的每种品质都有一个范围，这个范围取决于具体的问题和背景。没有能解决所有问题的完美程序员（至少在我们这个星球上），并且对于特定问题，完美程序员应该具有以下品质：　　1. 才智非凡- 能够理解问题、能够用清晰可读的代码翻译并表达想法、善于分析并且逻辑思维能力强（范围：用简单方式解决复杂问题）　　
使用KeleyiSQLHelper类进行分页查询 hvt sql .net C#asp.net hovertree
本文适用于sql server单主键表或者视图进行分页查询，支持多字段排序。KeleyiSQLHelper类的最新代码请到http://hovertree.codeplex.com/SourceControl/latest下载整个解决方案源代码查看。或者直接在线查看类的代码：http://hovertree.codeplex.com/SourceControl/latest#HoverTree.D
SVG 教程（三）圆形，椭圆，直线天梯梦 svg
SVG <circle> SVG 圆形 - <circle> <circle> 标签可用来创建一个圆：下面是SVG代码： <svg xmlns="http://www.w3.org/2000/svg" version="1.1"> <circle cx="100" c
链表栈 luyulong java 数据结构
public class Node { private Object object; private Node next; public Node() { this.next = null; this.object = null; } public Object getObject() { return object; } public
基础数据结构和算法十：2-3 search tree sunwinner Algorithm 2-3 search tree
Binary search tree works well for a wide variety of applications, but they have poor worst-case performance. Now we introduce a type of binary search tree where costs are guaranteed to be loga
spring配置定时任务 stunizhengjia spring timer
最近因工作的需要，用到了spring的定时任务的功能,觉得spring还是很智能化的,只需要配置一下配置文件就可以了,在此记录一下，以便以后用到： //------------------------定时任务调用的方法------------------------------ /** * 存储过程定时器 */ publi
ITeye 8月技术图书有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的8月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 8月试读活动回顾： http://webmaster.iteye.com/blog/2102830 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《跨终端Web》 gleams：http