魏晓蕾

【Spark】Spark On Yarn 环境搭建及 WordCount 程序原理深度剖析

1、Spark On Yarn 环境搭建

参考文献：http://spark.apache.org/docs/1.6.1/running-on-yarn.html
（1）将配置文件/opt/cdh-5.3.6/hadoop-2.5.0-cdh5.3.6/etc/hadoop/yarn-site.xml的路径加入Spark的Classpath中，即在/opt/cdh-5.3.6/spark-1.6.1-bin-2.5.0-cdh5.3.6/conf/spark-env.sh中设置HADOOP_CONF_DIR=/opt/cdh-5.3.6/hadoop-2.5.0-cdh5.3.6/etc/hadoop。
（2）配置Spark on Yarn Job History
配置在yarn页面可以通过链接直接点击进入history执行页面：
1）修改/opt/cdh-5.3.6/hadoop-2.5.0-cdh5.3.6/etc/hadoop/yarn-site.xml文件，yarn-site.xml文件配置如下：


        yarn.nodemanager.aux-services
        mapreduce_shuffle


        yarn.resourcemanager.hostname
        bigdata-senior.ibeifeng.com


        yarn.log-aggregation-enable
        true


        yarn.log.server.url
        http://bigdata-senior.ibeifeng.com:19888/jobhistory/job/


        yarn.log-aggregation.retain-seconds
        640800

2）修改配置文件/opt/cdh-5.3.6/spark-1.6.1-bin-2.5.0-cdh5.3.6/conf/spark-defaults.conf

spark.eventLog.enabled                  true
spark.eventLog.dir                      hdfs://bigdata-senior.ibeifeng.com:8020/user/beifeng/spark/history
spark.yarn.historyServer.address        http://bigdata-senior.ibeifeng.com:18080

（3）启动Spark的History Server
spark-1.6.1-bin-2.5.0-cdh5.3.6]$ sbin/start-history-server.sh
（4）启动Yarn
Spark的History Server管理界面：http://bigdata-senior.ibeifeng.com:18080/

2、Spark任务提交到Yarn执行

Spark应用的构成：Driver + Executors。
Driver：main方法运行的JVM的地方；主要功能是：SparkContext上下文创建、RDD构建、RDD调度、RDD运行资源调度。
Executor：具体task执行JVM的地方。
Spark应用启动配置信息可以在三个地方配置（优先级：1 < 2 < 3）：

spark-defaults.conf
spark-submit脚本参数
spark应用中通过SparkConf对象指定参数

spark-submit脚本参数（可用于Spark资源调优）：
参考文献：http://spark.apache.org/docs/1.6.1/configuration.html#available-properties
–master：给定运行spark应用的执行位置信息；
–deploy-mode：给定driver在哪儿执行：
client：driver在执行spark-submit的那台机器上运行；
cluster：driver在集群中任选一台机器运行；
–driver-memory MEM：指定driver运行的时候jvm的内存大小，默认1G，一般情况下要求比单个executor的内存要大；
–executor-memory MEM：指定单个executor的内存大小，默认1G；
–driver-cores NUM：指定spark on standalone的时候，而且是cluster模式的情况下，driver运行过程中使用的core数量，默认1；
–supervise：当运行环境为standalone/mesos + cluster，如果driver运行失败，会重新自动进行恢复操作；
–total-executor-cores NUM：运行环境为standalone/mesos，给定应用需要的总的core的数目，默认所有；
–executor-cores NUM：运行环境为standalon/yarn，给定应用运行过程中，每个executor包含的core数目，默认1个（yarn），默认all（standalone）；
–driver-cores NUM：spark on yarn cluster，给定driver运行需要多少个core，默认1个
–num-executors NUM：申请多少个executor，默认2。
spark-submit脚本示例：
spark-1.6.1-bin-2.5.0-cdh5.3.6]$ bin/spark-submit --class com.ibeifeng.bigdata.spark.app.core.SparkWordCount /opt/cdh-5.3.6/spark-1.6.1-bin-2.5.0-cdh5.3.6/data/logs-analyzer.jar
spark-1.6.1-bin-2.5.0-cdh5.3.6]$ bin/spark-submit --master yarn --deploy-mode client --class com.ibeifeng.bigdata.spark.app.core.SparkWordCount /opt/cdh-5.3.6/spark-1.6.1-bin-2.5.0-cdh5.3.6/data/logs-analyzer.jar
local执行：(如果我们不给定master的值，默认是本地)
spark-1.6.1-bin-2.5.0-cdh5.3.6]$ bin/spark-submit --class com.ibeifeng.bigdata.spark.app.core.SparkWordCount /opt/cdh-5.3.6/spark-1.6.1-bin-2.5.0-cdh5.3.6/data/logs-analyzer.jar

3、WordCount程序代码

（1）Java开发WordCount Local程序

package cn.spark.study.core;

import java.util.Arrays;
import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaPairRDD;
import org.apache.spark.api.java.JavaRDD;
import org.apache.spark.api.java.JavaSparkContext;
import org.apache.spark.api.java.function.FlatMapFunction;
import org.apache.spark.api.java.function.Function2;
import org.apache.spark.api.java.function.PairFunction;
import org.apache.spark.api.java.function.VoidFunction;
import scala.Tuple2;

/**
 * 使用java开发本地测试的wordcount程序
 * @author Administrator
 *
 */
public class WordCountLocal {
	
	public static void main(String[] args) {
		// 编写Spark应用程序
		// 本地执行，是可以执行在eclipse中的main方法中，执行的
		
		// 第一步：创建SparkConf对象，设置Spark应用的配置信息
		// 使用setMaster()可以设置Spark应用程序要连接的Spark集群的master节点的url
		// 但是如果设置为local则代表，在本地运行
		SparkConf conf = new SparkConf()
				.setAppName("WordCountLocal")
				.setMaster("local");  
		
		// 第二步：创建JavaSparkContext对象
		// 在Spark中，SparkContext是Spark所有功能的一个入口，你无论是用java、scala，甚至是python编写
			// 都必须要有一个SparkContext，它的主要作用，包括初始化Spark应用程序所需的一些核心组件，包括
			// 调度器（DAGSchedule、TaskScheduler），还会去到Spark Master节点上进行注册，等等
		// 一句话，SparkContext，是Spark应用中，可以说是最最重要的一个对象
		// 但是呢，在Spark中，编写不同类型的Spark应用程序，使用的SparkContext是不同的，如果使用scala，
			// 使用的就是原生的SparkContext对象
			// 但是如果使用Java，那么就是JavaSparkContext对象
			// 如果是开发Spark SQL程序，那么就是SQLContext、HiveContext
			// 如果是开发Spark Streaming程序，那么就是它独有的SparkContext
			// 以此类推
		JavaSparkContext sc = new JavaSparkContext(conf);
	
		// 第三步：要针对输入源（hdfs文件、本地文件，等等），创建一个初始的RDD
		// 输入源中的数据会打散，分配到RDD的每个partition中，从而形成一个初始的分布式的数据集
		// 我们这里呢，因为是本地测试，所以呢，就是针对本地文件
		// SparkContext中，用于根据文件类型的输入源创建RDD的方法，叫做textFile()方法
		// 在Java中，创建的普通RDD，都叫做JavaRDD
		// 在这里呢，RDD中，有元素这种概念，如果是hdfs或者本地文件呢，创建的RDD，每一个元素就相当于
		// 是文件里的一行
		JavaRDD lines = sc.textFile("C://Users//Administrator//Desktop//spark.txt");
	
		// 第四步：对初始RDD进行transformation操作，也就是一些计算操作
		// 通常操作会通过创建function，并配合RDD的map、flatMap等算子来执行
		// function，通常，如果比较简单，则创建指定Function的匿名内部类
		// 但是如果function比较复杂，则会单独创建一个类，作为实现这个function接口的类
		
		// 先将每一行拆分成单个的单词
		// FlatMapFunction，有两个泛型参数，分别代表了输入和输出类型
		// 我们这里呢，输入肯定是String，因为是一行一行的文本，输出，其实也是String，因为是每一行的文本
		// 这里先简要介绍flatMap算子的作用，其实就是，将RDD的一个元素，给拆分成一个或多个元素
		JavaRDD words = lines.flatMap(new FlatMapFunction() {
			
			private static final long serialVersionUID = 1L;
			
			@Override
			public Iterable call(String line) throws Exception {
				return Arrays.asList(line.split(" "));  
			}
			
		});
		
		// 接着，需要将每一个单词，映射为(单词, 1)的这种格式
			// 因为只有这样，后面才能根据单词作为key，来进行每个单词的出现次数的累加
		// mapToPair，其实就是将每个元素，映射为一个(v1,v2)这样的Tuple2类型的元素
			// 如果大家还记得scala里面讲的tuple，那么没错，这里的tuple2就是scala类型，包含了两个值
		// mapToPair这个算子，要求的是与PairFunction配合使用，第一个泛型参数代表了输入类型
			// 第二个和第三个泛型参数，代表的输出的Tuple2的第一个值和第二个值的类型
		// JavaPairRDD的两个泛型参数，分别代表了tuple元素的第一个值和第二个值的类型
		JavaPairRDD pairs = words.mapToPair(
				
				new PairFunction() {

					private static final long serialVersionUID = 1L;
		
					@Override
					public Tuple2 call(String word) throws Exception {
						return new Tuple2(word, 1);
					}
					
				});
		
		// 接着，需要以单词作为key，统计每个单词出现的次数
		// 这里要使用reduceByKey这个算子，对每个key对应的value，都进行reduce操作
		// 比如JavaPairRDD中有几个元素，分别为(hello, 1) (hello, 1) (hello, 1) (world, 1)
		// reduce操作，相当于是把第一个值和第二个值进行计算，然后再将结果与第三个值进行计算
		// 比如这里的hello，那么就相当于是，首先是1 + 1 = 2，然后再将2 + 1 = 3
		// 最后返回的JavaPairRDD中的元素，也是tuple，但是第一个值就是每个key，第二个值就是key的value
		// reduce之后的结果，相当于就是每个单词出现的次数
		JavaPairRDD wordCounts = pairs.reduceByKey(
				
				new Function2() {
					
					private static final long serialVersionUID = 1L;
		
					@Override
					public Integer call(Integer v1, Integer v2) throws Exception {
						return v1 + v2;
					}
					
				});
		
		// 到这里为止，我们通过几个Spark算子操作，已经统计出了单词的次数
		// 但是，之前我们使用的flatMap、mapToPair、reduceByKey这种操作，都叫做transformation操作
		// 一个Spark应用中，光是有transformation操作，是不行的，是不会执行的，必须要有一种叫做action
		// 接着，最后，可以使用一种叫做action操作的，比如说，foreach，来触发程序的执行
		wordCounts.foreach(new VoidFunction>() {
			
			private static final long serialVersionUID = 1L;
			
			@Override
			public void call(Tuple2 wordCount) throws Exception {
				System.out.println(wordCount._1 + " appeared " + wordCount._2 + " times.");    
			}
			
		});		
		sc.close();
	}
}

（2）Java开发 WordCount Cluster程序

package cn.spark.study.core;

import java.util.Arrays;
import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaPairRDD;
import org.apache.spark.api.java.JavaRDD;
import org.apache.spark.api.java.JavaSparkContext;
import org.apache.spark.api.java.function.FlatMapFunction;
import org.apache.spark.api.java.function.Function2;
import org.apache.spark.api.java.function.PairFunction;
import org.apache.spark.api.java.function.VoidFunction;
import scala.Tuple2;

/**
 * 将java开发的wordcount程序部署到spark集群上运行
 * @author Administrator
 *
 */
public class WordCountCluster {
	
	public static void main(String[] args) {
		// 如果要在spark集群上运行，需要修改的，只有两个地方
		// 第一，将SparkConf的setMaster()方法给删掉，默认它自己会去连接
		// 第二，我们针对的不是本地文件了，修改为hadoop hdfs上的真正的存储大数据的文件
		
		// 实际执行步骤：
		// 1、将spark.txt文件上传到hdfs上去
		// 2、使用我们最早在pom.xml里配置的maven插件，对spark工程进行打包
		// 3、将打包后的spark工程jar包，上传到机器上执行
		// 4、编写spark-submit脚本
		// 5、执行spark-submit脚本，提交spark应用到集群执行
		
		SparkConf conf = new SparkConf()
				.setAppName("WordCountCluster");  
		
		JavaSparkContext sc = new JavaSparkContext(conf);
		JavaRDD lines = sc.textFile("hdfs://spark1:9000/spark.txt");		
		JavaRDD words = lines.flatMap(new FlatMapFunction() {			
		private static final long serialVersionUID = 1L;
			
			@Override
			public Iterable call(String line) throws Exception {
				return Arrays.asList(line.split(" "));  
			}			
		});

		JavaPairRDD pairs = words.mapToPair(
				
				new PairFunction() {
					private static final long serialVersionUID = 1L;		
					@Override
					public Tuple2 call(String word) throws Exception {
						return new Tuple2(word, 1);
					}					
				});
		
		JavaPairRDD wordCounts = pairs.reduceByKey(
				
				new Function2() {					
					private static final long serialVersionUID = 1L;		
					@Override
					public Integer call(Integer v1, Integer v2) throws Exception {
						return v1 + v2;
					}
					
				});

		wordCounts.foreach(new VoidFunction>() {
			
			private static final long serialVersionUID = 1L;			
			@Override
			public void call(Tuple2 wordCount) throws Exception {
				System.out.println(wordCount._1 + " appeared " + wordCount._2 + " times.");    
			}			
		});		
		sc.close();
	}	
}

（3）Scala开发WordCount Cluster程序

package cn.spark.study.core

import org.apache.spark.SparkConf
import org.apache.spark.SparkContext

/**
 * @author Administrator
 */
object WordCount {
  
  def main(args: Array[String]) {
    val conf = new SparkConf()
        .setAppName("WordCount");
    val sc = new SparkContext(conf)
  
    val lines = sc.textFile("hdfs://spark1:9000/spark.txt", 1); 
    val words = lines.flatMap { line => line.split(" ") }   
    val pairs = words.map { word => (word, 1) }   
    val wordCounts = pairs.reduceByKey { _ + _ }
    
    wordCounts.foreach(wordCount => println(wordCount._1 + " appeared " + wordCount._2 + " times."))  
  }
}

（4）Spark Cluster 端执行脚本

/opt/cdh-5.3.6/spark-1.6.1-bin-2.5.0-cdh5.3.6/bin/spark-submit \
--class cn.spark.sparktest.core.WordCountCluster \
--num-executors 3 \
--driver-memory 100m \
--executor-memory 100m \
--executor-cores 3 \
/opt/cdh-5.3.6/spark-1.6.1-bin-2.5.0-cdh5.3.6/data/SparkTest-0.0.1-SNAPSHOT-jar-with-dependencies.jar \

4、WordCount 程序原理深度剖析

vue3使用AntV X6 (图可视化引擎)历程[二] 在路上` Vue vue.js javascript
通过h函数动态展示自定义节点内容一、案例效果二、案例代码父组件.BloodTopology.vuerightContentimportRightDrawerfrom'@/common/components/topologyToolKit/RightDrawer.vue';importTopologyCompactfrom'@/common/components/topologyToolKit/To
uniapp调用高德api zhcinit0 uni-app 小程序前端 vue.js
主要包含：1、uniapp调用高德地图的微信sdk2、实现坐标和经纬度互相转换功能3、实现关键字检索功能说明：页面以uniapp编写，使用uniapp官方map组件，cover-view处理原生组件层级问题。以下是单个页面布局和业务逻辑:{{inputInfo}}详细地址：{{description}}保存{{i.name}}importWhiteHeadfrom'../../components
uniapp--腾讯地图路线轨迹回放前端志茗 uni-app json 前端微信小程序小程序
腾讯地图路线轨迹回放返回路线轨迹手动选择目的地开始驾车路线规划显示小车轨迹模拟运行//引入SDK核心类，地图组件importQQMapWXfrom'../components/qqmap-wx-jssdk1.2/qqmap-wx-jssdk.js'exportdefault{data(){return{qqmapsdk:{},//腾讯地图小程序的SDKtext:'路线轨迹，带小车图标',//滚动通
[架构之美]手动搭建Vue3 前端项目框架曼岛_ 成长之路前端
[架构之美]手动搭建Vue3前端项目框架我们将手动创建一个完整的Vue前端项目，包含基础结构、路由、状态管理和UI组件。下面是实现方案：一.项目结构设计1.1项目架构设计my-vue-project/├──public/│├──index.html│└──favicon.ico├──src/│├──assets/││└──logo.png││├──main.css│├──components/││
DK遇见未来：机器人祖爸
人工智能、AI、机械设计、BigData……这些听起来就很高端的专业究竟是什么？这些前沿学科相遇又会碰撞出什么？机器人，将这些前沿领域结合在一起越来越多的融入到我们的工作与生活中可问题来了机器人究竟是什么呢？又该如何给孩子讲机器人呢？这本《DK遇见未来：机器人》完美解决您的烦恼最新数据、系统知识、精美插图可以说这是一本儿童机器人大百科让孩子在这里遇见未来在讲读版视频中与您共同思考未来社会中机器人与
Netty中CompositeByteBuf 的addComponents方法解析 Jooou java nio 网络协议
详细解析addComponents方法CompositeByteBuf中的addComponents方法是其核心功能之一，用于批量添加多个ByteBuf实例作为其内部组件，而无需实际的数据拷贝。这个方法提供了便捷的方式来构建一个包含多个独立数据块的逻辑连续缓冲区。1.addComponents方法的作用与签名addComponents方法的主要作用是接收一个或多个ByteBuf对象，并将它们作为C
Filter快速入门 Java web 撰卢 java 前端 hive spring boot
文章目录Filter快速入门登录演示Filter快速入门定义Filter:定义一个类，是实现Filter接口，并重写所有方法配置Filter:Filter类上加上==@WebFilter==注解，配置拦截资源的路径。引导类加上==@ServletComponentScan==开启Servlet组件支持(也就是在springboot的启动类上面加上这个注释)相关代码importjavax.servl
react/vue vite ts项目中，自动引入路由文件、 import.meta.glob动态引入路由无需手动引入初遇你时动了情 react.js vue.js javascript
utils/autoRouteHelper.ts//src/utils/autoRouteHelper.tsimport{lazy}from"react";importwithLoadingfrom"@/components/router/withLoading";/**自动生成某个文件夹下的子路由*/interfaceRouteItem{path:string;element?:any;chil
[特殊字符] Spring Boot 常用注解全解析：20 个高频注解 + 使用场景实例库库林_沙琪马 springboot spring boot 后端 java
一文掌握SpringBoot中最常用的20个注解，涵盖开发、配置、Web、数据库、测试等场景，配合示例讲解，一站式掌握！一、核心配置类注解1.@SpringBootApplication作用：标记为SpringBoot应用的入口类，包含了@Configuration、@EnableAutoConfiguration和@ComponentScan。使用场景：主启动类上唯一标注一次。@SpringBo
vue-cli 模式下安装 uni-ui
目录easycom自定义easycom配置的示例npm安装uni-ui准备sass安装uni-ui注意easycom传统vue组件，需要安装、引用、注册，三个步骤后才能使用组件。easycom将其精简为一步。只要组件路径符合规范（具体见下），就可以不用引用、注册，直接在页面中使用。如下：//这里不用import引入，也不需要在components内注册uni-list组件。template里就可以
深入解析React Server Components：服务端组件技术革新
深入解析ReactServerComponents：服务端组件技术革新前言React团队提出的ServerComponents（服务端组件）是一项突破性的技术演进，它重新定义了React应用的架构模式。本文将全面剖析这一技术，帮助开发者理解其核心价值和应用场景。什么是ServerComponents？ServerComponents是React的一种新型组件，它们只在服务端执行，具有以下关键特性：
Day02: BeanDefinition的注册艺术：揭秘@ComponentScan如何转化为Spring灵魂 zhysunny Spring spring java 后端
目录一、从@ComponentScan说起：Spring的组件扫描入口二、BeanDefinition：Spring容器的DNA三、ClassPathBeanDefinitionScanner：Spring的"扫雷专家"1.扫描器的初始化2.扫描器的核心配置3.扫描过程揭秘4.候选组件的查找：findCandidateComponents()四、元数据处理：注解如何转化为Bean属性五、实战：自定
React-Python项目安装与使用指南
React-Python项目安装与使用指南一、项目目录结构及介绍通常情况下，在克隆了https://github.com/facebookarchive/react-python.git仓库之后，你会看到以下的目录结构：├──README.md#项目的说明文档├──src#源码目录│├──components#React组件存放位置│├──App.py#应用主入口文件│└──index.js#引入
React响应式组件范式：从类组件到Hooks 止观止 #React 核心原理深度剖析 react.js javascript ecmascript
引言在UI开发中，"状态变化自动触发UI更新"的响应式机制是构建动态界面的核心。React通过独特的单向数据流和虚拟DOM（VirtualDOM）实现这一目标，但类组件（ClassComponents）与Hooks分别代表了两种截然不同的实现范式：类组件时代：以生命周期方法作为响应式调度器，需手动管理状态与副作用（SideEffects）的同步Hooks时代：以状态为驱动核心，通过声明式副作用（D
uniapp自定义全局弹窗组件 LuWiHa uni-app javascript 前端
可以参考一下方法，如果大家有更好的全局弹窗方法欢迎留言//使用方法//在main.js里全局注册importglobalModalfrom'./components/global-popup.vue'Vue.component('global-popup',globalModal)//在需要的页面引用组件this.$refs.globalModal.openPopup({title:'标题',co
极简Vue 3应用：从入门到掌握核心概念程序猿全栈の董（董翔） vue.js 前端 javascript
Vue.js作为一款渐进式JavaScript框架，以其直观的API和灵活的架构受到广泛欢迎。对于初学者而言，Vue官方CLI生成的项目结构可能略显复杂，包含了各种资源文件、样式和示例组件。本文将介绍如何创建一个最简洁的Vue3应用，帮助你专注于核心概念的学习。为什么需要最简Vue应用？VueCLI默认生成的项目包含：assets目录：存放图片、字体等资源components目录：包含多个示例组件
React移动端项目准备（ts版） sync98 前端框架 react typescript
一、创建项目使用脚手架命令创建新项目：1.通过命令行创建项目npxcreate-react-appts-geek-park-h5--templatetypescript2.src文件夹下，保留react-app-env.d.ts文件，删除其他文件，并且创建必要的文件项目结构：src>api封装接口>assets项目资源>components通用组件>hooks自定义钩子函数>pages页面组件>s
ABAP - Excel OO - zcl_excel
classZCL_EXCELdefinitionpubliccreatepublic.publicsection.*"*publiccomponentsofclassZCL_EXCEL*"*donotincludeothersourcefileshere!!!interfacesZIF_EXCEL_BOOK_PROPERTIES.interfacesZIF_EXCEL_BOOK_PROTECTIO
打造自己的组件库（一）宏函数解析行云＆流水 Vue3组件库 vue3组件库 vue.js javascript 前端
1.初始化项目npmcreatevite生成项目后，文件目录如下：├──.idea/#IntelliJIDEA配置目录├──.vscode/#VSCode配置目录├──public/#静态资源目录│└──vite.svg#Vite默认图标├──src/#源代码目录│├──assets/#项目资源文件││└──vue.svg#Vue图标│├──components/#Vue组件目录││└──Hell
java 同步redis到mysql_Yii2 redis同步数据到mysql 兰艳知己 java 同步redis到mysql
将redis数据写入mysql中：本次案例讲解将如何将商城中商品浏览次数通过缓存记录并写入mysql中具体的redis安装过程暂且就省略了.....一、安装redis插件|配置rediscomposerrequireyiisoft/yii2-redis找到common的config文件，在components下加入redis配置参数'redis'=>['class'=>'yii\redis\Con
更新！「3D Web轻量化引擎」HOOPS Communicator发布2025.2.0版本：全新WebViewer用户界面、工业3D_大熊 3D CAD开发工具 3d 3D建模 3D模型轻量化工业3D 3D数据格式转换 3D模型可视化 3D Web轻量化
3DWeb轻量化引擎HOOPSCommunicator此前发布2025.2.0版本！此次更新聚焦于提升用户体验和稳定性，通过引入创新的界面设计以及对若干问题的修复，确保用户能够更加高效、流畅地处理3D数据可视化任务。以下将详细阐述本次更新的核心内容。一、增强功能本次更新的重点在于对WebViewer用户界面的革新。我们精心打造了全新的WebViewerUI，其核心基于WebComponents技术
Svelte滚屏插件：rollup-plugin-svelte完全指南俞兰莎Rosalind
Svelte滚屏插件：rollup-plugin-svelte完全指南rollup-plugin-svelteCompileSveltecomponentswithRollup项目地址:https://gitcode.com/gh_mirrors/ro/rollup-plugin-svelte项目介绍rollup-plugin-svelte是一款专门用于将Svelte组件编译为JavaScript
React-forwardRef-useImperativeHandle 前端小趴菜05 react.js vue.js 前端
forwardRef暴露dom节点作用：使用ref暴露DOM节点给父组件案例例如在父组件中想要获取子组件input的输入值，和让input获取焦点父组件import{Button}from'antd-mobile'importSonfrom"./components/son";import{useState,useRef}from"react";constYear=()=>{constinputR
机器学习知识点复习上（保研、复试、面试）百面机器学习笔记
机器学习知识点复习上一、特征工程1.为什么需要对数值类型的特征做归一化？2.文本表示模型3.图像数据不足的处理方法二、模型评估1.常见的评估指标2.ROC曲线3.为什么在一些场景中要使用余弦相似度而不是欧氏距离？4.过拟合和欠拟合三、经典算法1.支持向量机SVM2.逻辑回归3.决策树四、降维1.主成分分析（PrinalComponentsAnalysis,PCA）降维中最经典的方法2.线性判别分析
【量化系统实战】深入解析：大规模数据管理与分布式计算，打造你的量化“超级工厂” Natsume1710 python github 开发语言算法大数据数据仓库
前言随着量化策略的不断演进，以及对高频数据、另类数据（新闻、社交媒体、卫星图像等）需求的日益增长，许多朋友可能都会遇到一个棘手的问题：当数据量达到TB甚至PB级别，复杂的因子计算和超大规模回测在单机上变得举步维艰，系统效率严重受限。本文将作为量化系统构建系列的进阶篇，聚焦于大规模数据管理（BigDataManagement）和分布式计算（DistributedComputing）。我们将详细阐述如
QueryBook常见问题解答：从查询失败到数据文档管理的完整指南汤力赛Frederica
QueryBook常见问题解答：从查询失败到数据文档管理的完整指南querybookQuerybookisaBigDataQueryingUI,combiningcollocatedtablemetadataandasimplenotebookinterface.项目地址:https://gitcode.com/gh_mirrors/qu/querybook查询执行问题排查当您在QueryBook
QueryBook项目中的查询引擎支持与集成指南倪俊炼
QueryBook项目中的查询引擎支持与集成指南querybookQuerybookisaBigDataQueryingUI,combiningcollocatedtablemetadataandasimplenotebookinterface.项目地址:https://gitcode.com/gh_mirrors/qu/querybook概述QueryBook作为一个数据查询与分析平台，其核心功
乾坤微前端框架详细使用大全不知名靓仔前端框架
引言乾坤微前端框架（Qiankun）是一款轻量级的微前端解决方案，它基于JavaScript的Proxy特性和WebComponents技术，提供了一套简单易用的微前端实现方案。本文将详细介绍乾坤微前端框架的安装、配置、使用方法及常见问题解答，帮助开发者快速上手乾坤微前端框架。1.乾坤简介1.1什么是乾坤？乾坤是一个轻量级的微前端框架，旨在帮助开发者轻松实现微前端架构。它通过主应用（MainApp
前端上传解析Excel；前端解析excel i_am_a_div_日积月累_ yarn安装和插件前端 excel 前端上传Excel文件前端解析Excel xlsx
注意：这里是前端使用xlsx插件，将前端上传的.xls、.xlsx文件，解析得到原始列表数据我的是vue3项目文章目录1.安装依赖2.组件封装3.子组件使用1.安装依赖[email protected].组件封装src/components/MyExcelData/index.vue{{props.msg}}import{defineProps}from'vue'import{UploadFi
styled-components：现代React样式解决方案司南锤前端 react.js 前端前端框架
文章目录引言什么是styled-components？核心特性安装与配置基础安装TypeScript支持Babel插件（可选）基础用法创建样式组件基于props的动态样式高级用法样式继承复合样式与条件渲染样式化现有组件主题系统创建主题访问主题响应式设计媒体查询助手动画与过渡关键帧动画过渡效果最佳实践1.组件命名2.样式组织3.避免过度嵌套4.使用TypeScript性能优化1.避免在渲染中创建样式
开发者关心的那些事圣子足道 ios 游戏编程 apple 支付
我要在app里添加IAP，必须要注册自己的产品标识符（product identifiers）。产品标识符是什么？产品标识符（Product Identifiers）是一串字符串，它用来识别你在应用内贩卖的每件商品。App Store用产品标识符来检索产品信息，标识符只能包含大小写字母（A-Z）、数字（0-9）、下划线（-）、以及圆点(.)。你可以任意排列这些元素，但我们建议你创建标识符时使用
负载均衡器技术Nginx和F5的优缺点对比 bijian1013 nginx F5
对于数据流量过大的网络中，往往单一设备无法承担，需要多台设备进行数据分流，而负载均衡器就是用来将数据分流到多台设备的一个转发器。目前有许多不同的负载均衡技术用以满足不同的应用需求，如软/硬件负载均衡、本地/全局负载均衡、更高
LeetCode[Math] - #9 Palindrome Number Cwind java Algorithm 题解 LeetCode Math
原题链接：#9 Palindrome Number 要求：判断一个整数是否是回文数，不要使用额外的存储空间难度：简单分析：题目限制不允许使用额外的存储空间应指不允许使用O(n)的内存空间，O(1)的内存用于存储中间结果是可以接受的。于是考虑将该整型数反转，然后与原数字进行比较。注：没有看到有关负数是否可以是回文数的明确结论，例如
画图板的基本实现 15700786134 画图板
要实现画图板的基本功能，除了在qq登陆界面中用到的组件和方法外，还需要添加鼠标监听器，和接口实现。首先，需要显示一个JFrame界面： public class DrameFrame extends JFrame { //显示
linux的ps命令被触发 linux
Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照，就是执行ps命令的那个时刻的那些进程，如果想要动态的显示进程信息，就可以使用top命令。要对进程进行监测和控制，首先必须要了解当前进程的情况，也就是需要查看当前进程，而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行
Android 音乐播放器下一曲连续跳几首歌肆无忌惮_ android
最近在写安卓音乐播放器的时候遇到个问题。在MediaPlayer播放结束时会回调 player.setOnCompletionListener(new OnCompletionListener() { @Override public void onCompletion(MediaPlayer mp) { mp.reset(); Log.i("H
java导出txt文件的例子知了ing java servlet
代码很简单就一个servlet,如下： package com.eastcom.servlet; import java.io.BufferedOutputStream; import java.io.IOException; import java.net.URLEncoder; import java.sql.Connection; import java.sql.Resu
Scala stack试玩, 提高第三方依赖下载速度矮蛋蛋 scala sbt
原文地址： http://segmentfault.com/a/1190000002894524 sbt下载速度实在是惨不忍睹, 需要做些配置优化下载typesafe离线包, 保存为ivy本地库 wget http://downloads.typesafe.com/typesafe-activator/1.3.4/typesafe-activator-1.3.4.zip 解压r
phantomjs安装(linux，附带环境变量设置) ，以及casperjs安装。 alleni123 linux spider
1. 首先从官网 http://phantomjs.org/下载phantomjs压缩包，解压缩到/root/phantomjs文件夹。 2. 安装依赖 sudo yum install fontconfig freetype libfreetype.so.6 libfontconfig.so.1 libstdc++.so.6 3. 配置环境变量 vi /etc/profil
JAVA IO FileInputStream和FileOutputStream，字节流的打包输出百合不是茶 java核心思想 JAVA IO操作字节流
在程序设计语言中，数据的保存是基本，如果某程序语言不能保存数据那么该语言是不可能存在的，JAVA是当今最流行的面向对象设计语言之一，在保存数据中也有自己独特的一面，字节流和字符流 1，字节流是由字节构成的，字符流是由字符构成的字节流和字符流都是继承的InputStream和OutPutStream ,java中两种最基本的就是字节流和字符流类 FileInputStream
Spring基础实例（依赖注入和控制反转） bijian1013 spring
前提条件：在http://www.springsource.org/download网站上下载Spring框架，并将spring.jar、log4j-1.2.15.jar、commons-logging.jar加载至工程1.武器接口 package com.bijian.spring.base3; public interface Weapon { void kil
HR看重的十大技能 bijian1013 提升能力 HR 成长
一个人掌握何种技能取决于他的兴趣、能力和聪明程度，也取决于他所能支配的资源以及制定的事业目标，拥有过硬技能的人有更多的工作机会。但是，由于经济发展前景不确定，掌握对你的事业有所帮助的技能显得尤为重要。以下是最受雇主欢迎的十种技能。　　一、解决问题的能力　　每天，我们都要在生活和工作中解决一些综合性的问题。那些能够发现问题、解决问题并迅速作出有效决
【Thrift一】Thrift编译安装 bit1129 thrift
什么是Thrift The Apache Thrift software framework, for scalable cross-language services development, combines a software stack with a code generation engine to build services that work efficiently and s
【Avro三】Hadoop MapReduce读写Avro文件 bit1129 mapreduce
Avro是Doug Cutting(此人绝对是神一般的存在）牵头开发的。开发之初就是围绕着完善Hadoop生态系统的数据处理而开展的（使用Avro作为Hadoop MapReduce需要处理数据序列化和反序列化的场景）,因此Hadoop MapReduce集成Avro也就是自然而然的事情。这个例子是一个简单的Hadoop MapReduce读取Avro格式的源文件进行计数统计，然后将计算结果
nginx定制500，502，503，504页面 ronin47 nginx　错误显示
server { listen 80; error_page 500/500.html; error_page 502/502.html; error_page 503/503.html; error_page 504/504.html; location /test {return502;}} 配置很简单，和配
java-1.二叉查找树转为双向链表 bylijinnan 二叉查找树
import java.util.ArrayList; import java.util.List; public class BSTreeToLinkedList { /* 把二元查找树转变成排序的双向链表题目：输入一棵二元查找树，将该二元查找树转换成一个排序的双向链表。要求不能创建任何新的结点，只调整指针的指向。 10 / \ 6 14 / \
Netty源码学习-HTTP-tunnel bylijinnan java netty
Netty关于HTTP tunnel的说明： http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/socket/http/package-summary.html#package_description 这个说明有点太简略了一个完整的例子在这里： https://github.com/bylijinnan
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别 coder_xpf jquery json map val()
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别数据库查询出来的map有一个字段为空通过System.out.println()输出 JSONUtil.serialize(map)： {"one":"1","two":"nul
Hibernate缓存总结 cuishikuan 开源 ssh javaweb hibernate缓存三大框架
一、为什么要用Hibernate缓存？ Hibernate是一个持久层框架，经常访问物理数据库。为了降低应用程序对物理数据源访问的频次，从而提高应用程序的运行性能。缓存内的数据是对物理数据源中的数据的复制，应用程序在运行时从缓存读写数据，在特定的时刻或事件会同步缓存和物理数据源的数据。二、Hibernate缓存原理是怎样的？ Hibernate缓存包括两大类：Hib
CentOs6 dalan_123 centos
首先su - 切换到root下面1、首先要先安装GCC GCC-C++ Openssl等以来模块：yum -y install make gcc gcc-c++ kernel-devel m4 ncurses-devel openssl-devel2、再安装ncurses模块yum -y install ncurses-develyum install ncurses-devel3、下载Erang
10款用 jquery 实现滚动条至页面底端自动加载数据效果 dcj3sjt126com JavaScript
无限滚动自动翻页可以说是web2.0时代的一项堪称伟大的技术，它让我们在浏览页面的时候只需要把滚动条拉到网页底部就能自动显示下一页的结果，改变了一直以来只能通过点击下一页来翻页这种常规做法。无限滚动自动翻页技术的鼻祖是微博的先驱：推特(twitter)，后来必应图片搜索、谷歌图片搜索、google reader、箱包批发网等纷纷抄袭了这一项技术，于是靠滚动浏览器滚动条
ImageButton去边框&Button或者ImageButton的背景透明 dcj3sjt126com imagebutton
在ImageButton中载入图片后，很多人会觉得有图片周围的白边会影响到美观，其实解决这个问题有两种方法一种方法是将ImageButton的背景改为所需要的图片。如：android:background="@drawable/XXX" 第二种方法就是将ImageButton背景改为透明，这个方法更常用在XML里； <ImageBut
JSP之c:foreach eksliang jsp forearch
原文出自：http://www.cnblogs.com/draem0507/archive/2012/09/24/2699745.html <c:forEach>标签用于通用数据循环，它有以下属性属性描述是否必须缺省值 items 进行循环的项目否无 begin 开始条件否 0 end 结束条件否集合中的最后一个项目 step 步长否 1
Android实现主动连接蓝牙耳机 gqdy365 android
在Android程序中可以实现自动扫描蓝牙、配对蓝牙、建立数据通道。蓝牙分不同类型，这篇文字只讨论如何与蓝牙耳机连接。大致可以分三步：一、扫描蓝牙设备： 1、注册并监听广播： BluetoothAdapter.ACTION_DISCOVERY_STARTED BluetoothDevice.ACTION_FOUND BluetoothAdapter.ACTION_DIS
android学习轨迹之四：org.json.JSONException: No value for hyz301 json
org.json.JSONException: No value for items 在JSON解析中会遇到一种错误，很常见的错误 06-21 12:19:08.714 2098-2127/com.jikexueyuan.secret I/System.out﹕ Result:{"status":1,"page":1,&
干货分享：从零开始学编程系列汇总 justjavac 编程
程序员总爱重新发明轮子，于是做了要给轮子汇总。从零开始写个编译器吧系列 (知乎专栏) 从零开始写一个简单的操作系统 (伯乐在线) 从零开始写JavaScript框架 (图灵社区) 从零开始写jQuery框架 (蓝色理想 ) 从零开始nodejs系列文章 (粉丝日志) 从零开始编写网络游戏
jquery-autocomplete 使用手册 macroli jquery Ajax 脚本
jquery-autocomplete学习一、用前必备官方网站：http://bassistance.de/jquery-plugins/jquery-plugin-autocomplete/ 当前版本：1.1 需要JQuery版本：1.2.6 二、使用 <script src="./jquery-1.3.2.js" type="text/ja
PLSQL-Developer或者Navicat等工具连接远程oracle数据库的详细配置以及数据库编码的修改超声波 oracle plsql
　　在服务器上将Oracle安装好之后接下来要做的就是通过本地机器来远程连接服务器端的oracle数据库，常用的客户端连接工具就是PLSQL-Developer或者Navicat这些工具了。刚开始也是各种报错，什么TNS:no listener;TNS:lost connection;TNS:target hosts...花了一天的时间终于让PLSQL-Developer和Navicat等这些客户
数据仓库数据模型之：极限存储--历史拉链表 superlxw1234 极限存储数据仓库数据模型拉链历史表
在数据仓库的数据模型设计过程中，经常会遇到这样的需求： 1. 数据量比较大; 2. 表中的部分字段会被update,如用户的地址，产品的描述信息，订单的状态等等; 3. 需要查看某一个时间点或者时间段的历史快照信息，比如，查看某一个订单在历史某一个时间点的状态，比如，查看某一个用户在过去某一段时间内，更新过几次等等; 4. 变化的比例和频率不是很大，比如，总共有10
10点睛Spring MVC4.1-全局异常处理 wiselyman spring mvc
10.1 全局异常处理使用@ControllerAdvice注解来实现全局异常处理; 使用@ControllerAdvice的属性缩小处理范围 10.2 演示演示控制器 package com.wisely.web; import org.springframework.stereotype.Controller; import org.spring

【Spark】Spark On Yarn 环境搭建及 WordCount 程序原理深度剖析

1、Spark On Yarn 环境搭建

2、Spark任务提交到Yarn执行

3、WordCount程序代码

4、WordCount 程序原理深度剖析

你可能感兴趣的:(BigData,Components,BigData)