EVAO_大个子

Spark学习笔记之Spark中的RDD的具体使用

1. Spark中的RDD

Resilient Distributed Datasets(弹性分布式数据集)
Spark中的最基本的抽象
有了RDD的存在我们就可以像操作本地集合一样操作分布式的数据
包含所有元素的分区的集合
RDD包含了很多的分区
2. RDD中的弹性
RDD中的数据是可大可小的
RDD的数据默认情况下存放在内存中的，但是在内存资源不足时，Spark会自动将RDD数据写入磁盘
RDD有自动容错功能,当其中一个RDD中的分区的数据丢失,或者当前节点故障时,rdd会根据依赖关系重新计算该分区的数据

3. RDD在Spark中的作用

迭代式计算

其主要实现思想就是RDD，把所有计算的数据保存在分布式的内存中。迭代计算通常情况下都是对同一个数据集做反复的迭代计算，数据在内存中将大大提升IO操作。这也是Spark涉及的核心：内存计算

交互式计算

因为Spark是用scala语言实现的，Spark和scala能够紧密的集成，所以Spark可以完美的运用scala的解释器，使得其中的scala可以向操作本地集合对象一样轻松操作分布式数据集

4. Spark中的名词解释

ClusterManager :在Standalone模式中即为Master（主节点），控制整个集群，监控Worker。在YARN模式中为资源管理器
Worker:从节点，负责控制计算节点，启动Executor。在YARN模式中为NodeManager，负责计算节点的控制。
Driver 运行Application的main()函数并创建SparkContext
Executor (CoarseGrainedExecutorBackend)在worker node上执行任务的组件、用于启动线程池运行任务。每个Application拥有独立的一组Executors
SparkContext :整个应用的上下文，控制应用的生命周期
RDD :Spark中的最基本的数据抽象
DAG Scheduler : 根据DAG(有向无环图)切分stage,并且生成task,以taskset的形式返回
Task Schedual: 调度task,把task交给executor
Stage: 一个Spark作业一般包含一到多个Stage。
Task :一个Stage包含一到多个Task，通过多个Task实现并行运行的功能
Transformations :转换操作,Transformation是lazy的,不会马上执行,只有当调用action时才会执行
Actions : 动作
SparkEnv : 线程级别的上下文，存储运行时的重要组件的引用

5. 创建RDD的两种方式

通过并行化集合创建RDD(用于测试)

val list = List("java c++ java","java java java c++")
val rdd = sc.parallelize(list)

通过加载hdfs中的数据创建RDD(生产环境)

val rdd = sc.textFile("hdfs://uplooking01:8020/sparktest/")

6. IDEA开发Spark

6.1 pom依赖



  4.0.0

  com.uplooking.bigdata
  2018-11-08-spark
  1.0-SNAPSHOT

  
    1.8
    1.8
    2.11.8
    2.2.0
    2.7.5
  

  
    
    
      org.scala-lang
      scala-library
      ${scala.version}
    

    
    
      org.apache.spark
      spark-core_2.11
      ${spark.version}
    

    
      org.apache.spark
      spark-sql_2.11
      ${spark.version}
    
    
    
      org.apache.hadoop
      hadoop-client
      ${hadoop.version}
    

  

  
    
      
      
        net.alchim31.maven
        scala-maven-plugin
        3.2.2
        
          
            scala-compile-first
            process-resources
            
              add-source
              compile
            
          
          
            scala-test-compile
            process-test-resources
            
              testCompile
            
          
        
      
      
      
        org.apache.maven.plugins
        maven-compiler-plugin
        
          
            compile
            
              compile
            
          
        
      
      
      
        org.apache.maven.plugins
        maven-shade-plugin
        2.4.3
        
          false
        
        
          
            package
            
              shade
            
            
              
                
                  *:*
                  
                    META-INF/*.SF
                    META-INF/*.DSA
                    META-INF/*.RSA

6.2 编写spark程序

val conf = new SparkConf()
conf.setAppName("Ops1")
val sc = new SparkContext(conf)
val rdd1: RDD[String] = sc.parallelize(List("java c+ java", "java java c++"))
val ret = rdd1.collect().toBuffer
println(ret)

6.3 打包

6.4 在Driver上运行jar包

spark-submit --master spark://uplooking01:7077 --class com.uplooking.bigdata.spark01.Ops1 original-spark-1.0-SNAPSHOT.jar

7. 本地运行Spark程序

import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}

import scala.collection.mutable

object Ops1 {
 def main(args: Array[String]): Unit = {
  val conf = new SparkConf()
  conf.setAppName("Ops1")
  conf.setMaster("local[4]")
  val sc = new SparkContext(conf)
  //一般不会指定最小分区数
  val rdd1 = sc.textFile("hdfs://uplooking01:8020/sparktest/")
  val rdd2: RDD[String] = rdd1.flatMap(line => line.split(" "))
  val rdd3: RDD[(String, Int)] = rdd2.map(word => (word, 1))
  val rdd4: RDD[(String, Int)] = rdd3.reduceByKey(_ + _)
  val ret: mutable.Buffer[(String, Int)] = rdd4.collect().toBuffer
  println(ret)
  println(rdd1.partitions.length)
 }
}

8. RDD中的分区数

并行化的方式指定分区数(一般会指定分区数)

默认如果创建RDD时不指定分区数,那么就会创建cpu核数个分区
手动指定分区数

val rdd = sc.parallelize(List("java c+ java", "java java c++"), 2)

textFile的方式指定分区数

默认如果创建RDD时不指定最小分区数,那么就会创建至少2个分区的RDD
一般不会指定最小分区数
不指定最小分区数,有切片的数量个分区

9. Spark作业的运行流程

构建DAG
根据DAG切分Stage,每个Stage对应一组相同计算逻辑不能计算数据的Task,以TastSet的形式返回
TaskSchedual调度task,把task发送到executor中去,用Runnable进行包装进给线程池
Executor执行task

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持脚本之家。

你可能感兴趣的:(Spark学习笔记之Spark中的RDD的具体使用)

关于将平板作为副屏的使用 sbuds 平板
我的需求我现在拥有一个联想小新平板(联想小新pad2022),还有一个联想小新电脑(联想小新pro13),原本买联想平板就图个便宜这是真的,但是还有一层就是联想的生态,但是这他喵的,联想的超级互联的生态实在是拉跨,我几乎看了所有的解决方案,还是解决不了连不上的问题.为什么要生态理由应该也很简单,无非就是传输文件比较方便等等,但是作为一个程序员来说,更重要的是我看中的副屏功能,但是联想的生态让我很失
【Python机器学习】2.2. 聚类分析算法理论：K均值聚类(KMeans Analysis)、KNN(K近邻分类)、均值漂移聚类(MeanShift) SomeB1oody Python机器学习机器学习算法 python 聚类分类算法
喜欢的话别忘了点赞、收藏加关注哦（关注即可查看全文），对接下来的教程有兴趣的可以关注专栏。谢谢喵！(=･ω･=)2.2.1.K均值聚类(KMeansAnalysis)K均值算法是以空间中K个点为中心进行聚类，对最靠近他们的对象归类，是聚类算法中最为基础但也最为重要的算法。数学原理计算数据点与各簇中心点的距离：dist(xi,ujt){dist}(x_i,u_j^t)dist(xi,ujt)然后根据
每天10道Java基础面试题，涵盖核心知识点，附简洁代码示例，掌握快速记忆的方法小小鸭程序员 spring boot java 后端开发语言 spring cloud
1.JDK、JRE、JVM区别JDK：开发工具包（含JRE+编译器）JRE：运行环境（含JVM+类库）JVM：执行字节码的虚拟机2.==与equals()区别Stringa="abc",b=newString("abc");System.out.println(a==b);//false（地址不同）System.out.println(a.equals(b));//true（内容相同）3.Stri
你的AI客服为何总抓不住客户核心诉求？（附特征优化方案）人工智能
1特征工程的意义nlp任务中，原始文本经数值映射后形成的词向量序列，难充分表达语言深层语义特征。就需引入文本特征增强技术：语义信息补全：突破单词语义局限，捕获词序关联特征模型适配优化：构建符合算法输入规范的矩阵结构评估指标提升：通过特征增强直接影响模型准确率、召回率等核心KPI如电商评论情感分析场景，单纯用词频特征可能导致"这个手机质量差得惊人"和"这个手机质量惊人地差"被判定为相同语义，此时bi
canvas绘制和数字签名前端
关键是要把存放绘制的信息放到一个二维数组中：绘制时最好不要用定时器进行定时绘制，因为会卡顿，最好使用requestAnimationFrame这个原生js的api方法，因为是以帧的间隔绘制，所以会看起来流畅Documenthtml,body{height:100%;margin:0;padding:0;}.container{width:100%;padding:20px0;display:fle
C语言：数据的存储 c++编程语言
本文重点：数据类型详细介绍整形在内存中的存储：原码、反码、补码大小端字节序介绍及判断浮点型在内存中的存储解析数据类型结构的介绍：类型的基本归类：整型家族浮点家族构造类型：指针类型：空类型：整形在内存中的存储：F10开始逐句调试，再打开窗口中的内存，在搜索栏查看a的地址如下图所示。可以看到在将20存入a的地址中，在内存窗口的表示形式是14000000，再看下图变量b中-10的表示形式。可以看到再内存
LLaMA-Factory 训练数据默认使用 instruction、input、output 三个 key 背太阳的牧羊人模型微调 llama 人工智能大模型微调
在LLaMA-Factory进行SFT（Directivesupervisionfine-tuning指令监督微调）时，训练数据的格式非常重要，因为大模型依赖标准化的数据结构来学习指令-响应模式。identity.json文件的数据采用了“instruction”、“input”、“output”这三个key，它们的作用如下：Key作用示例“instruction”代表用户给AI的指令（问题或任务
AI在投标管理中的智能化应用设计方案警世龙开发记录人工智能自然语言处理深度学习人工智能 AI编程
一、系统设计目标E={e1,e2,e3}其中{e1:标书准备效率提升40%e2:中标率提升25%e3:人工审核工作量降低60%E=\{e_1,e_2,e_3\}\quad\text{其中}\quad\begin{cases}e_1:\text{标书准备效率提升40\%}\\e_2:\text{中标率提升25\%}\\e_3:\text{人工审核工作量降低60\%}\end{cases}E={e1,
Deepseek 使用攻略隔窗听雨眠人工智能
人工智能飞速发展的时代，新的技术和工具不断涌现，Deepseek便是其中备受瞩目的存在。它以强大的功能和出色的表现，吸引了众多用户的关注。今天，就让我们一起来深入了解一下Deepseek究竟是什么，以及如何使用它。一、什么是DeepseekDeepseek（深度求索）是一家位于杭州的人工智能公司，同时也是一系列大语言模型的统称。它由中国对冲基金高毅资产创立并提供支持，其模型均以开源形式发布。Dee
【Node.js】模块分类与 `require` 用法详解 Peter-Lu #NodeJS node.js javascript 前端
文章目录一、Node.js模块概述1.模块的定义2.模块的作用二、Node.js模块的分类1.核心模块2.文件模块3.第三方模块4.全局模块三、`require`的用法详解1.`require`的基本用法2.模块导出机制3.模块的缓存机制4.`require`的动态引入四、模块的实际应用场景1.项目结构优化2.复用代码五、总结Node.js是一个强大的JavaScript运行环境，广泛应用于服务器
推荐文章：探索Devbox —— 打造统一且高效的开发环境薛烈珑Una
推荐文章：探索Devbox——打造统一且高效的开发环境项目地址:https://gitcode.com/gh_mirrors/de/devbox项目介绍在快节奏的软件开发世界中，保持团队成员间开发环境的一致性至关重要。Devbox正是为解决这一痛点而生，它是一个强大的命令行工具，允许开发者快速建立隔离的开发环境。通过简洁的配置文件，团队可以轻松定义所需的所有依赖包，确保无论在哪都能拥有一个一致且纯
Umi-OCR 使用与安装教程平依佩Ula
Umi-OCR使用与安装教程项目地址:https://gitcode.com/gh_mirrors/um/Umi-OCR1.项目目录结构及介绍Umi-OCR的项目结构精心组织，以支持其多方面功能。以下是主要组成部分的概览：Umi-OCR├──Umi-OCR.exe#主执行文件，Windows平台上直接运行的程序├──umi-ocr.sh#Linux上的启动脚本└──UmiOCR-data├──ma
Express.js 是一个轻量级、灵活且功能强大的 Node.js Web 应用框架 getapi 前端 express javascript
Express.js是一个轻量级、灵活且功能强大的Node.jsWeb应用框架，广泛用于构建Web应用程序和API。它以其简洁的语法和模块化设计而闻名，非常适合快速开发后端服务。以下是关于Express.js的详细介绍以及如何高效使用它的指南。1.Express.js的核心特点Express.js提供了一系列强大的功能，使其成为全栈开发中的首选后端框架之一：(1)路由管理支持定义URL路径与处理函
Web三要素：CSS之Flex/Grid布局(4) 双囍菜菜前端随记前端 css
CSS布局革命：Flex与Grid的双子星战法文章目录CSS布局革命：Flex与Grid的双子星战法一、布局进化史：从洪荒时代到现代文明二、Flex布局：一维空间的舞蹈家2.1核心概念深度解析容器属性详解：2.2典型应用场景实战导航栏布局（React示例）垂直居中（Vue示例）三、Grid布局：二维空间的指挥官3.1网格系统深度解析核心概念图解：3.2高级布局技巧实战响应式网格（React示例）复
CMake Error at myplugins_generated_yololayer.cu.o.Debug，tensorrtx编译失败解决雪可问春风 BUG 人工智能
system:ubuntu1804gpu:3060cuda:cuda11.4tensorrt:8.4使用项目tensorrtx进行yolov5的engine生成，之前在编译成功的配置为system:ubuntu1804gpu:2060cuda:cuda10.2tensorrt:7.2.3.4换到3060后，make失败，报错错误：/home/yfzx/work/vs-work/tensorrt-y
如何选择显卡（202408） =PNZ=BeijingL 操作系统经验分享 1024程序员节
（图片来自网络）显卡，也被称为视频卡、图形适配器或GPU（图形处理单元），是电脑中负责渲染图形输出到显示器的关键硬件组件一显卡的基本作用1.图形渲染显卡的主要任务是处理和渲染图形。无论是浏览网页、观看视频还是使用图形设计软件，所有这些操作都需要显卡来计算图形信息，并将其转化为可在屏幕上显示的图像。显卡包含专门设计用于图形处理的芯片，可以快速执行这些操作，从而提供流畅和高质量的视觉体验。2.加速图形
Node.js 模块化概念详细介绍还是鼠鼠 node.js node.js web javascript vscode 前端
目录模块化的概念模块化的好处：实现模块化代码实现1.创建计算器模块2.使用计算器模块3.运行结果总结常见的Node.js核心模块模块化的应用场景Node.js采用了模块化的设计，使得开发者能够将代码拆分成多个独立的模块，便于维护和复用。在Node.js中，每个文件都可以视为一个模块，并且可以通过require()函数引入其他模块的功能。模块化提高了代码的可维护性，减少了冗余代码，并提高了开发效率。
UI自动化测试之CSS Selector 定位秘籍：解锁 WEB UI 自动化测试的高效之道做测试的小薄测试进阶 css selenium UI自动化测试元素定位方式
在WebUI自动化测试中，元素定位是实现自动化操作的核心步骤。SeleniumWebDriver提供了多种元素定位方式，其中CSSSelector是一种功能强大且灵活的定位方法。它基于CSS选择器语法，能够快速、精准地定位目标元素，尤其适用于复杂的DOM结构。本文将深入解析CSSSelector的工作原理、使用技巧以及需要注意的事项，帮助你在自动化测试中更高效地运用这一工具。一、CSSSelect
罗丹明RB/四甲基罗丹明标记酰胺化果胶Amidated Pectin, Rhodamine B/TRITC labeled；Rhodamine B/TRITC-Amidated Pectin 齐岳hao java 数据库 jvm
果胶是一种多糖，其组成有同质多糖和杂多糖两种类型。它们多存在于植物细胞壁和细胞内层，大量存在于柑橘、柠檬、柚子等果皮中。呈白色至黄色粉状，相对分子质量约20000～400000，无味。在酸性溶液中较在碱性溶液中稳定，通常按其酯化度分为高酯果胶及低酯果胶。高酯果胶在可溶性糖含量≥60%、pH=2.6～3.4的范围内形成非可逆性凝胶。低酯果胶一部分甲酯转变为伯酰胺，不受糖、酸的影响，但需与钙、镁等二价
JVM GC四大算法 coding_-_半生 jvm 算法 java
JVMGC四大算法文章目录JVMGC四大算法GC四大算法一、引用计数法二、复制算法（COPY）三、标记清除算法（MARK-SWEEP）四、标记整理算法（MARK-COMPACT）五、总结GC四大算法一、引用计数法描述：给每一个对象分配一个计数器，用于记录对象是否被引用，被引用一次，计数进行+1优点：方便直接判断对象是否能够回收缺点：使用计数器需要消耗一定的内存，且每一次计数的修改同样需要消耗内存致
通信之PDH准同步数字系列玖Yee 信息与通信
PDH-准同步数字系列（PlesiochronousDigitalHierarchy）：是数字通信系统中的一种数字传输系列，采用在数字通信网的每个节点上都分别设置高精度时钟的方式，这些时钟信号有统一标准速率，但各时钟间存在微小差别，并非真正的同步，所以叫“准同步”。速率等级两大体系三个标准：国际上PDH有两大系列三个标准。以欧洲系列为例，各次群容纳的E1数量呈4倍关系，比如可将4个2Mbit/s复
php后端分页_thinkphp5框架前后端分离项目实现分页功能的方法分析淡定男 php后端分页
本文实例讲述了thinkphp5框架前后端分离项目实现分页功能的方法。分享给大家供大家参考，具体如下：方法一利用tp5提供的paginate方法实现自动分页参数page第几页，paginate分页方法会自动获取size每页数量代码/***Notes:消费记录*Date:2019/6/25*Time:15:43*@paramRequest$request*@return\think\response
python flask 分页_Python的Flask框架中实现分页功能的教程 weixin_39959126 python flask 分页
BlogPosts的提交让我们从简单的开始。首页上必须有一张用户提交新的post的表单。首先我们定义一个单域表单对象(fileapp/forms.py)：classPostForm(Form):post=TextField('post',validators=[Required()])下面，我们把这个表单添加到template中(fileapp/templates/index.html)：{%ex
linux jvm gc日志分析,JVM GC 日志详解一只小小的IOS linux jvm gc日志分析
本文采用的JDK版本：javaversion"1.8.0_144"Java(TM)SERuntimeEnvironment(build1.8.0_144-b01)JavaHotSpot(TM)64-BitServerVM(build25.144-b01,mixedmode)一、GC日志参数设置JVMGC格式日志的主要参数包括如下8个：-XX:+PrintGC输出简要GC日志-XX:+PrintGC
node mysql limit,nodejs mysql 实现分页的方法日签君AIUX node mysql limit
这两天学习了nodejsmysql实现分页，很重要，所以，今天添加一点小笔记。代码如下varexpress=require('express');varrouter=express.Router();varsettings=require('../settings.js');varmysql=require('mysql2');router.get('/',function(req,res,nex
Tailwindcss开启黑夜模式巴巴博一 vue.js css
本篇讲述如何使用tailwindcss切换白天黑夜主题tailwindcss自带的暗夜切换会比css自带的theme主体切换来得方便很多，学习成本也很低，只要求会用tailiwndcss1，tailwindcss.config有两种暗夜模式切换，媒体查询和手动类切换。手动控制需要开启类模式//tailwind.config.jsexportdefault{...darkMode:'class',/
Rabbitmq踩坑---删掉.erlang.cookie后重新启动服务报错原子一式 Rabbitmq
集群部署的时候，自己笔记本安装3台centos7服务器【102，103，104】，各种前期准备好后，执行rabbitmqctlcluster_status发现报错，第一个想到的是cookie可能不对，检查发现三台.erlang.cookie都是一样的，仔细一看是103我改过hostname，重启后，从102拷贝过来发现还是报错，我就直接删掉了.erlang.cookie,然后又从102拷贝过来，启
浏览器防截屏,录屏. zhongshizhi91 前端浏览器
浏览器防截屏,录屏使用加密媒体扩展APIhttps://developer.mozilla.org/zh-CN/docs/Web/API/Encrypted_Media_Extensions_APIEncryptedMediaExtensions(EME)EME是一种允许Web应用程序使用内容保护系统（通常称为DRM，数字版权管理）来控制媒体播放的API。它主要用于支持加密媒体内容的播放，比如流媒
OOM系列之一：java.lang.OutOfMemoryError: Java堆空间问题详解马小瑄经验分享开发语言程序人生 java 性能优化
第一篇：java.lang.OutOfMemoryError:JavaheapspaceJava应用程序只允许使用有限的内存量。此限制是在应用程序启动期间指定的。为了让事情变得更复杂，Java内存被分成两个不同的区域。这些区域称为堆空间和Permgen（用于永久代）：这些区域的大小是在Java虚拟机(JVM)启动期间设置的，可以通过指定JVM参数-Xmx和-XX:MaxPermSize进行自定义。
【Linux】日志插件 s_little_monster_ Linux linux 数据库 oracle 运维学习经验分享笔记
个人主页~日志插件一、日志文件的重要性二、日志文件的简单实现1、comm.hpp2、log.hpp三、测试用例一、日志文件的重要性故障排查与问题定位快速发现问题：日志能够实时记录系统运行过程中的各种事件和状态信息，当系统出现故障或异常时，通过查看日志可以快速察觉到问题的发生，例如，服务器突然崩溃，日志中可能会记录下崩溃前的错误信息、异常堆栈，帮助运维人员第一时间得知系统出现了故障精准定位根源：详细
jdk tomcat 环境变量配置 Array_06 java jdk tomcat
Win7 下如何配置java环境变量 1。准备jdk包，win7系统，tomcat安装包（均上网下载即可） 2。进行对jdk的安装，尽量为默认路径（但要记住啊！！以防以后配置用。。。） 3。分别配置高级环境变量。电脑-->右击属性-->高级环境变量-->环境变量。分别配置 : path &nbs
Spring调SDK包报java.lang.NoSuchFieldError错误 bijian1013 java spring
在工作中调另一个系统的SDK包，出现如下java.lang.NoSuchFieldError错误。 org.springframework.web.util.NestedServletException: Handler processing failed; nested exception is java.l
LeetCode[位运算] - #136 数组中的单一数 Cwind java 题解位运算 LeetCode Algorithm
原题链接：#136 Single Number 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现两次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：题目限定了线性的时间复杂度，同时不使用额外的空间，即要求只遍历数组一遍得出结果。由于异或运算 n XOR n = 0, n XOR 0 = n，故将数组中的每个元素进
qq登陆界面开发 15700786134 qq
今天我们来开发一个qq登陆界面，首先写一个界面程序，一个界面首先是一个Frame对象，即是一个窗体。然后在这个窗体上放置其他组件。代码如下： public class First { public void initul(){ jf=ne
Linux的程序包管理器RPM 被触发 linux
在早期我们使用源代码的方式来安装软件时，都需要先把源程序代码编译成可执行的二进制安装程序，然后进行安装。这就意味着每次安装软件都需要经过预处理-->编译-->汇编-->链接-->生成安装文件--> 安装，这个复杂而艰辛的过程。为简化安装步骤，便于广大用户的安装部署程序，程序提供商就在特定的系统上面编译好相关程序的安装文件并进行打包，提供给大家下载，我们只需要根据自己的
socket通信遇到EOFException 肆无忌惮_ EOFException
java.io.EOFException at java.io.ObjectInputStream$PeekInputStream.readFully(ObjectInputStream.java:2281) at java.io.ObjectInputStream$BlockDataInputStream.readShort(ObjectInputStream.java:
基于spring的web项目定时操作知了ing java Web
废话不多说，直接上代码，很简单配置一下项目启动就行 1，web.xml <?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="h
树形结构的数据库表Schema设计矮蛋蛋 schema
原文地址： http://blog.csdn.net/MONKEY_D_MENG/article/details/6647488 程序设计过程中，我们常常用树形结构来表征某些数据的关联关系，如企业上下级部门、栏目结构、商品分类等等，通常而言，这些树状结构需要借助于数据库完成持久化。然而目前的各种基于关系的数据库，都是以二维表的形式记录存储数据信息，
maven将jar包和源码一起打包到本地仓库 alleni123 maven
http://stackoverflow.com/questions/4031987/how-to-upload-sources-to-local-maven-repository <project> ... <build> <plugins> <plugin> <groupI
java IO操作与 File 获取文件或文件夹的大小，可读，等属性！！！百合不是茶
类 File File是指文件和目录路径名的抽象表示形式。 1，何为文件：标准文件（txt doc mp3...）目录文件（文件夹）虚拟内存文件 2，File类中有可以创建文件的 createNewFile（）方法,在创建新文件的时候需要try{} catch(）{}因为可能会抛出异常；也有可以判断文件是否是一个标准文件的方法isFile();这些防抖都
Spring注入有继承关系的类（2） bijian1013 java spring
被注入类的父类有相应的属性，Spring可以直接注入相应的属性，如下所例：1.AClass类 package com.bijian.spring.test4; public class AClass { private String a; private String b; public String getA() { retu
30岁转型期你能否成为成功人士 bijian1013 成长励志
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
【Velocity四】Velocity与Java互操作 bit1129 velocity
Velocity出现的目的用于简化基于MVC的web应用开发，用于替代JSP标签技术，那么Velocity如何访问Java代码.本篇继续以Velocity三http://bit1129.iteye.com/blog/2106142中的例子为基础， POJO package com.tom.servlets; public
【Hive十一】Hive数据倾斜优化 bit1129 hive
什么是Hive数据倾斜问题操作：join,group by,count distinct 现象：任务进度长时间维持在99%（或100%），查看任务监控页面，发现只有少量（1个或几个）reduce子任务未完成；查看未完成的子任务，可以看到本地读写数据量积累非常大，通常超过10GB可以认定为发生数据倾斜。原因：key分布不均匀倾斜度衡量：平均记录数超过50w且
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua csrf
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-3.求子数组的最大和 bylijinnan java
package beautyOfCoding; public class MaxSubArraySum { /** * 3.求子数组的最大和题目描述：输入一个整形数组，数组里有正数也有负数。数组中连续的一个或多个整数组成一个子数组，每个子数组都有一个和。求所有子数组的和的最大值。要求时间复杂度为O(n)。例如输入的数组为1, -2, 3, 10, -4,
Netty源码学习-FileRegion bylijinnan java netty
今天看org.jboss.netty.example.http.file.HttpStaticFileServerHandler.java 可以直接往channel里面写入一个FileRegion对象，而不需要相应的encoder： //pipeline（没有诸如“FileRegionEncoder”的handler）： public ChannelPipeline ge
使用ZeroClipboard解决跨浏览器复制到剪贴板的问题 cngolon 跨浏览器复制到粘贴板 Zero Clipboard
Zero Clipboard的实现原理 Zero Clipboard 利用透明的Flash让其漂浮在复制按钮之上，这样其实点击的不是按钮而是 Flash ，这样将需要的内容传入Flash，再通过Flash的复制功能把传入的内容复制到剪贴板。 Zero Clipboard的安装方法首先需要下载 Zero Clipboard的压缩包，解压后把文件夹中两个文件：ZeroClipboard.js
单例模式 cuishikuan 单例模式
第一种（懒汉，线程不安全）： public class Singleton { 2 private static Singleton instance; 3 pri
spring+websocket的使用 dalan_123
一、spring配置文件 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.or
细节问题：ZEROFILL的用法范围。 dcj3sjt126com mysql
1、zerofill把月份中的一位数字比如1，2，3等加前导0 mysql> CREATE TABLE t1 (year YEAR(4), month INT(2) UNSIGNED ZEROFILL, -> day
Android开发10——Activity的跳转与传值 dcj3sjt126com Android开发
Activity跳转与传值，主要是通过Intent类，Intent的作用是激活组件和附带数据。一、Activity跳转方法一Intent intent = new Intent(A.this, B.class); startActivity(intent) 方法二Intent intent = new Intent();intent.setCla
jdbc 得到表结构、主键 eksliang jdbc 得到表结构、主键
转自博客：http://blog.csdn.net/ocean1010/article/details/7266042 假设有个con DatabaseMetaData dbmd = con.getMetaData(); rs = dbmd.getColumns(con.getCatalog(), schema, tableName, null); rs.getSt
Android 应用程序开关GPS gqdy365 android
要在应用程序中操作GPS开关需要权限： <uses-permission android:name="android.permission.WRITE_SECURE_SETTINGS" /> 但在配置文件中添加此权限之后会报错，无法再eclipse里面正常编译，怎么办？ 1、方法一：将项目放到Android源码中编译； 2、方法二：网上有人说cl
Windows上调试MapReduce zhiquanliu mapreduce
1.下载hadoop2x-eclipse-plugin https://github.com/winghc/hadoop2x-eclipse-plugin.git 把 hadoop2.6.0-eclipse-plugin.jar 放到eclipse plugin 目录中。 2.下载 hadoop2.6_x64_.zip http://dl.iteye.com/topics/download/d2b
如何看待一些知名博客推广软文的行为？ justjavac 博客
本文来自我在知乎上的一个回答：http://www.zhihu.com/question/23431810/answer/24588621 互联网上的两种典型心态：当初求种像条狗，如今撸完嫌人丑当初搜贴像条犬，如今读完嫌人软你为啥感觉不舒服呢？难道非得要作者把自己的劳动成果免费给你用，你才舒服？就如同 Google 关闭了 Gooled Reader，那是
sql优化总结 macroli sql
为了是自己对sql优化有更好的原则性，在这里做一下总结，个人原则如有不对请多多指教。谢谢！要知道一个简单的sql语句执行效率，就要有查看方式，一遍更好的进行优化。一、简单的统计语句执行时间 declare @d datetime ---定义一个datetime的变量set @d=getdate() ---获取查询语句开始前的时间select user_id
Linux Oracle中常遇到的一些问题及命令总结超声波 oracle linux
1.linux更改主机名 (1)#hostname oracledb　　　　临时修改主机名 (2) vi /etc/sysconfig/network 　　修改hostname (3) vi /etc/hosts　　　　　　　　修改IP对应的主机名 2.linux重启oracle实例及监听的各种方法（注意操作的顺序应该是先监听，后数据库实例） &nbs
hive函数大全及使用示例 superlxw1234 hadoop hive函数
具体说明及示例参见附件文档。文档目录：目录一、关系运算： 4 1. 等值比较: = 4 2. 不等值比较: <> 4 3. 小于比较: < 4 4. 小于等于比较: <= 4 5. 大于比较: > 5 6. 大于等于比较: >= 5 7. 空值判断: IS NULL 5
Spring 4.2新特性-使用@Order调整配置类加载顺序 wiselyman spring 4
4.1 @Order Spring 4.2 利用@Order控制配置类的加载顺序 4.2 演示两个演示bean package com.wisely.spring4_2.order; public class Demo1Service { } package com.wisely.spring4_2.order; public class

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他