yanhan_huang

Spark读写和Lost Excutor错误的分析和解决过程

Spark读写和Lost Excutor错误的分析和解决过程
http://www.aboutyun.com/thread-15842-1-1.html

问题导读

1.大规模数据往HDFS中写时候，报了HDFS读写超时,本文是如何分析的？
2.大规模数据往HDFS中写时候，报了超时如何解决？
3.总结你遇到问题，是如何解决的？

一、概述

上篇blog记录了些在用spark-sql时遇到的一些问题，今天继续记录用Spark提供的RDD转化方法开发公司第一期标签分析系统（一部分scala作业逻辑代码后面blog再给大家分享）遇到的一些SPARK作业错误信息。其中有些问题可能一些数据量或者shuffle量比较小的作业时不会遇到的，我们整套标签系统的初级输入数据大概是8T左右，这里也是个参考。(下面的Spark部署模式为spark on yarn)

二、问题

1、大规模数据往HDFS中写时候，报了HDFS读写超时，具体日志看下面。

（1）具体到某个Excutor的错误日志:

（2）具体到各个数据节点DataNode的日志:

分析：

从这两个错误信息首先可以将错误定位到整个HDFS的读写过程中，其中对于读写超时可以定位到2个参数：dfs.client.socket-timeout(默认60s)、dfs.datanode.socket.write.timeout(默认80s)。在spark的程序中按照自己的实际情况设置这两个值，问题可以解决。给个例子：

[Bash shell] 纯文本查看复制代码

 
         01 
         val dwd_new_pc_list_patch = "/user/hive/warehouse/pc.db/dwd_new_pc_list/2015-01-*/action=play" 
       
         02 
         val sparkConf = new SparkConf().setAppName("TagSystem_compositeTag") 
       
         03 
           .set("spark.kryoserializer.buffer.max.mb", "128").set("spark.rdd.compress","true") 
       
         04 
         val sc = new SparkContext(sparkConf) 
       
         05 
         //hdfs客户端的读写超时时间 
       
         06 
         //默认60000 
       
         07 
         sc.hadoopConfiguration.set("dfs.client.socket-timeout", "180000") 
       
         08 
         //默认80000 
       
         09 
         sc.hadoopConfiguration.set("dfs.datanode.socket.write.timeout", "180000") 
       
         10 
         val sqlContext = new org.apache.spark.sql.SQLContext(sc) 
       
         11 
         val hiveSqlContext = new org.apache.spark.sql.hive.HiveContext(sc) 
       
         12 
            
         13 
         //(user_id,fo,fo_2,sty,fs) 
       
         14 
         val source = sc.textFile(dwd_new_pc_list_patch).filter(p => (p.trim != "" && p.split("\\|").length >= 105)).mapPartitions({ it => 
       
         15 
           for { 
       
         16 
             line <- it 
       
         17 
           } yield (line.split("\\|")(21), line.split("\\|")(9), line.split("\\|")(104), line.split("\\|")(40), line.split("\\|")(7)) 
       
         18 
         }).persist(StorageLevel.MEMORY_AND_DISK_SER) 
       
         19 
         . 
       
         20 
         . 
       
         21 
         .

另外相似问题： https://jira.spring.io/si/jira.i ... P-404/SHDP-404.html

2、由spark.reducer.maxMbInFlight引起的Lost Excutor问题。

这个错误主要是发生在shuffle中的fetch阶段，由于Excutor 已经lost掉了，由于容错机制另外重新启动一个Excutor，但是在之前lost掉的Excutor中保存的blockManager已经完全丢失，所以之前的stage需要重新计算。具体在dirver或者CoarseGrainedExecutorBackend的日志主要提示超时和读写文件失败，截了下超时的错误提示：

解决方法：

处理Lost Excutor问题还是花了比较长的时间，调整了很多参数都不行。最后将spark.reducer.maxMbInFlight调小或者将spark.shuffle.copier.threads调小问题解决。在家里还是详细的研究了下spark.reducer.maxMbInFlight这个参数的具体机制含义。spark.reducer.maxMbInFlight官方的配置文档的说明有些笼统：大概的意思是同事从reduce task中取出的ShuffleTask输出最大值（默认48MB）。这个从字面上理解还是不怎么容易的，从源码上search这个参数，定位到org.apache.spark.storage.BlockFetcherIterator.BasicBlockFetcherIterator#splitLocalRemoteBlocks

[Bash shell] 纯文本查看复制代码

 
         01 
         protected def splitLocalRemoteBlocks(): ArrayBuffer[FetchRequest] = { 
       
         02 
              // Make remote requests at most maxBytesInFlight / 5 in length; the reason to keep them 
       
         03 
              // smaller than maxBytesInFlight is to allow multiple, parallel fetches from up to 5 
       
         04 
              // nodes, rather than blocking on reading output from one node. 
       
         05 
              //每个fetch线程获取的数据量大小（默认5个fetch线程） 
       
         06 
              val targetRequestSize = math.max(maxBytesInFlight / 5, 1L) 
       
         07 
              logInfo("maxBytesInFlight: " + maxBytesInFlight + ", targetRequestSize: " + targetRequestSize) 
       
         08 
           
         09 
              // Split local and remote blocks. Remote blocks are further split into FetchRequests of size 
       
         10 
              // at most maxBytesInFlight in order to limit the amount of data in flight. 
       
         11 
              val remoteRequests = new ArrayBuffer[FetchRequest] 
       
         12 
              var totalBlocks = 0 
       
         13 
              for ((address, blockInfos) <- blocksByAddress) { //  address实际上是executor_id 
       
         14 
                totalBlocks += blockInfos.size 
       
         15 
                if (address == blockManagerId) { 
       
         16 
                  // Filter out zero-sized blocks 
       
         17 
                  localBlocksToFetch ++= blockInfos.filter(_._2 != 0).map(_._1) 
       
         18 
                  _numBlocksToFetch += localBlocksToFetch.size 
       
         19 
                } else { 
       
         20 
                  val iterator = blockInfos.iterator 
       
         21 
                  var curRequestSize = 0L 
       
         22 
                  var curBlocks = new ArrayBuffer[(BlockId, Long)] 
       
         23 
                  while (iterator.hasNext) { 
       
         24 
                  // blockId 是org.apache.spark.storage.ShuffleBlockId， 
       
         25 
                  // 格式："shuffle_" + shuffleId + "_" + mapId + "_" + reduceId 
       
         26 
                    val (blockId, size) = iterator.next() 
       
         27 
                    // Skip empty blocks 
       
         28 
                    if (size > 0) { 
       
         29 
                      curBlocks += ((blockId, size)) 
       
         30 
                      remoteBlocksToFetch += blockId 
       
         31 
                      _numBlocksToFetch += 1 
       
         32 
                      curRequestSize += size 
       
         33 
                    } else if (size < 0) { 
       
         34 
                      throw new BlockException(blockId, "Negative block size " + size) 
       
         35 
                    } 
       
         36 
                     // 避免一次请求的数据量过大 
       
         37 
                    if (curRequestSize >= targetRequestSize) { 
       
         38 
                      // Add this FetchRequest 
       
         39 
                      remoteRequests += new FetchRequest(address, curBlocks) 
       
         40 
                      curBlocks = new ArrayBuffer[(BlockId, Long)] 
       
         41 
                      logDebug(s"Creating fetch request of $curRequestSize at $address") 
       
         42 
                      curRequestSize = 0 
       
         43 
                    } 
       
         44 
                  } 
       
         45 
                  // Add in the final request 
       
         46 
                  // 将剩余的请求放到最后一个request中。 
       
         47 
                  if (!curBlocks.isEmpty) { 
       
         48 
                    remoteRequests += new FetchRequest(address, curBlocks) 
       
         49 
                  } 
       
         50 
                } 
       
         51 
              } 
       
         52 
              logInfo("Getting " + _numBlocksToFetch + " non-empty blocks out of " + 
       
         53 
                totalBlocks + " blocks") 
       
         54 
              remoteRequests 
       
         55 
            }

从代码上看我的个人理解是在shuffle节点每个reduce task会启动5个fetch线程（可以由spark.shuffle.copier.threads配置）去最多spark.reducer.maxMbInFlight个(默认5)其他Excuctor中获取文件位置，然后去fetch它们，并且每次fetch的抓取量不会超过spark.reducer.maxMbInFlight（默认值为48MB)/5。这种机制我个人理解，第一：可以减少单个fetch连接的网络IO、第二：这种将fetch数据并行执行有助于抓取速度提高，减少请求数据的抓取时间总和。

回来结合我现在的问题分析，我将spark.reducer.maxMbInFlight调小，从而减少了每个reduce task中的每个fetch线程的抓取数据量，进而减少了每个fetch连接的持续连接时间，降低了由于reduce task过多导致每个Excutor中存在的fetch线程太多而导致的fetch超时，另外降低内存的占用。

上述分析为个人理解，如有更深入的想法欢迎交流。

出处 http://zengzhaozheng.blog.51cto.com/8219051/1615792

你可能感兴趣的:(spark,数据,hdfs)

MongoDB介绍与部署使用 zhangleijiutian mongodb
MongoDB的功能特性MongoDB是一个高性能、开源、无模式的文档型数据库，设计用于提供高性能、水平可扩性、高可用性和高级可查询性，为Web应用提供可扩展的高性能数据存储解决方案。MongoDB的名称取自单词”humogous”中间的几个字符，是很大、巨大的意思。该数据库由10gen公司开发并提供技术支持，它属于NoSQL数据库家族中的一员，在许多场景下可以用来替代传统关系型数据库或key/v
Python Pandas实现dataframe导出为Excel 2007格式的文件并设置合适的列宽度 weixin_30777913 pandas python 开发语言 excel
PythonPandas实现dataframe导出为Excel2007格式的文件，并且针对每一列的数据调整到合适宽度，并封装为函数。此函数能够有效处理大多数情况下的列宽调整需求，确保Excel文件内容清晰易读。将PandasDataFrame导出为Excel2007+格式（.xlsx）并自动调整列宽，可以使用以下函数。该函数会处理索引列和数据列，确保每列宽度适合内容。importpandasasp
Python 爬虫基础教程盛子涵666 python 爬虫开发语言
爬虫的背景与应用诞生爬虫（WebCrawling）是自动化程序，用于从互联网上获取信息。爬虫的基本任务是自动访问网站，通过抓取网页内容并提取有用数据来构建数据库、索引或者进行进一步的数据分析。爬虫通常会模拟浏览器的行为，以避免被服务器识别为机器人，并且能够在大规模范围内高效地抓取信息。爬虫技术最早由搜索引擎开发者提出，目的是自动收集网页信息并将其索引，便于用户搜索时快速检索相关内容。随着互联网的快
Python实现机器学习项目教程：房价预测向着开发进攻 python python 机器学习开发语言
Python实现机器学习小项目教程：房价预测案例机器学习（MachineLearning）是数据科学中的一项重要技术，它通过从数据中学习规律，进行预测和决策。对于初学者来说，通过实际的项目来学习机器学习的原理和实现方法，是非常有效的。本篇教程将通过Python实现一个简单的机器学习小项目——房价预测。我们将使用scikit-learn库来构建并训练一个线性回归模型，预测房价。项目背景假设我们拥有一
使用C++实现链表数据结构向着开发进攻 c语言数据结构 c++链表
使用C++实现链表数据结构在计算机科学中，链表是最基础且常用的数据结构之一，它属于线性数据结构。链表相比于数组，它能动态地管理内存，具有更高的插入和删除效率，特别是在频繁需要增删操作的场景下。本文将通过C++编程语言实现单链表的数据结构。我们将实现以下功能：链表的插入:在链表头、尾部插入节点。链表的删除:删除指定位置的节点。链表的遍历:打印链表的所有元素。链表的搜索:根据值查找节点。一、链表的基本
C# 特性（Attributes）使用详解鲤籽鲲 C#c#开发语言 C#知识捡漏
总目录前言在C#中，特性（Attributes）是一种用于向代码添加元数据的强大机制。这些元数据可以被编译器、运行时环境或开发工具读取，并用于控制程序的行为。本文将详细介绍C#中特性的基本概念、常见用法以及一些高级应用。一、什么是特性？1.定义特性（Attribute）是C#中用于向代码元素（类、方法、属性等）附加元数据（Metadata）的声明性标记，本质是继承自System.Attribute
Python中Pandas常用函数及案例详解程序员爱技术 python pandas 开发语言数据分析大数据
Pandas是一个强大的Python数据分析工具库，它为Python提供了快速、灵活且表达能力强的数据结构，旨在使“关系”或“标签”数据的操作既简单又直观。Pandas的核心数据结构是DataFrame，它是一个二维标签化数据结构，可以看作是一个表格，其中可以存储不同类型的数据。下面是Pandas中一些关于导入、导出、查看、检查、选取、清理、合并、统计等常用函数的详解以及案例说明：第一、导入函数P
上万个Map运行时链接ApplicationMaster超时FAILED 500佰大数据云计算 big data mapreduce
#MapReduce业务常见故障#大数据#生产环境真实案例#MapReduce#批计算#离线业务#整理#经验总结说明：此篇总结MapReduce业务常见故障案例处理方案结合自身经历总结不易+关注+收藏欢迎留言更多专题(详见)：MapReduce计算引擎详解--项目优化(指导书)上万个Map运行时链接ApplicationMaster超时FAILED症状Mapreduce任务会并发起几万个map,会
生产环境使用k3s避雷指南：避免数据丢失与不可恢复 dblens 数据库管理和开发工具 k3s 系统架构 k8s
1.存储安全：避免数据丢失的核心1.1必须使用持久化存储问题：k3s默认使用临时存储（如emptyDir），容器重启后数据会丢失。解决方案：生产环境必须使用持久化存储卷（PVC），并绑定到可靠的存储后端（如云厂商的块存储、NFS、Longhorn等）。示例：在MySQL/Redis的Deployment中，替换emptyDir为持久化PVC：volumes:-name:mysql-datapers
【MySQL】表的约束熙曦Sakura MySQL mysql android oracle
5.表的约束真正约束字段的是数据类型，但是数据类型约束很单一，需要有一些额外的约束，更好的保证数据的合法性，从业务逻辑角度保证数据的正确性。比如有一个字段是email，要求是唯一的。表的约束很多，这里主要介绍如下几个：null/notnull,default,comment,zerofill,primarykey,auto_increment,uniquekey。5.1空属性两个值：null（默认
SpringBoot整合Hutool实现文件上传下载晚上睡不着！ #SpringBoot 笔记
前言我相信我们在日常开发中，难免会遇到对各种媒体文件的操作，由于业务需求的不同对文件操作的代码实现也大不相同数据库设计/*NavicatPremiumDataTransferSourceServer:MySQL5.5SourceServerType:MySQLSourceServerVersion:50554(5.5.54)SourceHost:localhost:3306SourceSchema
爬虫的精准识别：基于 User-Agent 的正则实现 Small踢倒coffee_氕氘氚经验分享笔记
##摘要随着互联网技术的飞速发展，网络爬虫在数据采集、搜索引擎优化等领域的应用日益广泛。然而，恶意爬虫的存在也给网站安全和数据隐私带来了严重威胁。因此，精准识别爬虫行为成为网络安全领域的重要课题。本文提出了一种基于User-Agent正则表达式的爬虫识别方法，通过分析User-Agent字符串的特征，构建正则表达式规则，实现对爬虫的精准识别。实验结果表明，该方法具有较高的识别准确率和较低的误报率，
arcgis 切片分析录入mongodb tvrddmss arcgis mongodb
将arcgis的切片数据录入mongodb，这样可以支持自定义的server发步以下是对3种arcgis切片规则的分析松散型也就是我们常见的文件式的切片管理方式，将ArcgisServer切出来的切片图片按照行列号的规范，存储在相应的文件夹中。循环所有.png文件路径，存入mongodb数据库for(leti=0;i0){letb3dmData={'level':level,'row':rowin
《计量地理学》实习指南 zmg18213828575
一、EXCEL中常用的函数（部分）操作方法：打开EXCEL→输入原始数据→选择fx粘贴函数→函数分类中选择统计→从函数名中选择我们所需要的函数→确定→在数值中输入或选入计算数据范围（如A1:A10）则结果就会出来。具体的函数及其含义：AVERAGE计算参数平均值CORREL求相关系数DEVSQ求离差平方和FTESTF检验的结果GEOMEAN正数数组的几何平均数INTERCEPT一元回归线的载距（Y
Python教程：一文了解如何让Python代码变成命令行工具旦莫 Python进阶 python 开发语言
目录1.什么是argparse？2.基本用法1.创建ArgumentParser对象2.添加参数3.解析参数4.使用解析后的参数5.一个简单的用户信息打印工具5.1示例代码5.2运行示例3.高级用法1.子命令2.互斥参数3.自定义类型和动作4.嵌套解析器4.复杂示例：数据库管理工具CLI，全称为Command-LineInterface，即命令行界面。它是一种与计算机程序进行交互的方式，用户通过输
伍德里奇计量经济学第四章计算机答案,计量经济学中文答案伍德里奇 weixin_39950470
第1章计置经济学的性质与经济数据1.1复习笔记一、计量经济学由于计量经济学主要考虑在搜集和分析非实验经济数据时的固有问题，计量经济学己从数理统计分离出来并演化成一门独立学科。1.非实验数据是指并非从对个人、企业或经济系统中的某些部分的控制实验而得来的数据。非实验数据有时被称为观测数据或回顾数据，以强调研宄者只是被动的数据搜集者这一事实。2.实验数据通常是在实验环境中获得的，但在社会科学中要得到这些
vue3学习教程第二十六节（Hooks 封装注意事项）刺客-Andy vue3 vue.js javascript 前端
1、什么是HooksHooks最先提出的是React，在React16之后提出了所有以use开头定义的函数，用于复杂功能编写、函数组件中状态管理共用、副作用处理而抽离的共用的单一功能可复用的函数；2、Hooks与mixinsClass在应用中的差异在vue2中的mixinsClass主要有以下缺点：a、数据来源不清晰：在一个单文件组件中引入多个mixins或者class时候，想要追踪一个方法或者属
大模型中的常用名词介绍八：【特征与数据处理、伦理与公平性等】【建议收藏】神马行空大模型人工智能深度学习计算机视觉神经网络架构自然语言处理
本文总结了大模型领域有关特征与数据处理、伦理与公平性等其他部分的名词，并解释其含义。跳出浩如烟海的大模型知识圈层，从概念上理清大模型的基础脉络！序号模块分组说明快捷访问1模型架构与基础概念介绍了【模型架构与基础概念】相关的常见名词及含义大模型中的常用名词介绍一：【模型架构与基础概念】【建议收藏】-CSDN博客2训练方法与技术介绍了【训练方法与技术】相关的常见名词及含义大模型中的常用名词介绍二：【训
RecyclerView学习笔记(1) ChildHelper.Bucket 奋斗小小鸟cy Android android 数据结构
简介toString方法set方法get方法clear方法countOnesBefore方法reset方法insert方法remove方法总结简介RecyclerView中的ChildHelper.Bucket是一个工具类，实现了类似List的数据结构，从而达到减少内存占用的目的。Bucket是一个链表结构，有两个字段：mData用于存储当前信息，next指向下一个数据publicstaticcl
【Python爬虫(71)】用Python爬虫解锁教育数据的奥秘奔跑吧邓邓子 Python爬虫 python 爬虫开发语言教育数据
【Python爬虫】专栏简介：本专栏是Python爬虫领域的集大成之作，共100章节。从Python基础语法、爬虫入门知识讲起，深入探讨反爬虫、多线程、分布式等进阶技术。以大量实例为支撑，覆盖网页、图片、音频等各类数据爬取，还涉及数据处理与分析。无论是新手小白还是进阶开发者，都能从中汲取知识，助力掌握爬虫核心技能，开拓技术视野。目录一、引言二、确定目标网站2.1教育机构官网2.2在线学习平台三、爬
React 使用高阶组件封装Context的两种方式 Kevin·Tseng vue react java 数据库 python
Reac中使用Context共享数据时，可以使用高阶组件做一个封装，方便页面使用方式一：使用高阶组件1.在App.js中添加状态共享ProviderimportHomefrom'./page/Home'import{Provider,Context}from'./AppContext'conststore={user:{isLogin:true,userName:"Kevin"}}function
Hive高级SQL技巧及实际应用场景小技工丨大数据随笔 sql hive 数据仓库大数据
Hive高级SQL技巧及实际应用场景引言ApacheHive是一个建立在Hadoop之上的数据仓库基础设施，它提供了一个用于查询和管理分布式存储中的大型数据集的机制。通过使用类似于SQL（称为HiveQL）的语言，Hive使得数据分析变得更加简单和高效。本文将详细探讨一些Hive高级SQL技巧，并结合实际的应用场景进行说明。HiveSQL的高级使用技巧1.窗口函数描述：窗口函数允许我们在不使用GR
QT如何操作sqlite数据库 sdkdslx 数据库 qt sqlite
介绍Sqlite数据库作为Qt项目开发中经常使用的一个轻量级的数据库，不需要server，可以说是兼容性相对比较好的数据库之一。其可以集成在其他软件中，非常适合嵌入式系统。本文为大家介绍了Qt操作SQLite数据库的具体方法，希望对大家有所帮助。优点SQLite的设计目的是嵌入式SQL数据库引擎，它基于纯C语言代码，已经应用于非常广泛的领域内。SQLite在需要长时间存储时可以直接读取硬盘上的数据
Hive SQL 精进系列：字符串拼接的三种常用方式进一步有进一步的欢喜 hive sql hadoop
Hive字符串拼接：三种常用方式深度剖析目录Hive字符串拼接：三种常用方式深度剖析引言一、简洁直观的`||`操作符1.基础语法规则2.丰富多样的示例展示3.优势与局限分析二、规范通用的`CONCAT`函数1.全面的语法解析2.生动的示例说明3.优势与局限剖析三、灵活指定分隔符的`CONCAT_WS`函数1.清晰的语法介绍2.实用的示例演示3.优势与局限探讨四、总结与选择建议引言在Hive数据处理
Python :数据模型愚戏师 python基础与机器学习 python 开发语言
一.什么是数据模型？Python数据模型是Python对象系统的抽象，通过一组特殊方法（如__init__、__len__等）和协议（如迭代协议、上下文管理协议），定义了对象如何与语言的内置功能（如len()、for循环等）交互。核心思想统一性：所有对象（如列表、字典、自定义类）的行为都通过相同的特殊方法实现。灵活性：通过实现特殊方法，可以让自定义对象支持内置操作（如+、in、切片等）。例子imp
用ExcelVBA下载ETF历史数据 Excel(Python)高效办公工具 VBA爬虫网抓那些事爬虫
先看结果，视频演示送上：https://www.bilibili.com/video/BV1s8411P7s7/制作思路的话，基本还是从“找数据源--设计表格结构--网抓实现---数据处理”这个逻辑来做。数据源方面，之前其实做过一个基金下载器，当时选择天天基金的数据源（详情见我的另一篇文章https://zhuanlan.zhihu.com/p/582901324），但是后来感觉这个可以获取的字段
HIVE SQL进阶 Q010910 hive sql hadoop 数据分析
1.lateralviewexplode：将array或map类型的列拆分成多行数据lateralview：把拆分的单个字段数据与原始表的数据关联上LATERALVIEWEXPLODE(col)table_tempAScol_nametable_temp是因为LATERALVIEWUDTF函数在执行时，会生成一个临时的虚拟表。同时生成的列也需要列名col_name。lateralview的位置在f
解决pandas的to_excel方法写入数据被覆盖的问题 hobbies. pandas excel python
1.先用openpyxl读取到了excel文件的数据，载入excel文件的内容到ExcelWriter中，使用ExcelWriter写入保存importpandasaspdfromopenpyxlimportload_workbookdf=pd.DataFrame([66])withpd.ExcelWriter(r'C:\Users\Administrator\Desktop\1.xlsx')as
Pandas：to_excel 在原Excel表追加写入数据条件漫步 python python
@创建于：20211118文章目录1、直接写入2、直接写入3、参考链接1、直接写入如果只是想把一个DataFrame保存为单独的一个Excel文件，那么直接写：df_data.to_excel('xxx.excel','sheet1',index=False)保存为单个Excel文件和这个文件中的单个表。如果先前存在有同名的Excel文件，这样做会把之前的Excel文件覆盖掉。2、直接写入ifno
Excel中怎样通过网站获取股票实时数据？股票程序化交易接口量化交易股票API接口 Python股票量化交易 excel 股票实时数据网站数据源股票量化接口股票API接口
Python股票接口实现查询账户，提交订单，自动交易（1）Python股票程序交易接口查账，提交订单，自动交易（2）股票量化，Python炒股，CSDN交流社区>>>财经新闻网站是获取股票信息的常见来源。像新浪财经、腾讯财经等网站，它们提供了大量的股票数据。这些网站数据更新较为及时，包含股票的实时价格、成交量等基本信息。从这类网站获取数据到Excel可能相对复杂一些，因为它们的页面结构主要是为了方
Spring中@Value注解，需要注意的地方无量 spring bean @Value xml
Spring 3以后,支持@Value注解的方式获取properties文件中的配置值，简化了读取配置文件的复杂操作 1、在applicationContext.xml文件(或引用文件中)中配置properties文件 <bean id="appProperty" class="org.springframework.beans.fac
mongoDB 分片开窍的石头 mongodb
mongoDB的分片。要mongos查询数据时候先查询configsvr看数据在那台shard上，configsvr上边放的是metar信息，指的是那条数据在那个片上。由此可以看出mongo在做分片的时候咱们至少要有一个configsvr,和两个以上的shard（片）信息。第一步启动两台以上的mongo服务 &nb
OVER(PARTITION BY)函数用法 0624chenhong oracle
这篇写得很好，引自 http://www.cnblogs.com/lanzi/archive/2010/10/26/1861338.html OVER(PARTITION BY)函数用法 2010年10月26日 OVER(PARTITION BY)函数介绍开窗函数 &nb
Android开发中，ADB server didn't ACK 解决方法一炮送你回车库 Android开发
首先通知：凡是安装360、豌豆荚、腾讯管家的全部卸载，然后再尝试。一直没搞明白这个问题咋出现的，但今天看到一个方法，搞定了！原来是豌豆荚占用了 5037 端口导致。参见原文章：一个豌豆荚引发的血案——关于ADB server didn't ACK的问题简单来讲，首先将Windows任务进程中的豌豆荚干掉，如果还是不行，再继续按下列步骤排查。 &nb
canvas中的像素绘制问题换个号韩国红果果 JavaScript canvas
pixl的绘制，1.如果绘制点正处于相邻像素交叉线，绘制x像素的线宽，则从交叉线分别向前向后绘制x/2个像素，如果x/2是整数，则刚好填满x个像素，如果是小数，则先把整数格填满，再去绘制剩下的小数部分，绘制时，是将小数部分的颜色用来除以一个像素的宽度，颜色会变淡。所以要用整数坐标来画的话（即绘制点正处于相邻像素交叉线时），线宽必须是2的整数倍。否则会出现不饱满的像素。 2.如果绘制点为一个像素的
编码乱码问题灵静志远 java jvm jsp 编码
1、JVM中单个字符占用的字节长度跟编码方式有关，而默认编码方式又跟平台是一一对应的或说平台决定了默认字符编码方式；2、对于单个字符：ISO-8859-1单字节编码，GBK双字节编码，UTF-8三字节编码；因此中文平台(中文平台默认字符集编码GBK)下一个中文字符占2个字节，而英文平台(英文平台默认字符集编码Cp1252(类似于ISO-8859-1))。 3、getBytes()、getByte
java 求几个月后的日期 darkranger calendar getinstance
Date plandate = planDate.toDate(); SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd"); Calendar cal = Calendar.getInstance(); cal.setTime(plandate); // 取得三个月后时间 cal.add(Calendar.M
数据库设计的三大范式（通俗易懂） aijuans 数据库复习
关系数据库中的关系必须满足一定的要求。满足不同程度要求的为不同范式。数据库的设计范式是数据库设计所需要满足的规范。只有理解数据库的设计范式，才能设计出高效率、优雅的数据库，否则可能会设计出错误的数据库. 目前，主要有六种范式：第一范式、第二范式、第三范式、BC范式、第四范式和第五范式。满足最低要求的叫第一范式，简称1NF。在第一范式基础上进一步满足一些要求的为第二范式，简称2NF。其余依此类推。
想学工作流怎么入手 atongyeye jbpm
工作流在工作中变得越来越重要，很多朋友想学工作流却不知如何入手。很多朋友习惯性的这看一点，那了解一点，既不系统，也容易半途而废。好比学武功，最好的办法是有一本武功秘籍。研究明白，则犹如打通任督二脉。系统学习工作流，很重要的一本书《JBPM工作流开发指南》。本人苦苦学习两个月，基本上可以解决大部分流程问题。整理一下学习思路，有兴趣的朋友可以参考下。 1 首先要
Context和SQLiteOpenHelper创建数据库百合不是茶 android Context创建数据库
一直以为安卓数据库的创建就是使用SQLiteOpenHelper创建,但是最近在android的一本书上看到了Context也可以创建数据库,下面我们一起分析这两种方式创建数据库的方式和区别,重点在SQLiteOpenHelper 一:SQLiteOpenHelper创建数据库: 1,SQLi
浅谈group by和distinct bijian1013 oracle 数据库 group by distinct
group by和distinct只了去重意义一样，但是group by应用范围更广泛些，如分组汇总或者从聚合函数里筛选数据等。譬如：统计每id数并且只显示数大于3 select id ,count(id) from ta
vi opertion 征客丶 mac opration vi
进入 command mode （命令行模式）按 esc 键再按 shift + 冒号注：以下命令中带 $ 【在命令行模式下进行】，不带 $ 【在非命令行模式下进行】一、文件操作 1.1、强制退出不保存 $ q! 1.2、保存 $ w 1.3、保存并退出 $ wq 1.4、刷新或重新加载已打开的文件 $ e 二、光标移动 2.1、跳到指定行数字
【Spark十四】深入Spark RDD第三部分RDD基本API bit1129 spark
对于K/V类型的RDD,如下操作是什么含义？ val rdd = sc.parallelize(List(("A",3),("C",6),("A",1),("B",5)) rdd.reduceByKey(_+_).collect reduceByKey在这里的操作，是把
java类加载机制 BlueSkator java 虚拟机
java类加载机制 1.java类加载器的树状结构引导类加载器 ^ | 扩展类加载器 ^ | 系统类加载器 java使用代理模式来完成类加载，java的类加载器也有类似于继承的关系，引导类是最顶层的加载器，它是所有类的根加载器，它负责加载java核心库。当一个类加载器接到装载类到虚拟机的请求时，通常会代理给父类加载器，若已经是根加载器了，就自己完成加载。虚拟机区分一个Cla
动态添加文本框 BreakingBad 文本框
<script> var num=1; function AddInput() { var str=""; str+="<input
读《研磨设计模式》-代码笔记-单例模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ public class Singleton { } /* * 懒汉模式。注意，getInstance如果在多线程环境中调用，需要加上synchronized，否则存在线程不安全问题 */ class LazySingleton
iOS应用打包发布常见问题 chenhbc ios iOS发布 iOS上传 iOS打包
这个月公司安排我一个人做iOS客户端开发，由于急着用，我先发布一个版本，由于第一次发布iOS应用，期间出了不少问题，记录于此。 1、使用Application Loader 发布时报错：Communication error.please use diagnostic mode to check connectivity.you need to have outbound acc
工作流复杂拓扑结构处理新思路 comsci 设计模式工作算法企业应用 OO
我们走的设计路线和国外的产品不太一样，不一样在哪里呢？国外的流程的设计思路是通过事先定义一整套规则(类似XPDL)来约束和控制流程图的复杂度(我对国外的产品了解不够多，仅仅是在有限的了解程度上面提出这样的看法)，从而避免在流程引擎中处理这些复杂的图的问题，而我们却没有通过事先定义这样的复杂的规则来约束和降低用户自定义流程图的灵活性，这样一来，在引擎和流程流转控制这一个层面就会遇到很
oracle 11g新特性Flashback data archive daizj oracle
1. 什么是flashback data archive Flashback data archive是oracle 11g中引入的一个新特性。Flashback archive是一个新的数据库对象，用于存储一个或多表的历史数据。Flashback archive是一个逻辑对象，概念上类似于表空间。实际上flashback archive可以看作是存储一个或多个表的所有事务变化的逻辑空间。
多叉树:2-3-4树 dieslrae 树
平衡树多叉树,每个节点最多有4个子节点和3个数据项,2,3,4的含义是指一个节点可能含有的子节点的个数,效率比红黑树稍差.一般不允许出现重复关键字值.2-3-4树有以下特征: 1、有一个数据项的节点总是有2个子节点(称为2-节点) 2、有两个数据项的节点总是有3个子节点(称为3-节
C语言学习七动态分配 malloc的使用 dcj3sjt126com c language malloc
/* 2013年3月15日15:16:24 malloc 就memory(内存) allocate(分配)的缩写本程序没有实际含义，只是理解使用 */ # include <stdio.h> # include <malloc.h> int main(void) { int i = 5; //分配了4个字节静态分配 int * p
Objective-C编码规范[译] dcj3sjt126com 代码规范
原文链接 : The official raywenderlich.com Objective-C style guide 原文作者 : raywenderlich.com Team 译文出自 : raywenderlich.com Objective-C编码规范译者 : Sam Lau
0.性能优化-目录 frank1234 性能优化
从今天开始笔者陆续发表一些性能测试相关的文章，主要是对自己前段时间学习的总结，由于水平有限，性能测试领域很深，本人理解的也比较浅，欢迎各位大咖批评指正。主要内容包括：一、性能测试指标吞吐量、TPS、响应时间、负载、可扩展性、PV、思考时间 http://frank1234.iteye.com/blog/2180305 二、性能测试策略生产环境相同基准测试预热等 htt
Java父类取得子类传递的泛型参数Class类型 happyqing java 泛型父类子类 Class
import java.lang.reflect.ParameterizedType; import java.lang.reflect.Type; import org.junit.Test; abstract class BaseDao<T> { public void getType() { //Class<E> clazz =
跟我学SpringMVC目录汇总贴、PDF下载、源码下载 jinnianshilongnian springMVC
----广告-------------------------------------------------------------- 网站核心商详页开发掌握Java技术，掌握并发/异步工具使用，熟悉spring、ibatis框架；掌握数据库技术，表设计和索引优化，分库分表/读写分离；了解缓存技术，熟练使用如Redis/Memcached等主流技术；了解Ngin
the HTTP rewrite module requires the PCRE library 流浪鱼 rewrite
./configure: error: the HTTP rewrite module requires the PCRE library. 模块依赖性Nginx需要依赖下面3个包 1. gzip 模块需要 zlib 库 ( 下载: http://www.zlib.net/ ) 2. rewrite 模块需要 pcre 库 ( 下载: http://www.pcre.org/ ) 3. s
第12章 Ajax（中） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Optimize query with Query Stripping in Web Intelligence blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Optimize+query+with+Query+Stripping+in+Web+Intelligence and a very straightfoward video http://www.sdn.sap.com/irj/scn/events?rid=/library/uuid/40ec3a0c-936
Java开发者写SQL时常犯的10个错误 tomcat_oracle java sql
1、不用PreparedStatements 　　有意思的是，在JDBC出现了许多年后的今天，这个错误依然出现在博客、论坛和邮件列表中，即便要记住和理解它是一件很简单的事。开发者不使用PreparedStatements的原因可能有如下几个：　　他们对PreparedStatements不了解　　他们认为使用PreparedStatements太慢了　　他们认为写Prepar
世纪互联与结盟有感阿尔萨斯
10月10日，世纪互联与（Foxcon）签约成立合资公司，有感。全球电子制造业巨头（全球500强企业）与世纪互联共同看好IDC、云计算等业务在中国的增长空间，双方迅速果断出手，在资本层面上达成合作，此举体现了全球电子制造业巨头对世纪互联IDC业务的欣赏与信任，另一方面反映出世纪互联目前良好的运营状况与广阔的发展前景。众所周知，精于电子产品制造（世界第一），对于世纪互联而言，能够与结盟

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他