- Python学习之路-爬虫提高:scrapy基础
geobuins
python学习爬虫
Python学习之路-爬虫提高:scrapy基础为什么要学习scrapy通过前面的学习,我们已经能够解决90%的爬虫问题了,那么scrapy是为了解决剩下的10%的问题么,不是,scrapy框架能够让我们的爬虫效率更高什么是scrapyScrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架,我们只需要实现少量的代码,就能够快速的抓取。Scrapy使用了Twisted['twɪstɪd]
- Python学习之路-爬虫提高:scrapy使用
geobuins
python学习爬虫
Python学习之路-爬虫提高:scrapy使用scrapy项目实现流程创建一个scrapy项目:scrapystartprojectmySpider生成一个爬虫:scrapygenspideritcast"itcast.cn提取数据:完善spider,使用xpath等方法保存数据:pipeline中保存数据创建scrapy项目下面以抓取传智师资库来学习scrapy的入门使用:http://www
- Python学习之路-爬虫提高:常见的反爬手段和解决思路
geobuins
python学习爬虫
Python学习之路-爬虫提高:常见的反爬手段和解决思路常见的反爬手段和解决思路明确反反爬的主要思路反反爬的主要思路就是:尽可能的去模拟浏览器,浏览器在如何操作,代码中就如何去实现。浏览器先请求了地址url1,保留了cookie在本地,之后请求地址url2,带上了之前的cookie,代码中也可以这样去实现。很多时候,爬虫中携带的headers字段,cookie字段,url参数,post的参数很多,
- Python学习之路-爬虫提高:selenium
geobuins
python学习爬虫
Python学习之路-爬虫提高:selenium什么是seleniumSelenium是一个Web的自动化测试工具,最初是为网站自动化测试而开发的,Selenium可以直接运行在浏览器上,它支持所有主流的浏览器(包括PhantomJS这些无界面的浏览器),可以接收指令,让浏览器自动加载页面,获取需要的数据,甚至页面截屏PhantomJS的介绍PhantomJS是一个基于Webkit的“无界面”(h
- Python学习之路-初识爬虫:基础知识
geobuins
jmeter
Python学习之路-初识爬虫:基础知识什么是爬虫网络爬虫(又被称为网页蜘蛛,网络机器人)就是模拟客户端发送网络请求,接收请求响应,一种按照一定的规则,自动地抓取互联网信息的程序。原则上,只要是浏览器(客户端)能做的事情,爬虫都能够做用途如今,人工智能,大数据离我们越来越近,很多公司在开展相关的业务,但是人工智能和大数据中有一个东西非常重要,那就是数据,但是数据从哪里来呢?这时候爬虫的用途就凸显出
- Python学习之路-初识爬虫:数据提取
geobuins
python学习爬虫
Python学习之路-初识爬虫:数据提取什么是数据提取简单的来说,数据提取就是从响应中获取我们想要的数据的过程爬虫中数据的分类结构化数据:json,xml等处理方式:直接转化为python类型非结构化数据:HTML处理方式:正则表达式、xpath数据提取之json为什么要复习json由于把json数据转化为python内建数据类型很简单,所以爬虫中,如果我们能够找到返回json数据的URL,就会尽
- Python学习之路-初识爬虫:requests
geobuins
python学习爬虫
Python学习之路-初识爬虫:requestsrequests的作用作用:发送网络请求,返回响应数据中文文档:http://docs.python-requests.org/zh_CN/latest/index.html为什么学requests而不是urllibrequests的底层实现就是urllibrequests在python2和python3中通用,方法完全一样requests简单易用R
- Python学习之路-Tornado基础:部署
geobuins
python学习tornado
Python学习之路-Tornado基础:部署部署Tornado简介为了充分利用多核CPU,并且为了减少同步代码中的阻塞影响,在部署Tornado的时候需要开启多个进程(最好为每个CPU核心开启一个进程)因为Tornado自带的服务器性能很高,所以我们只需开启多个Tornado进程。为了对外有统一的接口,并且可以分发用户的请求到不同的Tornado进程上,我们用Nginx来进行代理。supervi
- Python学习之路-Tornado基础:异步与WebSocket
geobuins
python学习tornado
Python学习之路-Tornado基础:异步与WebSocket认识异步同步我们用两个函数来模拟两个客户端请求,并依次进行处理:#coding:utf-8defreq_a():"""模拟请求a"""print('开始处理请求req_a')print('完成处理请求req_a')defreq_b():"""模拟请求b"""print('开始处理请求req_b')print('完成处理请求req_b
- Python学习之路-Flask项目:博客后台
geobuins
python学习flask
Python学习之路-Flask项目:博客后台前言上一篇完成了博客前台的相关内容,接下来进行博客后台的相关开发。管理员登录需求分析管理员用户进行登录,并且根据不同的情况报出不同的错误信息,如果当前已登录用户是管理员,在访问登录页面时直接跳转到后台管理主页。登录界面可以直接使用Form表单提交(也可以采用ajax的方式)代码准备在templates目录下创建admin文件夹,将static/admi
- Python学习之路-Flask项目:项目部署
geobuins
python学习flask
Python学习之路-Flask项目:项目部署部署环境基于MacOS10.15.4系统,使用Gunicorn+Nginx进行布署,云服务器为阿里云服务器选择阿里云服务器地址个人免费试用进入控制台,查看实例创建情况给安全组配置规则,添加5000端口(一并加上5001端口)利用命令行进行远程服务器登录ssh用户名@ip地址相关环境安装以下操作都在远程服务器上进行操作先更新apt相关源sudoapt-g
- Python学习之路-Django基础:工程搭建
geobuins
python学习django
Python学习之路-Django基础:工程搭建环境安装创建虚拟环境mkvirtualenvdjango_1.11.10-ppython3安装Django使用Django1.11.10版本pipinstalldjango==1.11.10创建工程在使用Flask框架时,项目工程目录的组织与创建是需要我们自己手动创建完成的。在django中,项目工程目录可以借助django提供的命令帮助我们创建。创
- Python学习之路-Tornado基础:数据库
geobuins
python学习tornado
Python学习之路-Tornado基础:数据库简介与Django框架相比,Tornado没有自带ORM,对于数据库需要自己去适配。我们使用MySQL数据库。在Tornado3.0版本以前提供tornado.database模块用来操作MySQL数据库,而从3.0版本开始,此模块就被独立出来,作为torndb包单独提供。torndb只是对MySQLdb的简单封装,不支持Python3。连接初始化我
- Python学习之路-Tornado基础:安全应用
geobuins
python学习tornado
Python学习之路-Tornado基础:安全应用Cookie对于RequestHandler,除了在初始Tornado中讲到的之外,还提供了操作cookie的方法。设置set_cookie(name,value,domain=None,expires=None,path=‘/’,expires_days=None)参数说明:参数名说明namecookie名valuecookie值domain提交
- Python学习之路002-小插曲之变量和字符串
阿花去哪里啦
注:内容源于学习小甲鱼《零基础入门学Python》,这些都是我自己写的作业,学习地址:https://www.bilibili.com/video/BV1Fs411A7HZ?p=20.以下哪个变量的命名不正确?为什么?(A)MM_520(B)_MM520_(C)520_MM(D)_520_MMA:C不正确,变量不能以数字开头1.在不上机的情况下,以下代码你能猜到屏幕会打印什么内容吗?>>>myte
- Python学习之路-Django基础:类视图与中间件
geobuins
python学习django
Python学习之路-Django基础:类视图与中间件类视图引入以函数的方式定义的视图称为函数视图,函数视图便于理解。但是遇到一个视图对应的路径提供了多种不同HTTP请求方式的支持时,便需要在一个函数中编写不同的业务逻辑,代码可读性与复用性都不佳。defregister(request):"""处理注册"""#获取请求方法,判断是GET/POST请求ifrequest.method=='GET':
- Python学习之路-Django基础:请求与响应
geobuins
python学习django
Python学习之路-Django基础:请求与响应请求简介回想一下,利用HTTP协议向服务器传参有几种途径?提取URL的特定部分,如/weather/beijing/2018,可以在服务器端的路由中用正则表达式截取;查询字符串(querystring),形如key1=value1&key2=value2;请求体(body)中发送的数据,比如表单数据、json、xml;在http报文的头(heade
- Python学习之路-数据库入门
geobuins
python学习数据库
Python学习之路-数据库入门简介数据库就是一种特殊的文件,其中存储着需要的数据。类型当前主要使用两种类型的数据库:关系型数据库、非关系型数据库,本篇主要讨论关系型数据库,对于非关系型数据库会在后面学习。所谓的关系型数据库RDBMS,是建立在关系模型基础上的数据库,借助于集合代数等数学概念和方法来处理数据库中的数据。关系型数据库的主要产品:oracle:在以前的大型项目中使用,银行,电信等项目m
- Python学习之路-Python操作MySQL
geobuins
python学习mysql
Python学习之路-Python操作MySQL简介PyMySQLPyMySQL是在Python3.x版本中用于连接MySQL服务器的一个库,PyMySQL遵循Python数据库APIv2.0规范,并包含了pure-PythonMySQL客户端库。安装pipinstallpymsql连接通过Connection对象与数据库建立连接frompymysqlimportconnectconn=conne
- Python学习之路-MySQL进阶
geobuins
python学习mysql
Python学习之路-MySQL进阶视图前言对于复杂的查询,往往是有多个数据表进行关联查询而得到,如果数据库因为需求等原因发生了改变,为了保证查询出来的数据与之前相同,则需要在多个地方进行修改,维护起来非常麻烦。可以通过定义视图来解决简介通俗的讲,视图就是一条SELECT语句执行后返回的结果集。所以我们在创建视图的时候,主要的工作就落在创建这条SQL查询语句上。视图是对若干张基本表的引用,一张虚表
- Python学习之路-正则表达式
geobuins
python学习正则表达式
Python学习之路-正则表达式简介正则表达式是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索、替换那些匹配某个模式的文本。RE模块在Python中需要通过正则表达式对字符串进行匹配的时候,可以使用一个模块:re语法#导入re模块importre#使用match方法进行匹配操作result=re.match("
- Python学习之路——异常捕获
墨白001
Python零基础学习之路学习python开发语言
一、什么是异常当检测到一个错误时,Python解释器就无法继续执行了,反而出现了一些错误的提示,这就是所谓的“异常”,也就是bug二、异常的捕获方法当我们的程序遇到bug,那么就下来有两种情况①整个程序因为一个bug停止运行②对bug进行提示,整个程序继续运行捕获异常的作用在于:提前假设某处会出现异常,做好提前准备,当真的出现异常的时候,可以有后续手段。1、捕获常规异常(一)基本语法try:可能发
- Python学习之路-注释
geobuins
学习
Python学习之路-注释将注释放在Python语法前面足以提现它的重要性。注释的作用一个好的程序中注释是不可缺失的一环。在程序中对某些代码进行标注说明,可以增强程序的可读性。在团队协同开发中,良好的注释可以提高开发效率。什么时候需要使用注释?注释不是越多越好,对于一目了然的代码,不需要添加注释对于复杂的操作,应该在操作开始前写上思路的注释对于不是一目了然的代码,应在其行尾添加注释(为了提高可读性
- Python学习之路-语法
geobuins
python学习开发语言
Python学习之路-语法简介Python的设计目标之一是让代码具备高度的可阅读性。在设计时尽量使用经常使用的标点符号和英文单字,让代码看起来整洁美观。缩进在Python中缩进表示语句块的开始和结束,作用等同于Java、Go中的大括号。增加缩进表示语句块的开始,而减少缩进则表示语句块的结束。缩进成为了语法的一部分,违反了“缩进规则”的程序不能通过解释器解释。{{}}根据PEP8的规定,使用4个空格
- Python学习之路-常量与变量
geobuins
python学习开发语言
Python学习之路-常量与变量程序就是用来处理数据的,而常量和变量就是最简单用来存储数据的常量定义声明在文件的顶部命名规范全部大写单词间用下划线分隔变量定义变量在使用前都必须要要进行赋值,只有被赋值后变量才会被创建命名规范一般情况当变量名需要由二个或多个单词组成时,每个单词都使用小写字母单词与单词之间使用_下划线连接驼峰命名法当变量名是由二个或多个单词组成时,还可以利用驼峰命名法来命名小驼峰式命
- Python学习之路-运算符
geobuins
学习
Python学习之路-运算符简介上一篇讲到Python中的语句提到很多运算符,本篇来总结一下各类运算符的作用与用法。算数运算符运算符描述实例+加1+1=2-减1-1=0*乘1*1=1**幂次方2**3=8/除2/1=2//取整5//2=2%取余5%2=1{{}}在Python中*运算符还可以用于字符串,计算结果就是字符串重复指定次数的结果{{}}比较运算符运算符描述==比较两个数据的值是否相等,如
- Python学习之路——文件部分【书接上回】
墨白001
Python零基础学习之路学习python开发语言
一、书接上回上个博客我说过,为什么最开始的时候一定要将文件内的中文的逗号替换为英文的逗号,接下来,请看(其实想一想,感觉没必要,不过也是好的,总要练练手的嘛)deffunc03(str):#先拿到文件的内容fr=open(str,'r',encoding='utf-8')fr_content=fr.read()print(fr_content)fr_now_content=fr_content.r
- Python学习之路——文件操作【综合案例】
墨白001
Python零基础学习之路学习python开发语言
创建employeeData文件,文件内容包含现要求如下:对正式工以及实习生的信息分别创建文件和intern进行备份具体操作如下:由于文档内存在中文的逗号,先将其替换为英文的逗号deffunc01(str):fr=open(str,'r',encoding='utf-8')file_str=fr.read()print(file_str)new_file_str=file_str.replace(
- Python学习之路——数据容器部分【列表(list)】
墨白001
Python零基础学习之路学习python开发语言
一、什么是数据容器呢(一)分类二、列表(一)定义(二)嵌套列表的定义(三)列表的下表索引(四)反向列表(五)嵌套列表(六)列表的常用操作1、方法总览(七)遍历列表1、while循环和for循环的区别2、练习案例三、总的来说一、什么是数据容器呢一种可以容纳多份数据的数据容器,容纳的每一份数据称之为一个元素,每一个元素,可以是任意类型的数据,如:字符串,数字,布尔等等。(一)分类数据容器根据特点的不同
- Python学习之路——数据容器部分【字典(dict)】
墨白001
Python零基础学习之路python学习开发语言
目录一、定义(一)代码示例二、字典数据的获取三、嵌套字典的定义(一)需求(二)框架(三)代码四、字典的常用操作(一)功能总览(二)代码示例(三)练习案例1、创建商品信息字典2、遍历判断是否符合条件3、整体代码五、总的来说(一)字典的创建:(二)字典的访问:(三)字典的修改:(四)字典的遍历:一、定义Python字典是一种键值对集合,用于存储和检索数据。他是一个无序的键值对集合,其中键是唯一的,值可
- 解读Servlet原理篇二---GenericServlet与HttpServlet
周凡杨
javaHttpServlet源理GenericService源码
在上一篇《解读Servlet原理篇一》中提到,要实现javax.servlet.Servlet接口(即写自己的Servlet应用),你可以写一个继承自javax.servlet.GenericServletr的generic Servlet ,也可以写一个继承自java.servlet.http.HttpServlet的HTTP Servlet(这就是为什么我们自定义的Servlet通常是exte
- MySQL性能优化
bijian1013
数据库mysql
性能优化是通过某些有效的方法来提高MySQL的运行速度,减少占用的磁盘空间。性能优化包含很多方面,例如优化查询速度,优化更新速度和优化MySQL服务器等。本文介绍方法的主要有:
a.优化查询
b.优化数据库结构
- ThreadPool定时重试
dai_lm
javaThreadPoolthreadtimertimertask
项目需要当某事件触发时,执行http请求任务,失败时需要有重试机制,并根据失败次数的增加,重试间隔也相应增加,任务可能并发。
由于是耗时任务,首先考虑的就是用线程来实现,并且为了节约资源,因而选择线程池。
为了解决不定间隔的重试,选择Timer和TimerTask来完成
package threadpool;
public class ThreadPoolTest {
- Oracle 查看数据库的连接情况
周凡杨
sqloracle 连接
首先要说的是,不同版本数据库提供的系统表会有不同,你可以根据数据字典查看该版本数据库所提供的表。
select * from dict where table_name like '%SESSION%';
就可以查出一些表,然后根据这些表就可以获得会话信息
select sid,serial#,status,username,schemaname,osuser,terminal,ma
- 类的继承
朱辉辉33
java
类的继承可以提高代码的重用行,减少冗余代码;还能提高代码的扩展性。Java继承的关键字是extends
格式:public class 类名(子类)extends 类名(父类){ }
子类可以继承到父类所有的属性和普通方法,但不能继承构造方法。且子类可以直接使用父类的public和
protected属性,但要使用private属性仍需通过调用。
子类的方法可以重写,但必须和父类的返回值类
- android 悬浮窗特效
肆无忌惮_
android
最近在开发项目的时候需要做一个悬浮层的动画,类似于支付宝掉钱动画。但是区别在于,需求是浮出一个窗口,之后边缩放边位移至屏幕右下角标签处。效果图如下:
一开始考虑用自定义View来做。后来发现开线程让其移动很卡,ListView+动画也没法精确定位到目标点。
后来想利用Dialog的dismiss动画来完成。
自定义一个Dialog后,在styl
- hadoop伪分布式搭建
林鹤霄
hadoop
要修改4个文件 1: vim hadoop-env.sh 第九行 2: vim core-site.xml <configuration> &n
- gdb调试命令
aigo
gdb
原文:http://blog.csdn.net/hanchaoman/article/details/5517362
一、GDB常用命令简介
r run 运行.程序还没有运行前使用 c cuntinue 
- Socket编程的HelloWorld实例
alleni123
socket
public class Client
{
public static void main(String[] args)
{
Client c=new Client();
c.receiveMessage();
}
public void receiveMessage(){
Socket s=null;
BufferedRea
- 线程同步和异步
百合不是茶
线程同步异步
多线程和同步 : 如进程、线程同步,可理解为进程或线程A和B一块配合,A执行到一定程度时要依靠B的某个结果,于是停下来,示意B运行;B依言执行,再将结果给A;A再继续操作。 所谓同步,就是在发出一个功能调用时,在没有得到结果之前,该调用就不返回,同时其它线程也不能调用这个方法
多线程和异步:多线程可以做不同的事情,涉及到线程通知
&
- JSP中文乱码分析
bijian1013
javajsp中文乱码
在JSP的开发过程中,经常出现中文乱码的问题。
首先了解一下Java中文问题的由来:
Java的内核和class文件是基于unicode的,这使Java程序具有良好的跨平台性,但也带来了一些中文乱码问题的麻烦。原因主要有两方面,
- js实现页面跳转重定向的几种方式
bijian1013
JavaScript重定向
js实现页面跳转重定向有如下几种方式:
一.window.location.href
<script language="javascript"type="text/javascript">
window.location.href="http://www.baidu.c
- 【Struts2三】Struts2 Action转发类型
bit1129
struts2
在【Struts2一】 Struts Hello World http://bit1129.iteye.com/blog/2109365中配置了一个简单的Action,配置如下
<!DOCTYPE struts PUBLIC
"-//Apache Software Foundation//DTD Struts Configurat
- 【HBase十一】Java API操作HBase
bit1129
hbase
Admin类的主要方法注释:
1. 创建表
/**
* Creates a new table. Synchronous operation.
*
* @param desc table descriptor for table
* @throws IllegalArgumentException if the table name is res
- nginx gzip
ronin47
nginx gzip
Nginx GZip 压缩
Nginx GZip 模块文档详见:http://wiki.nginx.org/HttpGzipModule
常用配置片段如下:
gzip on; gzip_comp_level 2; # 压缩比例,比例越大,压缩时间越长。默认是1 gzip_types text/css text/javascript; # 哪些文件可以被压缩 gzip_disable &q
- java-7.微软亚院之编程判断俩个链表是否相交 给出俩个单向链表的头指针,比如 h1 , h2 ,判断这俩个链表是否相交
bylijinnan
java
public class LinkListTest {
/**
* we deal with two main missions:
*
* A.
* 1.we create two joined-List(both have no loop)
* 2.whether list1 and list2 join
* 3.print the join
- Spring源码学习-JdbcTemplate batchUpdate批量操作
bylijinnan
javaspring
Spring JdbcTemplate的batch操作最后还是利用了JDBC提供的方法,Spring只是做了一下改造和封装
JDBC的batch操作:
String sql = "INSERT INTO CUSTOMER " +
"(CUST_ID, NAME, AGE) VALUES (?, ?, ?)";
- [JWFD开源工作流]大规模拓扑矩阵存储结构最新进展
comsci
工作流
生成和创建类已经完成,构造一个100万个元素的矩阵模型,存储空间只有11M大,请大家参考我在博客园上面的文档"构造下一代工作流存储结构的尝试",更加相信的设计和代码将陆续推出.........
竞争对手的能力也很强.......,我相信..你们一定能够先于我们推出大规模拓扑扫描和分析系统的....
- base64编码和url编码
cuityang
base64url
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.io.PrintWriter;
import java.io.StringWriter;
import java.io.UnsupportedEncodingException;
- web应用集群Session保持
dalan_123
session
关于使用 memcached 或redis 存储 session ,以及使用 terracotta 服务器共享。建议使用 redis,不仅仅因为它可以将缓存的内容持久化,还因为它支持的单个对象比较大,而且数据类型丰富,不只是缓存 session,还可以做其他用途,一举几得啊。1、使用 filter 方法存储这种方法比较推荐,因为它的服务器使用范围比较多,不仅限于tomcat ,而且实现的原理比较简
- Yii 框架里数据库操作详解-[增加、查询、更新、删除的方法 'AR模式']
dcj3sjt126com
数据库
public function getMinLimit () { $sql = "..."; $result = yii::app()->db->createCo
- solr StatsComponent(聚合统计)
eksliang
solr聚合查询solr stats
StatsComponent
转载请出自出处:http://eksliang.iteye.com/blog/2169134
http://eksliang.iteye.com/ 一、概述
Solr可以利用StatsComponent 实现数据库的聚合统计查询,也就是min、max、avg、count、sum的功能
二、参数
- 百度一道面试题
greemranqq
位运算百度面试寻找奇数算法bitmap 算法
那天看朋友提了一个百度面试的题目:怎么找出{1,1,2,3,3,4,4,4,5,5,5,5} 找出出现次数为奇数的数字.
我这里复制的是原话,当然顺序是不一定的,很多拿到题目第一反应就是用map,当然可以解决,但是效率不高。
还有人觉得应该用算法xxx,我是没想到用啥算法好...!
还有觉得应该先排序...
还有觉
- Spring之在开发中使用SpringJDBC
ihuning
spring
在实际开发中使用SpringJDBC有两种方式:
1. 在Dao中添加属性JdbcTemplate并用Spring注入;
JdbcTemplate类被设计成为线程安全的,所以可以在IOC 容器中声明它的单个实例,并将这个实例注入到所有的 DAO 实例中。JdbcTemplate也利用了Java 1.5 的特定(自动装箱,泛型,可变长度
- JSON API 1.0 核心开发者自述 | 你所不知道的那些技术细节
justjavac
json
2013年5月,Yehuda Katz 完成了JSON API(英文,中文) 技术规范的初稿。事情就发生在 RailsConf 之后,在那次会议上他和 Steve Klabnik 就 JSON 雏形的技术细节相聊甚欢。在沟通单一 Rails 服务器库—— ActiveModel::Serializers 和单一 JavaScript 客户端库——&
- 网站项目建设流程概述
macroli
工作
一.概念
网站项目管理就是根据特定的规范、在预算范围内、按时完成的网站开发任务。
二.需求分析
项目立项
我们接到客户的业务咨询,经过双方不断的接洽和了解,并通过基本的可行性讨论够,初步达成制作协议,这时就需要将项目立项。较好的做法是成立一个专门的项目小组,小组成员包括:项目经理,网页设计,程序员,测试员,编辑/文档等必须人员。项目实行项目经理制。
客户的需求说明书
第一步是需
- AngularJs 三目运算 表达式判断
qiaolevip
每天进步一点点学习永无止境众观千象AngularJS
事件回顾:由于需要修改同一个模板,里面包含2个不同的内容,第一个里面使用的时间差和第二个里面名称不一样,其他过滤器,内容都大同小异。希望杜绝If这样比较傻的来判断if-show or not,继续追究其源码。
var b = "{{",
a = "}}";
this.startSymbol = function(a) {
- Spark算子:统计RDD分区中的元素及数量
superlxw1234
sparkspark算子Spark RDD分区元素
关键字:Spark算子、Spark RDD分区、Spark RDD分区元素数量
Spark RDD是被分区的,在生成RDD时候,一般可以指定分区的数量,如果不指定分区数量,当RDD从集合创建时候,则默认为该程序所分配到的资源的CPU核数,如果是从HDFS文件创建,默认为文件的Block数。
可以利用RDD的mapPartitionsWithInd
- Spring 3.2.x将于2016年12月31日停止支持
wiselyman
Spring 3
Spring 团队公布在2016年12月31日停止对Spring Framework 3.2.x(包含tomcat 6.x)的支持。在此之前spring团队将持续发布3.2.x的维护版本。
请大家及时准备及时升级到Spring
- fis纯前端解决方案fis-pure
zccst
JavaScript
作者:zccst
FIS通过插件扩展可以完美的支持模块化的前端开发方案,我们通过FIS的二次封装能力,封装了一个功能完备的纯前端模块化方案pure。
1,fis-pure的安装
$ fis install -g fis-pure
$ pure -v
0.1.4
2,下载demo到本地
git clone https://github.com/hefangshi/f