- Python爬虫实战
weixin_34007879
爬虫jsonjava
引言网络爬虫是抓取互联网信息的利器,成熟的开源爬虫框架主要集中于两种语言Java和Python。主流的开源爬虫框架包括:1.分布式爬虫框架:Nutch2.Java单机爬虫框架:Crawler4j,WebMagic,WebCollector、Heritrix3.python单机爬虫框架:scrapy、pyspiderNutch是专为搜索引擎设计的的分布式开源框架,上手难度高,开发复杂,基本无法满足快
- 开发网络爬虫应该怎样选择爬虫框架
chunjiushi9898
爬虫java大数据
有些人问,开发网络爬虫应该选择Nutch、Crawler4j、WebMagic、scrapy、WebCollector还是其他的?这里按照我的经验随便扯淡一下:上面说的爬虫,基本可以分3类:1.分布式爬虫:Nutch2.JAVA单机爬虫:Crawler4j、WebMagic、WebCollector3.非JAVA单机爬虫:scrapy第一类:分布式爬虫爬虫使用分布式,主要是解决两个问题:1)海量U
- Go colly爬虫框架精简高效【杠杠的】入门到精通
small_to_large
Golanggolang爬虫colly
1前言1.1GoColly爬虫介绍爬虫框架中,各中流行的编程语言都有自己热门框架,python中的selenium、Scrapy、PySpider等,Java中的Nutch、Crawler4j、WebMagic、WebCollector等。golang中colly使用Go语言编写的功能强大的爬虫框架,api简洁、性能强大、并发性高,githubstar接近20K。1.2安装goinitcolly.
- 使用java爬虫WebCollector+jsoup抓取商品分类图标
柠檬冰块
背景介绍:场景是,有京东三级分类名称,没有对应图标,需要根据京东三级分类名称,获取分类名称匹配的图片,来作为商品分类图标技术选型:WebCollector+jsoup,WebCollector进行爬取,jsoup进行html解析实现步骤:1.根据根url发起请求,2.得到响应页面数据,3.对页面数据进行解析,并提取4.对图片进行下载持久化代码实现1.相关包结构说明2.代码实例links.java类
- 商品评论获取与词云图可视化分析
不是祸津神的夜斗
mapreducehivepython
商品评论获取解析与可视化词云图制作本篇文章主要介绍如何手写爬虫爬取电商平台评论数据,以及对爬取到的内容进行解析,导入mysql数据库并进行词频统计,可视化制作词云图。涉及的技术点如下:电商网站页面分析python简单爬虫java语言的webCollector爬虫框架使用python与java分别进行json文件解析,其中java解析结合mapreducepymysql操作mysql数据库实现爬取数
- java之网络爬虫介绍(非原创)
故事爱人c
文章大纲一、网络爬虫基本介绍二、java常见爬虫框架介绍三、WebCollector实战四、项目源码下载五、参考文章一、网络爬虫基本介绍1.什么是网络爬虫 网络爬虫(又被称为网页蜘蛛,网络机器人,在社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。2.常见问题介绍爬虫可以爬取ajax信息么?
- Java开源爬虫框架WebCollector图片抓取教程
CJX_Venus
网站中的图片和网页在本质上是相同的,图片和网页的获取本质上都是根据URL从网站中获取网页/图片的字节数组(byte[]),浏览器会根据http响应头中的content-type信息来决定以网页还是图片的形式来展示资源。爬取图的效果图如下:实现的代码如下:packageimageDownload;importjava.io.File;importjava.io.FileNotFoundExcepti
- 爬虫初探(一)crawler4j的robots
weixin_34123613
2019独角兽企业重金招聘Python工程师标准>>>最近刚刚开始研究爬虫,身为小白的我不知道应该从何处下手,网上查了查,发现主要的开源java爬虫有nutchapache/nutch·GitHub,Heritrixinternetarchive/heritrix3·GitHub和Crawler4jyasserg/crawler4j·GitHub,还有WebCollectorCrawlScript
- 基于Crawler4j + jsoup实现爬虫
苏州-微尘
Java相关
爬虫框架分类1.分布式爬虫Nutch2.Java单机爬虫Crawler4j、WebMagic、WebCollector3.非Java单机爬虫Scrapy开发思路根据业务需求选择合适的爬虫框架根据网站规则及业务需求抽取数据,保存到中间库数据清洗/格式化,保存到目标库基于Crawler4j+jsoup实现爬虫用Crawler4j构建多线程的web爬虫来抓取页面内容。Crawler4j的使用分为两个步骤
- WebCollector java.lang.NoClassDefFoundError: org/openqa/selenium/htmlunit/HtmlUnitDriver 问题解决方案
Nucky_
CrawlerWebCollectorselenium
最近在做一个项目参加比赛,需要截取很多数据,意外找到了一个程序叫webcollector然而在使用的时候出了一个问题java.lang.NoClassDefFoundError:org/openqa/selenium/htmlunit/HtmlUnitDriver不停得提示这个,在网上找了很久没发现解决方案不想草草了之,google了NoClassDefFoundError,发现可能是classp
- JAVA开源爬虫 WebMagic 与 WebCollector 之间比较
想改名的小雄鹿
NLP爬虫Java调研
WebMagic与WebCollector比较一、架构Webcollector图片来自官方文档WebMagic二、维护者WebMegic:董亿华,前点评工程师,现自主创业WebCollector::合肥工业大学DMIC三、最近更新时间(截止至2018.4.8)WebMegic:2017.12WebCollector:2018.3四、活跃度(以github上issuse数目评价,截止至2018.4.
- 网页正文提取+HMM命名实体识别+CRF命名实体识别
林林剑
推荐一篇博客:http://blog.csdn.net/AJAXHu/article/details/48382381开源的WebCollector爬虫确实很好用,并且提供了网页正文提取的模块。提供了图形界面的简单配置,Log也比较全面,WebCollector-Hadoop是WebCollector的分布式版本。对比自己一直使用的Scrapy-redis,感觉WebCollector更适合工业生
- webcollector爬虫demo
盟易
爬虫学习java爬虫webcollector
由于我们公司第二季度亏了7-8亿,所以项目组没有多余的资金让我们去正规渠道买数据。然后我就走向了一天爬虫的不归路。其实Java爬虫有很多开源的框架,这边我选择的是webcollector这个中小型的框架(官网:https://github.com/CrawlScript/WebCollector,教程文档:http://datahref.com/archives/category/webcolle
- 多线程爬虫去重问题
xiaocxyczh
大数据
最近无聊做了一个小爬虫项目,用的是WebCollector框架,比较好上手。但爬取数据后发现有许多重复的,测试了一下是多线程的问题,一开始想到的是在插入MongoDB前判断是否有相同数据存在,但可想而知多线程出现的是问题解决不了的而且效率也很低,然后想到了用CurrentHashMap去重,搞定首先新建全局属性:publicstaticConcurrentHashMapconcurrenthash
- Java爬虫-WebCollector爬虫Demo微讲解
艾V古斯
Java爬虫-WebCollector爬虫Demo微讲解工作三年,第一次有时间并且有兴致写博客,文笔可能不太好并且个人是个青铜级别开发,有错误的地方请及时帮忙纠正一下,谢谢。首先贴个WebCollector的开源地址:链接:https://github.com/CrawlScript/WebCollector.关于WebCollector,我就不多做介绍了,百度一大堆,下面推荐一下写的比较全的:链
- SpringBoot整合WebCollector,写入数据库
艾V古斯
SpringBoot整合WebCollector,写入数据库很久不见,我又回来了!大家有没有想过,当爬虫和网页结合会是怎么样?当爬虫普及,每个人都可以自己去爬的时候会是怎么样?之前,我在百度找了一下,发现了一个八爪鱼的爬虫应用,玩了一下,发现它的思想不错,可以说是全民都会爬虫的概念,可惜的是它是收费的。?SpringBoot整合Mybatis搭建目前SpringBoot已经众所周知了,开箱即用的功
- 如何从网站爬取图片?
CSDNRGY
java爬虫
工具WebCollector:https://www.oschina.net/p/webcollector概述突然想把xx网站的图片下载下来,但是一张一张的去另存为很是不爽,于是乎上网找了一个java爬虫。上面链接里面的爬虫文档写的已经非常详细了。我在这里面就简单的说下:打开上面的链接,搜索【WebCollector图片抓取教程】,打开链接后,你会发现有非常详细的教程。核心语法//添加种子URLd
- 使用htmlparser爬虫技术爬取电影网页的全部下载链接
dengzi2536
爬虫git开发工具
使用htmlparser爬虫技术爬取电影网页的全部下载链接昨天,我们利用webcollector爬虫技术爬取了网易云音乐17万多首歌曲,而且还包括付费的在内,如果时间允许的话,可以获取更多的音乐下来,当然,也有小伙伴留言说这样会降低国人的知识产权保护意识,诚然,我们的重点在于如何灵活运用我们已学的技术,这就需要我们不断的练习,不停的思索和深入发掘,在了解了精髓和意义之后运用到实践中才是技术的最高境
- 开源爬虫框架各有什么优缺点?
zyj8170
爬虫教程
开发网络爬虫应该选择Nutch、Crawler4j、WebMagic、scrapy、WebCollector还是其他的?这里按照我的经验随便扯淡一下:上面说的爬虫,基本可以分3类:1.分布式爬虫:Nutch2.JAVA单机爬虫:Crawler4j、WebMagic、WebCollector3.非JAVA单机爬虫:scrapy、pyspiderhttp://www.pyspider.cn/book/
- 用WebCollector 2.x爬取新浪微博(无需手动获取cookie)
lifaming15
用WebCollector2.x配合另一个项目WeiboHelper,就可以直接爬取新浪微博的数据(无需手动获取cookie)1.导入WebCollector2.x和WeiboHelper的所有jar包两个项目的地址:http://git.oschina.net/webcollector/WebCollectorhttp://git.oschina.net/webcollector/WeiboHe
- 开源爬虫框架各有什么优缺点?
蛋蛋说
作者:老夏开发网络爬虫应该选择Nutch、Crawler4j、WebMagic、scrapy、WebCollector还是其他的?这里按照我的经验随便扯淡一下:上面说的爬虫,基本可以分3类:1.分布式爬虫:Nutch2.JAVA单机爬虫:Crawler4j、WebMagic、WebCollector3.非JAVA单机爬虫:scrapyPython爬虫的工具列表附Github代码下载链接33款可用来
- 开源爬虫框架各有什么优缺点
嘟哒
大数据
开源爬虫框架各有什么优缺点?作者:老夏开发网络爬虫应该选择Nutch、Crawler4j、WebMagic、scrapy、WebCollector还是其他的?这里按照我的经验随便扯淡一下:上面说的爬虫,基本可以分3类:1.分布式爬虫:Nutch2.Java单机爬虫:Crawler4j、WebMagic、WebCollector3.非JAVA单机爬虫:scrapy第一类:分布式爬虫爬虫使用分布式,主
- 网络爬虫爬取数据 本地数据库储存 远程api分析 模型
Wheeehan
序言20161119写本次项目工程:第一部分:https://github.com/RenjiaLu9527/WebMagic_test-20161119—mysq第二部分:https://github.com/RenjiaLu9527/JFreeChart-20161119/相关博客、论坛网站链接如下WebMagic简单灵活的爬虫框架。http://webmagic.ioWebCollector
- java爬虫框架Webcontroller
我是小袋子
git地址:https://github.com/CrawlScript/WebCollector业务需要爬取一个网站所有手机信息,最开始用了crawler4j这个框架,挺简单的,但是发现不能满足我的需求;只支持单页面信息抓取,但是我是要多页面抓取;需要在一级页面抓取到所有的二级页面的链接,再加入所有二级页面的链接,进行抓取所有三级页面的信息;后来改成了webcontroller,发现可以实现我的
- java之网络爬虫介绍
编程鸭
互联网编程语言软件开发Java开发
文章大纲一、网络爬虫基本介绍二、java常见爬虫框架介绍三、WebCollector实战四、项目源码下载五、参考文章一、网络爬虫基本介绍1.什么是网络爬虫 网络爬虫(又被称为网页蜘蛛,网络机器人,在社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。2.常见问题介绍爬虫可以爬取ajax信息么?
- Java之网络爬虫WebCollector+selenium+phantomjs(二)
oSayMissyou0
心情随笔
上一篇做小例子的时候,在获取页面上价格的时候发现,获取不到,查了下说是webcollector需要结合selenium与phantomjs来获取js生成的动态。下面就做个例子来学习。准备材料在上一篇已经准备完毕,我是在windows系统上进行的测试,所以phantomjs运行环境下载phantomjs-windows下载即可,下载后解压到某个文件夹即可(可以把解压路径添加到环境变量里,如果没有加到
- java常用的爬虫框架
cui_yonghua
爬虫总结和详解
目前主流的Java爬虫框架主要有Nutch、Crawler4j、WebMagic、WebCollector等。1.分布式爬虫:Nutchgithub地址:https://github.com/andrewcao95/nutch-crawlerNutch是apache旗下的一个用Java实现的开源索引引擎项目,通过nutch,诞生了hadoop、tika、gora。Nutch的设计初衷主要是为了解决
- Webcollector 判定爬虫结束
努力加载中
爬虫
本人使用的版本是webcollector-2.40-beta-bin下载地址↓↓↓↓↓↓↓↓WebCollector爬虫官网:https://github.com/CrawlScript/WebCollector国内镜像:http://git.oschina.net/webcollector/WebCollector使用教程:http://blog.csdn.net/ajaxhu/article/
- 推荐十个优秀的Java开源爬虫
zsuxiong
1:JAVA爬虫WebCollectorStar:1345下载地址:http://www.17ky.net/soft/9278.html爬虫简介:WebCollector是一个无须配置、便于二次开发的JAVA爬虫框架(内核),它提供精简的的API,只需少量代码即可实现一个功能强大的爬虫。WebCollector-Hadoop是WebCollector的Hadoop版本,支持分布式爬取。爬虫内核:W
- 使用webcollector爬虫技术获取网易云音乐全部歌曲
dengzi2536
使用webcollector爬虫技术获取网易云音乐全部歌曲最近在知乎上看到一个话题,说使用爬虫技术获取网易云音乐上的歌曲,甚至还包括付费的歌曲,哥瞬间心动了,这年头,好听的流行音乐或者经典老歌都开始收费了,只能听不能下载,着实很郁闷,现在机会来了,于是开始研究爬虫技术,翻阅各种资料,最终选择网友们一致认为比较好用的webcollector框架来实现。首先,我们来认识一下webcollector,w
- 统一思想认识
永夜-极光
思想
1.统一思想认识的基础,才能有的放矢
原因:
总有一种描述事物的方式最贴近本质,最容易让人理解.
如何让教育更轻松,在于找到最适合学生的方式.
难点在于,如何模拟对方的思维基础选择合适的方式. &
- Joda Time使用笔记
bylijinnan
javajoda time
Joda Time的介绍可以参考这篇文章:
http://www.ibm.com/developerworks/cn/java/j-jodatime.html
工作中也常常用到Joda Time,为了避免每次使用都查API,记录一下常用的用法:
/**
* DateTime变化(增减)
*/
@Tes
- FileUtils API
eksliang
FileUtilsFileUtils API
转载请出自出处:http://eksliang.iteye.com/blog/2217374 一、概述
这是一个Java操作文件的常用库,是Apache对java的IO包的封装,这里面有两个非常核心的类FilenameUtils跟FileUtils,其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装,开发中对文件的操作,几乎都可以在这个框架里面找到。 非常的好用。
- 各种新兴技术
不懂事的小屁孩
技术
1:gradle Gradle 是以 Groovy 语言为基础,面向Java应用为主。基于DSL(领域特定语言)语法的自动化构建工具。
现在构建系统常用到maven工具,现在有更容易上手的gradle,
搭建java环境:
http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/
搭建android环境:
http://m
- tomcat6的https双向认证
酷的飞上天空
tomcat6
1.生成服务器端证书
keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
- 托管虚拟桌面市场势不可挡
蓝儿唯美
用户还需要冗余的数据中心,dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台,提供服务或者MSP也可以自己来控制。
在某些情况下,MSP会在dinCloud的云服务上进行服务分层,如监控和补丁管理。
MSP的利润空间将根据其参与的程度而有所不同,Din说。
“我们有一些合作伙伴负责将我们推荐给客户作为个
- spring学习——xml文件的配置
a-john
spring
在Spring的学习中,对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中,采用XML配置也是最常见的。以下是一个简单的XML配置文件:
<?xml version="1.0" encoding="UTF-8"?>
<beans xmlns="http://www.springframework.or
- HDU 4342 History repeat itself 模拟
aijuans
模拟
来源:http://acm.hdu.edu.cn/showproblem.php?pid=4342
题意:首先让求第几个非平方数,然后求从1到该数之间的每个sqrt(i)的下取整的和。
思路:一个简单的模拟题目,但是由于数据范围大,需要用__int64。我们可以首先把平方数筛选出来,假如让求第n个非平方数的话,看n前面有多少个平方数,假设有x个,则第n个非平方数就是n+x。注意两种特殊情况,即
- java中最常用jar包的用途
asia007
java
java中最常用jar包的用途
jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口,提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法,以及接收和处理SOAP错误的方法. w
- ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法
百合不是茶
jsjson编码返回异常
一:ajax获取自定义Struts框架中的json编码 出现以下 问题:
1,强制flush输出 json编码打印在首页
2, 不强制flush js会解析json 打印出来的是错误的jsp页面 却没有跳转到错误页面
3, ajax中的dataType的json 改为text 会
- JUnit使用的设计模式
bijian1013
java设计模式JUnit
JUnit源代码涉及使用了大量设计模式
1、模板方法模式(Template Method)
定义一个操作中的算法骨架,而将一些步骤延伸到子类中去,使得子类可以不改变一个算法的结构,即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构,也就是步骤,而步骤的实现可以在子类中完成。
 
- Linux常用命令(摘录)
sunjing
crondchkconfig
chkconfig --list 查看linux所有服务
chkconfig --add servicename 添加linux服务
netstat -apn | grep 8080 查看端口占用
env 查看所有环境变量
echo $JAVA_HOME 查看JAVA_HOME环境变量
安装编译器
yum install -y gcc
- 【Hadoop一】Hadoop伪集群环境搭建
bit1129
hadoop
结合网上多份文档,不断反复的修正hadoop启动和运行过程中出现的问题,终于把Hadoop2.5.2伪分布式安装起来,跑通了wordcount例子。Hadoop的安装复杂性的体现之一是,Hadoop的安装文档非常多,但是能一个文档走下来的少之又少,尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布,但是它的配置跟2.5.0,2.5.1没有分别。 &nb
- Anychart图表系列五之事件监听
白糖_
chart
创建图表事件监听非常简单:首先是通过addEventListener('监听类型',js监听方法)添加事件监听,然后在js监听方法中定义具体监听逻辑。
以钻取操作为例,当用户点击图表某一个point的时候弹出point的name和value,代码如下:
<script>
//创建AnyChart
var chart = new AnyChart();
//添加钻取操作&quo
- Web前端相关段子
braveCS
web前端
Web标准:结构、样式和行为分离
使用语义化标签
0)标签的语义:使用有良好语义的标签,能够很好地实现自我解释,方便搜索引擎理解网页结构,抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容,具有很好的可读性,从而实现对特殊终端的兼容。
1)div和span是没有语义的:只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时,才会适当添加div
- 编程之美-24点游戏
bylijinnan
编程之美
import java.util.ArrayList;
import java.util.Arrays;
import java.util.HashSet;
import java.util.List;
import java.util.Random;
import java.util.Set;
public class PointGame {
/**编程之美
- 主页面子页面传值总结
chengxuyuancsdn
总结
1、showModalDialog
returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值
主界面
var sonValue=window.showModalDialog("son.jsp");
子界面
window.retu
- [网络与经济]互联网+的含义
comsci
互联网+
互联网+后面是一个人的名字 = 网络控制系统
互联网+你的名字 = 网络个人数据库
每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
- oracle 创建视图 with check option
daizj
视图vieworalce
我们来看下面的例子:
create or replace view testview
as
select empno,ename from emp where ename like ‘M%’
with check option;
这里我们创建了一个视图,并使用了with check option来限制了视图。 然后我们来看一下视图包含的结果:
select * from testv
- ToastPlugin插件在cordova3.3下使用
dibov
Cordova
自己开发的Todos应用,想实现“
再按一次返回键退出程序 ”的功能,采用网上的ToastPlugins插件,发现代码或文章基本都是老版本,运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。
ToastPlugin.java
package&nbs
- C语言22个系统函数
dcj3sjt126com
cfunction
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分(尾数)x和 以2位的指数部分n,即num=x*2n,指数n存放在exp指向的变量中,返回x。D
- 开发一个类的流程
dcj3sjt126com
开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件,并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库,供以后复用。
以下是开发流程:
1. 明确类的功能,抽象出类的大概结构
2. 初步设想类的接口
3. 类名设计(驼峰式命名)
4. 属性设置(权限设置)
判断某些变量是否有必要作为成员属
- java 并发
shuizhaosi888
java 并发
能够写出高伸缩性的并发是一门艺术
在JAVA SE5中新增了3个包
java.util.concurrent
java.util.concurrent.atomic
java.util.concurrent.locks
在java的内存模型中,类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享,局部变量与方法参数都是线程私有的,不会被共享。
- Spring Security(11)——匿名认证
234390216
Spring SecurityROLE_ANNOYMOUS匿名
匿名认证
目录
1.1 配置
1.2 AuthenticationTrustResolver
对于匿名访问的用户,Spring Security支持为其建立一个匿名的AnonymousAuthenticat
- NODEJS项目实践0.2[ express,ajax通信...]
逐行分析JS源代码
Ajaxnodejsexpress
一、前言
通过上节学习,我们已经 ubuntu系统搭建了一个可以访问的nodejs系统,并做了nginx转发。本节原要做web端服务 及 mongodb的存取,但写着写着,web端就
- 在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值
lhbthanks
javahtmlstrutscheckbox
第一种方法:获取结果String类型
在 Action 中获得的是一个 String 型数据,每一个被选中的 checkbox 的 value 被拼接在一起,每个值之间以逗号隔开(,)。
所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。
以下是实现的代码:
前台 HTML 代码:
- 003.Kafka基本概念
nweiren
hadoopkafka
Kafka基本概念:Topic、Partition、Message、Producer、Broker、Consumer。 Topic: 消息源(Message)的分类。 Partition: Topic物理上的分组,一
- Linux环境下安装JDK
roadrunners
jdklinux
1、准备工作
创建JDK的安装目录:
mkdir -p /usr/java/
下载JDK,找到适合自己系统的JDK版本进行下载:
http://www.oracle.com/technetwork/java/javase/downloads/index.html
把JDK安装包下载到/usr/java/目录,然后进行解压:
tar -zxvf jre-7
- Linux忘记root密码的解决思路
tomcat_oracle
linux
1:使用同版本的linux启动系统,chroot到忘记密码的根分区passwd改密码 2:grub启动菜单中加入init=/bin/bash进入系统,不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 3: grub启动菜单中加入 single以单用户进入系统. 4:用以上方法mount到根分区把/etc/passwd中的root密码去除 例如: ro
- 跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现
xueyou
jsonpjquery框架UIhtml5
postMessage 是 HTML5 新方法,它可以实现跨域窗口之间通讯。到目前为止,只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持,而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样,前者是前端擅长跨域文档数据即时通讯,后者擅长针对跨域服务端数据通讯,p