隔壁老李头

Spark学习笔记2——RDD（上）

目录

Spark学习笔记2——RDD（上）
- RDD是什么？
  - 例子
- 创建 RDD
  - 并行化方式
  - 读取外部数据集方式
- RDD 操作
  - 转化操作
  - 行动操作
- 惰性求值

Spark学习笔记2——RDD（上）

笔记摘抄自 [美] Holden Karau 等著的《Spark快速大数据分析》

RDD是什么？

弹性分布式数据集（Resilient Distributed Dataset，简称 RDD）

Spark 的核心概念
一个不可变的分布式对象集合
每个 RDD 都被分为多个分区运行在集群的不同节点上
RDD 可以包含 Python、Java、Scala 中任意类型的对象（可以自定义）

在 Spark 中，对数据的所有操作不外乎 创建 RDD、转化已有 RDD 以及 调用 RDD 操作 进行求值。而在这一切背后，Spark 会自动将 RDD 中的数据分发到集群上，并将操作并行化执行。

例子

创建 RDD 的两种方式：

读取一个外部数据集

驱动器程序里分发驱动器程序中的对象集合（比如 list 和 set）

这里通过读取文本文件作为一个字符串 RDD：

>>> lines = sc.textFile("README.md")

RDD 的两种操作：

转化操作（transformation）：由一个RDD 生成一个新的RDD，例如筛选数据

行动操作（action）：对RDD 计算出一个结果，并把结果返回到驱动器程序中，或把结果存储到外部存储系统（如HDFS）中

调用转化操作 filter() :

>>> pythonLines = lines.filter(lambda line: "Python" in line)

调用 first() 行动操作 :

>>> pythonLines.first()
u'high-level APIs in Scala, Java, Python, and R, and an optimized engine that'

@Notice

“惰性计算”：RDD 只有在进行第一个 行动操作 时才会被计算¹
“持久化”：RDD默认会在每次行动操作时重新计算²，如果想要在多个行动操作中重复使用同一个 RDD ，需要对该 RDD 进行 “持久化”

把RDD 持久化³到内存中

>>> pythonLines.persist

>>> pythonLines.count()
3
>>> pythonLines.first()
u'high-level APIs in Scala, Java, Python, and R, and an optimized engine that'

创建 RDD

并行化方式

把程序中一个已有的集合传给 SparkContext 的 parallelize() 方法，这种方式需要把整个数据集先放到一台机器的内存中，故不常用

JavaRDD lines = sc.parallelize(Arrays.asList("pandas", "i like pandas"));

读取外部数据集方式

JavaRDD lines = sc.textFile("/path/to/README.md");

RDD 操作

转化操作

RDD 的转化操作是返回一个新的RDD 的操作，比如 map() 和 filter()

例程（Java）

展示日志文件中所有错误记录

import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaRDD;
import org.apache.spark.api.java.JavaSparkContext;
import org.apache.spark.api.java.function.Function;

import java.util.List;

public class CountError {
    public static void main(String[] args) {
        SparkConf sparkConf = new SparkConf().setAppName("CountError");
        JavaSparkContext javaSparkContext = new JavaSparkContext(sparkConf);
        JavaRDD log = javaSparkContext.textFile(args[0]);
        JavaRDD errorsRDD = log.filter(
                new Function() {
                    public Boolean call(String x) {
                        return x.contains("ERROR");
                    }
                });
        List errors = errorsRDD.collect();
        for (String output : errors) {
            System.out.println(output);
        }
        javaSparkContext.stop();
    }
}

日志文件内容

INFO:everything gonna be ok...
ERROR:something is wrong!
INFO:everything gonna be ok...
ERROR:something is wrong!
INFO:everything gonna be ok...
INFO:everything gonna be ok...
INFO:everything gonna be ok...
INFO:everything gonna be ok...
ERROR:something is wrong!
INFO:everything gonna be ok...
INFO:everything gonna be ok...
INFO:everything gonna be ok...
ERROR:something is wrong!
INFO:everything gonna be ok...
INFO:everything gonna be ok...

运行效果

[root@server1 spark-2.4.4-bin-hadoop2.7]# bin/spark-submit --class CountError ~/SparkTest2.jar ~/SparkTest2.log
...
19/09/10 16:33:10 INFO DAGScheduler: Job 0 finished: collect at CountError.java:20, took 0.423698 s
ERROR:something is wrong!
ERROR:something is wrong!
ERROR:something is wrong!
ERROR:something is wrong!
...

例程（Python）

>>> lines = sc.textFile("/root/SparkTest2.log")
>>> errorsRDD = lines.filter(lambda lines: "ERROR" in lines)
>>> infoRDD = lines.filter(lambda lines: "INFO" in lines)
>>> totalRDD = errorsRDD.union(infoRDD)
>>> lines.count()
21
>>> errorsRDD.count()
4
>>> infoRDD.count()
17
>>> totalRDD.count()
21

@Notice

转化操作可以操作任意数量的输入 RDD
Spark 会使用谱系图（lineage graph）来记录这些不同 RDD 之间的依赖关系，以此按需计算每个 RDD

@P.s.

也可以依靠谱系图在持久化的RDD 丢失部分数据时恢复所丢失的数据

行动操作

把最终求得的结果返回到驱动器程序，或者写入外部存储系统中的 RDD 操作

上文例程中的 count() 便是一个行动操作，另外还有 take() 、collect() 等操作

下面以 take() 为例，获取 union 后的 totalRDD 的前 10 条

>>> for line in totalRDD.take(10):print line
... 
ERROR:something is wrong!
ERROR:something is wrong!
ERROR:something is wrong!
ERROR:something is wrong!
INFO:everything gonna be ok...
INFO:everything gonna be ok...
INFO:everything gonna be ok...
INFO:everything gonna be ok...
INFO:everything gonna be ok...
INFO:everything gonna be ok...
>>>

@P.s.

程序把RDD 筛选到一个很小的规模单台机器内存足以放下时才可以使用 collect()

惰性求值

RDD 的转化操作都是惰性求值的，在被调用行动操作之前 Spark 不会开始计算

不应该把 RDD 看作存放着特定数据的数据集，而最好把每个 RDD 当作我们通过转化操作构建出来的、记录如何计算数据的 指令列表
把数据读取到 RDD 的操作也同样是惰性的
读取数据的操作也有可能会多次执行

如果创建 RDD 或转化 RDD 时就把文件中所有的行数都存储起来，会消耗大量存储空间，Spark 了解完整的操作链后，可以只计算结果真正需要的数据，例如行动操作为 first() 则只存储 “README.md” 中第一行 “Python”↩
如果不这样做也会导致重复创建 RDD 浪费存储空间↩
默认存储级别调用 persist() 和 cache() 是一样的↩

你可能感兴趣的:(Spark学习笔记2——RDD（上）)

Docker进阶 - 2. Dockerfile 常用保留字简介 Aaron_neil Linux #Docker docker 运维 linux 容器 DockerFile
目录1.FROM2.MAINTAINER3.RUN4.EXPOSE5.WORKDIR6.USER7.ENV8.VOLUME9.COPY10.ADD11.CMD12.ENTRYPOINT13.CMD和RUN命令的区别本篇文章的讲解截屏示例基于tomcat的Dockerfile：tomcat/9.0/jdk8/openjdk/Dockerfile1.FROM基础镜像，指当前镜像是基于哪个镜像，指定一个
给史多多的第三百八十一封信七千22
你好，这里是七千每日文字输出的第464天。你好，史多多今天大年三十，农历2020年的最后一天了。多多昨晚给爸爸妈妈了一个难忘的夜晚，频繁醒来，妈妈喂多多的时候直接睡着了，然后早上多多还早早醒来。小坏蛋在20年最后一天还挺能折腾。今天多多不知道是不是也很兴奋，下午开始自己一直呜呜啊啊的发声，就好似在说话一样。哈哈爸爸妈妈还说是婴语，是我们已经退化了听不懂的婴语。下午多多一度和爸爸对视着近3分钟，多多
清远个人隐私亲子鉴定地址一览(附2024年9月总汇) 国权基因
个人隐私亲子鉴定是一项专业的技术服务，旨在通过科学手段来判断亲子关系的真实性，具有保护个人隐私的特点。技术原理：通过比对被鉴定者的DNA样本，依据遗传学原理来判断两者之间的亲子相关性。清远个人隐私亲子鉴定机构地址一览1、清远国权基因dna亲子鉴定中心服务咨询点清远亲子鉴定中心地址：清远市清城区人民二路，清远亲子鉴定中心业务范围：上户口亲子鉴定咨询，个人亲子鉴定，司法亲子鉴定咨询预约，移民亲子鉴定咨
外交无小事，不是外国人无小事城市中迷途小书童
外交无小事，不是外国人无小事最近几天老是出现这种外国人在中国胡作非为的新闻报道，真是太让人生气了:1).北京3月31日，一名坦桑尼亚男子被举报抵京后拒绝集中隔离，不戴口罩、不听劝阻、随意外出取快递。2).青岛4月1日，青岛崂山某社区服务中心，几个外国人强行插队。遭到谴责后，一名外国人竟然将市民手中的单据扔在地上，并且叫嚣说：中国人出去。3).广州4月1日，广州某医院ICU病房护士，被确诊新冠肺炎的
坚持党的群众路线 Tan明申呀
自建党以来，我们凝聚起全国亿万人民的智慧和力量，走出了一条让中华民族伟大复兴之路，取得了让世界瞩目的成就，根本原因就在于我们始终把群众路线作为党的生命线，坚定一切为了群众，一切依靠群众，从群众中来，到群众中去的群众路线。贯彻群众路线，根本的是为群众谋利益、办实事。这是我们一切工作的出发点和落脚点，本质上是群众立场问题。因此，我们想问题、做决策、干工作，都要从群众的视角去思考和谋划.要用群众眼光、群
裸辞第68天：少年老成是我啊2017
信息架构作业本来想着一个上午或者下午完成的，愣是搞了一天了也没做完全。晚上小组讨论了下发现组长真的太牛气了，才25岁啊，只不过研究生学历，怎么这么厉害，活脱脱像个工作几年的人一般业务熟练。最幸运的事是认识这些优秀向上的人。最不幸的事是这年纪才遇见他们。俗语说：老鼠的儿子会打洞，庙门前的猪都会念经。希望跟着这些优秀的人，自己也会越来越好吧。
用ffmpeg 进行视频的拼接 hjjdebug #ffmpeg ffmpeg 音视频文件拼接
author:hjjdebugdate:2025年07月22日星期二17:06:02CSTdescrip:用ffmpeg进行视频的拼接文章目录1.指定协议为concat方式.1.1协议为concat模式,会调用concat_open函数1.2当读数据时,会调用concat_read2.指定file_format为concat方式2.1调用concat_read_header时,读入文件信息2.2调
【读书笔记】内向者如何构建自己的人脉网络？绘小潭
【读书收获】内向者想要构建自己的人脉网络，可以试着从这5个细节方面入手。1.利用好社交网络；2.做一个认真的倾听者；3.做一个谈话有质量的人；4.尽量记住对方的姓名；5.做好自我介绍。图片发自App无论是内向者还是外向者，都需要构建自己的人脉网络，只不过相较于外向者来说，内向者似乎更困难一些。内向者如何构建自己的人脉网络？在读《内向者沟通圣经》以前，我自己想到的方式大概有三个方面。一是做真诚的自己
2023-03-20 沫沫1823
青年守好“三心”做廉政好干部人无精神则不立，国无精神则不强。在新时代的壮阔征程中，闪耀着一个个熠熠生辉的精神坐标，一个个坚守的身影，一首首动人的故事，无不催人奋进，诠释着共产党员的初心和使命，凝聚着奋斗者的信心。青年兴则国家兴，青年强则国家强。作为新时代的青年，我们必须守住本心，有所作为，才能不负时代、不负韶华。坚守政治清明的“正”心。“修身齐家治国平天下”“其身正，不令而行”，历史的经验告诉我们
《非暴力沟通》读书分享27：愤怒时该做什么？发现愤怒的价值，不要让一时之气毁了你的人生峰哥读写思
愤怒时该做什么？这是《非暴力沟通》一书，读书心得分享的第27篇。《非暴力沟通》告诉我们，愤怒的感受是信号，传达着未被满足的需要。所以愤怒时该做什么？找到未被满足的需要并采取行动去满足它。然而，很多人包括以前的我，在愤怒时喜欢用的方式是去指责他人，甚至是去惩罚他人。因为我认为他们不对，他们有错。这样做，不但激发了暴力，而且，未被满足的需要反而更不容易得到满足。你看，你是因为需要没有得到满足而产生了愤
dify应用傻瓜教程二：dify升级
最近发现dify变化速度惊人，这对于dify的粉丝来说肯定是个好消息，说明dify正不断改善和优化自己，让自己变得越来越好用，但同时粉丝们也遇到个问题，就是如果确保自己在dify上已做过的产品或知识库不受影响的情况下升级到最新版本呢？下面我就以windows11系统中的dify1.4.0升级到1.6.0为例(前提是以源码部署方式），介绍大家如何升级：第一步：先右键点击桌面左下角类似分屏一样的图标，
帮朋友分析了一份合同刑部员外
下午有个朋友打电话问我忙着没，帮忙看一份合同，直接将合同发过来了。打开一看就是不知道从哪弄回来的模版，内容很全但是没啥用。下班后朋友在家附近等我，一起聊聊合同的事，一聊才知道原来是这么回事，某个领导想让他帮忙将一笔钱投到农业项目上，以农业开发为名，实则挖沙出售。双方都是有关系的，据说对方还是某位部级领导的哥哥，真假与否，难以考证。问题在于明明是做非法的事，偏偏还要弄个合同想维护自己权益，听起来都不
最详细的解决方法：MySQL服务无法启动。服务没有报告任何错误。端口问题，配置问题。掉色的熊猫 BUG MySQL 新手数据库 mysql bug 系统安装 windows
如图，启动mysql服务时，报这个错误了应该怎么办？往下看。我知道会报这个错误的两个原因：(1)端口号被占用。1.打开CMD，命令提示符。2.输入netstat-ano，则跳出下图所示，找对对应3306的端口。3.继续输入tasklist|findstr端口号对应的PID号，由于上图可知我的pid号为1564。然后就可以看见，是mysql占用了我的mysql端口号。好像有那里不对啊，哈哈哈，好吧，
中原焦点网络初级班第32期学员刘艳红坚持分享第3天2021年11月23日 42d78de9ecb7
第一次接触焦点，今晚第一次复盘让我感触很深。各位老师的分享让我对所学的内容有了深层次的理解，所举得例子感觉就发生在自己身边，特别是老师说的要关注正向，看到的是优点真的会优点越来越多，这点一定要在孩子身上实践
京东2023年全年活动时间一览表，京东活动日购物节有哪些？凌风导师
目前京东活动有京东生鲜到家活动，如果没在京东生鲜购买过商品的可以看一看，微信识别下图二维码进入会场京东是比较受欢迎的平台，今天就把2023年京东整年的活动优惠分享给大家，并奉上京东更省钱的方法，如何在京东领取神劵，一年省下不止是亿点点，文章最后分享京东内劵获取渠道使用教程；高省APP邀请码：高省-各大应用商城下载即可-购物领劵返利高，邀请码切记填777999，凌风高省邀请码777999，全网唯一教
杭州市10家亲子鉴定中心机构地址一览（附2024最新收费标准）国医基因孙主任
杭州亲子鉴定中心机构地址在哪里？杭州亲子鉴定中心机构地址在杭州市余杭区五常街道高顺路6号（杭州国医基因）。本文整理了杭州正规权威机构名录供大家参考，杭州有许多可以做dna亲子鉴定中心的机构，本文整理了杭州市正规dna亲子鉴定咨询机构及杭州市正规鉴定机构名录，部分机构不能进行亲子鉴定，请根据业务范围自行选择。杭州司法鉴定机构名单参考1、浙江省立同德医院司法鉴定所；浙江省杭州市余杭区五常街道五常大道华
每日复盘 day229/一日之计在于晨 A小雨_7982
【早睡早起】温度：23~21度天气:多云地点：江阴日出：5:32日落：6:22【运动】跟好轻运动25分钟【主题学习】阅读《搞定1》【90天3个目标】1.每天15个单词打卡2.学习网课3.读书3本【今日3只青蛙】1.准备老可开学资料✅2.英语资料整理✅3.大扫除✅【明日3只青蛙】1.家长会2.接老可回家3.完成每日打卡学习【每日复盘】每天早起早睡早已成为习惯，了最近一周老可在奶奶家就一个人在家，反而
2023-11-07 慧惠2023
今天是一个晴朗的日子,阳光明媚,微风拂面。我走在大街上,看到人们都在享受着这个美好的日子。我感到很开心,因为我知道这个世界还有很多美好的事物等着我去发现。今天我也经历了一些挑战。我遇到了一些困难,但是我努力克服了它们。这让我感到很自豪,因为我知道我有很多的潜力,只要我努力去做,我就可以实现自己的目标。今天我还和一些朋友相聚,我们一起分享了彼此的近况。我感到很温暖,因为我知道我有这么多的朋友在我的身
独克宗人家户命名乳名的方式之九姑依滑雪
独克宗人家户命名乳名的方式之九对于生长在高原上的独克宗人而言，雪是常见的一种自然之物。雪的纯洁，雪的孤傲，雪的洁白诸如此类的特征，往往成为人们所期望和所祝祷的寓意。在独克宗人的乳名中，带上“雪”字往往也在乳名之中被赋予或寄予了人们的某种期望和祝祷。在独克宗人家户中，带“雪”字的女性乳名有，雪松，雪峰，雪冰，雪山，雪衫，雪川等等诸如此类的男性乳名，从这一类的乳名之中，我们不难看出其中所充满的人们的希
成长是为了让自己更好独一无二的刘婕
分享人:AS07刘婕读书能够提升我们的理解和思考能力持续精进122/365读书使人聪明，人生更多可能【今日行动】学业上✳️1.上午建筑设备和外国与设计✳️2.下午值班学习行动:外国建筑史需要不断地学习哦财务上1.日常开销；2.记账3.晚上吃面条健康上1.早起晨跑第20天啦，跑步2.3【注意保护自己，记得拉伸】30min昨天有进步，起的比之前早行动:明天第21天早起晨跑2.步数1w+✅成长上1.早起
ansible awx自动化工具学习准备七七powerful ansible 自动化学习
使用sealos快速搭建kubernetes集群！！！-CSDN博客使用Kuboard-Spray安装1套k8s集群Kuboard-Spray图形化工具安装kubernetes集群-CSDN博客使用KuboardSpray安装kubernetes_v1.23.1|Kuboard通过helm安装calico插件Kubernetes默认上网端口_小屁孩的技术博客_51CTO博客【K8s】Kuberne
京东内部优惠券软件叫什么?如何领取优惠券高省_飞智666600
美团作为中国领先的本地生活服务平台，为广大用户提供包括美食、外卖、酒店住宿等多种服务。其中，美团住宿优惠券为广大旅行者和商务人士提供了实惠的住宿选择。本文将为您详细介绍美团住宿优惠券的购买、使用和领取方法。二、美团住宿优惠券怎么买？1.打开美团App，点击“酒店”或“住宿”频道；2.在搜索框输入目的地和入住时间，点击搜索；3.在搜索结果页面，您可以查看酒店的折扣信息和可用优惠券；4.点击选择您需要
买熟牛肉，不能只图便宜，要求‘质量’ 蜜獾传奇
过春节时，我们这个地方每家每户基本上都会购买大量的熟牛肉，可是有的人只图便宜，会买那些很便宜的熟牛肉，买到手里之后就后悔了，很难吃，到最后不吃，白花冤枉钱。一分价钱一分货，好东西不便宜，便宜没好货，这话是有一定道理的。熟牛肉很贵，在平常吃的人真的不多，到了节气就不考虑那么多了，就想多买一些。问题就是有些人只图便宜，买到手的是那些质量不好的或者是假牛肉，你遇到过这样的事吗？过春节时，我爸就是听别人说
231篇觉察日志语宝妈
今晚到家后，孩子说自己做了泡面吃，那我就自己解决晚餐了。满足的吃完晚餐后，我习惯靠墙站五分钟。靠墙站其实挺累，斋站着等时间会觉得很漫长，所以打开英语听演讲，这样时间就过得快多了。远远叫我，妈妈，我需要你的帮助。我走过去，看到远远又拼出一个新的乐高模型，现在需要穿绳子，我帮远远穿绳子，一起找零件，我真欣赏儿子这种专注和投入，特别让我佩服，陪儿子做他热爱的，我感觉也很好。以前远远让我陪伴他做的“游戏”
志愿者服务期间，我被领导移除群聊哈喽说你好
2020.3.3来的第十一天，越坚持越简单。自从我在开始更新文章的时候，就不在去关注其他社交软件，就像QQ，一天只登陆一次，只是看看有没有通知消息；就像微信：一天进去的次数也不多，固定时间两次，也是看看有没有通知消息！我知道，没有几个人时时刻刻找我聊天，几个固定的人也是在固定的时间！又是疫情期间，公司依旧没有通知上班，一天24小时也没有什么动静。所以一般情况下，微信也不再后台运行，不会收到消息。两
成功日记（Day825）狮子座的兔子姑娘
1、跟肖出诊。~4h。2、和g夙微信闲唠嗑。~0.5h。3、和c付丽闲唠嗑。~0.5h。4、和z鹤微信闲唠嗑。~0.5h。5、看电影《东方不败之风云再起》。~1.5h。6、简单整理笔记。~0.5h。心情：还可以吧！稍稍有一点郁闷，号个患者脉，没啥感觉。体会不够深刻。
使用 Ansible 批量部署 Zabbix 始知冰上有仙人 ansible zabbix 服务器
安装Ansible如果您还没有在控制节点上安装Ansible，请先根据您的操作系统版本安装Ansible。可在Ansible官方网站上找到相关文档。例如，在Ubuntu上安装Ansible，可以使用以下命令：$sudoaptupdate$sudoaptinstallansible创建Ansibleplaybook在创建playbook前，需要先在ansiblehosts文件中定义待配置主机信息，例
【bug】 jetson上opencv无法录制h264本地视频 lxmyzzs bug opencv 音视频
在JetsonOrinNX上无法使用opencv直接录制h264/h265视频流（h264格式的视频流才能在浏览器播放）解决：软件编码：需要源码编译opencv1.环境准备pipuninstallopencv-pythonsudoaptinstallbuild-essentialcmakegitpython3-devpython3-numpy\libavcodec-devlibavformat-d
【bug】global loadsave.cpp:241 cv::findDecoder imread_(‘xxx‘):: can‘t open/read file lxmyzzs bug pytorch opencv
问题OPENCV读取图片报错（win11）[WARN:[email protected]]globalloadsave.cpp:241cv::findDecoderimread_('xxx.png'):can'topen/readfile:checkfilepath/integrity解决：在windows系统上如果直接使用路径加载图片会报上述错误，使用PIL加载也无济于事，问题在文件路径的格式。因此博主做了如下
成功解决pandas.errors.ParserError: Error tokenizing data. C error: Expected 1 fields in line 4, saw 2 lxmyzzs python
问题描述：Traceback(mostrecentcalllast):File"C:/Users/Lenovo/Desktop/水泥数据/dataprocess1.py",line8,indata1=pd.read_csv("doubledata.xlsx")File"D:\Users\Lenovo\miniconda3\lib\site-packages\pandas\io\parsers.py
mondb入手木zi_鸣 mongodb
windows 启动mongodb 编写bat文件， mongod --dbpath D:\software\MongoDBDATA mongod --help 查询各种配置配置在mongob 打开批处理，即可启动，27017原生端口，shell操作监控端口扩展28017，web端操作端口启动配置文件配置，数据更灵活
大型高并发高负载网站的系统架构 bijian1013 高并发负载均衡
扩展Web应用程序一.概念简单的来说，如果一个系统可扩展，那么你可以通过扩展来提供系统的性能。这代表着系统能够容纳更高的负载、更大的数据集，并且系统是可维护的。扩展和语言、某项具体的技术都是无关的。扩展可以分为两种： 1.
DISPLAY变量和xhost(原创) czmmiao display
DISPLAY 在Linux/Unix类操作系统上, DISPLAY用来设置将图形显示到何处. 直接登陆图形界面或者登陆命令行界面后使用startx启动图形, DISPLAY环境变量将自动设置为:0:0, 此时可以打开终端, 输出图形程序的名称(比如xclock)来启动程序, 图形将显示在本地窗口上, 在终端上输入printenv查看当前环境变量, 输出结果中有如下内容:DISPLAY=:0.0
获取B/S客户端IP 周凡杨 java 编程 jsp Web 浏览器
最近想写个B/S架构的聊天系统，因为以前做过C/S架构的QQ聊天系统，所以对于Socket通信编程只是一个巩固。对于C/S架构的聊天系统，由于存在客户端Java应用，所以直接在代码中获取客户端的IP，应用的方法为： String ip = InetAddress.getLocalHost().getHostAddress(); 然而对于WEB
浅谈类和对象朱辉辉33 编程
类是对一类事物的总称，对象是描述一个物体的特征，类是对象的抽象。简单来说，类是抽象的，不占用内存，对象是具体的，占用存储空间。类是由属性和方法构成的，基本格式是public class 类名{ //定义属性 private/public 数据类型属性名； //定义方法 publ
android activity与viewpager+fragment的生命周期问题肆无忌惮_ viewpager
有一个Activity里面是ViewPager，ViewPager里面放了两个Fragment。第一次进入这个Activity。开启了服务，并在onResume方法中绑定服务后，对Service进行了一定的初始化，其中调用了Fragment中的一个属性。 super.onResume(); bindService(intent, conn, BIND_AUTO_CREATE);
base64Encode对图片进行编码 843977358 base64 图片 encoder
/** * 对图片进行base64encoder编码 * * @author mrZhang * @param path * @return */ public static String encodeImage(String path) { BASE64Encoder encoder = null; byte[] b = null; I
Request Header简介 aigo servlet
当一个客户端(通常是浏览器)向Web服务器发送一个请求是，它要发送一个请求的命令行，一般是GET或POST命令，当发送POST命令时，它还必须向服务器发送一个叫“Content-Length”的请求头(Request Header) 用以指明请求数据的长度，除了Content-Length之外，它还可以向服务器发送其它一些Headers，如：
HttpClient4.3 创建SSL协议的HttpClient对象 alleni123 httpclient 爬虫 ssl
public class HttpClientUtils { public static CloseableHttpClient createSSLClientDefault(CookieStore cookies){ SSLContext sslContext=null; try { sslContext=new SSLContextBuilder().l
java取反 -右移-左移-无符号右移的探讨百合不是茶位运算符位移
取反：在二进制中第一位，1表示符数，0表示正数 byte a = -1; 原码：10000001 反码：11111110 补码：11111111 //异或: 00000000 byte b = -2; 原码：10000010 反码：11111101 补码：11111110 //异或: 00000001
java多线程join的作用与用法 bijian1013 java 多线程
对于JAVA的join，JDK 是这样说的：join public final void join （long millis ）throws InterruptedException Waits at most millis milliseconds for this thread to die. A timeout of 0 means t
Java发送http请求(get 与post方法请求) bijian1013 java spring
PostRequest.java package com.bijian.study; import java.io.BufferedReader; import java.io.DataOutputStream; import java.io.IOException; import java.io.InputStreamReader; import java.net.HttpURL
【Struts2二】struts.xml中package下的action配置项默认值 bit1129 struts.xml
在第一部份，定义了struts.xml文件，如下所示： <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache.org/dtds/struts
【Kafka十三】Kafka Simple Consumer bit1129 simple
代码中关于Host和Port是割裂开的，这会导致单机环境下的伪分布式Kafka集群环境下，这个例子没法运行。实际情况是需要将host和port绑定到一起， package kafka.examples.lowlevel; import kafka.api.FetchRequest; import kafka.api.FetchRequestBuilder; impo
nodejs学习api ronin47 nodejs api
NodeJS基础什么是NodeJS JS是脚本语言，脚本语言都需要一个解析器才能运行。对于写在HTML页面里的JS，浏览器充当了解析器的角色。而对于需要独立运行的JS，NodeJS就是一个解析器。每一种解析器都是一个运行环境，不但允许JS定义各种数据结构，进行各种计算，还允许JS使用运行环境提供的内置对象和方法做一些事情。例如运行在浏览器中的JS的用途是操作DOM，浏览器就提供了docum
java-64.寻找第N个丑数 bylijinnan java
public class UglyNumber { /** * 64.查找第N个丑数具体思路可参考 [url] http://zhedahht.blog.163.com/blog/static/2541117420094245366965/[/url] * 题目：我们把只包含因子 2、3和5的数称作丑数（Ugly Number）。例如6、8都是丑数，但14
二维数组（矩阵）对角线输出 bylijinnan 二维数组
/** 二维数组对角线输出两个方向例如对于数组： { 1, 2, 3, 4 }, { 5, 6, 7, 8 }, { 9, 10, 11, 12 }, { 13, 14, 15, 16 }, slash方向输出： 1 5 2 9 6 3 13 10 7 4 14 11 8 15 12 16 backslash输出： 4 3
[JWFD开源工作流设计]工作流跳跃模式开发关键点(今日更新) comsci 工作流
既然是做开源软件的,我们的宗旨就是给大家分享设计和代码,那么现在我就用很简单扼要的语言来透露这个跳跃模式的设计原理大家如果用过JWFD的ARC-自动运行控制器,或者看过代码,应该知道在ARC算法模块中有一个函数叫做SAN(),这个函数就是ARC的核心控制器,要实现跳跃模式,在SAN函数中一定要对LN链表数据结构进行操作,首先写一段代码,把
redis常见使用 cuityang redis 常见使用
redis 通常被认为是一个数据结构服务器，主要是因为其有着丰富的数据结构 strings、map、 list、sets、 sorted sets 引入jar包 jedis-2.1.0.jar (本文下方提供下载) package redistest; import redis.clients.jedis.Jedis; public class Listtest
配置多个redis dalan_123 redis
配置多个redis客户端 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&quo
attrib命令 dcj3sjt126com attr
attrib指令用于修改文件的属性.文件的常见属性有:只读.存档.隐藏和系统. 只读属性是指文件只可以做读的操作.不能对文件进行写的操作.就是文件的写保护. 存档属性是用来标记文件改动的.即在上一次备份后文件有所改动.一些备份软件在备份的时候会只去备份带有存档属性的文件.
Yii使用公共函数 dcj3sjt126com yii
在网站项目中，没必要把公用的函数写成一个工具类，有时候面向过程其实更方便。在入口文件index.php里添加 require_once('protected/function.php'); 即可对其引用，成为公用的函数集合。 function.php如下： <?php /** * This is the shortcut to D
linux 系统资源的查看（free、uname、uptime、netstat） eksliang netstat linux uname linux uptime linux free
linux 系统资源的查看转载请出自出处：http://eksliang.iteye.com/blog/2167081 http://eksliang.iteye.com 一、free查看内存的使用情况语法如下： free [-b][-k][-m][-g] [-t] 参数含义 -b:直接输入free时，显示的单位是kb我们可以使用b(bytes),m
JAVA的位操作符 greemranqq 位运算 JAVA位移 <<>>>
最近几种进制，加上各种位操作符，发现都比较模糊，不能完全掌握，这里就再熟悉熟悉。 1.按位操作符：按位操作符是用来操作基本数据类型中的单个bit,即二进制位，会对两个参数执行布尔代数运算，获得结果。与（&）运算： 1&1 = 1, 1&0 = 0, 0&0 &
Web前段学习网站 ihuning Web
Web前段学习网站菜鸟学习：http://www.w3cschool.cc/ JQuery中文网：http://www.jquerycn.cn/ 内存溢出：http://outofmemory.cn/#csdn.blog http://www.icoolxue.com/ http://www.jikexue
强强联合：FluxBB 作者加盟 Flarum justjavac r
原文：FluxBB Joins Forces With Flarum作者：Toby Zerner译文：强强联合：FluxBB 作者加盟 Flarum译者：justjavac FluxBB 是一个快速、轻量级论坛软件，它的开发者是一名德国的 PHP 天才 Franz Liedke。FluxBB 的下一个版本(2.0)将被完全重写，并已经开发了一段时间。FluxBB 看起来非常有前途的，
java统计在线人数（session存储信息的） macroli java Web
这篇日志是我写的第三次了前两次都发布失败！郁闷极了！由于在web开发中常常用到这一部分所以在此记录一下，呵呵，就到备忘录了！我对于登录信息时使用session存储的，所以我这里是通过实现HttpSessionAttributeListener这个接口完成的。 1、实现接口类，在web.xml文件中配置监听类，从而可以使该类完成其工作。 public class Ses
bootstrp carousel初体验快速构建图片播放 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
img{ border: 1px solid white; box-shadow: 2px 2px 12px #333; _width: expression(this.width > 600 ? "600px" : this.width + "px"); _height: expression(this.width &
SparkSQL读取HBase数据，通过自定义外部数据源 superlxw1234 spark sparksql sparksql读取hbase sparksql外部数据源
关键字：SparkSQL读取HBase、SparkSQL自定义外部数据源前面文章介绍了SparSQL通过Hive操作HBase表。 SparkSQL从1.2开始支持自定义外部数据源(External DataSource)，这样就可以通过API接口来实现自己的外部数据源。这里基于Spark1.4.0，简单介绍SparkSQL自定义外部数据源，访
Spring Boot 1.3.0.M1发布 wiselyman spring boot
Spring Boot 1.3.0.M1于6.12日发布，现在可以从Spring milestone repository下载。这个版本是基于Spring Framework 4.2.0.RC1,并在Spring Boot 1.2之上提供了大量的新特性improvements and new features。主要包含以下： 1.提供一个新的sprin

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他