菜鸟也学大数据

PySpark简介、搭建以及使用

目录

一、PySpark简介
- 使用场景
- 结构体系
二、PySpark集成搭建
三、 PySpark的使用
- PySpark包介绍
- PySpark处理数据
- PySpark中使用匿名函数
- 加载本地文件
- PySpark中使用SparkSQL
- Spark与Python第三方库混用
- Pandas DF与Spark DF
- 使用PySpark通过图形进行数据探索

一、PySpark简介

使用场景

大数据处理或机器学习时的原型（ prototype）开发

验证算法
执行效率可能不高
要求能够快速开发

结构体系

二、PySpark集成搭建

准备环境：JDK、Spark需要提前安装好

下载Anaconbda

地址：点击这里
选择：Anaconda3-5.1.0-Linux-x86_64.sh

至于版本最好不要使用过低版本，可能无法使用

安装bzip2

缺少 bzip2 安装 Anaconda 会失败

在Linux下安装bzip2：yum install -y bzip2

上传/解压Anaconbda

将下载好的Anaconbda上传至Linux中
解压安装Anaconbda：bash Anaconda3-5.1.0-Linux-x86_64.sh
回车，开始安装，然后提示接受协议（输入yes回车），然后指定安装到的位置，根路径必须已存在，（否则默认安装在/root/anaconbda3下面）
处理完上面的步骤后会提示是否自动添加环境变量，输入yes即可
然后还会提示是否安装VSCode，这里linux不需要安装，输入no即可

Linux默认自带python，安装Anacondd会覆盖原有的Python，可以通过修改.bashrc使两个版本pyrhon共存

设置两个版本的python共存

配置文件：vim /root/.bashrc

#添加以下内容，自行修改自己安装的路径
export PATH="/opt/install/anaconda3/bin:$PATH"
alias pyana="/opt/install/anaconda3/bin/python"
alias python="/bin/python"

保存退出后生效配置文件：source /root/.bashrc

生成 PySpark 配置文件

在当前用户文件夹下运行以下命令生成配置文件：jupyter notebook --generate-config
查看生成的配置文件：ll /root/.jupyter/
修改配置文件，但在这之前，需要先执行以下操作
使用 pyana，进入交互模式，运行以下代码

from notebook.auth import passwd
passwd()
#按照提示设置密码后会生成与之对应的加密密码，然后保存这个生成的字符串，后面会赋值给 c.NotebookApp.password 属性

修改配置文件，允许从外部访问 Jupyter：vi ./.jupyter/jupyter_notebook_config.py

c.NotebookApp.allow_root = True
c.NotebookApp.ip = '*'
c.NotebookApp.open_browser = False
c.NotebookApp.password = 'sha1:*****************'#将前面生成的值放到这里
c.NotebookApp.port = 7070 #指定外部访问的端口号

修改环境变量,将Jupyter作为PySpark的编辑运行工具:vim /root/.bashrc

export PYSPARK_PYTHON=/opt/install/anaconda3/bin/python3 #指定/anaconda3/bin/python3
export PYSPARK_DRIVER_PYTHON=/opt/install/anaconda3/bin/jupyter #指定/anaconda3/bin/jupyter
export PYSPARK_DRIVER_PYTHON_OPTS="notebook"
ipython_opts="notebook -pylab inline"

生效环境变量：source /root/.bashrc
注意关闭防火墙
启动pyspark：pyspark
使用浏览器打开Jupyter：192.168.**.**:7070，并输入预先设置的密码
这里安装就算完成了

三、 PySpark的使用

初次使用建议创建一个文件夹，在这个文件夹保存操作过的代码
进入到新创建的文件夹下面，new->python3
然后就可以开始操作学习
执行命令
shift+回车：执行并开启新的一行
ctrl+回车：仅执行

PySpark包介绍

PySpark

Core Classes:
pyspark.SparkContext
pyspark.RDD
pyspark.sql.SQLContext
pyspark.sql.DataFrame

pyspark.streaming

pyspark.streaming.StreamingContext
pyspark.streaming.DStream

pyspark.ml

pyspark.mllib

PySpark处理数据

导包

from pyspark import SparkContext

获取SparkContext对象

sc=SparkContext.getOrCreate()

创建RDD

#不支持
makeRDD()
#支持
parallelize()
textFile()
wholeTextFiles()

演示

PySpark中使用匿名函数

使用Python的Lambda函数实现匿名函数
scala与python对比

#scala
val a=sc.parallelize(List("dog","tiger","lion","cat","panther","eagle"))
val b=a.map(x=>(x,1))
b.collect

#python
a=sc.parallelize(("dog","tiger","lion","cat","panther","eagle"))
b=a.map(lambda x:(x,1))
b.collect()

演示

加载本地文件

addFile(path, recursive = False)

接收本地文件
通过SparkFiles.get()方法来获取文件的绝对路径

addPyFile( path )

加载已存在的文件并调用其中的方法
现在本地创建一个文件：vi sci.py写入下面两个方法人，然后保存退出

#sci.py
def sqrt(num):
        return num * num
        
def circle_area(r):
        return 3.14 * sqrt(r)

在pyspark中通过addPyFile加载该文件

#加载预写入方法的文件
sc.addPyFile("file:///root/sci.py")
#导入文件中的方法
from sci import circle_area
#创建rdd并使用文件中的方法
sc.parallelize([5, 9, 21]).map(lambda x : circle_area(x)).collect()

演示

PySpark中使用SparkSQL

导包

from pyspark.sql import SparkSession

创建SparkSession对象

ss = SparkSession.builder.getOrCreate()

加载csv文件

ss.read.format("csv").option("header", "true").load("file:///xxx.csv")

演示

测试数据

Afghanistan  48.673000  SAs
Albania  76.918000  EuCA
Algeria  73.131000  MENA
Angola  51.093000  SSA
Argentina  75.901000  Amer
Armenia  74.241000  EuCA
Aruba  75.246000  Amer
Australia  81.907000  EAP
Austria  80.854000  EuCA
Azerbaijan  70.739000  EuCA
Bahamas  75.620000  Amer
Bahrain  75.057000  MENA
Bangladesh  68.944000  SAs
Barbados  76.835000  Amer
Belarus  70.349000  EuCA
Belgium  80.009000  EuCA
Belize  76.072000  Amer
Benin  56.081000  SSA
Bhutan  67.185000  SAs
Bolivia  66.618000  Amer
Bosnia_and_Herzegovina  75.670000  EuCA
Botswana  53.183000  SSA
Brazil  73.488000  Amer
Brunei  78.005000  EAP
Bulgaria  73.371000  EuCA
Burkina_Faso  55.439000  SSA
Burundi  50.411000  SSA
Cambodia  63.125000  EAP
Cameroon  51.610000  SSA
Canada  81.012000  Amer
Cape_Verde  74.156000  SSA
Central_African_Rep.  48.398000  SSA
Chad  49.553000  SSA
Channel_Islands  80.055000  EuCA
Chile  79.120000  Amer
China  73.456000  EAP
Colombia  73.703000  Amer
Comoros  61.061000  SSA
Congo_Dem._Rep.  48.397000  SSA
Congo_Rep.  57.379000  SSA
Costa_Rica  79.311000  Amer
Cote_d'Ivoire  55.377000  SSA
Croatia  76.640000  EuCA
Cuba  79.143000  Amer

操作代码

#导包
from pyspark.sql import SparkSession
from pyspark.sql.functions import col
from pyspark.sql.types import DoubleType
#创建sparkSession对象
ss = SparkSession.builder.getOrCreate()

#读取本地csv文件，并为每列设置名称
#pyspark中一条语句换行需要加斜杠
df = ss.read.format("csv").option("delimiter", " ").load("file:///root/example/LifeExpentancy.txt") \
    .withColumn("Country", col("_c0")) \
    .withColumn("LifeExp", col("_c2").cast(DoubleType())) \
    .withColumn("Region", col("_c4")) \
    .select(col("Country"), col("LifeExp"), col("Region"))
df.describe("LifeExp").show()

效果展示

Spark与Python第三方库混用

使用Spark做大数据ETL
处理后的数据使用Python第三方库分析或展示

1.Pandas做数据分析

#Pandas DataFrame 转 Spark DataFrame
spark.createDataFrame(pandas_df)

#Spark DataFrame转Pandas DataFrame
spark_df.toPandas() 

2.Matplotlib实现数据可视化

3.Scikit-learn完成机器学习

Pandas DF与Spark DF

PandasDF与SparkDF间的转换方法
测试数据
操作代码

# Pandas DataFrame to Spark DataFrame
import numpy as np
import pandas as pd
from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
pandas_df = pd.read_csv("./products.csv", header=None, usecols=[1, 3, 5])
print(pandas_df)

# convert to Spark DataFrame
spark_df = spark.createDataFrame(pandas_df)     
spark_df.show()
df2 = spark_df.withColumnRenamed("1", "id").withColumnRenamed("3", "name").withColumnRenamed("5", "remark")

# convert back to Pandas DataFrame
df2.toPandas()

演示

使用PySpark通过图形进行数据探索

将数据划分为多个区间，并统计区间中的数据个数

# 获取上面演示示例中的第一个df对象
rdd = df.select("LifeExp").rdd.map(lambda x: x[0])
#把数据划为10个区间，并获得每个区间中的数据个数
(countries, bins) = rdd.histogram(10)
print(countries)
print(bins)

#导入图形生成包
import matplotlib.pyplot as plt 
import numpy as np 

plt.hist(rdd.collect(), 10)  # by default the # of bins is 10
plt.title("Life Expectancy Histogram") 
plt.xlabel("Life Expectancy") 
plt.ylabel("# of Countries")

演示

你可能感兴趣的:(python,菜鸟也学大数据,python,大数据,spark)

python介绍&pycharm使用技巧倩倩倩倩千千*- python自动化测试 python pycharm 开发语言
一、python简单介绍python===>跨平台、面想对象，解释型（边运行边翻译）计算机程序设计语言被称为"胶水语言"ps：java是编译型语言学习编程要领（3+1）：编程语法编程规范编程技巧+带着工作任务多练、多实战，从小需求、小工具开始二、python优缺点优点：1、简单易学；2、免费开源；3、面向对象；4、丰富的库；5、可扩展性缺点：1、运行速度慢；2、好的中文资料匮乏三、python应用
《Python编程轻松进阶》干货整理 KLZZ66 python 开发语言 ide jupyter
《Python编程轻松进阶》干货整理最近把《Python编程轻松进阶》看完了，看得过程中顺便整理了一些自己觉得比较重要的点，分享出来，共同进步！文章目录《Python编程轻松进阶》干货整理第一章处理错误和寻求帮助1.1如何查看模块版本第二章环境设置和命令行2.1使用pathlib库可以让Python脚本跨平台兼容2.2Path常用命令2.3命令行参数2.3.1/?2.3.2python-c2.3.
Anaconda3 介绍和安装 gorgor在码农 #python入门基础 python conda
介绍Anaconda是一个开源的Python和R语言发行版，专注于数据科学、机器学习和科学计算，主要面向数据科学和机器学习领域。它集成了大量常用的科学计算库（如NumPy、Pandas、Matplotlib、Scikit-learn等），并提供了强大的包管理工具Conda和环境管理功能，适合快速部署和管理复杂的开发环境。特点：预装丰富库：包含250+常用的数据科学工具包，无需手动安装。跨平台支持：
大龄剩男的终极应对北纬文公子男女博弈个人成长婚恋
证明“对”并没有多大意义，这并不能改变对方立场。证明这不利于对方，合作才能共赢也没多大意义，这并不能不让对方心存侥幸。那么你怎么办呢？1、消解自己从成长中带来的的错误观念、错误行为并更新，比如自以为是的浅薄，比如拒绝诱惑；2、深入的看清本质，比如社会的，人性的，事情的；3、看清本质后平和的看待一切并找到好的办法，不会去抱怨谁，不会去抱怨社会；比如，我现在都不预设对方是人，而是预设对方是动物，然后对
【vLLM 学习】安装
vLLM是一款专为大语言模型推理加速而设计的框架，实现了KV缓存内存几乎零浪费，解决了内存管理瓶颈问题。更多vLLM中文文档及教程可访问→https://vllm.hyper.ai/vLLM是一个Python库，包含预编译的C++和CUDA(12.1)二进制文件。依赖环境操作系统：LinuxPython：3.8-3.12GPU：计算能力7.0或更高（例如V100、T4、RTX20xx、A100、L
Android App开发之Jetpack架构，带你全面理解View的绘制流程 m0_66144992 程序员架构移动开发 android
在UI组件日益完善的同时，也开始出现了RecyclerView、ConstraintLayout、MotionLayout等一些可以辅助大家写出更加符合性能要求的界面效果。在UI控件日益满足需求的同时，系统的安全与稳定性、用户隐私也越来越被重视，所以每个版本都出现了一些大的适配工作，例如运行时权限，FileProvider适配，限制后台服务、广播，限制反射SDK私有API，引导使用HTTPS，甚至
Python 潮流周刊#89：Python 3.14 的新型解释器！（摘要） python
本周刊由Python猫出品，精心筛选国内外的250+信息源，为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景：帮助所有读者精进Python技术，并增长职业和副业的收入。分享了12篇文章，12个开源项目，2则热门讨论以下是本期摘要：文章&教程①Python3.14新特性：一种新型解释器②高效扩展Python：PyO3与Rust实战③使用uv开发和安装PythonC
Unity入门七七喝椰奶 Unity 经验分享
摘要本文是为那些缺乏Unity使用经验的读者设立的，会对Unity游戏开发的大致流程以及一些属于进行说明Unity的游戏开发，大体可以分为三个步骤将美术素材和各种逻辑功能整合在一起，创建出角色摆放好各个角色，创建出场景创建好所有需要的场景根据我们的经验可以知道，在游戏中，玩家操作的角色以及敌方角色，还有作为游戏舞台的背景等都会显示在画面上。游戏中的那些角色可以通过鼠标或者触屏来操作，也可以根据自己
VTK之vtkLight 浩瀚之水_csdn 三维图像 vtk
vtkLight是VTK（TheVisualizationToolkit）中用于代表现实场景中灯光的一个类。在三维渲染场景中，灯光是必备的要素之一，它为场景提供照明，使得渲染出来的图像更加逼真和立体。以下是对vtkLight的详细介绍：一、灯光类型vtkLight可以分为两种类型：位置灯光（PositionalLight，也叫聚光灯）和方向灯光（DirectionLight）。位置灯光：光源位置在
从0开始的操作系统手搓教程附二——调试我们的操作系统（bochs调试小记） charlie114514191 从0开始的操作系统教程操作系统计算机架构 bochs 调试
目录我们可以调试OS的什么理解bochs调试的单位内存尺度查看内存内容disasm作为反汇编指令查看我们正在执行的内容打断点showint查看中断info其他指令我们当然要学习如何使用bochs来调试我们的操作系统。毕竟伴随代码量的增大，出错的概率自然也会直线的上升。我们可以调试OS的什么我们可以查看页表，查看GDT,IDT等后面我们编写操作系统会使用到的数据结构可以看到当前线程流的栈的数据可以反
2月16日星期日早报简报微语报早读微语早读生活
2月16日星期日，农历正月十九，早报#微语早读。1、全胜登顶！上海男篮战胜新疆，夺得首届CBA俱乐部杯冠军；2、湖南衡阳通报“妇幼保健院医生售卖出生证”：8名嫌犯被抓获；3、广东一中学让家长签字同意体罚犯错学生，学校：属实，是校规；4、北京已开通适龄男性HPV疫苗官方预约平台，疫苗供应量稳定；5、哪吒2成功进入全球影史票房TOP11；6、广西大学附属中学：教师郑某某已被开除，有关材料报送公安机关；
python后端调用Deep Seek API YY_oot python ai 语言模型
python后端调用DeepSeekAPI需要依次下载●Ollama●DeepseekR1LLM模型●嵌入模型nomic-embed-text/bge-m3●AnythingLLM参考教程：DeepseekR1打造本地化RAG知识库:安装部署使用详细教程手把手教你：deepseekR1基于AnythingLLMAPI调用本地知识库python调用anythingllm的APIimportreque
大数据之-hdfs+hive+hbase+kudu+presto集群(6节点) 管哥的运维私房菜大数据 hdfs hive kudu presto hbase
几个主要软件的下载地址：prestohttps://prestosql.io/docs/current/index.htmlkudurpm包地址https://github.com/MartinWeindel/kudu-rpm/releaseshivehttp://mirror.bit.edu.cn/apache/hive/hdfshttp://archive.apache.org/dist/ha
多python环境配置搞不定看这篇就够了 Nothi.C python 环境 python 开发语言 linux windows
环境配置一直都是难倒无数入门选手的关键问题。如何在一台电脑中运行多个版本？本文章以virtualenv构建虚拟环境为例子首先，下载相对应的Python，windows版本下载完成后如若遇到PYTHON和PIP已安装却系统无法执行：此电脑高级设置—>环境变量->系统PATH->新建->粘贴PYTHON路径（为指定Python）和PYTHON\Scripts（为指定pip）或者执行命令setPATH=
MySQL修改max_allowed_packet 一张假钞 mysql
个人博客地址：MySQL修改max_allowed_packet|一张假钞的真实世界通过global参数设置：setglobalmax_allowed_packet=32*1024*1024;注意，下面的写法是不正确的：setglobalmax_allowed_packet=32m;如果要重启也生效的话，在my.cnf中添加如下配置：max_allowed_packet=32m
下载多个python如何配置环境彪悍的高校 python 开发语言
多环境Python配置方案在数据科学和软件开发的领域，Python因其简单易用而广受欢迎。然而，随着项目的不断增多，我们常常需要在同一台机子上安装多个版本的Python及其依赖。为了解决这个问题，我们可以采用虚拟环境管理工具。本文将介绍如何通过venv和pyenv来配置多个Python环境，并提供相关的代码示例。一、环境准备在开始前，请确保你的计算机上已安装了以下软件：Python：确保安装了Py
hbase快照同步到目标集群出现ERROR Multiple regions have the same startkey问题分析 spring208208 hbase hbase python 前端
问题现象源集群表split/merge过程中创建快照，该快照同步到目标集群，目标集群恢复快照后，进行hbck检查，就会出现异常报错：ERRORMultipleregionshavethesamestartkey;问题分析首先，出现上述问题可能有如下两种原因：源集群中snapshot表本身就存在这种问题，没有修复就执行snapshot，导出快照到目标集群，然后恢复表也会存在这种问题。在执行split
JVM调优-学习篇 m0_74825172 面试学习路线阿里巴巴 jvm 学习
概述公司的江南白衣写了一篇关键业务系统的JVM参数推荐(2016热冬版)的文章,大牛的文章总是需要细细品读。这篇文章介绍大量的JVM调优参数,内容也比较多,本文只是列出我自己能理解的一些参数,暂时理解不了的参数就只能等以后自己实力到家了,再慢慢补充上来。性能调优参数-XX:AutoBoxCacheMaxJAVA进程启动的时候,会加载rt.jar这个核心包的,rt.jar包里的Integer自然也是
【python学习】深度解析 Python 的 .env配置与最佳实践：温格高的环境变量配置之道 NLP仙人 python python 学习开发语言人工智能
1.文章简介在开发和部署Python项目时，环境变量配置对于管理敏感信息如数据库连接字符串、API密钥至关重要。本文将以温格高（2023年环法冠军）的项目为例，详细介绍如何通过.env文件简化环境配置，并分享多环境管理、Docker集成等热门功能。我们还将覆盖一些小技巧和常见错误，帮助你避免开发中的踩坑。2.使用.env文件的好处温格高团队正在开发一个记录自行车赛事的应用，涉及多个开发环境和敏感信
通过WiFi连接adb调试小刘学安卓 adb android
通过WiFi连接adb调试解决cannotconnectto192.168.1.136:5555:由于目标计算机积极拒绝，无法连接。(10061)解决办法1（Windows下cmd环境执行）1.连接USB数据线，打开USB调试使用windows的“运行”命令行方式：（此方法需配置adb环境变量，也可直接进入adb工具目录执行\android-sdk-windows\platform-tools\）
Python爬虫获取股市数据，有哪些常用方法？股票程序化交易接口量化交易股票API接口 Python股票量化交易 python爬虫股市数据网页抓取 api 股票量化接口股票API接口
Python股票接口实现查询账户，提交订单，自动交易（1）Python股票程序交易接口查账，提交订单，自动交易（2）股票量化，Python炒股，CSDN交流社区>>>网页直接抓取法Python中有许多库可用于解析HTML页面来获取股市数据。例如BeautifulSoup，它能够轻松地从网页的HTML结构中提取出想要的数据。当我们定位到包含股市数据的网页时，利用BeautifulSoup可以根据HT
备战蓝桥杯：贪心算法之货仓选址无敌大饺子 1 贪心算法算法
当我们货仓选址在最中间的时候，货仓到每家商店的距离最短#include#include#includetypedeflonglongLL;usingnamespacestd;intn;constintN=1e5+10;LLa[N];intmain(){cin>>n;for(inti=1;i>a[i];sort(a+1,a+1+n);LLret=0;for(inti=1;i=|a-b|我们的代码也可
Python 爬虫实战：在东方财富网抓取股票行情数据，辅助投资决策西攻城狮北 python 爬虫实战案例东方财富网
目录一、引言二、准备工作1.环境搭建2.获取目标网址三、分析网页结构1.查看HTML结构2.分析请求方式四、编写爬虫代码1.导入必要的库2.设置请求头3.获取股票行情数据4.保存数据到CSV文件5.主函数五、数据分析与可视化1.加载数据2.数据清洗3.数据分析4.数据可视化六、总结一、引言在金融投资领域，股票行情数据是投资者做出决策的重要依据。东方财富网作为国内领先的金融信息平台，提供了丰富的股票
深度学习（1)-简单神经网络示例 yyc_audio 深度学习人工智能
我们来看一个神经网络的具体实例：使用Python的Keras库来学习手写数字分类。在这个例子中，我们要解决的问题是，将手写数字的灰度图像（28像素×28像素）划分到10个类别中（从0到9）。我们将使用MNIST数据集，图2-1给出了MNIST数据集的一些样本。在机器学习中，分类问题中的某个类别叫作类（class），数据点叫作样本（sample），与某个样本对应的类叫作标签（label）。你不需要现
python创建sqlite3数据库_SQLite – Python | 菜鸟教程 weixin_39683144
SQLite-Python安装SQLite3可使用sqlite3模块与Python进行集成。sqlite3模块是由GerhardHaring编写的。它提供了一个与PEP249描述的DB-API2.0规范兼容的SQL接口。您不需要单独安装该模块，因为Python2.5.x以上版本默认自带了该模块。为了使用sqlite3模块，您首先必须创建一个表示数据库的连接对象，然后您可以有选择地创建光标对象，这将
宋红康 MySQL高级篇学习笔记偷偷儿 mysql 学习笔记
架构篇1.sql的执行流程查询缓存：有就直接返回了。解析器进行解析：检查sql合不合语法优化器：对sql语句进行逻辑优化，看是否使用索引，生成执行计划。存贮引擎：myisam,innodb去执行上述计划当然返回的时候也会在缓存一下结果。索引及调优篇1.InnoDBB+树索引的注意事项（页分裂的场景）1.根页面万年不动（页分裂）：创建后，用户数据用完可用空间，就会新产生一个页a，并将根节点的数据复制
Python根据日历算排班表装小蜜监理王志峰 python 开发语言
Python,开发者相关视频讲解：python的or运算赋值用法用python编程Excel有没有用处？011_编程到底好玩在哪？查看python文件_输出py文件_cat_运行python文件_shel如何实现Python根据日历算排班表简介作为一名经验丰富的开发者，我将教你如何用Python根据日历来算排班表。这是一个常见且实用的功能，在很多公司和组织都有类似的需求。在这篇文章中，我将通过步骤
Python爬虫——网站基本信息 IT·小灰灰 python 爬虫开发语言网络
在智能时代，数据是新的石油。Python爬虫技术赋予了我们成为数据猎人的能力，让我们能够在网络的广袤土地上狩猎，为机器学习和人工智能的发展提供燃料目录一、介绍——Python二、介绍——Python爬虫1.请求库2.解析库3.数据存储4.多线程/多进程5.异步编程6.代理和反爬虫7.爬虫框架8.爬虫的法律和道德问题9.异常处理10.日志记录三、爬虫示例代码一、介绍——PythonPython是一种
使用Docker搭建Flink集群 O_1CxH Flink大数据 Kafka大数据 docker flink 容器
目录使用Docker搭建Flink集群docker-compose一键搭建步骤附录参考资料使用Docker搭建Flink集群在学习大数据框架的时候，需要一个真实的环境。我们知道，像spark、flink这些计算框架都有多种运行模式：在本地使用多线程模拟集群真正的分布式集群如果直接在IDE（Intellj）里面编译和运行写好的程序，实际上是用的前一种运行模式；如果想尝试真正的生产环境中任务的提交和管
Vue 2 路由指南：从基础到高级鸡吃丸子 vue.js 前端 javascript 前端框架
注意：对于代码看不清的部分，用鼠标选中就能看到了，背景颜色和字体颜色过于接近，我也不知道怎么调，只能这样子先看着了一、VueRouter是什么？VueRouter是Vue.js官方的路由管理器，它允许你在单页面应用中通过不同的URL显示不同的组件。VueRouter与Vue.js核心深度集成，提供了声明式的路由定义、嵌套路由、动态路由、导航守卫等功能，帮助开发者构建复杂的单页面应用。二、安装与配置
iOS http封装 374016526 ios 服务器交互 http 网络请求
程序开发避免不了与服务器的交互，这里打包了一个自己写的http交互库。希望可以帮到大家。内置一个basehttp，当我们创建自己的service可以继承实现。 KuroAppBaseHttp *baseHttp = [[KuroAppBaseHttp alloc] init]; [baseHttp setDelegate:self]; [baseHttp
lolcat ：一个在 Linux 终端中输出彩虹特效的命令行工具 brotherlamp linux linux教程 linux视频 linux自学 linux资料
那些相信 Linux 命令行是单调无聊且没有任何乐趣的人们，你们错了，这里有一些有关 Linux 的文章，它们展示着 Linux 是如何的有趣和“淘气” 。在本文中，我将讨论一个名为“lolcat”的小工具 – 它可以在终端中生成彩虹般的颜色。何为 lolcat ? Lolcat 是一个针对 Linux，BSD 和 OSX 平台的工具，它类似于 cat 命令，并为 cat
MongoDB索引管理（1）——[九] eksliang mongodb MongoDB管理索引
转载请出自出处：http://eksliang.iteye.com/blog/2178427 一、概述数据库的索引与书籍的索引类似，有了索引就不需要翻转整本书。数据库的索引跟这个原理一样，首先在索引中找，在索引中找到条目以后，就可以直接跳转到目标文档的位置，从而使查询速度提高几个数据量级。不使用索引的查询称
Informatica参数及变量 18289753290 Informatica 参数变量
下面是本人通俗的理解，如有不对之处，希望指正 info参数的设置：在info中用到的参数都在server的专门的配置文件中（最好以parma）结尾下面的GLOBAl就是全局的，$开头的是系统级变量，$$开头的变量是自定义变量。如果是在session中或者mapping中用到的变量就是局部变量，那就把global换成对应的session或者mapping名字。 [GLOBAL] $Par
python 解析unicode字符串为utf8编码字符串酷的飞上天空 unicode
php返回的json字符串如果包含中文，则会被转换成\uxx格式的unicode编码字符串返回。在浏览器中能正常识别这种编码，但是后台程序却不能识别，直接输出显示的是\uxx的字符，并未进行转码。转换方式如下 >>> import json >>> q = '{"text":"\u4
Hibernate的总结永夜-极光 Hibernate
1.hibernate的作用,简化对数据库的编码,使开发人员不必再与复杂的sql语句打交道做项目大部分都需要用JAVA来链接数据库，比如你要做一个会员注册的页面，那么获取到用户填写的基本信后，你要把这些基本信息存入数据库对应的表中，不用hibernate还有mybatis之类的框架，都不用的话就得用JDBC，也就是JAVA自己的，用这个东西你要写很多的代码，比如保存注册信
SyntaxError: Non-UTF-8 code starting with '\xc4' 随便小屋 python
刚开始看一下Python语言，传说听强大的，但我感觉还是没Java强吧！写Hello World的时候就遇到一个问题，在Eclipse中写的，代码如下 ''' Created on 2014年10月27日 @author: Logic ''' print("Hello World!"); 运行结果 SyntaxError: Non-UTF-8
学会敬酒礼仪不做酒席菜鸟 aijuans 菜鸟
俗话说，酒是越喝越厚，但在酒桌上也有很多学问讲究，以下总结了一些酒桌上的你不得不注意的小细节。细节一：领导相互喝完才轮到自己敬酒。敬酒一定要站起来，双手举杯。细节二：可以多人敬一人，决不可一人敬多人，除非你是领导。细节三：自己敬别人，如果不碰杯，自己喝多少可视乎情况而定，比如对方酒量，对方喝酒态度，切不可比对方喝得少，要知道是自己敬人。细节四：自己敬别人，如果碰杯，一
《创新者的基因》读书笔记 aoyouzi 读书笔记《创新者的基因》
创新者的基因创新者的“基因”，即最具创意的企业家具备的五种“发现技能”：联想，观察，实验，发问，建立人脉。第一部分破坏性创新，从你开始第一章破坏性创新者的基因如何获得启示：发现以下的因素起到了催化剂的作用：(1) -个挑战现状的问题；(2)对某项技术、某个公司或顾客的观察；(3) -次尝试新鲜事物的经验或实验；(4)与某人进行了一次交谈，为他点醒
表单验证技术百合不是茶 JavaScript DOM对象 String对象事件
js最主要的功能就是验证表单,下面是我对表单验证的一些理解,贴出来与大家交流交流 ,数显我们要知道表单验证需要的技术点, String对象,事件,函数一:String对象;通常是对字符串的操作; 1,String的属性; 字符串.length;表示该字符串的长度; var str= "java"
web.xml配置详解之context-param bijian1013 java servlet web.xml context-param
一.格式定义： <context-param> <param-name>contextConfigLocation</param-name> <param-value>contextConfigLocationValue></param-value> </context-param> 作用：该元
Web系统常见编码漏洞（开发工程师知晓） Bill_chen sql PHP Web fckeditor 脚本
1.头号大敌：SQL Injection 原因：程序中对用户输入检查不严格，用户可以提交一段数据库查询代码，根据程序返回的结果，获得某些他想得知的数据，这就是所谓的SQL Injection，即SQL注入。本质: 对于输入检查不充分，导致SQL语句将用户提交的非法数据当作语句的一部分来执行。示例： String query = "SELECT id FROM users
【MongoDB学习笔记六】MongoDB修改器 bit1129 mongodb
本文首先介绍下MongoDB的基本的增删改查操作，然后，详细介绍MongoDB提供的修改器，以完成各种各样的文档更新操作 MongoDB的主要操作 show dbs 显示当前用户能看到哪些数据库 use foobar 将数据库切换到foobar show collections 显示当前数据库有哪些集合 db.people.update，update不带参数，可
提高职业素养，做好人生规划白糖_ 人生
培训讲师是成都著名的企业培训讲师，他在讲课中提出的一些观点很新颖，在此我收录了一些分享一下。注：讲师的观点不代表本人的观点，这些东西大家自己揣摩。 1、什么是职业规划：职业规划并不完全代表你到什么阶段要当什么官要拿多少钱，这些都只是梦想。职业规划是清楚的认识自己现在缺什么，这个阶段该学习什么，下个阶段缺什么，又应该怎么去规划学习，这样才算是规划。
国外的网站你都到哪边看？ bozch 技术网站国外
学习软件开发技术，如果没有什么英文基础，最好还是看国内的一些技术网站，例如：开源OSchina，csdn，iteye,51cto等等。个人感觉如果英语基础能力不错的话，可以浏览国外的网站来进行软件技术基础的学习，例如java开发中常用的到的网站有apache.org 里面有apache的很多Projects,springframework.org是spring相关的项目网站,还有几个感觉不错的
编程之美-光影切割问题 bylijinnan 编程之美
package a; public class DisorderCount { /**《编程之美》“光影切割问题” * 主要是两个问题： * 1.数学公式（设定没有三条以上的直线交于同一点）： * 两条直线最多一个交点，将平面分成了4个区域； * 三条直线最多三个交点，将平面分成了7个区域； * 可以推出：N条直线 M个交点，区域数为N+M+1。
关于Web跨站执行脚本概念 chenbowen00 Web 安全跨站执行脚本
跨站脚本攻击(XSS)是web应用程序中最危险和最常见的安全漏洞之一。安全研究人员发现这个漏洞在最受欢迎的网站,包括谷歌、Facebook、亚马逊、PayPal,和许多其他网站。如果你看看bug赏金计划,大多数报告的问题属于 XSS。为了防止跨站脚本攻击,浏览器也有自己的过滤器,但安全研究人员总是想方设法绕过这些过滤器。这个漏洞是通常用于执行cookie窃取、恶意软件传播,会话劫持,恶意重定向。在
[开源项目与投资]投资开源项目之前需要统计该项目已有的用户数 comsci 开源项目
现在国内和国外,特别是美国那边,突然出现很多开源项目,但是这些项目的用户有多少,有多少忠诚的粉丝,对于投资者来讲,完全是一个未知数,那么要投资开源项目,我们投资者必须准确无误的知道该项目的全部情况,包括项目发起人的情况,项目的维持时间..项目的技术水平,项目的参与者的势力,项目投入产出的效益.....
oracle alert log file（告警日志文件） daizj oracle 告警日志文件 alert log file
The alert log is a chronological log of messages and errors, and includes the following items: All internal errors (ORA-00600), block corruption errors (ORA-01578), and deadlock errors (ORA-00060)
关于 CAS SSO 文章声明 denger SSO
由于几年前写了几篇 CAS 系列的文章，之后陆续有人参照文章去实现，可都遇到了各种问题，同时经常或多或少的收到不少人的求助。现在这时特此说明几点： 1. 那些文章发表于好几年前了，CAS 已经更新几个很多版本了，由于近年已经没有做该领域方面的事情，所有文章也没有持续更新。 2. 文章只是提供思路，尽管 CAS 版本已经发生变化，但原理和流程仍然一致。最重要的是明白原理，然后
初二上学期难记单词 dcj3sjt126com english word
lesson 课 traffic 交通 matter 要紧；事物 happy 快乐的，幸福的 second 第二的 idea 主意；想法；意见 mean 意味着 important 重要的，重大的 never 从来，决不 afraid 害怕的 fifth 第五的 hometown 故乡，家乡 discuss 讨论；议论 east 东方的 agree 同意；赞成 bo
uicollectionview 纯代码布局, 添加头部视图 dcj3sjt126com Collection
#import <UIKit/UIKit.h> @interface myHeadView : UICollectionReusableView { UILabel *TitleLable; } -(void)setTextTitle; @end #import "myHeadView.h" @implementation m
N 位随机数字串的 JAVA 生成实现 FX夜归人 java Math 随机数 Random
/** * 功能描述随机数工具类<br /> * @author FengXueYeGuiRen * 创建时间 2014-7-25<br /> */ public class RandomUtil { // 随机数生成器 private static java.util.Random random = new java.util.R
Ehcache（09）——缓存Web页面 234390216 ehcache 页面缓存
页面缓存目录 1 SimplePageCachingFilter 1.1 calculateKey 1.2 可配置的初始化参数 1.2.1 cach
spring中少用的注解@primary解析 jackyrong primary
这次看下spring中少见的注解@primary注解，例子 @Component public class MetalSinger implements Singer{ @Override public String sing(String lyrics) { return "I am singing with DIO voice
Java几款性能分析工具的对比 lbwahoo java
Java几款性能分析工具的对比摘自：http://my.oschina.net/liux/blog/51800 在给客户的应用程序维护的过程中，我注意到在高负载下的一些性能问题。理论上，增加对应用程序的负载会使性能等比率的下降。然而，我认为性能下降的比率远远高于负载的增加。我也发现，性能可以通过改变应用程序的逻辑来提升，甚至达到极限。为了更详细的了解这一点，我们需要做一些性能
JVM参数配置大全 nickys jvm 应用服务器
JVM参数配置大全 /usr/local/jdk/bin/java -Dresin.home=/usr/local/resin -server -Xms1800M -Xmx1800M -Xmn300M -Xss512K -XX:PermSize=300M -XX:MaxPermSize=300M -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=5 -
搭建 CentOS 6 服务器(14) - squid、Varnish rensanning varnish
（一）squid 安装 # yum install httpd-tools -y # htpasswd -c -b /etc/squid/passwords squiduser 123456 # yum install squid -y 设置 # cp /etc/squid/squid.conf /etc/squid/squid.conf.bak # vi /etc/
Spring缓存注解@Cache使用 tom_seed spring
参考资料 http://www.ibm.com/developerworks/cn/opensource/os-cn-spring-cache/ http://swiftlet.net/archives/774 缓存注解有以下三个： @Cacheable @CacheEvict @CachePut
dom4j解析XML时出现"java.lang.noclassdeffounderror: org/jaxen/jaxenexception"错误 xp9802
java.lang.NoClassDefFoundError: org/jaxen/JaxenExc 关键字: java.lang.noclassdeffounderror: org/jaxen/jaxenexception 使用dom4j解析XML时，要快速获取某个节点的数据，使用XPath是个不错的方法，dom4j的快速手册里也建议使用这种方式执行时却抛出以下异常： Exceptio

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他