数据魅力(DataCharm)

绘图提高篇 | Python - IDW插值计算及可视化绘制

前面几篇推文我们分辨介绍了使用Python和R绘制了二维核密度空间插值方法，并使用了Python可视化库plotnine、Basemap以及R的ggplot2完成了相关可视化教程的绘制推文，详细内容如下：

Python-plotnine 核密度空间插值可视化绘制
Python-Basemap核密度空间插值可视化绘制
R-ggplot2+sf 核密度空间插值可视化绘制

接下来，我们将继续介绍空间插值的其他方法，本期推文，我们将介绍IDW(反距离加权法（Inverse Distance Weighted）) 插值的Python计算方法及插值结果的可视化绘制过程。主要涉及的知识点如下：

IDW简介
自定义Python代码计算空间IDW
分别使用plotnine、Basemap进行IDW插值结果可视化绘制

IDW简介

反距离权重 (IDW) 插值假设：彼此距离较近的事物要比彼此距离较远的事物更相似。当为任何未测量的位置预测值时，反距离权重法会采用预测位置周围的测量值与距离预测位置较远的测量值相比，距离预测位置最近的测量值对预测值的影响更大。反距离权重法假定每个测量点都有一种局部影响，而这种影响会随着距离的增大而减小。由于这种方法为距离预测位置最近的点分配的权重较大，而权重却作为距离的函数而减小，因此称之为反距离权重法。(解释来源于网络)，繁琐的公式也没放，这里我们给出几张示意图即可，原理不解的小伙伴可自行百度。

（基于采样点距离的IDW插值（左）从高程矢量点插值的IDW曲面（右））

自定义Python代码计算空间IDW

我们免去了了繁琐的IDW插值原理部分，这节我们直接根据原理自定义IDW函数，根据已有样例站点位置及对应值，计算IDW结果。在这之前，我们给出所需样例的预览及地图文件的范围(构建插值网格所需)，结果如下：

样例点：

地图文件范围信息：

js_box = js.geometry.total_bounds
js_box
#array([116.36196 ,  30.757975, 121.975185,  35.122924])

小伙伴们对上述计算结果有疑惑的地方可以详细阅读之前的插值文章(文前链接)，或者等我将这系列做完会推出详细的源码及解释文档(目前在整理中)

定义IDW计算函数

这里主要涉及两个计算函数，计算经纬度点转实际距离(km)的haversine方法和计算IDW的函数，定义函数如下：

haversine方法:

import math
import numpy as np
#更换求距离的函数
from math import radians, cos, sin, asin, sqrt

def haversine(lon1, lat1, lon2, lat2):
    R =  6372.8
    dLon = radians(lon2 - lon1)
    dLat = radians(lat2 - lat1)
    lat1 = radians(lat1)
    lat2 = radians(lat2)
    a = sin(dLat/2)**2 + cos(lat1)*cos(lat2)*sin(dLon/2)**2
    c = 2*asin(sqrt(a))
    d = R * c
    return d

IDW

def IDW(x, y, z, xi, yi):
    lstxyzi = []
    for p in range(len(xi)):
        lstdist = []
        for s in range(len(x)):
            d = (haversine(x[s], y[s], xi[p], yi[p]))
            lstdist.append(d)
        sumsup = list((1 / np.power(lstdist, 2)))
        suminf = np.sum(sumsup)
        sumsup = np.sum(np.array(sumsup) * np.array(z))
        u = sumsup / suminf
        xyzi = [xi[p], yi[p], u]
        lstxyzi.append(xyzi)
    return(lstxyzi)

计算所需插值的网格

这里直接给出代码，阶段的结果需要更具上面的函数计算对应网格点出的IDW结果，这样就可以实现插值操作，代码如下：

js_box = js.geometry.total_bounds
#还是插入400*400的网格点
grid_lon = np.linspace(js_box[0],js_box[2],400)
grid_lat = np.linspace(js_box[1],js_box[3],400)
xgrid, ygrid = np.meshgrid(grid_lon, grid_lat)

较为简单，这里就不作多解释。

计算IDW结果

结合上面两个部分，我们进行了IDW插值结果，具体计算结果如下：

#将插值网格数据整理
df_grid =pd.DataFrame(dict(long=xgrid.flatten(),lat=ygrid.flatten()))
#这里将数组转成列表
grid_lon_list = df_grid["long"].tolist()
grid_lat_list = df_grid["lat"].tolist()

pm_idw = IDW(know_lon,know_lat,know_z,grid_lon_list,grid_lat_list)
IDW_grid_df = pd.DataFrame(pm_idw,columns=["lon","lat","idw_value"])
IDW_grid_df.head()

这样就可以得到IDW插值后的DF类型数据了，结果如下(部分）：

可视化绘制

有了规整完的插值结果，那么接下来绘制可视化结果也就非常简单了，方法和之前的几篇推文类似，具体如下：

plotnine绘制

首先，我们还是给出样例点及对应值的映射散点图，绘图过程如下：

「散点图绘制」

import plotnine
from plotnine import *
plotnine.options.figure_size = (5, 4.5)
idw_scatter = (ggplot() +
           geom_map(js,fill='none',color='gray',size=0.4) +
           geom_point(pm,aes(x='经度',y='纬度',fill='PM2.5'),size=5) +
           scale_fill_cmap(cmap_name='Spectral_r',name='PM2.5',
                           breaks=[30,40,60,80]
                           )+
           scale_x_continuous(breaks=[117,118,119,120,121,122])+
           labs(title="Map Charts in Python Exercise 02: Map IDM point",
                )+
           #添加文本信息
           annotate('text',x=116.5,y=35.3,label="processed map charts with plotnine",ha="left",
                   size=10)+
           annotate('text',x=120,y=30.6,label="Visualization by DataCharm",ha="left",size=9)+
           theme(
               text=element_text(family="Roboto Condensed"),
               #修改背景
               panel_background=element_blank(),
               axis_ticks_major_x=element_blank(),
               axis_ticks_major_y=element_blank(),
               axis_text=element_text(size=12),
               axis_title = element_text(size=14,weight="bold"),
               panel_grid_major_x=element_line(color="gray",size=.5),
               panel_grid_major_y=element_line(color="gray",size=.5),
            ))
idw_scatter

可视化结果如下：

「IDW插值结果绘制」

idw_scatter_inter = (ggplot() +
           geom_tile(IDW_grid_df,aes(x='lon',y='lat',fill='idw_value'),size=0.1) +
           geom_map(js,fill='none',color='gray',size=0.4) +
           geom_point(pm,aes(x='经度',y='纬度',fill='PM2.5'),size=4,stroke=.3,show_legend=False) +
           scale_fill_cmap(cmap_name='Spectral_r',name='idw_value',
                           breaks=[30,40,60,80]
                           )+
           scale_x_continuous(breaks=[117,118,119,120,121,122])+
           labs(title="Map Charts in Python Exercise 02: Map IDM point",
                )+
           #添加文本信息
           annotate('text',x=116.5,y=35.3,label="processed map charts with plotnine",ha="left",
                   size=10)+
           annotate('text',x=120,y=30.6,label="Visualization by DataCharm",ha="left",size=9)+
           theme(
               text=element_text(family="Roboto Condensed"),
               #修改背景
               panel_background=element_blank(),
               axis_ticks_major_x=element_blank(),
               axis_ticks_major_y=element_blank(),
               axis_text=element_text(size=12),
               plot_title=element_text(size=15,weight="bold"),
               axis_title = element_text(size=14),
               panel_grid_major_x=element_line(color="gray",size=.5),
               panel_grid_major_y=element_line(color="gray",size=.5),
            ))
idw_scatter_inter

可视化结果如下：

这里加上了散点是为了更好的对比插值结果，不加的效果如下：

裁剪操作

对研究区域的结果进行裁剪，在之前的推文中我们介绍了很多次，这里主要使用geopandas的clip() 方法进行操作，具体过程不再赘述(可以看我之前的推文教程)，我们直接给出裁剪结果：

Basemap绘制

上面介绍了plotnine包进行绘制的，这里我们再使用Basemap进行绘制，直接给出绘图代码：

from mpl_toolkits.basemap import Basemap

jiangsu_shp = r"F:\DataCharm\shpfile_data\JS\江苏省_行政边界"
fig,ax = plt.subplots(figsize=(6,4.5),dpi=130,facecolor="white")
map_base = Basemap(llcrnrlon=js_box[0], urcrnrlon=js_box[2], llcrnrlat=js_box[1],urcrnrlat=js_box[3],
                  projection="cyl",lon_0 = 119,lat_0 = 33,ax = ax)
# lat = np.arange(30,36,1)
# lon = np.arange(116,122,1)
map_base.drawparallels(np.arange(30,36,1), labels=[1,0,0,0],fontsize=12,zorder=0) #画纬度线
map_base.drawmeridians(np.arange(116,122,1), labels=[0,0,0,1],fontsize=12,zorder=0) #画经度线
map_base.readshapefile(shapefile = jiangsu_shp, name = "Js", default_encoding="ISO-8859-1",
                       drawbounds=True)
cp=map_base.pcolormesh(xgrid, ygrid, data=idw_grid,cmap='Spectral_r')  
#ct=map_base.contour(xgrid, ygrid, data=idw_grid,colors='w',linewidths=.7)
#添加散点
vmin = pm["PM2.5"].min()
vmax = pm["PM2.5"].max()
ax.scatter(pm['经度'],pm["纬度"],c=pm["PM2.5"],s=90,ec="k",lw=0.5,cmap="Spectral_r",
           vmin=vmin,vmax=vmax)


colorbar = map_base.colorbar(cp,size='3%',pad="5%",label="IDW_inter")
#设置colorbar
colorbar.outline.set_edgecolor('none')

for spine in ['top','left','right','bottom']:
    ax.spines[spine].set_visible(None) #隐去轴脊

ax.text(.5,1.1,"Map Charts in Python Exercise 02:Map IDW Grid Charts",transform = ax.transAxes,ha='center', 
        va='center',fontweight="bold",fontsize=14)
ax.text(.5,1.03, "processed map charts with Basemap",
        transform = ax.transAxes,ha='center', va='center',fontsize = 10,color='black')
ax.text(.83,-.06,'\nVisualization by DataCharm',transform = ax.transAxes,
        ha='center', va='center',fontsize = 8,color='black')

可视化结果如下：

裁剪操作

裁剪的才做也在之前的推文中介绍多次，这里我们直接给出结果哈：

当然，你也可以通过basemap.contour() 添加二维等值线，可视化结果如下：

总结

这是IDW插值的第一篇推文教程，好多原理的部分也没有介绍，这里是自定义函数进行插值计算的，当然也是有优秀的第三方包可以完成。下次的R-ggplot2版本的IDW插值我们将使用现有的优秀三方包进行计算操作。文中有很多重复的知识点没有详细介绍，大家可以查看之前的推文，或者等这个系列完成后的详细源码、数据、解释文档的分享哈！(文中出错的地方小伙伴们可以私聊指出或者加群讨论哈)

你可能感兴趣的:(数据可视化,python,数据可视化,论文阅读,r语言)

sorted() 函数：排序的利器 01_6 深度学习计算机视觉opencv 数据结构 opencv 计算机视觉人工智能图像 python
目录一、sorted()函数简介二、函数使用示例示例1：对列表进行排序示例2：对字符串进行排序示例3：指定排序键三、参数详细介绍1、key参数2、reverse参数四、高级用法1、自定义排序键函数2、多级排序五、总结一、sorted()函数简介sorted()函数是Python中的内置函数，用于对可迭代对象进行排序。它的基本语法如下：sorted(iterable,key=None,reverse
Python定位Span标签中的文字：实战指南傻啦嘿哟 python 开发语言
目录一、准备工作二、基本流程三、代码示例四、案例分析五、进阶技巧处理多个标签：根据其他属性定位：结合XPath：使用Selenium：六、注意事项七、总结在网页数据抓取和信息提取的过程中，经常需要定位并获取HTML中特定标签的内容。其中，标签是一个常见的内联元素，用于对文本进行分组或应用样式。本文将详细介绍如何使用Python来定位并提取标签中的文字，通过具体的代码示例和案例，帮助读者快速掌握这一
chatgpt赋能python：如何配置Python中的NumPy？ yakuchrisfor ChatGpt chatgpt python numpy 计算机
如何配置Python中的NumPy？如果您是一名Python程序员，那么您可能已经听说过NumPy。NumPy是一个强大的Python库，可用于处理大型多维数组和矩阵，以及用于数值计算和科学计算。因此，NumPy是数据科学中的黄金库，而它的安装是Python编程环境必不可少的一部分。什么是NumPy？NumPy是Python语言的一个扩展程序库，它支持大量的高级数学函数，以及可以高效地操作大型数组
把Python的pip源修改为国内亦安✘ python 开发语言
我们在用pip下载时访问的是国外pip源超级慢，因此可将源改为国内的镜像，就能飞速的下载,可临时修改，也可永久修改国内pip源：豆瓣http://pypi.douban.com/华中理工大学http://pypi.hustunique.com/山东理工大学http://pypi.sdutlinux.org/中国科学技术大学http://pypi.mirrors.ustc.edu.cn/阿里云htt
Python中如何获取HTTP请求的Response Body 傻啦嘿哟关于python那些事儿 python http 开发语言
目录一、引言二、使用urllib库获取ResponseBody1.基本用法2.发送POST请求三、使用requests库获取ResponseBody1.安装requests库2.基本用法3.发送POST请求4.处理JSON响应四、高级用法1.处理请求头2.设置超时3.处理Cookies五、案例：爬取网页内容六、总结在Python中进行网络编程和Web开发时，经常需要发送HTTP请求并处理服务器返回
Python pip更换国内源王阿菜 python
1.Pycharm内更换File-->Settings-->Project:*****-->PythonInterpreter点击加号-->MangeRepositories选择PIP的地址，修改成国内源-->保存2.Windows上修改在本机的user目录下新建一个pip目录，新建文件pip.ini，代码如下：[global]index-url=https://pypi.tuna.tsinghu
python 合并word文件_merge: 利用Python，合并多个MarkDown文档，并将其转化为Word文档。... weixin_39562606 python 合并word文件
merge项目介绍利用Python，合并多个MarkDown文档，并将其转化为Word文档。这样可以利用事先做好的word文档样式，一定程度上实现word文档的内容与样式分离，减少使用word时重复设置格式的烦恼。安装教程需要安装pandoc，并能全局运行。brewinstallpandoc需要安装python3。brewinstallpython3将merge.py复制到合适路径，并给予运行权限
python post body_python写http post请求的四种请求体 weixin_39606575 python post body
HTTP协议规定POST提交的数据必须放在消息主体(entity-body)中，但协议并没有规定数据必须使用什么编码方式。常见的四种编码方式如下：1、application/x-www-form-urlencoded这应该是最常见的POST提交数据的方式了。浏览器的原生form表单，如果不设置enctype属性，那么最终就会以application/x-www-form-urlencoded方式提
Tox-uv：Python测试环境搭建的新利器码农工具百宝箱码农小工具 python uv 人工智能
在Python开发中，测试环境的搭建是一个不可或缺的环节。传统的虚拟环境管理工具如virtualenv和pip虽然功能强大，但在某些场景下可能存在性能瓶颈。为了解决这一问题，tox-uv应运而生，它是一个tox插件，旨在用uv工具替代virtualenv和pip，以提升测试环境搭建的性能。Tox-uv简介tox-uv是一个创新的tox插件，它通过使用uv工具来创建和管理虚拟环境，从而提高了Pyth
ESP8266开发环境搭建 D_kity ESP8266 iot 物联网 c语言
1、工具安装sudoapt-getinstallgccgitwgetmakelibncurses-devflexbisongperfpythonpython-serial2、下载编译工具or64-bitLinux:https://dl.espressif.com/dl/xtensa-lx106-elf-gcc8_4_0-esp-2020r3-linux-amd64.tar.gzfor32-bitL
pip 修改国内源 sftxlin pip
在Windows系统中修改Python的pip源，可以让你更快地安装Python包，特别是在中国地区，使用国内的源可以显著提高下载速度。下面是详细的步骤：打开命令提示符按下Win+R键，输入cmd，然后按下回车，打开命令提示符。创建或修改pip配置文件在命令提示符中输入以下命令，以创建或修改pip配置文件：arduinoCopycodepipconfigsetglobal.index-urlhtt
Python 修改 pip 源为国内源人生嘚节奏 python pip 开发语言
1.临时换源：#清华源pipinstallmarkdown-ihttps://pypi.tuna.tsinghua.edu.cn/simple#阿里源pipinstallmarkdown-ihttps://mirrors.aliyun.com/pypi/simple/#腾讯源pipinstallmarkdown-ihttp://mirrors.cloud.tencent.com/pypi/simp
新的Python库、项目管理工具——uv CS创新实验室 Python python uv 开发语言
uv是一个由Astral团队开发的高性能Python包和项目管理工具。Astral团队也是广受欢迎的Ruff（一个极速的Pythonlinter）的开发者。uv的目标是成为Python生态中的“一站式”工具，取代传统的工具链（如pip、pip-tools、virtualenv、poetry等），同时提供更快的速度和更强大的功能。uv的核心优势在于其极快的速度和多功能性。它基于Rust编写，充分利用
Python将Markdown格式转为HTML：轻松实现博客文章的自动化处理木头左 python办公自动化 python html 自动化
哈喽，大家好，我是木头左！引言编写一篇高质量的博客文章并非易事，尤其是在排版和格式方面。Markdown作为一种轻量级的标记语言，为博主们提供了一种简洁、高效的写作方式。而Python作为一门强大的编程语言，可以帮助将Markdown格式的文本转换为HTML，从而实现博客文章的自动化处理。安装所需库要实现Markdown转HTML的功能，需要安装两个Python库：markdown和html。可以
Tex转化为Word文件的R语言方法风华绚烂 word r语言 c#R语言
Tex转化为Word文件的R语言方法Tex和Word是两种常用的文档编辑工具，它们各自具有不同的特点和用途。有时候，我们可能需要将Tex格式的文档转化为Word格式，以便与他人共享或进一步编辑。在R语言中，我们可以使用一些包和函数来实现这个目标。首先，我们需要安装rmarkdown包，它提供了将RMarkdown文档转化为多种格式的功能，包括将Tex转化为Word。可以通过以下命令安装rmarkd
[Python] MacOS 修改 pip 源为国内源 Cassius_Zeo python python macos pip
Step1：创建.pip文件夹mkdir~/.pipStep2:设置国内源（如果你是python3,需将pip修改为pip3）--清华源pipconfigsetglobal.index-urlhttps://pypi.tuna.tsinghua.edu.cn/simple--阿里源pipconfigsetglobal.index-urlhttps://
python3各个版本是通用的吗-python有几个版本 weixin_37988176
Python的3.0版本，常被称为Python3000，或简称Py3k。相对于Python的早期版本，这是一个较大的升级。为了不带入过多的累赘，Python3.0在设计的时候没有考虑向下相容。许多针对早期Python版本设计的程式都无法在Python3.0上正常执行。为了照顾现有程式，Python2.6作为一个过渡版本，基本使用了Python2.x的语法和库，同时考虑了向Python3.0的迁移，
【Python报错】已解决NameError: name ‘Image‘ is not defined 云天徽上 python 开发语言 numpy pandas 机器学习
解决Python报错：NameError:name‘Image’isnotdefined在使用Python进行图像处理时，我们经常使用Pillow库（PIL的一个分支）。如果你在尝试创建或处理图像时遇到了NameError:name'Image'isnotdefined的错误，这通常意味着你的代码中存在一些问题。本文将介绍这种错误的原因和解决办法。错误原因NameError:name'Image'
爬虫基础（四）线程和进程及相关知识点 A.sir啊网络爬虫必备知识点服务器网络网络爬虫 python pycharm
目录一、线程和进程（1）进程（2）线程（3）区别二、串行、并发、并行（1）串行（2）并行（3）并发三、爬虫中的线程和进程（1）GIL锁（2）爬虫的多线程（3）Python的多进程一、线程和进程（1）进程所谓进程，就是正在运行的程序，它占用独立的内存区域用通俗的话来说：我们打开媒体播放器，就是打开了一个媒体播放器进程，打开浏览器，就是打开了一个浏览器进程，打开某软件，就是打开了某软件进程。这三个进程
Python干货总结篇：列表、字典、集合、元组的区别与用途 A.sir啊用人话讲计算机：Python篇 python pycharm 青少年编程
前言：更详细知识点，搞懂列表、字典、集合、元组到底是什么，可关注主页文章：Python知识点精汇！目录一、特点与用途1.列表：a=[]2.集合：a={}3.字典：a={key:value}4.元组：a=()二、图表总结一、特点与用途1.列表：a=[]特点：有序：列表中的元素有固定的顺序，可以通过索引访问。可变：列表是可变的，可以修改、添加和删除元素。允许重复：列表允许重复的元素。用途：适用于需要保
【2024年华为OD机试】(B卷,200分)- 字符串化繁为简（JavaScript&Java & Python&C/C++）妄北y 算法汇集笔记总结(保姆级)华为od javascript java c语言 python
一、问题描述题目描述给定一个输入字符串，字符串只可能由英文字母（‘a’~‘z’、‘A’~‘Z’）和左右小括号（‘(’、‘)’）组成。当字符里存在小括号时，小括号是成对的，可以有一个或多个小括号对，小括号对不会嵌套，小括号对内可以包含1个或多个英文字母，也可以不包含英文字母。当小括号对内包含多个英文字母时，这些字母之间是相互等效的关系，而且等效关系可以在不同的小括号对之间传递。即当存在‘a’和‘b’
NumPy 字符串函数 wjs2024 开发语言
NumPy字符串函数引言NumPy是Python中一个强大的科学计算库，它提供了高效的数值计算功能。除了强大的数值处理能力外，NumPy还提供了一系列用于字符串处理的函数，这些函数对于数据清洗和预处理非常有用。本文将详细介绍NumPy中常用的字符串函数，帮助您更好地理解和运用这些函数。NumPy字符串函数概述NumPy字符串函数主要分为以下几类：字符串连接与分割字符串搜索与替换字符串转换与格式化字
Eclipse 编译项目 wjs2024 开发语言
Eclipse编译项目Eclipse是一个广泛使用的集成开发环境（IDE），它支持多种编程语言，包括Java、C/C++和Python。在Eclipse中编译项目是一个基本但重要的过程，确保代码的正确性和运行效率。本文将详细介绍在Eclipse中编译项目的步骤，包括配置、常见问题及其解决方案。1.配置Eclipse环境在开始编译项目之前，确保您的Eclipse环境已经正确配置。这包括安装适当的编程
Django 模型 wjs2024 开发语言
Django模型Django模型是Django框架的核心组件之一，它用于定义应用程序的数据结构。在Django中，模型是Python类，通常继承自django.db.models.Model。每个模型类代表数据库中的一个表，模型类的属性对应表中的字段。1.创建模型创建Django模型非常简单。首先，你需要定义一个继承自django.db.models.Model的类，然后在类中定义模型字段。例如，
python封装sql脚本_Python数据库封装实现代码示例解析 weixin_39647412 python封装sql脚本
Django中(原生mysql封装)1.函数封装importpymysql#查所数据defget_all(sql):conn=pymysql.connect(host="localhost",user="root",password="root",database="db6")cur=conn.cursor(cursor=pymysql.cursors.DictCursor)cur.execute
Python连接Oracle数据库：cx_Oracle与oracledb库的比较与选择码上富贵数据库 python oracle
文章目录一、概述cx_Oracleoracledb二、安装OracleInstantclient三、Python测试cx_Oracle：oracledb：一、概述Python访问Oracle可以通过两种Oracle官方库：旧驱动：cx_Oracle（需要安装OracleInstantclient）新驱动：oracledb（Oracle数据库12.1或更高版本不需要安装OracleInstantcl
【python】在【机器学习】与【数据挖掘】中的应用：从基础到【AI大模型】小李很执着杂乱无章机器学习数据挖掘 python 人工智能语言模型
目录一、Python在数据挖掘中的应用1.1数据预处理数据清洗数据变换数据归一化高级预处理技术1.2特征工程特征选择特征提取特征构造二、Python在机器学习中的应用2.1监督学习分类回归2.2非监督学习聚类降维三、Python在深度学习中的应用3.1深度学习框架TensorFlowPyTorch四、Python在AI大模型中的应用4.1大模型简介4.2GPT-4o实例五、实例验证5.1数据集介绍
spark和python的区别_Spark入门(Python) weixin_39934257 spark和python的区别
Spark是第一个脱胎于该转变的快速、通用分布式计算范式，并且很快流行起来。Spark使用函数式编程范式扩展了MapReduce模型以支持更多计算类型，可以涵盖广泛的工作流，这些工作流之前被实现为Hadoop之上的特殊系统。Spark使用内存缓存来提升性能，因此进行交互式分析也足够快速(就如同使用Python解释器，与集群进行交互一样)。缓存同时提升了迭代算法的性能，这使得Spark非常适合数据理
spark python入门_python pyspark入门篇 weixin_39686634 spark python入门
一.环境介绍：1.安装jdk7以上2.python2.7.113.IDEpycharm4.package:spark-1.6.0-bin-hadoop2.6.tar.gz二.Setup1.解压spark-1.6.0-bin-hadoop2.6.tar.gz到目录D:\spark-1.6.0-bin-hadoop2.62.配置环境变量Path，添加D:\spark-1.6.0-bin-hadoop2
spark streaming python_Spark入门：Spark Streaming简介(Python版) weixin_39531582 spark streaming python
SparkStreaming是构建在Spark上的实时计算框架，它扩展了Spark处理大规模流式数据的能力。SparkStreaming可结合批处理和交互查询，适合一些需要对历史数据和实时数据进行结合分析的应用场景。SparkStreaming设计SparkStreaming是Spark的核心组件之一，为Spark提供了可拓展、高吞吐、容错的流计算能力。如下图所示，SparkStreaming可整
矩阵求逆（JAVA）初等行变换 qiuwanchi 矩阵求逆（JAVA）
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(初等行变换) * @author 邱万迟 *
JDK timer antlove java jdk schedule code timer
1.java.util.Timer.schedule(TimerTask task, long delay)：多长时间（毫秒）后执行任务 2.java.util.Timer.schedule(TimerTask task, Date time)：设定某个时间执行任务 3.java.util.Timer.schedule(TimerTask task, long delay,longperiod
JVM调优总结 -Xms -Xmx -Xmn -Xss coder_xpf jvm 应用服务器
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx
JDBC连接数据库 Array_06 jdbc
package Util; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; public class JDBCUtil { //完
Unsupported major.minor version 51.0（jdk版本错误） oloz java
java.lang.UnsupportedClassVersionError: cn/support/cache/CacheType : Unsupported major.minor version 51.0 (unable to load class cn.support.cache.CacheType) at org.apache.catalina.loader.WebappClassL
用多个线程处理1个List集合 362217990 多线程 thread list 集合
昨天发了一个提问，启动5个线程将一个List中的内容，然后将5个线程的内容拼接起来，由于时间比较急迫，自己就写了一个Demo，希望对菜鸟有参考意义。。 import java.util.ArrayList; import java.util.List; import java.util.concurrent.CountDownLatch; public c
JSP简单访问数据库香水浓 sql mysql jsp
学习使用javaBean，代码很烂，仅为留个脚印 public class DBHelper { private String driverName; private String url; private String user; private String password; private Connection connection; privat
Flex4中使用组件添加柱状图、饼状图等图表 AdyZhang Flex
1.添加一个最简单的柱状图 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 <?xml version= "1.0"&n
Android 5.0 - ProgressBar 进度条无法展示到按钮的前面 aijuans android
在低于SDK < 21 的版本中，ProgressBar 可以展示到按钮前面，并且为之在按钮的中间，但是切换到android 5.0后进度条ProgressBar 展示顺序变化了，按钮再前面，ProgressBar 在后面了我的xml配置文件如下： [html] view plain copy <RelativeLa
查询汇总的sql baalwolf sql
select list.listname, list.createtime,listcount from dream_list as list , (select listid,count(listid) as listcount from dream_list_user group by listid order by count(
Linux du命令和df命令区别 BigBird2012 linux
1，两者区别 du，disk usage,是通过搜索文件来计算每个文件的大小然后累加，du能看到的文件只是一些当前存在的，没有被删除的。他计算的大小就是当前他认为存在的所有文件大小的累加和。
AngularJS中的$apply，用还是不用？ bijian1013 JavaScript AngularJS $apply
在AngularJS开发中，何时应该调用$scope.$apply()，何时不应该调用。下面我们透彻地解释这个问题。但是首先，让我们把$apply转换成一种简化的形式。 scope.$apply就像一个懒惰的工人。它需要按照命
[Zookeeper学习笔记十]Zookeeper源代码分析之ClientCnxn数据序列化和反序列化 bit1129 zookeeper
ClientCnxn是Zookeeper客户端和Zookeeper服务器端进行通信和事件通知处理的主要类，它内部包含两个类，1. SendThread 2. EventThread， SendThread负责客户端和服务器端的数据通信，也包括事件信息的传输，EventThread主要在客户端回调注册的Watchers进行通知处理 ClientCnxn构造方法 &
【Java命令一】jmap bit1129 Java命令
jmap命令的用法： [hadoop@hadoop sbin]$ jmap Usage: jmap [option] <pid> (to connect to running process) jmap [option] <executable <core> (to connect to a
Apache 服务器安全防护及实战 ronin47
此文转自IBM. Apache 服务简介 Web 服务器也称为 WWW 服务器或 HTTP 服务器 (HTTP Server)，它是 Internet 上最常见也是使用最频繁的服务器之一，Web 服务器能够为用户提供网页浏览、论坛访问等等服务。由于用户在通过 Web 浏览器访问信息资源的过程中，无须再关心一些技术性的细节，而且界面非常友好，因而 Web 在 Internet 上一推出就得到
unity 3d实例化位置出现布置？ brotherlamp unity教程 unity unity资料 unity视频 unity自学
问：unity 3d实例化位置出现布置？答：实例化的同时就可以指定被实例化的物体的位置,即 position Instantiate (original : Object, position : Vector3, rotation : Quaternion) : Object 这样你不需要再用Transform.Position了, 如果你省略了第二个参数(
《重构，改善现有代码的设计》第八章 Duplicate Observed Data bylijinnan java 重构
import java.awt.Color; import java.awt.Container; import java.awt.FlowLayout; import java.awt.Label; import java.awt.TextField; import java.awt.event.FocusAdapter; import java.awt.event.FocusE
struts2更改struts.xml配置目录 chiangfai struts.xml
struts2默认是读取classes目录下的配置文件，要更改配置文件目录，比如放在WEB-INF下，路径应该写成../struts.xml(非/WEB-INF/struts.xml) web.xml文件修改如下： <filter> <filter-name>struts2</filter-name> <filter-class&g
redis做缓存时的一点优化 chenchao051 redis hadoop pipeline
最近集群上有个job，其中需要短时间内频繁访问缓存，大概7亿多次。我这边的缓存是使用redis来做的，问题就来了。首先，redis中存的是普通kv，没有考虑使用hash等解结构，那么以为着这个job需要访问7亿多次redis，导致效率低，且出现很多redi
mysql导出数据不输出标题行 daizj mysql 数据导出去掉第一行去掉标题
当想使用数据库中的某些数据，想将其导入到文件中，而想去掉第一行的标题是可以加上-N参数如通过下面命令导出数据： mysql -uuserName -ppasswd -hhost -Pport -Ddatabase -e " select * from tableName" > exportResult.txt 结果为： studentid
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
先下载PHPEXCEL类文件，放在class目录下面，然后新建一个index.php文件，内容如下 <?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('
爱情格言 dcj3sjt126com 格言
1) I love you not because of who you are, but because of who I am when I am with you. 　　我爱你，不是因为你是一个怎样的人，而是因为我喜欢与你在一起时的感觉。 　　2) No man or woman is worth your tears, and the one who is, won‘t
转 Activity 详解——Activity文档翻译 e200702084 android UI sqlite 配置管理网络应用
activity 展现在用户面前的经常是全屏窗口，你也可以将 activity 作为浮动窗口来使用（使用设置了 windowIsFloating 的主题），或者嵌入到其他的 activity （使用 ActivityGroup ）中。当用户离开 activity 时你可以在 onPause() 进行相应的操作。更重要的是，用户做的任何改变都应该在该点上提交 ( 经常提交到 ContentPro
win7安装MongoDB服务 geeksun mongodb
1. 下载MongoDB的windows版本：mongodb-win32-x86_64-2008plus-ssl-3.0.4.zip，Linux版本也在这里下载，下载地址： http://www.mongodb.org/downloads 2. 解压MongoDB在D:\server\mongodb, 在D:\server\mongodb下创建d
Javascript魔法方法:__defineGetter__,__defineSetter__ hongtoushizi js
转载自： http://www.blackglory.me/javascript-magic-method-definegetter-definesetter/ 在javascript的类中,可以用defineGetter和defineSetter_控制成员变量的Get和Set行为例如,在一个图书类中,我们自动为Book加上书名符号: function Book(name){
错误的日期格式可能导致走nginx proxy cache时不能进行304响应 jinnianshilongnian cache
昨天在整合某些系统的nginx配置时，出现了当使用nginx cache时无法返回304响应的情况，出问题的响应头： Content-Type:text/html; charset=gb2312 Date:Mon, 05 Jan 2015 01:58:05 GMT Expires:Mon , 05 Jan 15 02:03:00 GMT Last-Modified:Mon, 05
数据源架构模式之行数据入口 home198979 PHP 架构行数据入口
注：看不懂的请勿踩，此文章非针对java，java爱好者可直接略过。一、概念行数据入口（Row Data Gateway）：充当数据源中单条记录入口的对象，每行一个实例。二、简单实现行数据入口为了方便理解，还是先简单实现： <?php /** * 行数据入口类 */ class OrderGateway { /*定义元数
Linux各个目录的作用及内容 pda158 linux 脚本
1）根目录“/” 　　根目录位于目录结构的最顶层，用斜线（/）表示，类似于 Windows 操作系统的“C:\“，包含Fedora操作系统中所有的目录和文件。　　2）/bin 　　/bin 　　目录又称为二进制目录，包含了那些供系统管理员和普通用户使用的重要 linux命令的二进制映像。该目录存放的内容包括各种可执行文件，还有某些可执行文件的符号连接。常用的命令有：cp、d
ubuntu12.04上编译openjdk7 ol_beta HotSpot jvm jdk OpenJDK
获取源码从openjdk代码仓库获取(比较慢) 安装mercurial Mercurial是一个版本管理工具。 sudo apt-get install mercurial 将以下内容添加到$HOME/.hgrc文件中，如果没有则自己创建一个： [extensions] forest=/home/lichengwu/hgforest-crew/forest.py fe
将数据库字段转换成设计文档所需的字段 vipbooks 设计模式工作正则表达式
哈哈，出差这么久终于回来了，回家的感觉真好！ PowerDesigner的物理数据库一出来，设计文档中要改的字段就多得不计其数，如果要把PowerDesigner中的字段一个个Copy到设计文档中，那将会是一件非常痛苦的事情。

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他