一、Pyeharts简介
pyecharts 是一个用于生成 Echarts 图表的类库。用 Echarts 生成的图可视化效果很不错,pyecharts库是用来与 Python 进行对接,方便在 Python 中直接使用数据生成图。
最新的Pyecharts库版本是v1,且与老版本 v0.5.X 是不兼容的,v0.5.X版本也已不再维护。新旧版本的Geo有着较大改动,本篇均是基于旧版本0.5.11
二、Pyecharts安装
pyecharts的安装说明很简单,也有很多大佬写了过程,本篇不赘述,主要说一下指定版本的问题。
安装pyecharts
Pyecharts v1版本的安装可使用pip install pyecharts -U
Pyecharts v0.5.X版本的安装可使用pip install pyecharts==0.5.11
安装对应的地图拓展
pip install echarts-countries-pypkg pip install echarts-china-provinces-pypkg pip install echarts-china-cities-pypkg pip install echarts-china-counties-pypkg pip install echarts-china-misc-pypkg
全球国家地图:echarts-countries-pypkg (1.9MB)
中国省级地图:echarts-china-provinces-pypkg (730KB)
中国市级地图:echarts-china-cities-pypkg (3.8MB)
中国区县地图:echarts-china-counties-pypkg
中国大区地图:echarts-china-misc-pypkg(如:华南、华北等)
三、Geo常用参数说明
1、创建Geo:geo=Geo()
geo=Geo()是画出地图的背景。
Geo(title,subtitle,width,height,title_pos,title_top,title_color,subtitle_color,title_text_size,subtitle_text_size,background_color,page_title,renderer,is_animation)
各参数说明如下。
实际使用过程中,我们其实经常用到的就几个参数,如title,width,height,background_color,只要搞这几个基本就够用了,所有参数都有默认值,这意味着在最极端情况下,直接用Geo()也可以,不过画出来的就是一张白纸罢了。
Init docstring: :param title: 主标题文本,支持换行,默认为 "" :param subtitle: 副标题文本,支持换行,默认为 "" :param width: 画布宽度,默认为 800(px) :param height: 画布高度,默认为 400(px) :param title_pos: 标题距离左侧距离,默认为'left',有'auto', 'left', 'right', 'center'可选,也可为百分比或整数 :param title_top: 标题距离顶部距离,默认为'top',有'top', 'middle', 'bottom'可选, 也可为百分比或整数 :param title_color: 主标题文本颜色,默认为 '#000' :param subtitle_color: 副标题文本颜色,默认为 '#aaa' :param title_text_size: 主标题文本字体大小,默认为 18 :param subtitle_text_size: 副标题文本字体大小,默认为 12 :param background_color: 画布背景颜色,默认为 '#fff' :param page_title: 指定生成的 html 文件中标签的值。默认为 'Echarts' :param renderer: 指定使用渲染方式,有 'svg' 和 'canvas' 可选,默认为 'canvas'。 3D 图仅能使用 'canvas'。 :param extra_html_text_label: 额外的 HTML 文本标签,( 标签)。类型为 list,list[0] 为文本内容, list[1] 为字体风格样式(选填)。如 ["this is a p label", "color:red"] :param is_animation: 是否开启动画,默认为 True。V0.5.9+
举例子:
from pyecharts import Geo geo =Geo("Geo地图示例", "副标题",width=500, height=500, title_pos='center',title_top=20, title_color="#2E2E2E", subtitle_color='#aaa',title_text_size=16,subtitle_text_size=12,background_color='#EEEEE8', page_title='Echarts',renderer='canvas',is_animation=True) geo
2、geo.add_coordinate()新增坐标点
geo.add_coordinate()的作用就是新增,比如现在调用一张广州地图,现在要在显示一个特定的点“测试1”,像这样的点就必须用add_coordinate新增进去,否则会报错(ValueError: No coordinate is specified for 测试1)。
geo.add_coordinate(点名称,经度,纬度),3个参数都是必填项
geo.add_coordinate('测试点1',113.40,23.07)
3、geo.add()展示坐标点
geo.add()的作用就是将点展示到上面加载的地图上,add有一大堆的参数,最常用的是series_name、names、value、type、maptype、is_visualmap、visual_range、visual_text_color、symbol_size,其中series_name、names、value、maptype这四个是必填项
# 系列名称,用于 tooltip 的显示,legend 的图例筛选。 series_name: str, # 数据项 (坐标点名称) names:list # 数据项 (坐标点值) value: list # Geo 图类型,有 scatter, effectScatter, heatmap, lines 4 种 type: 默认"scatter", # 是否选中图例 is_selected: 默认True, # 标记图形形状,circle,pin,rect,diamon,roundRect,arrow,triangle symbol: 默认circle, # 标记的大小 symbol_size: 默认12, # 系列 label 颜色 color: 默认None, # 是否是多段线,在画 lines 图情况下 is_polyline: 默认 False, # 是否启用大规模线图的优化,在数据图形特别多的时候(>=5k)可以开启 is_large: 默认 False, # 特效尾迹的长度。取从 0 到 1 的值,数值越大尾迹越长。 trail_length:默认 0.2 # 地图选择,如广东、广州、china maptype #不知道什么作用,只知道默认Ture is_random #是否开启鼠标缩放和平移漫游。'scale'缩放、'move'平移、'True'都开启 is_roam:默认True #显示图例条 is_visualmap:默认True #图例条范围 visual_range #图例条颜色 visual_text_color #常态下地图的颜色 geo_normal_color #触发下地图的颜色(鼠标放在地图上) geo_emphasis_color #涟漪的多少,当type="effectScatter"时才有效 effect_scale #显示标签 is_label_show #标签颜色 label_text_color #标签位置(inside,top,bottom,left,right) label_pos:默认"inside" #边界颜色 border_color
举例子
from pyecharts import Geo districts=['荔湾区', '花都区', '番禺区','测试点1'] value = [ 200, 200,300,400] geo =Geo("Geo地图示例", "副标题",width=500, height=500, title_pos='center',title_top=20, title_color="#2E2E2E", subtitle_color='#aaa',title_text_size=16,subtitle_text_size=12,background_color='#EEEEE8', page_title='Echarts',renderer='canvas',is_animation=True) geo.add_coordinate('测试点1',113.40,23.07) geo.add("系列名1", districts, value,type="effectScatter",is_selected=True,symbol='circle',symbol_size=20,color=None, maptype='广州',is_roam=True,is_visualmap=True, visual_range=[0,500],visual_text_color="#2E2E2E", geo_normal_color="#323c48",geo_emphasis_color='#2a033d', effect_scale=3, is_label_show=True,label_text_color="#00FF00",label_pos="inside" ) geo.render("广州测试2.html") geo
在这里有2个问题还没解决。第一、不知道is_random参数的作用,感觉不管是True或False都没影响;第二、如上图的series_name “系列名1”,不知道如何改变它的位置,如移动到左边右边等。
4、geo.render()保存文件
geo.render()很简单了,就是将地图保存为文件出来,render只有一个参数,就是path路径
geo.render("广州测试2.html")
补充:Pyecharts v1 Geo库的一些更新与应用
最近在利用Python进行爬虫的过程中,需要对网页中爬取的数据做一些可视化的处理,其中有部分数据是关于地区分布的,在地图上标注出具体的参数分布将使得数据更加的直观与生动。
地图标注的工具我选择使用的是Pyecharts库中Geo,运行在Pycharm下,值得注意的是,最新的Pyecharts库版本是v1, 是最新的版本,且与老版本 v0.5.X 是不兼容的,v0.5.X版本也已不再维护,所以建议以后尽量应用最新的v1版,本文也将在此对其进行一些Geo库的更新应用的说明。
Pyecharts v1版本的安装可使用pip install pyecharts -U,也可直接在Pycharm中安装Pyecharts,其说明文档地址为https://pyecharts.org/#/zh-cn/intro
Pyecharts v0.5.X版本的安装可使用pip install pyecharts==0.5.11,其说明文档地址为https://05x-docs.pyecharts.org/#/zh-cn/prepare
新版本Pyecharts中的地理图表Geo有着较大的改动,总的一个最直观的更新感受是,新的库没有以前那么繁琐了,应用起来更简单直接。因为本人刚接触Python,很多东西也是刚刚入门,现阶段也只是达到能够初步使用Geo的程度,在探索使用新版本的过程中发现网上关于新板Pyecharts的说明很少,所以在这里将自己遇到的一些问题以及自己的一些见解整理出来,以下的一些说明与理解可能较为粗浅,万望各位读者见谅。
Geo:地理坐标系
Geo作为一个地理坐标标注的工具,在功能上新老版本基本是一致的,但在细节上却有着很大的差别,这也导致了新旧代码是完全不通用的。
1. 创建Geo:geo = Geo()
在v0.5.X版本中在创建geo的过程中是可以对其进行一些基本参数设定的
如以说明文档中的例子:
geo = Geo("全国主要城市空气质量", "data from pm2.5", title_color="#fff", title_pos="center", width=1200, height=600, background_color="#404a59", )
可以设定主标题,副标题,标题颜色为止,图表大小,背景颜色等。
但在新版本中继续按照这样的格式进行创建时,编译器报错AttributeError: 'str' object has no attribute 'get',没有这样的对象。在新版文档中对Geo是直接进行创建的geo = Geo(),其实这样创建基本也就可以了,但是如果你真的想对其进行更多的参数设置,当然也是可以的。
在新的库中,对Geo的操作统一放在init_opts中,对其进行更改需要统一的对类opts.InitOpts进行修改,这里我们就需要引入from pyecharts import options as opts才能进行调用。
具体的InitOpts包括以下一些参数
class InitOpts(BasicOpts): def __init__( self, width: str = "900px", height: str = "500px", chart_id: Optional[str] = None, renderer: str = RenderType.CANVAS, page_title: str = CurrentConfig.PAGE_TITLE, theme: str = ThemeType.WHITE, bg_color: Union[str, dict] = None, js_host: str = "", animation_opts: Union[AnimationOpts, dict] = AnimationOpts(), ): self.opts: dict = { "width": width, "height": height, "chart_id": chart_id, "renderer": renderer, "page_title": page_title, "theme": theme, "bg_color": bg_color, "js_host": js_host, "animationOpts": animation_opts, }
需要注意的是对opt.InitOpts直接进行配置的话,只能对部分参数进行更改,如bg_color等,而width,height等参数是固定的无法修改的,比如如果这样设定
geo = Geo(init_opts = opts.InitOpts("aaa", width = 400, height = 200, bg_color = "#404a59"))
将报TypeError: init() got multiple values for argument 'width'多赋值的错误。好在新版本除了提供Opts 配置项作为参数传入,还提供了原生 dict 作为参数配置,所有参数均可以自己任意定义,具体操作代码是
geo = Geo(init_opts = {"width":1600,"chart_id":"ceshi","bg_color":"#404a59"})
这里发现了一个奇怪的现象,当更改height参数时,将直接导致地图标注无图像,至今未明白其中的原因。
2.add_schema设置
add_schema是Geo下的一个函数,具体功能是对地图的参数与功能进行一些配置,主要包括有
def add_schema( # 地图类型,具体参考 pyecharts.datasets.map_filenames.json 文件 maptype: str = "china", # 是否开启鼠标缩放和平移漫游。 is_roam: bool = True, # 当前视角的缩放比例。默认为 1 zoom: Optional[Numeric] = None, # 当前视角的中心点,用经纬度表示。例如:center: [115.97, 29.71] center: Optional[Sequence] = None, # # 标签配置项,参考 `series_options.LabelOpts` label_opts: Union[opts.LabelOpts, dict, None] = None, # 地图区域的多边形 图形样式。 itemstyle_opts: Union[opts.ItemStyleOpts, dict, None] =None, # 高亮状态下的多边形样式 emphasis_itemstyle_opts: Union[opts.ItemStyleOpts, dict,None] = None, # 高亮状态下的标签样式。 emphasis_label_opts: Union[opts.LabelOpts, dict, None] =None, ):
这里我只使用过maptype,zoom,label_opts的设置,具体设置如下
geo.add_schema(maptype = "china", zoom = 1, label_opts = opts.LabelOpts(is_show=True))
maptype可替换成世界地图,省份地图等,地图资源可通过以下
pip install echarts-countries-pypkg pip install echarts-china-provinces-pypkg pip install echarts-china-cities-pypkg pip install echarts-china-counties-pypkg pip install echarts-china-misc-pypkg
zoom是缩放设置,label_opts是标签设置,如同1中的设置,这里也是可以通过原生dict进行自定义设置的。
3.add_coordinate设置:新增坐标点
Geo中可以自己增加需要标注的坐标点,通过设置地点,经度,纬度这三个参数即可完成添加。
def add_coordinate( # 坐标地点名称 name: str, # 经度 longitude: Numeric, # 纬度 latitude: Numeric, )
这个函数和旧版是一致的,应用也非常简单,此处不再多加赘述,举一个简单的例子
geo.add_coordinate("标注地点", 120, 80)
4.add设置:显示与图例筛选
这是Geo中最主要的函数模块,可供设置的参数类型也比较多,新版的add函数结构与以前相比也有较大的改动,相关的参数如下所示
def add( # 系列名称,用于 tooltip 的显示,legend 的图例筛选。 series_name: str, # 数据项 (坐标点名称,坐标点值) data_pair: Sequence, # Geo 图类型,有 scatter, effectScatter, heatmap, lines 4 种,建议使用 # from pyecharts.globals import GeoType # GeoType.GeoType.EFFECT_SCATTER,GeoType.HEATMAP,GeoType.LINES type_: str = "scatter", # 是否选中图例 is_selected: bool = True, # 标记图形形状 symbol: Optional[str] = None, # 标记的大小 symbol_size: Numeric = 12, # 系列 label 颜色 color: Optional[str] = None, # 是否是多段线,在画 lines 图情况下 is_polyline: bool = False, # 是否启用大规模线图的优化,在数据图形特别多的时候(>=5k)可以开启 is_large: bool = False, # 特效尾迹的长度。取从 0 到 1 的值,数值越大尾迹越长。默认值 0.2 trail_length: Numeric = 0.2, # 开启绘制优化的阈值。 large_threshold: Numeric = 2000, # 标签配置项,参考 `series_options.LabelOpts` label_opts: Union[opts.LabelOpts, dict] = opts.LabelOpts(), # 涟漪特效配置项,参考 `series_options.EffectOpts` effect_opts: Union[opts.EffectOpts, dict] = opts.EffectOpts(), # 线样式配置项,参考 `series_options.LineStyleOpts` linestyle_opts: Union[opts.LineStyleOpts, dict] = opts.LineStyleOpts(), # 提示框组件配置项,参考 `series_options.TooltipOpts` tooltip_opts: Union[opts.TooltipOpts, dict, None] = None, # 图元样式配置项,参考 `series_options.ItemStyleOpts` itemstyle_opts: Union[opts.ItemStyleOpts, dict, None] = None, )
其中,新旧版本最大的一个不同是,旧版的地点和值分开配置给attr和value,旧版的典型示例如下
from pyecharts import Geo data = [ ("海门", 9), ("鄂尔多斯", 12), ("招远", 12), ("舟山", 12), ("齐齐哈尔", 14), ("盐城", 15) ] geo = Geo( "全国主要城市空气质量", "data from pm2.5", title_color="#fff", title_pos="center", width=1200, height=600, background_color="#404a59", ) attr, value = geo.cast(data) geo.add("", attr, value, type="effectScatter", is_random=True, effect_scale=5) geo.render()
而新版的add函数将地点和值放在了一个数据项里,
geo.add("", [attr, value], type_=ChartType.HEATMAP, symbol_size = 12, label_opts = opts.LabelOpts(is_show=False))
其他一些参数配置大致与以前是一致的,配置方式也可同样参照1中的方式进行。
在运行中发现一个有趣的问题,如一个个对坐标进行显示插入
geo.add_coordinate("测试点1", 20, 40) geo.add("haha1", [("测试点1", 60)]) geo.add_coordinate("测试点2", 60, 80) geo.add("haha2", [("测试点2", 60)])
这样运行是没有问题的,但如果对列表中的项进行批量的插入,如
for i in range(num): geo.add_coordinate(address[i], lng[i], lat[i]) geo.add("", [(address[i],60)])
这样做是会报错的,具体原因不是太明白,无奈只能进行如下修改
for i in range(num): geo.add_coordinate(address[i], lng[i], lat[i]) geo.add("", [(address[i],60) for i in range(num)])
做了这样的修改后就没有问题了,如果有知道原因的朋友可以留言给我,万分感谢
还有一个值得注意的问题是,对中国地图进行标注时,使用的地点不能包含“省”,“市”等,只能使用“江苏”,“浙江”等地名,不然就是无效的。
最后想放一张自己运行生成的标注地图,无奈第一次标记这边的文章,不会添加图片!!!
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。如有错误或未考虑完全的地方,望不吝赐教。