张小鱼༒

数据可视化课程设计——北京新发地官网数据分析与可视化展示【内容在jupyter notebook里面展示】包含数据爬取与可视化分析详解

一、课题说明

1.1、设计原因：

1.2、设计目标：

1.3、开发环境：

1.4、爬取网站链接

二、准备工作

2.1、数据获取：

2.2、爬取的数据说明：

2.3、爬虫程序设计的思路：

三、详细设计

3.1、导入库的模块：

3.2、对数据先进行读取：

3.2.1、显示前5条记录

3.2.2、查看数据的规模:行数和列数

3.2.3、利用info()查看数据的维度、字段名及类型等

3.2.4、利用describe()查看数据初步统计信息

3.3、对数据整体进行清洗：

3.3.1、查看数据是否有缺失值或者重复值

3.3.2、查看各元素是否为空值

3.4、对数据进行统计：

3.4.1、查看规格列包含具体种类

3.4.2、查看规格列各种类出现的次数

3.5、对蔬菜数据分析

3.5.1、查看每一列的数据类型

3.5.2、查看价格的相关情况

3.5.3、随机抽取10条数据：

3.6数据可视化展示：

3.6.1、#绘制每个属性的直方图，来快速了解数据

3.6.2、对平均价做对应的直方图与密度图的集合、加阴影的图以及小细线图

3.6.3、对产地以及品名做计数图

3.6.4、对产地的最高价绘制散点图

3.6.5、对蔬菜信息表的前70条数据产地的平均价绘制箱线图

3.6.6、对蔬菜信息表的前100条数据绘制最高价与最低价绘制多面板图

3.6.7、对蔬菜信息表第10条到20条数据绘制分组关系图

3.6.8、对于蔬菜信息表的最高价、最低价、平均价特征进行两两对比

3.6.9、绘制蔬菜信息表100到300条数据品名次数分布的散点图

3.6.10、蔬菜规格展示图

3.6.11、按照产地绘制柱状图

3.6.12、分析最高价与最低价以及平均价之间的箱线图

3.6.13、查看鲁地的各蔬菜平均价的分布情况饼图展示

3.6.14、绘制产地的词云

3.6.15、红尖椒与线椒的最高价、最低价、平均价随日期的变化趋势

3.6.16、绘制最高价前40的品名的散点图

3.6.17“红尖椒”的最高价在全部时间的分布情况饼图展示

3.6.18、“番茄”的最高价在全部时间的变化情况折线图展示

3.6.19、产地信息第200到1000条数据的蔬菜分布图

3.6.20、最低价排序第300到500条数据的蔬菜分布图

3.6.21、查看规格列各种类出现的次数，并且绘制节点图

3.6.22、部分蔬菜产地路线和数量图

四、设计遇到的问题以及难点：

4.1关键技术与难点：

4.2 处理数据与绘制图像

五、设计的总结与体会

一、课题说明

1.1、设计原因：

参考数据可视化课程内容，结合已学习的课程知识，对新发地官网的蔬菜价格数据进行“爬取—清洗—存储—可视化—结论性分析”的工作。

1.2、设计目标：

通过对上述数据的爬取和分析，实现对数据的整体评价或预测，并对一些数据进行可视化展示。

1.3、开发环境：

主要是Jupyter Notebook

1.4、爬取网站链接

http://www.xinfadi.com.cn/priceDetail.html

二、准备工作

2.1、数据获取：

爬取的代码：

import json

import requests

import threading

import pandas as pd

# 页数

page = 1

# 商品总列表

count = []

# json列表

jsons = []

# 解析网页函数

def url_parse(page):

    # 请求地址

    url = 'http://www.xinfadi.com.cn/getPriceData.html'

    headers = {

        "Accept": "*/*",

        "Accept-Encoding": "gzip, deflate",

        "Accept-Language": "zh-CN,zh;q=0.9",

        "Cache-Control": "no-cache",

        "Connection": "keep-alive",

        "Content-Length": "89",

        "Content-Type": "application/x-www-form-urlencoded; charset=UTF-8",

        "Host": "www.xinfadi.com.cn",

        "Origin": "http://www.xinfadi.com.cn",

        "Pragma": "no-cache",

        "Referer": "http://www.xinfadi.com.cn/priceDetail.html",

        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.107 Safari/537.36",

        "X-Requested-With": "XMLHttpRequest",

    }

    data = {

        "limit": "20",

        "current": page,

        "pubDateStartTime": "",

        "pubDateEndTime": "",

        "prodPcatid": "1186",  # 商品类id

        "prodCatid": "",

        "prodName": "",

    }

    response = requests.post(url=url, headers=headers, data=data).text

    # 获取商品信息

    response = json.loads(response)['list']

    # 生成线程锁对象

    lock = threading.RLock()

    # 上锁

    lock.acquire()

    # 添加到json列表中

    jsons.append(response)

    # 解锁

    lock.release()

# 解析json函数

def json_parse(product):

    lock = threading.RLock()

    lock.acquire()

    dic = {'品名': product['prodName'], "最低价": product['lowPrice'], '最高价': product['highPrice'],

           '平均价': product['avgPrice'], '规格': product['specInfo'], '产地': product['place'],

           '单位': product['unitInfo'],

           '发布日期': product['pubDate']}

    print(dic)

    # 将商品信息添加到商品总列表中

    count.append(dic)

    lock.release()

if __name__ == '__main__':

    num = int(input('请输入爬取页数：'))

    # 多进程解析网页

    for i in range(1, num + 1):

        x = threading.Thread(target=url_parse, args=(i,))

        x.start()

    x.join()

    # 多进程解析json

    for i in jsons:

        for product in i:

            y = threading.Thread(target=json_parse, args=(product,))

            y.start()

    y.join()

    # 生成excel

    data = pd.DataFrame(count)

    data.to_excel('爬取蔬菜相关信息.xlsx', index=None)

2.2、爬取的数据说明：

本次爬虫从2022-11-07到2022-11-22开始爬取，共爬取了100页，1741条数据，八列分别为品名、最低价、最高价、平均价、规格、产地、单位、发布日期、等，其中无重复值，产地有409个缺失值，规格有1188个缺失值，缺失值过多不能直接删除，这两个变量在后续研究中只看比较关系，无需填充，所以不用进行缺失值处理。数据类型有两类，object类型的数据有产地、单位、发布日期、品名、规格等，float64类型的数据包括平均价、最低价、最高价等。

2.3、爬虫程序设计的思路：

向HTML网页提交POST请求的方法，对应于HTTP的POST，找到蔬菜信息页面，然后进行翻页，发现页面的url没有发生改变，所有蔬菜信息是通过接口数据动态获取的，是动态数据。进行chrom调试抓包，找到每个页面信息所在的url，发现每个信息的url都相同，post请求，formdata不同。通过修改提交的data来获取不同页面的蔬菜信息。

三、详细设计

3.1、导入库的模块：

import numpy as np

import pandas as pd

import seaborn as sns

import matplotlib.pyplot as plt

import jieba

from tkinter import _flatten

import wordcloud

import warnings#引入警告信息库

warnings.filterwarnings('ignore')#过滤警告信息

import pandas as pd

from matplotlib.font_manager import FontProperties

plt.rcParams['font.sans-serif']=['simhei']# 添加中文字体支持

plt.rcParams['font.serif'] = ['simhei']

%matplotlib inline

3.2、对数据先进行读取：

3.2.1、显示前5条记录

df1 = pd.read_excel(r'爬取蔬菜相关信息.xlsx')

df1

df1.head()

查询结果：

3.2.2、查看数据的规模:行数和列数

print(df1.shape)  #查看维度

print(df1.index.size) #获得行数

print(df1.columns.size)  #获得列数

查询结果：

(1740, 8)

1740

3.2.3、利用info()查看数据的维度、字段名及类型等

df1.info()

查询结果：

RangeIndex: 1740 entries, 0 to 1739

Data columns (total 8 columns):

 #   Column  Non-Null Count  Dtype

---  ------  --------------  -----

 0   品名      1740 non-null   object

 1   最低价     1740 non-null   float64

 2   最高价     1740 non-null   float64

 3   平均价     1740 non-null   float64

 4   规格      552 non-null    object

 5   产地      1331 non-null   object

 6   单位      1740 non-null   object

 7   发布日期    1740 non-null   object

dtypes: float64(3), object(5)

memory usage: 108.9+ KB

3.2.4、利用describe()查看数据初步统计信息

df1.describe()

查询结果：

3.3、对数据整体进行清洗：

3.3.1、查看数据是否有缺失值或者重复值

#查看是否存在重复行

df1.duplicated()

#查看重复行与非重复行的数量

cf = df1.duplicated()

cf.value_counts()

查询结果：

False 1740

dtype: int64

3.3.2、查看各元素是否为空值

df1.isnull()

df1.isnull().any()

#各列含空值的具体数目

df1.isnull().sum()

查询结果：

品名 0

最低价 0

最高价 0

平均价 0

规格 1188

产地 409

单位 0

发布日期 0

dtype: int64

可以得到该数据集中产地有409个缺失值，规格有1188个缺失值，缺失值过多不能直接删除，这两个变量在后续研究中只看比较关系，所以无需填充

3.4、对数据进行统计：

3.4.1、查看规格列包含具体种类

p1 = df1['规格'].drop_duplicates()

ww = []

for i in p1:

    ww.append(i)

ww

查询结果：

[nan, '大', '白球\\净', '毛\\箱', '大\\小', '红\\黄', '泥\\洗', '洗', '脆', '黄', '麻', '泥', '红', '铁棍', '龙薯九', '西瓜红\\烟薯', '湿\\干', '黏\\甜', '长\\短', '箱', '袋\\箱', '黑框', '纸箱\\泡沫箱', '白框', '鲜干花', '旱\\荷兰', '吊', '地', '长\\小', '姜头\\整', '机剥\\手工', '净', '毛', '新', '小叶']

3.4.2、查看规格列各种类出现的次数

from collections import Counter

Counter(df1['规格'])

查询结果：

Counter({nan: 1188,

'大': 17,

'白球\\净': 15,

'毛\\箱': 15,

'大\\小': 15,

'红\\黄': 16,

'泥\\洗': 29,

'洗': 31,

'脆': 15,

'黄': 15,

'麻': 14,

'泥': 16,

'红': 15,

'铁棍': 14,

'龙薯九': 14,

'西瓜红\\烟薯': 14,

'湿\\干': 12,

'黏\\甜': 13,

'长\\短': 13,

'箱': 13,

'袋\\箱': 56,

'黑框': 15,

'纸箱\\泡沫箱': 15,

'白框': 15,

'鲜干花': 14,

'旱\\荷兰': 14,

'吊': 14,

'地': 14,

'长\\小': 14,

'姜头\\整': 14,

'机剥\\手工': 14,

'净': 14,

'毛': 14,

'新': 14,

'小叶': 5})

可以看到规格为'袋\箱'的较多，出现了56次，其次依次是'洗'31次，’泥\洗’29，'大'17次,'等，'小叶'出现较少，仅有5次，规格列缺失较多，但我们只需对已有的值进行分析，.缺失值不影响比较结果，所以不对其进行处理

3.5、对蔬菜数据分析

3.5.1、查看每一列的数据类型

df1.dtypes

查询结果：

品名       object

最低价     float64

最高价     float64

平均价     float64

规格       object

产地       object

单位       object

发布日期     object

dtype: object

3.5.2、查看价格的相关情况

#最高价的平均值

pj1 = df1['最高价'].mean()

print("最高价的平均值是{}".format(pj1))

#最高价的众数：

zs1 = df1['最高价'].mode()

print("最高价的众数是：{}".format(zs1))

#最高价的方差：

fc1 = df1['最高价'].var()

print("最高价的方差是：{}".format(fc1))

查询结果：

最高价的平均值是3.1683333333333357

最高价的众数是：0    2.0

Name: 最高价, dtype: float64

最高价的方差是：12.062323270078608

#最低价的平均值

pj2 = df1['最低价'].mean()

print("最低价的平均值是{}".format(pj2))

#最低价的众数：

zs2 = df1['最低价'].mode()

print("最低价的众数是：{}".format(zs2))

#最低价的方差：

fc2 = df1['最低价'].var()

print("最低价的方差是：{}".format(fc2))

查询结果：

最低价的平均值是2.454327586206895

最低价的众数是：0    1.5

Name: 最低价, dtype: float64

最低价的方差是：10.684754061688226

#平均价的平均值

pj3 = df1['平均价'].mean()

print("平均价的平均值是{}".format(pj3))

#平均价的众数：

zs3 = df1['平均价'].mode()

print("平均价的众数是：{}".format(zs3))

#平均价的方差：

fc3 = df1['平均价'].var()

print("平均价的方差是：{}".format(fc3))

查询结果：

平均价的平均值是2.8115000000000028

平均价的众数是：0    1.25

Name: 平均价, dtype: float64

平均价的方差是：11.286187455434195

对最高价、最低价以及平均价做成图表：

data = {'平均值':[pj1,pj2,pj3],'众数':[zs1,zs2,zs3],'方差':[fc1,fc2,fc3]}

w = pd.DataFrame(data,index=['最高价','最低价','平均价'])

w

3.5.3、随机抽取10条数据：

sj = df1.sample(10)

sj

3.6数据可视化展示：

3.6.1、#绘制每个属性的直方图，来快速了解数据

import seaborn as sns

import matplotlib.pyplot as plt

plt.rcParams['font.sans-serif']=['simhei']# 添加中文字体支持

plt.rcParams['font.serif'] = ['simhei']

df1.hist(bins=100,figsize=(20,20))

plt.show()

3.6.2、对平均价做对应的直方图与密度图的集合、加阴影的图以及小细线图

import seaborn as sns

import matplotlib.pyplot as plt

plt.rcParams['font.sans-serif']=['simhei']# 添加中文字体支持

plt.rcParams['font.serif'] = ['simhei']

fig,axes = plt.subplots(1,3)

sns.distplot(df_sc['平均价'].head(80),ax = axes[0],kde = True,rug = True)

sns.kdeplot(df_sc['平均价'].head(80),ax = axes[1],shade = True)#阴影

sns.rugplot(df_sc['平均价'].head(80),ax = axes[2])

plt.show()

3.6.3、对产地以及品名做计数图

import seaborn as sns

import matplotlib.pyplot as plt

plt.rcParams['font.sans-serif']=['simhei']# 添加中文字体支持

plt.rcParams['font.serif'] = ['simhei']

sns.countplot(x = "产地",hue = "品名",data = df_sc.head(20))

3.6.4、对产地的最高价绘制散点图

import seaborn as sns

import matplotlib.pyplot as plt

plt.rcParams['font.sans-serif']=['simhei']# 添加中文字体支持

plt.rcParams['font.serif'] = ['simhei']

sns.swarmplot(x=df_sc['最高价'][200:400],y=df_sc['产地'][200:250],data=df_sc['最高价'][200:400])#产地上面最高价的数量

3.6.5、对蔬菜信息表的前70条数据产地的平均价绘制箱线图

import seaborn as sns

import matplotlib.pyplot as plt

plt.rcParams['font.sans-serif']=['simhei']# 添加中文字体支持

plt.rcParams['font.serif'] = ['simhei']

sns.boxplot(x = df_sc['产地'].head(70),y = df_sc['平均价'][40:100])#箱线图

plt.show()

3.6.6、对蔬菜信息表的前100条数据绘制最高价与最低价绘制多面板图

sns.jointplot(kind = "hex",x = '最高价',y = '最低价',data = df_sc.head(100))

#绘图多变量分布关系

plt.show()

3.6.7、对蔬菜信息表第10条到20条数据绘制分组关系图

import seaborn as sns

import matplotlib.pyplot as plt

plt.rcParams['font.sans-serif']=['simhei']# 添加中文字体支持

plt.rcParams['font.serif'] = ['simhei']

sns.factorplot(x = "最低价",col = "产地",col_wrap = 4,data = df_sc[10:20],kind = "count",size = 2.5,aspect = 1)

3.6.8、对于蔬菜信息表的最高价、最低价、平均价特征进行两两对比

import seaborn as sns

import matplotlib.pyplot as plt

plt.rcParams['font.sans-serif']=['simhei']# 添加中文字体支持

plt.rcParams['font.serif'] = ['simhei']

sns.pairplot(df_sc[['最高价','最低价','平均价']],diag_kind = 'auto')

3.6.9、绘制蔬菜信息表100到300条数据品名次数分布的散点图

from pyecharts.charts import Scatter

w2 = data1.sort_values('品名',ascending=True)[100:300]

y = []  

x = []

for i in w2['品名'].value_counts().index:

    x.append(i)

for i in w2['品名'].value_counts():

    y.append(i)

c = Scatter(opts.InitOpts(width = '660px',height = "380px"))

c.add_xaxis(x)#x轴

c.add_yaxis("品名次数",y)#加入与前面的一一对应

c.set_global_opts(title_opts = opts.TitleOpts(title = "品名出现次数的散点图"))

c.render_notebook()

3.6.10、蔬菜规格展示图

from pyecharts import options as opts

from pyecharts.charts import Pie

www = df1['规格'].value_counts().index

cc = df1['规格'].value_counts()

c = (Pie().add("", [list(z) for z in zip(www,cc)],center=["80%", "40%"],radius=["30%", "60%"],)

    .set_global_opts(title_opts=opts.TitleOpts(title="蔬菜规格"),

                     legend_opts=opts.LegendOpts(orient="vertical", pos_top="15%", pos_left="0%"),)

    .set_series_opts(label_opts=opts.LabelOpts(formatter="{b}: {c}")))

c.render_notebook()

3.6.11、按照产地绘制柱状图

w2 = data1.sort_values('产地',ascending=True)

y = []  

x = []

for i in w2['产地'].value_counts().index:

    x.append(i)

for i in w2['产地'].value_counts():

    y.append(i)

bar1 = (Bar().add_xaxis(x).add_yaxis('个数', y)

       .set_global_opts(title_opts=opts.TitleOpts("产地信息的蔬菜分布图"),

                        yaxis_opts=opts.AxisOpts(name="个数"),  

                        xaxis_opts=opts.AxisOpts(name="产地"))

)

bar1.render_notebook()

3.6.12、分析最高价与最低价以及平均价之间的箱线图

corr = df1[['最高价','最低价','平均价']].corr()

corr

sns.heatmap(corr,xticklabels = corr.columns,yticklabels = corr.columns)

3.6.13、查看鲁地的各蔬菜平均价的分布情况饼图展示

data1 = pd.read_excel(r'爬取蔬菜相关信息.xlsx')

d1 = data1[data1['产地'] == "鲁"]

from pyecharts.charts import *

from pyecharts import options as opts

num = d1['平均价'].value_counts()

c = Pie(init_opts=opts.InitOpts(theme='light',width='1000px',height='600px'))

c.add("", [list(z) for z in zip(num.index, num)])

c.set_global_opts(title_opts=opts.TitleOpts(title="鲁地的各蔬菜平均价的分布情况饼图"),

                  legend_opts=opts.LegendOpts(type_="scroll", pos_left="90%", orient="vertical"))

c.set_colors(["blue", "green", "yellow", "red", "pink", "orange", "purple"])

c.set_series_opts(label_opts=opts.LabelOpts(position='top',

                                  color='red', font_family='Arial',

                                  font_size=12,font_style='italic',

                                  interval=1,formatter='{b}:{c}, 占比{d}%'))

c.render_notebook()

3.6.14、绘制产地的词云

import jieba

from tkinter import _flatten

import wordcloud

data1 = pd.read_excel(r'爬取蔬菜相关信息.xlsx').astype(str)

comment =data1[~data1['产地'].isin(["nan"])]

comment_cut = comment['产地'].apply(jieba.lcut)

comment_last = [] #一维列表，存放分词结果

for i in comment_cut:

    for j in i:

        comment_last.append(j)

counts = {}

for word in comment_last:

    if len(word) > 1:

        counts[word] = counts.get(word, 0) + 1

pic = plt.imread(r'tx5.jpg')

w = wordcloud.WordCloud(

    mask = pic, #背景图片

    background_color = 'white',#词云背景颜色

    font_path='C:/Windows/Fonts/simhei.TTF' #设置为中文字体，否则无法正常显示

)

w.fit_words(counts)#传入词频为字典类型，dic为上述字典

plt.imshow(w) #转为plt图形数据

plt.axis('off')#取消显示x-y轴

plt.show()#展示图形

w.to_file(r'产地5.jpg')

3.6.15、红尖椒与线椒的最高价、最低价、平均价随日期的变化趋势

yj = df1[df1['产地']=='鲁冀']
yj['规格'].value_counts()
yj['品名'].value_counts()
x=[]
for i in yj['发布日期'].sort_values().drop_duplicates():#.drop_duplicates去重

    x.append(i[4:20])

print(x)

r1 = yj[yj['品名']=='红尖椒']['最高价']

r2 = yj[yj['品名']=='红尖椒']['最低价']

r3 = yj[yj['品名']=='红尖椒']['平均价']

r4 = yj[yj['品名']=='线椒']['最高价']

r5 = yj[yj['品名']=='线椒']['最低价']

r6 = yj[yj['品名']=='线椒']['平均价']

from pyecharts.charts import Line

from pyecharts.globals import ThemeType

c=(Line(init_opts=opts.InitOpts(theme=ThemeType.LIGHT)).add_xaxis(x)

    .add_yaxis("红尖椒最高价",r1,is_smooth=True)#is_smooth平滑曲线

    .add_yaxis("红尖椒最低价",r2,is_smooth=True)         

    .add_yaxis("红尖椒平均价",r3,is_smooth=True)

    .add_yaxis("线椒最高价",r4,is_smooth=True)         

    .add_yaxis("线椒最低价",r5,is_smooth=True)

    .add_yaxis("线椒平均价",r6,is_smooth=True)         

    .set_global_opts(title_opts=opts.TitleOpts(title="红尖椒和线椒的最高价、最低价、平均价随日期的变化趋势",pos_left="center",pos_top="3%")))

c.render_notebook()

3.6.16、绘制最高价前40的品名的散点图

from pyecharts.charts import Scatter

data2 = pd.read_excel(r'爬取蔬菜相关信息.xlsx').astype(str)

w1 = data2.sort_values('最高价',ascending=False).head(40)

comment =w1['品名']

y = []

x = []

for i in comment.value_counts().index:

    x.append(i)

for i in comment.value_counts():

    y.append(i)

c = Scatter(opts.InitOpts(width = '660px',height = "380px"))

c.add_xaxis(x)#x轴

c.add_yaxis("品名",[list(z) for z in zip(y, x)],symbol_size=20)#加入与前面的一一对应

c.set_global_opts(title_opts=opts.TitleOpts(title="最高价前40的品名散点图"))

c.render_notebook()

3.6.17“红尖椒”的最高价在全部时间的分布情况饼图展示

d3 = data1[data1['品名']=="红尖椒"]

from pyecharts import options as opts

from pyecharts.charts import Pie

from pyecharts.faker import Faker

d3['最高价'].value_counts()

a1=[]

for i in d3['最高价'].value_counts().index:

    a1.append(i)

c = Pie(opts.InitOpts(width = '800px',height = '380px'))

c.add("",[list(z) for z in zip(a1,d3['最高价'].value_counts())],

        rosetype="radius",radius=["20%", "40%"],center=["35%", "40%"],

        label_opts=opts.LabelOpts(is_show=False),)

c.add("",[list(z) for z in zip(a1,d3['最高价'].value_counts())],

        rosetype="area",radius=["20%", "40%"], center=["73%", "40%"])

c.set_global_opts(title_opts=opts.TitleOpts(title="红尖椒的最高价在全部时间的分布情况玫瑰图示"),

                legend_opts=opts.LegendOpts(orient="vertical", pos_top="30%", pos_left="2%"))

#设置数据标签格式

c.set_series_opts(label_opts=opts.LabelOpts(formatter="{b}: {c}，占比：{d}%"))

c.render_notebook()

3.6.18、“番茄”的最高价在全部时间的变化情况折线图展示

d3 = data1[data1['品名']=="番茄"]

d4 = d3[d3['产地']=='蒙冀鲁'].sort_values('发布日期')

d5 = d3[d3['产地']=='蒙'].sort_values('发布日期')

a=[]

for i in d4['发布日期']:

    a.append(i[5:10])

print(a)

b = d4['最高价']

e = d5['最高价']

y1=[]

for i in b:

    y1.append(i)

y2=[]

for i in e:

    y2.append(i)

from pyecharts.charts import Bar, Grid, Line

bar = ( Bar().add_xaxis(a).add_yaxis("蒙冀鲁",y1).add_yaxis("蒙",y2)

    .set_global_opts(title_opts=opts.TitleOpts(title="番茄最高价随时间变化情况直方图展示")))

line = (Line().add_xaxis(a).add_yaxis("蒙", b).add_yaxis("蒙冀鲁", e)

    .set_global_opts(title_opts=opts.TitleOpts(title="番茄最高价随时间变化情况折线图展示", pos_top="48%"),

        legend_opts=opts.LegendOpts(pos_top="48%"),))

grid = (Grid().add(bar, grid_opts=opts.GridOpts(pos_bottom="60%"))

.add(line, grid_opts=opts.GridOpts(pos_top="60%"))

)

grid.render_notebook()

3.6.19、产地信息第200到1000条数据的蔬菜分布图

w2 = data1.sort_values('最低价',ascending=True).head(100)[200:1000]

y = []  

x = []

for i in w2['品名'].value_counts().index:

    x.append(i)

for i in w2['品名'].value_counts():

    y.append(i)

bar1 = (Bar().add_xaxis(x).add_yaxis('个数', y)

       .set_global_opts(title_opts=opts.TitleOpts("最低价排序前100的蔬菜分布图"),

                        yaxis_opts=opts.AxisOpts(name="个数"),  

                        xaxis_opts=opts.AxisOpts(name="品名"))

)

bar1.render_notebook()

3.6.20、最低价排序第300到500条数据的蔬菜分布图

from pyecharts.charts import Funnel

w3 = data1.sort_values('最高价',ascending=True)[300:500]

y = []  

x = []

for i in w3['产地'].value_counts().index:

    x.append(i)

for i in w3['产地'].value_counts():

    y.append(i)

wf = Funnel()

wf.add('产地最高价分布图',[list(z) for z in zip(x,y)],is_selected = True)

wf.render_notebook()

3.6.21、查看规格列各种类出现的次数，并且绘制节点图

from collections import Counter

Counter(df1['产地'])

#绘制各省份蔬菜产地之间的关联关系

from pyecharts.charts import Graph

nodes_data = [

    opts.GraphNode(name = '辽',symbol_size = 18),

    opts.GraphNode(name = '京',symbol_size = 20),

    opts.GraphNode(name = '冀',symbol_size = 15),

    opts.GraphNode(name = '鲁',symbol_size = 30),

    opts.GraphNode(name = '豫',symbol_size = 25),

    opts.GraphNode(name = '云',symbol_size = 15),

    opts.GraphNode(name = '蒙',symbol_size = 35),

    opts.GraphNode(name = '苏',symbol_size = 20),

    opts.GraphNode(name = '浙',symbol_size = 13),

]

links_data = [

    opts.GraphLink(source = '辽',target = '鲁',value = 28),

    opts.GraphLink(source = '辽',target = '冀',value = 13),

    opts.GraphLink(source = '辽',target = '云',value = 15),

    opts.GraphLink(source = '鲁',target = '辽',value = 14),

    opts.GraphLink(source = '辽',target = '京',value = 11),

    opts.GraphLink(source = '鲁',target = '京',value = 15),

    opts.GraphLink(source = '京',target = '冀',value = 5),

    opts.GraphLink(source = '京',target = '豫',value = 3),   

    opts.GraphLink(source = '冀',target = '辽',value = 44),   

    opts.GraphLink(source = '冀',target = '京',value = 45),

    opts.GraphLink(source = '冀',target = '云',value = 18),

    opts.GraphLink(source = '蒙',target = '冀',value = 16),

    opts.GraphLink(source = '冀',target = '浙',value = 11),

    opts.GraphLink(source = '鲁',target = '云',value = 25),

    opts.GraphLink(source = '鲁',target = '辽',value = 14),

    opts.GraphLink(source = '鲁',target = '冀',value = 13),

    opts.GraphLink(source = '豫',target = '苏',value = 14),

    opts.GraphLink(source = '云',target = '鲁',value = 10),

    opts.GraphLink(source = '蒙',target = '冀',value = 16),

    opts.GraphLink(source = '蒙',target = '鲁',value = 20),

]

c = Graph(init_opts = opts.InitOpts(width = '600px',height = '400px'))

c.add("",nodes_data,links_data,repulsion = 4500)

c.set_global_opts(title_opts = opts.TitleOpts(title = "Graph - Example"))

c.render_notebook()

3.6.22、部分蔬菜产地路线和数量图

from pyecharts.charts import Geo

from pyecharts.globals import ChartType,SymbolType

c = (Geo(init_opts = opts.InitOpts(width = '600px',height = '400px'))

    .add_schema(maptype = "china")#类型是中国

    .add("蔬菜产地",[("山东",28),("天津",3),("北京",45),("云南",18),

                 ("山东",58),("河南",14),("浙江",11),("辽宁",13)],

        type_ = ChartType.EFFECT_SCATTER,color = "green")

    .add("地方",[("辽宁","山东"),("云南","天津"),("河北","北京"),

               ("河北","云南"),("河北","山东"),("河北","河南"),

               ("河北","浙江"),("河北","辽宁")],

        type_ = ChartType.LINES,

        effect_opts = opts.EffectOpts(symbol = SymbolType.ARROW,symbol_size = 6,color = "blue"),

        linestyle_opts = opts.LineStyleOpts(curve = 0.2))#设置曲度

    .set_series_opts(label_opts = opts.LabelOpts(is_show = False))#去掉主要航线标签

    .set_global_opts(title_opts = opts.TitleOpts(title = "部分蔬菜产地路线和数量")))

c.render_notebook()

四、设计遇到的问题以及难点：

4.1关键技术与难点：

(1)、如何爬取大量数据且保证数据的有效性

(2)、数据处理的方法，相关函数的应用，图像的制作

(3)、选定所要制作图像的数据

(4)、对所得结果的综合性分析

4.2 处理数据与绘制图像

(1)、有些数据在使用时出来的图像效果不明显

解决方法：选择合适的数据进行分析

(2)、对一些方法的使用不够熟练，导致设计的程序一直不过

解决方法：在前面学习过的知识进行深入理解，在网络上查看博主写的相关函数参数介绍，正确使用之后程序调试通过

(3)、前期对于绘制怎样的图像没有头绪

解决方法：参考网络上博主的图形分析，以及所学绘图知识，慢慢搭建起自己的图形

(4)、最后完成数据分析之后，依旧觉得自己爬取分析的数据量有点少，应该在设计之前再多参考一下网上可以爬取的数据。

五、设计的总结与体会

在这次的课程设计当中，让我对于数据可视化这门课程有了更加深入的认识与理解，也真正体会到了数据可视化在生活当中的应用，真正体会到了什么是“一图胜千言”。用我们目前掌握的绘图库，可以绘制出来多种多样的图，让我影响深刻的图是漏斗图，饼图，词云，桑基图，玫瑰图，节点图，以及价格变化图，每张图都能一目了然的反映数据不能直接反映的问题。

这次课程设计主要运用了我们本学期在数据可视化上学到的绘图与数据分析等模块，对于学到的知识应该学以致用，要不断的训练，才能更好地学习和掌握它。通过本次的课程设计，我也发现我还有许多不足之处。首先对一些函数的参数使用不熟练，以及数据的绘图方面还有一些欠缺的地方。我相信，通过这次的课程设计，我对于自己的欠缺知识有了更多的发现，我会在以后的学习中不断完善自己的编程能力。

你可能感兴趣的:(python学习以及数据爬取,python,开发语言)

Python-Django毕业设计医院门诊管理信息系统（程序+Lw) Python计算机毕设程序源码_ python django 课程设计
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程项目运行环境配置：Pychram社区版+python3.7.7+Mysql5.7+HBuilderX+listpip+Navicat11+Django+nodejs。项目技术：django+python+Vue等等组成，B/S模式+pychram管理等等。环境需要1.运行环境：最好是python3.7.7，我们在这个版本上开发的。其他版
鸿蒙 @ohos.arkui.componentUtils (componentUtils) 淼学派对 harmonyos 华为
鸿蒙@ohos.arkui.componentUtils(componentUtils)在鸿蒙开发中，@ohos.arkui.componentUtils模块提供了强大的功能，用于获取组件的绘制区域坐标和大小信息。这对于实现动态布局、交互效果以及用户界面测试等场景非常有用。本文将详细介绍如何使用@ohos.arkui.componentUtils模块，并提供一些实际代码示例。一、功能概述@ohos
matlab代码通过一系列的计算和绘图操作，将ZHLY空域的3D结构、跑道、中心点以及地形以可视化的方式展示出来神经网络15044 MATLAB专栏 matlab 3d 数据库
%完整版ZHLY空域3D可视化代码%定义中心点ZHLY的坐标lat_ZHLY=34+44/60+29/3600;%转换为十进制度数lon_ZHLY=112+23
python+django+vue医院门诊挂号预约管理系统57wsx QQ_402205496 django pycharm python
开发语言：Python框架：django/flaskPython版本：python3.7.7数据库：mysql数据库工具：Navicat开发软件：PyCharm主要功能有：管理员功能：系统首页、个人中心、用户管理、医生管理、疫情公告管理、行动轨迹管理、异样报告管理、科室信息管理、异常报告管理、系统管理、医院信息管理、预约信息管理、在线聊天管理、聊天回复管理、我的收藏管理。用户功能模块：系统首页、个
Python 入门『六哥』 Python python 开发语言
Python安装检测许多PC和Mac都已经安装了python。如果需要检查是否已在WindowsPC上安装了python，请在开始栏中寻找Python或在命令行（cmd.exe）上运行以下命令:C:\Users\YourName>python--version如果是检查是否在Linux或Mac上安装了python，请在Linux上打开命令行或在Mac上打开终端并键入:python--version
Python爬虫|获取大麦网演出信息最好的药物是乌梅 python 爬虫开发语言
使用Selenium库自动化浏览器操作，从大麦网的搜索结果页面抓取演唱会信息，并将这些信息保存到一个CSV文件中代码的主要步骤包括：1.初始化WebDriver。2.打开指定的URL。3.模拟点击“全部”按钮。4.循环抓取每一页的演唱会信息，并写入CSV文件。5.关闭WebDriver。代码拆分讲解1.导入相关库fromselenium.webdriver.supportimportexpecte
数码管绘制程序(python) 最好的药物是乌梅 python 开发语言
题目自行设计界面上的输出信息"加上班级姓名学号,日期的年月日等"包括字体、颜色、样式均可自行编辑.将——————————的每一行补充正确的代码。importturtle,datetimedefdrawLine(draw):#绘制单段数码管turtle.pendown()ifdrawelseturtle.penup()turtle.fd(40)——————————————————————（1）———
Kubernetes 认证授权实验总结 π大星星️ kubernetes 容器云原生
实验目标通过一系列实验步骤，深入理解Kubernetes中的认证和授权机制，包括用户账户和服务账户的创建、RBAC（基于角色的访问控制）的配置与应用，以及如何通过这些机制实现对Kubernetes资源的安全访问控制。实验环境Kubernetes集群（已部署并运行）kubectl命令行工具（已配置并连接到集群）一台具有管理员权限的主机（用于执行命令）实验一：创建用户账户并进行认证实验目的创建一个用户
深入了解 Kafka：应用场景、架构和GO代码示例 spiker_ kafka 架构 golang
深入了解Kafka：应用场景、架构和GO代码示例ApacheKafka是一个分布式流平台，用于实时数据处理和流处理。在这篇博客中，我们将介绍Kafka的主要应用场景、架构及主要组件，并展示如何使用Go语言操作Kafka，包括Kafka生产者、消费者的示例代码，以及如何通过KafkaConnectRESTAPI配置连接器。Kafka的主要应用场景实时数据流处理：Kafka用于处理实时数据流，如用户行
tensorflow 不支持python3以下的版本辽宁大学神经网络神经网络
小白一枚，没用过tensorflow，所以在安装的时候导致版本错误安装不上。遇到这种情况建议换python的版本。
pmap 命令详解：使用场景、参数解析与实际应用实例 weixin_42587823 linux云计算服务器 linux 运维
pmap命令详解：使用场景、参数解析与实际应用实例在Linux系统中，了解进程的内存使用情况对系统调优、故障排查和内存泄漏分析至关重要。pmap命令就是一个非常实用的工具，它可以显示指定进程的内存映射信息，帮助我们直观地了解内存分配情况、共享库的加载情况以及各个内存段的占用详情。本文将详细介绍pmap命令的使用场景、各参数的功能及实际应用实例，包括具体的输入命令和输出解释。一、pmap命令的基本概
Adobe Firefly 技术浅析（三）：GANs 的改进爱研究的小牛 AIGC——图像 AIGC—生成对抗网络 AIGC 机器学习深度学习
生成式对抗网络（GANs）在图像生成领域取得了显著的进展，但原始的GANs在训练稳定性、生成质量以及多样性方面存在一些挑战。AdobeFirefly在其图像生成技术中采用了多种改进的GANs方法，以提高生成图像的质量和多样性。1.条件生成式对抗网络（cGANs）1.1基本原理条件生成式对抗网络（cGANs）通过引入额外的条件信息（如类别标签、文本描述等），使得生成器能够根据这些条件生成特定类型的图
第5篇：从入门到精通：深入详解Python模块与包管理的应用猿享天开 python 开发语言
第5篇：模块与包管理目录模块概述什么是模块导入模块标准库简介创建与使用自定义模块创建模块导入自定义模块模块搜索路径包（Packages）什么是包创建包导入包中的模块常用内置模块介绍math模块datetime模块os模块sys模块模块与包的最佳实践命名规范组织结构避免循环导入示例代码常见问题及解决方法总结模块概述什么是模块模块是Python中组织代码的一种方式。一个模块就是一个包含Python定义
用Python打造智能姓名生成器：从数据分离到AI赋能灏瀚星空 python 人工智能开发语言经验分享笔记
用Python打造智能姓名生成器：从数据分离到AI赋能目录项目概述与功能清单环境准备与工具选择项目架构设计核心代码实现AI古文解析模块交互界面开发使用示例与效果展示扩展思路与优化建议1.项目概述与功能清单核心功能数据管理CSV文件存储姓氏/名字库支持用户导入/导出数据交互界面姓名生成与实时预览已选名单管理（增删改查）排除词输入框（黑名单过滤）AI赋能从古文中提取字词及注解自动生成姓名寓意解析扩展功
Python常用10个模块详解：提升开发效率的利器 Python_trys python microsoft 数据库开发语言 Python入门 Python基础 Python教程
包含编程籽料、学习路线图、爬虫代码、安装包等！【点击领取！】Python作为一门功能强大且易于学习的编程语言，拥有丰富的标准库和第三方模块，能够帮助开发者快速实现各种功能。本文将详细介绍Python中常用的10个模块，帮助你在开发中更高效地完成任务。1.os模块：操作系统交互os模块提供了与操作系统交互的功能，包括文件操作、目录管理、环境变量等。常用功能：文件与目录操作：importos#获取当前
掌握Conda的艺术：精通channels管理 2401_85702623 conda
掌握Conda的艺术：精通channels管理Conda作为Python和其他科学计算包的包管理器，其强大的包管理能力很大程度上依赖于channels。channels是Conda用来查找和安装包的源。默认情况下，Conda会从Anaconda的官方源安装包，但有时我们需要添加额外的channels来获取更多的包或者特定版本的包。本文将详细介绍如何在Conda中使用condaconfig--add
Python模块详解：定义、操作方法与高级特性编程咕咕gu- python 数据库开发语言学习路线数据分析
如果你正在学习Python，那么你需要的话可以点击这里Python重磅福利：入门&进阶全套学习资料、电子书、软件包、项目源码等等免费分享！在Python中，模块是一个包含Python定义和语句的文件。模块可以定义函数、类和变量。模块也可以包含可执行的代码。你可以通过import语句将一个模块中的函数、类等导入到当前的程序中，以便能够重复使用代码，提高代码的可维护性。模块定义一个Python文件（.
3.13.0 python 配置tensorflow（CPU版本） m0_Gattuso tensorflow 人工智能 python
condacreate--nametestpython=3.12activatetestpipinstalltensorflow上面3步骤在condaprompt里完成退出时记得condadeactivate来源：Windows下tensorflow/pytorch环境配置_pycharm怎么配置tensorflow环境-CSDN博客然后问题出现了：condaenvironment里什么都没有，理
2021-05-21 python中curses基本用法 zerfew python curses cli
有时候linux系统没有界面，可能需要在terminal终端完成程序的交互和状态显示，C语言的ncurses支持命令行界面程序开发，curses是基于ncurses实现的python终端界面库。本文实现一个简单的demo小程序，方便初学者学习和使用。首先上demo主程序#-*-coding:UTF-8-*-importcursesimportlocalelocale.setlocale(local
构建可扩展的Python API与框架：实践与指南清水白石008 Python题库 python 计算机 python 开发语言
构建可扩展的PythonAPI与框架：实践与指南一、引言在当今的软件开发中，可扩展性已成为一个不可或缺的特性。一个可扩展的API或框架不仅能够满足当前的需求，还能轻松应对未来的变化和增长。本文将深入探讨在Python中如何设计一个可扩展的API或框架，通过实际例子和详细步骤，为您提供一个实用的指南。二、理解可扩展性可扩展性指的是系统或软件能够容易地适应变化，包括但不限于新功能的添加、现有功能的修改
在 Python 中实现 RESTful API 的完整指南清水白石008 python Python题库 python restful 开发语言
在Python中实现RESTfulAPI的完整指南随着互联网的发展，RESTfulAPI（RepresentationalStateTransfer）已成为现代应用程序架构的重要组成部分。RESTfulAPI允许不同系统之间通过HTTP协议进行通信，提供了一种简单而灵活的方式来访问和操作资源。在这篇文章中，我们将深入探讨如何在Python中实现RESTfulAPI，并提供简单的示例代码。一、什么是
MIE 1622H Risk-Based and Robust 后端
MIE1622H:Assignment2–Risk-BasedandRobustPortfolioSelectionStrategiesDr.OleksandrRomanko,MohammadrezaMohammadiFebruary10,2025Due:Friday,March7,2025,notlaterthan11:59p.m.UsePythonforallMIE1622Hassignmen
python测试工具 doctest pythondoctest
python调试工具doctestbriefintroductiondoctest是python自带的一个调试测试工具，可用于初步检测你写的python程序的输入与输出结果是否符合你的预期通过在自己写的函数内，按照规定的格式写上你想要对比的输入输出结果，再使用python3-mdoctestexample.py(example.py是你要test的python程序)，python会自动帮你用你的输
关于“Python int too large to convert to C long”的解决。 James Bamp python python too large long
这个问题在我使用python计算平方的时候出现，其实问题的症结并不是数据太大（你可以使用print(很大的数的平方)来验证，会发现是可以输出的），而是数据结构的问题。具体是指，直接使用np.array数据来遍历，会出问题，但是如果将np.array数据转化为列表形式再遍历，那么就不会出现问题。例如：data=np.array(100020003000)#计算平方和sum_squa=0foriinr
python restful api 高并发_Python 之路，Restful API设计规范 IT小霸王 python restful api 高并发
理解RESTful架构RestfulAPI设计指南理解RESTful架构越来越多的人开始意识到，网站即软件，而且是一种新型的软件。这种"互联网软件"采用客户端/服务器模式，建立在分布式体系上，通过互联网通信，具有高延时(highlatency)、高并发等特点。网站开发，完全可以采用软件开发的模式。但是传统上，软件和网络是两个不同的领域，很少有交集；软件开发主要针对单机环境，网络则主要研究系统之间的
# Manim学习记录（2）鼠鼠emo了捏 python numpy vscode 数学建模
第一个案例GraphingMovement这个开始再坐标轴上画函数图像以及移动frommanimimport*classGraphingMovement(Scene):defconstruct(self):axes=Axes(x_range=[0,5,1],#x轴范围：从0到5，刻度间隔为1y_range=[0,3,1],#y轴范围：从0到3，刻度间隔为1x_length=5,#x轴长度为5（单位
数据分析：数据的存储结构、数据类型、数据集成技术、存储模型、查询语言、API、驱动器等 AI天才研究院 Python实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介数据分析是一个复杂的工程，需要用到多个数据库、数据表、数据文件等数据集成资源。不同的数据集成环境（如分布式系统、异构数据库）会影响数据分析的效率和效果。在进行数据分析时，首先要确定数据集成方案、选择合适的数据模型和索引策略，以及评估各种解决方案之间的优劣。因此，掌握数据的存储结构、数据类型、数据集成技术、存储模型、查询语言、API、驱动器等关键信息对数据分析工作
Python int too large to convert to C long 铃音. 笔记 python 开发语言 c语言
报错在用python的matplotlib库绘制折线图时我报了这个错误PythoninttoolargetoconverttoClong解决方法win+R然后输入cmd,再输入pipinstall--upgradematplotlib然后问题就解决了
Python精进系列： K-Means 聚类算法调用库函数和手动实现对比分析进一步有进一步的欢喜 Python 精进系列算法 python kmeans
一、引言在机器学习领域，聚类分析是一种重要的无监督学习方法，用于将数据集中的样本划分为不同的组或簇，使得同一簇内的样本具有较高的相似性，而不同簇之间的样本具有较大的差异性。K-Means聚类算法是最常用的聚类算法之一，它以其简单性和高效性在数据挖掘、图像分割、模式识别等领域得到了广泛应用。本文将详细介绍K-Means聚类算法，并分别给出调用现成函数和不调用任何现成函数实现K-Means聚类的代码示
Windows Curses Python 模块使用教程邱进斌Olivia
WindowsCursesPython模块使用教程windows-cursesWindowsCursesPythonmodule项目地址:https://gitcode.com/gh_mirrors/wi/windows-curses1.项目介绍windows-curses是一个为Windows平台提供Pythoncurses模块的Python包。curses模块是Python标准库的一部分，但在
矩阵求逆（JAVA）利用伴随矩阵 qiuwanchi 利用伴随矩阵求逆矩阵
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(利用伴随矩阵) * @author 邱万迟
单例（Singleton）模式 aoyouzi 单例模式 Singleton
3.1 概述如果要保证系统里一个类最多只能存在一个实例时，我们就需要单例模式。这种情况在我们应用中经常碰到，例如缓存池，数据库连接池，线程池，一些应用服务实例等。在多线程环境中，为了保证实例的唯一性其实并不简单，这章将和读者一起探讨如何实现单例模式。 3.2
[开源与自主研发]就算可以轻易获得外部技术支持,自己也必须研发 comsci 开源
现在国内有大量的信息技术产品，都是通过盗版，免费下载，开源，附送等方式从国外的开发者那里获得的。。。。。。虽然这种情况带来了国内信息产业的短暂繁荣，也促进了电子商务和互联网产业的快速发展，但是实际上，我们应该清醒的看到，这些产业的核心力量是被国外的
页面有两个frame,怎样点击一个的链接改变另一个的内容 Array_06 UI XHTML
<a src="地址" targets="这里写你要操作的Frame的名字" />搜索然后你点击连接以后你的新页面就会显示在你设置的Frame名字的框那里 targerts="",就是你要填写目标的显示页面位置 ===================== 例如： <frame src=&
Struts2实现单个/多个文件上传和下载 oloz 文件上传 struts
struts2单文件上传：步骤01:jsp页面  　　<form action="fileUplo
推荐10个在线logo设计网站 362217990 logo
在线设计Logo网站。 1、http://flickr.nosv.org（这个太简单） 2、http://www.logomaker.com/?source=1.5770.1 3、http://www.simwebsol.com/ImageTool 4、http://www.logogenerator.com/logo.php?nal=1&tpl_catlist[]=2 5、ht
jsp上传文件香水浓 jsp fileupload
1. jsp上传 Notice： 1. form表单 method 属性必须设置为 POST 方法，不能使用 GET 方法 2. form表单 enctype 属性需要设置为 multipart/form-data 3. form表单 action 属性需要设置为提交到后台处理文件上传的jsp文件地址或者servlet地址。例如 uploadFile.jsp 程序文件用来处理上传的文
我的架构经验系列文章 - 前端架构 agevs JavaScript Web 框架 UI jQuer
框架层面：近几年前端发展很快，前端之所以叫前端因为前端是已经可以独立成为一种职业了，js也不再是十年前的玩具了，以前富客户端RIA的应用可能会用flash/flex或是silverlight，现在可以使用js来完成大部分的功能，因此js作为一门前端的支撑语言也不仅仅是进行的简单的编码，越来越多框架性的东西出现了。越来越多的开发模式转变为后端只是吐json的数据源，而前端做所有UI的事情。MVCMV
android ksoap2 中把XML(DataSet) 当做参数传递 aijuans android
我的android app中需要发送webservice ，于是我使用了 ksop2 进行发送，在测试过程中不是很顺利,不能正常工作.我的web service 请求格式如下 [html] view plain copy <Envelope xmlns="http://schemas.
使用Spring进行统一日志管理 + 统一异常管理 baalwolf spring
统一日志和异常管理配置好后，SSH项目中，代码以往散落的log.info() 和 try..catch..finally 再也不见踪影！统一日志异常实现类： [java] view plain copy package com.pilelot.web.util; impor
Android SDK 国内镜像 BigBird2012 android sdk
一、镜像地址： 1、东软信息学院的 Android SDK 镜像，比配置代理下载快多了。配置地址， http://mirrors.neusoft.edu.cn/configurations.we#android 2、北京化工大学的： IPV4:ubuntu.buct.edu.cn IPV4:ubuntu.buct.cn IPV6:ubuntu.buct6.edu.cn
HTML无害化和Sanitize模块 bijian1013 JavaScript AngularJS Linky Sanitize
一.ng-bind-html、ng-bind-html-unsafe AngularJS非常注重安全方面的问题，它会尽一切可能把大多数攻击手段最小化。其中一个攻击手段是向你的web页面里注入不安全的HTML，然后利用它触发跨站攻击或者注入攻击。考虑这样一个例子，假设我们有一个变量存
[Maven学习笔记二]Maven命令 bit1129 maven
mvn compile compile编译命令将src/main/java和src/main/resources中的代码和配置文件编译到target/classes中，不会对src/test/java中的测试类进行编译 MVN编译使用 maven-resources-plugin:2.6:resources maven-compiler-plugin:2.5.1:compile &nbs
【Java命令二】jhat bit1129 Java命令
jhat用于分析使用jmap dump的文件，，可以将堆中的对象以html的形式显示出来，包括对象的数量，大小等等，并支持对象查询语言。 jhat默认开启监听端口7000的HTTP服务，jhat是Java Heap Analysis Tool的缩写 1. 用法： [hadoop@hadoop bin]$ jhat -help Usage: jhat [-stack <bool&g
JBoss 5.1.0 GA:Error installing to Instantiated: name=AttachmentStore state=Desc ronin47
进到类似目录 server/default/conf/bootstrap，打开文件 profile.xml找到： Xml代码<bean name="AttachmentStore" class="org.jboss.system.server.profileservice.repository.AbstractAtta
写给初学者的6条网页设计安全配色指南 brotherlamp UI ui自学 ui视频 ui教程 ui资料
网页设计中最基本的原则之一是，不管你花多长时间创造一个华丽的设计，其最终的角色都是这场秀中真正的明星——内容的衬托我仍然清楚地记得我最早的一次美术课，那时我还是一个小小的、对凡事都充满渴望的孩子，我摆放出一大堆漂亮的彩色颜料。我仍然记得当我第一次看到原色与另一种颜色混合变成第二种颜色时的那种兴奋，并且我想，既然两种颜色能创造出一种全新的美丽色彩，那所有颜色
有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。写一个函数实现。复杂度是什么。 bylijinnan java 算法面试
import java.util.Random; import java.util.Set; import java.util.TreeSet; /** * http://weibo.com/1915548291/z7HtOF4sx * #面试题#有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。 * 写一个函数实现。复杂度是什么
struts2获得request、session、application方式 chiangfai application
1、与Servlet API解耦的访问方式。 a.Struts2对HttpServletRequest、HttpSession、ServletContext进行了封装，构造了三个Map对象来替代这三种对象要获取这三个Map对象，使用ActionContext类。 -----> package pro.action; import java.util.Map; imp
改变python的默认语言设置 chenchao051 python
import sys sys.getdefaultencoding() 可以测试出默认语言，要改变的话，需要在python lib的site-packages文件夹下新建： sitecustomize.py，这个文件比较特殊，会在python启动时来加载，所以就可以在里面写上： import sys sys.setdefaultencoding('utf-8') &n
mysql导入数据load data infile用法 daizj mysql 导入数据
我们常常导入数据！mysql有一个高效导入方法，那就是load data infile 下面来看案例说明基本语法： load data [low_priority] [local] infile 'file_name txt' [replace | ignore] into table tbl_name [fields [terminated by't'] [OPTI
phpexcel导入excel表到数据库简单入门示例 dcj3sjt126com PHP Excel
跟导出相对应的，同一个数据表，也是将phpexcel类放在class目录下，将Excel表格中的内容读取出来放到数据库中 <?php error_reporting(E_ALL); set_time_limit(0); ?> <html> <head> <meta http-equiv="Content-Type"
22岁到72岁的男人对女人的要求 dcj3sjt126com
22岁男人对女人的要求是：一，美丽，二，性感，三，有份具品味的职业，四，极有耐性，善解人意，五，该聪明的时候聪明，六，作小鸟依人状时尽量自然，七，怎样穿都好看，八，懂得适当地撒娇，九，虽作惊喜反应，但看起来自然，十，上了床就是个无条件荡妇。 32岁的男人对女人的要求，略作修定，是：一，入得厨房，进得睡房，二，不必服侍皇太后，三，不介意浪漫蜡烛配盒饭，四，听多过说，五，不再傻笑，六，懂得独
Spring和HIbernate对DDM设计的支持 e200702084 DAO 设计模式 spring Hibernate 领域模型
A：数据访问对象 DAO和资源库在领域驱动设计中都很重要。DAO是关系型数据库和应用之间的契约。它封装了Web应用中的数据库CRUD操作细节。另一方面，资源库是一个独立的抽象，它与DAO进行交互，并提供到领域模型的“业务接口”。资源库使用领域的通用语言，处理所有必要的DAO，并使用领域理解的语言提供对领域模型的数据访问服务。
NoSql 数据库的特性比较 geeksun NoSQL
Redis 是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。目前由VMware主持开发工作。 1. 数据模型作为Key-value型数据库，Redis也提供了键（Key）和值（Value）的映射关系。除了常规的数值或字符串，Redis的键值还可以是以下形式之一： Lists （列表） Sets
使用 Nginx Upload Module 实现上传文件功能 hongtoushizi nginx
转载自： http://www.tuicool.com/wx/aUrAzm 普通网站在实现文件上传功能的时候，一般是使用Python，Java等后端程序实现，比较麻烦。Nginx有一个Upload模块，可以非常简单的实现文件上传功能。此模块的原理是先把用户上传的文件保存到临时文件，然后在交由后台页面处理，并且把文件的原名，上传后的名称，文件类型，文件大小set到页面。下
spring-boot-web-ui及thymeleaf基本使用 jishiweili spring thymeleaf
视图控制层代码demo如下： @Controller @RequestMapping("/") public class MessageController { private final MessageRepository messageRepository; @Autowired public MessageController(Mes
数据源架构模式之活动记录 home198979 PHP 架构活动记录数据映射
hello!架构一、概念活动记录（Active Record）：一个对象，它包装数据库表或视图中某一行，封装数据库访问，并在这些数据上增加了领域逻辑。对象既有数据又有行为。活动记录使用直截了当的方法，把数据访问逻辑置于领域对象中。二、实现简单活动记录活动记录在php许多框架中都有应用，如cakephp。 <?php /** * 行数据入口类 *
Linux Shell脚本之自动修改IP pda158 linux centos Debian 脚本
作为一名 Linux SA，日常运维中很多地方都会用到脚本，而服务器的ip一般采用静态ip或者MAC绑定，当然后者比较操作起来相对繁琐，而前者我们可以设置主机名、ip信息、网关等配置。修改成特定的主机名在维护和管理方面也比较方便。如下脚本用途为：修改ip和主机名等相关信息，可以根据实际需求修改，举一反三！ #!/bin/sh #auto Change ip netmask ga
开发环境搭建独浮云 eclipse jdk tomcat
最近在开发过程中，经常出现MyEclipse内存溢出等错误，需要重启的情况，好麻烦。对于一般的JAVA+TOMCAT项目开发，其实没有必要使用重量级的MyEclipse，使用eclipse就足够了。尤其是开发机器硬件配置一般的人。 &n