灵海之森

利用百度情感分析进行微博评论数据分析及可视化（万字长文）

总览：
*输入：*关键词
*输出：*分日期情感均值折线图，主题词云，分省市情感均值折线图

一、微博数据爬取

1.爬取指定关键词相关的微博
2.根据爬取到的微博信息爬取到相关的评论数据
这里主要借鉴了

https://github.com/dataabc/weibo-crawler

3.将零散的单个微博下的所有评论整合在一个excel文件中，这里利用我的上一篇博客中的方法进行合并，得到总体的数据。

二、百度情感分析

我使用的是Python的SDK，详细使用见百度。
在配置好baidu-aip后，直接提取上一步获取到的评论数据进行百度情感分析，并写入新的excel文件中，代码如下，涉及微博表情字符化处理、提取excel文件中的一列、处理baidu-aip的并发限制问题等内容。

#coding=utf-8
from aip import AipNlp
import xlrd
import re
import xlwt
import time as t
""" 
你的 APPID AK SK 
每秒钟只能调用两次
"""
APP_ID = ''
API_KEY = ''
SECRET_KEY = ''
client = AipNlp(APP_ID, API_KEY, SECRET_KEY)

def filter_emoji(content):
	try:
	    # Wide UCS-4 build
	    cont = re.compile(u'['u'\U0001F300-\U0001F64F' u'\U0001F680-\U0001F6FF'u'\u2600-\u2B55]+')
	except re.error:
	    # Narrow UCS-2 build
	    cont = re.compile(u'('u'\ud83c[\udf00-\udfff]|'u'\ud83d[\udc00-\ude4f\ude80-\udeff]|'u'[\u2600-\u2B55])+')
	return cont.sub (u'', str(content))

def extract(inpath):
    """提取数据"""
    data = xlrd.open_workbook(inpath, encoding_override='utf-8')
    table = data.sheets()[0]#选定表
    nrows = table.nrows#获取行号
    ncols = table.ncols#获取列号
    numbers=[]
    for i in range(1, nrows):#第0行为表头
        alldata = table.row_values(i)#循环输出excel表中每一行，即所有数据
        result_1 = alldata[1]#取出评论内容
        result_2 = alldata[2]#取出日期
        result_3 = alldata[3]#取出地区
        numbers.append([result_1,result_2,result_3])
    return numbers

def run(inpath):
    "运行程序,返回一个嵌套小列表的大列表"
    alls=[]#大列表
    all=extract(inpath)
    for i in all:#i是三个元素的小列表
        c=i[2]#日期
        b=i[1]#地区
        a=i[0]#评论内容
        a=filter_emoji(a)#表情过滤
        #a=re.sub(r'[^\u4e00-\u9fa5]','',str(a))#保证只有中文
        p = re.findall(r'回复@.*?:',a) #去除前面的无用文本
        if len(p) != 0:
            p=str(p[0])
            a=a.replace(p,'')
        else:
            pass
        if a.strip()=='':#如果a为空，就结束本次循环开始下次循环
            continue

        while True:#处理aps并发异常
            judge=client.sentimentClassify(a)#获取评论，进行情感判断
            if judge=={'error_code': 18, 'error_msg': 'Open api qps request limit reached'}:
                t.sleep(1)
                continue
            else:
                break
        if 'error_msg' in judge:#如果出现意外的报错，就结束本次循环
            continue
        print(judge)
        print(a)
        pm=judge['items'][0]['sentiment']#情感分类
        print(pm)
        pp=judge['items'][0]['positive_prob']#正向概率
        np=judge['items'][0]['negative_prob']#负向概率
        alls.append([c,b,a,pm,pp,np])
    return alls

def save_file(alls,name):
    """将一个时间段的所有评论数据保存在一个excle
    """
    f=xlwt.Workbook()
    sheet1=f.add_sheet(u'sheet1',cell_overwrite_ok=True)
    sheet1.write(0,0,'评论日期')
    sheet1.write(0,1,'所属地区')
    sheet1.write(0,2,'评论内容')
    sheet1.write(0,3,'情感极性')
    sheet1.write(0,4,'正向概率')
    sheet1.write(0,5,'负向概率')
    i=1
    #for all in alls:#遍历每一页
    for data in alls:#遍历每一行
        for j in range(len(data)):#取每一单元格
            sheet1.write(i,j,data[j])#写入单元格
        i=i+1#往下一行
    f.save(str(name))

if __name__ == "__main__":
    save_file(run('数据.xls'),'情感分析.xls')

三、绘制分日期正负情感均值折线图

1.在上一步我们得到了评论的情感值文件，因此需要进一步计算情感均值。
这里有两种算法：

将情感倾向为正的情感数值取为其正向概率[0.5-1]，情感倾向为负的情感数值亦取其正向概率[0,0.5)。每日的正向情感均值为所有正向倾向的评论对应的正向概率之和除以其评论数量，负向情感均值同理。
将情感倾向为正的情感数值取为其正向概率[0-1]，情感倾向为负的情感数值取其负向概率[0,1]。每日的正向情感均值为其所有正向倾向的评论对应的正向概率之和除以其评论数量再乘以正向评论数量在当日总评论数量（包含中性）的比重，负向情感均值同理。

我采用的是第二种。在对比了两个算法绘制出的折线图之和发现第二种更适合折线图分析。
有必要提一下，第一种算法是《重大公共卫生事件中的舆情分析方法研究——以新冠肺炎疫情为例》中应用的，第二种是我推敲出来的。
这里特别感谢该篇论文的作者团队于百忙之中给予的热心指导！
2.进行分日期的情感均值的计算，就要先进行日期的合并，这里使用datafrme方式进行日期的合并计算。

#coding='utf-8'
import xlrd
import xlwt
import datetime
import re
import pandas as pd
import numpy as np
import time

def avg(data,rate):
    #求列表的均值
    #第一个是列表，第二个是比率
    sum=0
    for i in data:
        sum=sum+i
    av=(sum/len(data))*rate
    return av
def avg_y(data):
    #求列表的均值
    #第一个是列表，第二个是比率
    sum=0
    for i in data:
        sum=sum+i
    av=sum/len(data)
    return av
def trans(date):
    """日期，必须是字符串"""
    #原算法适宜绘制地图，我的算法适宜折线图
    #算均值的算法有问题
    #尝试使用比例作为权重
    #原作者的算法：对于正向倾向文本取其正向概率，位于(0.5,1];对于负向倾向文本亦取其正向概率，位于[0,0.5)。
    #均值是将正向倾向的正向概率相加平均，负向倾向也是正向概率相加平均。
    c=[]#正向列表
    d=[]#负向列表
    e=[]#中性列表
    a=data.loc[str(date)]#选定索引为该日期的所有行
    #print(a)
    for row in a.itertuples(index=True, name='Pandas'):
        #print(getattr(row, "极性"), getattr(row, "正向概率"),getattr(row, "负向概率"))
        if getattr(row, "极性")==2:
            c.append(getattr(row, "正向概率"))#正向的概率值列表
        elif getattr(row, "极性")==3:
            d.append(getattr(row, "负向概率"))#负向的概率值列表
        elif getattr(row, "极性")==1:
            e.append(1)#中性列表，纯用作计数
        else:
            pass

    sum_0=len(c)+len(d)+len(e)#评论总数量
    rate_c=len(c)/sum_0#正向评论于该天占比
    rate_d=len(d)/sum_0#负向评论于该天占比
    d_c=avg(c,rate_c)
    d_d=avg(d,rate_d)
    print("正向均值："+str(d_c))
    print("负向均值："+str(d_d))
    nums=[date,d_c,d_d]
    return nums
def save_afile(all,file):
    """将降维后的数据保存在一个excle
        传递给一个列表的列表，和一个文件名
    """
    f=xlwt.Workbook()
    sheet1=f.add_sheet(u'sheet1',cell_overwrite_ok=True)
    sheet1.write(0,0,'日期')
    sheet1.write(0,1,'正向均值')
    sheet1.write(0,2,'负向均值')
    i=1
    for data in all:#遍历每一行
            for j in range(len(data)):#取每一单元格
                sheet1.write(i,j,data[j])#写入单元格
            i=i+1#往下一行
    f.save(file+'.xls')
def dates(start,end):
    """生成时间序列
          输入起止日期
    """
    d=[]
    a=pd.date_range(start,end,freq='D')
    for i in a:
        i=str(i).replace('00:00:00','')
        i=i.strip()
        d.append(i)
    return d

'''
trans函数得出一天的列表，
可不做中性的情感均值
生成两年的日期，遍历
汇总并写入新的excel
'''
if __name__ == '__main__':
    data_1=pd.read_excel(r'')#文件路径
    data = pd.DataFrame(data_1)#将excel文件读取并转换为dataframe格式
    print(data)
    data['日期'] = pd.to_datetime(data['日期'])
    data.set_index("日期", inplace=True)
    print(data)
    dates_0=dates('2020-01-10','2021-03-09')#日期序列生成
    #print(dates_0)
    alls=[]
    for i in dates_0:
        try:
            alls.append(trans(str(i)))
        except:
            continue
    print(alls)
    save_afile(alls,'每日评论情感值')
    print('OVER!')

3.获得每日的情感均值文件后，开始绘制折线图，由于我采用第二种算法，因此沿x轴对称的折线图更合适些。参照：

https://gallery.pyecharts.org/#/Line/rainfall_and_water_flow

绘制折线图代码如下：

#coding='utf-8'
import xlrd
import pyecharts.options as opts
from pyecharts.charts import Line, Grid

def extract(col):
    """提取数据
          路径+列号
    """
    data = xlrd.open_workbook(r'', encoding_override='utf-8')#文件
    table = data.sheets()[0]#选定表
    nrows = table.nrows#获取行号
    ncols = table.ncols#获取列号
    numbers=[]
    for i in range(1, nrows):#第0行为表头
        alldata = table.row_values(i)#循环输出excel表中每一行，即所有数据
        result_1 = alldata[col]#取出评论内容
        numbers.append(result_1)
    return numbers

dates=extract(0)#日期
pos=extract(1)#正向倾向
neg=extract(2)#负向倾向

l1 = (
    Line()
    .add_xaxis(xaxis_data=dates)
    .add_yaxis(
        series_name="正向情感",
        y_axis=pos,
        symbol_size=8,
        is_hover_animation=False,
        label_opts=opts.LabelOpts(is_show=False),
        linestyle_opts=opts.LineStyleOpts(width=1.5),
        is_smooth=True,
    )
    .set_global_opts(
        title_opts=opts.TitleOpts(
            title="离婚冷静期前后公众正负向情感均值", subtitle="数据来自微博", pos_left="center"
        ),
        tooltip_opts=opts.TooltipOpts(trigger="axis"),
        axispointer_opts=opts.AxisPointerOpts(
            is_show=True, link=[{"xAxisIndex": "all"}]
        ),
        datazoom_opts=[
            opts.DataZoomOpts(
                is_show=True,
                is_realtime=True,
                start_value=30,
                end_value=70,
                xaxis_index=[0, 1],
            )
        ],
        xaxis_opts=opts.AxisOpts(
            type_="category",
            boundary_gap=False,
            axisline_opts=opts.AxisLineOpts(is_on_zero=True),
        ),
        yaxis_opts=opts.AxisOpts(max_=1, name="情感值"),
        legend_opts=opts.LegendOpts(pos_left="left"),
        toolbox_opts=opts.ToolboxOpts(
            is_show=True,
            feature={
                "dataZoom": {"yAxisIndex": "none"},
                "restore": {},
                "saveAsImage": {},
            },
        ),
    )
)

l2 = (
    Line()
    .add_xaxis(xaxis_data=dates)
    .add_yaxis(
        series_name="负向情感",
        y_axis=neg,
        xaxis_index=1,
        yaxis_index=1,
        symbol_size=8,
        is_hover_animation=False,
        label_opts=opts.LabelOpts(is_show=False),
        linestyle_opts=opts.LineStyleOpts(width=1.5),
        is_smooth=True,
    )
    .set_global_opts(
        axispointer_opts=opts.AxisPointerOpts(
            is_show=True, link=[{"xAxisIndex": "all"}]
        ),
        tooltip_opts=opts.TooltipOpts(trigger="axis"),
        xaxis_opts=opts.AxisOpts(
            grid_index=1,
            type_="category",
            boundary_gap=False,
            axisline_opts=opts.AxisLineOpts(is_on_zero=True),
            position="top",
        ),
        datazoom_opts=[
            opts.DataZoomOpts(
                is_realtime=True,
                type_="inside",
                start_value=30,
                end_value=70,
                xaxis_index=[0, 1],
            )
        ],
        yaxis_opts=opts.AxisOpts(is_inverse=True, name="情感值"),
        legend_opts=opts.LegendOpts(pos_left="7%"),
    )
)

(
    Grid(init_opts=opts.InitOpts(width="1200px", height="720px"))
    .add(chart=l1, grid_opts=opts.GridOpts(pos_left=50, pos_right=50, height="35%"))
    .add(
        chart=l2,
        grid_opts=opts.GridOpts(pos_left=50, pos_right=50, pos_top="55%", height="35%"),
    )
    .render("情感均值走势图.html")
)

四、制作主题词云

1.事先根据需要将评论内容依据时间段以及正负倾向划分为十个不同的txt文件。
2.准备好自建词表、停用词表文件。我会另发一篇帖子免费发布我整理的中文停用词表。这里记录一下词表去重代码：

#coding='utf-8'

list01 = []
for i in open('停用词表.txt',encoding='utf-8'):
    if i in list01:
        continue
    list01.append(i)
with open('停用词表去重.txt', 'w') as handle:
    handle.writelines(list01)
# test.txt 源文件
# test01.txt 输出文件

3.之后就是制作词云。本来是准备用BTM主题分析，但只迭代了6次就花费了15分钟，一个文件至少得迭代数百次，时间耗费太长，关于这部分的内容可以参见上文所述的论文。
因此我使用词频统计制作，代码如下：

#coding='utf-8'
import jieba  # 分词
import re
from wordcloud import WordCloud  # 词云图相关
import matplotlib.pyplot as plt
import matplotlib.colors as colors  # 处理图片相关内容
import numpy
from PIL import Image

# 创建停用词list
def stopwordslist(filepath):
    stopwords = [line.strip() for line in open(filepath, 'r', encoding='utf-8').readlines()]
    return stopwords
# 对句子进行分词
def seg_sentence(sentence):
    sentence_seged = jieba.cut(sentence.strip())
    stopwords = stopwordslist('停用词表.txt')  # 这里加载停用词的路径
    outstr = ''
    for word in sentence_seged:
        if word not in stopwords:
            word=re.sub(r'[^\u4e00-\u9fa5]','',str(word))#保证只有中文
            if word != '\t':
                outstr += word
                outstr += " "
    return outstr


def get_wcloud(file):
    tokenstr=[]
	# 读取文件内容
    inputs=open(file, 'r', encoding='utf-8') 
    # 加载词典
    jieba.load_userdict('自建词表.txt')
    # 也可以添加自定义词典
    for line in inputs:
        line_seg = seg_sentence(line)  # 这里的返回值是字符串
        tokenstr.append(line_seg)

    tokenstr=' '.join(tokenstr)
    print(tokenstr)
    # 打开背景图片
    color_mask = numpy.array(Image.open('圆.png'))
    # 自定义文字颜色
    colormaps = colors.ListedColormap(['#FF0000','#FF7F50','#FFE4C4'])
    # 生成词云（默认样式）
    # mywc1 = WordCloud().generate(tokenstr)
    # 生成词云（自定义样式）
    mywc1 = WordCloud(
        scale=10, #这个数值越大，产生的图片分辨率越高，字迹越清晰，最好不要超过64，运行很慢
        max_words=50, 
        mask=color_mask,  # 指定背景图形状
        colormap=colormaps,  # 指定颜色
        font_path='C:\Windows\Fonts\simhei.ttf',  # 指定字体
        background_color='white',  # 指定背景颜色，默认黑色
        width=1200,  # 指定宽度
        height=900  # 指定高度
    ).generate(tokenstr)
    # 显示词云
    plt.imshow(mywc1)
    plt.axis('off')
    #plt.show()
    mywc1.to_file(r'主题词云/负向/'+str(file).replace('负向语料/','')+'.png')  # 生成词云图片

if __name__ == '__main__':
    nams=['1.1-1.5.txt','1.5-3.8.txt','5.28-12.4.txt','5.28及以前.txt','12.4-次年1.1.txt']
    for i in nams:
        get_wcloud(r'负向语料/'+i)

五、绘制分省情感均值地图

上面实现了时间序列下的情感变动分析，最后来实现空间位置的情感均值分布可视化。
每个省市都有若干条评论，和绘制分日期的情感均值折线图一样，需要合并地区的情感值。
1.对省市的情感值计算其均值。同样使用第二种算法。代码如下：

#coding='utf-8'
import xlrd
import xlwt
import datetime
import re
import pandas as pd
import numpy as np
import time

def avg(data,rate):
    #求列表的均值
    #第一个是列表，第二个是比率
    sum=0
    for i in data:
        sum=sum+i
    av=(sum/len(data))*rate
    return av
def avg_y(data):
    #求列表的均值
   
    sum=0
    for i in data:
        sum=sum+i
    av=sum/len(data)
    return av
def trans(pro):
    """省份，必须是字符串"""
    #原算法适宜绘制地图，我的算法适宜折线图
    #算均值的算法有问题
    #尝试使用比例作为权重
    #原作者的算法：对于正向倾向文本取其正向概率，位于(0.5,1];对于负向倾向文本亦取其正向概率，位于[0,0.5)。
    #均值是将正向倾向的正向概率相加平均，负向倾向也是正向概率相加平均。
    c=[]#正向列表
    d=[]#负向列表
    e=[]#中性列表
    a=data.loc[str(pro)]#选定索引为该日期的所有行
    #print(a)
    for row in a.itertuples(index=True, name='Pandas'):
        #print(getattr(row, "极性"), getattr(row, "正向概率"),getattr(row, "负向概率"))
        if getattr(row, "极性")==2:
            c.append(getattr(row, "正向概率"))#正向的概率值列表
        elif getattr(row, "极性")==3:
            d.append(getattr(row, "负向概率"))#负向的概率值列表
        elif getattr(row, "极性")==1:
            e.append(1)#中性列表，纯用作计数
        else:
            pass

    sum_0=len(c)+len(d)+len(e)#评论总数量
    rate_c=len(c)/sum_0#正向评论于该天占比
    rate_d=len(d)/sum_0#负向评论于该天占比
    d_c=avg(c,rate_c)
    d_d=avg(d,rate_d)
    print("正向均值："+str(d_c))
    print("负向均值："+str(d_d))
    nums=[pro,d_c,d_d]
    return nums
def save_afile(all,file):
    """将降维后的数据保存在一个excle
        传递给一个列表的列表，和一个文件名
    """
    f=xlwt.Workbook()
    sheet1=f.add_sheet(u'sheet1',cell_overwrite_ok=True)
    sheet1.write(0,0,'省份')
    sheet1.write(0,1,'正向均值')
    sheet1.write(0,2,'负向均值')
    i=1
    for data in all:#遍历每一行
            for j in range(len(data)):#取每一单元格
                sheet1.write(i,j,data[j])#写入单元格
            i=i+1#往下一行
    f.save(file+'.xls')



if __name__ == '__main__':
    data_1=pd.read_excel(r'')#文件
    data = pd.DataFrame(data_1)#将excel文件读取并转换为dataframe格式
   # data['地区'] = pd.to_datetime(data['地区'])
    data.set_index("地区", inplace=True)
    """
    provinces=['湖南','湖北','广东','广西','河南','河北','山东','山西',
                        '江苏','浙江','江西','黑龙江','新疆','云南','香港','澳门',
                        '贵州','福建','吉林','安徽','四川','西藏','宁夏','辽宁',
                        '青海','甘肃','陕西','内蒙古','台湾','北京','上海','天津',
                        '重庆','海南']
    """

    cities=['西安','铜川','宝鸡','咸阳','渭南','延安','汉中','榆林','安康','商洛']
    alls=[]
    for i in cities:
        try:
            alls.append(trans(str(i)))
        except:
            continue
    save_afile(alls,'陕西省分市评论情感值')
    print('OVER!')

这里的代码是我在处理省内的各市的均值使用的，如果是省份的话将其注释掉，利用provinces。
2.根据得到的均值文件绘制情感均值地图。代码如下：

#coding='utf-8'
from pyecharts.charts import Map,Geo
from pyecharts import options as opts
import xlrd

def extract(inpath):
    """提取数据"""
    data = xlrd.open_workbook(inpath, encoding_override='utf-8')
    table = data.sheets()[0]#选定表
    nrows = table.nrows#获取行号
    ncols = table.ncols#获取列号
    numbers=[]
    for i in range(1, nrows):#第0行为表头
        alldata = table.row_values(i)#循环输出excel表中每一行，即所有数据
        result_1 = alldata[0]#取出省份
        result_2 = alldata[1]#取出正向均值
        result_3 = alldata[2]#取出负向均值
        numbers.append([result_1,result_2,result_3])
    return numbers
datas=extract('分省份评论情感值.xls')
data=[]
for i in datas:
    data.append((i[0],i[1]))

map=(
    Map( )
    .add("",data,"china")
    .set_global_opts(
        title_opts=opts.TitleOpts(title="",subtitle="",pos_right="center",pos_top="5%"),
        visualmap_opts=opts.VisualMapOpts(
            # 是否显示视觉映射配置
            is_show = True,
            # 映射过渡类型，可选，"color", "size"  （颜色映射还是大小映射）（重要！！！）
            type_ = "color",
            # 指定 visualMapPiecewise 组件的最小值。
            min_ = 0,
            # 指定 visualMapPiecewise 组件的最大值。
            max_ = 1,
            # 两端的文本，如['High', 'Low']，（自定义） range_text: Union[list, tuple] = None,
            #range_text = ['高', '低'],
            # visualMap 组件过渡颜色 (可以自定义)(颜色从淡到深) range_color: Union[Sequence[str]] = None,
            #range_color = ['#CCEBFF','#22DDDD','#0099FF','#003D66'],
            # visualMap 组件过渡 symbol 大小.range_size: Union[Sequence[int]] = None,
            #range_size = None,
            # visualMap 图元以及其附属物（如文字标签）的透明度。range_opacity: Optional[Numeric] = None,
            #range_opacity = None,
            # 如何放置 visualMap 组件，水平（'horizontal'）或者竖直（'vertical'）。
            orient = 'vertical',
            # visualMap 组件离容器左侧的距离。
            # left 的值可以是像 20 这样的具体像素值，可以是像 '20%' 这样相对于容器高宽的百分比，
            # 也可以是 'left', 'center', 'right'。
            # 如果 left 的值为'left', 'center', 'right'，组件会根据相应的位置自动对齐。
            pos_left = '8%',
            # visualMap 组件离容器右侧的距离（同上）。
            # right 的值可以是像 20 这样的具体像素值，可以是像 '20%' 这样相对于容器高宽的百分比。
            pos_right = None,
            # visualMap 组件离容器上侧的距离（同上）。
            # top 的值可以是像 20 这样的具体像素值，可以是像 '20%' 这样相对于容器高宽的百分比，
            # 也可以是 'top', 'middle', 'bottom'。
            # 如果 top 的值为'top', 'middle', 'bottom'，组件会根据相应的位置自动对齐。
            pos_top ='60%',
            # visualMap 组件离容器下侧的距离（同上）。
            # bottom 的值可以是像 20 这样的具体像素值，可以是像 '20%' 这样相对于容器高宽的百分比。
            pos_bottom = '30%',
            # 对于连续型数据，自动平均切分成几段。默认为5段。连续数据的范围需要 max 和 min 来指定
            #split_number = 5,
            # 指定取哪个系列的数据，默认取所有系列。series_index: Union[Numeric, Sequence, None] = None,
            series_index = None,
            # 组件映射维度Optional[Numeric]
            dimension = None,
            # 是否显示拖拽用的手柄（手柄能拖拽调整选中范围）。
            #is_calculable = True,
            # 是否为分段型
            is_piecewise = True,
            # 是否反转 visualMap 组件(默认False)
            #is_inverse = True,     
            # 自定义的每一段的范围，以及每一段的文字，以及每一段的特别的样式。例如：
            pieces=[{"max": 0, "min": -1, "label": "无数据", "color":"#eeeeee"},
                {"max": 0.350, "min": 0, "label": "0~0.350","color":"#a3cf62"},
                  {"max": 0.400, "min": 0.350, "label": "0.350~0.400","color":"#fedcbd"},
                  {"max": 0.450, "min": 0.400, "label": "0.400~0.450","color":"#faa755"},
                  {"max": 0.500, "min": 0.450, "label": "0.450~0.500","color":"#f47920"},
                  {"max": 1, "min": 0.500, "label": "0.500~1.000", "color":"#d71345"},
                  ],

            #pieces = None,
            # 定义 在选中范围外 的视觉元素。（用户可以和 visualMap 组件交互，用鼠标或触摸选择范围）
            #  可选的视觉元素有：
            #  symbol: 图元的图形类别。
            #  symbolSize: 图元的大小。
            #  color: 图元的颜色。
            #  colorAlpha: 图元的颜色的透明度。
            #  opacity: 图元以及其附属物（如文字标签）的透明度。
            #  colorLightness: 颜色的明暗度，参见 HSL。
            #  colorSaturation: 颜色的饱和度，参见 HSL。
            #  colorHue: 颜色的色调，参见 HSL。
            #out_of_range = None,
            # 图形的宽度，即长条的宽度。
            #item_width = 0,
            # 图形的高度，即长条的高度。
            #item_height = 0,
            # visualMap 组件的背景色。
            #background_color = '#CCCC33',
            # visualMap 组件的边框颜色。
            #border_color = '#EE1111',
            # visualMap 边框线宽，单位px。
            #border_width = 2,
            # 文字样式配置项，参考 `series_options.TextStyleOpts`
            #textstyle_opts = None,
            ) ,       
    )
    )  

map.render('正向均值地图.html')

3.这里也把我绘制陕西省的地图的代码分享一下，大家看看有什么不同吧。

#coding='utf-8'
from pyecharts.charts import Map,Geo
from pyecharts import options as opts
import xlrd

def extract(inpath):
    """提取数据"""
    data = xlrd.open_workbook(inpath, encoding_override='utf-8')
    table = data.sheets()[0]#选定表
    nrows = table.nrows#获取行号
    ncols = table.ncols#获取列号
    numbers=[]
    for i in range(1, nrows):#第0行为表头
        alldata = table.row_values(i)#循环输出excel表中每一行，即所有数据
        result_1 = alldata[0]#取出省份
        result_2 = alldata[1]#取出正向均值
        result_3 = alldata[2]#取出负向均值
        numbers.append([result_1,result_2,result_3])
    return numbers
datas=extract('陕西省分市评论情感值.xls')
data=[]
for i in datas:
    data.append((i[0],i[1]))

map=(
    Map( )
    .add("",data,"陕西")
    .set_global_opts(
        title_opts=opts.TitleOpts(title="",subtitle="",pos_right="center",pos_top="5%"),
        visualmap_opts=opts.VisualMapOpts(
            # 是否显示视觉映射配置
            is_show = True,
            # 映射过渡类型，可选，"color", "size"  （颜色映射还是大小映射）（重要！！！）
            type_ = "color",
            # 指定 visualMapPiecewise 组件的最小值。
            min_ = 0,
            # 指定 visualMapPiecewise 组件的最大值。
            max_ = 1,
            # 两端的文本，如['High', 'Low']，（自定义） range_text: Union[list, tuple] = None,
            #range_text = ['高', '低'],
            # visualMap 组件过渡颜色 (可以自定义)(颜色从淡到深) range_color: Union[Sequence[str]] = None,
            #range_color = ['#CCEBFF','#22DDDD','#0099FF','#003D66'],
            # visualMap 组件过渡 symbol 大小.range_size: Union[Sequence[int]] = None,
            #range_size = None,
            # visualMap 图元以及其附属物（如文字标签）的透明度。range_opacity: Optional[Numeric] = None,
            #range_opacity = None,
            # 如何放置 visualMap 组件，水平（'horizontal'）或者竖直（'vertical'）。
            orient = 'vertical',
            # visualMap 组件离容器左侧的距离。
            # left 的值可以是像 20 这样的具体像素值，可以是像 '20%' 这样相对于容器高宽的百分比，
            # 也可以是 'left', 'center', 'right'。
            # 如果 left 的值为'left', 'center', 'right'，组件会根据相应的位置自动对齐。
            pos_left = '20%',
            # visualMap 组件离容器右侧的距离（同上）。
            # right 的值可以是像 20 这样的具体像素值，可以是像 '20%' 这样相对于容器高宽的百分比。
            pos_right = None,
            # visualMap 组件离容器上侧的距离（同上）。
            # top 的值可以是像 20 这样的具体像素值，可以是像 '20%' 这样相对于容器高宽的百分比，
            # 也可以是 'top', 'middle', 'bottom'。
            # 如果 top 的值为'top', 'middle', 'bottom'，组件会根据相应的位置自动对齐。
            pos_top ='60%',
            # visualMap 组件离容器下侧的距离（同上）。
            # bottom 的值可以是像 20 这样的具体像素值，可以是像 '20%' 这样相对于容器高宽的百分比。
            pos_bottom = '30%',
            # 对于连续型数据，自动平均切分成几段。默认为5段。连续数据的范围需要 max 和 min 来指定
            #split_number = 5,
            # 指定取哪个系列的数据，默认取所有系列。series_index: Union[Numeric, Sequence, None] = None,
            series_index = None,
            # 组件映射维度Optional[Numeric]
            dimension = None,
            # 是否显示拖拽用的手柄（手柄能拖拽调整选中范围）。
            #is_calculable = True,
            # 是否为分段型
            is_piecewise = True,
            # 是否反转 visualMap 组件(默认False)
            #is_inverse = True,     
            # 自定义的每一段的范围，以及每一段的文字，以及每一段的特别的样式。例如：
            pieces=[
                  {"max": 0.300, "min": 0, "label": "0~0.300","color":"#a3cf62"},
                  {"max": 0.400, "min": 0.300, "label": "0.300~0.400","color":"#fedcbd"},
                  {"max": 0.500, "min": 0.400, "label": "0.400~0.500","color":"#faa755"},
                  {"max": 0.600, "min": 0.500, "label": "0.500~0.600","color":"#f47920"},
                  {"max": 1, "min": 0.600, "label": "0.600~1.000", "color":"#d71345"},
                  ],

            #pieces = None,
            # 定义 在选中范围外 的视觉元素。（用户可以和 visualMap 组件交互，用鼠标或触摸选择范围）
            #  可选的视觉元素有：
            #  symbol: 图元的图形类别。
            #  symbolSize: 图元的大小。
            #  color: 图元的颜色。
            #  colorAlpha: 图元的颜色的透明度。
            #  opacity: 图元以及其附属物（如文字标签）的透明度。
            #  colorLightness: 颜色的明暗度，参见 HSL。
            #  colorSaturation: 颜色的饱和度，参见 HSL。
            #  colorHue: 颜色的色调，参见 HSL。
            #out_of_range = None,
            # 图形的宽度，即长条的宽度。
            #item_width = 0,
            # 图形的高度，即长条的高度。
            #item_height = 0,
            # visualMap 组件的背景色。
            #background_color = '#CCCC33',
            # visualMap 组件的边框颜色。
            #border_color = '#EE1111',
            # visualMap 边框线宽，单位px。
            #border_width = 2,
            # 文字样式配置项，参考 `series_options.TextStyleOpts`
            #textstyle_opts = None,
            ) ,       
    )
    )  

map.render('陕西省正向均值地图.html')

六、完结

以上大多是关于我国的，如果是单个省市的话，只需要将其提取出来再处理一遍就行了，大家这么聪明就不赘述了。
总体来说，完成这一个工作花费了近20天的时间，主要是在评论爬取、数据清洗和日期合并上花费了不少精力，以后还得多多努力。
欢迎大家交流！（泠鸢镇楼）

你可能感兴趣的:(情感分析,python,visual,studio,code,数据分析)

一个 windows 自动语音识别案列小Tomkk Python AI windows 语音识别人工智能 python
一个windows自动语音识别案列之前给写过一段很有意思的代码，今天分享给大家！文章目录一个windows自动语音识别案列前言一、需要安装一些python库二、代码如下三，测试总结下前言一、需要安装一些python库speech_recognition：这是一个用于语音识别的库。它可以帮助将语音转换为文本。安装命令：pipinstallSpeechRecognitionpyttsx3：这是一个文本
Python的工作日判断库(含调休)——chinese_calendar 今晚务必早点睡 Python python 开发语言
chinese_calendar库使用场景chinese_calendar库主要用于处理中国农历和节假日相关的日期计算和判断。以下是一些常见的使用场景：判断日期是否为工作日：chinese_calendar提供了is_workday()函数，可以判断指定日期是否为工作日，包括周末、法定节假日等。判断日期是否为节假日：chinese_calendar提供了is_holiday()函数，可以判断指定日
如何用python读取流量包谛听汪网络
要用Python读取流量包，你可以使用网络编程库，例如scapy或pyshark。使用scapy，你需要安装它并导入scapy库。然后，你可以使用sniff()函数捕获流量包。例如：fromscapy.allimport*defpacket_callback(packet):print(packet.show())#使用默认的网卡捕获流量包sniff(prn=packet_callback)#使用
python抓包库大流量数据对比_justniffer抓取流量大法 weixin_39849254
Understandyourselfinordertobetterunderstandingothers知己方能解人本篇简单介绍一款流量抓取神器—justniffer，其能在线抓取流量也能离线分析数据包。justniffer与网络抓包神器wireshark相比，用法更为简单且对网络影响较小。面对海量的流量，我们需要经常从中分析出恶意请求，从而去做好防御，因此我在此记录justniffer的一些基础
python scapy模块_python使用scapy模块实现ping扫描漆园吏 python scapy模块
关于scapyScapy是一个可以让用户发送、侦听和解析并伪装网络报文的Python程序。这些功能可以用于制作侦测、扫描和攻击网络的工具。换言之，Scapy是一个强大的操纵报文的交互程序。它可以伪造或者解析多种协议的报文，还具有发送、捕获、匹配请求和响应这些报文以及更多的功能。Scapy可以轻松地做到像扫描(scanning)、路由跟踪(tracerouting)、探测(probing)、单元测试
浅谈Python项目开发&管理老胡的储物柜 java python 编程语言大数据 linux
本文主要探讨的是个人在Python项目开发&管理这块的一些经验之谈，经过在团队实践后主要内容总结如下：基础环境管理编码标准&规范化远程开发项目脚手架????环境管理使用Anaconda和Pipenv共同管理Python项目环境环境管理这块是个很普遍的问题，其面临的问题如下：如何对不同项目，任意Python版本的环境进行管控如何对不同项目，内外网Python依赖库进行管控（有些包是公司内部开发，那么
CAD处理组件CADViewX发布V15.2新版本，大幅改进导入和导出功能 CodeCraft Studio 3d
CADViewX是一款能让应用程序具有强大CAD图像浏览和打印功能的图像处理工具，无需任何CAD软件或查看器即可打开、浏览、打印AutoCAD等几十种格式的图像文件，还能享受直观的鼠标滚轮缩放、拖拽、平铺印画功能。CADViewX组件可用于在任何支持ActiveX技术的开发环境中（VisualC++，C＃，Delphi，HTML/JavaScript等）使用矢量和光栅图像。CADViewXV15.
CMake-3.28.3安装包奚佳尧Willard
CMake-3.28.3安装包【下载地址】CMake-3.28.3安装包CMake-3.28.3安装包欢迎来到CMake-3.28.3安装包的下载页面项目地址:https://gitcode.com/open-source-toolkit/68b64欢迎来到CMake-3.28.3安装包的下载页面。CMake是一个跨平台的自动化构建系统，设计用于管理软件的编译过程。它能够生成适合各种开发环境的本地
FastExcel使用教程束恺俭Jessie
FastExcel使用教程FastExcelFastExcelReadingandWritingin.Net项目地址:https://gitcode.com/gh_mirrors/fa/FastExcel项目介绍FastExcel是一款专为.Net开发环境设计的高性能Excel读写库，它提供了一种快速且内存占用小的方式来处理.xlsx文件。不同于依赖OpenXMLSDK的方式，FastExcel直
FastExcel 使用指南嵇殉嵘Eliza
FastExcel使用指南FastExcelFastExcelReadingandWritingin.Net项目地址:https://gitcode.com/gh_mirrors/fa/FastExcelFastExcel是一个用于.NET平台的库，它提供了快速读取和写入Excel文件的能力，特别适用于处理大量数据时保持较低的内存占用。本指南将帮助您了解项目的基本结构、启动与配置细节。1.项目目录
python操作mysql 码农~明哥 python python android
前言在Python3中，我们可以使用mysqlclient或者pymysql三方库来接入MySQL数据库并实现数据持久化操作。二者的用法完全相同，只是导入的模块名不一样。我们推荐大家使用纯Python的三方库pymysql，因为它更容易安装成功。下面我们仍然以之前创建的名为hrs的数据库为例，为大家演示如何通过Python程序操作MySQL数据库实现数据持久化操作。接入MySQL首先，我们可以在命
【实用技能】如何借助Excel处理控件Aspose.Cells，使用 C# 锁定 Excel 中的单元格 CodeCraft Studio 文档管理控件 excel c#开发语言
锁定Excel中的单元格对于数据完整性至关重要。它可以防止用户更改重要信息。此功能广泛用于财务、项目管理和数据分析。通过锁定单元格，您可以确保关键数据保持不变。这可以增强协作并减少错误。在这篇博文中，我们将探讨如何使用C#锁定Excel中的单元格。C#Excel库用于锁定或解锁单元格Aspose.Cellsfor.NET是一个功能强大的Excel文件处理库。它简化了Excel中锁定单元格等任务。使
使用Scikit-learn实现支持向量机分类器清水白石008 python Python题库 scikit-learn 支持向量机 python
使用Scikit-learn实现支持向量机分类器引言支持向量机（SupportVectorMachine,SVM）是一种强大的监督学习算法，广泛应用于分类和回归任务。SVM的核心思想是通过寻找一个最佳的超平面来分隔不同类别的数据点。本文将详细介绍如何使用Python的Scikit-learn库实现一个支持向量机分类器，包括数据准备、模型训练、评估和可视化等步骤。1.支持向量机的基本原理支持向量机的
基于Python实现微信表情轰炸机实现与界面设计程序熊. python 微信开发语言
实现效果：介绍：本教程将向您展示如何使用Python和Tkinter库创建一个微信表情轰炸机。该程序将允许用户选择表情包并设置轰炸次数和间隔时间，然后自动在微信对话框中发送表情。本教程还包含了一个用户界面，使用户可以方便地选择和配置轰炸参数。环境配置：Python3.xTkinter库pynput库（用于键盘和鼠标控制）项目分布：主窗口：包含输入框、列表框、按钮等控件，用于用户输入轰炸参数和选择表
Python 上位机开发 c实例 python
Python上位机开发第一节：入门介绍在这第一节中，我们将对Python上位机开发进行一个初步的了解和探索。首先，什么是上位机？上位机通常是指可以与下位机（如单片机、传感器等硬件设备）进行通信和交互，实现数据采集、控制指令发送以及数据处理和展示的计算机程序。Python作为一种高级编程语言，在开发上位机方面具有诸多优势。它拥有丰富的第三方库，使得开发过程变得相对简单和高效。例如，PySerial库
设计模式-策略模式 whale fall 设计模式设计模式策略模式
策略模式（StrategyPattern）是一种行为设计模式，它定义了一系列算法（策略），并将每个算法封装起来，使得它们可以互相替换。策略模式让算法的变化独立于使用算法的客户端。即将不同的算法封装成独立的策略类，然后在运行时根据需求选择具体的策略进行操作。下面是一个使用Python实现策略模式的示例。1.定义策略接口首先，定义一个策略接口（在Python中通常是一个抽象基类），该接口描述所有策略类
python list列表删除指定元素的四种方法 whale fall python进阶 python
在Python中，要删除列表中的某个元素，可以使用几种不同的方法，具体取决于你希望如何删除该元素。以下是一些常见的方法：1.使用remove()方法remove()方法会删除列表中第一次出现的指定元素。如果该元素不存在，会引发ValueError错误。my_list=[1,2,3,4,5]#删除值为3的元素my_list.remove(3)print(my_list)输出：[1,2,4,5]2.使
python 根据元素值获取span 大紫菜 python java android javascript 数据库
我整理的一些关于【网页内容,HTML,python】的项目学习资料（附讲解～～）和大家一起分享、学习一下：https://d.51cto.com/eDOcp1用Python根据元素值获取在实际的网页开发与数据抓取中，我们经常需要根据元素的值来获取对应的HTML标签，比如。本文将教你如何用Python实现这一功能。本文将详细阐述整个处理的流程，并展示具体的代码示例。流程概览下面是根据元素值获取的主要
python span 抓取_python – Beautifulsoup获取span内容 weixin_39755952 python span 抓取
我已经解析了html页面：使用beautifulsoupuser_page=urllib2.urlopen(user_url)souping_page=bs(user_page)badges=souping_page.body.find('div',attrs={'class':'badges'})在此之后我的徽章对象看起来像这样：93856现在我想从中提取示例9金徽章,38个银徽章,我试图使用b
socket服务器断开消息,详解JS WebSocket断开原因和心跳机制反海 socket服务器断开消息
1、断开原因WebSocket断开的原因有很多，最好在WebSocket断开时，将错误打印出来。ws.onclose=function(e){console.log('websocket断开:'+e.code+''+e.reason+''+e.wasClean)console.log(e)}错误状态码：WebSocket断开时，会触发CloseEvent,CloseEvent会在连接关闭时发送给使
微信信息轰炸【简易版】老师好，我是刘同学力扣 python
本版本的微信信息轰炸仅能在电脑端使用：简单讲解下其中的原理:在程序中输入我们想要信息轰炸的信息，然后模拟键盘输入。其实我们就是使用了python的库pynput,模拟输入文字和信息，不多说，上代码frompynput.keyboardimportKey,Controlleraskey_clfrompynput.mouseimportController,Buttonimporttimedefkey
基于Python的一个串口程序上位机 DEMO qq_26991191 python 开发语言 pyqt 单片机
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、程序基本功能二、全部代码,代码直接复制可用1.全部代码总结前言`一个简单的串口程序-上位机,基于Python,pyqt5代码实现.需要安装sys,pyqt5.`一、程序基本功能这个程序可以自动搜索电脑上已经连接的端口,自由设置端口,码率,开关串口.接收数据,发送数据.二、全部代码,代码直接复制可用1.全部代码代码如下（
探索Labelbox：打造自定义标注应用的利器！孔旭澜Renata
探索Labelbox：打造自定义标注应用的利器！去发现同类优质开源项目:https://gitcode.com/项目介绍Labelbox是一款专为企业级客户设计的高级数据标注工具。它允许用户构建自己的定制标注界面（编辑器），提供强大的API和SDK，以适应各种复杂的数据标注需求。无论你是人工智能研究者、数据科学家还是软件开发者，Labelbox都能帮助你高效、精准地处理你的数据。技术分析Label
python定位span里面的文字 egzosn python 前端 javascript 开发语言 ecmascript
在网页开发和数据抓取过程中，我们经常需要从HTML页面中提取信息，尤其是span元素中的文本。span标签是一个行内元素，通常用于包装一小段文本或其他元素。在Python中，我们可以通过使用BeautifulSoup或lxml等库来解析HTML并提取span标签中的文本。本文将介绍如何使用Python定位并提取span元素中的文字，并展示一些常见的用法和示例。一、安装相关依赖在开始之前，我们需要安
sorted() 函数：排序的利器 01_6 深度学习计算机视觉opencv 数据结构 opencv 计算机视觉人工智能图像 python
目录一、sorted()函数简介二、函数使用示例示例1：对列表进行排序示例2：对字符串进行排序示例3：指定排序键三、参数详细介绍1、key参数2、reverse参数四、高级用法1、自定义排序键函数2、多级排序五、总结一、sorted()函数简介sorted()函数是Python中的内置函数，用于对可迭代对象进行排序。它的基本语法如下：sorted(iterable,key=None,reverse
Python定位Span标签中的文字：实战指南傻啦嘿哟 python 开发语言
目录一、准备工作二、基本流程三、代码示例四、案例分析五、进阶技巧处理多个标签：根据其他属性定位：结合XPath：使用Selenium：六、注意事项七、总结在网页数据抓取和信息提取的过程中，经常需要定位并获取HTML中特定标签的内容。其中，标签是一个常见的内联元素，用于对文本进行分组或应用样式。本文将详细介绍如何使用Python来定位并提取标签中的文字，通过具体的代码示例和案例，帮助读者快速掌握这一
chatgpt赋能python：如何配置Python中的NumPy？ yakuchrisfor ChatGpt chatgpt python numpy 计算机
如何配置Python中的NumPy？如果您是一名Python程序员，那么您可能已经听说过NumPy。NumPy是一个强大的Python库，可用于处理大型多维数组和矩阵，以及用于数值计算和科学计算。因此，NumPy是数据科学中的黄金库，而它的安装是Python编程环境必不可少的一部分。什么是NumPy？NumPy是Python语言的一个扩展程序库，它支持大量的高级数学函数，以及可以高效地操作大型数组
把Python的pip源修改为国内亦安✘ python 开发语言
我们在用pip下载时访问的是国外pip源超级慢，因此可将源改为国内的镜像，就能飞速的下载,可临时修改，也可永久修改国内pip源：豆瓣http://pypi.douban.com/华中理工大学http://pypi.hustunique.com/山东理工大学http://pypi.sdutlinux.org/中国科学技术大学http://pypi.mirrors.ustc.edu.cn/阿里云htt
Python中如何获取HTTP请求的Response Body 傻啦嘿哟关于python那些事儿 python http 开发语言
目录一、引言二、使用urllib库获取ResponseBody1.基本用法2.发送POST请求三、使用requests库获取ResponseBody1.安装requests库2.基本用法3.发送POST请求4.处理JSON响应四、高级用法1.处理请求头2.设置超时3.处理Cookies五、案例：爬取网页内容六、总结在Python中进行网络编程和Web开发时，经常需要发送HTTP请求并处理服务器返回
Python pip更换国内源王阿菜 python
1.Pycharm内更换File-->Settings-->Project:*****-->PythonInterpreter点击加号-->MangeRepositories选择PIP的地址，修改成国内源-->保存2.Windows上修改在本机的user目录下新建一个pip目录，新建文件pip.ini，代码如下：[global]index-url=https://pypi.tuna.tsinghu
Java 并发包之线程池和原子计数 lijingyao8206 Java计数 ThreadPool 并发包 java线程池
对于大数据量关联的业务处理逻辑，比较直接的想法就是用JDK提供的并发包去解决多线程情况下的业务数据处理。线程池可以提供很好的管理线程的方式，并且可以提高线程利用率，并发包中的原子计数在多线程的情况下可以让我们避免去写一些同步代码。这里就先把jdk并发包中的线程池处理器ThreadPoolExecutor 以原子计数类AomicInteger 和倒数计时锁C
java编程思想抽象类和接口百合不是茶 java 抽象类接口
接口c++对接口和内部类只有简介的支持,但在java中有队这些类的直接支持 1 ,抽象类 : 如果一个类包含一个或多个抽象方法,该类必须限定为抽象类(否者编译器报错) 抽象方法 : 在方法中仅有声明而没有方法体 package com.wj.Interface;
[房地产与大数据]房地产数据挖掘系统 comsci 数据挖掘
随着一个关键核心技术的突破,我们已经是独立自主的开发某些先进模块,但是要完全实现,还需要一定的时间... 所以,除了代码工作以外,我们还需要关心一下非技术领域的事件..比如说房地产 &nb
数组队列总结沐刃青蛟数组队列
数组队列是一种大小可以改变，类型没有定死的类似数组的工具。不过与数组相比，它更具有灵活性。因为它不但不用担心越界问题，而且因为泛型（类似c++中模板的东西）的存在而支持各种类型。以下是数组队列的功能实现代码： import List.Student; public class
Oracle存储过程无法编译的解决方法 IT独行者 oracle 存储过程　
今天同事修改Oracle存储过程又导致2个过程无法被编译，流程规范上的东西，Dave 这里不多说，看看怎么解决问题。 1. 查看无效对象 XEZF@xezf(qs-xezf-db1)> select object_name,object_type,status from all_objects where status='IN
重装系统之后oracle恢复文强chu oracle
前几天正在使用电脑，没有暂停oracle的各种服务。突然win8.1系统奔溃，无法修复，开机时系统提示正在搜集错误信息，然后再开机，再提示的无限循环中。无耐我拿出系统u盘准备重装系统，没想到竟然无法从u盘引导成功。晚上到外面早了一家修电脑店，让人家给装了个系统，并且那哥们在我没反应过来的时候，直接把我的c盘给格式化了并且清理了注册表，再装系统。然后的结果就是我的oracl
python学习二（一些基础语法）小桔子 pthon 基础语法
紧接着把！昨天没看继续看django 官方教程，学了下python的基本语法与c类语言还是有些小差别： 1.ptyhon的源文件以UTF-8编码格式 2. / 除结果浮点型 // 除结果整形 % 除取余数 * 乘 ** 乘方 eg 5**2 结果是5的2次方25 _&
svn 常用命令 aichenglong SVN 版本回退
1 svn回退版本 1)在window中选择log,根据想要回退的内容,选择revert this version或revert chanages from this version 两者的区别: revert this version:表示回退到当前版本(该版本后的版本全部作废) revert chanages from this versio
某小公司面试归来 alafqq 面试
先填单子，还要写笔试题，我以时间为急，拒绝了它。。时间宝贵。老拿这些对付毕业生的东东来吓唬我。。面试官很刁难，问了几个问题，记录下； 1，包的范围。。。public,private,protect. --悲剧了 2，hashcode方法和equals方法的区别。谁覆盖谁.结果，他说我说反了。 3，最恶心的一道题，抽象类继承抽象类吗？（察，一般它都是被继承的啊） 4，stru
动态数组的存储速度比较集合框架百合不是茶集合框架
集合框架：自定义数据结构(增删改查等) package 数组; /** * 创建动态数组 * @author 百合 * */ public class ArrayDemo{ //定义一个数组来存放数据 String[] src = new String[0]; /** * 增加元素加入容器 * @param s要加入容器
用JS实现一个JS对象，对象里有两个属性一个方法 bijian1013 js对象
<html> <head> </head> <body> 用js代码实现一个js对象，对象里有两个属性，一个方法 </body> <script> var obj={a:'1234567',b:'bbbbbbbbbb',c:function(x){
探索JUnit4扩展：使用Rule bijian1013 java 单元测试 JUnit Rule
在上一篇文章中，讨论了使用Runner扩展JUnit4的方式，即直接修改Test Runner的实现(BlockJUnit4ClassRunner)。但这种方法显然不便于灵活地添加或删除扩展功能。下面将使用JUnit4.7才开始引入的扩展方式——Rule来实现相同的扩展功能。 1. Rule &n
[Gson一]非泛型POJO对象的反序列化 bit1129 POJO
当要将JSON数据串反序列化自身为非泛型的POJO时，使用Gson.fromJson(String, Class)方法。自身为非泛型的POJO的包括两种： 1. POJO对象不包含任何泛型的字段 2. POJO对象包含泛型字段，例如泛型集合或者泛型类 Data类 a.不是泛型类， b.Data中的集合List和Map都是泛型的 c.Data中不包含其它的POJO
【Kakfa五】Kafka Producer和Consumer基本使用 bit1129 kafka
0.Kafka服务器的配置一个Broker，一个Topic Topic中只有一个Partition（） 1. Producer： package kafka.examples.producers; import kafka.producer.KeyedMessage; import kafka.javaapi.producer.Producer; impor
lsyncd实时同步搭建指南——取代rsync+inotify ronin47
1. 几大实时同步工具比较 1.1 inotify + rsync 最近一直在寻求生产服务服务器上的同步替代方案，原先使用的是 inotify + rsync，但随着文件数量的增大到100W+，目录下的文件列表就达20M，在网络状况不佳或者限速的情况下，变更的文件可能10来个才几M，却因此要发送的文件列表就达20M，严重减低的带宽的使用效率以及同步效率；更为要紧的是，加入inotify
java-9. 判断整数序列是不是二元查找树的后序遍历结果 bylijinnan java
public class IsBinTreePostTraverse{ static boolean isBSTPostOrder(int[] a){ if(a==null){ return false; } /*1.只有一个结点时，肯定是查找树 *2.只有两个结点时，肯定是查找树。例如{5,6}对应的BST是 6 {6,5}对应的BST是
MySQL的sum函数返回的类型 bylijinnan java spring sql mysql jdbc
今天项目切换数据库时，出错访问数据库的代码大概是这样： String sql = "select sum(number) as sumNumberOfOneDay from tableName"; List<Map> rows = getJdbcTemplate().queryForList(sql); for (Map row : rows
java设计模式之单例模式 chicony java设计模式
在阎宏博士的《JAVA与模式》一书中开头是这样描述单例模式的：　　作为对象的创建模式，单例模式确保某一个类只有一个实例，而且自行实例化并向整个系统提供这个实例。这个类称为单例类。单例模式的结构　　单例模式的特点：单例类只能有一个实例。单例类必须自己创建自己的唯一实例。单例类必须给所有其他对象提供这一实例。　　饿汉式单例类 publ
javascript取当月最后一天 ctrain JavaScript
 <script language=javascript> var current = new Date(); var year = current.getYear(); var month = current.getMonth(); showMonthLastDay(year, mont
linux tune2fs命令详解 daizj linux tune2fs 查看系统文件块信息
一.简介： tune2fs是调整和查看ext2/ext3文件系统的文件系统参数，Windows下面如果出现意外断电死机情况，下次开机一般都会出现系统自检。Linux系统下面也有文件系统自检，而且是可以通过tune2fs命令，自行定义自检周期及方式。二.用法： Usage: tune2fs [-c max_mounts_count] [-e errors_behavior] [-g grou
做有中国特色的程序员 dcj3sjt126com 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有
Android：TextView属性大全 dcj3sjt126com textview
android:autoLink 设置是否当文本为URL链接/email/电话号码/map时，文本显示为可点击的链接。可选值(none/web/email/phone/map/all) android:autoText 如果设置，将自动执行输入值的拼写纠正。此处无效果，在显示输入法并输
tomcat虚拟目录安装及其配置 eksliang tomcat配置说明 tomca部署web应用 tomcat虚拟目录安装
转载请出自出处：http://eksliang.iteye.com/blog/2097184 1.-------------------------------------------tomcat 目录结构 config：存放tomcat的配置文件 temp ：存放tomcat跑起来后存放临时文件用的 work ：当第一次访问应用中的jsp
浅谈：APP有哪些常被黑客利用的安全漏洞 gg163 APP
首先，说到APP的安全漏洞，身为程序猿的大家应该不陌生；如果抛开安卓自身开源的问题的话，其主要产生的原因就是开发过程中疏忽或者代码不严谨引起的。但这些责任也不能怪在程序猿头上，有时会因为BOSS时间催得紧等很多可观原因。由国内移动应用安全检测团队爱内测（ineice.com）的CTO给我们浅谈关于Android 系统的开源设计以及生态环境。 1. 应用反编译漏洞：APK 包非常容易被反编译成可读
C#根据网址生成静态页面 hvt Web .net C#asp.net hovertree
HoverTree开源项目中HoverTreeWeb.HVTPanel的Index.aspx文件是后台管理的首页。包含生成留言板首页，以及显示用户名，退出等功能。根据网址生成页面的方法： bool CreateHtmlFile(string url, string path) { //http://keleyi.com/a/bjae/3d10wfax.htm stri
SVG 教程（一）天梯梦 svg
SVG 简介 SVG 是使用 XML 来描述二维图形和绘图程序的语言。学习之前应具备的基础知识：继续学习之前，你应该对以下内容有基本的了解： HTML XML 基础如果希望首先学习这些内容，请在本站的首页选择相应的教程。什么是SVG？ SVG 指可伸缩矢量图形 (Scalable Vector Graphics) SVG 用来定义用于网络的基于矢量
一个简单的java栈 luyulong java 数据结构栈
public class MyStack { private long[] arr; private int top; public MyStack() { arr = new long[10]; top = -1; } public MyStack(int maxsize) { arr = new long[maxsize]; top
基础数据结构和算法八：Binary search sunwinner Algorithm Binary search
Binary search needs an ordered array so that it can use array indexing to dramatically reduce the number of compares required for each search, using the classic and venerable binary search algori
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！刘星宇 c 面试
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！ 1.gets()函数问：请找出下面代码里的问题： #include<stdio.h> int main(void) { char buff[10]; memset(buff,0,sizeof(buff));
ITeye 7月技术图书有奖试读获奖名单公布 ITeye管理员活动 ITeye 试读
ITeye携手人民邮电出版社图灵教育共同举办的7月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 7月试读活动回顾： http://webmaster.iteye.com/blog/2092746 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《Java性能优化权威指南》