HeartBeating_RUC

统计词频-生成词云-数据分析报告（python R语言）

数据分析

统计洛杉矶旅游地区的词频：景点词和酒店词

数据源：携程网站的文本

数据分析：

统计词频（python语言）

用词云展示结果（R语言）

先看结果：

旅游景点的词频

旅游酒店的词频

统计酒店名和景点名出现次数

建立一个字典（数据类型），key为酒店/景点的名字，value为出现次数。用sort函数进行排序，保存文件为csv格式，以及json格式。整理成文档报告形式。

1. 数据抓取（数据源）

1.1爬取携程网站游记

该网站一共有238张页面，每个页面9个游记标题简介，每个标题简介，对应一个游记文本。编写代码爬取每个文本数据，并分别保存为一个文本文档。

1.2编写代码的总体思路

在此页面，有分页机制，共有238张页面，用一个for循环控制页面，一个for循环控制每个页面的简介列表。列表中有9个简介，每个简介下面都会有一个url，该url对应该简介的网页，此网页中的文本就是爬取的内容。爬取文本后，保存为一个文档。

代码：

import pandas.io.json

import requests

from bs4 import BeautifulSoup

z = 1

def save_to_file(file_name, contents):

fh = open(file_name, 'w')

fh.write(contents)

fh.close()

def getNewsDetail(url):

global z

z += 1

#result={}

res = requests.get(url)

res.encoding = 'utf-8'

soup = BeautifulSoup(res.text, 'html.parser')

#result['article'] = ''.join([p.text.strip() for p in soup.select('.ctd_content')[:-1]])

#a ='hhhh'

a = ''.join([p.text.strip() for p in soup.select('.ctd_content')])

name = 'xc{}.txt'

tx = name.format(z)

save_to_file(tx, a)

#n += 1

#df=pandas.DataFrame(a)

print(z)

#print(type(a))

#lis.append(a)

#f = open('i.txt', 'wb')

#f.write(''.join([p.text.strip() for p in soup.select('.ctd_content')[:-1]]))

#f.close()

#l.append()

#return result

def parseListLinks(urls):

#results=[]

res = requests.get(urls)

res.encoding = 'utf-8'

soup = BeautifulSoup(res.text, 'html.parser')

for n in soup.select('a[class="journal-item cf"]'):

#results.append(getNewsDetail('http://you.ctrip.com' + n['href']))

getNewsDetail('http://you.ctrip.com' + n['href'])

#return results

seedurl = 'http://you.ctrip.com/travels/losangeles250/t3-p{}.html'

#li = []

for i in range(1, 238):

url = seedurl.format(i)

parseListLinks(url)

#df=pandas.DataFrame(lis)

#df

#xc=parseListLinks(url)

#li.extend(xc)

#print(li)

结果生成2142个文档。

2数据预处理

处理工具jieba分词，用jieba分词处理分别处理2142个文本文档，因为酒店名称和景点名称都是由名词，或者多个名词组成的，直接用jiaba系统自带字典，选出每个文本中所有名词，处理后所有文档，保存为一个文档。

代码：

import jieba.analyse

import jieba.posseg

from sklearn import feature_extraction

from sklearn.feature_extraction.text import TfidfTransformer

from sklearn.feature_extraction.text import CountVectorizer

#词性标注，读取文件

def cut_news(n):

global sum

global sums

na= 'xc{}.txt'

op = na.format(n)

with open(op, 'r')as f:

for line in f:

seg = jieba.posseg.cut(line.strip()) #jieba分词

#print("/".join(seg))

for i in seg:

if i.flag =='nt' or i.flag =='ns'or i.flag =='nst' or i.flag =='n':#l.append(i.word,i.flag)

#print(i.word,i.flag)

# segs = "/".join(seg)

sum += i.word

sums= sum +'\n'

#sums=sum+'\n'

#print(sum)

return sums

# jieba分词器，通过词频获取关键词

def jieba_keywords(news: object) -> object:

keywords = jieba.analyse.extract_tags(news, topK=100)

print(keywords)

def save_to_file(file_name, contents):

fh = open(file_name, 'w')

fh.write(contents)

fh.close()

if __name__ == '__main__':

#new = read_news()

#jieba_keywords(new)

print('\n')

#jieba_keywords(s)

z=0

for z in range(1,11):

cut_news(z)

name = 'tiqu{}.txt'

tx = name.format(z)

save_to_file(tx, sums)

#tfidf_keywords(tx)

#tfidf_keywords('news.txt')

生成结果的部分文档内容：

图文纽约携程朋友事婚礼地点洛杉矶南加州人纽约行程纽约洛杉矶天洛杉矶小伙伴洛杉矶热门景点故地重游感觉洛杉矶行程规划圣地亚哥洛杉矶圣地亚哥心心念念薯片岩石婚礼风情记忆行程洛杉矶圣地亚哥婚礼玻璃教堂婚礼玻璃教堂晚宴游轮符号含义图片景点餐馆酒店目录项游记实用信息时候废话预告片预告片机票花费行程酒店时间顺序预告片预告片星光大道化身脑残粉比山庄目的洛杉矶夜景好莱坞薯片岩石胆山顶大地日落悬崖日落情人中途岛航空母舰博物馆战争美丽圣地亚哥战争人间情感玻璃教堂美丽海岸线人美国民宿西班牙风情小屋海滩南加海风印象两极化洛杉矶美国美国顶级豪宅富人区街流浪汉洛杉矶代表美国美国化城市气候宜人洛杉矶典型加州气候纽约洛杉矶人们短裤问题温度衣物随身带外套空调温度温差洛杉矶航班航空公司洛杉矶航线飞洛杉矶飞小时北京洛杉矶广州洛杉矶上海洛杉矶航空公司机上餐食中国胃机组人员机票个人经验美国机票时间工作日概率下单机票价格价格下单机票小时私家经验美国网站机票小时内全款政策下单条款小时政策人性化美国航空机票美国机票费用航空航空美国本土航空公司国人航空公司飞机硬件设施行李额美国航空公司行李额度典型西南航空箱子箱子航空购票私家经验航空行李额度购票价格价格基本额度价格箱子额度例子航空航班价格额度箱子价格箱子额度箱子价格美航空美航空全球性航空公司客流量个人经验航空情况机龄公司机票航空公司票价航空公司官网程机票航空公司票价额度返程机票航空公司票价额度票价价格美国东西严格控制行李空间机箱书包机场纽约机场机场机场时间登机口距离机场误机机场免税店时间美国航班建议小时机场小时机场大门建议时间机场大门手机航班美国机场航班上二维码纸质手机电量登机口节约时间机场前提办理行李柜台办理纸质航空公司柜台信息办理机票人工柜台排队行李建议人工柜台排队浪费时间机场纽约机场机场线航站楼长岛铁路纽约地铁标记箭头机场线洛杉矶机场洛杉矶机场洛杉矶国际机场洛杉矶国际机场机场美国航班机场私人飞机市区轨道交通机场巴士轨道交通绿线市区市区巴士公交巴士星光大道好莱坞区域机场租车公司小时营业时间租车公司基本

3 建立jieba分词的用户字典，包括景点、酒店

3.1分别爬取携程网站的和景点名，建立jieba分词的用户字典

Jieba分词系统的自带字典是汉语字典来对文本进行分词，标注。所以，要提取酒店，景点等专有名词，首先建立用户字典。用户字典的格式，每一行为：专有名词空格数字空格用字母表示的标签，例如：好莱坞20 jd。文件格式为文本文档。为了获得酒店和景点的数据，爬取携程网站的景点和酒店。

3.1先爬取景点文本，自作景点字典

该网页共有25页，每页含有一个列表，每个列表含有15个景点，一个for循环控制25页，一个for循环控制列表，对于每个简介，提取出景点名称，把所有景点名称+空格+20+jd+换行符，保存到一个文档中。

代码：

import pandas.io.json

import requests

from bs4 import BeautifulSoup

z = 1

sum = ''

def save_to_file(file_name, contents):

fh = open(file_name, 'w')

fh.write(contents)

fh.close()

def getNewsDetail(url):

global sum

#z += 1

#result={}

res = requests.get(url)

res.encoding = 'utf-8'

soup = BeautifulSoup(res.text, 'html.parser')

#result['article'] = ''.join([p.text.strip() for p in soup.select('.ctd_content')[:-1]])

#a ='hhhh'

#a = ''.join([p.text.strip() for p in soup.select('.ctd_content')])

a = soup.select('h1')[0].text

sum += a +' '+'20'+' '+'jd'+'\n'

#name = 'tiqu0.txt'

#tx = name.format(z)

#save_to_file("dict.txt", a)

#n += 1

#df=pandas.DataFrame(a)

#print(a)

#print(type(a))

#lis.append(a)

#f = open('i.txt', 'wb')

#f.write(''.join([p.text.strip() for p in soup.select('.ctd_content')[:-1]]))

#f.close()

#l.append()

#return result

def parseListLinks(urls):

global sum

z=0

res = requests.get(urls)

res.encoding = 'utf-8'

soup = BeautifulSoup(res.text, 'html.parser')

for n in soup.select('.cn_tit'):

#print(n.text)

s1 = n.text

#print(soup.select('.en_tit')[0].text)

#第二个soupselect，不受for循环第一个select控制，引入变量z

s2 =soup.select('.en_tit')[z].text

#print(soup.select('.en_tit')[0].text)

#print(n.text.rstrip(soup.select('.en_tit')[0].text))

print(s1.rstrip(s2))

z += 1

a=s2

#a = s1.rstrip(s2)

if a != '':

sum += a +' '+'20'+' '+'jd'+'\n'

print(sum)

#children=n.children

#print(n.children[0])

#print(n.text-n.children)

#print(n['href'])

#getNewsDetail(n['href'])

#sum += n.text+'\n'

#name = 'xczi{}.txt'

#tx = name.format(z)

#print(sum)

save_to_file("dict2.txt", sum)

#results.append(getNewsDetail('http://you.ctrip.com' + n['href']))

#getNewsDetail('http://you.ctrip.com' + n['href'])

#return results

seedurl = 'http://travel.qunar.com/p-cs310189-luoshanji-jiudian-1-{}'

#li = []

for i in range(1, 49):

url = seedurl.format(i)

parseListLinks(url)

#df=pandas.DataFrame(lis)

#df

#xc=parseListLinks(url)

#li.extend(xc)

#print(li)

3.2 爬取酒店名称数据

同样过程爬取酒店名称数据并建立酒店的用户字典

爬取酒店建立字典代码：

import pandas.io.json

import requests

import re

from bs4 import BeautifulSoup

z = 1

sum = ''

def save_to_file(file_name, contents):

fh = open(file_name, 'w')

fh.write(contents)

fh.close()

def getNewsDetail(url):

global sum

#z += 1

#result={}

res = requests.get(url)

res.encoding = 'utf-8'

soup = BeautifulSoup(res.text, 'html.parser')

#result['article'] = ''.join([p.text.strip() for p in soup.select('.ctd_content')[:-1]])

#a ='hhhh'

#a = ''.join([p.text.strip() for p in soup.select('.ctd_content')])

a = soup.select('h1')[0].text

sum += a +' '+'20'+' '+'jd'+'\n'

#name = 'tiqu0.txt'

#tx = name.format(z)

#save_to_file("dict.txt", a)

#n += 1

#df=pandas.DataFrame(a)

#print(a)

#print(type(a))

#lis.append(a)

#f = open('i.txt', 'wb')

#f.write(''.join([p.text.strip() for p in soup.select('.ctd_content')[:-1]]))

#f.close()

#l.append()

#return result

def parseListLinks(urls):

global sum

z=0

res = requests.get(urls)

res.encoding = 'utf-8'

soup = BeautifulSoup(res.text, 'html.parser')

for n in soup.select('.cn_tit'):

#print(n.text)

#截取中文字符串，剔除英文字符

reChinese = re.compile('[\u4e00-\u9fa5]+')

teststr = n.text

#'测试awk测试123测试11'

b = reChinese.findall(teststr)

a = ''.join(b)

print(a)

#s1 = n.text

#print(soup.select('.en_tit')[0].text)

#第二个soupselect，不受for循环第一个select控制，引入变量z

#s2 =soup.select('.en_tit')[z].text

#print(soup.select('.en_tit')[0].text)

#print(n.text.rstrip(soup.select('.en_tit')[0].text))

#print(s1.rstrip(s2))

#z += 1

# a=s2

#a = s1.rstrip(s2)

if a != '':

sum += a +' '+'20'+' '+'jiud'+'\n'

print(sum)

#children=n.children

#print(n.children[0])

#print(n.text-n.children)

#print(n['href'])

#getNewsDetail(n['href'])

#sum += n.text+'\n'

#name = 'xczi{}.txt'

#tx = name.format(z)

#print(sum)

save_to_file("dict_jiudian.txt", sum)

#results.append(getNewsDetail('http://you.ctrip.com' + n['href']))

#getNewsDetail('http://you.ctrip.com' + n['href'])

#return results

seedurl = 'http://travel.qunar.com/p-cs310189-luoshanji-jiudian-1-{}'

#li = []

for i in range(1, 183):

url = seedurl.format(i)

parseListLinks(url)

#df=pandas.DataFrame(lis)

#df

#xc=parseListLinks(url)

#li.extend(xc)

#print(li)

部分景点字典文件：

好莱坞环球影城20 jd

好莱坞星光大道20 jd

圣莫尼卡海滩20 jd

棕榈泉20 jd

比弗利山20 jd

盖帝艺术中心20 jd

Lake Hollywood Park 20 jd

丹麦城20 jd

运河城20 jd

威尼斯海滩20 jd

亨廷顿海滩20 jd

小东京20 jd

斯台普斯球场20 jd

The Murder Mystery Company 20 jd

里普利的信不信由你博物馆20 jd

Griffith Observatory 20 jd

加利福尼亚大学洛杉矶分校20 jd

奥克格兰20 jd

佛光山西来寺20 jd

布罗德博物馆20 jd

伊丽莎白湖20 jd

大熊湖20 jd

格里菲斯公园20 jd

戈曼山20 jd

日落大道20 jd

圣塔莫尼卡码头水族馆20 jd

Tennis L.A. 20 jd

六旗魔术山主题公园20 jd

洛杉矶艺术博物馆20 jd

南加州大学20 jd

威尼斯海滨大道20 jd

Ole Henriksen水疗中心20 jd

Orpheum 剧场20 jd

Wi Spa 20 jd

曼哈顿海滩20 jd

马里布海滩20 jd

约书亚树国家公园20 jd

部分酒店字典文件：

洛杉矶国际机场皇冠假日酒店20 jiud

洛杉矶机场希尔顿酒店20 jiud

洛杉矶洛杉矶国际机场假日酒店20 jiud

洛杉矶圣加布里埃尔希尔顿酒店20 jiud

洛杉矶机场万豪酒店20 jiud

好莱坞罗斯福酒店20 jiud

洛杉矶机场智选假日酒店20 jiud

洛杉矶环球影城希尔顿酒店20 jiud

水晶酒店20 jiud

洛杉矶市中心设计酒店20 jiud

洛杉矶万豪现场酒店20 jiud

洛杉矶比佛利山庄索菲特酒店20 jiud

好莱坞星光大道智选假日酒店20 jiud

长滩机场假日酒店20 jiud

洛杉矶大道喜来登酒店20 jiud

比佛利山区广场酒店20 jiud

贝斯特韦斯特优质龙门酒店20 jiud

贝斯特韦斯特优质好莱坞山庄酒店20 jiud

好莱坞名人酒店20 jiud

洛杉矶比特摩尔千禧酒店20 jiud

比佛利山庄洛杉矶世纪城洲际酒店20 jiud

洛伊斯好莱坞酒店20 jiud

洛杉矶国际机场北使馆套房酒店20 jiud

洛杉矶地铁广场酒店20 jiud

帕萨迪纳亨廷顿朗廷酒店20 jiud

洛杉矶国际机场速酒店20 jiud

洛杉矶市中心希尔顿逸林酒店20 jiud

林肯豪华大酒店20 jiud

洛杉矶国际机场世纪大道万怡酒店20 jiud

洛杉矶福朋喜来登酒店20 jiud

帕萨迪纳豪生酒店20 jiud

布埃纳帕克戴斯酒店20 jiud

贝斯特韦斯特优质套房酒店20 jiud

埃兰酒店20 jiud

日落塔酒店20 jiud

4基于旅游攻略的景点、酒店的提取

4.1加载景点/酒店用户字典，再次对处理后的文本进行分词，标注，目的是选出所有景点/酒店。

4.2统计景点/酒店的出现次数

对于选出的所有景点/酒店，建立一个字典（数据类型），key为酒店/景点的名字，value为出现次数。

4.3 用sort函数进行排序，保存文件为csv格式，以及json格式。

统计景点代码：

import jieba.analyse

import jieba.posseg

import json

import re

import sys

# reload(sys)

import importlib

importlib.reload(sys)

# sys.setdefaultencoding('utf8')

from sklearn import feature_extraction

from sklearn.feature_extraction.text import TfidfTransformer

from sklearn.feature_extraction.text import CountVectorizer

'''

# 读取文件

def read_news():

news = open('news.txt').read()

return news

'''

jieba.load_userdict("dict.txt") #加载字典

sum = ''

sums = ''

stat = {}

z = 0

# 词性标注，提取景点

def cut_news():

global sum

global sums

global stat

global z

with open('tiqu2097.txt', 'r')as f:

for line in f:

line = line.encode('utf-8')

seg = jieba.posseg.cut(line.strip()) # jieba分词,分词与词性标注同时进行，生成一个列表

# print("/".join(seg))

for i in seg:

if i.flag == 'jd': #正向筛选

if i.word not in stat:

stat[i.word] = 0

stat[i.word] += 1

z += 1

print(z)

# print(i.word, i.flag)

# sum += i.word

# print(sum)

return stat

# 其中join可以将分词结果变为列表格式。

'''

# jieba分词器，通过词频获取关键词

def jieba_keywords(news: object) -> object:

keywords = jieba.analyse.extract_tags(news, topK=100)

print(keywords)

'''

def save_as_csv(file_name, contents):

fh = open(file_name, 'w')

for item in contents:

fh.write(item[0]+','+str(item[1])+'\n')

fh.close()

def save_as_json(filename, content):

fw = open(filename, 'w')

fw.write(content)

fw.close()

if __name__ == '__main__':

#save_as_json('111.json', 'haha')

# new = read_news()

# jieba_keywords(new)

a = cut_news()

print('进入主函数')

print(a)

save_as_json('111a.json', json.dumps(a,ensure_ascii=False))

save_as_csv('111a.csv', a)

b = sorted(a.items(), key=lambda d: d[1], reverse=True)

print(b)

save_as_json('111b.json', json.dumps(b, ensure_ascii=False))

save_as_csv('111b.csv', b)

统计酒店代码：

import jieba.analyse

import jieba.posseg

import json

import re

import sys

import re

# reload(sys)

import importlib

importlib.reload(sys)

# 读取文件

def read_news():

news = open('news.txt').read()

return news

jieba.load_userdict("dict_jiudian.txt")

sum = ''

sums = ''

stat = {}

z = 0

# 词性标注，提取酒店

def cut_news():

global sum

global sums

global stat

global z

with open('tiqu2097.txt', 'r')as f:

for line in f:

line = line.encode('utf-8')

seg = jieba.posseg.cut(line.strip()) # jieba分词

# print("/".join(seg))

for i in seg:

if i.flag == 'jiud':

if i.word not in stat:

stat[i.word] = 0

stat[i.word] += 1

z += 1

print(z)

# print(i.word, i.flag)

# sum += i.word

# print(sum)

return stat

# 其中join可以将分词结果变为列表格式。

def save_to_file(file_name, contents):

fh = open(file_name, 'w')

fh.write(contents)

fh.close()

def save_as_csv(file_name, contents):

fh = open(file_name, 'w')

for item in contents:

fh.write(item[0]+','+str(item[1])+'\n')

fh.close()

def save_as_json(filename, content):

fw = open(filename, 'w')

fw.write(content)

fw.close()

if __name__ == '__main__':

save_as_json('222.json', 'haha')

# new = read_news()

# jieba_keywords(new)

a = cut_news()

'''

print('进入主函数')

print(a)

save_as_json('222a.json', json.dumps(a,ensure_ascii=False))

save_as_csv('222a.csv', a)

'''

b = sorted(a.items(), key=lambda d: d[1], reverse=True)

print(b)

save_as_json('222b.json', json.dumps(b, ensure_ascii=False))

save_as_csv('222b.csv', b)

统计结果

1统计景点次数

景点csv数据：

好莱坞环球影城,6164

好莱坞,3327

好莱坞星光大道,1121

棕榈泉,767

日落大道,368

加利福尼亚大学洛杉矶分校,312

洛杉矶市政厅,153

加州科学中心,149

南加州大学,133

洛杉矶艺术博物馆,73

大熊湖,67

曼哈顿海滩,61

丹麦城,46

好莱坞高地中心,45

加州理工学院,34

小东京,19

好莱坞露天剧场,15

洛杉矶音乐中心,13

洛杉矶纪念体育场,13

太平洋水族馆,11

爱德华兹空军基地,8

好莱坞博物馆,7

海峡群岛国家公园,6

博览会公园,6

好莱坞蜡像博物馆,4

洛杉矶动物园,4

圣盖博山,3

火车公园,3

西林纪念公园,2

洛杉矶歌剧院,1

加利福尼亚州科学中心,1

回音山,1

洛杉矶时报大楼,1

2 统计酒店次数

酒店数据csv文件：

洛杉矶酒店,156

假日酒店,152

好莱坞酒店,77

套房酒店,70

豪华酒店,46

洛杉矶机场希尔顿酒店,46

东西酒店,35

加州酒店,34

美国旅馆,22

洛杉矶市中心酒店,13

水晶酒店,10

洛杉矶国际机场速酒店,10

海景酒店,6

洛杉矶山丘酒店日落店,6

洛杉矶环球影城希尔顿酒店,6

洛杉矶好莱坞酒店,5

好莱坞宾馆,5

提塔酒店,4

洛杉矶地铁广场酒店,4

洛杉矶花园酒店,3

洛杉矶加兰酒店,3

洛杉矶国际机场皇冠假日酒店,3

洛杉矶好莱坞历史酒店,2

海风旅馆,2

小时汽车旅馆,2

洛杉矶速酒店,1

大道套房酒店,1

都市酒店,1

山谷旅馆,1

日落汽车旅馆,1

美国好莱坞旅馆,1

经济汽车旅馆,1

经济旅馆,1

影院酒店,1

海洋公园酒店,1

好莱坞公寓酒店,1

世纪旅馆,1

洛杉矶洛杉矶国际机场假日酒店,1

好莱坞城里人酒店,1

洛杉矶人酒店,1

棕榈汽车旅馆,1

龙门汽车旅馆,1

好莱坞星光大道品质酒店,1

洛杉矶好莱坞城市旅馆,1

好莱坞环球影城,6164

好莱坞,3327

好莱坞星光大道,1121

棕榈泉,767

日落大道,368

加利福尼亚大学洛杉矶分校,312

洛杉矶市政厅,153

加州科学中心,149

南加州大学,133

洛杉矶艺术博物馆,73

大熊湖,67

曼哈顿海滩,61

丹麦城,46

好莱坞高地中心,45

加州理工学院,34

小东京,19

好莱坞露天剧场,15

洛杉矶音乐中心,13

洛杉矶纪念体育场,13

太平洋水族馆,11

爱德华兹空军基地,8

好莱坞博物馆,7

海峡群岛国家公园,6

博览会公园,6

好莱坞蜡像博物馆,4

洛杉矶动物园,4

圣盖博山,3

火车公园,3

西林纪念公园,2

洛杉矶歌剧院,1

加利福尼亚州科学中心,1

回音山,1

洛杉矶时报大楼,1

用python保存为excel文件

import pandas as pd

# Reading data locally

df2 = pd.read_csv('景点.csv') #, encoding='gbk

writer = pd.ExcelWriter('景点.xlsx')

df2.to_excel(writer,'Sheet1')

#df2.to_excel(writer,'Sheet2')

writer.save()

用R语言读入excel文件

library(openxlsx)

a<-read.xlsx("景点.xlsx",sheet=1)

#解决读入中文乱码：

Sys.setlocale(category="LC_ALL",locale="en_US.UTF-8")

#去除第一列

a <- subset(a, select = -X1)

#输出词云

wordcloud2(a, size = 2, fontFamily = "微软雅黑",

color = "random-light", backgroundColor = "grey")

用python保存为excel文件

import pandas as pd

# Reading data locally

df2 = pd.read_csv('酒店.csv') #, encoding='gbk

writer = pd.ExcelWriter('酒店.xlsx')

df2.to_excel(writer,'Sheet1')

#df2.to_excel(writer,'Sheet2')

writer.save()

用R语言读入excel文件

library(openxlsx)

b<-read.xlsx("酒店.xlsx",sheet=1)

#解决读入中文乱码：

Sys.setlocale(category="LC_ALL",locale="en_US.UTF-8")

#去除第一列

b<- subset(b, select = -X1)

#输出词云

wordcloud2(b, size = 2, fontFamily = "微软雅黑",

color = "random-light", backgroundColor = "grey")

你可能感兴趣的:(统计数据分析)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
每日一题——第八十九题互联网打工人no1 C语言程序设计每日一练 c语言
题目：在字符串中找到提取数字，并统计一共找到多少整数，a123xxyu23&8889，那么找到的整数为123，23，8889//思想：#include#include#includeintmain(){charstr[]="a123xxyu23&8889";intcount=0;intnum=0;//用于临时存放当前正在构建的整数。boolinNum=false;//用于标记当前是否正在读取一个整
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
Java面试题精选：消息队列(二) 芒果不是芒 Java面试题精选 java kafka
一、Kafka的特性1.消息持久化：消息存储在磁盘，所以消息不会丢失2.高吞吐量：可以轻松实现单机百万级别的并发3.扩展性：扩展性强，还是动态扩展4.多客户端支持：支持多种语言（Java、C、C++、GO、）5.KafkaStreams（一个天生的流处理）:在双十一或者销售大屏就会用到这种流处理。使用KafkaStreams可以快速的把销售额统计出来6.安全机制：Kafka进行生产或者消费的时候会
用Python实现读取统计单词个数程序媛了了 python 游戏 java
完整实例代码：fromcollectionsimportCounterdefpythonit():danci={}withopen("pythonit.txt","r",encoding="utf-8")asf:foriinf:words=i.strip().split()forwordinwords:ifwordnotindanci:danci[word]=1else:danci[word]+=
进销存小程序源码 PHP网络版ERP进销存管理系统全开源可二开摸鱼小号 php
可直接源码搭建部署发布后使用：一、功能模块介绍该系统模板主要有进，销，存三个主要模板功能组成，下面将介绍各模块所对应的功能；进：需要将产品采购入库，自动生成采购明细台账同时关联财务生成付款账单；销：是指对客户的销售订单记录，汇总生成产品销售明细及回款计划；存：库存的日常盘点与统计，库存下限预警、出入库台账、库存位置等。1.进购管理采购订单：采购下单审批→由上级审批通过采购入库；采购入库：货品到货>
Python数据分析与可视化 jun778895 python 数据分析开发语言
Python数据分析与可视化是一个涉及数据处理、分析和以图形化方式展示数据的过程，它对于数据科学家、分析师以及任何需要从数据中提取洞察力的专业人员来说至关重要。以下将详细探讨Python在数据分析与可视化方面的应用，包括常用的库、数据处理流程、可视化技巧以及实际应用案例。一、Python数据分析与可视化的重要性数据可视化是将数据以图形或图像的形式表示出来，以便人们能够更直观地理解数据背后的信息和规
分布式锁和spring事务管理暴躁的鱼锁及事务分布式 spring java
最近开发一个小程序遇到一个需求需要实现分布式事务管理业务需求用户在使用小程序的过程中可以查看景点，对景点地区或者城市标记是否想去，那么需要统计一个地点被标记的人数，以及记录某个用户对某个地点是否标记为想去，用两个表存储数据，一个地点表记录改地点被标记的次数，一个用户意向表记录某个用户对某个地点是否标记为想去。由于可能有多个用户同时标记一个地点，每个用户在前端点击想去按钮之后，后台接收到请求，从数据
新媒体运营小白，有哪些书籍可以推荐？ y耳朵
为了转行运营，我曾花了3个月的时间，看了不下百本书，可以说市面上大部分跟运营有关的书籍，我都看过了，因此关于书的推荐也有一些自己的小见解。看书不一定要多，但一定要****精，我根据豆瓣评分、推荐热度和自己的转行经历，挑出了13本值得运营小白看的书，收藏好这份书单，不需要你浪费时间去找书了。先看下统计好的书单：整理不易，看完记得点个赞哦！感谢你的支持。入门篇：1.《运营之光》（豆瓣评分：8.0)推荐
向着明亮那方12.7 向着明亮那方的我们
【水晶泥的妙用】在地上捡到一滩水晶泥，本想扔进垃圾桶，发现水晶泥上附着了些许蓝色钢笔墨水。我脑洞大开，水晶泥可不可以用来处理钢笔墨渍呢？正好垃圾桶那面瓷砖墙上有蓝色钢笔水痕迹，我用水晶泥沾了沾墨迹，很轻易地把墨色粘了下来，好干净。【长跑报名】我让同学们自愿报名参加冬季长跑比赛，课间将名字报给班长。班长把名字统计在本子上，把本子拿来给我看：“老师，我晚上回去给你做张电子表，发给你。”看来班长又学了新
python编写直方图和饼图 2301_80421078 python 开发语言
1.直方图#直方图的绘制#语法格式：plt.hist(x,bins),其中x:数据集；bins:统计数据的分布区间importmatplotlib.pyplotaspltimportpandasaspd#导入文件excel=pd.read_excel('成绩.xlsx')#print(excel)#避免乱码plt.rcParams['font.sans-serif']=['SimHei']x=ex
跟着黑马学mysql（5）小杜不吃糖 mysql 数据库
17.DQL-聚合函数DQL-聚合函数介绍将一列数据作为一个整体，进行纵向计算。常见聚合函数函数功能count统计数量max最大值min最小值avg平均值sum求和语法SELECT聚合函数(字段列表)FROM表名;注意：所有的null值不参与聚合函数的运算18.DQL-分组查询语法SELECT字段列表FROM表名[WHERE条件]GROUPBY分组字段名[HAVING分组后的过滤条件];where
梧桐数据库（WuTongDB）：数据库技术中都有哪些常见的优化器鲁鲁517 梧桐数据库梧桐数据库
以下是一些常见的数据库优化器：1.CBO（Cost-BasedOptimizer）应用场景：广泛应用于关系型数据库中，如Oracle、PostgreSQL、MySQL等。工作原理：通过计算不同执行计划的代价（如CPU、I/O等资源消耗），选择最低代价的执行计划。代表数据库：Oracle、PostgreSQL、MySQL。特点：CBO使用统计信息（如表大小、索引分布）来评估查询的代价。2.RBO（R
淘宝优惠券返利app 软件？淘宝返利app哪个佣金高日常购物小技巧
今天有朋友问莉莉：淘宝优惠券返利app软件？淘宝返利app哪个佣金高目前市面上出现越来越多的淘客返利APP，比如花桃、粉象生活、花生日记、好省、高佣联盟、美逛、芬香、蜜源、果冻宝盒、悦拜等等。据不完全统计，可能已经多达上千家了。那面对众多的返利软件，作为用户，我们该如何选择呢？其实返利APP的主要功能就是查券和返利，而券可以说每个平台也都是一样的，如果有那都有，如果没有，那么都没有。所不同的就是返
Github 2024-09-12 Go开源项目日报Top10 老孙正经胡说 github golang 开源 Github趋势分析开源项目 Python Golang
根据GithubTrendings的统计，今日(2024-09-12统计)共有10个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量Go项目10C项目1Terraform：基础设施即代码的开源工具创建周期：3626天开发语言：Go协议类型：OtherStar数量：40393个Fork数量：9397次关注人数：40393人贡献人数：358人OpenIssues数量：1943个Git
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
Sentinel实时监控不展示问题朱杰jjj sentinel sentinel
问题官方插件Endpoint支持，可以实时统计出SpringBoot的健康状况和请求的调用信息在使用Endpoint特性之前需要在Maven中添加spring-boot-starter-actuator依赖，并在配置中允许Endpoints的访问。SpringBoot1.x中添加配置management.security.enabled=false。暴露的endpoint路径为/sentinelS
python读写CSV文件 bcbobo21cn .Net python 开发语言机器学习 CSV
做数据分析，有时候要分析的数据在CSV文件里；先看一下python读写CSV文件；importpandasaspddf=pd.read_csv('test1.csv')print(df)print('')print(df.head(2))companyname=["A1","B2","E3","F4"]legperson=["lier","yanqi","wangwu","zhangsan"]le
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
认识世界陈陈_19b4
9月16日，雨。阅读书目:《真相》。作者:瑞典统计学家和医学教授汉斯·罗斯林，他的儿子奥拉·罗斯林，google公共数据团队的负责人。汉斯·罗斯林还是一位全球知名的教育家，是世界健康组织和联合国儿童基金会的顾问。他与儿子儿媳共同创办了Gapminder基金会，开发了Trendalyzer软件，将国际统计数据转化成交互式的生动有趣的图表，帮助人们以事实为基础来观察世界，被称为“可视化数据之父”。图片
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
在服务器计算节点中使用 jupyter Lab ranshan567 程序人生
JupyterLab是一个基于网页的交互式开发环境,用于科学计算、数据分析和机器学.jupyterlab是jupyternotebook的下一代产品,集成了更多功能,使用起来更方便.在进行数据分析及可视化时，个人电脑不能满足大数据的分析需求，就需要用到高性能计算机集群资源，然而计算机集群的计算节点往往没有联网功能，所以在计算机集群中使用jupyterLab需要进行一些配置。具体的步骤如下：
大数据真实面试题---SQL The博宇大数据面试题——SQL 大数据 mysql sql 数据库 big data
视频号数据分析组外包招聘笔试题时间限时45分钟完成。题目根据3张表表结构，写出具体求解的SQL代码（搞笑品类定义：视频分类或者视频创建者分类为“搞笑”）1、表创建语句：createtablet_user_video_action_d(dsint,user_idstring,video_idstring,action_typeint,`timestamp`bigint)rowformatdelimi
枚举的构造函数中抛出异常会怎样 bylijinnan java enum 单例
首先从使用enum实现单例说起。为什么要用enum来实现单例？这篇文章（ http://javarevisited.blogspot.sg/2012/07/why-enum-singleton-are-better-in-java.html）阐述了三个理由： 1.enum单例简单、容易，只需几行代码： public enum Singleton { INSTANCE;
CMake 教程 aigo C++
转自：http://xiang.lf.blog.163.com/blog/static/127733322201481114456136/ CMake是一个跨平台的程序构建工具，比如起自己编写Makefile方便很多。介绍：http://baike.baidu.com/view/1126160.htm 本文件不介绍CMake的基本语法，下面是篇不错的入门教程： http:
cvc-complex-type.2.3: Element 'beans' cannot have character Cb123456 spring Webgis
cvc-complex-type.2.3: Element 'beans' cannot have character Line 33 in XML document from ServletContext resource [/WEB-INF/backend-servlet.xml] is i
jquery实例:随页面滚动条滚动而自动加载内容 120153216 jquery
<script language="javascript"> $(function (){ var i = 4;$(window).bind("scroll", function (event){ //滚动条到网页头部的高度，兼容ie,ff,chrome var top = document.documentElement.s
将数据库中的数据转换成dbs文件何必如此 sql dbs
旗正规则引擎通过数据库配置器（DataBuilder）来管理数据库，无论是Oracle，还是其他主流的数据都支持，操作方式是一样的。旗正规则引擎的数据库配置器是用于编辑数据库结构信息以及管理数据库表数据，并且可以执行SQL 语句，主要功能如下。 1)数据库生成表结构信息：主要生成数据库配置文件(.conf文
在IBATIS中配置SQL语句的IN方式 357029540 ibatis
在使用IBATIS进行SQL语句配置查询时，我们一定会遇到通过IN查询的地方，在使用IN查询时我们可以有两种方式进行配置参数：String和List。具体使用方式如下： 1.String:定义一个String的参数userIds，把这个参数传入IBATIS的sql配置文件，sql语句就可以这样写： <select id="getForms" param
Spring3 MVC 笔记（一） 7454103 spring mvc bean REST JSF
自从 MVC 这个概念提出来之后 struts1.X struts2.X jsf 。。。。。这个view 层的技术一个接一个！都用过！不敢说哪个绝对的强悍！要看业务，和整体的设计！最近公司要求开发个新系统！
Timer与Spring Quartz 定时执行程序 darkranger spring bean 工作 quartz
有时候需要定时触发某一项任务。其实在jdk1.3，java sdk就通过java.util.Timer提供相应的功能。一个简单的例子说明如何使用，很简单： 1、第一步，我们需要建立一项任务，我们的任务需要继承java.util.TimerTask package com.test; import java.text.SimpleDateFormat; import java.util.Date;
大端小端转换，le32_to_cpu 和cpu_to_le32 aijuans C语言相关
大端小端转换，le32_to_cpu 和cpu_to_le32 字节序 http://oss.org.cn/kernel-book/ldd3/ch11s04.html 小心不要假设字节序. PC 存储多字节值是低字节为先(小端为先, 因此是小端), 一些高级的平台以另一种方式(大端)
Nginx负载均衡配置实例详解 avords
[导读] 负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡，单从字面上的意思来理解就可以解负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡
乱说的 houxinyou 框架敏捷开发软件测试
从很久以前，大家就研究框架，开发方法，软件工程，好多！反正我是搞不明白！这两天看好多人研究敏捷模型，瀑布模型！也没太搞明白. 不过感觉和程序开发语言差不多，瀑布就是顺序，敏捷就是循环. 瀑布就是需求、分析、设计、编码、测试一步一步走下来。而敏捷就是按摸块或者说迭代做个循环，第个循环中也一样是需求、分析、设计、编码、测试一步一步走下来。也可以把软件开发理
欣赏的价值——一个小故事 bijian1013 有效辅导欣赏欣赏的价值
　　第一次参加家长会，幼儿园的老师说："您的儿子有多动症，在板凳上连三分钟都坐不了，你最好带他去医院看一看。"　　回家的路上，儿子问她老师都说了些什么，她鼻子一酸，差点流下泪来。因为全班30位小朋友，惟有他表现最差；惟有对他，老师表现出不屑，然而她还在告诉她的儿子："老师表扬你了，说宝宝原来在板凳上坐不了一分钟，现在能坐三分钟。其他妈妈都非常羡慕妈妈，因为全班只有宝宝
包冲突问题的解决方法 bingyingao eclipse maven exclusions 包冲突
包冲突是开发过程中很常见的问题：其表现有： 1.明明在eclipse中能够索引到某个类，运行时却报出找不到类。 2.明明在eclipse中能够索引到某个类的方法，运行时却报出找不到方法。 3.类及方法都有，以正确编译成了.class文件，在本机跑的好好的，发到测试或者正式环境就抛如下异常： java.lang.NoClassDefFoundError: Could not in
【Spark七十五】Spark Streaming整合Flume-NG三之接入log4j bit1129 Stream
先来一段废话：实际工作中，业务系统的日志基本上是使用Log4j写入到日志文件中的，问题的关键之处在于业务日志的格式混乱，这给对日志文件中的日志进行统计分析带来了极大的困难，或者说，基本上无法进行分析，每个人写日志的习惯不同，导致日志行的格式五花八门，最后只能通过grep来查找特定的关键词缩小范围，但是在集群环境下，每个机器去grep一遍，分析一遍，这个效率如何可想之二，大好光阴都浪费在这上面了
sudoku solver in Haskell bookjovi sudoku haskell
这几天没太多的事做，想着用函数式语言来写点实用的程序，像fib和prime之类的就不想提了（就一行代码的事），写什么程序呢？在网上闲逛时发现sudoku游戏，sudoku十几年前就知道了，学生生涯时也想过用C/Java来实现个智能求解，但到最后往往没写成，主要是用C/Java写的话会很麻烦。现在写程序，本人总是有一种思维惯性，总是想把程序写的更紧凑，更精致，代码行数最少，所以现
java apache ftpClient bro_feng java
最近使用apache的ftpclient插件实现ftp下载，遇见几个问题，做如下总结。 1. 上传阻塞，一连串的上传，其中一个就阻塞了，或是用storeFile上传时返回false。查了点资料，说是FTP有主动模式和被动模式。将传出模式修改为被动模式ftp.enterLocalPassiveMode();然后就好了。看了网上相关介绍，对主动模式和被动模式区别还是比较的模糊，不太了解被动模
读《研磨设计模式》-代码笔记-工厂方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 工厂方法模式：使一个类的实例化延迟到子类 * 某次，我在工作不知不觉中就用到了工厂方法模式（称为模板方法模式更恰当。2012-10-29）： * 有很多不同的产品，它
面试记录语 chenyu19891124 招聘
或许真的在一个平台上成长成什么样，都必须靠自己去努力。有了好的平台让自己展示，就该好好努力。今天是自己单独一次去面试别人，感觉有点小紧张，说话有点打结。在面试完后写面试情况表，下笔真的好难，尤其是要对面试人的情况说明真的好难。今天面试的是自己同事的同事，现在的这个同事要离职了，介绍了我现在这位同事以前的同事来面试。今天这位求职者面试的是配置管理，期初看了简历觉得应该很适合做配置管理，但是今天面
Fire Workflow 1.0正式版终于发布了 comsci 工作 workflow Google
Fire Workflow 是国内另外一款开源工作流，作者是著名的非也同志，哈哈.... 官方网站是 http://www.fireflow.org 经过大家努力,Fire Workflow 1.0正式版终于发布了正式版主要变化: 1、增加IWorkItem.jumpToEx(...)方法，取消了当前环节和目标环节必须在同一条执行线的限制，使得自由流更加自由 2、增加IT
Python向脚本传参 daizj python 脚本传参
如果想对python脚本传参数，python中对应的argc, argv(c语言的命令行参数)是什么呢？需要模块：sys 参数个数：len(sys.argv) 脚本名： sys.argv[0] 参数1： sys.argv[1] 参数2： sys.argv[
管理用户分组的命令gpasswd dongwei_6688 passwd
NAME： gpasswd - administer the /etc/group file SYNOPSIS： gpasswd group gpasswd -a user group gpasswd -d user group gpasswd -R group gpasswd -r group gpasswd [-A user,...] [-M user,...] g
郝斌老师数据结构课程笔记 dcj3sjt126com 数据结构与算法
<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
yii2 cgridview加上选择框进行操作 dcj3sjt126com GridView
页面代码 <?=Html::beginForm(['controller/bulk'],'post');?> <?=Html::dropDownList('action','',[''=>'Mark selected as: ','c'=>'Confirmed','nc'=>'No Confirmed'],['class'=>'dropdown',])
linux mysql fypop linux
enquiry mysql version in centos linux yum list installed | grep mysql yum -y remove mysql-libs.x86_64 enquiry mysql version in yum repositoryyum list | grep mysql oryum -y list mysql* install mysq
Scramble String hcx2013 String
Given a string s1, we may represent it as a binary tree by partitioning it to two non-empty substrings recursively. Below is one possible representation of s1 = "great":
跟我学Shiro目录贴 jinnianshilongnian 跟我学shiro
历经三个月左右时间，《跟我学Shiro》系列教程已经完结，暂时没有需要补充的内容，因此生成PDF版供大家下载。最近项目比较紧，没有时间解答一些疑问，暂时无法回复一些问题，很抱歉，不过可以加群（334194438/348194195）一起讨论问题。 ----广告-----------------------------------------------------
nginx日志切割并使用flume-ng收集日志 liyonghui160com
nginx的日志文件没有rotate功能。如果你不处理，日志文件将变得越来越大，还好我们可以写一个nginx日志切割脚本来自动切割日志文件。第一步就是重命名日志文件，不用担心重命名后nginx找不到日志文件而丢失日志。在你未重新打开原名字的日志文件前，nginx还是会向你重命名的文件写日志，linux是靠文件描述符而不是文件名定位文件。第二步向nginx主
Oracle死锁解决方法 pda158 oracle
　select p.spid,c.object_name,b.session_id,b.oracle_username,b.os_user_name from v$process p,v$session a, v$locked_object b,all_objects c where p.addr=a.paddr and a.process=b.process and c.object_id=b.
java之List排序 shiguanghui list排序
在Java Collection Framework中定义的List实现有Vector，ArrayList和LinkedList。这些集合提供了对对象组的索引访问。他们提供了元素的添加与删除支持。然而，它们并没有内置的元素排序支持。　　你能够使用java.util.Collections类中的sort()方法对List元素进行排序。你既可以给方法传递
servlet单例多线程 utopialxw 单例多线程 servlet
转自http://www.cnblogs.com/yjhrem/articles/3160864.html 和 http://blog.chinaunix.net/uid-7374279-id-3687149.html Servlet 单例多线程 Servlet如何处理多个请求访问？Servlet容器默认是采用单实例多线程的方式处理多个请求的：1.当web服务器启动的