qibingtuanjwh

kobe

科比职业生涯回顾与模型预测

2016年4月13日，NBA巨星科比退役，结束了自己的篮球生涯。2020年1月26日，科比去世，令球迷悲痛不已。在此回顾科比20年的NBA生涯，以更深入的了解这位传奇，同时向科比致敬。
本文主要内容如下：

数据采集
数据清洗
数据分析
数据概览
- 胜率
- 出勤率
- 命中率
- 对阵球队
时间序列模型预测
比赛结果预测
结论

一、数据采集

import pandas as pd

# 爬取科比常规赛数据
df = pd.read_html('http://www.stat-nba.com/query.php?page=0&QueryType=game&GameType=season&Player_id=195&crtcol=season&order=1#label_show_result',encoding='utf-8',index_col=0)[0]
for page in range(67):
    url = f'http://www.stat-nba.com/query.php?page={page+1}&QueryType=game&GameType=season&Player_id=195&crtcol=season&order=1#label_show_result'
    temp = pd.read_html(url,encoding='utf-8',index_col=0)[0]
    df = pd.concat([df,temp])

df.to_csv('kobe_regular.csv',index=None)

# 爬取科比季后赛数据
df_2 = pd.read_html('http://www.stat-nba.com/query.php?page=0&QueryType=game&GameType=playoff&Player_id=195&crtcol=season&order=1#label_show_result',encoding='utf-8',index_col=0)[0]
for page in range(10):
    url = f'http://www.stat-nba.com/query.php?page={page+1}&QueryType=game&GameType=playoff&Player_id=195&crtcol=season&order=1#label_show_result'
    temp = pd.read_html(url,encoding='utf-8',index_col=0)[0]
    df_2 = pd.concat([df_2,temp])

df_2.to_csv('kobe_playoff.csv',index=None)

二、数据清洗

1、缺失值处理及数据替换

# 读取数据
import pandas as pd
df_r = pd.read_csv('kobe_regular.csv')
df_o = pd.read_csv('kobe_playoff.csv')

# 替换"结果"中的字符
df_r.replace({
     '胜':1,'负':0},inplace=True)
df_o.replace({
     '胜':1,'负':0},inplace=True)

# 将字符串转换为float
df_r[['投篮','三分','罚球']]=df_r[['投篮','三分','罚球']].apply(lambda x:x.str.replace('%', '').astype('float')/100)
df_o[['投篮','三分','罚球']]=df_o[['投篮','三分','罚球']].apply(lambda x:x.str.replace('%', '').astype('float')/100)

# def convert_percent(x):
#     new = x.str.replace('%','')
#     return float(new)/100
# df['投篮'].apply(convert_percent)

#查看缺失数据
df_r.isnull().values.sum() 
df_o.isnull().values.sum()

df_r[df_r.isnull().any(axis=1)].iloc[:,7:].head(10)

	命中	出手	三分	命中.1	出手.1	罚球	篮板	前场	后场	助攻	抢断	盖帽	失误	犯规	得分
7	1	7	0.000	0	2	NaN	2	1	1	0	0	0	1	0	2
27	4	13	0.286	2	7	NaN	4	0	4	3	2	0	2	2	10
28	5	9	0.000	0	1	NaN	2	0	2	1	0	0	5	1	10
29	2	9	0.250	1	4	NaN	2	1	1	6	0	1	3	2	5
31	2	5	0.500	1	2	NaN	2	0	2	9	1	0	4	0	5
33	4	15	0.000	0	4	NaN	6	2	4	3	2	1	2	2	8
47	5	13	0.500	1	2	NaN	1	0	1	1	1	0	2	2	11
49	2	15	0.167	1	6	NaN	3	0	3	1	1	0	3	2	5
57	5	13	0.000	0	5	NaN	4	0	4	5	2	0	3	2	10
69	2	12	0.000	0	3	NaN	8	0	8	7	1	0	6	1	4

缺失值均为命中率，且仅在无出手时才为0，理应删除该类缺失，但此处先保留，分析时再做处理

2、将“比赛”列拆分为对阵双方的比分，方便后续比较

import re 

# 将“比赛”列拆分为对阵双方
df_r_score= df_r['比赛'].str.split('-',1,expand=True).rename(columns={
     0:'对手',1:'湖人'})
df_o_score= df_o['比赛'].str.split('-',1,expand=True).rename(columns={
     0:'对手',1:'湖人'})
# 提取湖人比分
df_r_score['湖人得分']=df_r_score['湖人'].str.extract(r'(\d+)',expand=True)
df_o_score['湖人得分']=df_o_score['湖人'].str.extract(r'(\d+)',expand=True)
# 将对手比分和队名拆分，其中队名中“76人”既有数字又有字符，因此使用正则表达式
rival = []
for i in range(len(df_r)):
    tem = re.split(r'(\d+\D|\D+)',df_r_score['对手'][i],maxsplit=1)
    rival.append(tem)
# 合并两队数据，删除无用列
df_r_score = df_r_score.join(pd.DataFrame(rival)).drop(['对手','湖人',0],axis=1).rename(columns={
     1:'对手',2:'对手得分'})

rival = []
for i in range(len(df_o)):
    tem = re.split(r'(\d+\D|\D+)',df_o_score['对手'][i],maxsplit=1)
    rival.append(tem)
# 合并两队数据，删除无用列
df_o_score = df_o_score.join(pd.DataFrame(rival)).drop(['对手','湖人',0],axis=1).rename(columns={
     1:'对手',2:'对手得分'})

df_r_score = df_r_score.join(df_r['果'])
df_o_score = df_o_score.join(df_o['果'])

df_r_score.to_csv('df_r_score.csv')
df_o_score.to_csv('df_o_score.csv')

3、重新命名列名

df_r.columns

Index(['球员', '赛季', '果', '比赛', '首发', '时间', '投篮', '命中', '出手', '三分', '命中.1',
       '出手.1', '罚球', '命中.2', '出手.2', '篮板', '前场', '后场', '助攻', '抢断', '盖帽', '失误',
       '犯规', '得分'],
      dtype='object')

df_o.columns

Index(['球员', '赛季', '果', '比赛', '时间', '投篮', '命中', '出手', '三分', '命中.1', '出手.1',
       '罚球', '命中.2', '出手.2', '篮板', '前场', '后场', '助攻', '抢断', '盖帽', '失误', '犯规',
       '得分'],
      dtype='object')

# 删除无用列，重新命名列名
df_r.drop(['球员','比赛'],axis=1,inplace=True)
df_o.drop(['球员','比赛'],axis=1,inplace=True)
df_r.columns = ['赛季', '结果', '首发', '出场时间', '投篮命中率', '投篮命中', '投篮出手', '三分命中率', '三分命中', '三分出手',
       '罚球命中率', '罚球命中', '罚球出手', '篮板', '前场', '后场', '助攻', '抢断', '盖帽', '失误', '犯规',
       '得分']
df_o.columns = ['赛季', '结果', '出场时间', '投篮命中率', '投篮命中', '投篮出手', '三分命中率', '三分命中', '三分出手',
       '罚球命中率', '罚球命中', '罚球出手', '篮板', '前场', '后场', '助攻', '抢断', '盖帽', '失误', '犯规',
       '得分']
df_r.head()

	赛季	结果	首发	出场时间	投篮命中率	投篮命中	投篮出手	三分命中率	三分命中	三分出手	...	罚球出手	篮板	后场	助攻	抢断	盖帽	失误	犯规	得分
0	15-16	1	1	42	0.440	22	50	0.286	6	21	...	12	4	4	4	1	1	2	1	60
1	15-16	0	1	19	0.333	4	12	0.333	3	9	...	2	1	1	0	1	0	2	2	13
2	15-16	0	1	27	0.455	10	22	0.364	4	11	...	11	2	2	1	2	0	4	1	35
3	15-16	0	1	22	0.267	4	15	0.333	3	9	...	3	3	3	4	1	0	2	0	14
4	15-16	0	1	28	0.316	6	19	0.167	1	6	...	4	3	3	1	1	0	1	1	17

5 rows × 22 columns

4、添加每个赛季的场次

由于原始数据为倒序排列，因此须将比赛按时间发生的顺序重新排列，并将每赛季的比赛添加场次信息

# 倒序，重置索引
df_r.sort_index(ascending=False,inplace=True)
df_o.sort_index(ascending=False,inplace=True)
df_r.reset_index(drop=True,inplace=True)
df_o.reset_index(drop=True,inplace=True)

# 将赛季信息按原来的顺序组成含有唯一值的列表
df_index = list(df_r['赛季'])
t = list(set(df_index))
t.sort(key=df_index.index)

# 生成场次的序列，并添加至原数据
game = []
for session in t:
    length = len(df_r[df_r['赛季']==session])
    tem = np.array([i+1 for i in range(length)])
    game = np.concatenate((game,tem))
df_r['场次'] = pd.DataFrame(game.astype(int))

game = []
for session in t:
    length = len(df_o[df_o['赛季']==session])
    tem = np.array([i+1 for i in range(length)])
    game = np.concatenate((game,tem))

df_o['场次'] = pd.DataFrame(game.astype(int))

df_r[df_r['赛季']=='98-99'].head(10)
# df_o[df_o['赛季']=='98-99'].head(10)

	赛季	结果	首发	出场时间	投篮命中率	投篮命中	投篮出手	三分命中率	三分命中	三分出手	...	篮板	前场	后场	助攻	抢断	盖帽	失误	犯规	得分	场次
150	98-99	1	1	44	0.381	8	21	0.667	2	3	...	10	2	8	2	2	3	2	4	25	1
151	98-99	0	1	41	0.583	7	12	0.000	0	1	...	12	2	10	3	0	2	5	6	16	2
152	98-99	1	1	41	0.421	8	19	0.250	1	4	...	10	2	8	2	2	2	4	5	19	3
153	98-99	1	1	38	0.533	8	15	0.500	1	2	...	10	1	9	5	1	0	3	5	21	4
154	98-99	0	1	38	0.381	8	21	0.000	0	3	...	10	2	8	2	2	1	1	1	24	5
155	98-99	0	1	35	0.500	6	12	0.250	1	4	...	2	0	2	0	2	2	3	5	18	6
156	98-99	1	1	31	0.571	8	14	0.000	0	1	...	9	0	9	5	2	2	4	1	16	7
157	98-99	1	1	31	0.533	8	15	NaN	0	0	...	9	1	8	4	1	0	3	2	23	8
158	98-99	1	1	42	0.474	9	19	NaN	0	0	...	8	1	7	6	1	1	3	5	21	9
159	98-99	0	1	40	0.400	8	20	0.167	1	6	...	13	4	9	2	1	0	4	5	23	10

10 rows × 23 columns

df_r.to_csv('kobe_regular_.csv',index=None)
df_o.to_csv('kobe_playoff_.csv',index=None)

三、数据分析

import pandas as pd

# 读取数据
df_r = pd.read_csv('G:/py_data/kobe_data/kobe_regular_.csv')
df_o = pd.read_csv('G:/py_data/kobe_data/kobe_playoff_.csv')
df_r.head()

	赛季	结果	出场时间	投篮命中率	投篮命中	投篮出手	三分命中率	三分命中	三分出手	...	篮板	前场	后场	助攻	盖帽	失误	犯规	得分	场次
0	96-97	1	6	0.000	0	1	NaN	0	0	...	1	0	1	0	1	1	1	0	1
1	96-97	1	3	0.000	0	1	NaN	0	0	...	0	0	0	0	0	1	0	1	2
2	96-97	0	7	0.667	2	3	0.500	1	2	...	0	0	0	0	0	3	0	5	3
3	96-97	0	17	0.375	3	8	0.667	2	3	...	3	0	3	0	1	0	3	10	4
4	96-97	1	8	0.000	0	3	NaN	0	0	...	3	1	2	1	0	0	0	2	5

5 rows × 23 columns

1、科比职业生涯评价

科比职业生涯绵长，有整整20年，那么在这20年的职业生涯中，哪些赛季是他的生涯巅峰，哪个赛季又开始不负当年勇，他的命中率是否真如人们调侃的那般“铁”,科比输给最多的球队又是哪支呢？接下来我们用数据说话。

import warnings
warnings.filterwarnings('ignore')
from matplotlib import pyplot as plt
%matplotlib inline
plt.rcParams['font.sans-serif']=['SimHei']   #加载本地字体以显示中文

# 按序排列的赛季序列
df_index = list(df_r['赛季'])
session_list = list(set(df_index))
session_list.sort(key=df_index.index)

# 计算科比的常规赛和季后赛胜率
win_r_rate = len(df_r[df_r['结果']==1])/len(df_r)
win_o_rate = len(df_o[df_o['结果']==1])/len(df_o)
print(win_r_rate,win_o_rate)

0.6210995542347697 0.6136363636363636

# 计算各赛季的胜率
win_r_single_rate = []
for session in session_list:
    rate = df_r.groupby(by=['赛季','结果'],sort=False).count().loc[session,1][0]/df_r.groupby(by=['赛季'],sort=False).count().loc[session,:][0]
    win_r_single_rate.append(rate)
# win_r_single_rate

win_o_single_rate = []
for session in session_list:
    if session in ['04-05','12-13','13-14','14-15','15-16']:    #该赛季未进季后赛
        win_o_single_rate.append(0)
    else:
        rate = df_o.groupby(by=['赛季','结果'],sort=False).count().loc[session,1][0]/df_o.groupby(by=['赛季'],sort=False).count().loc[session,:][0]
        win_o_single_rate.append(rate)
# win_o_single_rate

# 绘图查看科比职业生涯的胜率变化
fig, ax = plt.subplots(figsize=(10,5))
ax.plot(session_list,win_r_single_rate,'.-',label='常规赛胜率')
ax.plot(session_list,len(session_list)*[win_r_rate],'r',label='生涯胜率_常')
ax.plot(session_list,win_o_single_rate,'.-',label='季后赛胜率')
ax.plot(session_list,len(session_list)*[win_o_rate],label='生涯胜率_后')
ax.set_xlabel('赛季')
ax.set_ylabel('胜率')
plt.legend()

科比的常规赛胜率和季后赛胜率趋势基本保持一致。
以常规赛职业生涯胜率为基准的话，可将科比的职业生涯大致分为4个阶段，见下表。

赛季	96-04	04-07	07-12	12-16
Kobe	人生得意	短暂低潮	王者归来	英雄落寞

而季后赛的胜率则能明显说明湖人的两次王朝，分别为99-02赛季和08-10赛季（07-08赛季总决赛折戟波斯顿）

# 计算出勤率
import numpy as np
attendance = []
for session in session_list:
    if session=='98-99':
        rate = df_r.groupby(by=['赛季'],sort=False).count().loc[session,:][0]/50
    elif session == '11-12':
        rate = df_r.groupby(by=['赛季'],sort=False).count().loc[session,:][0]/66
    else:
        rate = df_r.groupby(by=['赛季'],sort=False).count().loc[session,:][0]/82
    attendance.append(rate)
attendance_mean = np.array(attendance).mean()
# attendance
attendance_mean

0.8488174427198816

fig,ax = plt.subplots(figsize=(10,5))
ax.plot(session_list,attendance,'-o',label='赛季出勤')
ax.plot(session_list,len(session_list)*[attendance_mean],label='生涯出勤',)

[]

NBA在1967-68赛季最终将一个赛季的常规赛场次定为82场，一直沿袭至今，仅98-99，11-12赛季因劳资纠纷，赛季缩水至分别只有50场和66场比赛。
科比的出勤率在整个职业生涯中一直较高，常规赛平均出勤率高达85%，可能也正是这样的高出勤率最终导致了13-14赛季的大伤，也正是经历了这次大伤，科比再也未能重现荣光。

# 合并常规赛和季后赛的数据，方便可视化展示
df_all = pd.concat([df_r.drop(['首发'],axis=1),df_o],keys=['常规赛','季后赛'])
df_all.index.names = ['类型','x']
df_all = df_all.reset_index(['类型','x']).drop('x',axis=1)

import seaborn as sns

fig,ax = plt.subplots(3,1,figsize=(12,18))
pos = list(range(len(session_list)))

sns.boxplot(x='赛季',y='投篮命中率',hue='类型',data=df_all,ax=ax[0],palette="Set3")
sns.boxplot(x='赛季',y='三分命中率',hue='类型',data=df_all,ax=ax[1],palette="Set3")
sns.boxplot(x='赛季',y='罚球命中率',hue='类型',data=df_all,ax=ax[2],palette="Set3")

plt.show()

科比常规赛和季后赛命中率基本相差不大，但可以明显看出科比的三分球稳定性较差，这也可能是科比常被球迷调侃“铁”的原因之一吧。

import warnings
warnings.filterwarnings('ignore')
import seaborn as sns
from matplotlib import pyplot as plt
%matplotlib inline

# 确定球队的顺序
df_r_score = pd.read_csv('G:/py_data/kobe_data/df_r_score.csv')
order = df_r_score.groupby(by='对手').count()['果'].sort_values(ascending=False).index

df_all.head()

	Unnamed: 0	all
对手
76人	32	32
公牛	31	31
凯尔特	31	31
勇士	67	67
国王	64	64

# 计算对每只球队的胜率
df_win = df_r_score[df_r_score['果']==1].groupby(by='对手').count().drop(['湖人得分','对手得分'],axis=1).drop(['Unnamed: 0'],axis=1).rename(columns={
     '果':'win'})
df_all = df_r_score.groupby(by='对手').count().drop(['湖人得分','对手得分'],axis=1).drop(['Unnamed: 0'],axis=1).rename(columns={
     '果':'all'})
df_rate = df_win.join([df_all])
df_rate['rate'] = df_rate['win']/df_rate['all']

my_order = list(order)
df_rate.index = pd.CategoricalIndex(df_rate.index,categories=my_order,ordered=True)
pd.CategoricalIndex(df_rate.index,categories=my_order,ordered=True)
df_rate = df_rate.sort_index()

# 可视化展示
fig,ax = plt.subplots(2,1,figsize=(16,12))
sns.countplot(x='对手',data=df_r_score,color='gold',label='lose',order=order,ax=ax[0])
sns.countplot(x='对手',data=df_r_score[df_r_score['果']==1],color='purple',label='win',order=order,ax=ax[0])
ax[0].legend()
sns.barplot(my_order,df_rate['rate'],ax=ax[1],color='purple')

df_rate[df_rate['rate']<0.5]['rate'].sort_values()

对手
鹈鹕     0.333333
马刺     0.409836
雷霆     0.454545
开拓者    0.483871
热火     0.484848
Name: rate, dtype: float64

以上32只队伍中，超音速为雷霆的前身，鹈鹕为黄蜂前身，子弹为奇才前身。
通过上图可以很明显看出，与西部球队的较量多于东部球队，这也是由于nba赛程设定导致的。而科比对阵过最多的球队竟然是同城的快船，洛城的球迷应该很幸福吧。
而在这15只西部球队中，战胜湖人最多的球队分别是马刺、雷霆和开拓者，嗯，就是波波维奇的那个马刺！

2、赛季时间序列模型预测

鉴于科比职业生涯前期较高的出勤率，仅在生涯末期的两个赛季出勤率较低，因此是否可以利用前期数据建立时间预测模型，来预测如果科比没有大伤的情况下，最后三个赛季的表现如何呢？
另外由于98-99和11-12赛季缩水，因此直接丢弃这两个赛季的数据。

games = pd.DataFrame(df_r.groupby(by=['赛季'],sort=False).count().iloc[:,0])
games.columns=['场次']
# games.sort_values('场次',ascending=False)

# 插入数据
import random
miss = df_r.loc[0]
miss['得分'] = np.nan   # 需要插入的缺失数据
df_r_insert = df_r.copy()
for session in session_list:
    miss['赛季'] = session
    k = 82- games.loc[session][0]
    insert_index = random.choices(df_r_insert[df_r_insert['赛季']==session].index,k=k)
    df_values = np.insert(df_r_insert.values,insert_index,miss,axis=0)
    df_r_insert = pd.DataFrame(df_values,columns=df_r_insert.columns)

#df_r_insert.groupby(by=['赛季']).count()[0]   #查看是否插入正确

df_r_insert.shape

(1640, 23)

date = pd.date_range('1996','2016',periods=82*20)  # 添加时间索引
df_r_insert.set_index(date,inplace=True)

session_drop = ['98-99','11-12','13-14','14-15','15-16']  #需要删除的赛季数据
df_r_drop = df_r_insert[-df_r_insert.赛季.isin(session_drop)]

df_r_drop.shape

(1230, 23)

# 生成标准数据
df_r_drop = df_r_drop.reset_index().rename(columns={
     'index':'时间'})
data = df_r_drop[['时间','得分']]
data.columns=['ds','y']
data.head()

	ds	y
0	1996-01-01 00:00:00.000000000	0
1	1996-01-05 10:58:03.587553408	1
2	1996-01-09 21:56:07.175106816	5
3	1996-01-14 08:54:10.762660096	10
4	1996-01-18 19:52:14.350213504	2

365/82

4.451219512195122

import fbprophet
from fbprophet.plot import add_changepoints_to_plot
model = fbprophet.Prophet()

model.fit(data)
future = model.make_future_dataframe(periods=82*3,freq='4.45D')
forcast = model.predict(future)

INFO:fbprophet:Disabling daily seasonality. Run prophet with daily_seasonality=True to override this.

from fbprophet.plot import add_changepoints_to_plot

fig = model.plot(forcast)
a = add_changepoints_to_plot(fig.gca(),model,forcast)

利用prophet对科比得分数据进行拟合预测，发现其职业生涯的两个状态拐点，分别为99-00赛季和05-06赛季，其中99-00赛季开启了科比的第一个三连冠，而05-06赛季则是“鲨鱼”东游后第二个赛季，科比逐渐适应了一个人扛起一支队伍的使命，仅从得分来说，此时已是科比的巅峰(单场得分记录在这一赛季也较多)。

# 对比13-14，14-15，15-16赛季的预测数据与真实数据
score_f = []
str = ['2013','2014','2015','2016']
for i in range(3):
    score_f.append(forcast[(forcast['ds']>str[i])&(forcast['ds']<str[i+1])]['yhat'].mean())

score_a = []
periods = ['13-14','14-15','15-16']
for i in range(3):
    score_a.append(df_r[df_r['赛季']==periods[i]]['得分'].mean())
print(score_a)
print(score_f)

[13.833333333333334, 22.34285714285714, 17.59090909090909]
[24.85394505977496, 24.066417125054304, 23.376864986074708]

from matplotlib import pyplot as plt
%matplotlib inline
fig,ax = plt.subplots(figsize=(12,6))
ax.plot(periods,score_f,'o-',label='预测')
ax.plot(periods,score_a,'*-',label='实际')
ax.set_xlabel('赛季')
ax.set_ylabel('得分')
plt.legend()

科比在经历了大伤之后，状态下滑，但根据健康时期的数据，我们预测科比最后三个赛季，仍可保持场均24分左右，而实际上科比在14-15赛季在出勤率将近5成的情况下，场均得分为22.3分，15-16赛季则下滑严重，场均得分为17.6分。不禁让人遐想如果没有伤病，科比会不会再征战几个赛季呢？

3、比赛结果预测

由于比赛结果只有两种，因此尝试使用支持向量机进行建模。
输入数据包括篮板、助攻、抢断、盖帽、失误、犯规、得分、出场时间、投篮命中率、三分命中率和罚球命中率，并做归一化处理。

# 归一化
def max_min_scaler(x): return (x-np.min(x))/(np.max(x)-np.min(x))

df_min_max = df_r[['篮板','助攻','抢断','盖帽','失误','犯规','得分','出场时间','投篮命中率','三分命中率','罚球命中率']].apply(max_min_scaler)
target = pd.DataFrame(df_r['结果'])

df_min_max = df_min_max.join(target).dropna()  #删除缺失数据

# 数据集分类
from sklearn.model_selection import train_test_split
X_train,X_test,y_train,y_test = train_test_split(df_min_max.iloc[:,:-1],df_min_max.iloc[:,-1],test_size=0.3,random_state=10)

# 建立SVM模型
import warnings
warnings.filterwarnings('ignore')
from sklearn.svm import SVC
model_svc = SVC(C=10000)
model_svc.fit(X_train,y_train)

SVC(C=10000, cache_size=200, class_weight=None, coef0=0.0,
  decision_function_shape='ovr', degree=3, gamma='auto', kernel='rbf',
  max_iter=-1, probability=False, random_state=None, shrinking=True,
  tol=0.001, verbose=False)

from sklearn.metrics import accuracy_score

# 训练集的正确率
y_train_a = model_svc.predict(X_train)
accuracy_score(y_train,y_train_a)

0.7785714285714286

# 测试集的正确率
model_svc.score(X_test,y_test)

0.6833333333333333

# 测试集的预测结果
model_svc.predict(X_test)

array([1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 0, 1,
       0, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 0, 0, 0,
       0, 1, 0, 1, 1, 0, 1, 0, 1, 1, 1, 0, 1, 1, 0, 0, 1, 0, 1, 1, 0, 1,
       0, 1, 0, 1, 0, 0, 0, 1, 1, 0, 0, 1, 1, 0, 1, 1, 1, 1, 0, 0, 1, 1,
       1, 0, 0, 1, 0, 1, 1, 0, 0, 0, 1, 1, 1, 0, 1, 1, 0, 0, 1, 1, 0, 1,
       1, 1, 0, 0, 1, 1, 1, 0, 1, 1, 1, 0, 0, 1, 1, 0, 0, 1, 0, 1, 1, 1,
       1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1,
       1, 1, 0, 1, 0, 1, 0, 1, 1, 1, 0, 0, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1,
       1, 0, 1, 1, 1, 1, 0, 0, 0, 1, 1, 1, 0, 1, 1, 0, 0, 1, 1, 0, 1, 1,
       1, 0, 0, 1, 0, 0, 1, 1, 1, 1, 1, 0, 0, 0, 1, 0, 1, 1, 0, 1, 1, 0,
       1, 1, 0, 1, 0, 0, 1, 0, 0, 0, 0, 0, 0, 1, 1, 1, 0, 1, 1, 0, 1, 0,
       1, 1, 0, 1, 0, 1, 1, 1, 1, 0, 1, 0, 1, 0, 0, 0, 0, 0, 0, 1, 1, 1,
       1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 1,
       0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1,
       1, 1, 1, 1, 0, 1, 1, 0, 0, 0, 1, 1, 1, 1, 1, 1, 0, 1, 0, 0, 1, 1,
       1, 1, 0, 1, 1, 0, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1,
       0, 1, 0, 1, 1, 0, 0, 1], dtype=int64)

利用SVM对数据拟合，预测效果较差，测试集的正确率在60%-70%左右，看来仅用科比的数据来预测球队的胜负还是不太合理，尽管核心球员的确可能影响比赛结果，但篮球是10个人的运动，毕竟科比输的最多的球队可是马刺啊。

四、总结

1、科比的职业生涯大致可以分为四个阶段，而他的巅峰赛季在第三个阶段的05-06赛季。

2、如果科比未在生涯末期经历大伤，他的最后三个赛季的场均得分可达24分（奇妙的数字）左右。

3、利用科比的个人数据来预测比赛结果有待商榷。

你可能感兴趣的:(Data-Analysis,数据分析)

Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
Python数据分析与可视化 jun778895 python 数据分析开发语言
Python数据分析与可视化是一个涉及数据处理、分析和以图形化方式展示数据的过程，它对于数据科学家、分析师以及任何需要从数据中提取洞察力的专业人员来说至关重要。以下将详细探讨Python在数据分析与可视化方面的应用，包括常用的库、数据处理流程、可视化技巧以及实际应用案例。一、Python数据分析与可视化的重要性数据可视化是将数据以图形或图像的形式表示出来，以便人们能够更直观地理解数据背后的信息和规
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
python读写CSV文件 bcbobo21cn .Net python 开发语言机器学习 CSV
做数据分析，有时候要分析的数据在CSV文件里；先看一下python读写CSV文件；importpandasaspddf=pd.read_csv('test1.csv')print(df)print('')print(df.head(2))companyname=["A1","B2","E3","F4"]legperson=["lier","yanqi","wangwu","zhangsan"]le
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
在服务器计算节点中使用 jupyter Lab ranshan567 程序人生
JupyterLab是一个基于网页的交互式开发环境,用于科学计算、数据分析和机器学.jupyterlab是jupyternotebook的下一代产品,集成了更多功能,使用起来更方便.在进行数据分析及可视化时，个人电脑不能满足大数据的分析需求，就需要用到高性能计算机集群资源，然而计算机集群的计算节点往往没有联网功能，所以在计算机集群中使用jupyterLab需要进行一些配置。具体的步骤如下：
大数据真实面试题---SQL The博宇大数据面试题——SQL 大数据 mysql sql 数据库 big data
视频号数据分析组外包招聘笔试题时间限时45分钟完成。题目根据3张表表结构，写出具体求解的SQL代码（搞笑品类定义：视频分类或者视频创建者分类为“搞笑”）1、表创建语句：createtablet_user_video_action_d(dsint,user_idstring,video_idstring,action_typeint,`timestamp`bigint)rowformatdelimi
python数据分析知识点大全编程零零七 python数据分析 python 开发语言 python数据分析数据分析知识点大全 python数据分析知识点 python教程 python基础
Python数据分析知识点大全可以归纳为以下几个主要方面：一、基础概念与目的数据分析定义：数据分析是指用适当的统计分析方法对收集来的大量数据进行分析，提取有用信息和形成结论，对数据加以详细研究和概括总结的过程。其目的在于从数据中挖掘规律、验证猜想、进行预测。Python在数据分析中的优势：Python因其易学性、快速开发、丰富的扩展库（如NumPy、Pandas等）和成熟的框架，成为数据分析领域的
数据分析-24-时间序列预测之基于keras的VMD-LSTM和VMD-CNN-LSTM预测风速皮皮冰燃数据分析数据分析
文章目录1普通的LSTM模型1.1数据重采样1.2数据标准化1.3切分窗口1.4划分数据集1.5建立模型1.6预测效果2VMD-LSTM模型2.1VMD分解时间序列2.2对每一个IMF建立LSTM模型2.2.1IMF1—LSTM2.2.2IMF2-LSTM2.2.3统一代码2.3评估效果3CNN-LSTM模型3.1数据预处理3.2建立模型3.3效果预测4VMD-CNN-LSTM模型4.1VMD分解
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
【数字化供应链】数字化供应链架构、全景管理、全流程贯通方案数字化建设方案数字化转型数据治理主数据数据仓库供应链数字仓储智慧物流智慧仓储物流园区架构微服务数据挖掘大数据人工智能
原文《数字化供应链架构、全景管理、全流程贯通方案》PPT格式。主要从供应链管理全景、智慧供应链建设总体目标、供应链总体业务流程、供应链总体功能架构、供应链总体技术架构、供应链全流程贯通、供应链全领域管理、供应链数据数据分析、供应链决策中台等进行建设。本文仅对主要内容进行介绍。来源网络公开渠道，旨在交流学习，如有侵权联系速删，更多参考公众号：优享智库基于先进IT技术、大数据能力、物联网应用、区块链平
OmicsTools除b站教学视频外已整理的零代码生信全流程分析文档邢博士谈科教医学科研生信分析 r语言数据可视化数据挖掘数据分析生信医学生信分析
OmicsTools软件介绍和下载安装配置软件简介我开发了一款本地电脑无限使用的零代码生信数据分析作软图神器电脑软件OmicsTools，欢迎大家使用OmicsTools进行生物医学科研数据分析和作图，该软件件能让大家在不需要任何编程和代码编写的基础上，分析次数没有限制，可以无限使用，让您在自己电脑上快速进行大量的生信分析和加速大家的科研。OmicsTools生信分析电脑软件可以做医学生物生信各个
【数据分析】利用Python+AI+工作流实现自动化数据分析-全流程讲解 z千鑫 AI领域 FLASK基础 Python基础人工智能数据分析 python AI编程 AI工作流 ai 自动化
文章目录一、为什么要用AI进行自动化分析？二、AI自动化分析场景三、编写Python脚本示例1、用flask实现让AI分析数据内容使用说明：示例2、用定时任务的方式，定时处理AI数据代码说明四、把AI分析的数据，放到AI工作流中做展示五、openAI的key结尾在信息爆炸的时代，如何快速获取有价值的洞察力成为了各行各业的迫切需求。传统的内容分析方法往往又耗时又费力，并且难以满足快速变化的市场需求。
Mall4j商城实战 - 部署 canal 数据库增量日志解析 yueerba126 Mall4j商城实战数据库 spring cloud 微服务架构
Canal简介Canal是基于MySQL数据库增量日志解析的工具，主要用于增量数据的订阅和消费。Canal主要用途基于MySQL数据库增量日志解析详细功能：实时解析MySQL的二进制日志（Binlog）。捕获数据库中的所有增量变更，如插入、更新和删除操作。使用场景：适用于实时监控数据库变化的应用，比如数据复制、数据备份或实时数据分析等。提供增量数据订阅和消费服务
大数据新视界 --大数据大厂之揭秘大数据时代 Excel 魔法：大厂数据分析师进阶秘籍青云交大数据新视界 Excel 数据分析函数公式数据透视表图表功能规划求解数据分析工具库大数据新视界数据库
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：Ja
Rust: duckdb和polars读csv文件比较 songroom rust 开发语言后端
duckdb在数据分析上，有非常多不错的特质。1、快；2、客户体验好，特别是可以同时批量读csv（在一个目录下的csv等文件）。polars的性能比pandas有非常多的超越。但背后的一些基于arrow的技术栈有很多相同之类。今天想比较一下两者在csv数据读写的情况。一、文件准备csv样本内容，是N行9列的csv标准格式，有字符串，有浮点数，有整型。具体如下：本次准备了两个csv文件，一个大约是2
chatgpt赋能python：如何在Python中计算平均值 tulingtest ChatGpt python chatgpt numpy 计算机
如何在Python中计算平均值计算平均值是数据分析、统计和机器学习等许多领域中的常见任务。Python作为一门功能强大且易于学习的编程语言，为计算平均值提供了多种方法。在本文中，我们将介绍如何在Python中计算平均值。什么是平均值简单来说，平均值是一组数字的总和除以数字的数量。例如，对于数字序列1，3，5，7，9，平均值是(1+3+5+7+9)/5=5。平均值在数据分析中非常有用，因为它可以提供
python基于django/flask的NBA球员大数据分析与可视化python+java+node.js QQ_511008285 python django flask java spring boot 数据分析
前端开发框架:vue.js数据库mysql版本不限后端语言框架支持：1java(SSM/springboot)-idea/eclipse2.Nodejs+Vue.js-vscode3.python(flask/django)--pycharm/vscode4.php(thinkphp/laravel)-hbuilderx数据库工具：Navicat/SQLyog等都可以本文针对NBA球员的大数据进行
Java基于spring boot的国产电影数据分析与可视化python+java+node.js QQ_511008285 java spring boot 数据分析 python django vue.js flask
前端开发框架:vue.js数据库mysql版本不限后端语言框架支持：1java(SSM/springboot)-idea/eclipse2.Nodejs+Vue.js-vscode3.python(flask/django)--pycharm/vscode4.php(thinkphp/laravel)-hbuilderx数据库工具：Navicat/SQLyog等都可以该系统使用进行大数据处理和
Python最全的股票数据API接口 w_traveler python 开发语言大数据
python最全的股票数据API接口使用python是一种有效的方式来获取高频股票数据，以便进行股票行情数据分析和量化交易。python是一种广泛应用于金融数据领域的编程语言，可用于与股票数据API接口进行交互。通过调用股票数据API接口，我们可以获取实时的股票数据，包括tick数据和k线历史数据。tick数据提供了每次交易的详细信息，而k线历史数据则提供了一段时间内港股、美股、A股、沪深行情数据
R 地图绘制-比例尺与指北针 jamesjin63
ggplot绘制mapR语言可以进行数据分析，也可以进行地图绘制，而且非常简洁，快速。虽然Arcgis基于桌面可视化操作，能够进行空间分析，但是唯一不足的就是操作步骤繁琐而且一不小心，就要从头再来，可重复性较低。这篇文章主要讲述如何利用R语言中的ggplot与sf绘制带有指北针、图列与标尺的地图屏幕快照2020-06-28下午9.27.59.png数据我们下载非洲地区54个国家的图层Afirca.
什么是AIGC？有哪些免费工具？ chent_某位 AIGC
AIGC（AIGeneratedContent），即“人工智能生成内容”，是指通过人工智能技术自动生成各种类型的数字内容。AIGC让机器能够根据输入的信息或数据生成符合人类需求的文本、图像、音频、视频等内容，极大提高了内容创作的效率。AIGC的背景与起源随着深度学习和自然语言处理技术的快速发展，人工智能已经不再局限于简单的任务，如分类、预测和数据分析，而是具备了生成内容的能力。生成式AI模型，如O
新质农业-再生农业的应用橙蜂智农人工智能制造创业创新
橙蜂智能公司致力于提供先进的人工智能和物联网解决方案，帮助企业优化运营并实现技术潜能。公司主要服务包括AI数字人、AI翻译、埃域知识库、大模型服务等。其核心价值观为创新、客户至上、质量、合作和可持续发展。橙蜂智农的智慧农业产品涵盖了多方面的功能，如智能化推荐、数据分析、远程监控和决策支持系统。用户可以通过应用获得个性化的作物种植建议、实时的生长状态监控以及精确的灌溉和施肥指导，提升农业生产效率。文
利用发电量和气象数据分析来判断光伏仿真系统的准确性鹧鸪云光伏与储能软件开发数据分析数据挖掘光伏发电大数据光伏新能源
随着光伏产业的迅速发展，光伏仿真系统通过集成气象数据分析、发电量分析、投融资分析及损耗估算等功能，为光伏项目的全生命周期管理提供了科学依据。光伏仿真系统集成了气象数据分析、发电量预测、投融资分析、损耗估算及光伏设计等功能。其中，气象数据分析是仿真系统的基石，通过整合权威的气象数据（如Meteonorm、Nasa等），模拟光伏电站所在区域的历史气象条件及未来气象预测。基于这些气象数据，发电量分析功能
Java常用排序算法/程序员必须掌握的8大排序算法 cugfy java
分类： 1）插入排序（直接插入排序、希尔排序） 2）交换排序（冒泡排序、快速排序） 3）选择排序（直接选择排序、堆排序） 4）归并排序 5）分配排序（基数排序）所需辅助空间最多：归并排序所需辅助空间最少：堆排序平均速度最快：快速排序不稳定：快速排序，希尔排序，堆排序。先来看看8种排序之间的关系： 1.直接插入排序（1
【Spark102】Spark存储模块BlockManager剖析 bit1129 manager
Spark围绕着BlockManager构建了存储模块，包括RDD，Shuffle，Broadcast的存储都使用了BlockManager。而BlockManager在实现上是一个针对每个应用的Master/Executor结构，即Driver上BlockManager充当了Master角色，而各个Slave上(具体到应用范围，就是Executor)的BlockManager充当了Slave角色
linux 查看端口被占用情况详解 daizj linux 端口占用 netstat lsof
经常在启动一个程序会碰到端口被占用，这里讲一下怎么查看端口是否被占用，及哪个程序占用，怎么Kill掉已占用端口的程序 1、lsof -i:port port为端口号 [root@slave /data/spark-1.4.0-bin-cdh4]# lsof -i:8080 COMMAND PID USER FD TY
Hosts文件使用周凡杨 hosts locahost
一切都要从localhost说起，经常在tomcat容器起动后，访问页面时输入http://localhost:8088/index.jsp，大家都知道localhost代表本机地址，如果本机IP是10.10.134.21，那就相当于http://10.10.134.21:8088/index.jsp，有时候也会看到http: 127.0.0.1:
java excel工具 g21121 Java excel
直接上代码，一看就懂，利用的是jxl： import java.io.File; import java.io.IOException; import jxl.Cell; import jxl.Sheet; import jxl.Workbook; import jxl.read.biff.BiffException; import jxl.write.Label; import
web报表工具finereport常用函数的用法总结（数组函数）老A不折腾 finereport web报表函数总结
ADD2ARRAY ADDARRAY(array,insertArray, start):在数组第start个位置插入insertArray中的所有元素，再返回该数组。示例： ADDARRAY([3,4, 1, 5, 7], [23, 43, 22], 3)返回[3, 4, 23, 43, 22, 1, 5, 7]. ADDARRAY([3,4, 1, 5, 7], "测试&q
游戏服务器网络带宽负载计算墙头上一根草服务器
家庭所安装的4M，8M宽带。其中M是指，Mbits/S 其中要提前说明的是： 8bits = 1Byte 即8位等于1字节。我们硬盘大小50G。意思是50*1024M字节，约为 50000多字节。但是网宽是以“位”为单位的，所以，8Mbits就是1M字节。是容积体积的单位。 8Mbits/s后面的S是秒。8Mbits/s意思是每秒8M位，即每秒1M字节。我是在计算我们网络流量时想到的
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans Spring 3 系列
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
高性能mysql 之选择存储引擎(一) annan211 mysql InnoDB MySQL引擎存储引擎
1 没有特殊情况，应尽可能使用InnoDB存储引擎。原因：InnoDB 和 MYIsAM 是mysql 最常用、使用最普遍的存储引擎。其中InnoDB是最重要、最广泛的存储引擎。她被设计用来处理大量的短期事务。短期事务大部分情况下是正常提交的，很少有回滚的情况。InnoDB的性能和自动崩溃恢复特性使得她在非事务型存储的需求中也非常流行，除非有非常
UDP网络编程百合不是茶 UDP编程局域网组播
UDP是基于无连接的,不可靠的传输与TCP/IP相反 UDP实现私聊,发送方式客户端,接受方式服务器 package netUDP_sc; import java.net.DatagramPacket; import java.net.DatagramSocket; import java.net.Ine
JQuery对象的val()方法执行结果分析 bijian1013 JavaScript js jquery
JavaScript中，如果id对应的标签不存在（同理JAVA中，如果对象不存在），则调用它的方法会报错或抛异常。在实际开发中，发现JQuery在id对应的标签不存在时，调其val()方法不会报错，结果是undefined。
http请求测试实例（采用json-lib解析） bijian1013 json http
由于fastjson只支持JDK1.5版本，因些对于JDK1.4的项目，可以采用json-lib来解析JSON数据。如下是http请求的另外一种写法，仅供参考。 package com; import java.util.HashMap; import java.util.Map; import
【RPC框架Hessian四】Hessian与Spring集成 bit1129 hessian
在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中介绍了基于Hessian的RPC服务的实现步骤，在那里使用Hessian提供的API完成基于Hessian的RPC服务开发和客户端调用，本文使用Spring对Hessian的集成来实现Hessian的RPC调用。定义模型、接口和服务器端代码 |---Model &nb
【Mahout三】基于Mahout CBayes算法的20newsgroup流程分析 bit1129 Mahout
1.Mahout环境搭建 1.下载Mahout http://mirror.bit.edu.cn/apache/mahout/0.10.0/mahout-distribution-0.10.0.tar.gz 2.解压Mahout 3. 配置环境变量 vim /etc/profile export HADOOP_HOME=/home
nginx负载tomcat遇非80时的转发问题 ronin47
　　nginx负载后端容器是tomcat（其它容器如WAS,JBOSS暂没发现这个问题）非８０端口，遇到跳转异常问题。解决的思路是：$host:port 详细如下：　　该问题是最先发现的，由于之前对nginx不是特别的熟悉所以该问题是个入门级别的： ? 1 2 3 4 5
java-17-在一个字符串中找到第一个只出现一次的字符 bylijinnan java
public class FirstShowOnlyOnceElement { /**Q17.在一个字符串中找到第一个只出现一次的字符。如输入abaccdeff，则输出b * 1.int[] count:count[i]表示i对应字符出现的次数 * 2.将26个英文字母映射：a-z <--> 0-25 * 3.假设全部字母都是小写 */ pu
mongoDB 复制集开窍的石头 mongodb
mongo的复制集就像mysql的主从数据库，当你往其中的主复制集(primary)写数据的时候，副复制集(secondary)会自动同步主复制集(Primary)的数据,当主复制集挂掉以后其中的一个副复制集会自动成为主复制集。提供服务器的可用性。和防止当机问题 mo
[宇宙与天文]宇宙时代的经济学 comsci 经济
宇宙尺度的交通工具一般都体型巨大，造价高昂。。。。。在宇宙中进行航行，近程采用反作用力类型的发动机，需要消耗少量矿石燃料，中远程航行要采用量子或者聚变反应堆发动机，进行超空间跳跃，要消耗大量高纯度水晶体能源以目前地球上国家的经济发展水平来讲，
Git忽略文件 Cwind git
有很多文件不必使用git管理。例如Eclipse或其他IDE生成的项目文件，编译生成的各种目标或临时文件等。使用git status时，会在Untracked files里面看到这些文件列表，在一次需要添加的文件比较多时（使用git add . / git add -u），会把这些所有的未跟踪文件添加进索引。 ==== ==== ==== 一些牢骚
MySQL连接数据库的必须配置 dashuaifu mysql 连接数据库配置
MySQL连接数据库的必须配置 1.driverClass：com.mysql.jdbc.Driver 2.jdbcUrl：jdbc:mysql://localhost:3306/dbname 3.user：username 4.password：password 其中1是驱动名；2是url，这里的‘dbna
一生要养成的60个习惯 dcj3sjt126com 习惯
一生要养成的60个习惯第1篇让你更受大家欢迎的习惯 1 守时，不准时赴约,让别人等,会失去很多机会。如何做到： ①该起床时就起床， ②养成任何事情都提前15分钟的习惯。 ③带本可以随时阅读的书，如果早了就拿出来读读。 ④有条理，生活没条理最容易耽误时间。 ⑤提前计划：将重要和不重要的事情岔开。 ⑥今天就准备好明天要穿的衣服。 ⑦按时睡觉，这会让按时起床更容易。 2 注重
[介绍]Yii 是什么 dcj3sjt126com PHP yii2
Yii 是一个高性能，基于组件的 PHP 框架，用于快速开发现代 Web 应用程序。名字 Yii （读作易）在中文里有“极致简单与不断演变”两重含义，也可看作 Yes It Is! 的缩写。 Yii 最适合做什么？ Yii 是一个通用的 Web 编程框架，即可以用于开发各种用 PHP 构建的 Web 应用。因为基于组件的框架结构和设计精巧的缓存支持，它特别适合开发大型应
Linux SSH常用总结 eksliang linux ssh SSHD
转载请出自出处：http://eksliang.iteye.com/blog/2186931 一、连接到远程主机格式： ssh name@remoteserver 例如： ssh [email protected] 二、连接到远程主机指定的端口格式： ssh name@remoteserver -p 22 例如： ssh i
快速上传头像到服务端工具类FaceUtil gundumw100 android
快速迭代用 import java.io.DataOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOExceptio
jQuery入门之怎么使用 ini JavaScript html jquery Web css
jQuery的强大我何问起（个人主页：hovertree.com）就不用多说了，那么怎么使用jQuery呢？首先，下载jquery。下载地址：http://hovertree.com/hvtart/bjae/b8627323101a4994.htm，一个是压缩版本，一个是未压缩版本，如果在开发测试阶段，可以使用未压缩版本，实际应用一般使用压缩版本(min)。然后就在页面上引用。
带filter的hbase查询优化 kane_xie 查询优化 hbase RandomRowFilter
问题描述 hbase scan数据缓慢，server端出现LeaseException。hbase写入缓慢。问题原因直接原因是： hbase client端每次和regionserver交互的时候，都会在服务器端生成一个Lease,Lease的有效期由参数hbase.regionserver.lease.period确定。如果hbase scan需
java设计模式-单例模式 men4661273 java 单例枚举反射 IOC
单例模式1，饿汉模式 //饿汉式单例类.在类初始化时，已经自行实例化 public class Singleton1 { //私有的默认构造函数 private Singleton1() {} //已经自行实例化 private static final Singleton1 singl
mongodb 查询某一天所有信息的3种方法，根据日期查询 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
// mongodb的查询真让人难以琢磨，就查询单天信息，都需要花费一番功夫才行。 // 第一种方式： coll.aggregate([ {$project:{sendDate: {$substr: ['$sendTime', 0, 10]}, sendTime: 1, content:1}}, {$match:{sendDate: '2015-
二维数组转换成JSON tangqi609567707 java 二维数组 json
原文出处：http://blog.csdn.net/springsen/article/details/7833596 public class Demo { public static void main(String[] args) { String[][] blogL
erlang supervisor wudixiaotie erlang
定义supervisor时，如果是监控celuesimple_one_for_one则删除children的时候就用supervisor:terminate_child (SupModuleName, ChildPid)，如果shutdown策略选择的是brutal_kill，那么supervisor会调用exit(ChildPid, kill)，这样的话如果Child的behavior是gen_