小黄油块跑

机器学习（三）：基于LightGBM的分类预测

LightGBM介绍

LightGBM是2017年由微软推出的可扩展机器学习系统，是微软旗下DMKT的一个开源项目，由2014年首届阿里巴巴大数据竞赛获胜者之一柯国霖老师带领开发。它是一款基于GBDT（梯度提升决策树）算法的分布式梯度提升框架，为了满足缩短模型计算时间的需求，LightGBM的设计思路主要集中在减小数据对内存与计算性能的使用，以及减少多机器并行计算时的通讯代价。

LightGBM可以看作是XGBoost的升级豪华版，在获得与XGBoost近似精度的同时，又提供了更快的训练速度与更少的内存消耗。

LightGBM的主要优点：

简单易用。提供了主流的Python\C++\R语言接口，用户可以轻松使用LightGBM建模并获得相当不错的效果。
高效可扩展。在处理大规模数据集时高效迅速、高准确度，对内存等硬件资源要求不高。
鲁棒性强。相较于深度学习模型不需要精细调参便能取得近似的效果。
LightGBM直接支持缺失值与类别特征，无需对数据额外进行特殊处理

LightGBM的主要缺点：

相对于深度学习模型无法对时空位置建模，不能很好地捕获图像、语音、文本等高维数据。
在拥有海量训练数据，并能找到合适的深度学习模型时，深度学习的精度可以遥遥领先LightGBM。

ps：

安装LightGBM，详见https://lightgbm.readthedocs.io/en/latest/Installation-Guide.html
这个网页介绍了使用lightgbm的两种形式：原生形式(import lightgbm as lgb)和Sklearn接口形式(from lightgbm import LGBMRegressor, LGBMClassifier)具体可查看https://www.cnblogs.com/chenxiangzhen/p/10894306.html
原生形式中可以使用lgb.cv做交叉验证选参数，但要注意数据集必须使用lgb.Dataset函数加以转换

关于LightGBM参数

lightgbm参数很多，应仔细阅读https://lightgbm.readthedocs.io/en/latest/Parameters.html
关于调参，可以参考https://lightgbm.readthedocs.io/en/latest/Parameters-Tuning.html
1、核心参数：task, objective, boosting, n_estimators, learning_rate, metric
2、与决策树相关的参数：num_leaves, max_depth, min_data_in_leaf, feature_fraction_bynode, min_gain_split
3、涉及加速与防止过拟合的参数：bagging_fraction, feature_fraction, lambda_l1, lambda_l2, max_bin, min_data_in_bin, bin_construct_sample_cnt（实际上，决策树中的参数max_depth, min_data_in_leaf,
feature_fraction_bynode也有防止过拟合的作用）
4、处理不平衡的参数：pos_bagging_fraction, neg_bagging_fraction, is_unbalance
5、GOSS相关参数（设置boosting=goss才会启用GOSS）：top_rate, other_rate
6、EFB相关参数：enable_bundle, max_conflict_rate （实际上，这两个参数也可以实现加速）

ps1：网上也有很多调参攻略，例如我随便搜索看到的网页：

https://www.cnblogs.com/wzdLY/p/9867719.html
https://blog.csdn.net/u012513618/article/details/78441676
https://www.cnblogs.com/jiangxinyang/p/9337094.html
https://www.imooc.com/article/43784?block_id=tuijian_wz

ps2：不需要处理缺失值；不需要独热编码（但不能输入字符串）

算法实战

参考链接在此

基于英雄联盟数据集的LightGBM分类实战

数据集变量描述如下：

数据集导入

mport numpy as np 
import pandas as pd

import matplotlib.pyplot as plt
import seaborn as sns
df = pd.read_csv('./high_diamond_ranked_10min.csv')
y = df.blueWins

drop_cols = ['gameId','blueWins']#删除不必要的变量或预测变量
x = df.drop(drop_cols, axis=1)
x.describe()#进行统计描述

不同对局中插眼数和拆眼数的取值范围存在明显差距，甚至有前十分钟插了250个眼的异常值。
EliteMonsters的取值相当于Deagons + Heralds。
TotalGold 等变量在大部分对局中差距不大。
两支队伍的经济差和经验差是相反数。
红队和蓝队拿到首次击杀的概率大概都是50%

可视化描述

data = x
data_std = (data - data.mean()) / data.std()
data = pd.concat([y, data_std.iloc[:, 0:9]], axis=1)
data = pd.melt(data, id_vars='blueWins', var_name='Features', value_name='Values')

fig, ax = plt.subplots(1,2,figsize=(15,5))

# 绘制小提琴图
sns.violinplot(x='Features', y='Values', hue='blueWins', data=data, split=True,
               inner='quart', ax=ax[0], palette='Blues')
fig.autofmt_xdate(rotation=45)

data = x
data_std = (data - data.mean()) / data.std()
data = pd.concat([y, data_std.iloc[:, 9:18]], axis=1)
data = pd.melt(data, id_vars='blueWins', var_name='Features', value_name='Values')

# 绘制小提琴图
sns.violinplot(x='Features', y='Values', hue='blueWins', 
               data=data, split=True, inner='quart', ax=ax[1], palette='Blues')
fig.autofmt_xdate(rotation=45)

plt.show()

从图中可以看出：

击杀英雄数量越多更容易赢，死亡数量越多越容易输（bluekills与bluedeaths左右的区别）。
助攻数量与击杀英雄数量形成的图形状类似，说明他们对游戏结果的影响差不多。
一血的取得情况与获胜有正相关，但是相关性不如击杀英雄数量明显。
经济差与经验差对于游戏胜负的影响较小。
击杀野怪数量对游戏胜负的影响并不大。

plt.figure(figsize=(18,14))
sns.heatmap(round(x.corr(),2), cmap='Blues', annot=True)
plt.show()

# 去除冗余特征
drop_cols = ['redAvgLevel','blueAvgLevel']
x.drop(drop_cols, axis=1, inplace=True)

sns.set(style='whitegrid', palette='muted')

# 构造两个新特征
x['wardsPlacedDiff'] = x['blueWardsPlaced'] - x['redWardsPlaced']
x['wardsDestroyedDiff'] = x['blueWardsDestroyed'] - x['redWardsDestroyed']

data = x[['blueWardsPlaced','blueWardsDestroyed','wardsPlacedDiff','wardsDestroyedDiff']].sample(1000)
data_std = (data - data.mean()) / data.std()
data = pd.concat([y, data_std], axis=1)
data = pd.melt(data, id_vars='blueWins', var_name='Features', value_name='Values')

plt.figure(figsize=(10,6))
sns.swarmplot(x='Features', y='Values', hue='blueWins', data=data)
plt.xticks(rotation=45)
plt.show()

从插眼数量的散点图发现不存在插眼数量与游戏胜负间的显著规律。猜测由于钻石分段以上在哪插眼在哪好排眼都是套路，所以数据中前十分钟插眼数拔眼数对游戏的影响不大。所以我们暂时先把这些特征去掉。

# 去除和眼位相关的特征
drop_cols = ['blueWardsPlaced','blueWardsDestroyed','wardsPlacedDiff',
            'wardsDestroyedDiff','redWardsPlaced','redWardsDestroyed']
x.drop(drop_cols, axis=1, inplace=True)

x['killsDiff'] = x['blueKills'] - x['blueDeaths']
x['assistsDiff'] = x['blueAssists'] - x['redAssists']

x[['blueKills','blueDeaths','blueAssists','killsDiff','assistsDiff','redAssists']].hist(figsize=(12,10), bins=20)
plt.show()

发现击杀、死亡与助攻数的数据分布差别不大。但是击杀减去死亡、助攻减去死亡的分布与原分布差别很大，因此我们新构造这么两个特征。

data = x[['blueKills','blueDeaths','blueAssists','killsDiff','assistsDiff','redAssists']].sample(1000)
data_std = (data - data.mean()) / data.std()
data = pd.concat([y, data_std], axis=1)
data = pd.melt(data, id_vars='blueWins', var_name='Features', value_name='Values')

plt.figure(figsize=(10,6))
sns.swarmplot(x='Features', y='Values', hue='blueWins', data=data)
plt.xticks(rotation=45)
plt.show()

上图可以发现击杀数与死亡数与助攻数，以及我们构造的特征对数据都有较好的分类能力。

data = pd.concat([y, x], axis=1).sample(500)

sns.pairplot(data, vars=['blueKills','blueDeaths','blueAssists','killsDiff','assistsDiff','redAssists'], 
             hue='blueWins')

plt.show()

#一些特征两两组合后对于数据的划分能力也有提升。
x['dragonsDiff'] = x['blueDragons'] - x['redDragons']
x['heraldsDiff'] = x['blueHeralds'] - x['redHeralds']
x['eliteDiff'] = x['blueEliteMonsters'] - x['redEliteMonsters']

data = pd.concat([y, x], axis=1)

eliteGroup = data.groupby(['eliteDiff'])['blueWins'].mean()
dragonGroup = data.groupby(['dragonsDiff'])['blueWins'].mean()
heraldGroup = data.groupby(['heraldsDiff'])['blueWins'].mean()

fig, ax = plt.subplots(1,3, figsize=(15,4))

eliteGroup.plot(kind='bar', ax=ax[0])
dragonGroup.plot(kind='bar', ax=ax[1])
heraldGroup.plot(kind='bar', ax=ax[2])

print(eliteGroup)
print(dragonGroup)
print(heraldGroup)

plt.show()

构造了两队之间是否拿到龙、是否拿到峡谷先锋、击杀大型野怪的数量差值，发现在游戏的前期拿到龙比拿到峡谷先锋更容易获得胜利。拿到大型野怪的数量和胜率也存在着强相关。

x['towerDiff'] = x['blueTowersDestroyed'] - x['redTowersDestroyed']

data = pd.concat([y, x], axis=1)

towerGroup = data.groupby(['towerDiff'])['blueWins']
print(towerGroup.count())
print(towerGroup.mean())

fig, ax = plt.subplots(1,2,figsize=(15,5))

towerGroup.mean().plot(kind='line', ax=ax[0])
ax[0].set_title('Proportion of Blue Wins')
ax[0].set_ylabel('Proportion')

towerGroup.count().plot(kind='line', ax=ax[1])
ax[1].set_title('Count of Towers Destroyed')
ax[1].set_ylabel('Count')

推塔是英雄联盟这个游戏的核心，因此推塔数量可能与游戏的胜负有很大关系。我们绘图发现，尽管前十分钟推掉第一座防御塔的概率很低，但是一旦某只队伍推掉第一座防御塔，获得游戏的胜率将大大增加。

利用 LightGBM 进行训练与预测

from sklearn.model_selection import train_test_split
data_target_part = y
data_features_part = x

## 测试集大小为20%， 80%/20%分
x_train, x_test, y_train, y_test = train_test_split(data_features_part, data_target_part, test_size = 0.2, random_state = 2020)

from lightgbm.sklearn import LGBMClassifier
## 定义 LightGBM 模型 
clf = LGBMClassifier()
# 在训练集上训练LightGBM模型
clf.fit(x_train, y_train)

# 在训练集和测试集上分布利用训练好的模型进行预测
train_predict = clf.predict(x_train)
test_predict = clf.predict(x_test)
from sklearn import metrics

## 利用accuracy（准确度）【预测正确的样本数目占总预测样本数目的比例】评估模型效果
print('The accuracy of the Logistic Regression is:',metrics.accuracy_score(y_train,train_predict))
print('The accuracy of the Logistic Regression is:',metrics.accuracy_score(y_test,test_predict))

## 查看混淆矩阵 (预测值和真实值的各类情况统计矩阵)
confusion_matrix_result = metrics.confusion_matrix(test_predict,y_test)
print('The confusion matrix result:\n',confusion_matrix_result)

# 利用热力图对于结果进行可视化
plt.figure(figsize=(8, 6))
sns.heatmap(confusion_matrix_result, annot=True, cmap='Blues')
plt.xlabel('Predicted labels')
plt.ylabel('True labels')
plt.show()

利用 LightGBM 进行特征选择

sns.barplot(y=data_features_part.columns, x=clf.feature_importances_)

from sklearn.metrics import accuracy_score
from lightgbm import plot_importance

def estimate(model,data):

    #sns.barplot(data.columns,model.feature_importances_)
    ax1=plot_importance(model,importance_type="gain")
    ax1.set_title('gain')
    ax2=plot_importance(model, importance_type="split")
    ax2.set_title('split')
    plt.show()
def classes(data,label,test):
    model=LGBMClassifier()
    model.fit(data,label)
    ans=model.predict(test)
    estimate(model, data)
    return ans
 
ans=classes(x_train,y_train,x_test)
pre=accuracy_score(y_test, ans)
print('acc=',accuracy_score(y_test,ans))

通过调整参数获得更好的效果

from sklearn.model_selection import GridSearchCV

## 定义参数取值范围
learning_rate = [0.1, 0.3, 0.6]
feature_fraction = [0.5, 0.8, 1]
num_leaves = [16, 32, 64]
max_depth = [-1,3,5,8]

parameters = { 'learning_rate': learning_rate,
              'feature_fraction':feature_fraction,
              'num_leaves': num_leaves,
              'max_depth': max_depth}
model = LGBMClassifier(n_estimators = 50)

## 进行网格搜索
clf = GridSearchCV(model, parameters, cv=3, scoring='accuracy',verbose=3, n_jobs=-1)
clf = clf.fit(x_train, y_train)

clf.best_params_## 网格搜索后的最优参数

clf = LGBMClassifier(feature_fraction = 0.8,
                    learning_rate = 0.1,
                    max_depth= 3,
                    num_leaves = 16)
# 在训练集上训练LightGBM模型
clf.fit(x_train, y_train)

train_predict = clf.predict(x_train)
test_predict = clf.predict(x_test)

## 利用accuracy（准确度）【预测正确的样本数目占总预测样本数目的比例】评估模型效果
print('The accuracy of the Logistic Regression is:',metrics.accuracy_score(y_train,train_predict))
print('The accuracy of the Logistic Regression is:',metrics.accuracy_score(y_test,test_predict))

## 查看混淆矩阵 (预测值和真实值的各类情况统计矩阵)
confusion_matrix_result = metrics.confusion_matrix(test_predict,y_test)
print('The confusion matrix result:\n',confusion_matrix_result)

# 利用热力图对于结果进行可视化
plt.figure(figsize=(8, 6))
sns.heatmap(confusion_matrix_result, annot=True, cmap='Blues')
plt.xlabel('Predicted labels')
plt.ylabel('True labels')
plt.show()

至此就完成了一个简单的LightGBM算法的实践应用，感兴趣的同学可以去前文的参考链接里获取相应的数据集自行探索。

纷呈短剧APP下载安装：红包版广告赚钱攻略教程怎么做清风导师
纷呈短剧官方APP下载，纷呈短剧红包版广告赚钱攻略教程怎么做?纷呈短剧APP并非单纯的短剧软件，其实是尚玩助手旗下的一款看广告赚零花钱的兼职软件,经过测评纷呈短剧一个广告单价居然可以高达5毛，而且超低变现门槛，加上尚玩助手作为聚合软件里面有多个同类APP可以一起操作，属于长期项目甚至有网友时间比较充沛的光靠自己几个手机居然能干到日收益50+，确实是同类天花板了!纷呈短剧APP官方正版下载：如同上面
2020-04-23 静静小站
公司：温州维力弹簧五金有限公司【日精进打卡第304天】【知～学习】《六项精进》1遍共114遍《大学》1遍共114遍《京瓷哲学》看到第二电电上市【经典词句】张文宏澄清年收入传言：读书不是唯一的路，却是人生最好走的路一、修身：（对自己个人）以作为人何为正确作为判断事物的标准二、齐家：（对家庭和家人）陪女儿考试做早餐同儿子视频三.建功安排下单订外加工螺丝客户报价回访客户｛积善｝：发愿从2019年4月15
愿你们历经千帆，归来仍是少年永靖015吴兴春
“上课，同学们好，老师好，请坐”，白驹过隙，转眼之间，大半个学期已经过去，2019年8月24号，我正式成为了2019届国家特岗计划老师，怀着新奇和忐忑站上了讲台。新奇是因为这是我人生的一个新的起点，新的职业，新的工作环境，新的生活从此开始，忐忑是因为背负自己内心巨大的压力，无非是害怕经验不足，看着一个个求知的小脸庞，怕教授不好，承受社会的压力。然而，随着学期的逐渐推进，和孩子们的逐渐接触和交流，从
史可法 Distractions分心
史可法，明末抗清名将、民族英雄，在抗清时英勇殉国。关于史可法的事迹被后世谨记。今天，要介绍的是关于史可法在抗清时的故事，以血战扬州为主要介绍。接下来，就到民族故事中了解这位英雄的故事吧。民族故事当崇祯皇帝自杀的消息传到南京，这座明朝的陪都陷入了惊恐和慌乱之中。接下来的问题就是，立谁做皇帝、继承明朝皇室的血统呢？南京的大臣们分成了两派。一派以正直爱国的官员、南京兵部尚书史可法为代表，另一派是腐败乱政
D23，拍电影荏苒3999
我们的摄制组必须得瑟一下，这是我不惑之年的微电影《不忘初心》的拍摄现场。编剧是我同事兼闺蜜，导演是我朋友，化妆造型师是我女神，真是一群友爱的人。我们用文字记录生活，用艺术表达情感，这真得感谢文字的力量。那就说文字吧，从甲骨文出现，汉字经过了6000多年的变化，楠得有你读书会的一位神秘楠友给我们讲过，其演变过程是：甲骨文、金文、大篆、小篆、隶书、草书、楷书、行书(殷商）（周)（秦）(汉）(魏晋)，其
学会聆听很重要南有乔木07
昨晚因为追剧（都挺好），彻底把日更抛之脑后，今天抓紧赶在天黑之前完成。因为坚持比努力更重要。今天需要吐槽的是菜鸟裹裹的客服。事情是这样的：中午午餐时间，我接到一个固定电话，是从宿迁打来的，屏幕赫然显示：快递！因最近先生有网购的习惯，陆陆续续买了不少东西，都留我的电话，所以我没加思索就接了。小姑娘告诉我有个快递到街上了，让我自己到菜鸟裹裹取件。我第一反应是先生给婆婆买的新微波炉到了！想到昨天快递师傅
顾旭林予柔(丈夫为了白月光儿子，活活抽干女儿血)全本阅读_顾旭林予柔最新热门小说_丈夫为了白月光儿子，活活抽干女儿血(顾旭林予柔)全集阅读_丈夫为了白月光儿子，活活抽干女儿血最新章节阅读_顾旭林... 全本全集小说
顾旭林予柔(丈夫为了白月光儿子，活活抽干女儿血)全本阅读_顾旭林予柔最新热门小说_丈夫为了白月光儿子，活活抽干女儿血(顾旭林予柔)全集阅读_丈夫为了白月光儿子，活活抽干女儿血最新章节阅读_顾旭林予柔《丈夫为了白月光儿子，活活抽干女儿血》全本免费在线阅读_(顾旭林予柔)最新章节在线阅读主角配角：顾旭林予柔简介：5.男人走到我的面前，周围的人不由得将我松开“您是？沈医生？”“是那个……起死回生一把刀的
有个好心态很重要 4e5fbf97e20e
很佩服自己，对前程仕途看的比较淡然，在自己付出了那么多，又取得很大的荣誉后，依然能平静待之，不急不躁，默默做着自己。特别是在周围的人辉煌腾达后，也能不为所动，甚至还把垂手可得的特定范围内的职位升迁机会拱手相让，有时真想，自己是不是傻掉了。在人的一生当中，事业很重要，但我觉得家人也同样重要。以前年轻，为工作常常拼命，弄得现在一身伤痛，个中滋味只有自己一个人知道。其实想开了，看淡了，理清了，人就好过起
PyTorch深度学习工具箱整理总结前网易架构师-高司机深度学习+AI pytorch
一、pytorch简介Pytorch是torch的python版本，是由Facebook开源的神经网络框架，专门针对GPU加速的深度神经网络（DNN）编程。Torch是一个经典的对多维矩阵数据进行操作的张量（tensor）库，在机器学习和其他数学密集型应用有广泛应用。与Tensorflow的静态计算图不同，pytorch的计算图是动态的，可以根据计算需要实时改变计算图。但由于Torch语言采用Lu
内部操盘伍戈Low carbon碳中和市场防不胜防!冒充名人行骗,有问题!被骗无法出金揭秘! 大盛律道
随着互联网的普及和金融科技的发展，越来越多的人开始使用线上平台进行投资、交易等活动。然而，一些不法分子也利用这些平台实施诈骗行为，给投资者带来了巨大的损失。本文将介绍一种常见的骗局——黑平台无法出金，以帮助大家提高警惕性，避免上当受骗。推荐网上投资理财、炒*的、做外汇的、炒数字货币、虚拟币慈善投票网站买数字的等等都是，广大市民对此要提高警惕，遇到此类情况一概不要相信。若不幸被骗发现不能提现赶紧与我
PyTorch常用小工具-Tensorboard、Summary、Profiler R-G-B 深度学习论文格式必会的技能传统/深度三维重建MVS系列 pytorch 深度学习计算机视觉
1PyTorch可视化工具-Tensorboard2summary计算每层参数个数2.1安装与使用2.2实战3profiler分析每个操作在GPU和CPU的时间花销3.1教程3.2实战统计前向运行时间4eval.py和eval_2.py对比5工程文件、数据集、源码下载1PyTorch可视化工具-TensorboardPyTorch可视化工具-Tensorboard教程2summary计算每层参数个
错诱何知洛温乘逸温以言(最新章节小说)错诱何知洛温乘逸温以言&完结版阅读...错诱何知洛温乘逸温以言九月文楼
错诱何知洛温乘逸温以言(最新章节小说)错诱何知洛温乘逸温以言&完结版阅读...错诱何知洛温乘逸温以言小说主角：何知洛温乘逸温以言简介：心机爆表腹黑宠妻糙汉VS禁欲系扮猪吃老虎黑莲花，强取豪夺，青梅反目，救赎，追妻火葬场大学时，温以言是人人追逐的高岭之花贵公子，而我是软糯可人专门训练出来靠近豪门的小狐狸。我诱他，引他，却在他上钩的同时自己也深陷得无法自拔。多年后，他是被豪门扫地，死了父母的私生子，我
上海财经顾问服务费能退吗？答案是：可以退的！29800退款流程一步一步告诉你金融维权知识
投顾公司服务费可以退！投顾公司服务费退款流程方法：一、将聊天记录和交易证据提交给法律服务后，经机构介入协商，投顾公司同意退还全额服务费用二、签署退款文件、填写到账信息，并且寄回公司三、公司相关部门收到退款合约之后，会在约定的时间内将你交的费用原路退回！今年5月看到某短视频里说只要9.9元每天盘前推荐三只票，想着看看于是加了投顾公司的顾问小徐，加上之后每天早上都给我推荐三只前一天涨停的股票，也会发很
第14天落地实修快乐天使_快乐飞翔
图片发自App写给自己：每天保持好心情，保持好眼光，保持好心态，遇到的所有都会变成美好的回忆。安茹导师：@王莉英——桂明导师沉静中犹如一朵玫瑰花，悄然间绽放最美的姿态在季节中散发爱的光芒……[玫瑰][玫瑰][玫瑰][拥抱]马龙飞老师：时间在一天天的过去，你也在一天天的遇见更好的自己，遇见崭新的自己，遇见美丽的自己。
有些农村地区很多兄弟姐妹不和，兄弟姐妹之间有矛盾的主要原因是？朦蒙哒
兄弟不和多数是原生大家庭和父母的原因，一个原生大家庭充满冷漠自私的气氛，那么在大家庭的大部分成员一般都是冷漠自私的，不冷漠自私的那个在这个原生大家庭成员的眼中就属于异类了！一、冷漠自私的原生大家庭原生大家庭一般是爷爷奶奶、父辈兄弟和你这一代的兄弟姐妹（包括堂兄弟姐妹），一般农村这三代人大多数房子都是挤在一起盖的，这三代亲属低头不见抬头见的，如果冷漠自私在加上感情不好这里面的子孙势必受到影响，如无意
Trust is future currency（4.6）胡同学的读书笔记
1大量阅读、设置更宏大的目标。2不负生命，不负有情，不负天地。3随着生物的体积放大一倍，它所需要的食物不是同比增加一倍，而是只需要增加75%，即四分之三。4惠特曼说“人的一生，总是要找到一种平衡关系。忠贞的人，永远会得到忠贞；勇敢的人，最后也是用勇敢结束。5海浪永远会来，而且在某种程度上，你并不真的希望它们停止。但你慢慢知道，你会挺过去的。别的潮水还会到来。但你会活下来。如果你幸运的话，你会带着许
吴亦凡公司人去楼空！这个巨婴什么时候能长大？顾小宝
图｜来源网络如需转载｜请后台留言随着这几天北京朝阳警方发布了一波警情通报，吴亦凡事件的各种疑团基本水落石出了。吴亦凡方面不仅没有半点承认错误的悔改之心，反而各种推卸责任。在都爆料后，吴第一时间还是找公关，称对方是污蔑，把责任全部推卸出去，自己清白的一干二净。之后，有网友实地探访了吴亦凡在北京的公司，发现已经大门紧闭，人去楼空。要知道吴亦凡现在非常紧张，被各大官媒定义为劣迹艺人，又被十多家代言的品牌
《世界•勇气》第五章唐偉濱
图片发自App《天涯海角》你微笑的模样隐藏着痛苦的泪光你转身坚毅背起的行囊都成最后的影象一生之中我只数着日子入梦期待在那里与你重逢深情地相拥天涯海角去寻找你天涯海角来找我夏去冬过一万多个日子就这么熬过你的农历生辰从未忘过年年为你过天涯海角去寻找你天涯海角来找我天涯海角你在哪里天涯海角来找我你现在的模样闪烁着幸福的泪光你坐的轮椅背上的行囊都成最新的影象天涯海角你在这里天涯海角找到我天涯海角我在这里你
2023-05-30 小潘潘呀
“在乡村，人和物动一起，忙着生，忙着死。”鲁迅评这价本书说：“与其听我在安坐的中牢.骚话，不如快看看《生死场》，她才会你给们以坚强和扎挣的力气”。于是我自为认做好了心理准备，才开打这本书。可我是还在晚上九点钟，坐在桌书前，莫名产生了种一窒息的感觉。那一我刻才意识原到来文字真的可当以枪使，正萧如红的文字。见了识萧红的文字，我才切实体到会了文字的力量。原来文的字魅力可以这么大，原来不感带情的字文竟然能
漂浮XP团练笔记花火喜珠
漂浮XP团练笔记2020.08.02擦地板围圈，目光找另一人互动，先一人找，先找者欲退出则闭目回原位，被找者另寻下一位，如是传递。变化：可同时开始多几个找人者。婴儿式起落，爬行，手脚不离地面探索多种姿态，前行，婴儿之间交互。围圈立，一人俯身采气，屏住，至另一人处吹向他身体的任一位置，被吹着做出反应。变化：多人并行，吹气人吹完倒下做死状，被吹人可以去吹别人，倒下者需受他人吹气复活。九级情绪围圈，转身
Linux消息队列深度剖析：内核实现与性能优化操作系统内核探秘 linux 性能优化 wpf ai
Linux消息队列深度剖析：内核实现与性能优化关键词：Linux消息队列、内核数据结构、SystemV、POSIX、性能优化、进程间通信、IPC摘要：本文从生活场景出发，逐步拆解Linux消息队列的核心机制，深入讲解SystemV和POSIX两种主流实现的内核原理，结合代码示例分析消息发送/接收流程，并针对高并发场景给出性能优化策略。无论你是后端开发工程师还是系统调优爱好者，都能通过本文掌握消息队
关于都街贡公后裔感恩工程第二届理事会如何交班问题谈三点看法骑驴观花
由于都街贡公后裔感恩工程第二届理事会没有作为，交班问题就必须提上议事日程。我认为有三种方式：一和平交接，二强硬交接，三没有交接，也没有人愿意成立第三届理事会。一、和平交接的方式有：第二届理事会自我总结，自我反省，并号召成立第三届理事会，重新构建核心领导人，重新开始工作部署。这样就必须由现任负责人提前发出倡议，制定换届工作方案，及时完成顺利的交接班工作。所有人第二届理事会成员服从第三届理事会成员领导
[特殊字符]️用Python打造全能型新闻爬虫：抓取全文+图片+视频的完整攻略（含最新Playwright方案） Python爬虫项目 python 爬虫数据分析开发语言音视频 javascript 数据挖掘
一、前言：为什么要抓取新闻网站全文？在大数据、人工智能风口之上，构建新闻语料库用于训练自然语言处理（NLP）模型、情感分析、热点追踪等任务变得愈发重要。然而，大多数新闻网站并不提供开放的API，内容分散在网页的各个结构中，因此我们必须编写一个功能齐全的爬虫来抓取文章、图片、视频等多种内容。️二、技术选型与环境准备主要依赖库库名用途Playwright最新浏览器自动化技术，支持动态页面渲染Beaut
ZeroMQ源码深度剖析：网络机制与性能优化实战 TravisBytes #ZMQ 网络性能优化
这里写目录标题1发布订阅过滤的高效实现2ZeroMQ的核心优势3常见Socket类型及应用4异步连接实现机制5断线重连机制6高水位线（HWM）深度解析7消息丢失与错误处理8消息帧（Frame）高级特性9高效性实现原理10无锁消息队列设计11零拷贝实现位置12消息可靠性设计13负载均衡实现14PUB/SUB性能对比：ZeroMQvsRedis15简单分布式系统搭建16实战项目案例17与传统消息队列对
反派居然该死的甜美阿肆鸭
第一章：下凡历劫仙气缭绕之中的宫殿若隐若现，金黄色的琉璃瓦在阳光下闪着耀眼的光辉，不知何处传来的乐声悠扬而动听……一片歌舞升平的祥和模样。五百年一次的蟠桃盛会，本该是众仙放松欢乐的时间，然而此情此景在沈温瑜看来却是没有什么心情去欣赏的，因为他是唯一一个在蟠桃盛会上被殿前神将押送着下凡历劫的神仙。“上神，您是自己下去呢？还是需要我们送您一程？”二位神将客客气气的，倒不失做为神仙的风度。沈温瑜冲着两位
能进入心流的活动 JackSua
“心流”状态是一种忘我、忘记时间的专注状态。我发现能进入心流状态的活动都需要有意识的连接身体的感知，如果只是凭大脑思绪乱飞，是不能进入状态的。能够连接身体的活动有：练字，唱歌，跑步，瑜伽等。这些活动不仅连接身体，还需要有一定的意识去控制，当达到专注的控制的时候，便达到了心流状态。而每天早晚的刷牙活动，往往已经被我们内化成了潜意识，一般是自动进行，难以调动显意识，于是难以进入心流状态。脑力劳动者进入
晨语问安2023年9月16日求索大伟
『晨语问安9.16』人应该一以贯之，最起码是阶段时间内的一以贯之、不变初心，不能朝时令暮就改，让人不知所云不知道该干什么，前后车后无辙的路径很难走。不变的初心、恒定的行动和持久的坚持，是成功者的底色和基础。作为一个组织的领导者，更应把坚守不变放在第一位，除非路线性错误或原则性失误，认准路径以后就应该排除万难走下去，总会看到柳暗花明又一村的那一刻。相反，一会儿一变，一会儿东一会儿西，是走不出路的。做
Hbase BulkLoad用法 kikiki2
要导入大量数据，Hbase的BulkLoad是必不可少的，在导入历史数据的时候，我们一般会选择使用BulkLoad方式，我们还可以借助Spark的计算能力将数据快速地导入。使用方法导入依赖包compilegroup:'org.apache.spark',name:'spark-sql_2.11',version:'2.3.1.3.0.0.0-1634'compilegroup:'org.apach
与工程项目中标后拒绝签约相关的法律问题太阳煜炎_王冠华
《招标投标法》第46条第1款规定：“招标人和中标人应当自中标通知书发出之日起30日内，按照招标文件和中标人的投标文件订立书面合同……”但在工程实践中，中标后拒绝签订的情形也时有发生，主要表现在两种情形：一是招标人无正当理由不与中标人订立合同，或者在订立合同时向中标人提出附加条件致使合同无法订立；二是中标人在中标通知书发出后放弃中标项目，或者无正当理由不与招标人订立合同，或者在签订合同时向招标人提出
成年人的游戏（881）等你开饭
武大粗看她满脸倦容，关切地问：“老板，你没累坏吧？”白面女会心一笑：“老娘干了这么多年，应付一个老混混简直就是小菜一碟。干这行要是没两把刷子，我还怎么混日子？”武大粗赶紧送上笑脸：“你说得是，这个行当的确不是一般人能干的事，若没点体力还真干不了，依我看主要还得取决于身体素质。如果身体不行，我估摸干两天就得歇菜。你说是吧？”说完没等白面女作答，又继续拍马屁：“你干了这么多年，气色还能保持这么好真不简
html页面js获取参数值 0624chenhong html
1.js获取参数值js function GetQueryString(name) { var reg = new RegExp("(^|&)"+ name +"=([^&]*)(&|$)"); var r = windo
MongoDB 在多线程高并发下的问题 BigCat2013 mongodb DB 高并发重复数据
最近项目用到 MongoDB , 主要是一些读取数据及改状态位的操作. 因为是结合了最近流行的 Storm进行大数据的分析处理，并将分析结果插入Vertica数据库，所以在多线程高并发的情境下, 会发现 Vertica 数据库中有部分重复的数据. 这到底是什么原因导致的呢？笔者开始也是一筹莫展，重复去看 MongoDB 的 API , 终于有了新发现： com.mongodb.DB 这个类有
c++ 用类模版实现链表(c++语言程序设计第四版示例代码) CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T> class Node { private: Node<T> * next; public: T data;
最近情况麦田的设计者感慨考试生活
在五月黄梅天的岁月里，一年两次的软考又要开始了。到目前为止，我已经考了多达三次的软考，最后的结果就是通过了初级考试（程序员）。人啊，就是不满足，考了初级就希望考中级，于是，这学期我就报考了中级，明天就要考试。感觉机会不大，期待奇迹发生吧。这个学期忙于练车，写项目，反正最后是一团糟。后天还要考试科目二。这个星期真的是很艰难的一周，希望能快点度过。
linux系统中用pkill踢出在线登录用户被触发 linux
由于linux服务器允许多用户登录，公司很多人知道密码，工作造成一定的障碍所以需要有时踢出指定的用户 1/#who 查出当前有那些终端登录（用 w 命令更详细） # who root pts/0 2010-10-28 09:36 (192
仿QQ聊天第二版肆无忌惮_ qq
在第一版之上的改进内容: 第一版链接: http://479001499.iteye.com/admin/blogs/2100893 用map存起来号码对应的聊天窗口对象,解决私聊的时候所有消息发到一个窗口的问题. 增加ViewInfo类,这个是信息预览的窗口,如果是自己的信息,则可以进行编辑. 信息修改后上传至服务器再告诉所有用户,自己的窗口
java读取配置文件知了ing
1，java读取.properties配置文件 InputStream in; try { in = test.class.getClassLoader().getResourceAsStream("config/ipnetOracle.properties");//配置文件的路径 Properties p = new Properties()
__attribute__ 你知多少？矮蛋蛋 C++gcc
原文地址: http://www.cnblogs.com/astwish/p/3460618.html GNU C 的一大特色就是__attribute__ 机制。__attribute__ 可以设置函数属性（Function Attribute ）、变量属性（Variable Attribute ）和类型属性（Type Attribute ）。 __attribute__ 书写特征是：
jsoup使用笔记 alleni123 java 爬虫 JSoup
<dependency> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.7.3</version> </dependency> 2014/08/28 今天遇到这种形式，
JAVA中的集合 Collectio 和Map的简单使用及方法百合不是茶 list map set
List ,set ,map的使用方法和区别 java容器类类库的用途是保存对象，并将其分为两个概念： Collection集合：一个独立的序列，这些序列都服从一条或多条规则;List必须按顺序保存元素，set不能重复元素；Queue按照排队规则来确定对象产生的顺序（通常与他们被插入的
杀LINUX的JOB进程 bijian1013 linux unix
今天发现数据库一个JOB一直在执行，都执行了好几个小时还在执行，所以想办法给删除掉系统环境： ORACLE 10G Linux操作系统操作步骤如下：第一步.查询出来那个job在运行，找个对应的SID字段 select * from dba_jobs_running--找到job对应的sid &n
Spring AOP详解 bijian1013 java spring AOP
最近项目中遇到了以下几点需求，仔细思考之后，觉得采用AOP来解决。一方面是为了以更加灵活的方式来解决问题，另一方面是借此机会深入学习Spring AOP相关的内容。例如，以下需求不用AOP肯定也能解决，至于是否牵强附会，仁者见仁智者见智。 1.对部分函数的调用进行日志记录，用于观察特定问题在运行过程中的函数调用
[Gson六]Gson类型适配器(TypeAdapter) bit1129 Adapter
TypeAdapter的使用动机 Gson在序列化和反序列化时，默认情况下，是按照POJO类的字段属性名和JSON串键进行一一映射匹配，然后把JSON串的键对应的值转换成POJO相同字段对应的值，反之亦然，在这个过程中有一个JSON串Key对应的Value和对象之间如何转换(序列化/反序列化)的问题。以Date为例，在序列化和反序列化时，Gson默认使用java.
【spark八十七】给定Driver Program，如何判断哪些代码在Driver运行，哪些代码在Worker上执行 bit1129 driver
Driver Program是用户编写的提交给Spark集群执行的application，它包含两部分作为驱动： Driver与Master、Worker协作完成application进程的启动、DAG划分、计算任务封装、计算任务分发到各个计算节点(Worker)、计算资源的分配等。计算逻辑本身，当计算任务在Worker执行时，执行计算逻辑完成application的计算任务
nginx 经验总结 ronin47 nginx 总结
　　　深感nginx的强大，只学了皮毛，把学下的记录。　　　获取Header 信息，一般是以$http_XX（ＸＸ是小写）获取body,通过接口，再展开，根据Ｋ取Ｖ　　　获取uri,以$arg_XX &n
轩辕互动-1.求三个整数中第二大的数2.整型数组的平衡点 bylijinnan 数组
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class ExoWeb { public static void main(String[] args) { ExoWeb ew=new ExoWeb(); System.out.pri
Netty源码学习-Java-NIO-Reactor bylijinnan java 多线程 netty
Netty里面采用了NIO-based Reactor Pattern 了解这个模式对学习Netty非常有帮助参考以下两篇文章： http://jeewanthad.blogspot.com/2013/02/reactor-pattern-explained-part-1.html http://gee.cs.oswego.edu/dl/cpjslides/nio.pdf
AOP通俗理解 cngolon spring AOP
1.我所知道的aop 初看aop,上来就是一大堆术语，而且还有个拉风的名字，面向切面编程，都说是OOP的一种有益补充等等。一下子让你不知所措，心想着：怪不得很多人都和我说aop多难多难。当我看进去以后，我才发现：它就是一些java基础上的朴实无华的应用，包括ioc，包括许许多多这样的名词，都是万变不离其宗而已。 2.为什么用aop&nb
cursor variable 实例 ctrain variable
create or replace procedure proc_test01 as type emp_row is record( empno emp.empno%type, ename emp.ename%type, job emp.job%type, mgr emp.mgr%type, hiberdate emp.hiredate%type, sal emp.sal%t
shell报bash: service: command not found解决方法 daizj linux shell service jps
今天在执行一个脚本时，本来是想在脚本中启动hdfs和hive等程序，可以在执行到service hive-server start等启动服务的命令时会报错，最终解决方法记录一下：脚本报错如下： ./olap_quick_intall.sh: line 57: service: command not found ./olap_quick_intall.sh: line 59
40个迹象表明你还是PHP菜鸟 dcj3sjt126com 设计模式 PHP 正则表达式 oop
你是PHP菜鸟，如果你：1. 不会利用如phpDoc 这样的工具来恰当地注释你的代码2. 对优秀的集成开发环境如Zend Studio 或Eclipse PDT 视而不见3. 从未用过任何形式的版本控制系统，如Subclipse4. 不采用某种编码与命名标准，以及通用约定，不能在项目开发周期里贯彻落实5. 不使用统一开发方式6. 不转换（或）也不验证某些输入或SQL查询串（译注：参考PHP相关函
Android逐帧动画的实现 dcj3sjt126com android
一、代码实现： private ImageView iv; private AnimationDrawable ad; @Override protected void onCreate(Bundle savedInstanceState) { super.onCreate(savedInstanceState); setContentView(R.layout
java远程调用linux的命令或者脚本 eksliang linux ganymed-ssh2
转载请出自出处： http://eksliang.iteye.com/blog/2105862 Java通过SSH2协议执行远程Shell脚本(ganymed-ssh2-build210.jar) 使用步骤如下： 1.导包官网下载: http://www.ganymed.ethz.ch/ssh2/ ma
adb端口被占用问题 gqdy365 adb
最近重新安装的电脑，配置了新环境，老是出现： adb server is out of date. killing... ADB server didn't ACK * failed to start daemon * 百度了一下，说是端口被占用，我开个eclipse，然后打开cmd，就提示这个，很烦人。一个比较彻底的解决办法就是修改
ASP.NET使用FileUpload上传文件 hvt .net C#hovertree asp.net webform
前台代码： <asp:FileUpload ID="fuKeleyi" runat="server" /> <asp:Button ID="BtnUp" runat="server" onclick="BtnUp_Click" Text="上传" />
代码之谜（四）- 浮点数（从惊讶到思考） justjavac 浮点数精度代码之谜 IEEE
在『代码之谜』系列的前几篇文章中，很多次出现了浮点数。浮点数在很多编程语言中被称为简单数据类型，其实，浮点数比起那些复杂数据类型（比如字符串）来说，一点都不简单。单单是说明 IEEE浮点数就可以写一本书了，我将用几篇博文来简单的说说我所理解的浮点数，算是抛砖引玉吧。一次面试记得多年前我招聘 Java 程序员时的一次关于浮点数、二分法、编码的面试，多年以后，他已经称为了一名很出色的
数据结构随记_1 lx.asymmetric 数据结构笔记
第一章 1.数据结构包括数据的逻辑结构、数据的物理/存储结构和数据的逻辑关系这三个方面的内容。 2.数据的存储结构可用四种基本的存储方法表示，它们分别是顺序存储、链式存储、索引存储和散列存储。 3.数据运算最常用的有五种，分别是查找/检索、排序、插入、删除、修改。 4.算法主要有以下五个特性：输入、输出、可行性、确定性和有穷性。 5.算法分析的
linux的会话和进程组网络接口 linux
会话：一个或多个进程组。起于用户登录，终止于用户退出。此期间所有进程都属于这个会话期。会话首进程：调用setsid创建会话的进程1.规定组长进程不能调用setsid，因为调用setsid后，调用进程会成为新的进程组的组长进程.如何保证？先调用fork，然后终止父进程，此时由于子进程的进程组ID为父进程的进程组ID，而子进程的ID是重新分配的，所以保证子进程不会是进程组长，从而子进程可以调用se
二维数组元素的连续求解 1140566087 二维数组 ACM
import java.util.HashMap; public class Title { public static void main(String[] args){ f(); } // 二位数组的应用 //12、二维数组中，哪一行或哪一列的连续存放的0的个数最多，是几个0。注意，是“连续”。 public static void f(){
也谈什么时候Java比C++快 windshome java C++
刚打开iteye就看到这个标题“Java什么时候比C++快”，觉得很好笑。你要比，就比同等水平的基础上的相比，笨蛋写得C代码和C++代码，去和高手写的Java代码比效率，有什么意义呢？我是写密码算法的，深刻知道算法C和C++实现和Java实现之间的效率差，甚至也比对过C代码和汇编代码的效率差，计算机是个死的东西，再怎么优化，Java也就是和C