ab1213456

Kaggle 比赛项目总结（项目流程）

一、EDA（Exploratory Data Analysis）

EDA：也就是探索性的分析数据
目的：

理解每个特征的意义；
知道哪些特征是有用的，这些特征哪些是直接可以用的，哪些需要经过变换才能用，为之后的特征工程做准备；

1）每个特征的意义、特征的类型：
```
df.describe()
df['Category'].unique()
```

2）看是否存在 missing value（特征数据是否缺失）
```
df.loc[df.Dates.isnull(),'Dates']
```

3）看每个特征下的数据分布，用 boxplot 或者 hist：

%matplotlib inline
import matplotlib.pyplot as plt
df.boxplot(column='Fare', by = 'Pclass')
plt.hist(df['Fare'], bins = 10, range =(df['Fare'].min(),df['Fare'].max()))
plt.title('Fare >distribution')
plt.xlabel('Fare')
plt.ylabel('Count of Passengers')

如果变量是categorical的，想看distribution，则可以：
```
df.PdDistrict.value_counts().plot(kind='bar', figsize=(8,10))
```

4）看一些特征之间的联立情况，用 pandas 的 groupby：

temp = pd.crosstab([df.Pclass, df.Sex], df.Survived.astype(bool))
temp.plot(kind='bar', stacked=True, color=['red','blue'], grid=False)

二、Data Preprocessing（数据预处理）

目的：将数据处理下，为模型输入做准备；

　1）处理 missing value（缺失值）

查看数据集中，所有的特征数据有没有缺失；

如果 missing value 占总体的比例非常小，那么直接填入平均值或者众数；
如果 missing value 所占比例不算小也不算大，那么可以考虑它跟其他特征的关系，如果关系明显，那么直接根据其他特征填入；也可以建立简单的模型，比如线性回归，随机森林等。
如果 missing value 所占比例大，那么直接将 miss value 当做一种特殊的情况，另取一个值填入处理；

　2）处理 Outlier （异常值）

这个就是 EDA 的作用，通过画图，找出异常值

　3）categorical feature （类别特征）

Categorical 特征常被称为离散特征、分类特征，数据类型通常是 object 类型；
机器学习模型通常只能处理数值数据，所以需要对 Categorical 数据转换成 Numeric 特征。

categorical feature 有两种分类：

Ordinal 类型：这种类型的Categorical存在着自然的顺序结构，如果你对Ordinal 类型数据进行排序的话，可以是增序或者降序，比如在学习成绩这个特征中具体的值可能有：A、B、C、D四个等级，但是根据成绩的优异成绩进行排序的话有A>B>C>D
Nominal 类型：这种是常规的Categorical类型，不能对Nominal类型数据进行排序。比如血型特征可能的值有：A、B、O、AB，但你不能得出A>B>O>AB的结论。

对于Ordinal 和 Nominal 类型数据有不同的方法将它们转换成数字：
Ordinal 类型数据：使用 LabelEncoder 进行编码处理；

例如成绩的A、B、C、D四个等级进行 LabelEncoder 处理后会映射成1、2、3、4，这样数据间的自然大小关系也会保留下来。

Nominal 类型数据：使用 OneHotEncoder 进行编码处理；

Pandas 的 get_dummies() 方法，对应每一个虚拟变量，都返回一包含一个新的一列的 DataFrame；
Use the concat() method to add these dummy columns back to the original DataFrame
Then drop the original columns entirely using the drop method

　4）处理 categorical feature

一般就是通过dummy variable的方式解决，也叫one hot encode：

pandas.get_dummies()
sklearn 中 preprocessing.OneHotEncoder()

例：
将一列的 month 数据展开为了12列，用0、1代表类别
另外在处理 categorical feature 有两点值得注意：

如果特征中包含大量需要做 dummy variable（虚拟变量）处理的，那么很可能导致得到一个稀疏的dataframe，这时候最好用下PCA做降维处理。
如果某个特征有好几万个取值，那么用 dummy variable 就并不现实了，这时候可以用Count-Based Learning.

对于类别特征，在模型中加入tf-idf 有好的效果；
“Leave-one-out” encoding：可以处理类别特征种类过多的问题；

三、Feature Engineering（特征工程）

理论上来说，“特征工程” 属于数据预测。

特征工程非常重要，可以说最后结果的好坏，大部分就是由特征工程决定的，剩下部分应该是调参和 Ensemble（集成学习）决定。

特征工程的好坏主要是由 domain knowledge 决定的，但是大部分人可能并不具备这种知识，那么只能尽可能多的根据原来 feature 生成新的 feature ，然后让模型选择其中重要的feature。这里就又涉及到 feature selection（特征选择）；

feature selection 的方法：backward、forward selection 等有很多。我个人倾向于用 random forest 的 feature importance，这里有论文介绍了这种方法。

四、Model Selection and Training

　1）Model Selection（模型选择）

最常用的模型是 Ensemble Model（集成学习），比如 Random Forest、Gradient Boosting。

Kaggle 上的项目，开始可以用点简单的模型，一方面是可以作为底线 threshold，另一方面也可以在最后作为Ensemble Model。xgboost

　2）Model Training（模型训练）

训练模型主要就是调参，每种模型都有自己最关键的几个参数，在 sklearn 中

GridSearchCV （网格搜索）设置需要比较的几种参数组合；
用 cross validation 选出最优秀的参数组合。

大概用法：

from sklearn.grid_search import GridSearchCV
from pprint import pprint
clf=RandomForestClassifier(random_state=seed)
parameters = {'n_estimators': [300, 500], 'max_features':[4,5,'auto']}
grid_search = GridSearchCV(estimator=clf,param_grid=parameters, cv=10, scoring='accuracy')
print("parameters:")
pprint(parameters)
grid_search.fit(train_x,train_y)
print("Best score: %0.3f" % grid_search.best_score_)
print("Best parameters set:")
best_parameters=grid_search.best_estimator_.get_params()
for param_name in sorted(parameters.keys()):
print("\t%s: %r" % (param_name, best_parameters[param_name]))

五、Model Ensemble（模型集成）

Model Ensemble 的方法：Pasting、Bagging、Boosting（增强学习）、Stacking（堆叠）；其中 Bagging 和 Boosting 都算是 Bootstraping 的应用。Bootstraping 的概念是对样本每次有放回的抽样，抽样K个，一共抽N次。
Bagging：每次从总体样本中随机抽取K个样本来训练模型，重复N次，得到N个模型，然后将各个模型结果合并，分类问题投票方式结合，回归则是取平均值，e.g.Random Forest。
Boosting：一开始给每个样本取同样的权重，然后迭代训练，每次对训练失败的样本调高其权重。最后对多个模型用加权平均来结合，e.g. GBDT。
Bagging 与Boosting 的比较：在深入理解 Bagging 和 Boosting 后发现，bagging 其实是用相同的模型来训练随机抽样的数据，这样的结果是各个模型之间的 bias（偏差）差不多，variance（方差）也差不多，通过平均，使得 variance 降低（由算平均方差的公式可知），从而提高 ensemble model 的表现。而 Boosting 其实是一种贪心算法，不断降低bias。

Stacking：训练一个模型来组合其他各个模型。

首先先训练多个不同的模型；
然后再以之前训练的各个模型的输出为输入来训练一个模型，以得到一个最终的输出。

stacking很像神经网络，通过很多模型的输出，构建中间层，最后用逻辑回归将中间层训练得到最后的结果。

例：

def single_model_stacking(clf):
     skf = list(StratifiedKFold(y, 10))
     dataset_blend_train = np.zeros((Xtrain.shape[0],len(set(y.tolist()))))
    dataset_blend_test = np.zeros((Xtest.shape[0],len(set(y.tolist()))))
    dataset_blend_test_list=[]
    loglossList=[]
    for i, (train, test) in enumerate(skf):
    dataset_blend_test_j = []
    X_train = Xtrain[train]
    y_train =dummy_y[train]
    X_val = Xtrain[test]
    y_val = dummy_y[test]
    if clf=='NN_fit':
        fold_pred,pred=NN_fit(X_train, y_train,X_val,y_val)
    if clf=='xgb_fit':
             fold_pred,pred=xgb_fit(X_train, y_train,X_val,y_val)
    if clf=='lr_fit':
        fold_pred,pred=lr_fit(X_train, y_train,X_val,y_val) 
    print('Fold %d, logloss:%f '%(i,log_loss(y_val,fold_pred))) 

    dataset_blend_train[test, :] = fold_pred                 
    dataset_blend_test_list.append( pred )         
    loglossList.append(log_loss(y_val,fold_pred))     
    dataset_blend_test = np.mean(dataset_blend_test_list,axis=0)    
    print('average log loss is :',np.mean(log_loss(y_val,fold_pred)))
    print ("Blending.")

    clf = LogisticRegression(multi_class='multinomial',solver='lbfgs')     
    clf.fit(dataset_blend_train, np.argmax(dummy_y,axis=1))
    pred = clf.predict_proba(dataset_blend_test)
return pred

转载于:https://www.cnblogs.com/volcao/p/9523254.html

你可能感兴趣的:(Kaggle 比赛项目总结（项目流程）)

勇士赢了，我把掌声给了骑士复角度的生活
今天，不参加高考，只看NBA总决赛第三场的较量。这么说有点得罪高考生了，不过我没有当他们面秀，也没有跑到考点外面得瑟，所以我内心毫无波澜。毫无疑问，考场里不乏骑士和勇士球迷，在紧张作答语文考卷同时还心系着球队，不过我希望今天的比赛不会让你们有所分心，毕竟高考不会像比赛录像那样可以再来。今天，好像起来赶考一样，我起得很早，然而事实是睡不着，挺郁闷的，又不是我高考，我紧张什么？九点我并没有准时打开浏览
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
2022-11-25 疫情卷土而来快乐微笑每一天
原计划本周因比赛休息两天半，结果一个阳性患者疫情转变了所有，轮休课表换掉，继续周五上课；比赛顺延，假期顺延，相对应确诊病例所在区域封闭。这疫情何时是一个尽头，谁也无法知晓，唯有进出带好口罩，保护自己，方能战胜疫情。疫情无情，人间温暖，期待疫情早日过去，大地重返平安和谐。
稍微落后的人更容易被激励成长有杕之杜
今日纯分享。图片发自App沃顿商学院市场营销学教授乔纳·伯杰在接受《哈佛商业评论》采访时，介绍了他的一项研究。伯杰教授告诉参加实验的人，他们在跟隔壁房间的另一个人比赛打字速度，获胜的人有金钱奖励。一轮比赛之后，伯杰给了这些人不同的反馈，有的人被告知远远落后竞争对手，有的人被告知稍稍落后，还有的人被告知不相上下或者略微领先。结果只有那些被告知“稍微落后”的人，在第二轮中速度明显提高，而且总体来说，这
向着明亮那方12.7 向着明亮那方的我们
【水晶泥的妙用】在地上捡到一滩水晶泥，本想扔进垃圾桶，发现水晶泥上附着了些许蓝色钢笔墨水。我脑洞大开，水晶泥可不可以用来处理钢笔墨渍呢？正好垃圾桶那面瓷砖墙上有蓝色钢笔水痕迹，我用水晶泥沾了沾墨迹，很轻易地把墨色粘了下来，好干净。【长跑报名】我让同学们自愿报名参加冬季长跑比赛，课间将名字报给班长。班长把名字统计在本子上，把本子拿来给我看：“老师，我晚上回去给你做张电子表，发给你。”看来班长又学了新
MATLAB语言基础教程、小项目1：简单的计算器、小项目2：有页面的计算器、使用App Designer创建GUI计算器 azuredragonz 学习教程 matlab 开发语言
MATLABMATLAB语言基础教程1.MATLAB简介2.基本语法变量与赋值向量与矩阵矩阵运算数学函数控制流3.函数4.绘图案例：简单方程求解小项目1：简单的科学计算器功能代码项目说明小项目2：有页面的计算器使用AppDesigner创建GUI计算器主要步骤：完整代码（使用MATLAB编写）说明：如何运行：小项目总结MATLAB语言基础教程1.MATLAB简介MATLAB（矩阵实验室）是一种用于
全运会结束了除了闭幕式无亮点外对西安发展大有裨益新心芯达人
前言昨天是最后一个比赛日，山东代表团单日揽4金，最后以58金55银47铜，总计160枚奖牌的成绩位列奖牌榜第一的位置，这已经是山东连续第四届全运会取得奖牌榜第一的成绩，以绝对的优势达成了四连冠成就，山东属实厉害！广东在本届全运会中也拼尽了全力，在26号的最后一个比赛日，狂揽6金，最后以54金，32银，56铜，总计142枚奖牌位列奖牌榜第二的位置，虽然最后一个比赛日爆发连夺6金，最后还是没有撼动山东
72称体重作者：陈瑄仪家庭教育CEO
2019年5月1日星期三大雨昭阳区今天我们开始准备明天的比赛，教练说早上8:00叫我们到市委党校集合，爸爸很早就送我到市委党校了，我在那里等了好久，教练还没来，我就在那里跑步，跑了十几圈教练还没有来又跑几圈教练还没来，我们就觉得奇怪了，教练不会在家里睡懒觉吧，我们又跑了几圈才休息。等教练来了我们就去称重体重，第一次称，没过，我急了，教练说我超了0.3公斤，让我去跑了几圈重量才减下来，明明之前几天只
2019-11-29晨间日记麦新
今天是什么日子起床：6:00就寝：23:30天气：晴朗心情：平静纪念日：第二场比赛叫我起床的不是闹钟是梦想年度目标及关键点：国考考研本月重要成果：学习今日三只青蛙/番茄钟点评作业出镜点评夜班成功日志-记录三五件有收获的事务出镜点评点评作业夜班财务检视-1人际的投入来回跑～开卷有益-学习/读书/听书《孔子》健康与饮食今日步数：8000+好习惯打卡早晚打卡阅读打卡听书打卡社群打卡
特雷-杨表现出色，比肩詹姆斯，库里 Allen196
特雷-杨得到35分11次助攻。从2000年以后只有两个新秀可以打出这样的数据（至少35分，10次助攻），他们的名字是：史蒂芬-库里，勒布朗-詹姆斯。现在亚特兰大老鹰队的特雷-杨加入了他们的行列，在对阵克里夫兰骑士队的比赛中，他拿到了35分，11次助攻帮助老鹰队取得胜利，同时也是老鹰队主教练罗伊德-皮尔斯作为NBA主教练的首场胜利。揭幕战战胜尼克斯，第二场战胜防守强硬的灰熊后，杨再次帮助球队战胜了骑
D15 论语学习笔记许小兔Angelina
悟：上级对下级的宽容：凡事成定局，就不你说了；已接近完结的事，也没必要匡正和挽回了；既然是过去的事，也没必要追究得失和责任了。对待孩子教育也是，不用“问责制”，这样容易让孩子因为害怕担责而说谎。应当循循善诱，避免再犯错才是最重要的。3.16：【原文】子曰：“射不主皮，为力不同科，古之道也。”【译文】孔子说：“射箭比赛不以射透为主，而主要看是否射得准确，因为人的力量不同，自古如此。”3.17：【原文
中国男篮：15万赛后评分，赵继伟第三，赵睿3.8分倒数第一体娱荒原
在某体育社交软件中，有15万人之多为中国男篮第二场比赛进行点评，我们一起来看看他们的评分排名。这场比赛有12人出场，全部球员都有得分进账。吴前9.9分，这场比赛他拿到全队最高的18分还有4篮板3助攻3抢断，虽然也有3次失误和5次犯规，但是瑕不掩瑜，特别是最后一节单节得到10分跟赵继伟的连线帮助球队逆转对手赢得一场胜利，他的发挥至关重要，要知道对手对他也有研究，基本上都是贴身防守，持球还有夹击，吴前
平昌冬奥，人生竞赛不要给对手和裁判任何机会小猫_003e
如火如荼的平昌冬奥会拉下了帷幕，但是自从某年的伦敦奥运会之后，我们中国队自从好像就“最爱干犯规的事儿”。2月20日，短道速滑女子3000米接力赛，可以说是相当令人痛心了。比赛中，韩国队交接棒失误“扑街”，阻拦了加拿大队，带来的连锁反应也影响了中国队。中国队以微弱劣势落后韩国队，第二个冲线！韩国队这次失误犯规那么明显，应该唱费玉清的我送你离开千里之外。但···最终赛场上裁判宣布：韩国队冠军，中国队、
网上商城项目总结报告 WEB前端程序贵前端
网上商城项目总结报告1：掌握的知识通过网上商城这个实战项目的开发，不仅了解到了一个项目的业务逻辑，而且掌握了实现相关业务功能的方法。通过这个实战项目，了解到了模块化开发项目的基础结构的搭建，以及项目文件的管理方式。通过这个实战项目，运用封装的接口api文档实现了客户端服务器之间的交互知识。通过封装的axios实例对象与方法，向服务器请求数据，然后渲染页面。通过运用localStorage本地储存的
网上商城项目总结续猫只i java web 电子商城结构
前台1.用户登录注册邮箱验证校验用户名是否存在验证码自动登录2.导航条自定义标签库采用异步读取数据（使用gson将集合转换json数据）Redis服务器3.首页热门商品查询展示4.分类列表分页查询5.商品详情用cookie实现浏览记录6.购物车实现商品添加到购物车商品的查询，添加，修改，删除清空购物车7.提交订单添加订单（订单详情）确认订单（易宝支付）8.我的订单9.Fliter定义权限拦截（提交
周记15 安诗雨
星期天回学校的时候，发现寝室里有好几只臭屁虫。星期一的电学很难，数学也非常难，让我感到非常吃力。历史比赛日期就在11月29日，也就是我的生日。唉，过生日去比赛，我好难受。不仅如此，还是高手对决……老师希望“保三争二冲一”，我也希望来一个一等奖，这样多光荣，也证明了自己的实力。不管怎么样，要全力以赴。星期二我们进行了电子技能实训期中考试。对我来说，简直不要太轻松。无非就是拿万用表测电阻值，顺带读出来
【足坛简讯】9月2日足坛简讯及比赛预告神州足球
【足坛简讯】9月2日足坛简讯及比赛预告9月2日足坛简讯与比赛预告比赛结果✍️意甲第3轮：十人米兰2-1罗马三连胜领跑莱奥凌空斩吉鲁点射托莫里染红✍️德甲第3轮：两连平！多特连丢两球2-2遭升班马海登海姆扳平布兰特凌空斩✍️沙特联：米特洛维奇戴帽本泽马破门新月连入三球4-3逆转吉达联合✍️热身赛：中国国奥1-0土库曼斯坦国奥，艾菲尔丁制胜球国内足坛✍️明日之星足球赛：上海队点球憾负曼城，大阪樱花蔚山
都2024年了，还在问网络安全怎么入门，气得我当场脑血栓发作网安大师兄 web安全网络安全网络安全学习
前言本人从事网路安全工作12年，曾在2个大厂工作过，安全服务、售后服务、售前、攻防比赛、安全讲师、销售经理等职位都做过，对这个行业了解比较全面。下面就开始进入正题，如何从一个萌新一步一步进入网络安全行业。正题首先,在准备进入这个行业之前，我们要问一下我们的内心，工作千千万，为什么要想进入这个行业？相信每个人的答案都不一样，有的人会说，这个行业整体上比其他行业赚钱多，有的人会说特别喜欢技术，想钻研一
在 Spring Boot 项目中连接 IBM AS/400 数据库——详细案例教程箬敏伊儿数据库 AS/400 spring boot 数据库后端 database java
文章目录1.添加`jt400`依赖2.下载`jt400`驱动包依赖下载手动下载下载地址：手动下载JAR的步骤：3.配置application.properties或application.yml（1）`application.properties`（2）`application.yml`4.数据源配置类（可选）5.创建`JDBC`访问层6.测试连接7.启动项目总结在SpringBoot项目中连接I
第十二章〈一〉汝此一生1985
接下来的运动会时光便是和东美一起度过。两人时不时就去超市买上一大袋东西，提着一大袋东西然后坐在操场上看着比赛消磨时光。下午两三点时刻，太阳很大，笼罩了整个操场，晒得人只想睡觉。秦嘉杨在篮球场挥洒热汗，东美躺在林召航腿上和林召航一起听着歌。拒绝去看秦嘉杨比赛，“我可不想看见他和他那个情人的亲密互动。”说着忿忿填进嘴里一个薯片。林召航拔下耳机，“哪来的情人？”东美：“姓篮名球”东美的嘴巴变成了“0”形
Dev-C++头文件小Bug 蒟蒻pzjdsg666 bug c语言 c++
Dev-C++应该是大家最常用的C++软件了吧，但它有几个小Bug。1、“万能头”众所周知，“万能头”在官方比赛中不能使用（你要用没人拦着你~呵呵），但在Dev-C++可以使用。所以，我们可以省掉好多头文件！如下：#includeusingnamespacestd;2、C语言头文件在Dev-C++中，你竟然可以使用C语言头文件（惊不惊喜~意不意外~）如下：#include3、iostream竟然包
跃迁第一天师者之写道
《跃迁》你怎么也想不到火车在替代马车的时候，很多人嘲笑火车，甚至夸张地和火车比赛，直到今天，马车被淘汰了，更别说有能赶上马车的火车了！时代在发展，我们稍微不学习，不改变就可能永远地被淘汰在世界的某一个角落里。今天我用拆书法拆了我自己。
周二竞足：塞维利亚力争小胜巴萨，亚特兰大击败热那亚如探囊取物阿东侃球
昨日赛事回顾：富勒姆对阵谢菲尔德联这场很简单，整体方向是正确的，但是谢菲联在开局3分钟进了1个球后，富勒姆竟然没能追平，全场就只有这1个进球，有点可惜。莱万特和巴伦西亚这一场比赛简直就是折磨人，上半场莱万特2-1领先，下半场却被反攻最终3-4结束，硬生生的打出了胜负的战果，着实惊到了我。周二003意甲：热那亚VS亚特兰大比赛时间：2021-12-2203:45基本面分析：热那亚联赛1胜7平10负积
当姨妈遇见马拉松赛事，该怎么破语非年
图片发自App凌晨4:30分匆匆洗漱出门，到5:10分集合点与团长、许总车自驾前往参赛地（漳州市华安县），车上听说参赛点大雨倾盆，本来就有心无意参赛的（没雨就跑，有雨弃赛），果不其然在进入华安县的时候就遇瓢泼大雨，于是与如风大神们说笑着，若到起跑点还是这般大雨就弃赛。因都身体抱恙。所幸，天工不负有心人，到达目的地存包直到开跑，雨奇迹般的停了。临近比赛的前三天正好生理期，在纠结去还是不去的时候，内心
2022年3月23日复盘凤晴天
工作方面：今天过来开始伎钢筋的结算单。然后开始做模板木方的结算单。开始加昨天钢管扣件对账缺的部分，晚上过来加班，又把那个需求总计划给上传了一下。25号要上传创效和限额领料资料。学习方面：1.秘密的话，还是没有怎么听他们社群里面的分享。2、21天演讲训练营，今天是总决赛及结营仪式。因为加班也没有听他们的比赛。但是看群里边发的就是军人的，感觉军人的气概，那种气魄非常强。3.小a的话已经开始拉10天训练
扎吉托娃：我高兴自己没有让团队失望云游四方的旅人
阿莉娜·扎吉托娃赛后采访时表示，自己满意自己没有让团队失望。“我滑得好，过程非常高兴，克服自己的焦虑，高兴，我没有让团队失望。”“我告诉自己事实上我在训练中一切都做很好，所有的动作都做好了，为什么我不能在比赛中做好呢？”
惊喜！国足福将被施密特神奇复活，他的作用比肩外援，里皮开心了枫桥落夜
2018年7月22日晚，北京工人体育场进行了一场精彩激烈的新京津德比大战，由北京中赫国安对阵天津权健。这是一场强强对话，天津权健是上赛季的中超第三名，亚冠也打进了8强，实力强劲。而北京国安联赛已经11轮不败，领跑积分榜，本赛季是奔着冠军而去的。北京中赫国安本场比赛是有非常大的优势的，因为他们的内外援齐整，巴西国脚奥古斯托从世界杯回来也已经归队，而权健的维特赛尔和莫德斯特都还没有回来，只能有两外援上
写给QADMaoMao 向夏25
写给那个独一无二的毛毛，那个学习护理专业名叫做毛不易的大男孩，谢谢你的歌和故事。2019年1.7日我想把明日之子再完整的看一遍，毛毛记得很清晰的是刚开始有人问你这个比赛假如你拿了冠军你会怎么想，你说这个节目该有多烂让你拿冠军……第一期，你见到薛老师，你的话薛老师第一次不知道该怎么接，但就是很奇怪的留下了你，你说你是业余巨星毛不易接下来自己可以骄傲的向前走了，看到这么憨厚无比的男生，毛毛这一刻我才明
2023-01-08 冬日暖阳栗小媛阳光雨露均沾
1.8冬日暖阳栗小媛冬日里的阳光，那一缕温馨而又含蓄的阳光，映照着我这布满阴霾的冬日天空。就像开在我心中一朵热情的玫瑰，也似冰天雪地里凌寒独自的腊梅，开启我矇昧的心房，让我看到了黑暗背后那一束灿烂的光束——成长。冬日阳光照耀下的我竟显的有些懊恼、沮丧，就像一片刚飘离枝头的枯叶。是关于这次的马术比赛失利了，关键时刻步法错误导致中间的连续障碍跳跃卡顿了，注意力不够集中……下场后教练却温柔的在我耳边说了
27周周总结，预示着，这一学期结束了一方麦浪
当我敲下这周的周总结时，已经处于放假状态。上周重点是备战周四的比赛，一切以比赛为主。时间记录说明了一切。本周时间记录本周的工作学习时长达到历史第二，符合现状。本周用时108.9小时，有效时长91.8小时，纯工作学习时长65.6小时，平均每天用时9.37小时。排名第一的是教务教学，第二名的是社交链接，用21.3小时，第三名的是三餐休息17.1小时，排名第四的是12.4小时，积微事务排名第五，用时7.
多线程编程之join()方法周凡杨 java JOIN 多线程编程线程
现实生活中，有些工作是需要团队中成员依次完成的，这就涉及到了一个顺序问题。现在有T1、T2、T3三个工人，如何保证T2在T1执行完后执行，T3在T2执行完后执行？问题分析：首先问题中有三个实体，T1、T2、T3，因为是多线程编程，所以都要设计成线程类。关键是怎么保证线程能依次执行完呢？ Java实现过程如下： public class T1 implements Runnabl
java中switch的使用 bingyingao java enum break continue
java中的switch仅支持case条件仅支持int、enum两种类型。用enum的时候，不能直接写下列形式。 switch (timeType) { case ProdtransTimeTypeEnum.DAILY: break; default: br
hive having count 不能去重 daizj hive 去重 having count 计数
hive在使用having count()是，不支持去重计数 hive (default)> select imei from t_test_phonenum where ds=20150701 group by imei having count(distinct phone_num)>1 limit 10; FAILED: SemanticExcep
WebSphere对JSP的缓存周凡杨 WAS JSP 缓存
对于线网上的工程，更新JSP到WebSphere后，有时会出现修改的jsp没有起作用，特别是改变了某jsp的样式后，在页面中没看到效果，这主要就是由于websphere中缓存的缘故，这就要清除WebSphere中jsp缓存。要清除WebSphere中JSP的缓存，就要找到WAS安装后的根目录。现服务
设计模式总结朱辉辉33 java 设计模式
1.工厂模式 1.1 工厂方法模式 (由一个工厂类管理构造方法) 1.1.1普通工厂模式(一个工厂类中只有一个方法) 1.1.2多工厂模式(一个工厂类中有多个方法) 1.1.3静态工厂模式(将工厂类中的方法变成静态方法) &n
实例：供应商管理报表需求调研报告老A不折腾 finereport 报表系统报表软件信息化选型
引言随着企业集团的生产规模扩张，为支撑全球供应链管理，对于供应商的管理和采购过程的监控已经不局限于简单的交付以及价格的管理，目前采购及供应商管理各个环节的操作分别在不同的系统下进行，而各个数据源都独立存在，无法提供统一的数据支持；因此，为了实现对于数据分析以提供采购决策，建立报表体系成为必须。业务目标 1、通过报表为采购决策提供数据分析与支撑 2、对供应商进行综合评估以及管理，合理管理和
mysql 林鹤霄
转载源：http://blog.sina.com.cn/s/blog_4f925fc30100rx5l.html mysql -uroot -p ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password: YES) [root@centos var]# service mysql
Linux下多线程堆栈查看工具(pstree、ps、pstack) aigo linux
原文：http://blog.csdn.net/yfkiss/article/details/6729364 1. pstree pstree以树结构显示进程$ pstree -p work | grep adsshd(22669)---bash(22670)---ad_preprocess(4551)-+-{ad_preprocess}(4552) &n
html input与textarea 值改变事件 alxw4616 JavaScript
// 文本输入框(input) 文本域(textarea)值改变事件 // onpropertychange(IE) oninput(w3c) $('input,textarea').on('propertychange input', function(event) { console.log($(this).val()) });
String类的基本用法百合不是茶 String
字符串的用法; // 根据字节数组创建字符串 byte[] by = { 'a', 'b', 'c', 'd' }; String newByteString = new String(by); 1,length() 获取字符串的长度 &nbs
JDK1.5 Semaphore实例 bijian1013 java thread java多线程 Semaphore
Semaphore类一个计数信号量。从概念上讲，信号量维护了一个许可集合。如有必要，在许可可用前会阻塞每一个 acquire()，然后再获取该许可。每个 release() 添加一个许可，从而可能释放一个正在阻塞的获取者。但是，不使用实际的许可对象，Semaphore 只对可用许可的号码进行计数，并采取相应的行动。 S
使用GZip来压缩传输量 bijian1013 java GZip
启动GZip压缩要用到一个开源的Filter：PJL Compressing Filter。这个Filter自1.5.0开始该工程开始构建于JDK5.0，因此在JDK1.4环境下只能使用1.4.6。 PJL Compressi
【Java范型三】Java范型详解之范型类型通配符 bit1129 java
定义如下一个简单的范型类， package com.tom.lang.generics; public class Generics<T> { private T value; public Generics(T value) { this.value = value; } }
【Hadoop十二】HDFS常用命令 bit1129 hadoop
1. 修改日志文件查看器 hdfs oev -i edits_0000000000000000081-0000000000000000089 -o edits.xml cat edits.xml 修改日志文件转储为xml格式的edits.xml文件，其中每条RECORD就是一个操作事务日志 2. fsimage查看HDFS中的块信息等 &nb
怎样区别nginx中rewrite时break和last ronin47
在使用nginx配置rewrite中经常会遇到有的地方用last并不能工作，换成break就可以，其中的原理是对于根目录的理解有所区别，按我的测试结果大致是这样的。 location / { proxy_pass http://test;
java-21.中兴面试题输入两个整数 n 和 m ，从数列 1 ， 2 ， 3.......n 中随意取几个数 , 使其和等于 m bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; public class CombinationToSum { /* 第21 题 2010 年中兴面试题编程求解：输入两个整数 n 和 m ，从数列 1 ， 2 ， 3.......n 中随意取几个数 , 使其和等
eclipse svn 帐号密码修改问题开窍的石头 eclipse SVN svn帐号密码修改
问题描述： Eclipse的SVN插件Subclipse做得很好，在svn操作方面提供了很强大丰富的功能。但到目前为止，该插件对svn用户的概念极为淡薄，不但不能方便地切换用户，而且一旦用户的帐号、密码保存之后，就无法再变更了。解决思路：删除subclipse记录的帐号、密码信息，重新输入
[电子商务]传统商务活动与互联网的结合 comsci 电子商务
某一个传统名牌产品，过去销售的地点就在某些特定的地区和阶层，现在进入互联网之后，用户的数量群突然扩大了无数倍，但是，这种产品潜在的劣势也被放大了无数倍，这种销售利润与经营风险同步放大的效应，在最近几年将会频繁出现。。。。如何避免销售量和利润率增加的
java 解析 properties-使用 Properties-可以指定配置文件路径 cuityang java properties
#mq xdr.mq.url=tcp://192.168.100.15:61618; import java.io.IOException; import java.util.Properties; public class Test { String conf = "log4j.properties"; private static final
Java核心问题集锦 darrenzhu java 基础核心难点
注意，这里的参考文章基本来自Effective Java和jdk源码 1)ConcurrentModificationException 当你用for each遍历一个list时，如果你在循环主体代码中修改list中的元素，将会得到这个Exception，解决的办法是： 1)用listIterator, 它支持在遍历的过程中修改元素， 2)不用listIterator, new一个
1分钟学会Markdown语法 dcj3sjt126com markdown
markdown 简明语法基本符号 *,-,+ 3个符号效果都一样，这3个符号被称为 Markdown符号空白行表示另起一个段落 `是表示inline代码，tab是用来标记代码段，分别对应html的code，pre标签换行单一段落( <p>) 用一个空白行连续两个空格会变成一个 <br> 连续3个符号，然后是空行
Gson使用二（GsonBuilder） eksliang json gson GsonBuilder
转载请出自出处：http://eksliang.iteye.com/blog/2175473 一.概述 GsonBuilder用来定制java跟json之间的转换格式二.基本使用实体测试类：温馨提示：默认情况下@Expose注解是不起作用的,除非你用GsonBuilder创建Gson的时候调用了GsonBuilder.excludeField
报ClassNotFoundException: Didn't find class "...Activity" on path: DexPathList gundumw100 android
有一个工程，本来运行是正常的，我想把它移植到另一台PC上，结果报： java.lang.RuntimeException: Unable to instantiate activity ComponentInfo{com.mobovip.bgr/com.mobovip.bgr.MainActivity}: java.lang.ClassNotFoundException: Didn't f
JavaWeb之JSP指令 ihuning javaweb
要点 JSP指令简介 page指令 include指令 JSP指令简介 JSP指令（directive）是为JSP引擎而设计的，它们并不直接产生任何可见输出，而只是告诉引擎如何处理JSP页面中的其余部分。 JSP指令的基本语法格式： <%@ 指令属性名="
mac上编译FFmpeg跑ios 啸笑天 ffmpeg
1、下载文件：https://github.com/libav/gas-preprocessor，复制gas-preprocessor.pl到/usr/local/bin/下，修改文件权限：chmod 777 /usr/local/bin/gas-preprocessor.pl 2、安装yasm-1.2.0 curl http://www.tortall.net/projects/yasm
sql mysql oracle中字符串连接 macroli oracle sql mysql SQL Server
有的时候，我们有需要将由不同栏位获得的资料串连在一起。每一种资料库都有提供方法来达到这个目的： MySQL: CONCAT() Oracle: CONCAT(), || SQL Server: + CONCAT() 的语法如下： Mysql 中 CONCAT(字串1, 字串2, 字串3, ...): 将字串1、字串2、字串3，等字串连在一起。请注意，Oracle的CON
Git fatal: unab SSL certificate problem: unable to get local issuer ce rtificate qiaolevip 学习永无止境每天进步一点点 git 纵观千象
// 报错如下： $ git pull origin master fatal: unable to access 'https://git.xxx.com/': SSL certificate problem: unable to get local issuer ce rtificate // 原因：由于git最新版默认使用ssl安全验证，但是我们是使用的git未设
windows命令行设置wifi surfingll windows wifi 笔记本wifi
还没有讨厌无线wifi的无尽广告么，还在耐心等待它慢慢启动么教你命令行设置笔记本电脑wifi： 1、开启wifi命令 netsh wlan set hostednetwork mode=allow ssid=surf8 key=bb123456 netsh wlan start hostednetwork pause 其中pause是等待输入，可以去掉 2、
Linux（Ubuntu）下安装sysv-rc-conf wmlJava linux ubuntu sysv-rc-conf
安装：sudo apt-get install sysv-rc-conf 使用：sudo sysv-rc-conf 操作界面十分简洁，你可以用鼠标点击，也可以用键盘方向键定位，用空格键选择，用Ctrl+N翻下一页，用Ctrl+P翻上一页，用Q退出。背景知识 sysv-rc-conf是一个强大的服务管理程序，群众的意见是sysv-rc-conf比chkconf
svn切换环境，重发布应用多了javaee标签前缀 zengshaotao javaee
更换了开发环境，从杭州，改变到了上海。svn的地址肯定要切换的，切换之前需要将原svn自带的.svn文件信息删除，可手动删除，也可通过废弃原来的svn位置提示删除.svn时删除。然后就是按照最新的svn地址和规范建立相关的目录信息，再将原来的纯代码信息上传到新的环境。然后再重新检出，这样每次修改后就可以看到哪些文件被修改过，这对于增量发布的规范特别有用。检出

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他