Beta Lemon

【动手学数据分析】 Task05 - 模型建立和评估

建模和评估的基本流程：

读入数据集

特征工程

分割训练集和测试集

创建模型

输出模型预测结果

模型评估

零、特征工程

导入数据：

import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
from IPython.display import Image

plt.rcParams['font.sans-serif'] = ['SimHei']  # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False  # 用来正常显示负号
plt.rcParams['figure.figsize'] = (10, 6)  # 设置输出图片大小

# 读取训练数集
train = pd.read_csv('train.csv')

在读入数据集后，需要对数据的处理进行某些操作以方便后续的模型建立及训练。

1. 填充缺失值：.fillna()

连续变量：平均数、中位数、众数
分类变量：NA、最多的类别

# 检查缺失值比例
train.isnull().sum().sort_values(ascending=False)

Embarked       0
Cabin          0
Fare           0
Ticket         0
Parch          0
SibSp          0
Age            0
Sex            0
Name           0
Pclass         0
Survived       0
PassengerId    0
dtype: int64

2. 对分类变量编码：pandas.get_dummies()

例如只有两种可能的类别

# 取出所有的输入特征
data = train[['Pclass','Sex','Age','SibSp','Parch','Fare', 'Embarked']]
# 进行虚拟变量转换
data = pd.get_dummies(data)

一、建立模型

处理数据后就需要建立模型了，在建模之前需选择合适的模型。

先确定数据集的种类：监督学习，无监督学习
选择依据：任务、数据样本量、特征的稀疏性
步骤：先尝试使用一个基本的模型作为其baseline，之后再用其他模型做对比，最后选择泛化能力或性能较好的模型。

1.1 切割训练集和测试集

目的：便于后续评估模型的泛化能力
切割方法：
- 按比例切割：一般有30%、25%、15%和10%
- 按目标变量分层等比切割
- 设置随机种子复现结果
sklearn中切割数据的方法： train_test_split()

切割数据集的时候不用进行随机选取的情况：数据集本身已经经过随机处理或样本量足够大。

from sklearn.model_selection import train_test_split

# 一般先取出X和y后再切割，当使用到未切割的时候就可以用X和y
X = data
y = train['Survived']

# 对数据集进行切割
X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=0)

# 查看训练集测试集大小
X_train.shape, X_test.shape
# ((668, 10), (223, 10))

1.2 模型创建

模型类别

基于线性模型（sklearn.linear_model）的分类模型：逻辑回归（逻辑回归是分类模型，线性回归才是回归模型）
基于树（sklearn.ensemble）的分类模型：决策树、随机森林（随机森林是决策树集为了降低决策树过拟合的情况）

证明为什么可以使用线性回归来做二元分类问题：《机器学习笔记-利用线性模型进行分类》

from sklearn.linear_model import LogisticRegression
from sklearn.ensemble import RandomForestClassifier

# 默认参数逻辑回归模型
lr = LogisticRegression()
lr.fit(X_train, y_train)
# 查看训练集和测试集score值
print("Training set score: {:.2f}".format(lr.score(X_train, y_train)))
print("Testing set score: {:.2f}".format(lr.score(X_test, y_test)))
# 调整参数后的逻辑回归模型
lr2 = LogisticRegression(C=100)
lr2.fit(X_train, y_train)
print("Training set score: {:.2f}".format(lr2.score(X_train, y_train)))
print("Testing set score: {:.2f}".format(lr2.score(X_test, y_test)))

测试集上的分数在调参之后提升了。

# 默认参数的随机森林分类模型
rfc = RandomForestClassifier()
rfc.fit(X_train, y_train)
print("Training set score: {:.2f}".format(rfc.score(X_train, y_train)))
print("Testing set score: {:.2f}".format(rfc.score(X_test, y_test)))
# 调整参数后的随机森林分类模型
rfc2 = RandomForestClassifier(n_estimators=100, max_depth=5)
rfc2.fit(X_train, y_train)
print("Training set score: {:.2f}".format(rfc2.score(X_train, y_train)))
print("Testing set score: {:.2f}".format(rfc2.score(X_test, y_test)))

1.3 输出模型预测结果

一般监督模型在sklearn里面，predict输出预测标签，predict_proba输出标签概率

# 预测标签
pred = lr.predict(X_train)
# 预测标签概率
pred_proba = lr.predict_proba(X_train)

二、模型评估

目的：获得模型的泛化能力
方法：交叉验证（cross-validation）
- 数据被多次划分，并且需要训练多个模型
- 最常用的交叉验证是 k 折交叉验证（k-fold cross-validation），其中 k 是由用户指定的数字，通常取 5 或 10。
- 参考李宏毅《机器学习》Task03 - 误差和梯度下降中误差的第3节
准确率（precision）度量被预测为正例的样本中有多少是真正的正例
召回率（recall）度量正类样本中有多少被预测为正类（TP）
f-分数是准确率与召回率的调和平均

2.1 交叉验证

sklearn中的模块：sklearn.model_selection

from sklearn.model_selection import cross_val_score

# 用10折交叉验证来评估逻辑回归模型
lr = LogisticRegression(C=100)
scores = cross_val_score(lr, X_train, y_train, cv=10)

# k折交叉验证分数
scores

# 平均交叉验证分数
print("Average cross-validation score: {:.2f}".format(scores.mean()))

K折越多，消耗时间增加，但是平均误差被视为泛化误差，结果更可靠。

2.2 混淆矩阵

对于二分类问题常用的评价指标是精确率(precision)和召回率(recall)，评价分类器的指标一般是分类准确率(accuracy)

分类器在测试数据集上的预测或正确或不正确，其有四种情况：

sklearn中的模块：sklearn.metrics
混淆矩阵需要输入真实标签和预测标签

from sklearn.metrics import confusion_matrix

# 训练模型
lr = LogisticRegression(C=100)
lr.fit(X_train, y_train)

# 模型预测结果
pred = lr.predict(X_train)
# 混淆矩阵
confusion_matrix(y_train, pred)

from sklearn.metrics import classification_report
# 精确率、召回率以及f1-score
print(classification_report(y_train, pred))

2.3 ROC曲线

ROC曲线在sklearn中的模块为 sklearn.metrics
ROC曲线下面所包围的面积越大越好

from sklearn.metrics import roc_curve

fpr, tpr, thresholds = roc_curve(y_test, lr.decision_function(X_test))
plt.plot(fpr, tpr, label="ROC Curve")
plt.xlabel("FPR")
plt.ylabel("TPR (recall)")
# 找到最接近于0的阈值
close_zero = np.argmin(np.abs(thresholds))
plt.plot(fpr[close_zero], tpr[close_zero], 'o', markersize=10, label="threshold zero", fillstyle="none", c='k', mew=2)
plt.legend(loc=4)

你可能感兴趣的:(动手学数据分析,sklearn,机器学习,python,数据分析,numpy)

Python全网最全基础课程笔记(十三)——作用域，跟着思维导图和图文来学习，爆肝2w字，无数代码案例！长风清留扬最新Python入门基础合集 python 笔记学习作用域面试跳槽改行学it
本专栏系列为Pythong基础系列，每篇内容非常全面，包含全网各个知识点，非常长，请耐心看完。每天都会更新新的内容，搜罗全网资源以及自己在学习和工作过程中的一些总结，可以说是非常详细和全面。以至于为什么要写的这么详细：自己也是学过Python的，很多新手只是简单的过一篇语法，其实对于一个知识点的底层逻辑和其他使用方法以及参数详情根本不是很了解，这就导致学完很容易忘记，而且在实战过程中也是半知半解，
Python全网最全基础课程笔记(三)——所有运算符+运算符优先级长风清留扬最新Python入门基础合集开发语言 python 运算符 Python基础 numpy pandas pip
本专栏系列为Pythong基础系列，每天都会更新新的内容，搜罗全网资源以及自己在学习和工作过程中的一些总结，可以说是非常详细和全面。以至于为什么要写的这么详细：自己也是学过Python的，很多新手只是简单的过一篇语法，其实对于一个知识点的底层逻辑和其他使用方法以及参数详情根本不是很了解，这就导致学完很容易忘记，而且在实战过程中也是半知半解，所以自己就尽量写的详细些，让需要的人能更了解Python的
python中json的使用余生的观澜 python技术栈 json python 开发语言
问题与背景在python中对json的使用无非就是以下几种：dict转json字符串json字符串转dictdict类型写入json文件json文件读取为dict类型解决方案与总结变量类型的映射dict与json互相转化importjsontesdic={'name':'Tom','age':18,'score':{'math':98,'chinese':99}}print(type(tesdic
金融数据有哪些，有用的股票API接口数据 nance99 金融 python git
一、金融数据有哪些，有用的股票API接口行情数据金融大数据是为金融机构、个人投资者以及金融应用开发者提供专业的数据和行情报价API服务，满足不同用户在投资过程中丰富多样的行情数据分析和投资研究，以API接口形式为用户提供行情数据API服务，提供的数据包括市场行情、财报、宏观等，还有基于文本分析的股票关联数据。对金融机构或者投资者而言，金融数据是企业财富。实时数据对企业成功至关重要，股票行情数据种类
python pack中padx和pady的用法,padx(10,5)是什么意思 huiyuanzhenduo python 前端开发语言
在Python的Tkinter库中，`pack`方法用于添加小部件（如按钮、标签、框架等）到窗口中。`padx`和`pady`是`pack`方法的可选参数，用于控制小部件内部和外部的填充（或空隙）。-`padx`：控制小部件的！！！左右外边距！！！（水平填充）。它的值指定了小部件两侧的额外空间，单位是像素。-`pady`：控制小部件的上下外边距（垂直填充）。它的值指定了小部件上下的额外空间，单位也
银联付款服务器部署 dGcgQGludm9rZXlvdQ== 服务器运维安全
服务器选择Debian是个不错的选择，建议使用Debian11或12最小配置建议：1核CPU、1GB内存、20GB存储空间环境准备#更新系统aptupdate&&aptupgrade-y#安装必要工具aptinstallpython3python3-pipgitnginx-y#安装Python依赖pip3installflaskpycryptodomerequests代码部署#创建项目目录mkdi
2025数学建模美赛B题完整建模思路——管理可持续旅游业鹿鹿数模数学建模
2025MCM问题B：管理可持续旅游业以下是我们对该题目的赛题分析，由于完整内容过长，因此在此处放出部分内容，欢迎从文末小卡片处加群获取。赛题分析以下内容包括三个主要部分：(1)题目的中文翻译(2)对题目的整体分析与思路综述(3)对题目要求的逐项详细分析与求解思路。本文的撰写将综合运用多元的数学模型、算法以及机器学习/深度学习的方法，并在必要时给出题外假设与可行的创新性思路，以期为参赛者提供较为系
Python--进程和线程 Ssaty. python 开发语言
第1关：Python多进程-求素数个数本关任务：使用Python多进程求素数个数。importmathfrommultiprocessingimportcpu_countfrommultiprocessingimportPool#判断数字是否为质数#**********Begin*****
Python pact契约测试实战司小幽测试开发 #自动化 #Python 测试测试开发自动化测试契约测试 python
目录1.pact-python契约测试示例2.生产者端，用于生成数据内容3.1号消费者4.2号消费者1.pact-python契约测试示例'''pact-python契约测试示例'''importatexitimportunittestimportrequestsfrompactimportConsumerfrompactimportProvider#定义一个契约（pact)，明确消费者与生产者，
2025年全国CTF夺旗赛-从零基础入门到竞赛，看这一篇就稳了！白帽安全-黑客4148 网络安全 web安全 linux 密码学 CTF python ddos
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包目录一、CTF简介二、CTF竞赛模式三、CTF各大题型简介四、CTF学习路线4.1、初期1、html+css+js（2-3天）2、apache+php（4-5天）3、mysql（2-3天）4、python(2-3天)5、burpsuite（1-2天）4.2、中期1、SQL注入（7-8天）2、文件上传（7-8天）3、其他漏洞（14-15
程序代码篇---python回调函数&异步编程 Ronin-Lotus 程序代码篇 python 前端开发语言学习程序人生回调函数异步编程
文章目录前言第一部分：Python的回调函数1.基本概念2.如何实现定义回调函数：定义主函数：例子3.回调函数的应用场景事件处理异步编程库和框架注意事项调用时机错误处理闭包第二部分：async和await关键字1.异步编程的概念2.async定义用法特性3.await定义用法特性4.异步编程的例子5.注意事项总结前言以上就是今天要讲的内容，本文简单介绍了Python中的回调函数以及异步编程。第一部
奇怪的比赛（Python，递归，状态压缩动态规划dp）不染_是非 python 算法 python 动态规划算法蓝桥杯
目录前言：题目：思路：递归：代码及详细注释：状态压缩dp：代码及详细注释：总结：前言：这道题原本是蓝桥上的题，现在搜不到了，网上关于此题的讲解更是寥寥无几，仅有的讲解也只是递归思想，python讲解和状态压缩dp的解决方法都没有，这里就带大家用状态压缩dp方法来解决此题。题目：大奖赛计分规则：每位选手需要回答10个问题（其编号为1到10），越后面越有难度。答对的，当前分数翻倍；答错了，则扣掉与题号
Python量化金融都需要用到哪些库？最全汇总中年猿人 python 金融开发语言
今天分享一篇Python量化金融最全汇总，推荐大家收藏～记得划到文末点赞呐～本文汇总了定量金融的大量三方库，按功能进行分类，覆盖数值运算，衍生品定价，回溯检验，风险管理，数据爬取，可视化等多个子领域，供每个Python程序员参考。不要重复造轮子，明确要解决的问题，然后寻找相应的工具。很多著名的包如Numpy，Pandas，Seaborn，backtrader等已经被证明高度有效，即便没有找到符合应
使用 Python 开发一个 AI Agent 自媒体助手示例程序员陆通 python 人工智能媒体
1.项目背景随着自媒体行业的快速发展，内容创作者需要处理大量重复性任务，例如撰写文章、生成标题、优化关键词、分析数据等。通过开发一个AIAgent自媒体助手，可以帮助创作者高效完成这些任务，节省时间并提升内容质量。本文将展示如何使用Python构建一个简单的AIAgent自媒体助手，支持以下功能：自动生成文章标题。根据关键词生成文章段落。分析文章的关键词密度。2.技术架构AIAgent自媒体助手的
微信小程序-点餐（美食屋）02开发实践你我哈微信小程序微信小程序小程序美食 html php
目录概要整体架构流程（一）用户注册与登录（二）菜品浏览与点餐（三）订单管理（四）后台管理部分代码展示1.index.wxml2.list.wxml3.checkout.wxml4.detail.wxml小结优点概要01篇让我们成功搭建开发环境，现在让我们着手开发“美食屋”点餐系统了。下面，我会用PHP和MySQL实现系统核心功能，像用户注册登录、展示和管理菜品，以及处理订单。快一起动手，让“美食屋
Python快速使用jira模块调用Jira接口小斌哥ge Python/PYPI jira
Python快速使用jira模块调用Jira接口JIRA介绍:JIRA是Atlassian公司出品的项目与事务跟踪工具，被广泛应用于缺陷跟踪、需求收集、流程审批、任务跟踪、项目跟踪和敏捷管理等工作领域.在开发工作中,Jira通常用作BUG管理和任务跟踪管理等,项目经理,测试人员,开发人员等在Jira上进行提交BUG,提交任务,修改任务进度等操作.当项目逐渐多时,Jira上的BUG数量和任务数量也会
智能运维分析决策系统：赋能数字化转型的智慧引擎我的运维人生运维运维开发技术共享
智能运维分析决策系统：赋能数字化转型的智慧引擎在数字化转型的大潮中，企业运维管理正经历着从传统手动运维向智能化、自动化运维的深刻转变。智能运维分析决策系统（AIOps，ArtificialIntelligenceforITOperations）作为这一转变的核心驱动力，通过融合大数据、机器学习、人工智能等先进技术，实现了对运维数据的深度洞察与智能决策，极大地提升了运维效率与质量，为企业数字业务的连
Python实现SMTP自动发邮件全流程指南福建低调
本文还有配套的精品资源，点击获取简介：SMTP是互联网用于发送电子邮件的标准协议，Python提供便利的库来实现这一功能。本文将介绍如何利用Python的smtplib和email.mime库通过SMTP自动发送邮件，包括设置服务器、登录验证、构建邮件对象、发送邮件，并提供了一个代码示例。文章还强调安全性和常见问题的解决方案，为初学者提供详细步骤和视觉辅助。1.SMTP协议基础在互联网技术飞速发展
AirSim学习（3）AirSim的PythonAPI基本操作——环境配置与VehicleClient类睡觉狂魔er AirSim 虚幻自动驾驶 python
文章内容AirSim学习笔记汇总AirSim的PythonAPI的安装AirSim的坐标系统classVehicleClient1.成员变量2.构造函数3.连接与仿真启停resetpinggetClientVersiongetServerVersiongetMinRequiredServerVersiongetMinRequiredClientVersionenableApiControlisAp
ROS2 细节知识学习儒雅芝士 ROS2系列机器人 c++linux
1.rosidl_generate_interfaces()在ROS2中，rosidl_generate_interfaces是一个关键的构建工具功能。它主要用于从接口定义文件（如.msg消息文件、.srv服务文件和.action动作文件）生成不同编程语言（如C++、Python等）可以使用的接口代码。这些接口是ROS2中节点间通信的基础，确保了数据在不同组件之间能够准确、高效地传递。在构建系统中
Python对jira的调用万公子测试
1：首先要知道基本属性#-*-coding:utf-8-*-importdatetimefromjiraimportJIRAjira_ip="127.0.0.1"jira_user='ceshi1'jira_passwd="1"port=8080jr=JIRA('http://'+jira_ip+':8080/',auth=(jira_user,jira_passwd))#登录all_bug=jr
使用python连接jira，获取issues 坚韧顽强的搬砖小伙 python学习手册 python 开发语言后端
需要自行配置所需的url及auth信息代码如下defget_jira_issues(jqlquery):'''传入jql语句,返回issues的dict:paramjqlquery::return:'''url="https://example.com/rest/api/2/search"auth=HTTPBasicAuth("username","password")headers={"Acce
GFPGAN - 腾讯开源的图形修复算法修复算法小众AI AI开源开源算法人工智能
GFPGAN是腾讯开源的人脸修复算法，它利用预先训练好的面部修复算法，并且封装了各种丰富多样的先验因素进行盲脸(blindface)修复，可以对老照片进行很好的修复。35800Stars5900Forks345Issues11贡献者ApacheLicensePython语言代码:https://github.com/TencentARC/GFPGAN更多AI开源软件：AI开源-小众AI主要功能盲修
ubuntu电脑调用摄像头拍摄照片山山而川_R Drugs opencv 计算机视觉人工智能
一、1、先装环境condacreate-ntextpython==3.8-ycondaactivatetext2、pipinstallopencv-python-ihttps://pypi.tuna.tsinghua.edu.cn/simple1、连接摄像头拍摄收集数据集capture_image5.pyimportcv2ascvimportosimportdatetimeimportnumpya
【AirSim+Python】image API和无人机获取图像退堂鼓选手⑥ python 无人机开发语言
没错！这个还是b站【皮卡丘上大学啦】up主学习的代码。我就是懒！今天下午敲得每一行代码都不能白敲，放在这方便我以后复制！up主原代码分享链接：在这！！！1.imageAPI获取相机图像使用的时候根据自己需求进行注释：importairsimimportnumpyasnpimportcv2#与airsim建立连接client=airsim.MultirotorClient()client.confi
【AirSim+Python】无人机简单API控制-Python代码退堂鼓选手⑥ 无人机 python
1.无人机起飞/下降importairsim#与airsim建立连接client=airsim.MultirotorClient()client.confirmConnection()#确定是否要用API控制client.enableApiControl(True)#解锁无人机转起来client.armDisarm(True)#join()等任务结束再进行下个任务#起飞client.takeoff
使用 Python 和 Tesseract 实现验证码识别一休哥助手 mfc c++
验证码识别是一个常见且实用的技术需求，尤其是在自动化测试和数据采集场景中。通过开源OCR（OpticalCharacterRecognition，光学字符识别）工具Tesseract，结合Python的强大生态，我们可以高效实现验证码识别任务。本篇博客将以详细步骤和代码示例，介绍如何使用Python和Tesseract实现验证码识别，包括原理解析、图像预处理、代码实现以及优化策略。一、验证码识别的
AirSim 利用pygame绘制窗口并获取无人机FPV实时图像呈现 fegxg pygame 无人机 python
利用pygame绘制窗口并获取无人机FPV实时图像呈现的代码如下：importsysimporttimeimportairsimimportpygameimportcv2importnumpyasnp#>------>>>pygamesettings------>>>AirSimsettings<<<------<##这里改为你要控制的无人机名称(settings文件里面设置的)vehicle_n
Python知识点：基于Python技术，如何使用AirSim进行无人机模拟超哥同学 Python系列 python 无人机开发语言面试编程
开篇，先说一个好消息，截止到2025年1月1日前，翻到文末找到我，赠送定制版的开题报告和任务书，先到先得！过期不候！如何使用Python和AirSim进行无人机模拟无人机技术的发展为许多行业带来了革命性的变化，尤其是在航拍、物流配送和农业监测等领域。然而，无人机的操作和开发需要一个安全且可控的环境来进行测试和训练。AirSim就是这样一个模拟器，它提供了一个基于UnrealEngine的逼真环境，
AirSim python通信环境配置和无人机控制 fegxg 无人机 python
本人学习课程链接【AirSim】无人机踏上飞行的征途——第三课-AirSim&Python通信环境配置以及无人机起飞降落、位置控制&速度控制_哔哩哔哩_bilibili，本系列文章对其代码做一个总结和解读一、起飞降落importairsim#connecttotheAirsimsimulatorclient=airsim.MultirotorClient()client.confirmConnec
分享100个最新免费的高匿HTTP代理IP mcj8089 代理IP 代理服务器匿名代理免费代理IP 最新代理IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ 120.198.243.130:80,中国/广东省 58.251.78.71:8088,中国/广东省 183.207.228.22:83,中国/
mysql高级特性之数据分区 annan211 java 数据结构 mongodb 分区 mysql
mysql高级特性 1 以存储引擎的角度分析，分区表和物理表没有区别。是按照一定的规则将数据分别存储的逻辑设计。器底层是由多个物理字表组成。 2 分区的原理分区表由多个相关的底层表实现，这些底层表也是由句柄对象表示，所以我们可以直接访问各个分区。存储引擎管理分区的各个底层表和管理普通表一样(所有底层表都必须使用相同的存储引擎)，分区表的索引只是
JS采用正则表达式简单获取URL地址栏参数 chiangfai js 地址栏参数获取
GetUrlParam:function GetUrlParam(param){ var reg = new RegExp("(^|&)"+ param +"=([^&]*)(&|$)"); var r = window.location.search.substr(1).match(reg); if(r!=null
怎样将数据表拷贝到powerdesigner (本地数据库表) Array_06 powerDesigner
================================================== 1、打开PowerDesigner12，在菜单中按照如下方式进行操作 file->Reverse Engineer->DataBase 点击后，弹出 New Physical Data Model 的对话框 2、在General选项卡中 Model name:模板名字，自
logbackのhelloworld 飞翔的马甲日志 logback
一、概述 1.日志是啥？当我是个逗比的时候我是这么理解的：log.debug()代替了system.out.print(); 当我项目工作时，以为是一堆得.log文件。这两天项目发布新版本，比较轻松，决定好好地研究下日志以及logback。传送门1：日志的作用与方法： http://www.infoq.com/cn/articles/why-and-how-log 上面的作
新浪微博爬虫模拟登陆随意而生新浪微博
转载自：http://hi.baidu.com/erliang20088/item/251db4b040b8ce58ba0e1235 近来由于毕设需要，重新修改了新浪微博爬虫废了不少劲，希望下边的总结能够帮助后来的同学们。现行版的模拟登陆与以前相比，最大的改动在于cookie获取时候的模拟url的请求
synchronized 香水浓 java thread
Java语言的关键字，可用来给对象和方法或者代码块加锁，当它锁定一个方法或者一个代码块的时候，同一时刻最多只有一个线程执行这段代码。当两个并发线程访问同一个对象object中的这个加锁同步代码块时，一个时间内只能有一个线程得到执行。另一个线程必须等待当前线程执行完这个代码块以后才能执行该代码块。然而，当一个线程访问object的一个加锁代码块时，另一个线程仍然
maven 简单实用教程 AdyZhang maven
1. Maven介绍 1.1. 简介 java编写的用于构建系统的自动化工具。目前版本是2.0.9，注意maven2和maven1有很大区别，阅读第三方文档时需要区分版本。 1.2. Maven资源见官方网站；The 5 minute test，官方简易入门文档；Getting Started Tutorial，官方入门文档；Build Coo
Android 通过 intent传值获得null aijuans android
我在通过intent 获得传递兑现过的时候报错，空指针,我是getMap方法进行传值，代码如下 1 2 3 4 5 6 7 8 9 public void getMap(View view){ Intent i =
apache 做代理报如下错误：The proxy server received an invalid response from an upstream baalwolf response
网站配置是apache＋tomcat,tomcat没有报错，apache报错是： The proxy server received an invalid response from an upstream server. The proxy server could not handle the request GET /. Reason: Error reading fr
Tomcat6 内存和线程配置 BigBird2012 tomcat6
1、修改启动时内存参数、并指定JVM时区（在windows server 2008 下时间少了8个小时）在Tomcat上运行j2ee项目代码时，经常会出现内存溢出的情况，解决办法是在系统参数中增加系统参数： window下，在catalina.bat最前面 set JAVA_OPTS=-XX:PermSize=64M -XX:MaxPermSize=128m -Xms5
Karam与TDD bijian1013 Karam TDD
一.TDD 测试驱动开发（Test-Driven Development,TDD）是一种敏捷（AGILE）开发方法论，它把开发流程倒转了过来，在进行代码实现之前，首先保证编写测试用例，从而用测试来驱动开发（而不是把测试作为一项验证工具来使用）。 TDD的原则很简单： a.只有当某个
[Zookeeper学习笔记之七]Zookeeper源代码分析之Zookeeper.States bit1129 zookeeper
public enum States { CONNECTING, //Zookeeper服务器不可用，客户端处于尝试链接状态 ASSOCIATING, //？？？ CONNECTED, //链接建立，可以与Zookeeper服务器正常通信 CONNECTEDREADONLY, //处于只读状态的链接状态，只读模式可以在
【Scala十四】Scala核心八：闭包 bit1129 scala
Free variable A free variable of an expression is a variable that’s used inside the expression but not defined inside the expression. For instance, in the function literal expression (x: Int) => (x
android发送json并解析返回json ronin47 android
package com.http.test; import org.apache.http.HttpResponse; import org.apache.http.HttpStatus; import org.apache.http.client.HttpClient; import org.apache.http.client.methods.HttpGet; import
一份IT实习生的总结 brotherlamp PHP php资料 php教程 php培训 php视频
今天突然发现在不知不觉中自己已经实习了 3 个月了，现在可能不算是真正意义上的实习吧，因为现在自己才大三，在这边撸代码的同时还要考虑到学校的功课跟期末考试。让我震惊的是，我完全想不到在这 3 个月里我到底学到了什么，这是一件多么悲催的事情啊。同时我对我应该 get 到什么新技能也很迷茫。所以今晚还是总结下把，让自己在接下来的实习生活有更加明确的方向。最后感谢工作室给我们几个人这个机会让我们提前出来
据说是2012年10月人人网校招的一道笔试题-给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。将重物放到天平左侧，问在两边如何添加砝码 bylijinnan java
public class ScalesBalance { /** * 题目： * 给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。（假设N无限大，但一种重量的砝码只有一个） * 将重物放到天平左侧，问在两边如何添加砝码使两边平衡 * * 分析： * 三进制 * 我们约定括号表示里面的数是三进制，例如 47=(1202
dom4j最常用最简单的方法 chiangfai dom4j
要使用dom4j读写XML文档,需要先下载dom4j包,dom4j官方网站在 http://www.dom4j.org/目前最新dom4j包下载地址:http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.zip 解开后有两个包,仅操作XML文档的话把dom4j-1.6.1.jar加入工程就可以了,如果需要使用XPath的话还需要
简单HBase笔记 chenchao051 hbase
一、Client-side write buffer 客户端缓存请求描述：可以缓存客户端的请求，以此来减少RPC的次数，但是缓存只是被存在一个ArrayList中，所以多线程访问时不安全的。可以使用getWriteBuffer()方法来取得客户端缓存中的数据。默认关闭。二、Scan的Caching 描述： next( )方法请求一行就要使用一次RPC,即使
mysqldump导出时出现when doing LOCK TABLES daizj mysql mysqdump 导数据
　　执行　mysqldump -uxxx -pxxx -hxxx -Pxxxx database tablename > tablename.sql　导出表时，会报 mysqldump: Got error: 1044: Access denied for user 'xxx'@'xxx' to database 'xxx' when doing LOCK TABLES 解决
CSS渲染原理 dcj3sjt126com Web
从事Web前端开发的人都与CSS打交道很多，有的人也许不知道css是怎么去工作的，写出来的css浏览器是怎么样去解析的呢？当这个成为我们提高css水平的一个瓶颈时，是否应该多了解一下呢？一、浏览器的发展与CSS
《阿甘正传》台词 dcj3sjt126com
Part Ⅰ: 《阿甘正传》Forrest Gump经典中英文对白 Forrest: Hello! My names Forrest. Forrest Gump. You wanna Chocolate? I could eat about a million and a half othese. My momma always said life was like a box ochocol
Java处理JSON dyy_gusi json
Json在数据传输中很好用，原因是JSON 比 XML 更小、更快，更易解析。在Java程序中，如何使用处理JSON，现在有很多工具可以处理，比较流行常用的是google的gson和alibaba的fastjson，具体使用如下： 1、读取json然后处理 class ReadJSON { public static void main(String[] args)
win7下nginx和php的配置 geeksun nginx
1. 安装包准备 nginx : 从nginx.org下载nginx-1.8.0.zip php：从php.net下载php-5.6.10-Win32-VC11-x64.zip， php是免安装文件。 RunHiddenConsole: 用于隐藏命令行窗口 2. 配置 # java用8080端口做应用服务器，nginx反向代理到这个端口即可 p
基于2.8版本redis配置文件中文解释 hongtoushizi redis
转载自： http://wangwei007.blog.51cto.com/68019/1548167 在Redis中直接启动redis-server服务时, 采用的是默认的配置文件。采用redis-server xxx.conf 这样的方式可以按照指定的配置文件来运行Redis服务。下面是Redis2.8.9的配置文
第五章常用Lua开发库3-模板渲染 jinnianshilongnian nginx lua
动态web网页开发是Web开发中一个常见的场景，比如像京东商品详情页，其页面逻辑是非常复杂的，需要使用模板技术来实现。而Lua中也有许多模板引擎，如目前我在使用的lua-resty-template，可以渲染很复杂的页面，借助LuaJIT其性能也是可以接受的。如果学习过JavaEE中的servlet和JSP的话，应该知道JSP模板最终会被翻译成Servlet来执行；而lua-r
JZSearch大数据搜索引擎颠覆者 JavaScript
系统简介：大数据的特点有四个层面：第一，数据体量巨大。从TB级别，跃升到PB级别；第二，数据类型繁多。网络日志、视频、图片、地理位置信息等等。第三，价值密度低。以视频为例，连续不间断监控过程中，可能有用的数据仅仅有一两秒。第四，处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”——Volume，Variety，Value，Velocity。大数据搜索引
10招让你成为杰出的Java程序员 pda158 java 编程框架
如果你是一个热衷于技术的 Java 程序员，那么下面的 10 个要点可以让你在众多 Java 开发人员中脱颖而出。　　 1. 拥有扎实的基础和深刻理解 OO 原则　　对于 Java 程序员，深刻理解 Object Oriented Programming（面向对象编程）这一概念是必须的。没有 OOPS 的坚实基础，就领会不了像 Java 这些面向对象编程语言
tomcat之oracle连接池配置小网客 oracle
tomcat版本7.0 配置oracle连接池方式：修改tomcat的server.xml配置文件： <GlobalNamingResources> <Resource name="utermdatasource" auth="Container" type="javax.sql.DataSou
Oracle 分页算法汇总 vipbooks oracle sql 算法 .net
这是我找到的一些关于Oracle分页的算法，大家那里还有没有其他好的算法没？我们大家一起分享一下！ -- Oracle 分页算法一 select * from ( select page.*,rownum rn from (select * from help) page -- 20 = (currentPag

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他