佛系MAN

打卡-Task2:数据的探索性分析（EDA）

打卡-Task2:数据的探索性分析（EDA）

- 载入数据库
- 载入数据
- 数据查看
- 总览数据概况
- 判断数据的异常和缺失
- 预处理数据
- 了解预测值的分布
- 查看特征的分布
- 用pandas_profiling生成数据报告
- 经验总结

载入数据库

pandas和numpy作为数据科学库导入，matplotlib和seaborn作为可视化的库导入

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import missingno as msno

载入数据

sep=’ ’以’ '为数据分隔符读取

path = 'C:/Users/61499/Desktop/二手车交易/'
Train_data_load = open(path+'used_car_train_20200313.csv')
Test_data_load = open(path+'used_car_testA_20200313.csv')
Train_data = pd.read_csv(Train_data_load,sep=' ')
Test_data = pd.read_csv(Test_data_load,sep=' ')

数据查看

Train_data.head().append(Train_data.tail())
Train_data.shape
Test_data.head().append(Train_data.tail())
Test_data.shape

常用的pandas数据查看函数：
train.head(5) #显示前5行数据
train.tail(5) #显示后5行
train.columns #查看列名
train.info() #查看各字段的信息
train.shape #查看数据集行列分布，几行几列

总览数据概况

使用describe总览数据概况

describe种有每列的统计量，个数count、平均值mean、方差std、最小值min、中位数25% 50% 75% 、以及最大值看这个信息主要是瞬间掌握数据的大概的范围以及每个值的异常值的判断，比如有的时候会发现999 9999 -1 等值这些其实都是nan的另外一种表达方式，有的时候需要注意下。

Train_data.describe()
Test_data.describe()

使用info()查看数据类型和缺失值

info 通过info来了解数据每列的type，有助于了解是否存在除了nan以外的特殊符号异常

Train_data.info()
Test_data.info()

判断数据的异常和缺失

数据的异常值和缺失值用nan表示，统计数据中的nan个数

Train_data.isnull().sum()
Test_data.isnull().sum()

可视化数据

missing = Train_data.isnull().sum()
missing = missing[missing > 0]
missing.sort_values(inplace=True)
missing.plot.bar()

预处理数据

数据通过用info检查之后，了解数据的类型，如二手车数据除了notRepairedDamage 为object类型其他都为数字，检查一下其中内容

Train_data['notRepairedDamage'].value_counts()
Test_data['notRepairedDamage'].value_counts()

做处理

Train_data['notRepairedDamage'].replace('-', np.nan, inplace=True)
Test_data['notRepairedDamage'].replace('-', np.nan, inplace=True)

当数据偏差特别大时与结果的相关性就会比较小，不具有挖掘的价值，可以删去。

了解预测值的分布

查看数据的分布

import scipy.stats as st
y = Train_data['price']
plt.figure(1); plt.title('Johnson SU')
sns.distplot(y, kde=False, fit=st.johnsonsu)
plt.figure(2); plt.title('Normal')
sns.distplot(y, kde=False, fit=st.norm)
plt.figure(3); plt.title('Log Normal')
sns.distplot(y, kde=False, fit=st.lognorm)

产看数据的偏度和峰度 [偏度，峰度详解]

sns.distplot(Train_data['price']);
print("Skewness: %f" % Train_data['price'].skew())
print("Kurtosis: %f" % Train_data['price'].kurt())

Train_data.skew(), Train_data.kurt()

频值得查看，对于较少的可以选择删除数据

plt.hist(Train_data['price'], orientation = 'vertical',histtype = 'bar', color ='red')
plt.show()

数据不服从正态分布，所以在进行回归之前，它必须进行转换。虽然对数变换做得很好，但最佳拟合是无界约翰逊分布，使用np.log进行变换

plt.hist(np.log(Train_data['price']), orientation = 'vertical',histtype = 'bar', color ='red') 
plt.show()

查看特征的分布

特征可以分为类型特征和数字特征，这种特征的处理方式适用于没有标签的数据
对于数据特征，分析其与预测值得相关性

price_numeric = Train_data[numeric_features]
correlation = price_numeric.corr()
print(correlation['price'].sort_values(ascending = False),'\n')

查看数据的偏度和峰度

for col in numeric_features:
    print('{:15}'.format(col), 
          'Skewness: {:05.2f}'.format(Train_data[col].skew()) , 
          '   ' ,
          'Kurtosis: {:06.2f}'.format(Train_data[col].kurt())  
         )

对于类型特征，分析其特征nunique分布

for cat_fea in categorical_features:
    print(cat_fea + "的特征分布如下：")
    print("{}特征有个{}不同的值".format(cat_fea, Train_data[cat_fea].nunique()))
    print(Train_data[cat_fea].value_counts())

用pandas_profiling生成数据报告

用pandas_profiling生成一个较为全面的可视化和数据报告(较为简单、方便) 最终打开html文件即可

import pandas_profiling
pfr = pandas_profiling.ProfileReport(Train_data)
pfr.to_file("./example.html")

经验总结

经验总结
所给出的EDA步骤为广为普遍的步骤，在实际的不管是工程还是比赛过程中，这只是最开始的一步，也是最基本的一步。

接下来一般要结合模型的效果以及特征工程等来分析数据的实际建模情况，根据自己的一些理解，查阅文献，对实际问题做出判断和深入的理解。

最后不断进行EDA与数据处理和挖掘，来到达更好的数据结构和分布以及较为强势相关的特征

数据探索在机器学习中我们一般称为EDA（Exploratory Data Analysis）：

是指对已有的数据（特别是调查或观察得来的原始数据）在尽量少的先验假定下进行探索，通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。

数据探索有利于我们发现数据的一些特性，数据之间的关联性，对于后续的特征构建是很有帮助的。

对于数据的初步分析（直接查看数据，或.sum(), .mean()，.descirbe()等统计函数）可以从：样本数量，训练集数量，是否有时间特征，是否是时许问题，特征所表示的含义（非匿名特征），特征类型（字符类似，int，float，time），特征的缺失情况（注意缺失的在数据中的表现形式，有些是空的有些是”NAN”符号等），特征的均值方差情况。

分析记录某些特征值缺失占比30%以上样本的缺失处理，有助于后续的模型验证和调节，分析特征应该是填充（填充方式是什么，均值填充，0填充，众数填充等），还是舍去，还是先做样本分类用不同的特征模型去预测。

对于异常值做专门的分析，分析特征异常的label是否为异常值（或者偏离均值较远或者事特殊符号）,异常值是否应该剔除，还是用正常值填充，是记录异常，还是机器本身异常等。

对于Label做专门的分析，分析标签的分布情况等。

进步分析可以通过对特征作图，特征和label联合做图（统计图，离散图），直观了解特征的分布情况，通过这一步也可以发现数据之中的一些异常值等，通过箱型图分析一些特征值的偏离情况，对于特征和特征联合作图，对于特征和label联合作图，分析其中的一些关联性。

你可能感兴趣的:(打卡-Task2:数据的探索性分析（EDA）)

【深度学习】Huber Loss详解小小小小祥深度学习人工智能算法职场和发展机器学习
文章目录1.HuberLoss原理详解2.Pytorch代码详解3.与MSELoss、MAELoss区别及各自优缺点3.1MSELoss均方误差损失3.2MAELoss平均绝对误差损失3.3HuberLoss4.总结4.1优化平滑4.2梯度较好4.3为什么说MSE是平滑的1.HuberLoss原理详解HuberLoss是一种结合了MSE（均方误差）与MAE（平均绝对误差）的损失函数，旨在克服两者的
【YOLOV8】YOLOV8模型训练train及参数详解小小小小祥 YOLO
介绍训练深度学习模型涉及为其提供数据并调整其参数，以便它能够做出准确的预测。UltralyticsYOLOv8的训练模式专为有效、高效地训练目标检测模型而设计，充分利用现代硬件的能力。本指南旨在涵盖使用YOLOv8强大功能集训练自定义模型所需的所有细节，帮助你快速入门。为什么选择UltralyticsYOLO进行训练？高效性：无论是单GPU设置还是跨多个GPU扩展，都能充分利用你的硬件。多功能性：
【YOLOV8】目标检测任务中应该如何选择YOLOV8n/s/m/l/x模型及输入尺寸大小小小小小祥 YOLO 目标检测人工智能
问题描述：YOLOV8作为目前主流的深度学习网络，支持图像分类、目标检测、实例分割、姿态检测、旋转目标检测等功能。对于目标检测任务官方提供了n/s/m/l/x五个模型，我们在使用YOLOV8模型进行自己任务训练时，应该如何选择YOLOV8的模型以及输入尺寸大小呢？YOLOV8官网：https://github.com/ultralytics/ultralyticsYOLOV8n/s/m/l/x信息
c++ 类模板飞yu流星 c++开发语言
1.类模板语法类模板类模板作用：建立一个通用类，类中的成员数据类型可以不具体指定，用一个虚拟的类型来代表。语法：templateclass类名{}templateclassPerson{public:Person(NameTypename,AgeTypeage){m_Name=name;m_Age=age;}NameTypem_Name;AgeTypem_Age;voidshowPerson(){
用java 实现 Zigzag Conversion Z 字形变换（leetCode 算法）用心去追梦算法 java leetcode
Z字形变换（ZigzagConversion）是LeetCode上一个有趣的字符串操作问题。题目要求我们把给定的字符串按照Z字形排列，并且按行读取这些字符，最后返回重新排列后的字符串。例如，输入字符串“PAYPALISHIRING”和行数numRows=3时，Z字形排列如下：PAHNAPLSIIGYIR然后按行读取得到的结果字符串为“PAHNAPLSIIGYIR”。下面是用Java实现这个算法的方
用java 实现 Longest Substring Without Repeating Characters 无重复字符的最长子串（leetCode 算法）用心去追梦算法 java leetcode
无重复字符的最长子串（LongestSubstringWithoutRepeatingCharacters）是LeetCode上一个非常经典的滑动窗口问题。这个问题要求我们找到给定字符串中没有重复字符的最长子串的长度。下面是一个使用Java实现的解决方案，它使用了滑动窗口和哈希集合来跟踪当前窗口内的字符：importjava.util.HashSet;importjava.util.Set;pub
用java 实现 Longest Palindromic Substring 最长回文子串（leetCode 算法）用心去追梦算法 java leetcode
最长回文子串（LongestPalindromicSubstring）是LeetCode上一个经典的问题，它要求我们找到给定字符串中最长的回文子串。这个问题可以通过多种方法来解决，其中一种高效的方法是中心扩展法。该算法的基本思想是遍历每个字符，并以该字符为中心尝试向两边扩展，寻找最长的回文子串。下面是用Java实现这个算法的方法：publicclassLongestPalindromicSubst
cannot open shared object file: No such file or directory解决方法 Turn X7 工作问题总结 linux 服务器运维
一般我们在Linux下执行某些外部程序的时候可能会提示找不到共享库的错误,比如:errorwhileloadingsharedlibraries:libavformat.so.58:cannotopensharedobjectfile:Nosuchfileordirectory原因一般有两个：一个是操作系统里确实没有包含该共享库(lib*.so.*文件)或者共享库版本不对，遇到这种情况那就去网上下
【5】WLC上的CIMC 剪刀石头布Cheers Cisco Wireless Learning 运维网络无线思科 WLC CMIC UCS-C
1.概述CIMC全称是CiscoIntegratedManagementController，是C系列服务器的管理服务，而思科的WLC5520、8540等无线控制器，硬件是基于思科UCS-C系列的（其中WLC5520基于C220，WLC8540基于C240），所以这些控制器上是有CMIC的。虽然平时在WLC上不是那么容易用到或者有相关的操作，但是还是需要知晓一下相关的内容。CIMC是内置于设备主板
HighCharts 交互式图表-01-入门介绍后端java
常见的图形库系列常见的图形库概览-00-overview常见的图形库概览-01-Chart.js入门例子常见的图形库概览-03-D3.js入门例子HighCharts交互式图表-01-入门介绍Plotly函数图像绘制ApexCharts图表入门例子Victory图表基于React，适合React项目，支持移动端Recharts入门例子AntVG2入门例子图表库C3.js入门例子图表库GoogleC
NLP 中文拼写检测纠正论文-07-NLPTEA-2020中文语法错误诊断共享任务概述后端java
拼写纠正系列NLP中文拼写检测实现思路NLP中文拼写检测纠正算法整理NLP英文拼写算法，如果提升100W倍的性能？NLP中文拼写检测纠正Paperjava实现中英文拼写检查和错误纠正？可我只会写CRUD啊！一个提升英文单词拼写检测性能1000倍的算法？单词拼写纠正-03-leetcodeedit-distance72.力扣编辑距离NLP开源项目nlp-hanzi-similar汉字相似度word-
C# delegate 委托使用教程 c#.net
什么是委托？委托是定义方法签名的引用类型数据类型，可以定义委托的变量，就像其他数据类型一样，可以引用与委托具有相同签名的任何方法。它允许方法作为参数传递，并允许事件驱动编程。它们提供了一种以类型安全的方式封装方法引用的方法。委托是一种类型，类似于C++的函数指针，但更安全和灵活。委托可以存储对方法的引用（或者多个方法）。委托是实现事件和回调的基础。为什么使用委托？类型安全：委托提供一种类型安全的方
【赵渝强老师】MongoDB的Journal日志数据库nosqlmongodb
数据是MongoDB的核心，MongoDB通过使用Journal日志保证数据的安全。Journal日志用于记录上一个检查点之后发生的数据更新，并将更新的信息顺序写入Journal日志文件中。通过使用Journal日志能够将数据库从系统异常终止事件中还原到一个有效的状态。通过6.5.1.3小节的介绍了解到，MongoDB使用预写日志机制实现数据的持久化。每个Journal日志文件的大小是100M，并
C# dynamic 类型详解 c#.net
简介C#中的dynamic是一种特殊类型，它允许在运行时确定对象的类型和成员，而不是在编译时。dynamic的定义dynamic是一种类型，它告诉编译器对其进行“动态类型解析”。dynamic类型的变量会跳过编译时类型检查，所有的操作会推迟到运行时进行。适合处理未知类型的对象，或需要与动态语言（如Python、JavaScript）互操作的场景。dynamic的使用动态类型赋值dynamicobj
Linux stdin、stdout和stderr详解 linux
一、标准流介绍在计算机编程中，标准流是计算机程序开始执行时与其环境之间预连接的输入和输出通信通道。这三种输入/输出(I/O)连接称为标准输入(stdin)、标准输出(stdout)和标准错误(stderr)。最初I/O是通过物理连接的系统控制台(通过键盘输入，通过监视器输出)发生的，但是标准流抽象了这一点。当通过交互式shell执行命令时，流通常连接到shell运行的文本终端，但可以通过重定向或管
Linux axel 下载加速命令详解 linux
简介axel命令是一个轻量级、快速且用户友好的Linux命令行下载加速器。它通过将文件分割成片段并同时下载来加快下载速度，这对于大文件和网络不好时尤其有用。axel支持HTTP、HTTPS、FTP和FTPS协议。安装Debian/UbuntusudoaptupdatesudoaptinstallaxelCentOS/RHELsudoyuminstallaxelFedorasudodnfinstal
NLP 中文拼写检测纠正论文-04-Learning from the Dictionary 后端java
拼写纠正系列NLP中文拼写检测实现思路NLP中文拼写检测纠正算法整理NLP英文拼写算法，如果提升100W倍的性能？NLP中文拼写检测纠正Paperjava实现中英文拼写检查和错误纠正？可我只会写CRUD啊！一个提升英文单词拼写检测性能1000倍的算法？单词拼写纠正-03-leetcodeedit-distance72.力扣编辑距离NLP开源项目nlp-hanzi-similar汉字相似度word-
微信小程序单选题双击取消功能实现 d1st2nt 微信小程序小程序
因为单选题不自带双击取消功能，于是在我学习了其中的逻辑之后我决定自行编写代码实现该功能。具体实现方法：添加了一个状态变量isChecked,初始值设为false，在选项上添加了点击事件，设置了两个全局变量，在点击事件中，第一个全局变量存奇数次选择的值，第二个全局变量存偶数次选择的值，将这两个变量进行对比，如果存的值一样，设置isChecked的值为false，同时将存该选项答案的变量设为空，不一样
Linux xargs 命令使用教程 linux
简介xargs是一个功能强大的Linux命令，用于从标准输入构建和执行命令。它接受一个命令的输出，并将其作为参数提供给另一个命令。它在处理大量输入时特别有用，其含义可以解释为：extendedarguments，使用xargs允许echo、rm、mkdir等命令接受标准输入作为参数。与管道的对比管道仅将一个命令的输出传递到下一个命令的输入。xargs将输入（通常来自标准输出）转换为另一个命令的参数
NLP 中文拼写检测纠正论文-01-介绍了SIGHAN 2015 包括任务描述，数据准备，绩效指标和评估结果后端java
拼写纠正系列NLP中文拼写检测实现思路NLP中文拼写检测纠正算法整理NLP英文拼写算法，如果提升100W倍的性能？NLP中文拼写检测纠正Paperjava实现中英文拼写检查和错误纠正？可我只会写CRUD啊！一个提升英文单词拼写检测性能1000倍的算法？单词拼写纠正-03-leetcodeedit-distance72.力扣编辑距离NLP开源项目nlp-hanzi-similar汉字相似度word-
DynamicDatasource动态数据源实现及使用 m0_74825074 java
文章目录动态数据源DynamicDatasource简介源码分析ThreadLocal和AbstractRoutingDataSourceDynamicRoutingDataSourceDynamicDatasource快速开始项目结构Maven依赖application.yml配置文件sql脚本动态加载数据源动态切换数据源手动实现核心类`DataSourceContextHolder`核心类`D
分布式链路追踪-03-Jaeger、Zipkin、skywalking 中的 span 是如何设计的？后端java
开源项目auto-log自动日志输出Jaeger、Zipkin中的spanId是如何生成的？在Jaeger和Zipkin这两个分布式跟踪系统中，SpanID是通过不同的方法生成的。下面分别介绍它们的生成方式：Jaeger中的SpanID生成：在Jaeger中，SpanID是通过Snowflake算法生成的。Snowflake算法是Twitter开源的一种全局唯一ID生成算法，用于生成64位的唯一标
敏感词 v0.23.0 结果条件拓展，内置支持链式+单词标签后端java
开源项目敏感词核心https://github.com/houbb/sensitive-word敏感词控台https://github.com/houbb/sensitive-word-admin版本特性大家好，我是老马。有时候我们得到敏感词以后，想要进一步处理。比如只关心某些标签的敏感词，要如何实现呢?V0.23.0针对结果处理做了进一步增强。结果条件拓展内置支持wordTags（单词标签）和c
【赵渝强老师】PostgreSQL的物理存储结构数据库postgresql
PostgreSQL在执行initdb的数据库集群初始化时会指定一个目录。该目录通过环境变量$PGDATA来表示。当数据库集群初始化完成后，会在这个目录生成相关的子目录以及一些文件。这些生成的文件就是PostgreSQL的物理存储结构中的文件。如下图所示。如上图所示，环境变量$PGDATA指向的目录就是/home/postgres/training/pgsql/data。下表说明了其中的每个目录的
【赵渝强老师】PostgreSQL的WAL预写日志文件数据库postgresql
PostgreSQL数据库的物理存储结构主要是指硬盘上存储的文件，包括：数据文件、日志文件、参数文件、控制文件、WAL预写日志文件等等。下面重点讨论一下PostgreSQL的WAL预写日志文件。视频讲解如下：https://www.bilibili.com/video/BV1HCWBehEjj/?aid=113020218901...WAL是WriteAheadLogging的缩写，即预写日志，它
【赵渝强老师】PostgreSQL中的模式数据库postgresql
在PostgreSQL中，所有的数据库对象都是属于模式中的对象。这里的数据库对象包括：表、索引、视图、存储过程、触发器等等。所有数据库对象都有各自的对象标识符oid（objectidentifiers）,它是一个无符号的四字节整数，相关对象的oid都存放在相关的系统目录表中，比如数据库的oid和表的oid分别存放在pg_database,pg_class表中。下面重点介绍一下PostgreSQL中
Ubuntu20.04上安装Docker的两种方法，含最新国内镜像网址 docker教程linux
docker提供了容器化技术，可以将应用程序及其所有依赖项打包到一个容器中，免去配置环境的麻烦。方法一：通过apt安装sudoaptinstalldocker.io添加-y指令可实现自动化安装安装成功后，使用docker--version命令查看当前安装版本测试是否安装成功sudodockerrunhello-world可能报错：errorpullingimageconfiguration原因：无
下一代 CSS 框架：Mojo CSS
TailwindCSS推出即受到广大开发者的欢迎，当前Githubstar数已达77.8k。它是一个功能类优先（utility-first）的CSS框架，它提供了一系列功能类，让开发者可以在HTML中通过组合这些功能类（原子类）的方式去快速构建用户界面。本文将给大家分享下一代原子级CSS框架：MojoCSS，并简要阐述其与TailwindCSS的异同。MojoCSS基本介绍MojoCSS定位为下一
现代 CPU 技术发展 | 京东云技术团队 cpucpu架构软件开发
介绍这篇文章主要是介绍CPU技术的发展，包括最近几十年CPU性能提升和半导体工艺发展，当前技术发展方向。希望可以帮助软件开发者理解CPU指令集和组成运行原理、CPU性能提升的现状和瓶颈、CPU技术发展方向会如何影响软件开发/设计的框架和编程思想。提示：因为是面向软件开发者，所以会忽略掉一些电路设计、制造工艺等底层的硬件知识。同时也不会特别深入的介绍每个知识点，只是提供一个概览。CPU指令集和运行原
微服务项目服务之间的调用--使用openfeign m0_61813994 微服务架构 spring cloud
在微服务架构中，通常会将系统拆分成多个独立的服务，每个服务负责不同的功能模块。为了实现这些服务之间的通信，我们可以使用HTTP请求进行数据交互，而OpenFeign作为一种声明式的HTTP客户端库，可以让我们更方便地进行服务之间的调用。1.什么是OpenFeignOpenFeign是SpringCloud提供的一种声明式的HTTP客户端，能够在调用远程服务时自动生成请求代码并管理调用的负载均衡。它
windows下源码安装golang 616050468 golang安装 golang环境 windows
系统： 64位win7，开发环境：sublime text 2， go版本： 1.4.1 1. 安装前准备(gcc, gdb, git) golang在64位系
redis批量删除带空格的key bylijinnan redis
redis批量删除的通常做法： redis-cli keys "blacklist*" | xargs redis-cli del 上面的命令在key的前后没有空格时是可以的，但有空格就不行了： $redis-cli keys "blacklist*" 1) "blacklist:12: [email protected]
oracle正则表达式的用法 0624chenhong oracle 正则表达式
方括号表达示方括号表达式描述 [[:alnum:]] 字母和数字混合的字符 [[:alpha:]] 字母字符 [[:cntrl:]] 控制字符 [[:digit:]] 数字字符 [[:graph:]] 图像字符 [[:lower:]] 小写字母字符 [[:print:]] 打印字符 [[:punct：]] 标点符号字符 [[:space:]]
2048源码(核心算法有，缺少几个anctionbar，以后补上) 不懂事的小屁孩 2048
2048游戏基本上有四部分组成， 1：主activity，包含游戏块的16个方格，上面统计分数的模块 2：底下的gridview，监听上下左右的滑动，进行事件处理， 3：每一个卡片，里面的内容很简单，只有一个text，记录显示的数字 4：Actionbar，是游戏用重新开始，设置等功能(这个在底下可以下载的代码里面还没有实现) 写代码的流程 1：设计游戏的布局，基本是两块，上面是分
jquery内部链式调用机理换个号韩国红果果 JavaScript jquery
只需要在调用该对象合适(比如下列的setStyles)的方法后让该方法返回该对象（通过this 因为一旦一个函数称为一个对象方法的话那么在这个方法内部this（结合下面的setStyles）指向这个对象） function create(type){ var element=document.createElement(type); //this=element;
你订酒店时的每一次点击背后都是NoSQL和云计算蓝儿唯美 NoSQL
全球最大的在线旅游公司Expedia旗下的酒店预订公司，它运营着89个网站，跨越68个国家，三年前开始实验公有云，以求让客户在预订网站上查询假期酒店时得到更快的信息获取体验。云端本身是用于驱动网站的部分小功能的，如搜索框的自动推荐功能，还能保证处理Hotels.com服务的季节性需求高峰整体储能。 Hotels.com的首席技术官Thierry Bedos上个月在伦敦参加“2015 Clou
java笔记1 a-john java
1，面向对象程序设计（Object-oriented Propramming，OOP）：java就是一种面向对象程序设计。 2，对象：我们将问题空间中的元素及其在解空间中的表示称为“对象”。简单来说，对象是某个类型的实例。比如狗是一个类型，哈士奇可以是狗的一个实例，也就是对象。 3，面向对象程序设计方式的特性： 3.1 万物皆为对象。
C语言 sizeof和strlen之间的那些事 C/C++软件开发求职面试题必备考点（一） aijuans C/C++求职面试必备考点
找工作在即，以后决定每天至少写一个知识点，主要是记录，逼迫自己动手、总结加深印象。当然如果能有一言半语让他人收益，后学幸运之至也。如有错误，还希望大家帮忙指出来。感激不尽。后学保证每个写出来的结果都是自己在电脑上亲自跑过的，咱人笨，以前学的也半吊子。很多时候只能靠运行出来的结果再反过来
程序员写代码时就不要管需求了吗？ asia007 程序员不能一味跟需求走
编程也有2年了，刚开始不懂的什么都跟需求走，需求是怎样就用代码实现就行，也不管这个需求是否合理，是否为较好的用户体验。当然刚开始编程都会这样，但是如果有了2年以上的工作经验的程序员只知道一味写代码，而不在写的过程中思考一下这个需求是否合理，那么，我想这个程序员就只能一辈写敲敲代码了。我的技术不是很好，但是就不代
Activity的四种启动模式百合不是茶 android 栈模式启动 Activity的标准模式启动栈顶模式启动单例模式启动
android界面的操作就是很多个activity之间的切换,启动模式决定启动的activity的生命周期 ; 启动模式xml中配置 <activity android:name=".MainActivity" android:launchMode="standard&quo
Spring中@Autowired标签与@Resource标签的区别 bijian1013 java spring @Resource @Autowired @Qualifier
Spring不但支持自己定义的@Autowired注解，还支持由JSR-250规范定义的几个注解，如：@Resource、 @PostConstruct及@PreDestroy。 1. @Autowired @Autowired是Spring 提供的，需导入 Package:org.springframewo
Changes Between SOAP 1.1 and SOAP 1.2 sunjing Changes Enable SOAP 1.1 SOAP 1.2
JAX-WS SOAP Version 1.2 Part 0: Primer (Second Edition) SOAP Version 1.2 Part 1: Messaging Framework (Second Edition) SOAP Version 1.2 Part 2: Adjuncts (Second Edition) Which style of WSDL
【Hadoop二】Hadoop常用命令 bit1129 hadoop
以Hadoop运行Hadoop自带的wordcount为例， hadoop脚本位于/home/hadoop/hadoop-2.5.2/bin/hadoop，需要说明的是，这些命令的使用必须在Hadoop已经运行的情况下才能执行 Hadoop HDFS相关命令 hadoop fs -ls 列出HDFS文件系统的第一级文件和第一级
java异常处理（初级）白糖_ java DAO spring 虚拟机 Ajax
从学习到现在从事java开发一年多了，个人觉得对java只了解皮毛，很多东西都是用到再去慢慢学习，编程真的是一项艺术，要完成一段好的代码，需要懂得很多。最近项目经理让我负责一个组件开发，框架都由自己搭建，最让我头疼的是异常处理，我看了一些网上的源码，发现他们对异常的处理不是很重视，研究了很久都没有找到很好的解决方案。后来有幸看到一个200W美元的项目部分源码，通过他们对异常处理的解决方案，我终
记录整理-工作问题 braveCS 工作
1）那位同学还是CSV文件默认Excel打开看不到全部结果。以为是没写进去。同学甲说文件应该不分大小。后来log一下原来是有写进去。只是Excel有行数限制。那位同学进步好快啊。 2）今天同学说写文件的时候提示jvm的内存溢出。我马上反应说那就改一下jvm的内存大小。同学说改用分批处理了。果然想问题还是有局限性。改jvm内存大小只能暂时地解决问题，以后要是写更大的文件还是得改内存。想问题要长远啊
org.apache.tools.zip实现文件的压缩和解压，支持中文 bylijinnan apache
刚开始用java.util.Zip，发现不支持中文（网上有修改的方法，但比较麻烦）后改用org.apache.tools.zip org.apache.tools.zip的使用网上有更简单的例子下面的程序根据实际需求，实现了压缩指定目录下指定文件的方法 import java.io.BufferedReader; import java.io.BufferedWrit
读书笔记-4 chengxuyuancsdn 读书笔记
1、JSTL 核心标签库标签 2、避免SQL注入 3、字符串逆转方法 4、字符串比较compareTo 5、字符串替换replace 6、分拆字符串 1、JSTL 核心标签库标签共有13个，学习资料：http://www.cnblogs.com/lihuiyy/archive/2012/02/24/2366806.html 功能上分为4类： (1)表达式控制标签：out
[物理与电子]半导体教材的一个小问题 comsci 问题
各种模拟电子和数字电子教材中都有这个词汇-空穴书中对这个词汇的解释是; 当电子脱离共价键的束缚成为自由电子之后,共价键中就留下一个空位,这个空位叫做空穴我现在回过头翻大学时候的教材,觉得这个
Flashback Database --闪回数据库 daizj oracle 闪回数据库
Flashback 技术是以Undo segment中的内容为基础的，因此受限于UNDO_RETENTON参数。要使用flashback 的特性，必须启用自动撤销管理表空间。在Oracle 10g中， Flash back家族分为以下成员： Flashback Database， Flashback Drop，Flashback Query(分Flashback Query,Flashbac
简单排序:插入排序 dieslrae 插入排序
public void insertSort(int[] array){ int temp; for(int i=1;i<array.length;i++){ temp = array[i]; for(int k=i-1;k>=0;k--)
C语言学习六指针小示例、一维数组名含义，定义一个函数输出数组的内容 dcj3sjt126com c
# include <stdio.h> int main(void) { int * p; //等价于 int *p 也等价于 int* p; int i = 5; char ch = 'A'; //p = 5; //error //p = &ch; //error //p = ch; //error p = &i; //
centos下php redis扩展的安装配置3种方法 dcj3sjt126com redis
方法一 1.下载php redis扩展包代码如下复制代码 #wget http://redis.googlecode.com/files/redis-2.4.4.tar.gz 2 tar -zxvf 解压压缩包，cd /扩展包（进入扩展包然后运行phpize 一下是我环境中phpize的目录，/usr/local/php/bin/phpize (一定要
线程池(Executors) shuizhaosi888 线程池
在java类库中，任务执行的主要抽象不是Thread，而是Executor，将任务的提交过程和执行过程解耦 public interface Executor { void execute(Runnable command); } public class RunMain implements Executor{ @Override pub
openstack 快速安装笔记 haoningabc openstack
前提是要配置好yum源版本icehouse，操作系统redhat6.5 最简化安装，不要cinder和swift 三个节点 172 control节点keystone glance horizon 173 compute节点nova 173 network节点neutron control /etc/sysctl.conf net.ipv4.ip_forward =
从c面向对象的实现理解c++的对象（二） jimmee C++面向对象虚函数
1. 类就可以看作一个struct，类的方法，可以理解为通过函数指针的方式实现的，类对象分配内存时，只分配成员变量的，函数指针并不需要分配额外的内存保存地址。 2. c++中类的构造函数，就是进行内存分配(malloc)，调用构造函数 3. c++中类的析构函数，就时回收内存(free) 4. c++是基于栈和全局数据分配内存的，如果是一个方法内创建的对象，就直接在栈上分配内存了。专门在
如何让那个一个div可以拖动 lingfeng520240 html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml
第10章高级事件（中） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
计算两个经纬度之间的距离 roadrunners 计算纬度 LBS 经度距离
要解决这个问题的时候，到网上查了很多方案，最后计算出来的都与百度计算出来的有出入。下面这个公式计算出来的距离和百度计算出来的距离是一致的。 /** * * @param longitudeA * 经度A点 * @param latitudeA * 纬度A点 * @param longitudeB *
最具争议的10个Java话题 tomcat_oracle java
1、Java8已经到来。什么！？ Java8 支持lambda。哇哦，RIP Scala！　　随着Java8 的发布，出现很多关于新发布的Java8是否有潜力干掉Scala的争论，最终的结论是远远没有那么简单。Java8可能已经在Scala的lambda的包围中突围，但Java并非是函数式编程王位的真正觊觎者。　　2、Java 9 即将到来　　 Oracle早在8月份就发布
zoj 3826 Hierarchical Notation(模拟) 阿尔萨斯 rar
题目链接：zoj 3826 Hierarchical Notation 题目大意：给定一些结构体，结构体有value值和key值，Q次询问，输出每个key值对应的value值。解题思路：思路很简单，写个类词法的递归函数，每次将key值映射成一个hash值，用map映射每个key的value起始终止位置，预处理完了查询就很简单了。这题是最后10分钟出的，因为没有考虑value为{}的情

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他