CC_duyao

爬取51job可视化分析（一）——数据清洗

数据分析岗位

数据分析是当下每个互联网人不可或缺的技能，我是去年才开始入坑的大四计算机专业学生，现在面临春招，我现在还是有点楞逼的，继续做点项目充实一下自己空闲的心吧！爬虫分析一波51job有关数据分析的岗位吧。（个人学习项目，思维不严谨的地方，望和大家交流交流。）

需求分析

1.应届毕业生找数据分析岗位的薪资如何？不同城市的薪资的影响？学历对薪资的影响？
2.哪些城市对数据分析岗位的需求大？哪些行业对数据分析岗位的需求量大？
3.初级的数据分析都该掌握哪些技能？

数据获取

1.先来看看我的搜索条件吧，只是对于应届生而言的数据分析师岗位。

2.爬虫部分这里就自动跳过了，重点是数据分析。这里直接把爬下来的csv文件分析给大家：
链接：https://pan.baidu.com/s/1SSW9sOn_u3_oC-9IJ4ksnA
提取码：5oxg
用Pandas打开如下,一共有1.9w条数据

数据清洗

1.删除职业名称与数据分析无关的信息。

import pandas as pd
import re
data = pd.read_csv('shujufenxi.csv')
b = u'数据'
a = u'分析'
number = 1
li = data['title']
for i in range(0,len(li)):
    try:
        if a in li[i] or b in li[i]:
            #print(number,li[i])
            number+=1
        else:
            data = data.drop(i,axis=0)
    except:
        pass

代码我是用Jupyter Notebook 写的，这一步直接删除了1.7w条数据。（这一刻感觉爬虫都白爬了，需求这么少的吗？没事，下次爬大数据的）

2.查看重复值，并删除

#查看重复值,这里每个数据没有唯一标识，所以用全查重。
print((data.duplicated()).sum())
#删除重复值，保留第一个
data.drop_duplicates(keep='first',inplace=True)

3.查看缺失值，并处理

#查看缺失值的分布情况,会发现工资，公司规模等字段会有缺失。
print((data.isnull()).sum())
#删除工资为NAN的行
data.dropna(axis = 0,subset = ['company_industry','company_categories'],inplace=True)
#由于数据量有点少，这里不删除，用上面一个值填充缺失值。
data.fillna(method='ffill',axis=0,inplace=True)

4.salary单位转换

a.先来看看单位构成吧，6-9千/月，我当时头也是有点疼的。那就一步一步来吧。

b.先看看是不是所有salary都是一个范围（包含符号‘-’）

#对数据观察，查看工资的格式是否都是'xx-xx千/月'
data[~data.salary.str.contains('-')]
#删除这一部分数据，对data重新赋值
data = data[data.salary.str.contains('-')]

会发现这种xx元/天的都是实习岗位，我们要找的是正式工作，删除这一部分数据。

c.再来看看现在工资的单位。

#查看salary这一行所有字段的后三位，并统计
data.salary.str[-3:]).value_counts()

输出：千/月 983 万/月 633 万/年 43

d.单位转换（以千/月作为基本单位），并转为float型

#将最低工资和最高工资分开
salary_list = data.salary.str.split('-')
#求出最高工资
data['max_salary'] = salary_list.str.get(1)
#lambda x: 语句1 if 条件1 else 语句2 if 条件2 else 语句3 实际上是下面这样表达 lambda x: 语句1 if 条件1 else ( 语句2 if 条件2 else 语句3 )
data['max_salary'] = data['max_salary'].map(lambda x: float(x.strip('万/月'))*10 if ('万/月' in x) 
                                            else float(x.strip('万/年'))*10/12 if ('万/年' in x) 
                                            else float(x.strip('千/月'))) 
#得出最低工资
data['min_salary']= data['salary'].map(lambda x: float(x.split('-')[0])*10 if ('万/月' in x) 
                                            else float(x.split('-')[0])*10/12 if ('万/年' in x) 
                                            else float(x.split('-')[0]))

5.整理公司所在城市的信息

如图：company_city的部分包含了所在区域，就全国范围来看，我们只需将公司位置精确到每个市就好了。

#整理城市信息
data['company_city'] = data['company_city'].map(lambda x: x.split('-')[0] if ('-') in x else x)

6.异常值处理

查看最低工资的分布：

import matplotlib.pyplot as plt
import seaborn as sns
sns.set_context("poster")
plt.figure(figsize=(30,10))
sns.boxplot(y="min_salary",data=data);

#为了准确性，把月薪大于15K的离群点
data = data[data.min_salary <15.0]

max_salary同理把大于20K的数据祛除掉。

7.祛除频次较低的数据

这一步是为了避免一些较少的数据影响整体的分析结果；如：各城市平均薪资对比图，北京市的所有该岗位平均薪资是8000，而成都市只有一个岗位，但是薪资为12000，把12000当作成都市的该岗位平均工资，对于分析有很大的影响。
先来祛除岗位较少的城市


#按照company_city进行分组，并统计每个company_city有多少个岗位
count_city = data.groupby(by='company_city')['company_city'].count()
dic = count_city.to_dict()
#赋值到data['count_city']中
data['count_city'] = data['company_city'].map(dic)
#把频次小于10 的删除掉
data = data[data.count_city > 10]

对于祛除频次较低的数据我多少还是有点疑惑。该不该祛除？或者怎样处理？有没有更简便的方法？求大神指点。
后续祛除了‘education’，‘company_categories’等字段频次较少的数据。

总结

经过以上的数据清洗，总算得到了这样1214条数据：

1.数据量从1.9w条到0.12w条，缩水了十倍之多，主要还是数据获取方面出现了问题，以后在学习生活中一定要注意数据获取的准确性，减少无用功。
2.刚开始想学数据分析的时候，就想着怎么获取数据是最重要的（爬虫），觉得数据分析没什么难的，现在觉得思维限制了自己，希望大家以后少走弯路吧，锻炼分析思维最重要，怎样从数据中发现问题，解决问题。
3.本篇文章就是想给大家分享分享，顺便请教一下大家，特别是关于处理频次较少数据的那个问题,望高人之路。
处理完后的数据我放在下篇文章。

你可能感兴趣的:(爬取51job可视化分析（一）——数据清洗)

在服务器上增加新网段IP的路由配置醉心编码通信软件 shell基础知识及技巧服务器 tcp/ip
在服务器上增加新网段IP的路由配置前提条件步骤一：检查当前路由表步骤二：添加新路由步骤三：验证新路由步骤四：持久化路由配置脚本示例结论在网络管理中，路由配置是一项基本且重要的任务。它决定了数据包在网络中的传输路径。本文将详细介绍如何在服务器上增加新的路由配置，以便使服务器能够正确地将目的地为特定网段的数据包发送到指定的下一跳地址。具体来说，我们将添加目的地址为5.0.0.0/8、10.0.0.0/
Java 并发编程解析 | 如何正确理解Java领域中的并发锁，我们应该具体掌握到什么程度？荆州克莱面试题汇总与解析 spring cloud spring boot spring 技术 css3
写在开头对于Java领域中的锁，其实从接触Java至今，我相信每一位JavaDeveloper都会有这样的一个感觉？不论是Java对锁的实现还是应用，真的是一种“群英荟萃”，而且每一种锁都有点各有各的驴，各有各的本，各不相同。在很多情况下，以及在各种锁的应用场景里，各式各样的定义，难免会让我们觉得无所适从，很难清楚该如何对这些锁做到得心应手？在并发编程色世界中，一般情况下，我们只需了解其是如何使用
使用 Java 开发 Android 应用：Kotlin 与 Java 的混合编程荆州克莱面试题汇总与解析 spring cloud spring boot spring 技术 css3
使用Java开发Android应用：Kotlin与Java的混合编程在开发Android应用程序时，我们通常可以选择使用Java或Kotlin作为主要的编程语言。然而，有些开发者可能会想要在同一个项目中同时使用这两种语言，这就是所谓的混合编程（mixedprogramming）。为什么要混合编程？混合编程的主要优势之一是，它可以让你利用Java和Kotlin两种语言的优势。Java作为一种老牌的编
update_min_vruntime()流程图 iceman1952 cfs vruntime
linuxkernelschedulercfs的update_min_vruntime()看起来还挺绕的。含义其实也简单，总一句话，将cfs_rq->min_vruntime设置为：max(cfs_rq->vruntime,min(leftmost_se->vruntime,cfs_rq->curr->vruntime))。画个流程图，给它整个明明白白。//将cfs_rq->min_vruntim
从0到1：AI微信红包开发全攻略，小白也能轻松上手！人工智能cursor程序员
AI编程时代真的来了！最近我重度沉迷AI编程，发现它简直是开发神器，前端页面、后端服务，都能轻松搞定，效率直接起飞！最近临近过年，我突然冒出一个想法：为什么不试试用AI来做个微信红包呢？说干就干！1.明确需求要用AI做红包，首先得了解微信红包的规则。简单来说，我们需要一张精美的红包封面图，它会出现在发红包、消息气泡、拆红包、详情页等四个地方。而且尺寸也有要求，是957×1278像素。看起来有点复杂
使用 electron-builder 构建一个 Electron 应用程序涔溪 Electron electron javascript 前端
使用electron-builder构建一个Electron应用程序是一个多步骤的过程，它涉及到了解如何设置你的开发环境、配置构建工具以及运行构建命令。以下是详细的讲解：1.安装Node.js和npm首先，你需要确保你的计算机上已经安装了Node.js和npm（NodePackageManager）。Electron是基于Node.js的，因此这是必需的。你可以从Node.js官网下载并安装最新版
使用 electron-builder 构建一个 Electron 应用程序常见问题以及解决办法涔溪 Electron electron javascript 前端
构建Electron应用程序时，使用electron-builder可能会遇到一些常见问题。以下是一些问题及其解决办法：1.构建输出目录冲突问题：如果你的项目中已经存在与构建输出目录同名的文件夹，可能会导致构建失败。解决方法：确保package.json中build.directories.output指定的输出目录在构建开始前不存在或为空。你可以手动删除该文件夹，或者配置构建工具在每次构建前自动
Java全栈项目 - 校园跑腿服务系统天天进步2015 Java项目实战 java 开发语言
项目介绍校园跑腿服务系统是一个面向高校师生的互助平台,旨在解决校园内取快递、买饭、打印等日常跑腿需求。系统采用前后端分离架构,基于SpringBoot+Vue实现。技术栈后端SpringBoot2.xSpringSecurityMyBatisPlusMySQL8.0RedisRabbitMQJWT前端Vue2.xElementUIAxiosVuexVueRouter核心功能1.用户模块注册/登录实
一篇文章告诉你什么是BloomFilter 后端
什么是BloomFilter布隆过滤器（英语：BloomFilter）是1970年由布隆提出的。它实际上是一个很长的二进制向量和一系列随机映射函数。主要用于判断一个元素是否在一个集合中。通常我们会遇到很多要判断一个元素是否在某个集合中的业务场景，一般想到的是将集合中所有元素保存起来，然后通过比较确定。链表、树、散列表（又叫哈希表，Hashtable）等等数据结构都是这种思路。但是随着集合中元素的增
程序员必须掌握的消息中间件-RocketMQ 后端
设计(design)1消息存储消息存储是RocketMQ中最为复杂和最为重要的一部分，本节将分别从RocketMQ的消息存储整体架构、PageCache与Mmap内存映射以及RocketMQ中两种不同的刷盘方式三方面来分别展开叙述。1.1消息存储整体架构消息存储架构图中主要有下面三个跟消息存储相关的文件构成。(1)CommitLog：消息主体以及元数据的存储主体，存储Producer端写入的消息主
硬盘图标修改器，自定义电脑硬盘图标 Ag大雨 windows
今天发现了一个很有趣的小工具，还是来自我们的吾爱大佬硬盘图标修改器他可以修改电脑硬盘的图标LOGO，可以自定义，只要图标是ico格式的就可以，操作简单，选择自己的要换的盘符然后浏览找到要换图标ico，点去确定就行了，修改的时候建议把ico文件放在一个地方保存起来，因为修改后系统会占用这个ico图标，删除后可能会导致不显示。非常的有趣好玩，同时我搜集了一些ico图片，足足81个，需要的小伙伴快快下载
ST编程指南详细写作大纲阿凡工控分享 ST编程指南 PLC
从今天开始除了做视频，也是应一些后台观众的需求，希望我将ST编程单独说明，纵观网上这么多教程，大多很零散，而且不全面，所以我打算开个坑，自己写一个ST编程指南，希望能够帮助到大家，这里需要说明一点，这一次创作并不是免费的，因为做视频本身就很占用我的时间了，写作的话，也是希望大家多多赞赏或者付费支持下我，谢谢了！以下是我打算的一个大纲。引言1.1ST语言简介ST（StructuredText）的定义
计算机网络的五层协议青茶360 计算机网络计算机网络
计算机网络的五层协议‌计算机网络的五层协议模型包括物理层、数据链路层、网络层、传输层和应用层，每一层都有其特定的功能和相关的协议。‌‌1‌物理层‌：负责传输原始的比特流，通过线路（有线或无线）将数据转换为电信号或光信号进行传输。物理层的主要功能是确保比特流的透明传输，屏蔽具体传输介质和物理设备的差异。‌数据链路层‌：负责在相邻节点之间建立可靠的通信，将物理层接收到的比特流组装成帧，并添加必要的控制
在 X86_64(amd64) 平台上的docker支持打包跨平台的镜像(如arm64) DHclly docker java eureka
在信创，ARM开始崛起的现在，Docker也从一开始的只支持x86_64架构变为支持各种架构了，虽然Docker的目的是保证只要Docker安装好，在任意机器上运行都能达到一样的效果，但是这个的前提是Docker镜像的架构和当前服务器的架构一致，以前都是x84_64架构自然可以，但现在也有别的架构，因此一个镜像如果只有x86_64架构的版本，那么是无法在Arm架构的服务器上运行的。和运行同理，打包
深入理解Spring Boot：启动方式、注解、配置文件与模板引擎 Bro_cat SpringBoot spring boot java spring Freemarker properties yml
引言SpringBoot是一个用于简化Spring应用初始搭建以及开发过程的框架。它通过约定大于配置的方式，大大减少了开发者需要编写的配置代码。本文将详细介绍SpringBoot的启动方式、核心注解的用法及含义、配置文件的书写格式以及模板引擎的使用方法。SpringBoot的启动方式SpringBoot应用有多种启动方式，以下是最常见的三种方式：1.直接运行主类的main方法这是最常见的启动方式。
Python-基础-字典（dict） All_Test_Pass Python-基础 python 开发语言
目录1、字典2、字典常用操作3、字典的方法1、字典字典（Dictionary）是一种用于存储键值对（key-valuepairs）数据的可变容器类型。每个字典都包含一组键（key）和值（value），通过键可以快速访问对应的值。字典是无序的，也就是说，它们不保证元素的顺序，直到Python3.7之后，字典会保留插入的顺序my_dict={key1:value1,key2:value2,key3:v
用C语言找完数回响N 算法数据结构
完数：一个数的所有因子（除本身外）之和等于这个数，称这个数为完数intmain()//{//inti,j,sum;//for(i=1;i<=1000;i++)//寻找1000之内的完数//{//sum=0;//因子之和的初始化//for(j=1;j
【Java数据结构】二叉树相关算法回响N 算法数据结构 java 开发语言链表
第一题：获取二叉树中结点个数得到二叉树结点个数，如果结点为空则返回0，然后再用递归计算左树结点个数+根结点（1个）+右树结点个数。publicintnodeSize(Noderoot){if(root==null)return0;returnnodeSize1(root.left)+nodeSize1(root.right)+1;}第二题：获取叶子结点的个数得到叶子结点个数和结点总数的做法相同，也
玩转大模型的第一步——提示词(Prompt)工程【抛砖篇】 AI大模型老林 prompt 数据挖掘机器学习 opencv 语音识别人工智能
前言AI大模型提示词工程，又名LLMpromptsProject，指的是在使用大型语言模型（如OpenAI的GPT系列）时，用于引导模型生成特定响应的输入，是在使用AI大模型过程中非常重要的一个环节，是模型生成文本的起点。选择合适的Prompt对大模型回答的质量影响非常大，甚至可能会导致截然不同的结果。Prompt编写框架我们可以简单的看一下，分别使用下面两个Prompt在LLM的输出中分别会得到
C++ unordered_map 我要满血复活 c++开发语言
1.unordered系列关联式容器在C++98中，STL提供了底层为红黑树结构的一系列关联式容器，在查询时效率可达到，即最差情况下需要比较红黑树的高度次，当树中的节点非常多时，查询效率也不理想。最好的查询是，进行很少的比较次数就能够将元素找到，因此在C++11中，STL又提供了4个unordered系列的关联式容器，这四个容器与红黑树结构的关联式容器使用方式基本类似，只是其底层结构不同,该系列容
QT开发技术【基于TinyXml2的对类进行序列化和反序列化】一增援未来章北海 QT C++学习 qt 数据库算法
一、对TinyXml2进行封装使用宏实现序列化和反序列化思路：利用宏增加一个类函数，使用序列化器调用函数进行序列化封装宏示例#defineXML_SERIALIZER_BEGIN(ClassName)\public:\virtualvoidToXml(XMLElement*parentElem,boolbSerialize=true){\if(bSerialize){\parentElem->Se
线上工单引发的思考：Spring Boot 中 @Autowired 与 @Resource 的区别 coding侠客 spring boot 后端 java
最近接手了离职同事负责的业务，在处理一个线上工单的时候，看了下历史逻辑，在阅读他们写的代码时，发现他们竟然把@Autowired和@Resource注解混用。今天就借此机会聊聊SpringBoot项目中这两者之间的区别。1.注解来源@Autowired：是Spring框架提供的注解。IOC特性的核心注解之一。@Resource：是Java的标准注解，属于JavaEE规范（JSR-250）。2.注入
Imagen架构详解：理解其背后的技术与创新范范0825 Imagen 架构
Imagen架构详解：理解其背后的技术与创新引言近年来，生成式人工智能技术取得了飞速发展，特别是在图像生成领域。作为这一领域的重要创新之一，Imagen是由谷歌开发的一种基于文本生成图像的模型。它在生成高质量、逼真的图像方面表现出色，并通过其先进的架构和技术手段推动了图像生成的技术进步。Imagen不仅在图像生成质量上具有显著优势，还能够通过自然语言描述生成细致复杂的图像。本文将详细剖析Image
华为OD机试E卷 --热点网站统计--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript python c++c语言
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c算法源码c++算法源码题目描述企业路由器的统计页面，有一个功能需要动态统计公司访问最多的网页URLtopN。请设计一个算法，可以高效动态统计TopN的页面。输入描述每一行都是一个URL或一个数字•如果是URL，代表一段时间内的网页访问•如果是一个数字N，代表本次需要输出的TopN个URL输入约束：总访问网
《CPython Internals》阅读笔记：p232-p249 python
《CPythonInternals》学习第13天，p232-p249总结，总计18页。一、技术总结无。二、英语总结(生词：1)1.overhead(1)overhead:over-("above")+head(“toppart,uppermostsection”)overhead的字面意思是：abovethehead,后来演变成"representthingssituatedaboveormeta
【TCP】rfc文档 shengnan_wsn 网络协议 tcp/ip
tcp协议相关rfc有哪些TCP（传输控制协议）是一个复杂的协议，其设计和实现涉及多个RFC文档。以下是一些与TCP协议密切相关的RFC文档列表，按照时间顺序排列，涵盖了从基础定义到高级特性和优化的各个方面：基础定义RFC793-TransmissionControlProtocol(1981)最初的TCP标准定义，描述了TCP的基本功能和协议细节。窗口和确认机制RFC813-WindowandA
ElasticSearch索引别名的应用 elasticsearch
个人博客：无奈何杨（wnhyang）个人语雀：wnhyang共享语雀：在线知识共享Github：wnhyang-OverviewElasticsearch索引别名是一种极为灵活且强大的功能，它允许用户为一个或多个索引创建逻辑上的别名。这些别名用途广泛，涵盖查询、索引操作以及索引管理等多个方面。以下为一些常见的索引别名应用场景：简化查询通过创建别名，用户能够以更简洁的名称访问一个或多个索引。例如，若
使用 Java 开发 Android 应用：Kotlin 与 Java 的混合编程荆州克莱面试题汇总与解析 spring cloud spring boot spring 技术 css3
使用Java开发Android应用：Kotlin与Java的混合编程在开发Android应用程序时，我们通常可以选择使用Java或Kotlin作为主要的编程语言。然而，有些开发者可能会想要在同一个项目中同时使用这两种语言，这就是所谓的混合编程（mixedprogramming）。为什么要混合编程？混合编程的主要优势之一是，它可以让你利用Java和Kotlin两种语言的优势。Java作为一种老牌的编
SQLAlchemy：Python数据库实战_第2版(贾森•迈尔斯,里克•科普兰) zxfxgn 数据库 python 开发语言
pdf：获取关于SQLAlchemy：“SQLAlchemy是一个流行的PythonSQL工具包和对象关系映射（ORM）库。”安装SQLAlchemy：“安装SQLAlchemy非常简单，你可以使用pip安装它：pipinstallsqlalchemy。”数据库连接：“使用SQLAlchemy的第一步是创建一个数据库连接。这通常是通过创建一个Engine对象来完成的，该对象表示数据库的核心接口。”
Redis学习：从基础到应用的全面探索来恩1003 Redis redis 学习数据库
Redis学习资料Redis学习资料Redis学习资料在当今数字化时代，数据处理与存储的效率成为众多应用的关键所在。Redis作为一款高性能的内存数据库，凭借其独特的优势，在众多领域发挥着不可或缺的作用。无论是高并发的Web应用、实时数据分析，还是缓存机制的构建，Redis都展现出了卓越的性能。下面将为你详细介绍Redis的学习路径，助你从入门走向精通。一、Redis初相识：基础概念与安装Redi
jdk tomcat 环境变量配置 Array_06 java jdk tomcat
Win7 下如何配置java环境变量 1。准备jdk包，win7系统，tomcat安装包（均上网下载即可） 2。进行对jdk的安装，尽量为默认路径（但要记住啊！！以防以后配置用。。。） 3。分别配置高级环境变量。电脑-->右击属性-->高级环境变量-->环境变量。分别配置 : path &nbs
Spring调SDK包报java.lang.NoSuchFieldError错误 bijian1013 java spring
在工作中调另一个系统的SDK包，出现如下java.lang.NoSuchFieldError错误。 org.springframework.web.util.NestedServletException: Handler processing failed; nested exception is java.l
LeetCode[位运算] - #136 数组中的单一数 Cwind java 题解位运算 LeetCode Algorithm
原题链接：#136 Single Number 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现两次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：题目限定了线性的时间复杂度，同时不使用额外的空间，即要求只遍历数组一遍得出结果。由于异或运算 n XOR n = 0, n XOR 0 = n，故将数组中的每个元素进
qq登陆界面开发 15700786134 qq
今天我们来开发一个qq登陆界面，首先写一个界面程序，一个界面首先是一个Frame对象，即是一个窗体。然后在这个窗体上放置其他组件。代码如下： public class First { public void initul(){ jf=ne
Linux的程序包管理器RPM 被触发 linux
在早期我们使用源代码的方式来安装软件时，都需要先把源程序代码编译成可执行的二进制安装程序，然后进行安装。这就意味着每次安装软件都需要经过预处理-->编译-->汇编-->链接-->生成安装文件--> 安装，这个复杂而艰辛的过程。为简化安装步骤，便于广大用户的安装部署程序，程序提供商就在特定的系统上面编译好相关程序的安装文件并进行打包，提供给大家下载，我们只需要根据自己的
socket通信遇到EOFException 肆无忌惮_ EOFException
java.io.EOFException at java.io.ObjectInputStream$PeekInputStream.readFully(ObjectInputStream.java:2281) at java.io.ObjectInputStream$BlockDataInputStream.readShort(ObjectInputStream.java:
基于spring的web项目定时操作知了ing java Web
废话不多说，直接上代码，很简单配置一下项目启动就行 1，web.xml <?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="h
树形结构的数据库表Schema设计矮蛋蛋 schema
原文地址： http://blog.csdn.net/MONKEY_D_MENG/article/details/6647488 程序设计过程中，我们常常用树形结构来表征某些数据的关联关系，如企业上下级部门、栏目结构、商品分类等等，通常而言，这些树状结构需要借助于数据库完成持久化。然而目前的各种基于关系的数据库，都是以二维表的形式记录存储数据信息，
maven将jar包和源码一起打包到本地仓库 alleni123 maven
http://stackoverflow.com/questions/4031987/how-to-upload-sources-to-local-maven-repository <project> ... <build> <plugins> <plugin> <groupI
java IO操作与 File 获取文件或文件夹的大小，可读，等属性！！！百合不是茶
类 File File是指文件和目录路径名的抽象表示形式。 1，何为文件：标准文件（txt doc mp3...）目录文件（文件夹）虚拟内存文件 2，File类中有可以创建文件的 createNewFile（）方法,在创建新文件的时候需要try{} catch(）{}因为可能会抛出异常；也有可以判断文件是否是一个标准文件的方法isFile();这些防抖都
Spring注入有继承关系的类（2） bijian1013 java spring
被注入类的父类有相应的属性，Spring可以直接注入相应的属性，如下所例：1.AClass类 package com.bijian.spring.test4; public class AClass { private String a; private String b; public String getA() { retu
30岁转型期你能否成为成功人士 bijian1013 成长励志
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
【Velocity四】Velocity与Java互操作 bit1129 velocity
Velocity出现的目的用于简化基于MVC的web应用开发，用于替代JSP标签技术，那么Velocity如何访问Java代码.本篇继续以Velocity三http://bit1129.iteye.com/blog/2106142中的例子为基础， POJO package com.tom.servlets; public
【Hive十一】Hive数据倾斜优化 bit1129 hive
什么是Hive数据倾斜问题操作：join,group by,count distinct 现象：任务进度长时间维持在99%（或100%），查看任务监控页面，发现只有少量（1个或几个）reduce子任务未完成；查看未完成的子任务，可以看到本地读写数据量积累非常大，通常超过10GB可以认定为发生数据倾斜。原因：key分布不均匀倾斜度衡量：平均记录数超过50w且
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua csrf
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-3.求子数组的最大和 bylijinnan java
package beautyOfCoding; public class MaxSubArraySum { /** * 3.求子数组的最大和题目描述：输入一个整形数组，数组里有正数也有负数。数组中连续的一个或多个整数组成一个子数组，每个子数组都有一个和。求所有子数组的和的最大值。要求时间复杂度为O(n)。例如输入的数组为1, -2, 3, 10, -4,
Netty源码学习-FileRegion bylijinnan java netty
今天看org.jboss.netty.example.http.file.HttpStaticFileServerHandler.java 可以直接往channel里面写入一个FileRegion对象，而不需要相应的encoder： //pipeline（没有诸如“FileRegionEncoder”的handler）： public ChannelPipeline ge
使用ZeroClipboard解决跨浏览器复制到剪贴板的问题 cngolon 跨浏览器复制到粘贴板 Zero Clipboard
Zero Clipboard的实现原理 Zero Clipboard 利用透明的Flash让其漂浮在复制按钮之上，这样其实点击的不是按钮而是 Flash ，这样将需要的内容传入Flash，再通过Flash的复制功能把传入的内容复制到剪贴板。 Zero Clipboard的安装方法首先需要下载 Zero Clipboard的压缩包，解压后把文件夹中两个文件：ZeroClipboard.js
单例模式 cuishikuan 单例模式
第一种（懒汉，线程不安全）： public class Singleton { 2 private static Singleton instance; 3 pri
spring+websocket的使用 dalan_123
一、spring配置文件 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.or
细节问题：ZEROFILL的用法范围。 dcj3sjt126com mysql
1、zerofill把月份中的一位数字比如1，2，3等加前导0 mysql> CREATE TABLE t1 (year YEAR(4), month INT(2) UNSIGNED ZEROFILL, -> day
Android开发10——Activity的跳转与传值 dcj3sjt126com Android开发
Activity跳转与传值，主要是通过Intent类，Intent的作用是激活组件和附带数据。一、Activity跳转方法一Intent intent = new Intent(A.this, B.class); startActivity(intent) 方法二Intent intent = new Intent();intent.setCla
jdbc 得到表结构、主键 eksliang jdbc 得到表结构、主键
转自博客：http://blog.csdn.net/ocean1010/article/details/7266042 假设有个con DatabaseMetaData dbmd = con.getMetaData(); rs = dbmd.getColumns(con.getCatalog(), schema, tableName, null); rs.getSt
Android 应用程序开关GPS gqdy365 android
要在应用程序中操作GPS开关需要权限： <uses-permission android:name="android.permission.WRITE_SECURE_SETTINGS" /> 但在配置文件中添加此权限之后会报错，无法再eclipse里面正常编译，怎么办？ 1、方法一：将项目放到Android源码中编译； 2、方法二：网上有人说cl
Windows上调试MapReduce zhiquanliu mapreduce
1.下载hadoop2x-eclipse-plugin https://github.com/winghc/hadoop2x-eclipse-plugin.git 把 hadoop2.6.0-eclipse-plugin.jar 放到eclipse plugin 目录中。 2.下载 hadoop2.6_x64_.zip http://dl.iteye.com/topics/download/d2b
如何看待一些知名博客推广软文的行为？ justjavac 博客
本文来自我在知乎上的一个回答：http://www.zhihu.com/question/23431810/answer/24588621 互联网上的两种典型心态：当初求种像条狗，如今撸完嫌人丑当初搜贴像条犬，如今读完嫌人软你为啥感觉不舒服呢？难道非得要作者把自己的劳动成果免费给你用，你才舒服？就如同 Google 关闭了 Gooled Reader，那是
sql优化总结 macroli sql
为了是自己对sql优化有更好的原则性，在这里做一下总结，个人原则如有不对请多多指教。谢谢！要知道一个简单的sql语句执行效率，就要有查看方式，一遍更好的进行优化。一、简单的统计语句执行时间 declare @d datetime ---定义一个datetime的变量set @d=getdate() ---获取查询语句开始前的时间select user_id
Linux Oracle中常遇到的一些问题及命令总结超声波 oracle linux
1.linux更改主机名 (1)#hostname oracledb　　　　临时修改主机名 (2) vi /etc/sysconfig/network 　　修改hostname (3) vi /etc/hosts　　　　　　　　修改IP对应的主机名 2.linux重启oracle实例及监听的各种方法（注意操作的顺序应该是先监听，后数据库实例） &nbs
hive函数大全及使用示例 superlxw1234 hadoop hive函数
具体说明及示例参见附件文档。文档目录：目录一、关系运算： 4 1. 等值比较: = 4 2. 不等值比较: <> 4 3. 小于比较: < 4 4. 小于等于比较: <= 4 5. 大于比较: > 5 6. 大于等于比较: >= 5 7. 空值判断: IS NULL 5
Spring 4.2新特性-使用@Order调整配置类加载顺序 wiselyman spring 4
4.1 @Order Spring 4.2 利用@Order控制配置类的加载顺序 4.2 演示两个演示bean package com.wisely.spring4_2.order; public class Demo1Service { } package com.wisely.spring4_2.order; public class

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他