王大阳_

Python对拉钩网爬取的数据进行数据清洗②

文件地址 Github：https://github.com/why19970628/Python_Crawler/tree/master/LaGou

脏数据

脏数据可以理解为带有不整洁程度的原始数据。原始数据的整洁程度由数据采集质量所决定。脏数据的表现形式五花八门，如若数据采集质量不过关，拿到的原始数据内容只有更差没有最差。脏数据的表现形式包括：
数据串行，尤其是长文本情形下
数值变量种混有文本/格式混乱
各种符号乱入
数据记录错误
大段缺失（某种意义上不算脏数据）
数据采集完后拿到的原始数据到建模前的数据 ———— there is a long way to go. 从数据分析的角度上来讲，这个中间处理脏数据的数据预处理和清洗过程几乎占到了我们全部机器学习项目的60%-70%的时间。
总体而言就是原始数据 -> 基础数据预处理/清洗 -> 探索性数据分析 -> 统计绘图/数据可视化 -> 特征工程

数据清洗与预处理基本方向

数据预处理没有特别固定的套路
数据预处理的困难程度与原始数据脏的程度而定
原始数据越脏，数据预处理工作越艰辛
数据预处理大的套路没有，小的套路一大堆
机器学习的数据预处理基于pandas来做
缺失值处理
小文本和字符串数据处理
法无定法，融会贯通

缺失值处理方法
删除:超过70%以上的缺失
填充

数据分析与成图网址

https://blog.csdn.net/weixin_43746433/article/details/94500669

招聘数据的清洗过程

一.读取数据

import numpy as np
import pandas as pd
import warnings
warnings.filterwarnings('ignore')
data1 = pd.read_csv('./data_analysis.csv', encoding='gbk')
data2 = pd.read_csv('./machine_learning.csv', encoding='gbk')
data3 = pd.read_csv('./data_mining.csv', encoding='gbk')
data4 = pd.read_csv('./deep_learning.csv', encoding='gbk')
data = pd.concat((pd.concat((pd.concat((data1, data2)), data3)), data4)).reset_index(drop=True)
data.shape

data.head()

data.info()

二.清洗数据

2.1将数据中address缺失值改为未知，并去除中括号’[]’

data['address'] = data['address'].fillna("['未知']")
data['address'][:5]

for i, j in enumerate(data['address']):
    j = j.replace('[', '').replace(']', '')
    data['address'][i] = j
data['address'][:5]

2.2将数据中industryLables去除中括号

for i, j in enumerate(data['industryLables']):
    j = j.replace('[', '').replace(']', '')
    data['industryLables'][i] = j
    
data['industryLables'][:10]

2.3去除label中的’[]’

for i, j in enumerate(data['label']):
    j = j.replace('[', '').replace(']', '')
    data['label'][i] = j
    
data['label'][:10]

2.4填充缺失值并去除异常字符

data['position_detail'] = data['position_detail'].fillna('未知')
for i, j in enumerate(data['position_detail']):
    j = j.replace('\r', '').replace('?','')
    data['position_detail'][i] = j
print(data['position_detail'][:3])

2.5取薪水平均值

for i, j in enumerate(data['salary']):
    j = j.replace('k', '').replace('K', '').replace('以上', '-0')
    j1 = int(j.split('-')[0])
    j2 = int(j.split('-')[1])
    j3 = 1/2 * (j1+j2)
    data['salary'][i] = j3*1000
data['salary'].head(10)

2.6 统一position_name名称

for i, j in enumerate(data['position_name']):
    if '数据分析' in j:
        j = '数据分析师'
    if '数据挖掘' in j:
        j = '数据挖掘工程师'
    if '机器学习' in j:
        j = '机器学习工程师'
    if '深度学习' in j:
        j = '深度学习工程师'
    data['position_name'][i] = j
data['position_name'][:5]

data.head()

三数据清洗模块化

import numpy as np
import pandas as pd
import string
import warnings
warnings.filterwarnings('ignore')

class data_clean(object):
    def __init__(self):
        pass
    
    def get_data(self):
        data1 = pd.read_csv('./data_analysis.csv', encoding='gbk')
        data2 = pd.read_csv('./machine_learning.csv', encoding='gbk')
        data3 = pd.read_csv('./data_mining.csv', encoding='gbk')
        data4 = pd.read_csv('./deep_learning.csv', encoding='gbk')

        data = pd.concat((pd.concat((pd.concat((data1, data2)), data3)), data4)).reset_index(drop=True)
        return data

    def clean_operation(self):
        data = self.get_data()
        data['address'] = data['address'].fillna("['未知']")
        for i, j in enumerate(data['address']):
            j = j.replace('[', '').replace(']', '')
            data['address'][i] = j
            
        for i, j in enumerate(data['salary']):
            j = j.replace('k', '').replace('K', '').replace('以上', '-0')
            j1 = int(j.split('-')[0])
            j2 = int(j.split('-')[1])
            j3 = 1/2 * (j1+j2)
            data['salary'][i] = j3*1000
            
        for i, j in enumerate(data['industryLables']):
            j = j.replace('[', '').replace(']', '')
            data['industryLables'][i] = j
            
        for i, j in enumerate(data['label']):
            j = j.replace('[', '').replace(']', '')
            data['label'][i] = j
         
        data['position_detail'] = data['position_detail'].fillna('未知')
        for i, j in enumerate(data['position_detail']):
            j = j.replace('\r', '')
            data['position_detail'][i] = j
            
        return data
    
    
opt = data_clean()
data = opt.clean_operation()
data.head()

四.保存数据

data.to_csv('data_cleaned.csv')

如果保存的文件乱码，请移步这篇文章：
https://blog.csdn.net/weixin_43746433/article/details/94464190

数据分析与成图网址

https://blog.csdn.net/weixin_43746433/article/details/94500669

你可能感兴趣的:(数据分析与数据挖掘,拉钩)

大四学生的前端实习记录
我的第一次实习经历吐槽一下:2022年2月23号在拉钩上投的某所的前端实习生的岗位，一面：24号安排的面试，25号面试完，面试官说回答的很不错。二面：奇葩的一批：发了个数据可视化的页面，让做出来这个静态页面的效果，给了三天，因为我以前做过这个，然后两天就做完了。发过去了。三面：更是奇葩，又让用vue脚手架写二面数据可视化的页面。无语至极，然后我两天之后交了，就不吱声了。当时我们班还有个女生也投的是
腾讯社招前端面经（成都）
本人经验是1.8年，拉钩投递，分享面经用于学习，大家可供参考~面试流程电话面同事面组长面部长面电话面首先会接到一个面试官的电话，问一些简单的问题，简单确认是否水平真实，没有录音，记不到什么了~过了才有线下面试机会(网上说这个只是来简单判断简历是否有水分，所以如果经历正常下能过滴～)。自我介绍上家公司业务、规模项目中遇到的最大挑战react与vue的区别离职原因同事面电话面过了的话，差不多三个工作日
四个机器学习模型对比道路裂缝检测识别分类模型深度学习乐园深度学习实战项目机器学习分类人工智能
完整源码项目包获取→点击文章末尾名片！一、课题综述1.1.课题简介在机器学习的研究领域中，传统分类算法模型数量众多，适合的应用场景也各不相同。1.2.课题目标（示例）本课题使用的数据集来自于数据分析与数据挖掘竞赛Kaggle，该竞赛为数据科学领域著名的国际性赛事之一。课题使用的数据集为带标签的图像数据集，包含带有裂痕和不带有裂痕的桥梁、墙和人行道图片。课题的目标为对于目标数据集，搭建相应的传统机器
SCAU期末笔记 - 数据分析与数据挖掘题库解析 swan416 SCAU学习笔记数据挖掘笔记数据分析
这门怎么题库答案不全啊日来简单学一下子来一、选择题（可多选）将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?(C)A.频繁模式挖掘B.分类和预测C.数据预处理D.数据流挖掘A.频繁模式挖掘：专注于发现数据中频繁出现的项集、序列或子结构。B.分类和预测：用已标记数据训练模型，对新数据做类别判断或数值预测。C.数据预处理：对原始数据做清洗、集成（合并多源数据）、变换（如归一化、离散
在拉钩学习的笔记（七）Web APIs网页应用编程可爱丶妖小妖在拉钩学习的笔记 javascript html5 html dom bom
1、API的概念API（ApplicationProgrammingInterface，应用程序编程接口）是一些预先定义的函数，目的是提供应用程序与开发人员基于某原件或硬件得以访问一组例程的能力，而又无需访问源码，或理解内部工作机制的细节。任何开发语言都有自己的APIAPI的特征输入和输出（1/0）例如：varmax=Math.max(2,3,4);API的使用方法（console.log("ab
如何根据个人现状确定职业方向转型大数据 xiaokaiabcde 大数据大数据开发转型大数据大数据职业规划大数据学习
本文章目录如下：一、大数据相关职位介绍（数据来源于拉钩、智联）（一）大数据相关职位列举（二）每个相关职位的岗位职责与要求二、非程序员转型大数据职位推荐与SWOT分析（一）金融财会，统计，其他商科转型大数据。（二）非科班理工科转型大数据（三）除了第1条以外的文科专业同学转型大数据。三、程序员转型大数据职位推荐与SWOT分析（一）Java后端/JavaWeb程序员转型大数据。（二）Python程序员转
数据挖掘与数据分析两者的区别中琛源科技
随着大数据爆发式增长，市场上对大数据相关人才的需求与日俱增，导致大数据行业人才需求紧缺，引发了关于大数据的学习浪潮，在这个过程中，人们也会不时将数据分析与数据挖掘的关系混淆，什么是数据挖掘?与数据分析有什么联系吗?又或者说数据挖掘与数据分析有什么区别呢?让我们带着这些问题，一起往下解惑吧。数据分析简单的说，就是对数据进行分析，比较专业的说法是，数据分析是指用适当的统计分析方法对收集来的大量数据进行
用selenium爬取拉钩网的职位信息 wg5foc08 Python
拉钩网的职位信息数据为ajax数据，抓取ajax数据可以直接分析数据的url接口，但是直接用requests库发送url请求会被拉钩网识别出来。1.可以通过session保存会话信息模拟请求，这时可以爬取部分信息数据，但是仍然不能爬取大量的或者完整的数据2.用selenium模拟浏览器爬取拉钩网的数据，可以完整的爬取本文拟爬取的url代码1：importrequestsfromlxmlimport
python爬虫学习小叶丶
Python爬虫(1):基本原理Python爬虫(2):Requests的基本用法Python爬虫(3):Requests的高级用法Python爬虫(4):BeautifulSoup的常用方法Python爬虫(5):豆瓣读书练手爬虫Python爬虫(6):煎蛋网全站妹子图爬虫Python爬虫(7):多进程抓取拉钩网十万数据Python爬虫(8):分析Ajax请求爬取果壳网Python爬虫(9):C
【七宗罪】梦筏
[9岁]乔克]:“玛格丽特，你说我会学坏吗?"[玛格丽特]:“乔克，你要记住我可是天使啊,有我你一辈子都不会学坏。”[乔克]:“可是别人都看不见你，你怎么证明我不会变坏呢?"[玛格丽特]:“你不会学坏的，我以天使的名义保证。”[乔克]:“我不信!我们拉钩。[玛格丽特]:“好呀。”这时，妈妈走了进来。[妈妈]:“还没有睡觉吗?我进来了。”[妈妈]:“你一个人自言自语什么呢?”[乔克]:“没有没有，我
python实现搜索引擎，数据检索项目：职业查询系统（基本的搜索引擎+爬虫拉勾网职业数据库），搜索引擎可以学习用户的标记，职业网站爬虫生成数据集 violet_ever_garden python 搜索引擎爬虫算法
简介信息检索小组项目，队友已同意上传用spider爬拉钩网站排序文档基于tfidf和cosine相似性从搜索历史和用户标记的相关和不相关的结果中学习IDE规则方法，优化结果基于Tkinter的UI标准登录模块主搜索窗口与页面切换这里我只放出我贡献相关的部分，原文为英文，懒得翻译就机翻一下，文末给出文件链接正文数据处理搜索引擎我们遵循基本的管道，并实现了排名搜索引擎与一些经典的算法，我们已经研究过。
SEO 爱的微微暖
应聘网站：boss直聘拉钩seo即搜索引擎优化，是一种利用搜索引擎的规则提高网站排名，来获取更多流量，达到网站销售及品牌建设的目标达到的效果；1、让更多的的用户通过搜索引擎搜到你的网站2、让更多的用户喜欢你的的网站SEO是网站营销的一部分，通过对网站内部及外部的调整从而实现网站的最终目标1、完成转化2、达到销售3、广告点击4、品牌建设搜索引擎工作原理爬行蜘蛛抓取网页送到仓库-计算机把仓库信息进行索
可变字符串和日期相关类 Yuanc丶
来自拉钩教育-JAVA就业集训营1.可变字符串2.日期相关类----------------------------------------------------------可变字符串类基本概念1.由于String类描述的字符串内容是个常量不可改变，当需要在Java代码中描述大量类似的字符串时，只能单独申请和存储，此时会造成内存空间的浪费。为了解决上述问题，可以使用java.lang.Strin
Give me five! 踮起脚尖靠近太阳
人生，有你相伴，老也何尝不可。图片来自微博毛绒绒的，这个触感我喜欢。图片来自微博连睡觉，也与你同在。你比某人通人性呵~图片来自微博来，击个掌，老哥我继续睡！图片来自微博主人，不要离开我~~图片来自微博疫情，相隔你，我，他！图片来自微博来，来，来要带我出去找吃的吗？图片来自微博早上好，老铁~图片来自微博拉钩你不能离开我哦~图片来自微博
第二章一叶浮萍向大海（下）吾名蓬歌
“凡事都有例外嘛，像你轻尘哥哥这么帅气聪明的人，人见人爱、花见花开，桃树结果也是理所当然的。”“那我们说好了，等桃树结果你一定要回来！我们拉钩钩。”灵巧儿伸出玲珑秀气的小手指，水灵灵的大眼睛干净而纯粹。轻尘一听说拉钩钩，心里就有种骗小孩子零食吃的感觉。犹豫了一下，还是伸出了小手指跟她拉上。“拉钩上吊，一百年，不许变！”说完，灵巧儿开心地笑了起来。这笑容会传染，轻尘心中的淡淡离愁为之泫然消散，跟着笑
敏捷开发篇--Agile Development-自用墨竹菊软件开发 Java 敏捷流程极限编程团队开发
**如有错误，感谢指正**如有错误，感谢指正，请私信博主，有辛苦红包，拜“一字之师”。请根据目录寻找自己需要的段落导语：本博客为个人整理Java学习记录帖，如有错误，感谢指正。系统学习，欢迎持续关注，后续陆陆续续更新~Java交流qq群383245788。群内有一些资源和大佬，欢迎进来交流。本文旨在学习交流，个人敏捷开发学习心得-自用内容来源：黑皮书-软件开发拉钩教育相关博客和学习视频正文敏捷理论
Python实战：使用DrissionPage库爬取高考网大学信息程序员coding python 爬虫
上一篇文章，我刚入门DrissionPage爬虫库，使用这个库爬取了拉钩网关于Python的职位信息。今天再使用DrissionPage爬虫库练习一个案例，爬取高考网大学信息。本次爬取到2885个大学信息，包含大学名称、所在省、市、大学标签信息。截图如下：一、页面分析目标网页是https://www.gaokao.cn/school/search获取学校名称、所在省市、学婊标签信息。二、分析思路使
2023还有所谓的“金三银四”，行业梦魇35岁是否提前了呢南宫文凯朝闻道夕可死职场和发展
1.大体行业判断技术多元化从原来的单一技术到其他范围：大数据、AI、云容器、算法等等。技能多元化从原来的单一技能到其他技术：后端java、go、python、hive、算法。其他，点开boss或者领英，拉钩，一个岗位不再是只要求会技术相关的部分东西了，还要求不少其他的技能，比如前端要求shell脚本，服务器，部分后端语言。后端不仅要会写代码，云原生，大数据，算法也是一些厂商的基本要求。2.求职壁垒
欣诚幼儿园大八班：遇见“欣”美好欣诚幼儿园郑雅文
你也生气了我也生气了不理不睬不理不睬小嘴巴往上翘呀小嘴巴往上翘你伸小指头我伸小指头拉拉钩拉拉钩拉拉钩我们又做好朋友了我们又做好朋友呀集体活动：周一：安全活动《防溺水》1、提高幼儿的安全意识，知道在水边玩耍会发生的危险，学习有关溺水安全的知识。2、引导幼儿了解溺水安全内容，了解落水自救的常识，切勿亲自下水，做到基本的安全防护意识。周二：安全活动《防欺凌》1.提高幼儿的安全意识，使幼儿懂得什么是欺凌，
函数式编程与Js异步编程、手写Promise（Day01） 5coder
Part1·JavaScript【深度剖析】函数式编程与Js异步编程、手写Promise文章说明：本专栏内容为本人参加【拉钩大前端高新训练营】的学习笔记以及思考总结，学徒之心，仅为分享。如若有误，请在评论区支出，如果您觉得专栏内容还不错，请点赞、关注、评论。共同进步！一、为什么要学习函数式编程函数式编程功能是非常古老的一个概念，早于第一台计算机的诞生，函数式编程的历史学习函数式编程的目的：函数式编
家庭公约学习第27天明天阳光
【念先生好】晚上我上班，又要准备职评资料，拜托您帮我弄份资料，您第一时间落实，让我安心上班，感谢您的支持和责任担当，有您真好，爱您！【念大宝好】今晚，我们都很厉害，三个半小时书法，您也坚持着，难怪老师钦点让您参赛，您的毅力杠杠的，感谢努力成长的您，爱您哦！【念二宝好】已经拉钩下午接您，因为前四天都种种原因错过了，无奈的是下午因为工作又食言了，为了弥补，妈妈买了小礼物，没想到您懂事的跟我说“没接我，
宇航员西西里欧与图书馆少女惊之段 ToujoJotaro
“从前，有位十根手指的少年。少年13岁那年，街边的一位算命师傅对他说：“你的两根小拇指本不是属于你的东西。所以，你不能跟自己拉钩。不然你的小拇指就会结伴离你而去。”少年听后不以为然。当天晚上回家，便漫不经心的用自己左手小拇指勾起右手小拇指。两只小拇指勾在一起后，竟然直接从手上脱落，掉在了书桌上。更令人匪夷所思的是，手上的断面竟然像断尾的壁虎一样直接愈合了。本不自然的现象，发生在少年身上竟显得无比自
路飞项目--01 糖果爱上我前端 javascript python sqlite vue.js
项目类型#面向互联网用户：商城类项目---微信小程序商城#面向互联网用户：二手交易类的---咸鱼、转转#公司内部项目：python写的重点：oa系统(员工管理系统)客户关系管理资产管理打卡系统工资核算系统#第三方公司做的：给医院---互联网，内部的项目银行---内部系统政府钢材市场---商户微信小程序订餐---二维火餐饮行业零售行业问卷网考试系统#个人博客#内容收费站---掘金、拉钩教育#看技术
新媒体运营的「前景」哆啦y
知乎火了，小红书火了，抖音火了，拉钩和Boss直聘上的新媒体运营岗位又霸屏了……如果你不是从事这个行业，入行前你大概能够感知的就是「新媒体运营很火」，这样一个基础的结论或者观点而已。「男怕入错行，女怕嫁错狼」。如果你真的想要从事这个岗位，「前景」可能是在你入行前，你最需要知道的问题之一。有人说：新媒体运营工资很高。也有人说：新媒体运营门槛很低。这一些细碎的观点，脱离具体的行业和城市背景，丝毫没有任
“拉钩”我的法一杯热茶暖暖身
这个将是我此生最大的法宝这里就像一个温暖的家我难受的时候回到这里像个孩子一样可以哭的稀里哗啦不故作坚强我开心的时候回到这里依然像个孩子可以想说什么说什么不他懂我图片发自App我的心里很喜欢这个地方也很爱这个地方这个地方让我重生让我坚强起来去干自己喜欢的事让我不再以吃药的方式维持正常生活我黑暗的角落里有了一束阳光图片发自App阳光把我照的暖暖的我不再傻傻的幻想这个地方给了我世界上唯一的一个婚戒在这里
方凳儿语录清气芳含
图片发自App儿子:妈妈，如果这次考试成绩好，能不能给我买个玩具？图片发自App嫲嫲:考的好，当然可以啊～图片发自App儿子:妈妈，那咱俩拉个勾吧。图片发自App于是，拉钩上吊一百年不许变！图片发自App儿子:妈妈，拉了勾就表示你答应买玩具噢，考的好，就是奖励，考的不好，就是鼓励[偷笑][坏笑][坏笑]图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自Ap
找工作后记：面试的惯性流产，依然没找对位置抢饭驴
Boss直聘截图裸辞在8月初，offer确定是在国庆前，前前后后2个月，中间回了趟老家，去甘南草原晃了一圈，去掉中秋和那么多的周六周日，找工作的时间大概一个半月。意向是想去互联网相关的公司。所以，基本都是在boss直聘和拉钩上投简历、约面试。开始的前两周，每天安排了3-4场面试。后面的时间，一天2场。我把每天都安排满满，生活从未像此刻一般，如此厌恶周末。走遍了上海各种各样的办公室，奇形怪状的面试官
麦芒（原创张传功）张传功
图片发自App01城里人说:山村尽是好东西，连空气的养分都要比城里的空气浓了几倍。山村好的东西是多，连死人的住所都山清水秀。青松，溪流，野花，城里买不起的奢求，在这里只要用镐头画个圈就是你的。人人都可以有，就可以低贱的随便践踏，张三和李四穷的茅屋透风，但画好的墓地足够八代同堂，阳间的穷可以用阴间的富拉钩了。残存的愚昧死不那么快，他把人格割成了等级，并让高尚的人在闲余担忧。都是一个家的成员，文明总是
2018-11-05 玛奇朵_635b
A：最近工作太忙，没时间辅导孩子功课，孩子学习成绩下降。M:沮丧，茫然，既忙不过来工作，又协调不了家庭.调整情绪，释然B:跟孩子一起审查卷子的错题，让孩子自己找出存在的问题，全是粗心导致，引导孩子积极面对挫折，并相信他能很好的吸取教训，提升半期考成绩。R:孩子对自己的粗心也很后悔，表示会更加认真的面对之后的考试，并有信心考好。母子一起加油拉钩，准备周日全家出去吃大餐
我的“健忘症” 沈君阳
我这个人，最大的缺点就是经常忘事，今天，我就挑出一件的给大家献丑。不过，你们别笑我，我们拉钩！今天，老爸抽出一张十块钱的钞票，说:“我要做韭菜炒鸡蛋，去买一些韭菜，剩下的钱归你，做奖励”“老爹万岁！万万岁！”我高叫着。“还有，别在路上忘了！”老爸说！一路上，我哼着一首红流行的歌曲。，把车子骑的摇摇晃晃，果然不出我所料，我已经忘了买什么，不过，本帅哥聪明，把东西的样子记住了，要买长长的，绿绿的。我想
桌面上有多个球在同时运动，怎么实现球之间不交叉，即碰撞？换个号韩国红果果 html 小球碰撞
稍微想了一下，然后解决了很多bug，最后终于把它实现了。其实原理很简单。在每改变一个小球的x y坐标后，遍历整个在dom树中的其他小球，看一下它们与当前小球的距离是否小于球半径的两倍？若小于说明下一次绘制该小球（设为a）前要把他的方向变为原来相反方向（与a要碰撞的小球设为b），即假如当前小球的距离小于球半径的两倍的话，马上改变当前小球方向。那么下一次绘制也是先绘制b，再绘制a，由于a的方向已经改变
《高性能HTML5》读后整理的Web性能优化内容白糖_ html5
读后感先说说《高性能HTML5》这本书的读后感吧，个人觉得这本书前两章跟书的标题完全搭不上关系，或者说只能算是讲解了“高性能”这三个字，HTML5完全不见踪影。个人觉得作者应该首先把HTML5的大菜拿出来讲一讲，再去分析性能优化的内容，这样才会有吸引力。因为只是在线试读，没有机会看后面的内容，所以不胡乱评价了。
[JShop]Spring MVC的RequestContextHolder使用误区 dinguangx jeeshop 商城系统 jshop 电商系统
在spring mvc中，为了随时都能取到当前请求的request对象，可以通过RequestContextHolder的静态方法getRequestAttributes()获取Request相关的变量，如request, response等。在jshop中，对RequestContextHolder的
算法之时间复杂度周凡杨 java 算法时间复杂度效率
在计算机科学中，算法的时间复杂度是一个函数，它定量描述了该算法的运行时间。这是一个关于代表算法输入值的字符串的长度的函数。时间复杂度常用大O符号表述，不包括这个函数的低阶项和首项系数。使用这种方式时，时间复杂度可被称为是渐近的，它考察当输入值大小趋近无穷时的情况。这样用大写O()来体现算法时间复杂度的记法，
Java事务处理 g21121 java
一、什么是Java事务通常的观念认为，事务仅与数据库相关。事务必须服从ISO/IEC所制定的ACID原则。ACID是原子性（atomicity）、一致性（consistency）、隔离性（isolation）和持久性（durability）的缩写。事务的原子性表示事务执行过程中的任何失败都将导致事务所做的任何修改失效。一致性表示当事务执行失败时，所有被该事务影响的数据都应该恢复到事务执行前的状
Linux awk命令详解 510888780 linux
一. AWK 说明 awk是一种编程语言，用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入、一个或多个文件，或其它命令的输出。它支持用户自定义函数和动态正则表达式等先进功能，是linux/unix下的一个强大编程工具。它在命令行中使用，但更多是作为脚本来使用。 awk的处理文本和数据的方式：它逐行扫描文件，从第一行到
android permission 布衣凌宇 Permission
<uses-permission android:name="android.permission.ACCESS_CHECKIN_PROPERTIES" ></uses-permission>允许读写访问"properties"表在checkin数据库中，改值可以修改上传 <uses-permission android:na
Oracle和谷歌Java Android官司将推迟 aijuans java oracle
北京时间 10 月 7 日，据国外媒体报道，Oracle 和谷歌之间一场等待已久的官司可能会推迟至 10 月 17 日以后进行，这场官司的内容是 Android 操作系统所谓的 Java 专利权之争。本案法官 William Alsup 称根据专利权专家 Florian Mueller 的预测，谷歌 Oracle 案很可能会被推迟。　　该案中的第二波辩护被安排在 10 月 17 日出庭，从目前看来
linux shell 常用命令 antlove linux shell command
grep [options] [regex] [files] /var/root # grep -n "o" * hello.c:1:/* This C source can be compiled with:
Java解析XML配置数据库连接(DOM技术连接 SAX技术连接) 百合不是茶 sax技术 Java解析xml文档 dom技术 XML配置数据库连接
XML配置数据库文件的连接其实是个很简单的问题,为什么到现在才写出来主要是昨天在网上看了别人写的,然后一直陷入其中,最后发现不能自拔所以今天决定自己完成 ,,,,现将代码与思路贴出来供大家一起学习 XML配置数据库的连接主要技术点的博客; JDBC编程 : JDBC连接数据库 DOM解析XML: DOM解析XML文件 SA
underscore.js 学习（二） bijian1013 JavaScript underscore
Array Functions 所有数组函数对参数对象一样适用。1.first _.first(array, [n]) 别名: head, take 返回array的第一个元素，设置了参数n，就
plSql介绍 bijian1013 oracle 数据库 plsql
/* * PL/SQL 程序设计学习笔记 * 学习plSql介绍.pdf * 时间：2010-10-05 */ --创建DEPT表 create table DEPT ( DEPTNO NUMBER(10), DNAME NVARCHAR2(255), LOC NVARCHAR2(255) ) delete dept; select
【Nginx一】Nginx安装与总体介绍 bit1129 nginx
启动、停止、重新加载Nginx nginx 启动Nginx服务器，不需要任何参数u nginx -s stop 快速(强制)关系Nginx服务器 nginx -s quit 优雅的关闭Nginx服务器 nginx -s reload 重新加载Nginx服务器的配置文件 nginx -s reopen 重新打开Nginx日志文件
spring mvc开发中浏览器兼容的奇怪问题 bitray jquery Ajax springMVC 浏览器上传文件
最近个人开发一个小的OA项目,属于复习阶段.使用的技术主要是spring mvc作为前端框架,mybatis作为数据库持久化技术.前台使用jquery和一些jquery的插件. 在开发到中间阶段时候发现自己好像忽略了一个小问题,整个项目一直在firefox下测试,没有在IE下测试,不确定是否会出现兼容问题.由于jquer
Lua的io库函数列表 ronin47 lua io
1、io表调用方式：使用io表，io.open将返回指定文件的描述，并且所有的操作将围绕这个文件描述　　io表同样提供三种预定义的文件描述io.stdin,io.stdout,io.stderr 　　2、文件句柄直接调用方式,即使用file:XXX()函数方式进行操作,其中file为io.open()返回的文件句柄　　多数I/O函数调用失败时返回nil加错误信息,有些函数成功时返回nil
java-26-左旋转字符串 bylijinnan java
public class LeftRotateString { /** * Q 26 左旋转字符串 * 题目：定义字符串的左旋转操作：把字符串前面的若干个字符移动到字符串的尾部。 * 如把字符串abcdef左旋转2位得到字符串cdefab。 * 请实现字符串左旋转的函数。要求时间对长度为n的字符串操作的复杂度为O(n)，辅助内存为O(1)。 */ pu
《vi中的替换艺术》-linux命令五分钟系列之十一 cfyme linux命令
vi方面的内容不知道分类到哪里好，就放到《Linux命令五分钟系列》里吧！今天编程，关于栈的一个小例子，其间我需要把”S.”替换为”S->”(替换不包括双引号)。其实这个不难，不过我觉得应该总结一下vi里的替换技术了，以备以后查阅。 1 所有替换方案都要在冒号“:”状态下书写。 2 如果想将abc替换为xyz，那么就这样 :s/abc/xyz/ 不过要特别
[轨道与计算]新的并行计算架构 comsci 并行计算
我在进行流程引擎循环反馈试验的过程中，发现一个有趣的事情。。。如果我们在流程图的每个节点中嵌入一个双向循环代码段，而整个流程中又充满着很多并行路由，每个并行路由中又包含着一些并行节点，那么当整个流程图开始循环反馈过程的时候，这个流程图的运行过程是否变成一个并行计算的架构呢？
重复执行某段代码 dai_lm android
用handler就可以了 private Handler handler = new Handler(); private Runnable runnable = new Runnable() { public void run() { update(); handler.postDelayed(this, 5000); } }; 开始计时 h
Java实现堆栈（list实现） datageek 数据结构——堆栈
public interface IStack<T> { //元素出栈，并返回出栈元素 public T pop(); //元素入栈 public void push(T element); //获取栈顶元素 public T peek(); //判断栈是否为空 public boolean isEmpty
四大备份MySql数据库方法及可能遇到的问题 dcj3sjt126com DB backup
一：通过备份王等软件进行备份前台进不去？用备份王等软件进行备份是大多老站长的选择，这种方法方便快捷，只要上传备份软件到空间一步步操作就可以，但是许多刚接触备份王软件的客用户来说还原后会出现一个问题：因为新老空间数据库用户名和密码不统一，网站文件打包过来后因没有修改连接文件，还原数据库是好了，可是前台会提示数据库连接错误，网站从而出现打不开的情况。解决方法：学会修改网站配置文件，大多是由co
github做webhooks：[1]钩子触发是否成功测试 dcj3sjt126com github git webhook
转自: http://jingyan.baidu.com/article/5d6edee228c88899ebdeec47.html github和svn一样有钩子的功能，而且更加强大。例如我做的是最常见的push操作触发的钩子操作，则每次更新之后的钩子操作记录都会在github的控制板可以看到！工具/原料 github 方法/步骤
">的作用" target="_blank">JSP中的作用蕃薯耀
JSP中<base href="<%=basePath%>">的作用 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
linux下SAMBA服务安装与配置 hanqunfeng linux
局域网使用的文件共享服务。一.安装包： rpm -qa | grep samba samba-3.6.9-151.el6.x86_64 samba-common-3.6.9-151.el6.x86_64 samba-winbind-3.6.9-151.el6.x86_64 samba-client-3.6.9-151.el6.x86_64 samba-winbind-clients
guava cache IXHONG cache
缓存，在我们日常开发中是必不可少的一种解决性能问题的方法。简单的说，cache 就是为了提升系统性能而开辟的一块内存空间。　　缓存的主要作用是暂时在内存中保存业务系统的数据处理结果，并且等待下次访问使用。在日常开发的很多场合，由于受限于硬盘IO的性能或者我们自身业务系统的数据处理和获取可能非常费时，当我们发现我们的系统这个数据请求量很大的时候，频繁的IO和频繁的逻辑处理会导致硬盘和CPU资源的
Query的开始--全局变量,noconflict和兼容各种js的初始化方法 kvhur JavaScript jquery css
这个是整个jQuery代码的开始，里面包含了对不同环境的js进行的处理，例如普通环境，Nodejs，和requiredJs的处理方法。还有jQuery生成$, jQuery全局变量的代码和noConflict代码详解完整资源： http://www.gbtags.com/gb/share/5640.htm jQuery 源码： (
美国人的福利和中国人的储蓄 nannan408
今天看了篇文章，震动很大，说的是美国的福利。美国医院的无偿入院真的是个好措施。小小的改善，对于社会是大大的信心。小孩，税费等，政府不收反补，真的体现了人文主义。美国这么高的社会保障会不会使人变懒？答案是否定的。正因为政府解决了后顾之忧，人们才得以倾尽精力去做一些有创造力，更造福社会的事情，这竟成了美国社会思想、人
N阶行列式计算(JAVA) qiuwanchi N阶行列式计算
package gaodai; import java.util.List; /** * N阶行列式计算 * @author 邱万迟 * */ public class DeterminantCalculation { public DeterminantCalculation(List<List<Double>> determina
C语言算法之打渔晒网问题 qiufeihu c 算法
如果一个渔夫从2011年1月1日开始每三天打一次渔，两天晒一次网，编程实现当输入2011年1月1日以后任意一天，输出该渔夫是在打渔还是在晒网。代码如下： #include <stdio.h> int leap(int a) /*自定义函数leap()用来指定输入的年份是否为闰年*/ { if((a%4 == 0 && a%100 != 0
XML中DOCTYPE字段的解析 wyzuomumu xml
DTD声明始终以!DOCTYPE开头,空一格后跟着文档根元素的名称,如果是内部DTD,则再空一格出现[],在中括号中是文档类型定义的内容. 而对于外部DTD,则又分为私有DTD与公共DTD,私有DTD使用SYSTEM表示,接着是外部DTD的URL. 而公共DTD则使用PUBLIC,接着是DTD公共名称,接着是DTD的URL. 私有DTD <!DOCTYPErootSYST

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他