piaow_

Python3-Scrapy框架-猎聘网

进入网站首页：
找到如下所示位置，可得到对应页面的信息（在链接页面上方不能进行条件筛选，否则需要进行页面测试能否爬虫）

一.创建项目

这里默认已经安装好了Python、Scrapy等环境

1.打开cmd创建项目

scrapy startproject liepincom

2.进入项目目录

cd liepincom

3. 创建spider

scrapy genspider liepin liepin.com

命令执行完毕后，项目的目录结构应该如下述所示：

4.导入第三方库

本人安装的第三方库如下所示，当然对于本项目来说是有多余的，为了供大家方便使用，现将全部内容展现出来供大家安装使用。

操作方法：将下述内容复制到文本文件中，并重命名为requirements(这种命名是一种规范，一目了然，当然了想起别的名称也没问题)

async-generator==1.10
attrs==22.1.0
Automat==22.10.0
certifi==2022.9.24
cffi==1.15.1
charset-normalizer==2.1.1
constantly==15.1.0
cryptography==38.0.4
cssselect==1.2.0
et-xmlfile==1.1.0
exceptiongroup==1.0.4
filelock==3.8.2
h11==0.14.0
hyperlink==21.0.0
idna==3.4
incremental==22.10.0
itemadapter==0.7.0
itemloaders==1.0.6
jmespath==1.0.1
lxml==4.9.1
openpyxl==3.0.10
outcome==1.2.0
packaging==21.3
parsel==1.7.0
Protego==0.2.1
pyasn1==0.4.8
pyasn1-modules==0.2.8
pycparser==2.21
PyDispatcher==2.0.6
PyMySQL==1.0.2
pyOpenSSL==22.1.0
pyparsing==3.0.9
pyquery==1.4.3
PySocks==1.7.1
queuelib==1.6.2
requests==2.28.1
requests-file==1.5.1
Scrapy==2.7.1
selenium==4.7.2
service-identity==21.1.0
six==1.16.0
sniffio==1.3.0
sortedcontainers==2.4.0
tldextract==3.4.0
trio==0.22.0
trio-websocket==0.9.2
Twisted==22.10.0
twisted-iocpsupport==1.0.2
typing-extensions==4.4.0
urllib3==1.26.13
w3lib==2.1.0
wsproto==1.2.0
zope.interface==5.5.2

此时项目分支展示：

保存完文件，最后执行如下命令

环境配置成功！

二、编写spider代码

修改liepin.py代码如下所示：

import scrapy
from scrapy import Selector
from liepincom.items import LiepincomItem


class LiepinSpider(scrapy.Spider):
    name = 'liepin'
    allowed_domains = ['liepin.com']
    start_urls = ['https://liepin.com/career/java']

    # 预先准备好待爬取页面的URL
    def start_requests(self):
        for page in range(5):
            yield scrapy.Request(
                url=f'https://www.liepin.com/career/java/pn{page}/'
            )


    def parse(self, response):
        sel = Selector(response)
        # 用不同的xpath路径方式进行解析，多体会xpath解析方式的强大与方便之处
        position = sel.xpath('/html/body/div/div/div/div[1]/div/div[1]/ul/li/div/div/div[1]/div/a[1]/div[1]/div/div[1]/text()').extract()  # 完整路径
        city = sel.xpath('//div[@class="job-title-box"]//span[@class="ellipsis-1"]/text()').extract()  #手写xpath路径
        salary = sel.xpath('//*[@id="main-container"]/div/div/div[1]/div/div[1]/ul/li/div/div/div/div/a/div[1]/span/text()').extract()  # 浏览器给出的路径
        year = sel.xpath('//*[@id="main-container"]/div/div/div[1]/div/div[1]/ul/li/div/div/div[1]/div/a[1]/div[2]/span[1]/text()').extract()
        edu = sel.xpath('//*[@id="main-container"]/div/div/div[1]/div/div[1]/ul/li/div/div/div[1]/div/a[1]/div[2]/span[2]/text()').extract()
        company = sel.xpath('//div[@data-nick="job-detail-company-info"]//div[@class="job-company-info-box"]/span/text()').extract()
        company_size = sel.xpath('//div[@data-nick="job-detail-company-info"]//div[@class="company-tags-box ellipsis-1"]//span[last()]/text()').extract()

        for a, b, c, d, e, f, g in zip(position,city,salary,year,edu,company,company_size):
            liepin_item = LiepincomItem()
            liepin_item['position'] = a
            liepin_item['city'] = b
            liepin_item['salary'] = c
            liepin_item['year'] = d
            liepin_item['edu'] = e
            liepin_item['company'] = f
            liepin_item['company_size'] = g
            # 注意不要用return，否则遍历一次就返回完毕了
            yield liepin_item

三、编写items数据结构对象

修改items.py代码如下所示：

# Define here the models for your scraped items
#
# See documentation in:
# https://docs.scrapy.org/en/latest/topics/items.html

import scrapy

class LiepincomItem(scrapy.Item):
    # define the fields for your item here like:
    # name = scrapy.Field()
    position = scrapy.Field()
    city = scrapy.Field()
    salary = scrapy.Field()
    year = scrapy.Field()
    edu = scrapy.Field()
    company = scrapy.Field()
    company_size = scrapy.Field()

四、编写Pipelines项目管道

修改pipelines.py代码如下所示：

# Define your item pipelines here
#
# Don't forget to add your pipeline to the ITEM_PIPELINES setting
# See: https://docs.scrapy.org/en/latest/topics/item-pipeline.html


# useful for handling different item types with a single interface
import openpyxl
import pymysql
from itemadapter import ItemAdapter

# 保存数据到Mysql数据库
class MysqlPipeline:

    def __init__(self):
        self.conn = pymysql.connect(host='localhost',port=3306,
                                    user='root',password='1234',
                                    database='spider')
        self.cursor = self.conn.cursor()

    def close_spider(self,spider):
        self.conn.commit()
        self.conn.close()

    # 回调函数，让scrapy框架主动调用我们的方法（callback），上述其他方法都是调用框架给我们的方法（call）,每有一个数据就调用一次
    def process_item(self, item, spider):
        db_post = item.get('position', '')
        db_city = item.get('city', '')
        db_salary = item.get('salary', '')
        db_year = item.get('year', '')
        db_edu = item.get('edu', '')
        db_company = item.get('company', '')
        db_company_size = item.get('company_size', '')

        self.cursor.execute(
            'insert into liepin_zhaopin (position, city, salary, year, edu, company, company_size) values (%s,%s,%s,%s,%s,%s,%s)',
            (db_post, db_city, db_salary, db_year, db_edu, db_company, db_company_size)
        )
        return item


# 保存数据到excel
class LiepincomPipeline:

    def __init__(self):
        # 创建工作簿
        self.wb = openpyxl.Workbook()
        # 拿到默认被激活的工作表
        self.ws = self.wb.active
        self.ws.title = '招聘信息'
        self.ws.append(('岗位','城市','薪水','工作年限','学历','公司名称','公司规模'))

    def close_spider(self,spider):
        self.wb.save('招聘数据.xlsx')

    # 回调函数，让scrapy框架主动调用我们的方法（callback），上述其他方法都是调用框架给我们的方法（call）
    def process_item(self, item, spider): # 得到数据并写入excel文件中
        db_post = item.get('position','')
        db_city = item.get('city','')
        db_salary = item.get('salary','')
        db_year = item.get('year','')
        db_edu = item.get('edu','')
        db_company = item.get('company','')
        db_company_size = item.get('company_size','')
        self.ws.append((db_post, db_city, db_salary, db_year, db_edu, db_company, db_company_size))
        return item

五、修改一些settings配置信息

注意：数字越小，越靠前执行

ITEM_PIPELINES = {
   'liepincom.pipelines.LiepincomPipeline': 300,
   'liepincom.pipelines.MysqlPipeline': 200,
}

六、创建数据库表

这里是在Navicat中执行了如下命令，先创建数据库，再创建张表

CREATE DATABASE spider

CREATE TABLE `liepin_zhaopin`(
`liepin_id` int UNSIGNED auto_increment comment '编号',
`position` VARCHAR(50) not null comment '岗位',
`city` VARCHAR(30) not null COMMENT '城市',
`salary` VARCHAR(30) not null COMMENT '薪水',
`year` VARCHAR(30) not NULL COMMENT '工作年限',
`edu` VARCHAR(20) not NULL COMMENT '学历',
`company` VARCHAR(50) not NULL COMMENT '公司',
`company_size` VARCHAR(30) not NULL COMMENT '公司规模',
PRIMARY KEY (`liepin_id`)
)

可以发现，数据库中有了对应的表

七、执行程序

进入到项目文件夹，输入如下命令，回车

在Mysql数据库生成如下数据：

并在项目目录下生成了如下文件：

打开后内容展示

八、项目说明

1.如上内容爬取的是java相关信息，如想爬取其他，只需更改URL链接地址即可，因为页面的构造相同，xpath解析路径没有发生改变。
2.因为网站robots协议设置关系，不是所有页面都可以进行爬取的，关于能够爬取哪些页面，可以通过如下方式查看：
以Edge浏览器为例，打开F12开发者模式，找到网络–>全部–>预览，刷新；
如果这里预览到了页面的全部信息，说明是可以进行直接爬取的；否则，需要改进技术选型和方法，应对此种问题的方式这里先不做介绍。
3.后续改进，可以遍历首页中的列表进入子链接URL，重复调用parse方法，如此操作，所有岗信息都可以进行一次爬取了（即不用再更改网页URL后重复执行程序了）。

你可能感兴趣的:(python,python,scrapy)

Python咒语大全（学习笔记与使用指南）桑迪Sandy.Q Python python 开发语言
目录字符串格式限制，%xd（整数），%x.yf（小数点浮点数）f“内容{变量}快速格式化案例1：股价预测INPUT语句案例2：INPUT登陆界面语句布尔类型函数基础运用案例3:比较运算符的运用IF语句基本格式案例4:IF语句+INPUT语句练习案例5:IFELSE语句案例6:IFELIFELSE语句案例7:猜数字小游戏案例8:IFELSE嵌套规则案例9:IFELSE嵌套（符合工龄的员工可享受旅游）
Python音频库龅牙内马尔
Python音频库Python有一些很棒的音频处理库，比如Librosa和PyAudio。还有一些内置的模块（内置库wave）用于一些基本的音频功能。我们将主要使用两个库进行音频采集和分析：1.LibrosaLibrosa是一个用于音频、音乐分析、处理的python工具包，一些常见的时频处理、特征提取、绘制声音图形等功能应有尽有，功能十分强大。功能实现：读取音频提取特征提取Log-MelSpect
使用pyarmor对python文件进行加密 robot_future ubuntu pycharm linux
在pycharm上开发python后，需要对python文件进行加密。进行了调研，采用pyarmor进行加密。PyArmor是一个用于加密和保护Python脚本的工具。它能够在运行时刻保护Python脚本的二进制代码不被泄露。因为代码是python3代码，windows上的默认python是2.7版本。所以换到ubuntu上进行操作。ubuntu上：sudoapt-getinstallpython
基于昇腾910B部署Qwen3-embedding-8B模型（通过vllm 推理引擎部署）萌新--加油 embedding 人工智能经验分享
目前基于知识库搭建，会涉及到embedding和rerank模型，目前阿里通义千问Qwen3-embedding-8B模型在网上测评效果还不错，本文基于vllm部署Qwen3-embedding-8B模型，使用的国产化算力910B2-64G单卡资源。1、环境要求：软件支持版本CANN>=8.1.RC1torch-npu>=2.5.1torch>=2.5.1Python>=3.9,<3.122、to
【SNN脉冲神经网络2】AdEx神经网络软件仿真 XvnNing SNN脉冲神经网络神经网络人工智能深度学习
本文使用AdEx神经元搭建一个完整的神经网络来进行生物神经脉冲现象的仿真。主要的目的是为了验证数学原理，因此只调用的numpy函数包。对应的代码例程如下：1.导入所需的Python函数库importnumpyasnpimportmatplotlib.pyplotaspltimportreimportos2.定义均值函数以及一些常用函数defbin_data(data):try:returnnp.m
Pyarmor 项目使用教程
Pyarmor项目使用教程pyarmorAtoolusedtoobfuscatepythonscripts,bindobfuscatedscriptstofixedmachineorexpireobfuscatedscripts.项目地址:https://gitcode.com/gh_mirrors/py/pyarmor1.项目目录结构及介绍Pyarmor项目的目录结构如下：pyarmor/├──
Python 之指针（Pointers）的理解与应用ぃ曦晔° python java 前端
Python之指针（Pointers）的理解与应用1.变量与对象的引用关系2.可变对象与不可变对象3.模拟指针操作4.函数参数传递机制5.“空指针”“双指针”的详解和应用场景6.垃圾回收与引用计数7.应用场景在Python中，虽然没有显式的指针概念（如C/C++中的int*p），但所有变量本质上都是对对象的引用（类似于指针的抽象）。理解这一点对掌握Python的内存管理、参数传递和可变/不可变对象
Python数据结构之 Big O ぃ曦晔° 数据结构算法 Big O 复杂度
学习课程：【Udemy高分付费课程】Python数据结构与算法-终极Python编码面试和计算机科学训练营在Python中，BigO表示法用于描述算法的时间复杂度，即算法运行时间与输入大小之间的关系；或空间复杂度，即算法运行时所占用的内存。在处理时间复杂度和空间复杂度是有3个希腊字母：Ω--最佳速度θ--平均速度O--最坏情况我们在讨论BigO时，总是在谈论最坏情况（WorstCase）Pytho
Python 数据结构之队列（Queue）
Python中的队列（Queue）概述队列是一种遵循先进先出（FIFO,FirstInFirstOut）原则的线性数据结构，这意味着最早进入队列的元素将最先被移除。常用于任务调度、缓冲区管理等场景。Python提供了多种实现队列的方式，包括内置模块和第三方库。Python中queue的主要类型Python的queue模块提供了几种常用的队列类型，每种类型都有其独特的特性和应用场景。1.QueueQ
Python class：定义类 Itmastergo python 开发语言
类仅仅充当图纸的作用，本身并不能直接拿来用，而只有根据图纸造出的实际物品（对象）才能直接使用。因此，Python程序中类的使用顺序是这样的：1、创建（定义）类，也就是制作图纸的过程；2、创建类的实例对象（根据图纸造出实际的物品），通过实例对象实现特定的功能。这里先教大家如何创建（定义）一个类，如何使用定义好的类将放到以后进行讲解。Python类的定义Python中定义一个类使用class关键字实现
Python之 Class的定义和使用ぃ曦晔° python 开发语言
类的定义在Python中，class是用来定义类的关键字。通过class关键字可以创建一个新的类，该类可以包含属性和方法。类名通常使用大写字母开头的驼峰命名法。定义类的基本语法：class类名:#类名惯用驼峰式命名#类属性（所有实例共享）类属性=值#构造方法（初始化对象）def__init__(self,参数1,参数2,...):#实例属性（每个实例独有）self.属性1=参数1self.属性2=
Python 进攻性渗透测试（一）
原文：annas-archive.org/md5/dccde1d96c9ad81f97529d78e3e69c9b译者：飞龙协议：CCBY-NC-SA4.0序言Python是一种易学的跨平台编程语言，具有无限的第三方库。许多开源黑客工具都是用Python编写的，可以轻松地集成到你的脚本中。本书被分成了清晰的小部分，你可以按照自己的节奏学习，并专注于对你最有兴趣的领域。你将学会如何编写自己的脚本，并
无限弹窗（python）在线码BUG python
生活中当我们给朋友发消息不回时就可以为他发送一个无限弹窗打代码，他因为好奇打开了那么他就中计了，没有中计我们也不会损失什么importtkinterastkimportrandomimportthreadingimporttimedefdow():window=tk.Tk()window.title('你是XX')window.geometry("200x50"+"+"+str(random.ra
使用Python制作电脑无限弹窗恶搞程序教程 kkkliaoo python 开发语言安全
效果如下：演示视频：python弹窗恶搞程序演示视频教程：1，导入模块，下载模块的方法不过多说明了，可以看我其他的文章有说怎么下载第三方模块，或者Alt+Enter下载也可。#弹窗恶搞importtkinterastkimportrandomimportthreadingimporttime2，复制如下代码，运行即可defdow():window=tk.Tk()width=window.winfo
Python用于进攻性渗透测试教程董宙帆
Python用于进攻性渗透测试教程Python-for-Offensive-PenTestPythonforOffensivePenTest,publishedbyPackt项目地址:https://gitcode.com/gh_mirrors/py/Python-for-Offensive-PenTest本教程旨在指导您了解并使用Python-for-Offensive-PenTest这一开源项
Python 进攻性渗透测试（二）
原文：annas-archive.org/md5/dccde1d96c9ad81f97529d78e3e69c9b译者：飞龙协议：CCBY-NC-SA4.0第四章：追捕我吧！在今天的世界里，绕过和劫持软件在互联网上到处都是。然而，明确的使用和执行方式才是让你成为一名优秀的业余黑客的关键。这可以通过正确选择工具并遵循必要的过程，完美地完成手头的任务来实现。在本章中，我们将涵盖以下主题，帮助你实现这一
Python版无限弹窗（禁用鼠标键盘不禁触摸板）迪迦隔山海 python
提示：整蛊小木马简单好玩又实用期末将近可刺激着急的同学们也可以整蛊老师不要过分！！！注意不要过分！！！一、无限弹窗1.引入库代码如下（示例）：importos通过while死循环用os库调用cmd弹窗2.while循环代码如下（示例）：whileTrue:os.system('startcmd')但是如果这样就心满意足那是远远不够的，这样的程序容易关闭，可以添加上禁用鼠标键盘等功能，然后还可以进行
Python 快速入门教程：构建一个 A2A Agent @井九 python 开发语言
欢迎来到Agent2Agent(A2A)Python快速入门教程！在本教程中，您将使用PythonSDK探索一个简单的“回声”A2A服务器。这将向您介绍A2A服务器的基本概念和组件。然后，您将看到一个集成了大型语言模型(LLM)的更高级示例。本实践指南将帮助您理解：A2A协议背后的基本概念。如何使用SDK为A2A开发设置Python环境。AgentSkills(智能体技能)和AgentCards(
为什么 Python 是 AI 的首选语言？
文章目录一、简洁优雅，易于上手二、丰富的库和框架1.数据处理与分析2.数据可视化3.机器学习与深度学习框架三、强大的社区支持四、跨平台性和可移植性五、与其他语言的互操作性文章配套代码已上传，点击查看：https://download.csdn.net/download/2501_92578370/91180848在人工智能（AI）技术飞速发展的今天，编程语言的选择对AI开发者来说至关重要。当你翻开
【Python基础】13 知识拓展：CPU、GPU与NPU的区别和联系智算菩萨 python 开发语言人工智能
引言：处理器大战背后的技术革命在人工智能蓬勃发展的今天，我们经常听到CPU、GPU、NPU这些术语，但你是否真正理解它们之间的区别和联系？作为Python开发者，我们更关心的是：在什么场景下选择哪种处理器？如何在Python中充分发挥它们的性能优势？这篇文章将从技术原理出发，结合Python实战代码，深入解析这三种处理器的特点、应用场景和发展趋势，帮助你在面对不同计算任务时做出最优选择。第一章：C
【Python基础】15 Python并发编程进阶智算菩萨 python 人工智能
在现代软件开发中，随着多核处理器的普及和网络应用的复杂化，并发编程已经成为提升程序性能的关键技术。Python作为一门优雅且强大的编程语言，提供了多种并发编程方案，包括多线程、多进程和异步编程。然而，很多开发者在面对具体场景时，往往不知道该选择哪种方案，或者对这些技术的底层原理缺乏深入理解。本文将深入探讨Python并发编程的三大核心技术，从底层原理到实际应用，通过详实的案例分析帮助读者掌握在不同
Python性能优化：10个提升代码性能的策略进击的六角龙 Python python 性能优化开发语言
文末赠免费精品编程资料~~引言今天，我们就来聊聊如何让你的Python代码飞起来——通过10个实用的性能优化策略。别担心，我们会从基础讲起，一步步带你进入性能优化的大门。1.使用内置函数和库Python内置了许多高效的函数和库，利用它们往往比自己从头写要快得多。比如，列表推导式就比for循环创建列表更快。# 列表推导式 vs for循环fast_list = [i**2 for i in rang
【Python基础】14 内存管理与性能优化智算菩萨 python 性能优化开发语言
前言在现代软件开发中，性能优化已经成为每位开发者必须掌握的核心技能。Python作为一门高级编程语言，虽然在语法简洁性和开发效率方面具有显著优势，但其解释型语言的特性也带来了性能上的挑战。深入理解Python的内存管理机制，掌握有效的性能优化策略，不仅能够帮助我们编写出更高效的代码，还能在处理大规模数据和高并发场景时游刃有余。本文将从Python内存管理的底层原理出发，深入探讨垃圾回收机制、内存分
python lambda函数计算三次幂_pythonlambda函数及三个常用的高阶函数
进行编程时，一般我们会给一个函数或者变量起一个名字，该名称是用于引用或寻址函数变量。但是有一个低调的函数，你不需要赋予它名字，因此该函数也叫匿名函数。该函数就是Python中的Lambda函数，下面就来为大家解析python—lambda函数，三个常用的高阶函数。为什么要使用PythonLambda函数？匿名函数可以在程序中任何需要的地方使用，但是这个函数只能使用一次，即一次性的。因此Python
python有哪些函数怎么用_必须掌握的常用python函数有哪些？
必须掌握的常用python函数有哪些？更新时间：2020年11月02日作者：spoto必须掌握的常用Python的安装设置过程中需要注意的事项，今天我们就另一个学员们经常询问的问题进行解答。我们都知道Python有许多函数，但是因为数量庞大，难以全部掌握，所以今天我们帮助大家删繁就简，下面罗列了大家在学习过程中必须掌握的一些常用Python函数及其用途功能，希望大家认真学习，熟练应用。1.prin
AutoGen行业应用与典型场景实践
摘要AutoGen作为分布式多智能体AI系统，已在金融、医疗、教育、智能客服等行业落地应用。本文系统梳理AutoGen在各行业的应用模式、业务流程、Python实战、最佳实践与常见问题，助力中国AI开发者高效构建行业级AI解决方案。1.AutoGen行业应用全景与价值支持多智能体协作，适配复杂业务流程易于集成主流大模型与行业工具分布式部署，满足高可用与弹性扩展需求典型行业：金融风控、医疗问答、教育
Deep Global Registration 代码环境配置(rtx3090+python3.8+cuda11.1+pytorch1.7+MinkowskiEngine0.5.1) JPy646 pytorch 深度学习神经网络
前言踩过的坑：因为rtx3090最低算力是8.6，似乎不支持过低版本的cuda。试过pytorch1.7.0+cuda11.0，但会报错，由于cuda11.0支持的最高算力达不到rtx最低的要求。但配置pytorch1.8时DGR的代码运行时会报错。对于没有这个烦恼的还是推荐安装python3.6+cuda10.2+pytorch1.6+MinkowskiEngine0.4.3,这个配置无需改动代
从 Alpha 到 Final：Python 各阶段版本到底该怎么用？三金C_C Python python 版本生命周期
主流的Python是由PythonSoftwareFoundation（PSF，Python软件基金会）主导的：PSF是一个非营利组织负责维护Python官方语言规范、标准库、社区基础设施它主导的实现版本是我们日常使用的：CPythonPython的版本阶段（版本周期）。这些阶段是官方正式定义的，适用于每一个Python主版本（比如3.12、3.13、3.14…）Python版本的四大阶段Pyth
RTX50系显卡+CUDA+torch+python对应关系
前言本人的显卡是RTX5070，使用时发现它对CUDA、torch和python版本有要求，试图按照老项目的依赖文件进行安装发现安不了，因此记录一下（截至2025年6月）。提示：以下是本篇文章正文内容，下面案例可供参考一、RTX50系显卡只能使用CUDA12.8二、目前只支持torch2.7.0和2.7.11.去pytorch官网的https://download.pytorch.org/whl/
Github 2025-07-01 开源项目月报 Top16
根据GithubTrendings的统计，本月(2025-07-01统计)共有16个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量TypeScript项目5JupyterNotebook项目4Python项目4Rust项目2JavaScript项目1非开发语言项目1Shell项目1Dockerfile项目1Java项目1C++项目1Vue项目1各种有趣主题的精彩清单创建周期：3
Maven Array_06 eclipse jdk maven
Maven Maven是基于项目对象模型(POM)，信息来管理项目的构建，报告和文档的软件项目管理工具。 Maven 除了以程序构建能力为特色之外，还提供高级项目管理工具。由于 Maven 的缺省构建规则有较高的可重用性，所以常常用两三行 Maven 构建脚本就可以构建简单的项目。由于 Maven 的面向项目的方法，许多 Apache Jakarta 项目发文时使用 Maven，而且公司
ibatis的queyrForList和queryForMap区别 bijian1013 java ibatis
一.说明 iBatis的返回值参数类型也有种：resultMap与resultClass，这两种类型的选择可以用两句话说明之： 1.当结果集列名和类的属性名完全相对应的时候，则可直接用resultClass直接指定查询结果类
LeetCode[位运算] - #191 计算汉明权重 Cwind java 位运算 LeetCode Algorithm 题解
原题链接：#191 Number of 1 Bits 要求：写一个函数，以一个无符号整数为参数，返回其汉明权重。例如，‘11’的二进制表示为'00000000000000000000000000001011', 故函数应当返回3。汉明权重：指一个字符串中非零字符的个数；对于二进制串，即其中‘1’的个数。难度：简单分析：将十进制参数转换为二进制，然后计算其中1的个数即可。 “
浅谈java类与对象 15700786134 java
java是一门面向对象的编程语言，类与对象是其最基本的概念。所谓对象，就是一个个具体的物体，一个人，一台电脑，都是对象。而类，就是对象的一种抽象，是多个对象具有的共性的一种集合，其中包含了属性与方法，就是属于该类的对象所具有的共性。当一个类创建了对象，这个对象就拥有了该类全部的属性，方法。相比于结构化的编程思路，面向对象更适用于人的思维
linux下双网卡同一个IP 被触发 linux
转自： http://q2482696735.blog.163.com/blog/static/250606077201569029441/ 由于需要一台机器有两个网卡，开始时设置在同一个网段的IP，发现数据总是从一个网卡发出，而另一个网卡上没有数据流动。网上找了下，发现相同的问题不少：一、关于双网卡设置同一网段IP然后连接交换机的时候出现的奇怪现象。当时没有怎么思考、以为是生成树
安卓按主页键隐藏程序之后无法再次打开肆无忌惮_ 安卓
遇到一个奇怪的问题，当SplashActivity跳转到MainActivity之后，按主页键，再去打开程序，程序没法再打开（闪一下），结束任务再开也是这样，只能卸载了再重装。而且每次在Log里都打印了这句话"进入主程序"。后来发现是必须跳转之后再finish掉SplashActivity 本来代码： // 销毁这个Activity fin
通过cookie保存并读取用户登录信息实例知了ing JavaScript html
通过cookie的getCookies()方法可获取所有cookie对象的集合；通过getName()方法可以获取指定的名称的cookie；通过getValue()方法获取到cookie对象的值。另外，将一个cookie对象发送到客户端，使用response对象的addCookie()方法。下面通过cookie保存并读取用户登录信息的例子加深一下理解。（1）创建index.jsp文件。在改
JAVA 对象池矮蛋蛋 java ObjectPool
原文地址： http://www.blogjava.net/baoyaer/articles/218460.html Jakarta对象池 ☆为什么使用对象池恰当地使用对象池化技术，可以有效地减少对象生成和初始化时的消耗，提高系统的运行效率。Jakarta Commons Pool组件提供了一整套用于实现对象池化
ArrayList根据条件+for循环批量删除的方法 alleni123 java
场景如下： ArrayList<Obj> list Obj-> createTime, sid. 现在要根据obj的createTime来进行定期清理。（释放内存） ------------------------- 首先想到的方法就是 for(Obj o:list){ if(o.createTime-currentT>xxx){
阿里巴巴“耕地宝”大战各种宝百合不是茶平台战略
“耕地保”平台是阿里巴巴和安徽农民共同推出的一个 “首个互联网定制私人农场”，“耕地宝”由阿里巴巴投入一亿，主要是用来进行农业方面，将农民手中的散地集中起来不仅加大农民集体在土地上面的话语权，还增加了土地的流通与利用率，提高了土地的产量，有利于大规模的产业化的高科技农业的发展，阿里在农业上的探索将会引起新一轮的产业调整，但是集体化之后农民的个体的话语权将更少，国家应出台相应的法律法规保护
Spring注入有继承关系的类（1） bijian1013 java spring
一个类一个类的注入 1.AClass类 package com.bijian.spring.test2; public class AClass { String a; String b; public String getA() { return a; } public void setA(Strin
30岁转型期你能否成为成功人士 bijian1013 成功
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
[Velocity三]基于Servlet+Velocity的web应用 bit1129 velocity
什么是VelocityViewServlet 使用org.apache.velocity.tools.view.VelocityViewServlet可以将Velocity集成到基于Servlet的web应用中，以Servlet+Velocity的方式实现web应用 Servlet + Velocity的一般步骤 1.自定义Servlet，实现VelocityViewServl
【Kafka十二】关于Kafka是一个Commit Log Service bit1129 service
Kafka is a distributed, partitioned, replicated commit log service.这里的commit log如何理解？ A message is considered "committed" when all in sync replicas for that partition have applied i
NGINX + LUA实现复杂的控制 ronin47 lua nginx 控制
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-14.输入一个已经按升序排序过的数组和一个数字，在数组中查找两个数，使得它们的和正好是输入的那个数字 bylijinnan java
public class TwoElementEqualSum { /** * 第 14 题：题目：输入一个已经按升序排序过的数组和一个数字，在数组中查找两个数，使得它们的和正好是输入的那个数字。要求时间复杂度是 O(n) 。如果有多对数字的和等于输入的数字，输出任意一对即可。例如输入数组 1 、 2 、 4 、 7 、 11 、 15 和数字 15 。由于
Netty源码学习-HttpChunkAggregator-HttpRequestEncoder-HttpResponseDecoder bylijinnan java netty
今天看Netty如何实现一个Http Server org.jboss.netty.example.http.file.HttpStaticFileServerPipelineFactory： pipeline.addLast("decoder", new HttpRequestDecoder()); pipeline.addLast(&quo
java敏感词过虑-基于多叉树原理 cngolon 违禁词过虑替换违禁词敏感词过虑多叉树
基于多叉树的敏感词、关键词过滤的工具包，用于java中的敏感词过滤 1、工具包自带敏感词词库，第一次调用时读入词库，故第一次调用时间可能较长，在类加载后普通pc机上html过滤5000字在80毫秒左右，纯文本35毫秒左右。 2、如需自定义词库，将jar包考入WEB-INF工程的lib目录，在WEB-INF/classes目录下建一个 utf-8的words.dict文本文件，
多线程知识 cuishikuan 多线程
T1，T2，T3三个线程工作顺序，按照T1，T2，T3依次进行 public class T1 implements Runnable{ @Override
spring整合activemq dalan_123 java spring jms
整合spring和activemq需要搞清楚如下的东东1、ConnectionFactory分： a、spring管理连接到activemq服务器的管理ConnectionFactory也即是所谓产生到jms服务器的链接 b、真正产生到JMS服务器链接的ConnectionFactory还得
MySQL时间字段究竟使用INT还是DateTime？ dcj3sjt126com mysql
环境：Windows XPPHP Version 5.2.9MySQL Server 5.1 第一步、创建一个表date_test（非定长、int时间） CREATE TABLE `test`.`date_test` (`id` INT NOT NULL AUTO_INCREMENT ,`start_time` INT NOT NULL ,`some_content`
Parcel: unable to marshal value dcj3sjt126com marshal
在两个activity直接传递List<xxInfo>时，出现Parcel: unable to marshal value异常。在MainActivity页面（MainActivity页面向NextActivity页面传递一个List<xxInfo>）： Intent intent = new Intent(this, Next
linux进程的查看上（ps） eksliang linux ps linux ps -l linux ps aux
ps:将某个时间点的进程运行情况选取下来转载请出自出处：http://eksliang.iteye.com/admin/blogs/2119469 http://eksliang.iteye.com ps 这个命令的man page 不是很好查阅，因为很多不同的Unix都使用这儿ps来查阅进程的状态，为了要符合不同版本的需求，所以这个
为什么第三方应用能早于System的app启动 gqdy365 System
Android应用的启动顺序网上有一大堆资料可以查阅了，这里就不细述了，这里不阐述ROM启动还有bootloader，软件启动的大致流程应该是启动kernel -> 运行servicemanager 把一些native的服务用命令启动起来（包括wifi, power, rild, surfaceflinger, mediaserver等等）-> 启动Dalivk中的第一个进程Zygot
App Framework发送JSONP请求(3) hw1287789687 jsonp 跨域请求发送jsonp ajax请求越狱请求
App Framework 中如何发送JSONP请求呢? 使用jsonp,详情请参考:http://json-p.org/ 如何发送Ajax请求呢? (1)登录 /*** * 会员登录 * @param username * @param password */ var user_login=function(username,password){ // aler
发福利，整理了一份关于“资源汇总”的汇总 justjavac 资源
觉得有用的话，可以去github关注：https://github.com/justjavac/awesome-awesomeness-zh_CN 通用 free-programming-books-zh_CN 免费的计算机编程类中文书籍精彩博客集合 hacke2/hacke2.github.io#2 ResumeSample 程序员简历
用 Java 技术创建 RESTful Web 服务 macroli java 编程 Web REST
转载：http://www.ibm.com/developerworks/cn/web/wa-jaxrs/ JAX-RS (JSR-311) 【 Java API for RESTful Web Services 】是一种 Java™ API，可使 Java Restful 服务的开发变得迅速而轻松。这个 API 提供了一种基于注释的模型来描述分布式资源。注释被用来提供资源的位
CentOS6.5-x86_64位下oracle11g的安装详细步骤及注意事项超声波 oracle linux
前言：这两天项目要上线了，由我负责往服务器部署整个项目，因此首先要往服务器安装oracle，服务器本身是CentOS6.5的64位系统，安装的数据库版本是11g，在整个的安装过程中碰到很多的坑，不过最后还是通过各种途径解决并成功装上了。转别写篇博客来记录完整的安装过程以及在整个过程中的注意事项。希望对以后那些刚刚接触的菜鸟们能起到一定的帮助作用。安装过程中可能遇到的问题（注
HttpClient 4.3 设置keeplive 和 timeout 的方法 supben httpclient
ConnectionKeepAliveStrategy kaStrategy = new DefaultConnectionKeepAliveStrategy() { @Override public long getKeepAliveDuration(HttpResponse response, HttpContext context) { long keepAlive
Spring 4.2新特性-@Import注解的升级 wiselyman spring 4
3.1 @Import @Import注解在4.2之前只支持导入配置类在4.2,@Import注解支持导入普通的java类,并将其声明成一个bean 3.2 示例演示java类 package com.wisely.spring4_2.imp; public class DemoService { public void doSomethin

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他