yijian2595

Python3下基于bs4和sqlalchemy的爬虫实现

本文来自网易云社区

作者：王贝

小学生现在都在学python了，作为专业程序员当然不能落下了，所以，快马加鞭，周六周末在家学起了python3，python3的基本语法比较简单，相比于Java开发更加敏捷，python3的基础就不讲了，这里主要讲下我这里的爬虫小程序的实现逻辑吧

上下模块图：

一目了然，总体上就是这5步，涉及到python3的requests,bs4,re,sqlalchemy这四个模块。

（1）requests：

是一个很强大的http客户端库，提供了丰富的api，比如发一个get请求：

with requests.get(url,params={},headers={}) as rsp:
   res.text   #返回值文本内容

发一个入参为json的post请求：

with requests.post(url,json={},headers={}) as rsp:
   res.text #返回值文本内容

等等。

这里值得说一下，为什么用with as，with会先执行__enter__()方法，其返回值就是as，requests里返回值就是rsp，当with as 这一逻辑行执行结束时，就会执行__exit__()方法，requests里__exit__()方法将request close掉了，这就是程序没有显示调用close的原因。下面程序里会有一个例子彰显with as的功能。

requests还有很多强大的功能，参考：https://www.cnblogs.com/lilinwei340/p/6417689.html。

（2）bs4 BeatifulSoup

学过java的都知道java有个jsoup，jsoup就是对html模版进行解析，变成各个标签集合，这里bs4和jsoup如出一辙，api也基本一致，比如，一下html代码，我们想获取新闻，地图，视频，贴吧这些内容，只要：

soup=BeautifulSoup(html,'html.parser')
atags=soup.find('div',{'id':'u1'}).findChilren('a',{'class':'mnav'})
values=[]for atag in atags:
   values.append(atag.text)

以上程序即可实现我们的要求，python解析html的还有一个scrapy框架的xpath，以后分享scrapy时再讲。



    
    
    
    
    百度一下，你就知道

autocomplete=off autofocus>

name=tj_trhao123 > > href=http://tieba.baidu.com name=tj_trtieba >

关于百度About Baidu

©2017 Baidu 使用百度前必读 src=//www.baidu.com/img/gs.gif>

(3) re

re正则模块很强大，有match search sub replace这些api，每个都有自己的特长，可以参考：http://www.runoob.com/python3/python3-reg-expressions.html

(4) sqlalchemy

一款python的数据库orm框架，用了下，很好用，有点类似于java 的hibernate，但更灵活。

说了这么多，该帖下爬虫脚本的代码了，下面是目录结构，毕竟也是专业程序员，不能写的一团糟，也要讲究架构，哈哈。

------youku_any #包名

--------------datasource.py #专门管理数据源session

--------------youkubannerdao.py #程序里抓取的优酷banner信息，这个是dao层

--------------youkuservice.py #不用说了，业务逻辑

还有一件事情，就是建表，不多说了：

CREATE TABLE `youku_banner` (  `id` bigint(22) NOT NULL AUTO_INCREMENT,  `type` int(2) NOT NULL, #优酷banner类型 1:电视 2:电影 3.综艺 
  `year` int(4) NOT NULL,  `month` int(2) NOT NULL,  `date` int(2) NOT NULL,  `hour` int(2) NOT NULL,  `minute` int(2) NOT NULL,  `img` varchar(255) DEFAULT NULL,  `title` varchar(255) DEFAULT NULL,  `url` varchar(255) DEFAULT NULL,  `create_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,  PRIMARY KEY (`id`),  KEY `idx_uniq` (`year`,`month`,`date`,`hour`) USING BTREE
) ENGINE=InnoDB AUTO_INCREMENT=83 DEFAULT CHARSET=utf8mb4

接下来就是代码实现了：

datasource.py

from sqlalchemy import create_enginefrom sqlalchemy.orm import sessionmaker

dburl = 'mysql+pymysql://root:123@localhost/youku?charset=utf8'#pool_size 置为100 session回收时间3600sds = create_engine(dburl,pool_size=100,pool_recycle=3600)

Session = sessionmaker(bind=ds)# session=Session()#创建session管理类class SessionManager():

    def __init__(self):
        self.session=Session()    def __enter__(self):
        return self.session    #连接池管理session，不需要显示close
    def __exit__(self, exc_type, exc_val, exc_tb):
        # session.close()
        print('not close')

youkubannerdao.py

from sqlalchemy import Sequence, Column, Integer, BigInteger, String, TIMESTAMP, textfrom sqlalchemy.ext.declarative import declarative_basefrom youku_any.datasource import SessionManager

Base = declarative_base()#继承基类Baseclass YoukuBanner(Base):

    #指定表名
    __tablename__ = 'youku_banner'

    #定义字段映射关系
    id = Column(BigInteger, Sequence('id'), primary_key=True)
    type=Column(Integer)
    year = Column(Integer)
    month = Column(Integer)
    date = Column(Integer)
    hour = Column(Integer)
    minute = Column(Integer)
    img = Column(String(255))
    title = Column(String(255))
    url = Column(String(255))
    createTime = Column('create_time', TIMESTAMP)    def add(self):
        #with as 先执行SessionManager __enter__() 逻辑行结束执行__exit()__
        with SessionManager() as session:            try:
                session.add(self)
                session.commit()            except:
                session.rollback()    def addBatch(self,values):
        with SessionManager() as session:            try:
                session.add_all(values)
                session.commit()            except:
                session.rollback()    def select(self,param):
        with SessionManager() as session:            return session.query(YoukuBanner).select_from(YoukuBanner).filter(param)    def remove(self,parma):
        with SessionManager() as session:            try:
                session.query(YoukuBanner).filter(parma).delete(synchronize_session='fetch')
                session.commit()            except:
                session.rollback()    def update(self,param,values):
        with SessionManager() as session:            try:
                session.query(YoukuBanner).filter(param).update(values, synchronize_session='fetch')
                session.commit()            except:
                session.rollback()

youkuservice.py

import requestsimport jsonimport reimport datetimefrom bs4 import BeautifulSoupfrom sqlalchemy import textfrom youku_any.youkubannerdao import YoukuBannerdef getsoup(url):
    with requests.get(url, params=None, headers=None) as req:        if req.encoding != 'utf-8':
            encodings = requests.utils.get_encodings_from_content(req.text)            if encodings:
                encode = encodings[0]            else:
                encode = req.apparent_encoding
        encode_content = req.content.decode(encode).encode('utf-8')
        soup = BeautifulSoup(encode_content, 'html.parser')        return soupdef getbanner(soup):
    # soup = BeautifulSoup()
    # soup.findChild()
    bannerDivP = soup.find('div', {'id': 'm_86804', 'name': 'm_pos'})
    bannerScript = bannerDivP.findChildren('script', {'type': 'text/javascript'})[1].text
    m = re.search('\[.*\]', bannerScript)
    banners = json.loads(m.group())    for banner in banners:
        time = datetime.datetime.now()
        youkubanner = YoukuBanner(type=1, year=time.year, month=time.month, date=time.day, hour=time.hour,
                                  minute=time.minute,
                                  img=banner['img'], title=banner['title'], url=banner['url'])
        youkubanner.add()

soup=getsoup('http://tv.youku.com/')
getbanner(soup)

youkuBanner = YoukuBanner()
youkuBanner.remove(parma=text('id=67 or id=71'))
youkuBanner.update(param=text('id=70'),values={'title':YoukuBanner.title + '呼啸山庄'})for i in range(0,10000):
    youkuBanner.update(param=text('id=70'), values={'title': YoukuBanner.title + '呼啸山庄'})
    bannerList = youkuBanner.select(param=text('id > 66 and id < 77 order by id asc limit 0,7'))
    print("lines--------%d" % i)    # time.sleep(10)
    for banner in bannerList:
        print(banner.id,banner.minute,banner.img,banner.title)

到此，一个简答的爬虫脚本就写完了，周末两天的成果还是有点小满足，不过这只是python的冰山一脚，还有好多等着我们去探讨呢。

网易云免费体验馆，0成本体验20+款云产品！

更多网易研发、产品、运营经验分享请访问网易云社区。

相关文章：
【推荐】 HBase原理–所有Region切分的细节都在这里了
【推荐】一步步教你学会browserify

你可能感兴趣的:(Python3下基于bs4和sqlalchemy的爬虫实现)

mongodb数据库备份迁移 windows -> linux weixin_30597269 数据库操作系统 json
mongodb数据库备份迁移windows->linuxcd到本机mongodb的安装目录如：C:\ProgramFiles\MongoDB\Server\3.4\bin可以发现里面除了可以启动mongodb的mongod.exe还有很多启动程序其中mongodump.exe和mongorestore.exe就分别是用来数据备份迁移的mongodump备份数据库常用命令格mongodump-hIP
c语言指针 pdf,深入理解c指针 PDF扫描版[33MB] origami dance c语言指针 pdf
深入理解C指针内容简介：深入理解C指针和内存管理，提升编程效率！这是一本实战型图书，通过它，读者可以掌握指针动态操控内存的机制、对数据结构的增强支持，以及访问硬件等技术。本书详细阐述了如何在数组、字符串、结构体和函数中使用指针，同时演示了相应的内存模型及其对指针使用的影响。指针为C语言带来了强大的功能和灵活性，却也是C语言中最难啃的一块“骨头”。本书旨在帮读者透彻理解指针，解决这个老大难问题。不论
网络安全态势感知：企业数字化转型的 “安全密钥” 知白守黑V 安全运营网络安全态势感知网络
在数字经济飞速发展的当下，网络安全已经成为企业平稳运营的关键所在。从大型企业的数据泄露事故，到中小企业遭遇的各类网络攻击，网络安全威胁无处不在。而网络安全态势感知产品，作为应对复杂网络威胁的关键技术，正逐渐成为企业守护数字资产的“智慧大脑”。一、态势感知：全景掌控，精准防御你可以把网络安全态势感知想象成企业网络的“超级侦察兵”。它借助大数据分析、机器学习这些先进技术，就像是拥有了超级强大的“洞察力
局域网用MAC通讯为什么还要IP? sun shang chao 计算机网络
虽然这个问题很傻，但是我还是喜欢你这样的问题。网络是分层的，从应用层到物理层各层有各层的功能，如果一个层次没有配置就没法调用下一层的功能。因此，如果你没有配置网络层的IP地址，就没法调用数据链路层的MAC地址进行通信。追问那这样局域网就不是通过MAC通讯的了吗？要IP才能调用MAC，那就是通过IP通讯了啊回答LAN中是采用MAC通信，但是上层协议没法直接调用MAC协议，必须使用ARP协议将IP地址
五、Mongodb的备份恢复与导出导入 s_daqing mongodb
1、备份备份的语法：mongodump-hdbhost-ddbname-odbdirectory-h：服务器地址，也可以指定端⼝号-d：需要备份的数据库名称-o：备份的数据存放位置，此⽬录中存放着备份出来的数据示例：mongodump-h127.0.0.1:27017-dtest1-o~/Desktop/test1bak2、恢复恢复语法：mongorestore-hdbhost-ddbname--
数据库管理系统的数据控制功能橘子熊-0 数据库
数据库管理系统提供下述4个方面的数据控制功能：（1）数据的安全性控制：防止不合法使用数据库造成数据的泄露和破坏，使每个用户只能按其规定对某些数据进行某种或某些操作和处理。安全性控制是指要尽可能杜绝所有可能的数据库非法访问。数据的安全性是保护数据库以防止不合法使用造成的数据泄露、更改或破坏。安全性措施：①用户标识和鉴定。通过定义用户标识对用户身份进行鉴定，只允许合法用户才能进入系统。②用户存取权限控
Go语言初上手（三）编码规范与性能优化 | 青训营余cos 笔记 golang 开发语言后端
本节课讲了如何写出更简洁清晰的代码，每种语言都有自己的特性，也有自己独特的代码规范，对于Go来说，有哪些性能优化的手段、趁手的工具，也都进行了介绍。高质量代码需要具备正确可靠、简洁清晰的特性正确性：各种边界条件是否考虑完备、错误的调用能否被处理可靠性：异常情况或错误处理明确，依赖的服务异常能够及时处理简洁：逻辑是否简单、后续新增功能是否能够快速支持清晰可读：其他人阅读理解代码时是否能清楚明白、重构
BabylonJS初学习笔记 Marina-37 学习笔记
初步接触Babylonjs，由于学习跨度会比较大，所以就做了一些笔记，在此分享出来，希望能够对那些和我一样学习的新人有所帮助。通过Babylon官网学习这个项目主要就是一些基础方法的学习，以静态HTML为主，附带一些个人笔记，持续更新。项目地址：babylon-learn-byDoc:通过babylon官方网站进行学习，创建一些交互式web文件。Babylon官网：https://www.baby
b站任务脚本 AALoveTouch python
仅供学习参考用于自动化执行Bilibili（哔哩哔哩）网站的一些任务，包括签到、投币、观看视频等。它通过与Bilibili的API接口进行交互来完成各种任务，并返回执行结果。主要功能get_nav(session):获取当前登录用户的基本信息，包括用户名、UID、登录状态、硬币数、VIP类型和当前经验值等。get_today_exp(session):获取当天的经验信息，包括用户参与的各种活动（如
Kotlin 2.1.0 入门教程（九） xvch Kotlin kotlin android
类型检查和转换在Kotlin中，可以执行类型检查以在运行时检查对象的类型。类型转换能够将对象转换为不同的类型。is和!is操作符要执行运行时检查以确定对象是否符合给定类型，请使用is操作符或其否定形式!is。if(objisString){print(obj.length)}//等同于!(objisString)。if(obj!isString){print("NotaString")}else{
最新外卖霸王餐系统程序源码|美团/饿了么霸王餐系统(含数据库)（可对接公众号） AALoveTouch 霸王餐 php
一款特别好用的霸王餐系统，搭建也特别简单，个人需要自备服务器和域名。下面是一些系统图片：下面是有关部分代码展示：部分代码展示配置数据库
ESG资料大全(部分更新2024)：数据+工具变量+论文复现经管数据库人工智能大数据物联网
资源介绍ESG是Environmental（环境）、Social（社会责任）、Governance（公司治理）3个英文单词的首字母缩写，是一种评价企业可持续性的指标及框架。不同于传统上对于企业财务绩效的评价，ESG是一种关注企业环境、社会责任和公司治理绩效的投资理念和企业评价标准。政府监管机构和投资者可以通过对企业ESG绩效的观察，评价投资对象在促进环境保护、促进经济可持续发展和履行社会责任等方面
Node.js NativeAddon 构建工具：node-gyp 安装与配置完全指南 P7进阶路面试学习路线阿里巴巴 node.js
Node.jsNativeAddon构建工具：node-gyp安装与配置完全指南node-gypNode.jsnativeaddonbuildtool[这里是图片001]项目地址:https://gitcode.com/gh_mirrors/no/node-gyp项目基础介绍及主要编程语言Node.jsNativeAddon构建工具（node-gyp）是一个基于Node.js的跨平台命令行工具，专
【Nginx系列】Nginx配置超时时间 m0_74824552 面试学习路线阿里巴巴 nginx 运维
???欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kwan的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越剑指大厂系列:全面总结java核心技术,jvm,并发编程redis,kafka,Spring,微服务等常用开发工具系列:常用的开发工具,IDEA,Mac,Alfred,G
MySQL与Oracle对比及区别 m0_74823434 面试学习路线阿里巴巴 java
一、比较1、MySQL的特点性能卓越，服务稳定，很少出现异常宕机；开放源代码无版本制约，自主性及使用成本低；历史悠久，社区和用户非常活跃，遇到问题及时寻求帮助；软件体积小，安装使用简单且易于维护，维护成本低；品牌口碑效应；支持多种OS，提供多种API接口，支持多种开发语言，对流行的PHP，Java很好的支持2、Oracle的特点兼容性：Oracle产品采用标准SQL，并经过美国u构架标准技术所（N
算法随笔_21:字符的最短距离程序趣谈算法
上一篇:算法随笔_20:区间子数组个数-CSDN博客=====================题目描述如下:给你一个字符串s和一个字符c，且c是s中出现过的字符。返回一个整数数组answer，其中answer.length==s.length且answer[i]是s中从下标i到离它最近的字符c的距离。两个下标i和j之间的距离为abs(i-j)，其中abs是绝对值函数。示例1：输入：s="lovel
[JS]学习笔记2 -- JAVAScript数据类型 Jizhi_Zhang JavaScript学习笔记 javascript 学习笔记
一、常量概念：使用const声明的变量称为“常量”。使用场景：当某个变量永远不会改变的时候，就可以使用const来声明，而不是let。命名规范：和变量一致注：常量不允许重新赋值，在声明的时候必须要赋值（初始化）二、数据类型1、基本数据类型1.1数字型number学习中的数字，整数、小数、正数、负数可以有很多操作：算数+：求和-：求差*：求积/：求商%：取模（取余数）--开发中经常作为某个数字是否被
基于 Node.js 的天气查询系统实现(附源码） Kasper0121 node.js
项目概述这是一个基于Node.js的全栈应用，前端使用原生JavaScript和CSS，后端使用Express框架，通过调用第三方天气API实现天气数据的获取和展示。主要功能默认显示多个主要城市的天气信息支持城市天气搜索响应式布局设计深色主题界面优雅的加载动画技术栈后端：Node.js+Express前端：HTML5+CSS3+JavaScriptHTTP客户端：AxiosAPI：天气API(v1
Python-静态方法（@staticmethod） lhh_qrsly Python
@staticmethod静态方法只是名义上归属类管理，但是不能使用类变量和实例变量，是类的工具包放在函数前（该函数不传入self或者cls），所以不能访问类属性和实例属性classcal:cal_name='计算器'def__init__(self,x,y):self.x=xself.y=y@property#在cal_add函数前加上@property，使得该函数可直接调用，封装起来defca
golang性能调优工具pprof的使用 KhaD golang golang 开发语言后端
文章目录前言一、cpu1.下载实例代码2.运行项目中的main.go文件3.查看CPU性能数据4.使用topN（N是可选的数量，也可以不加直接运行）命令来查看占用资源最多的函数5.查看可能存在问题的具体函数代码6.使用web命令来调用关系可视化二、堆内存1.查看堆内存性能数据2.在浏览器中进行查看三、goroutine1.查看goroutine性能数据四、mutex1.查看mutex性能数据五、m
[转] mongodb数据库备份和恢复 hi_zf MongoDB mongodb
windows下面mongodb数据库备份和恢复1、mongodump（备份）及mongorestore（还原）→说明：mongodump是一个用于导出二进制数据库内容的实用工具，它导出的bson文档中只会包含着集合文档等信息，不包括索引信息（索引信息会单独导出），所以还原后，索引必须重建（这个不用担心，使用mongorestore会自动重建mongodump生成的索引信息）。3.4版本中添加了对
推荐开源项目：大麦抢票辅助鲍凯印Fox
推荐开源项目：大麦抢票辅助去发现同类优质开源项目:https://gitcode.com/1、项目介绍在音乐节、演唱会和各类演出活动日益盛行的今天，抢购门票成为了一项技术活。这款名为"大麦抢票辅助"的开源工具，帮助你在票务竞争激烈的市场中，提高购票效率。它并不是传统的外挂程序，而是通过合法的技术手段，帮助用户更高效地刷新并尝试购买回流票。2、项目技术分析该项目的核心原理是实时监控大麦App的页面状
PostgreSQL体系结构 eygle
原文：https://www.enmotech.com/web/detail/1/764/1.html导读：本文主要从日志文件、参数文件、控制文件、数据文件、redo日志（WAL）、后台进程这六个方面来讨论PostgreSQL的结构。一、引言PostgreSQL是最像Oracle的开源数据库，我们可以拿MySQL和Oracle来比较学习它的体系结构，比较容易理解。本文会讨论pg的如下结构：日志文件
Vue.js组件开发案例（比较两个数字大小）我曾经是个程序员常用代码片段 vue.js
见过不少人、经过不少事、也吃过不少苦，感悟世事无常、人心多变，靠着回忆将往事串珠成链，聊聊感情、谈谈发展，我慢慢写、你一点一点看......实现一个比较2个数字大小的组件，当输入2个数字后，单击“比较”按钮后自动输出比较结果。第1个数字：第2个数字：比较比较结果：{{result}}exportdefault{data(){return{num1:0,num2:0,result:0,};},met
mikro-orm 和typeorm 对比大耳朵乔乔 NodeJs #SQL #NestJs node.js 数据库
以下是Mikro-ORM和TypeORM的详细对比：设计理念与架构Mikro-ORM：基于数据映射器、工作单元和身份映射模式。这种设计使得它在管理内存中实体状态方面表现优异，能够自动处理事务，当调用em.flush()时，所有计算出的更改都会被包装在一个数据库事务中。TypeORM：支持活跃记录和数据映射器模式，深受Hibernate、Doctrine和Entity框架等传统ORM的影响。它提供了
小程序与内嵌网页的数据通信大耳朵乔乔 #微信小程序开发小程序
小程序与内嵌网页的数据通信前言微信小程序提供了web-view组件，允许开发者在小程序中嵌入网页。然而，由于小程序和网页运行在不同的环境中，它们之间的通信就需要依赖特定的机制来实现。然而我们日常的需求中，很多的时候都涉及到小程序内嵌网页和小程序之间进行数据通信的情况。这篇文章是我自己总结的微信小程序与内嵌web-view中网页通信的一些方法。小程序向内嵌网页传递数据通过修改web-view的src
新华三H3CNE网络工程师认证—DHCP配置极客范儿计算机网络网络
动态主机配置协议（DHCP）是一种用于自动分配IP地址和其他网络参数的网络协议。它通过客户端/服务器模式工作，客户端向服务器请求配置信息，服务器根据策略返回相应的信息，如IP地址、子网掩码、网关和DNS服务器地址。DHCP的配置非常简单，以新华三设备为例，在交换机、路由器的三层接口上去配置这个功能就好了。比如交换机使用vlanif作为三层接口，配置就这些操作，开启DHCP服务功能，开完之后针对地址
Apache Doris 2.1.8 版本正式发布 SelectDB技术团队 Doris 数据库大数据数据分析数据仓库
亲爱的社区小伙伴们，ApacheDoris2.1.8版本已于2025年01月24日正式发布。该版本持续在湖仓一体、异步物化视图、查询优化器与执行引擎、存储管理等方面进行改进提升与问题修复，进一步加强系统的性能和稳定性，欢迎大家下载体验。立即下载：https://doris.apache.org/downloadGitHub下载：https://github.com/apache/doris/rel
东华大学高级程序设计上机题（贪心篇） IPython_J 算法数据结构面试 c++
目录贪心有序矩阵中的第k个最小数组和题目代码买卖股票的最佳时机题目代码救生艇题目代码去除重复字母题目代码无重叠区间题目代码分割数组为连续子序列题目代码翻转矩阵后的得分题目代码拼接最大数题目代码按要求补齐数组题目代码设置交集大小至少为2题目代码后续内容持续更新~~~贪心有序矩阵中的第k个最小数组和题目给你一个m*n的矩阵mat，以及一个整数k，矩阵中的每一行都以非递减的顺序排列。你可以从每一行中选出
python中@staticmethod方法 elie813 python基础
python中@staticmethod方法，类似于C++中的static，方便将外部函数集成到类体中，主要是可以在不实例化类的情况下直接访问该方法，如果你去掉staticmethod,在方法中加self也可以通过实例化访问方法也是可以集成。classTest:def__init__(self,num):self.num=num;defcout_num(self):print(self.num)@
怎么样才能成为专业的程序员？ cocos2d-x小菜编程 PHP
如何要想成为一名专业的程序员？仅仅会写代码是不够的。从团队合作去解决问题到版本控制，你还得具备其他关键技能的工具包。当我们询问相关的专业开发人员，那些必备的关键技能都是什么的时候，下面是我们了解到的情况。关于如何学习代码，各种声音很多，然后很多人就被误导为成为专业开发人员懂得一门编程语言就够了？！呵呵，就像其他工作一样，光会一个技能那是远远不够的。如果你想要成为
java web开发高并发处理 BreakingBad java Web 并发开发处理高
java处理高并发高负载类网站中数据库的设计方法（java教程,java处理大量数据，java高负载数据）一：高并发高负载类网站关注点之数据库没错,首先是数据库,这是大多数应用所面临的首个SPOF。尤其是Web2.0的应用，数据库的响应是首先要解决的。一般来说MySQL是最常用的，可能最初是一个mysql主机，当数据增加到100万以上，那么，MySQL的效能急剧下降。常用的优化措施是M-S（
mysql批量更新 ekian mysql
mysql更新优化：一版的更新的话都是采用update set的方式，但是如果需要批量更新的话，只能for循环的执行更新。或者采用executeBatch的方式，执行更新。无论哪种方式，性能都不见得多好。三千多条的更新，需要3分多钟。查询了批量更新的优化，有说replace into的方式，即： replace into tableName(id,status) values
微软BI（3） 18289753290 微软BI SSIS
1) Q：该列违反了完整性约束错误；已获得 OLE DB 记录。源:“Microsoft SQL Server Native Client 11.0” Hresult: 0x80004005 说明:“不能将值 NULL 插入列 'FZCHID'，表 'JRB_EnterpriseCredit.dbo.QYFZCH'；列不允许有 Null 值。INSERT 失败。”。 A：一般这类问题的存在是
Java中的List g21121 java
List是一个有序的 collection（也称为序列）。此接口的用户可以对列表中每个元素的插入位置进行精确地控制。用户可以根据元素的整数索引（在列表中的位置）访问元素，并搜索列表中的元素。与 set 不同，列表通常允许重复
读书笔记永夜-极光读书笔记
1. K是一家加工厂,需要采购原材料,有A,B,C,D 4家供应商,其中A给出的价格最低,性价比最高,那么假如你是这家企业的采购经理,你会如何决策? 传统决策: A:100%订单 B,C,D:0% &nbs
centos 安装 Codeblocks 随便小屋 codeblocks
1.安装gcc,需要c和c++两部分,默认安装下,CentOS不安装编译器的,在终端输入以下命令即可yum install gccyum install gcc-c++ 2.安装gtk2-devel,因为默认已经安装了正式产品需要的支持库,但是没有安装开发所需要的文档.yum install gtk2* 3. 安装wxGTK yum search w
23种设计模式的形象比喻 aijuans 设计模式
1、ABSTRACT FACTORY—追MM少不了请吃饭了，麦当劳的鸡翅和肯德基的鸡翅都是MM爱吃的东西，虽然口味有所不同，但不管你带MM去麦当劳或肯德基，只管向服务员说“来四个鸡翅”就行了。麦当劳和肯德基就是生产鸡翅的Factory 　　工厂模式：客户类和工厂类分开。消费者任何时候需要某种产品，只需向工厂请求即可。消费者无须修改就可以接纳新产品。缺点是当产品修改时，工厂类也要做相应的修改。如：
开发管理 CheckLists aoyouzi 开发管理 CheckLists
开发管理 CheckLists(23) -使项目组度过完整的生命周期开发管理 CheckLists(22) -组织项目资源开发管理 CheckLists(21) -控制项目的范围开发管理 CheckLists(20) -项目利益相关者责任开发管理 CheckLists(19) -选择合适的团队成员开发管理 CheckLists(18) -敏捷开发 Scrum Master 工作开发管理 C
js实现切换百合不是茶 JavaScript 栏目切换
js主要功能之一就是实现页面的特效,窗体的切换可以减少页面的大小,被门户网站大量应用思路: 1,先将要显示的设置为display:bisible 否则设为none 2,设置栏目的id ,js获取栏目的id,如果id为Null就设置为显示 3,判断js获取的id名字;再设置是否显示代码实现: html代码: <di
周鸿祎在360新员工入职培训上的讲话 bijian1013 感悟项目管理人生职场
这篇文章也是最近偶尔看到的，考虑到原博客发布者可能将其删除等原因，也更方便个人查找，特将原文拷贝再发布的。“学东西是为自己的，不要整天以混的姿态来跟公司博弈，就算是混，我觉得你要是能在混的时间里，收获一些别的有利于人生发展的东西，也是不错的，看你怎么把握了”，看了之后，对这句话记忆犹新。 &
前端Web开发的页面效果 Bill_chen html Web Microsoft
1.IE6下png图片的透明显示： <img src="图片地址" border="0" style="Filter.Alpha(Opacity)=数值(100),style=数值(3)"/> 或在<head></head>间加一段JS代码让透明png图片正常显示。 2.<li>标
【JVM五】老年代垃圾回收：并发标记清理GC(CMS GC) bit1129 垃圾回收
CMS概述并发标记清理垃圾回收(Concurrent Mark and Sweep GC）算法的主要目标是在GC过程中，减少暂停用户线程的次数以及在不得不暂停用户线程的请夸功能，尽可能短的暂停用户线程的时间。这对于交互式应用，比如web应用来说，是非常重要的。 CMS垃圾回收针对新生代和老年代采用不同的策略。相比同吞吐量垃圾回收，它要复杂的多。吞吐量垃圾回收在执
Struts2技术总结白糖_ struts2
必备jar文件早在struts2.0.*的时候，struts2的必备jar包需要如下几个： commons-logging-*.jar Apache旗下commons项目的log日志包 freemarker-*.jar
Jquery easyui layout应用注意事项 bozch jquery 浏览器 easyui layout
在jquery easyui中提供了easyui-layout布局，他的布局比较局限，类似java中GUI的border布局。下面对其使用注意事项作简要介绍：如果在现有的工程中前台界面均应用了jquery easyui，那么在布局的时候最好应用jquery eaysui的layout布局，否则在表单页面（编辑、查看、添加等等）在不同的浏览器会出
java-拷贝特殊链表：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？ bylijinnan java
public class CopySpecialLinkedList { /** * 题目：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？拷贝pNext指针非常容易，所以题目的难点是如何拷贝pRand指针。假设原来链表为A1 -> A2 ->... -> An，新拷贝
color Chen.H JavaScript html css
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <HTML> <HEAD>&nbs
[信息与战争]移动通讯与网络 comsci 网络
两个坚持:手机的电池必须可以取下来光纤不能够入户,只能够到楼宇建议大家找这本书看看:<&
oracle flashback query(闪回查询) daizj oracle flashback query flashback table
在Oracle 10g中，Flash back家族分为以下成员： Flashback Database Flashback Drop Flashback Table Flashback Query(分Flashback Query,Flashback Version Query，Flashback Transaction Query) 下面介绍一下Flashback Drop 和Flas
zeus持久层DAO单元测试 deng520159 单元测试
zeus代码测试正紧张进行中,但由于工作比较忙,但速度比较慢.现在已经完成读写分离单元测试了,现在把几种情况单元测试的例子发出来,希望有人能进出意见,让它走下去. 本文是zeus的dao单元测试: 1.单元测试直接上代码 package com.dengliang.zeus.webdemo.test; import org.junit.Test; import o
C语言学习三printf函数和scanf函数学习 dcj3sjt126com c printf scanf language
printf函数 /* 2013年3月10日20:42:32 地点：北京潘家园功能：目的：测试%x %X %#x %#X的用法 */ # include <stdio.h> int main(void) { printf("哈哈！\n"); // \n表示换行 int i = 10; printf
那你为什么小时候不好好读书? dcj3sjt126com life
dady, 我今天捡到了十块钱, 不过我还给那个人了 good girl! 那个人有没有和你讲thank you啊没有啦....他拉我的耳朵我才把钱还给他的, 他哪里会和我讲thank you 爸爸, 如果地上有一张5块一张10块你拿哪一张呢.... 当然是拿十块的咯... 爸爸你很笨的, 你不会两张都拿爸爸为什么上个月那个人来跟你讨钱, 你告诉他没
iptables开放端口 Fanyucai linux iptables 端口
1，找到配置文件 vi /etc/sysconfig/iptables 2，添加端口开放，增加一行，开放18081端口 -A INPUT -m state --state NEW -m tcp -p tcp --dport 18081 -j ACCEPT 3，保存 ESC :wq! 4，重启服务 service iptables
Ehcache（05）——缓存的查询 234390216 排序 ehcache 统计 query
缓存的查询目录 1. 使Cache可查询 1.1 基于Xml配置 1.2 基于代码的配置 2 指定可搜索的属性 2.1 可查询属性类型 2.2 &
通过hashset找到数组中重复的元素 jackyrong hashset
如何在hashset中快速找到重复的元素呢?方法很多，下面是其中一个办法： int[] array = {1,1,2,3,4,5,6,7,8,8}; Set<Integer> set = new HashSet<Integer>(); for(int i = 0
使用ajax和window.history.pushState无刷新改变页面内容和地址栏URL lanrikey history
后退时关闭当前页面 <script type="text/javascript"> jQuery(document).ready(function ($) { if (window.history && window.history.pushState) {
应用程序的通信成本 netkiller.github.com 虚拟机应用服务器陈景峰 netkiller neo
应用程序的通信成本什么是通信一个程序中两个以上功能相互传递信号或数据叫做通信。什么是成本这是是指时间成本与空间成本。时间就是传递数据所花费的时间。空间是指传递过程耗费容量大小。都有哪些通信方式全局变量线程间通信共享内存共享文件管道 Socket 硬件（串口，USB）等等全局变量全局变量是成本最低通信方法，通过设置
一维数组与二维数组的声明与定义恋洁e生二维数组一维数组定义声明初始化
/** * */ package test20111005; /** * @author FlyingFire * @date:2011-11-18 上午04:33:36 * @author ：代码整理 * @introduce :一维数组与二维数组的初始化 *summary： */ public c
Spring Mybatis独立事务配置 toknowme mybatis
在项目中有很多地方会使用到独立事务，下面以获取主键为例（1）修改配置文件spring-mybatis.xml  <tx:annotation-driven transaction-manager="transactionManager" /> &n
更新Anadroid SDK Tooks之后，Eclipse提示No update were found xp9802 eclipse
使用Android SDK Manager 更新了Anadroid SDK Tooks 之后，打开eclipse提示 This Android SDK requires Android Developer Toolkit version 23.0.0 or above, 点击Check for Updates 检测一会后提示 No update were found

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他