gcn_Raymond

Python与爬虫入门实践——简易搜狐新闻爬虫01

Python与爬虫入门实践——简易搜狐新闻爬虫01

写在前面：

笔者在寒假期间进行了一些简短的实训，主要内容包括简单的爬虫和简单的人脸识别算法，由于时间有限，对于python也是第一次详细学习，功能较为简单，提供给入学者参考，帮助大家进入py的世界，若有不正确或不明确的地方欢迎指正。

以下是一个简单爬虫项目所需要的基本内容，整体的项目代码参考另一片文章：

Python与爬虫入门实践——简易搜狐新闻爬虫02https://blog.csdn.net/gcn_Raymond/article/details/86756404

一、爬虫介绍

爬虫的基本原理

爬虫是什么？

从互联网中抓取数据的程序

搜索引擎

先准备一些网站---找到更多网站---搜集每个页面的数据---保存到服务器中（数据库）

爬虫本质是模拟浏览器访问网页的过程

HTTP/HTTPS

从网站服务器上获取页面，网页传输的是源代码/文件

网页中的三个元素

HTML超文本标记语言

节点上的数据

标签的属性

img、href标签

文本

特殊属性

Id、class

css

控制样式

JavaScript

事件驱动

ajax网页异步技术，网站的接口化又称前后端分离（页面相关的东西单独处理，数据由单独的接口提供Web API 数据格式：JSON格式/XML格式）

爬虫编写

获取源代码

网页中提取数据

HTTP状态码

状态码有助于我们判断编写的程序是否可以正常连接上指定网站

参考资料：

http://tools.jb51.net/table/http_status_code

二、爬虫编写

1.访问目标网站

urllib库提供了访问HTTP协议的工具

#urllib库提供了访问HTTP协议的工具
import urllib.request
from urllib import request

#获取一个站点的html源码
response=request.urlopen("https://www.qq.com/")
print(response.geturl())
print(response.info())
print(response.getcode())#得到状态码

结果如下：

2.伪装请求头

有时候请求头会被网站识别，他会拒绝我们访问，这是网站的反爬机制，我们只要伪装一下，装作我们是普通用户就可以通过检测了

from urllib import request
from urllib.request import Request
#beautifulsoup
url='http://httpbin.org/get'
#伪装请求头
headers={'User-Agent':' Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36'}

req=Request(url, headers=headers)

response=request.urlopen(req)
print(response.read().decode('utf-8'))

3.安装beautifulsoup

beautifulsoup可以帮助我们提取网页中html标签，来进一步提取我们想要的元素

pip install beautifulsoup4

安装完成后可以看到新的包出现

4.爬取新闻标题和内容

查询标题

from urllib import request
from urllib.request import Request
from bs4 import BeautifulSoup
url='http://www.sohu.com/a/289547597_114731?g=0?code=61f919a88328210f408c3e188c241d16'

headers={'User-Agent':' Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36'}

req=Request(url, headers=headers)

response=request.urlopen(req)

soup = BeautifulSoup(response.read(),'html.parser')
print(soup.h1)#元素选择器
#信息的获取
print(soup.h1.name)#标签名
print(soup.title.string)#标签内的字符串
h1=soup.h1
#去掉空格、换行
print(h1.contents[0])#
newstitle = h1.contents[0]
newstitle=newstitle.replace(' ','')
newstitle=newstitle.replace('\n','')
print(newstitle)

查询内容

article=soup.article
ps=article.contents
#遍历子节点，筛选文字信息
for p in ps:
    if p.string:
        print(p.string)

这是对于一个新闻内容页的爬取：http://www.sohu.com/a/289547597_114731?g=0?code=61f919a88328210f408c3e188c241d16

5.爬取信息保存数据库

这里用到的是sqlite数据库

保存收集的数据

1.保存到文件中

文本csv json 保存方便，查询不便

2.保存到服务器

可以保存海量数据

3.保存到数据库中

查询方便，速度快

sqlite数据库

基于文件

创建emp

emp

id 自增主键

name 文本

sex 文本

#创建数据库
import sqlite3
#数据库的连接,参数：数据库文件的名字，如果文件不存在，自动创建文件
conn=sqlite3.connect('mydb.db')
#创建数据表 执行一段sql
#创建执行对象
cor=conn.cursor()
#调用执行对象
cor.execute('''
    create table emp(
        id INTEGER  PRIMARY KEY AUTOINCREMENT,
        name TEXT NOT NULL,
        sex TEXT NOT NULL
    )
''')
#提交
conn.commit()
#关闭数据库连接
conn.close()

有绿色箭头的DB按钮是同步刷新，有时出现数据库结果和实际结果不一致的时候可以刷新一下试试

有关数据库的详细代码如下：

#创建数据库
import sqlite3
#数据库的连接,参数：数据库文件的名字，如果文件不存在，自动创建文件
def creat_table():
    conn=sqlite3.connect('mydb.db')
    #创建数据表 执行一段sql
    #创建执行对象
    cor=conn.cursor()
    #调用执行对象
    cor.execute('''
        create table emp(
            id INTEGER  PRIMARY KEY AUTOINCREMENT,
            name TEXT NOT NULL,
            sex TEXT NOT NULL
        )
    ''')
    #提交
    conn.commit()
    #关闭数据库连接
    conn.close()
#增删改查
def add():
    conn = sqlite3.connect('mydb.db')
    cor = conn.cursor()
    cor.execute('''
        insert into emp 
        (name, sex)
        values 
        ('赵四','男')
    ''')
    conn.commit()
    conn.close()
# if __name__=='__main__':
#     add()
def query():
    conn = sqlite3.connect('mydb.db')
    cor = conn.cursor()
    result=cor.execute('''
            select * from emp
        ''')
    ls=[]
    for row in result:
        # print(row[0])
        # print(row[1])
        # print(row[2])
        ls.append(row)
    #print(result)
    conn.commit()
    return ls
    conn.close()
if __name__=='__main__':
    ls = query()
    for row in ls:
        print(row)
#删除语句delete from emp where id=1
#修改语句update emp set name='xiaoma',sex='女'

你可能感兴趣的:(Python与爬虫入门实践——简易搜狐新闻爬虫01)

【AI日记】25.01.06 AI完全体 AI日记人工智能机器学习 kaggle 比赛
【AI论文解读】【AI知识点】【AI小项目】【AI战略思考】【AI日记】【读书与思考】AI参加：kaggle比赛ForecastingStickerSales读书书名：国家为什么会失败阅读原因：2024年诺贝尔经济学奖得主的力作，之前我已经读过他另一本书了《權力與進步》备注：有兴趣的建议读未删减版https://book.douban.com/subject/26388427/discussion
Linux下passwd、shadow各字段含义 weixin_33924220 操作系统 shell
/etc/passwd新建test用户[root@centos1~]#getentpasswdtest#getent查看passwd某个用户test:x:1015:1015:userinfo:/home/test:/bin/bash12345671、loginname：登录用名（test)2、passwd：密码(x)密码字段为x表示密码存在于shadow中可用pwunconv、pwconv修改，p
最核心的 ICT 产品与技术话题，干货云集，让你不虚此行 u013424982 云计算活动大数据技术分享云计算活动技术分享
7月27日，CloudInsightConference2018就要和大家见面了，除了新品发布与科技、创新的前沿话题之外，还将与参会者共同探讨最核心的ICT产品与技术话题：超融合与软件定义存储、容器与企业微服务治理、多云管理与应用云化、SDN&SD-WAN、全栈ICT服务助推企业构建『双核心』全模云等。我们隆重邀请到来自政府、金融、教育、物流、制造、零售、医疗、能源等众多行业的技术领袖，围绕企业I
国自然青年项目｜基于多模态影像组学的乳腺癌分子分型预测研究｜基金申请·25-01-20 罗小罗同学基金申请医学人工智能人工智能国自然
小罗碎碎念今天和大家分享一份国自然青年项目，项目执行期为2021-2023年，直接费用为24万。项目聚焦乳腺癌分子分型预测，综合运用多模态组学数据、影像组学技术和深度学习技术。研究内容包括跨模态医学图像分割、多模态特征提取与融合、模型设计与系统研发。通过提出一系列创新算法，如基于类别中心原型对齐器的图像分割算法、基于自注意力机制与生成对抗网络的聚类算法等，实现了对乳腺癌分子分型的高精度预测，并开发
CMD批处理命令入门（7）——if 条件语句跑不了的你 Windows驱动 windows ddos microsoft
CMD批处理命令入门（7）——if条件语句本章主要内容判断两个字符串是否相等判断两个数值是否相等判断判断驱动器，文件或文件夹是否存在，判断变量是否已经定义，判断上个命令的反回值，本章主要内容5种if语句的基本语法：判断两个字符串是否相等，if"字符串1"=="字符串2"command语句;判断两个数值是否相等，if数值1equ数值2command语句；判断判断驱动器，文件或文件夹是否存在，ifex
CMD批处理命令入门（5）——ping,ipconfig,arp,start,shutdown,taskkill 跑不了的你 Windows驱动开发语言 windows ddos
CMD批处理命令入门（5）——ping,ipconfig,arp,start,shutdown,taskkill本章主要内容：测试IP连接：`ping`查看IP配置：`ipconfig`解析地址：`arp`开启命令：`start`关闭或重启计算机：`shutdown`关闭指定进程`taskkill`本章主要内容：测试IP连接：ping查看IP配置：ipconfig解析地址：arp开启命令：star
CMD批处理命令入门（1）——echo,rem,cd,dir 跑不了的你 Windows驱动 ddos windows microsoft
CMD批处理命令入门（1）——echo,rem,cd,dir本章内容包含显示信息：echo输出提示信息关闭该命令的回显打开回显或关闭回显功能输出空行，即相当于输入一个回车答复命令中的提问建立新文件或增加文件内容rem目录切换：cd同一个分区的切换不同分区的切换CD的另一个用途：显示当前的完整路径，一般用通过%cd%加以引用。列文件名：dir列出`c:\windows`下的目录及文件列出`c:\`下
ZYNQ + Linux jerwey linux zynq
ZYNQLinux操作系统移植说明文档http://xilinx.eetrend.com/content/2019/100018437.html1，组成ZYNQ上面移植Linux操作系统包括四个部分，uboot,devicetree,kernel,ramdisk.其中uboot类似于bios，负责对设备进行简单的初始化，devicetree以树的形式对zynq相连的硬件设备进行描述，kernel是
IP地址，子网掩码，网关与DNS Seinikov 嵌入式开发网络
文章目录IP地址IPv4地址子网例子网关DNS服务器IP地址IP地址是网际协议中用于标识发送或接收数据报的设备的一串数字。IPv4地址IPv4地址由32位二进制数字组成。类型组成部分高位到低位网络标志位（最高位）IP范围二进制IP范围十进制使用场景A类一个网络地址+三个主机地址00000.0000.0000.0000-0111.1111.1111.11110.0.0.0-127.255.255.2
【Linux】shell语法入门手册语法大全 Genevieve_xiao linux linux bash 运维
shell学习笔记yxc的linuxshell语法目录概论运行方式直接用解释器执行作为可执行文件运行注释单行注释多行注释变量定义变量引用变量只读变量删除变量变量类型字符串默认变量文件参数变量其他参数相关变量数组定义调用数组元素中的值数组长度expr命令重要说明字符串表达式整数表达式逻辑关系表达式read命令echo命令显示普通字符串显示转义字符显示变量显示换行显示不换行显示结果定向至文件原样输出显
24.01.17 2401_87910368 java 数据库前端
异步使用 @Resource ThreadPoolTaskExecutortaskExecutor;taskExecutor.execute(()->{//业务代码 });开启异步注解@Configuration@MapperScan("com.javasm.mingming.*.dao")@EnableAsync//开启异步任务注解publicclassServerConfig{ @
如何提高自动化测试覆盖率和效率测试者家园人工智能软件测试质量效能软件测试人工智能测试覆盖率自动化测试 CI/CD 质量效能 IT行业
用ChatGPT做软件测试在现代软件开发中，自动化测试已经成为保证软件质量的重要手段。然而，在实践中，自动化测试的覆盖率和效率常常受到限制，导致潜在缺陷未能及时发现或测试资源浪费。因此，提升自动化测试的覆盖率和效率是每个测试团队的重要目标。本文将详细探讨如何通过合理的策略、技术和工具提高自动化测试的覆盖率和效率，并结合具体案例阐述最佳实践。一、自动化测试覆盖率的定义与重要性1.覆盖率的概念测试覆盖
25.01.15 SpringSecurity 授权 2401_87910368 笔记
//准备工作在登录通过username查询用户时，把用户对应的角色即角色对应的菜单查出，//根据用户的角色rolerid来查询对应的菜单publicinterfaceAdminMenuDaoextendsBaseMapper{@Select("SELECTm.*FROMadmin_menum,rel_role_menurelWHEREm.mid=rel.midANDrel.rid=#{id}")L
java快速入门之判断与循环天启互联网工作室 java 开发语言
一、流程控制语句在一个程序执行的过程中，各条语句的执行顺序对程序的结果是有直接影响的。所以，我们必须清楚每条语句的执行流程。而且，很多时候要通过控制语句的执行顺序来实现我们想要的功能。1.1流程控制语句分顺序结构判断和选择结构(if,switch)循环结构(for,while,do…while)二、判断语句：if语句2.1if语句格式1格式1：if(关系表达式){语句体;}执行流程：①首先计算关系
精通爬虫技术：从入门到入狱——网络数据爬虫的合法性与法律边界
了解数据爬虫的原理、用途、法律风险与合规性。本文深入解析网络爬虫的工作机制，探讨其在数据采集、搜索引擎等领域的应用。同时，重点关注Robots协议、反爬虫技术、开放数据等合规性问题，并分析相关法律案例，助您合法安全地使用爬虫技术。文章目录什么是网络数据爬虫？数据爬虫的工作原理数据爬虫的应用与影响数据爬虫的广泛用途数据爬虫带来的负面影响和潜在风险数据爬虫的合规性问题开放数据与非开放数据Robots协
Vue 3.5 中的 useId：深入解析与应用实践程序员
随着Vue3.5的发布，开发者们迎来了许多新特性和改进。其中，useId是一个备受关注的工具函数，它为开发者提供了一种简单而高效的方式来生成唯一的ID。本文将深入解析useId的实现原理、使用场景以及在实际项目中的应用实践。一、什么是useId？useId是Vue3.5中引入的一个CompositionAPI函数，用于生成唯一的ID。它的主要用途是为组件或DOM元素分配唯一的标识符，避免在SSR（
「AI 中国」榜单揭晓，OpenBayes贝式计算入选「大模型最具潜力创业企业 TOP 10」
日前，「AI中国」机器之心2024年度评选正式揭晓，OpenBayes贝式计算有幸入选「大模型最具潜力创业企业TOP10」。作为专业的人工智能媒体与产业服务平台，机器之心于2017年发布了AI榜单「SyncedMachineIntelligenceAwards」，在随后的时间里，伴随AI的跨越式发展，机器之心的年度评选也逐渐成为了产业风向标之一，覆盖的领域、范围更加广泛，维度更加细化。机器之心20
6、ListView详解：构建可滚动的列表 piplab666 flutter ui
在移动应用开发中，经常需要展示大量数据，如新闻列表、商品列表等。Flutter提供了丰富的滚动视图控件，其中最基础也是最常用的就是ListView。本篇博客将深入探讨ListView的各种属性、类型以及性能优化技巧，帮助您更好地利用这一重要工具。1.什么是ListView？ListView是Flutter中的滚动视图控件，用于展示一个可滚动的列表。它可以在垂直方向（默认）或水平方向滚动，内部包含一
StarRocks Lakehouse 快速入门——Apache Iceberg
导读：StarRocksLakehouse快速入门旨在帮助大家快速了解湖仓相关技术，内容涵盖关键特性介绍、独特的优势、使用场景和如何与StarRocks快速构建一套解决方案。最后大家也可以通过用户真实的使用场景来了解StarRocksLakehouse的最佳实践！ApacheIceberg介绍ApacheIceberg是一种为大规模、复杂数据集设计的开源表格式，这些数据集跨越了PB级别的数据。最初
2017-SIGGRAPH-Google,MIT-(HDRNet)Deep Bilateral Learning for Real-Time Image Enhancements WX Chen HDR技术深度学习神经网络机器学习
双边网格本质上是一个可以保存边缘信息的3维的数据结构。对于一张2维图片,在2维空间中增加了一维代表像素的强度slice操作(上采样)BilateralGuidedUpsampling这篇文章用双边网格实现图像的操作算子的加速。算法的核心思想是将一幅高分辨率的图像通过下采样转换成一个双边网格,在双边网格中每个格子就是一个图像的仿射变换算子,它的原理是在空间与值域相近的区域内,相似输入图像的亮度经算子
021：为什么是卷积呢？董董灿是个攻城狮计算机视觉保姆级教程人工智能计算机视觉 CNN
本文为合集收录，欢迎查看合集/专栏链接进行全部合集的系统学习。合集完整版请查看这里。卷积算法非常重要，但是为什么是卷积呢?在进一步学习之前，先看一看神经网络(或者叫一个AI模型)是如何完成一张图片的推理的。你肯定听说过阿尔法狗大战柯洁的故事，当时新闻一出，不知大家什么反应，反正我是被震撼到了：AI模型竟然学到了那么多的棋谱，而且人类在AI的面前毫无还手可言。但是，你有没有想过一个问题：阿尔法狗学会
Python从0到100（七十三）：Python OpenCV-OpenCV实现手势虚拟拖拽是Dream呀 python opencv 开发语言
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
Spring Boot 分层解耦相关知识需要重新演唱 web spring boot 后端 java
SpringBoot分层解耦相关知识详解目录SpringBoot分层解耦相关知识详解1.概述2.控制反转（IOC）2.1概念解释2.2在SpringBoot中的实现3.依赖注入（DI）3.1概念解释3.2在SpringBoot中的实现3.2.1构造器注入3.2.2Setter注入3.2.3字段注入4.分层解耦的实践4.1分层架构4.2示例代码5.总结1.概述在现代软件开发中，分层解耦是一个核心概念
Xshell常用指令（已经连接到华为鲲鹏服务器）风染yeye 服务器华为 linux
我的使用主要是通过Xshell连接到华为鲲鹏服务器，实现远程登录和管理。通过Xshell，可以直接在本机windows系统下使用华为鲲鹏服务器。此篇适用于入门阶段，只展示了如何在xshell上运行代码文件。常用指令1.help：显示命令的帮助信息。示例：输入help命令可以获取所有Xshell命令的帮助信息。2.pwd：显示当前工作目录的路径。示例：-pwd：显示当前工作目录的路径。3.cd：改变
银河麒麟V10 sp3 安装Oracle11g 蓝天4202 oracle 笔记 oracle
hostnamectlset-hostnamedb01vim/etc/hosts192.168.1.101db01vim/etc/selinux/configSELINUX=disabled2.5关闭防火墙配置systemctldisablefirewalldsystemctlstopfirewalldsystemctlstopfirewalld.servicesystemctldisablefi
Python处理Excel数据王肇朋 excel Excel EXCEL office python Python
Python处理Excel数据2012-08-0210:07:32我来说两句收藏我要投稿前段时间做了个小项目，帮个海洋系的教授做了个数据处理的软件。基本的功能很简单，就是对Excel里面的一些数据进行过滤，统计，对多个表的内容进行合并等。之前没有处理Excel数据的经验，甚至于自己都很少用到Excel。记得《Python核心编程》的最后一章里有讲到用Win32COM操作office，看了一下讲的不
国产海光CPU平台兼容性指南-基础软件分册-20231013（附各系统下载链接）技术瘾君子1573 服务器&存储服务器兼容列表海光 CPU 云计算大数据操作系统
目录声明一、操作系统二、虚拟化和云2.1虚拟化和云2.2虚拟机上的操作系统2.2.1VMwarevSphere上的虚拟机操作系统2.2.2KVM上的虚拟机操作系统2.2.3WindowsHyper-V上的虚拟机操作系统2.2.4VirtualBox上的虚拟机操作系统三、分布式存储四、数据库五、中间件六、大数据七、平台组件7.1云平台7.2大数据平台7.3人工智能平台7.4科学与工程计算平台八、其它
【shell脚本练习——判断文件是否存在、批量创建有规律用户并设置密码、判断文件大小并更改路径位置】怎么昵称都被占用啊练习 RHCE linux 运维
shell脚本练习练习要求：练习一：判断文件是否存在练习二：批量创建有规律用户并设置密码随机字符部分内容解释：练习三：判断文件大小并更改路径位置练习要求：shell脚本写出检测/tmp/size.log文件如果存在显示它的内容，不存在则创建一个文件将创建时间写入写一个shell脚本,实现批量添加20个用户,用户名为user01-20,密码为user后面跟5个随机字符编写个shell脚本将/usr/
【音视频SDL2入门】创建第一个窗口人才程序员音视频基础大合集音视频 c++c语言 windows 用户界面 sdl2 视频编解码
文章目录前言创建窗口的流程需要使用的函数1.初始化SDL库2.创建SDL窗口3.获取与窗口关联的表面SDL_FillRect函数介绍4.更新窗口表面5.延迟一定时间6.销毁窗口并退出SDL库示例代码总结前言SDL2（SimpleDirectMediaLayer）是一个跨平台的开发库，旨在为多媒体应用程序（如游戏和视频播放软件）提供低级别的访问接口。SDL2提供了创建窗口、处理输入、播放音频等多种功
burp suite入门使用没有理想的不伤心常用工具 burp suite web渗透
burpsuite入门使用REF:参考文章遇到的问题https协议场景访问，可能会失败：证书认证问题burpsuite配置问题REF:ERR_HTTP2_PROTOCOL_ERRORcommonerrors
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI linux PHP android
╔-----------------------------------╗┆
zookeeper admin 笔记 braveCS zookeeper
Required Software 1) JDK>=1.6 2)推荐使用ensemble的ZooKeeper(至少3台)，并run on separate machines 3)在Yahoo!，zk配置在特定的RHEL boxes里，2个cpu，2G内存，80G硬盘数据和日志目录 1)数据目录里的文件是zk节点的持久化备份，包括快照和事务日
Spring配置多个连接池 easterfly spring
项目中需要同时连接多个数据库的时候，如何才能在需要用到哪个数据库就连接哪个数据库呢？ Spring中有关于dataSource的配置： <bean id="dataSource" class="com.mchange.v2.c3p0.ComboPooledDataSource" &nb
Mysql 171815164 mysql
例如，你想myuser使用mypassword从任何主机连接到mysql服务器的话。 GRANT ALL PRIVILEGES ON *.* TO 'myuser'@'%'IDENTIFIED BY 'mypassword' WI TH GRANT OPTION; 如果你想允许用户myuser从ip为192.168.1.6的主机连接到mysql服务器，并使用mypassword作
CommonDAO（公共/基础DAO） g21121 DAO
好久没有更新博客了，最近一段时间工作比较忙，所以请见谅，无论你是爱看呢还是爱看呢还是爱看呢，总之或许对你有些帮助。 DAO(Data Access Object)是一个数据访问（顾名思义就是与数据库打交道）接口，DAO一般在业
直言有讳永夜-极光感悟随笔
1.转载地址:http://blog.csdn.net/jasonblog/article/details/10813313 精华: “直言有讳”是阿里巴巴提倡的一种观念，而我在此之前并没有很深刻的认识。为什么呢？就好比是读书时候做阅读理解，我喜欢我自己的解读，并不喜欢老师给的意思。在这里也是。我自己坚持的原则是互相尊重，我觉得阿里巴巴很多价值观其实是基本的做人
安装CentOS 7 和Win 7后，Win7 引导丢失随便小屋 centos
一般安装双系统的顺序是先装Win7，然后在安装CentOS，这样CentOS可以引导WIN 7启动。但安装CentOS7后，却找不到Win7 的引导，稍微修改一点东西即可。一、首先具有root 的权限。即进入Terminal后输入命令su，然后输入密码即可二、利用vim编辑器打开/boot/grub2/grub.cfg文件进行修改 v
Oracle备份与恢复案例 aijuans oracle
Oracle备份与恢复案例一. 理解什么是数据库恢复当我们使用一个数据库时，总希望数据库的内容是可靠的、正确的，但由于计算机系统的故障（硬件故障、软件故障、网络故障、进程故障和系统故障）影响数据库系统的操作，影响数据库中数据的正确性，甚至破坏数据库，使数据库中全部或部分数据丢失。因此当发生上述故障后，希望能重构这个完整的数据库，该处理称为数据库恢复。恢复过程大致可以分为复原(Restore)与
JavaEE开源快速开发平台G4Studio v5.0发布無為子
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V5.0版本已经正式发布。访问G4Studio网站 http://www.g4it.org 2013-04-06 发布G4Studio_V5.0版本功能新增 (1). 新增了调用Oracle存储过程返回游标，并将游标映射为Java List集合对象的标
Oracle显示根据高考分数模拟录取百合不是茶 PL/SQL编程 oracle例子模拟高考录取学习交流
题目要求: 1,创建student表和result表 2,pl/sql对学生的成绩数据进行处理 3,处理的逻辑是根据每门专业课的最低分线和总分的最低分数线自动的将录取和落选 1,创建student表,和result表学生信息表; create table student( student_id number primary key,--学生id
优秀的领导与差劲的领导 bijian1013 领导管理团队
责任优秀的领导：优秀的领导总是对他所负责的项目担负起责任。如果项目不幸失败了，那么他知道该受责备的人是他自己，并且敢于承认错误。差劲的领导：差劲的领导觉得这不是他的问题，因此他会想方设法证明是他的团队不行，或是将责任归咎于团队中他不喜欢的那几个成员身上。努力工作优秀的领导：团队领导应该是团队成员的榜样。至少，他应该与团队中的其他成员一样努力工作。这仅仅因为他
js函数在浏览器下的兼容 Bill_chen jquery 浏览器 IE DWR ext
做前端开发的工程师，少不了要用FF进行测试，纯js函数在不同浏览器下，名称也可能不同。对于IE6和FF，取得下一结点的函数就不尽相同： IE6：node.nextSibling,对于FF是不能识别的； FF：node.nextElementSibling,对于IE是不能识别的；兼容解决方式：var Div = node.nextSibl
【JVM四】老年代垃圾回收：吞吐量垃圾收集器(Throughput GC) bit1129 垃圾回收
吞吐量与用户线程暂停时间衡量垃圾回收算法优劣的指标有两个：吞吐量越高，则算法越好暂停时间越短，则算法越好首先说明吞吐量和暂停时间的含义。垃圾回收时，JVM会启动几个特定的GC线程来完成垃圾回收的任务，这些GC线程与应用的用户线程产生竞争关系，共同竞争处理器资源以及CPU的执行时间。GC线程不会对用户带来的任何价值，因此，好的GC应该占
J2EE监听器和过滤器基础白糖_ J2EE
Servlet程序由Servlet，Filter和Listener组成，其中监听器用来监听Servlet容器上下文。监听器通常分三类：基于Servlet上下文的ServletContex监听，基于会话的HttpSession监听和基于请求的ServletRequest监听。 ServletContex监听器 ServletContex又叫application
博弈AngularJS讲义(16) - 提供者 boyitech js AngularJS api Angular Provider
Angular框架提供了强大的依赖注入机制，这一切都是有注入器(injector)完成. 注入器会自动实例化服务组件和符合Angular API规则的特殊对象，例如控制器，指令，过滤器动画等。那注入器怎么知道如何去创建这些特殊的对象呢？ Angular提供了5种方式让注入器创建对象，其中最基础的方式就是提供者(provider), 其余四种方式(Value, Fac
java-写一函数f(a,b)，它带有两个字符串参数并返回一串字符，该字符串只包含在两个串中都有的并按照在a中的顺序。 bylijinnan java
public class CommonSubSequence { /** * 题目：写一函数f(a,b)，它带有两个字符串参数并返回一串字符，该字符串只包含在两个串中都有的并按照在a中的顺序。 * 写一个版本算法复杂度O(N^2)和一个O(N) 。 * * O(N^2)：对于a中的每个字符，遍历b中的每个字符，如果相同，则拷贝到新字符串中。 * O(
sqlserver 2000 无法验证产品密钥 Chen.H sql windows SQL Server Microsoft
在 Service Pack 4 (SP 4), 是运行 Microsoft Windows Server 2003、 Microsoft Windows Storage Server 2003 或 Microsoft Windows 2000 服务器上您尝试安装 Microsoft SQL Server 2000 通过卷许可协议 (VLA) 媒体。这样做, 收到以下错误信息CD KEY的 SQ
[新概念武器]气象战争 comsci
气象战争的发动者必须是拥有发射深空航天器能力的国家或者组织.... 原因如下: 地球上的气候变化和大气层中的云层涡旋场有密切的关系,而维持一个在大气层某个层次
oracle 中 rollup、cube、grouping 使用详解 daizj oracle grouping rollup cube
oracle 中 rollup、cube、grouping 使用详解 -- 使用oracle 样例表演示转自namesliu -- 使用oracle 的样列库，演示 rollup, cube, grouping 的用法与使用场景 --- ROLLUP ，为了理解分组的成员数量，我增加了分组的计数 COUNT(SAL)
技术资料汇总分享 Dead_knight 技术资料汇总分享
本人汇总的技术资料，分享出来，希望对大家有用。 http://pan.baidu.com/s/1jGr56uE 资料主要包含： Workflow->工作流相关理论、框架(OSWorkflow、JBPM、Activiti、fireflow...) Security->java安全相关资料(SSL、SSO、SpringSecurity、Shiro、JAAS...) Ser
初一下学期难记忆单词背诵第一课 dcj3sjt126com english word
could 能够 minute 分钟 Tuesday 星期二 February 二月 eighteenth 第十八 listen 听 careful 小心的，仔细的 short 短的 heavy 重的 empty 空的 certainly 当然 carry 携带；搬运 tape 磁带 basket 蓝子 bottle 瓶 juice 汁，果汁 head 头；头部
截取视图的图片, 然后分享出去 dcj3sjt126com OS Objective-C
OS 7 has a new method that allows you to draw a view hierarchy into the current graphics context. This can be used to get an UIImage very fast. I implemented a category method on UIView to get the vi
MySql重置密码 fanxiaolong MySql重置密码
方法一: 在my.ini的[mysqld]字段加入： skip-grant-tables 重启mysql服务，这时的mysql不需要密码即可登录数据库然后进入mysql mysql>use mysql; mysql>更新 user set password=password('新密码') WHERE User='root'; mysq
Ehcache（03）——Ehcache中储存缓存的方式 234390216 ehcache MemoryStore DiskStore 存储驱除策略
Ehcache中储存缓存的方式目录 1 堆内存（MemoryStore） 1.1 指定可用内存 1.2 驱除策略 1.3 元素过期 2 &nbs
spring mvc中的@propertysource jackyrong spring mvc
在spring mvc中，在配置文件中的东西，可以在java代码中通过注解进行读取了： @PropertySource 在spring 3.1中开始引入比如有配置文件 config.properties mongodb.url=1.2.3.4 mongodb.db=hello 则代码中 @PropertySource(&
重学单例模式 lanqiu17 单例 Singleton 模式
最近在重新学习设计模式，感觉对模式理解更加深刻。觉得有必要记下来。第一个学的就是单例模式，单例模式估计是最好理解的模式了。它的作用就是防止外部创建实例，保证只有一个实例。单例模式的常用实现方式有两种，就人们熟知的饱汉式与饥汉式，具体就不多说了。这里说下其他的实现方式静态内部类方式: package test.pattern.singleton.statics; publ
.NET开源核心运行时，且行且珍惜 netcome java .net 开源
背景 2014年11月12日，ASP.NET之父、微软云计算与企业级产品工程部执行副总裁Scott Guthrie，在Connect全球开发者在线会议上宣布，微软将开源全部.NET核心运行时，并将.NET 扩展为可在 Linux 和 Mac OS 平台上运行。.NET核心运行时将基于MIT开源许可协议发布，其中将包括执行.NET代码所需的一切项目——CLR、JIT编译器、垃圾收集器（GC）和核心
使用oscahe缓存技术减少与数据库的频繁交互 Everyday都不同 Web 高并发 oscahe缓存
此前一直不知道缓存的具体实现，只知道是把数据存储在内存中，以便下次直接从内存中读取。对于缓存的使用也没有概念，觉得缓存技术是一个比较”神秘陌生“的领域。但最近要用到缓存技术，发现还是很有必要一探究竟的。缓存技术使用背景：一般来说，对于web项目，如果我们要什么数据直接jdbc查库好了，但是在遇到高并发的情形下，不可能每一次都是去查数据库，因为这样在高并发的情形下显得不太合理——
Spring+Mybatis 手动控制事务 toknowme mybatis
@Override public boolean testDelete(String jobCode) throws Exception { boolean flag = false; &nbs
菜鸟级的android程序员面试时候需要掌握的知识点 xp9802 android
熟悉Android开发架构和API调用掌握APP适应不同型号手机屏幕开发技巧熟悉Android下的数据存储熟练Android Debug Bridge Tool 熟练Eclipse/ADT及相关工具熟悉Android框架原理及Activity生命周期熟练进行Android UI布局熟练使用SQLite数据库；熟悉Android下网络通信机制，S

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他