不会说相声的dancer不是好码农

一个初初初学者的python爬虫心得

一个初初初学者的python爬虫心得

准备工作
取

取一（书籍信息直接显示在html文件中）
取二（在刷新网页时加载js文件）
取三（加载时展示部分网页，进行操作后显示其余部分）

存

1.数据库
2.Excel

数据可视化
词云图
后记

准备工作

python基础知识，大概懂语法就ok；
网页相关知识，或许不是很重要，能看懂审查元素结果；
IDE，我用Spyder，听说Sublime也好用，但是我搭建环境安装Package Control插件的时候凉掉了。。。上课用的Pycharm，可以Ctrl+左键查看方法的参数，对我这种小白很友好，而且下载和配置都很简单，好用！
过程中会使用pip命令安装Python相应的包和模块，所以打开命令行程序输入pip查看是否安装pip以及配置环境变量。看有朋友说windows下默认安装了pip工具,只是没有将路径加入path中；
Mysql，不必须，将爬取的数据存储到数据库中会用到。

取

取一（书籍信息直接显示在html文件中）

我们以爬取当*网的500本书的书名、价格及作者信息并存储为.txt文件为例

分析网页结构

可以看到每本书的书籍信息在

一个初初初学者的python爬虫心得_第2张图片

步骤
下载网页以得到网页源码

import requests  #pip list命令查看相应包是否已下载，没有的话pip install 包名
from lxml.html import fromstring
def downloag_code(url): 
 response=requests.get(url)       #
 htmlString=response.text         #
 code=fromstring(htmlString)      # 可以直接按照网页层次结构解析
 return code

数据提取

#获取一个网页的60本书
def get_books(code,count,lonum):    
 li_list=code.xpath('..//ul[@id="component_59"]/li')  #获取
标签 
 books_list=[]         #存储当前网页的60本书
 for li in li_list:
     bookname=li.xpath('p[@class="name"]/a/@title') 
     price = li.xpath('p[@class="price"]/span[@class="search_now_price"]/text()')#有可能没有值
     author = li.xpath('p[@class="search_book_author"]/span/a[@name="itemlist-author"]/@title')
     if len(price)==0: #简单处理没有爬取到价格的书籍，问题在于存储位置不同，当然可以重新定位
         price=['¥46.60']
     books_list.append([bookname,price,author])
     lonum+=1  #控制爬取数据数目
     if lonum>count:
         return books_list
 return books_list

#获取指定数目书籍
def get_all_books(count):       #获取９个网页的书籍
 pages=math.ceil(count/60)    #每个网页60本书信息
 all_books=[]
 for page in range(1,pages+1):
     url="http://search.dangdang.com/?key=python&act=input&page_index={}".format(page) 
     codes=downloag_code(url)
     books_list=get_books(codes,count,(page-1)*60+1) #参数为源码,总数,当前开始的数目
     all_books.append(books_list)
 return all_books

数据存储

def save_all_books(all_books):
 with open(file="dangdang.txt",mode='w',encoding='utf_8') as file
 for page,books in enumerate(all_books):#写入方式2
     for num,book in enumerate(books):
         file.write("第{}页第{}条书籍是:{} \n".format(page+1,num+1,book))

执行及结果

if __name__=="__main__":
 all_books=get_all_books(180) #也可以修改网页地址其他属性如key获取不同书
 save_all_books(all_books)

执行结果

取二（在刷新网页时加载js文件）

以智*招聘为例，审查元素时在network中寻找XHR文件，最终确定url

可以看到data中定义了results列表存放职位信息，每个职位的信息组成字典类型

#获取源码
def downloag_code(url):   
   response=requests.get(url)
   jsoncode=response.json()       #字典形式
   return jsoncode
def get_values(jsoncode):
   jobs=jsoncode['data']['results']      #针对字典的读取形式
   vocations=[]
   for job in jobs:
       jobname=job['jobName']
       workexp=job['workingExp']['name']
       salary=job['salary']
       vocations.append((jobname,workexp,salary))
   return vocations
code=downloag_code("https://fe-api.zhaopin.com/c/i/sou?&start=90&pageSize=90&cityId=854&workExperience=-1&education=-1&companyType=-1&employmentType=-1&jobWelfareTag=-1&kw=java&kt=3&_v=0.46880996&x-zp-page-request-id=2c5e1c1b0a3f448996ce61acf87be46d-1562292190264-205445&x-zp-client-id=5eaebb71-95e9-426d-8b07-7315576a86e7")  #preview中查看url

取三（加载时展示部分网页，进行操作后显示其余部分）

以一*店为例，在网页加载完毕时只显示30本书，浏览到底部会加载剩余的30本书
需要用到对应浏览器的驱动器，下载解压后将其添加到Mysql的bin目录下

from lxml.html import fromstring
from selenium import webdriver
import time
def downloag_code(url):   #获取一个网页源码
    # 1- 启动谷歌浏览器
    chrome = webdriver.Chrome()
    # 2- url
    chrome.get(url)
    # 3- 缓冲时间(打开网页)
    time.sleep(3)
    # 4- 滚动条的执行,执行一个js代码，实现滚动条的滚动
    js="window.scrollTo(0,100000)" #需要足够的长度，否则不能触发，加载可以用循环实现
    chrome.execute_script(js)
    time.sleep(3)          #(滚动后浏览器自身的缓冲)
    # 5- 获取内容
    code=chrome.page_source        
    htmlcode=fromstring(code)
    return htmlcode

存

上面的代码提到了存储在记事本中，这里再记录一下存储到数据库中，以及导入到Excel表中

1.数据库

在存储之前首先需要设置好数据库一系列内容。
我建立了名为dangd的数据库，并创建了一个books的表

"""
建表
create table books(
bid int primary key auto_increment,
bname varchar(255) not null,
bprice float(20),
bauthor varchar(300)
)engine="InnoDb" charset="utf8";
"""
#1-导包
import pymysql
from demo2.dangd import downloag_code,get_books,get_all_books  
#2-建立连接
connect=pymysql.connect(host="localhost",port=3306,user="root",password="12345",database="dangd",charset="utf8")
#3-操作之需求
sql="insert into books(bname,bprice,bauthor)values (%s,%s,%s)"
#操作之执行者
cursor=connect.cursor()
#操作之执行
all_books=get_all_books(30)
for books in all_books:
    for book in books:
        row=cursor.execute(sql,[book[0],book[1][0][1:],str(book[2])])    
#4-结果处理：成功则提交，失败则回滚
        if row>0:
            connect.commit()
        else:
            connect.rollback()
#5-关闭资源
cursor.close()
connect.close()

2.Excel

import xlwt
def save_to_excel():
    #1-创建工作表
    workbook=xlwt.Workbook(encoding='utf-8')  
    #2-添加sheet文件
    sheet=workbook.add_sheet("dangpython",True)     
    #xlwt.Worksheet("dangpython",workbook,True)   
    # 3-写内容 sheet 行列从0开始标号
    all_books=get_all_books(200)  #获取200本书信息
    row=0  #控制写入工作表的行
    for books in all_books:
        for book in books:
            for i in range(len(book)):
                sheet.write(row, i, book[i])
            row+=1
    #4-保存(在同一目录下)
    workbook.save("dangd.xls")

数据可视化

对存储到数据库中的数据进行处理
可以调用matplotlib中的方法实现如折线图、饼图和条形图等的绘制
以条形图为例，比较每个价格区间的最大值和最小值
首先在数据库中建立关于价格区间的视图

'''
create view temp_bprice(bprice,pricerange) as
select bprice,case
when bprice<50 then "0-50"
when bprice<100 then "50-100"
when bprice<150 then "100-150"
when bprice<200 then "150-200"
when bprice>=200 then "200及以上"
end pricerange from books
'''
import pymysql
from matplotlib import pyplot as plt
from matplotlib.font_manager import FontProperties   #设置中文字体
#获取最大值和最小值列表
def getxyz():
	#省略数据库相关操作
    #sql="""select pricerange,min(bprice),max(bprice) from temp_bprice group by pricerange order by max(bprice)"""
    x=[]
    y_min=[]  #最大值列表
    y_max=[]  #最小值列表
    for i in result:
         x.append(i[0])
         y_min.append(i[1])
         y_max.append(i[2])
    return x,y_min,y_max

#绘图
def get_bar(x,y,z):
    font = FontProperties(fname="..\\toolsf\\STXINGKA.TTF")#为字体创建对象
    x_axis = [i - 0.15 for i in range(len(x))]
    plt.bar(x_axis,y,width=0.3,color='blue')
    x_axis = [i + 0.15 for i in range(len(x))]
    plt.bar(x_axis,z,width=0.3,color='purple')
    plt.xticks(range(len(x)), x, fontproperties=font,rotation=30)#旋转刻度
    plt.xlabel('图书价格区间',fontproperties=font)
    plt.ylabel('数量',fontproperties=font)
    plt.title("图书价格条形图",fontproperties=font)
    plt.show()

词云图

只是学习了一点皮毛，权当做个记录

from wordcloud import WordCloud
import pymysql
from PIL import Image   #读取图像信息
import numpy            #科学计算第三方工具
import matplotlib.pyplot as plt

def get_text():
    text=""
    #省略数据库一般操作
    #sql = """select bname from books"""
    return text
def get_wordcloud(text):
    img=Image.open("1.jpg")       #类似PS中的蒙版（个人理解）
    mask_img=numpy.array(img)
    wordcloud=WordCloud(font_path="..\\toolsf\\STXINGKA.TTF",
    	background_color="white", width=200,mask=mask_img,
    	stopwords=['Python','第2版','第3版'],)#stopwords：不显示的词语
    #词云图的生成
    wordcloud=wordcloud.generate(text)
    #保存
    wordcloud.to_file("wordcloud.png")

结果。。。

为什么这么奇怪呢，大概是因为我用了这样一张图?。。。（图源：百度）

后记

可以看到基本都遵循相同的步骤，能否爬到需要的数据还是在于对网页结构的分析
其余什么参数之类可以查看文档
人生第一次写这种总结性的东西，想着也是对自己学到的东西的记录。毕竟菜鸡如我指不定哪天就忘了
做事情从来都是三分钟热度，可求求我自己能多坚持一会
如果有大佬看见了，您可以说我哪错了，但不能说我菜，嗯
爬虫还要继续学习，毕竟早上看别人的Scrapy等等各种神奇框架没咋理解
我寻思着这东西还挺有意思的，发人深省，那天爬了智联招聘各种工作岗位和月薪，啊，活着好难，挣钱好难

你可能感兴趣的:(一个初初初学者的python爬虫心得)

PyWavelets（pywt）安装与使用指南贾雁冰
PyWavelets（pywt）安装与使用指南项目地址:https://gitcode.com/gh_mirrors/pyw/pywtPyWavelets是一个用于离散小波变换（DiscreteWaveletTransform,DWT）和连续小波变换（ContinuousWaveletTransform,CWT）的Python库。该库广泛应用于信号处理、图像分析以及数据压缩等领域。以下是基于提供的
25年大数据开发省赛样题第一套，离线数据处理答案 Tometor 大数据 spark scala
省赛样题一，数据抽取模块这一模块的作用是从mysql抽取数据到ods层进行指标计算，在题目中要求进行全量抽取，并新增etl-date字段进行分区，日期为比赛前一天importorg.apache.spark.sql.SparkSessionimportjava.util.PropertiesobjectTask1{defmain(args:Array[String]):Unit={valspark
C语言数据结构——变长数组（柔性数组） Iawfy22 数据结构 c语言柔性数组
前言这是一位即将大二的大学生（卷狗）在暑假预习数据结构时的一些学习笔记，供大家参考学习。水平有限，如有错误，还望多多指正。本文主要介绍了如何手动实现一个变长数组，以及实现其部分功能（如删除、查找、添加、排序等）变长数组介绍变长数组又可以叫柔性数组，与一般数组不同，它是一个动态的数组，具体表现为可以根据数组里面元素个数的多少而自动的进行扩容，以便达到变长（柔性）的特点。预备知识为了实现自动边长扩容这
python 开放的通讯系统高保密性张小秦命令模式算法 python
优点1.点对点（P2P）加密通信：•采用点对点通信模式，消息直接在客户端之间传输，无需通过中央服务器。•提高隐私性，避免中央服务器成为单点故障或攻击目标。•降低通信延迟，消息传输更高效。2.强大的加密机制：•使用AES（高级加密标准）对消息进行加密，确保通信内容的安全性。•每个会话生成唯一的加密密钥，确保密钥的安全性。•使用AES的EAX模式，支持加密和消息认证，防止消息被篡改。3.临时数据存储：
pytorch实现cifar10多分类总结 L_pyu 人工智能 pytorch 分类
cifar-10简介：CIFAR-10是一个常用的图像分类数据集，每张图片都是3×32×32，3通道彩色图片，分辨率32×32。它包含了10个不同类别，每个类别有6000张图像，其中5000张用于训练，1000张用于测试。这10个类别分别为：飞机、汽车、鸟类、猫、鹿、狗、青蛙、马、船和卡车。CIFAR-10分类任务是将这些图像正确地分类到它们所属的类别中。对于这个任务，可以使用深度学习模型，如卷积
Mybatis的基本使用学c真好玩 mybatis
MyBatis简介MyBatis用于持久层框架,持久层是对数据库操作的部分，前版本iBatis由Apache软件基金组织进行更名并维护。特点:简化数据库的操作SQL映射灵活(半ORM框架)支持高级映射易于集成维护配置动态SQL缓存机制功能：替代JDBC,JDBC是java中提供的用于操作数据库的技术及方案数据库的连接控制难。连接池SQL语句硬编码。将sql语句存放到xml配置文件中参数传递问题。提
Python的pywt库的安装赵孝正 Python标准库使用 #python和pip安装 python 数据库开发语言
目录pywt库的全称是PyWavelets，https://pywavelets.readthedocs.io/en/latest/。安装pywt库：pipinstallPyWavelets而不是VS2017中默认的pipinstallpywt，真是坑啊。>>>importpywt>>>x=[3,7,1,1,-2,5,4,6]>>>cA,cD=pywt.dwt(x,‘db2′)>>>printcA
Python漂浮爱心代码 Want595 趣味编程 python 开发语言
目录系列文章前言小海龟漂浮爱心完整代码尾声系列文章序号直达链接表白系列1Python无法拒绝的表白界面（完整代码）_python玫瑰花雨编程-CSDN博客2Python满屏飘字表白代码（完整代码）_抖音同款满屏飘字表白代码(python版)-CSDN博客3Python无限弹窗满屏表白代码（完整代码）_python弹窗满屏幕-CSDN博客4Python李峋同款跳动的爱心（完整代码）_python绘制
React 和 Vue _使用区别开心小老虎 react知识点+组件 vue3知识点+组件前端知识点 vue.js react.js 前端
目录一、框架介绍1.Vue2.React二、框架结构1.创建应用2.框架结构三、使用区别1.单页面组成2.样式3.显示响应式数据4.响应式html标签属性5.控制元素显隐6.条件渲染7.渲染列表react和vue是目前前端比较流行的两大框架，前端程序员应该将两种框架都掌握，本文总结一些基本知识点的使用区别。一、框架介绍1.VueVue是一个框架，也是一个生态。其功能覆盖了大部分前端开发常见的需求。
pjsip dtmf发送和接收（pjsua）小gpt& Pjsip 音视频 qt c++
DTMF（双音多频，Dual-ToneMulti-Frequency）是一种用于电话系统的信号技术，通过组合两个不同频率的音频信号来表示数字和符号。以下是DTMF的主要使用背景和应用场景：电话拨号DTMF最常见的用途是电话拨号。当用户按下电话键盘上的数字或符号时，电话会生成两个特定频率的音调，交换机接收并解码这些信号以确定用户拨打的号码。交互式语音应答（IVR）系统DTMF广泛用于IVR系统，用户
2024年Flutter从入门到精通全网最全学习路线指南高级技术工程师 flutter flutter flutter中文网 flutter中文官方文档
随着移动开发技术的快速发展，Flutter作为Google推出的跨平台开发框架，以其高效的热重载、统一的UI开发体验和卓越的性能表现，正逐渐成为众多开发者青睐的首选工具。为了帮助广大编程爱好者及职业开发者在2024年更好地掌握Flutter技术，本文将为您呈现一套全面且深度的Flutter学习路线图。flutter中文网flutterflutter中文官方文档第一阶段：基础入门与环境配置了解Flu
ng-网关-zuul 给自己做加法个人 java
一般服务的访问ng-》网关-》服务所以通常有一个服务访问的前缀，这个前缀是在ng上配置的，然后接着才是具体服务的url，zuul可以没有前缀，但是zuul决定了跳转的服务。zuul的配置path其实就是寻找到对应的url格式，然后选择选择跳转注意，当出现两个服务器的url前缀一样的时候，path该如何配置呢？答案是zuul从上之下检索url，符合条件就进行跳转。既然访问是根据path进行判断的，那
王道数据结构第三章（二）- 栈和队列的应用 int型码农数据结构算法
王道数据结构第三章（二）栈和队列的应用一、栈在括号匹配中的应用1.括号匹配2.实现2.前、中、后缀表达式二、栈在表达式求值中的应用1.后缀表达式（重要）1.1中缀转后缀1.2后缀表达式的计算1.2.1手算1.2.2机算2.前缀表达式2.1中缀转前缀2.2前缀表达式的计算3.中缀表达式3.1中缀转后缀的机算（用栈实现）3.2中缀表达式的计算三、栈在递归中的应用1.阶乘2.斐波那契数列四、队列的应用总
html5使用本地sqlite数据库小祁爱编程 sqlite html5 big data
html5使用本地sqlite数据库本地数据库概述在HTML5中，大大丰富了客户端本地可以存储的内容，添加了很多功能将原本必须要保存在服务器上的数据转为保存在客户端本地，从而大大提高了Web应用程序性能，减轻了服务器的负担，使用Web时代重新回到了“客户端为重、服务器端为轻”的时代。HTML5中内置了两种本地数据库，一种是SQLite,一种是indexedDBSQLite数据库使用操作本地数据库的
vscode语言支持插件开发 amux9527 笔记 vscode typescript 编辑器
安装脚手架npminstall-gyogenerator-code生成插件模板yocode配置语言支持我这里就自定义一种以.da结尾的语言，修改根目录下的package.json文件的contributes处的属性{"contributes":{"languages":[{"id":"da","aliases":["DA"],"extensions":[".da"],"icon":{"dark":
VSCode 2025最新后端开发必备插件汇总（必备插件合集，Python、Java、Go等语言） Code_流苏实用软件与高效工具 vscode python java 后端开发必备插件合集
前言:作为微软推出的轻量级跨平台编辑器，VSCode凭借智能代码补全、远程开发、Git集成等核心功能，已成为后端开发者首选工具。其强大的插件生态更是覆盖了主流后端语言支持、代码质量优化、性能分析等全场景需求。名人说：博观而约取，厚积而薄发。——苏轼《稼说送张琥》创作者：Code_流苏(CSDN)（一个喜欢古诗词和编程的Coder）目录一、语言支持类插件二、代码质量和格式化工具三、数据库工具四、AP
HTML网页中添加视频的代码冬瓜生鲜 JavaWeb
//非原创（当时忘记保存大佬连接了，不知道是谁的了，所以没有转载链接，见谅）只需要把名字改改就行如果要实现自动播放：改下这个：controlsautoplaymuted;
C++中栈的用法冬瓜生鲜 1 大学学习的算法
简单记忆，具体详细见：https://blog.csdn.net/qq_20366761/article/details/70053813c++栈的方法的基本用法：push():向栈内压入一个成员；pop():从栈顶弹出一个成员；empty():如果栈为空返回true，否则返回false；top():返回栈顶，但不删除成员；size():返回栈内元素的大小；#include#includeusin
IDEA项目maven project没有出现plugins和Dependencies 冬瓜生鲜 IDEA Maven
背景：今天学习Springboot，但是用的apache-maven3.0，导入springboot1.5.19，Maven项目老是爆红线，还没有plugins和Dependencies方案一：方案二：jdk+SpringBoot+maven版本不对《我把maven版本换高，就成功解决了》Springboot版本SpringFrameworkjdk版本maven版本1.2.0版本之前63.01.2
2025年Python后端开发指南：从基础到云原生实践 ctrl_cv工程师￥云原生 django flask pycharm
在2025年，Python后端开发已全面进入云原生与智能化时代。开发者不仅需要掌握传统后端技术栈，还需融合容器化、AI辅助编程等新兴技术。本文基于行业最新趋势与最佳实践，系统梳理Python后端开发的核心要点与进阶方向，涵盖开发环境、架构设计、性能优化等关键领域。一、开发环境与工具链1.环境配置标准化Python版本：推荐Python3.12+，支持模式匹配（PatternMatching）和更优
Vue3 + TypeScript 实战经验：2025年高效开发指南 ctrl_cv工程师￥ typescript javascript 前端
在2024年的前端工程化浪潮中，Vue3与TypeScript已成为企业级应用的黄金组合。本文将基于多个真实项目经验，从工程规范、类型安全、性能优化三个维度，分享实战技巧与避坑指南。一、工程配置：构建坚如磐石的基础1.脚手架选择与优化1.1推荐方案：使用Vite+create-vue初始化项目（2024年默认模板已集成TypeScript）关键配置：//vite.config.tsexportde
MySQL 事务的隔离级别重生之我在成电转码 java mysql 事务
MySQL事务的隔离级别定义了多个事务并发执行时，如何防止相互影响。隔离级别越高，数据一致性越强，但并发性能可能降低。四种事务隔离级别MySQL提供4种事务隔离级别（从低到高）：隔离级别脏读（DirtyRead）不可重复读（Non-repeatableRead）幻读（PhantomRead）1.读未提交（ReadUncommitted）❌可能发生❌可能发生❌可能发生2.读已提交（ReadCommi
VSCode SSHFS 扩展使用教程史跃骏Erika
VSCodeSSHFS扩展使用教程vscode-sshfsExtensionforVisualStudioCode:FilesystemproviderusingSSH项目地址:https://gitcode.com/gh_mirrors/vs/vscode-sshfs1.项目介绍VSCodeSSHFS是一个用于VisualStudioCode的扩展，允许用户通过SSH协议将远程文件系统挂载为本地
手动部署？NONONO，动态上传热部署才是王道！！架构文摘JGWZ 接口学习后端 spring
近期开发系统过程中遇到的一个需求，系统给定一个接口，用户可以自定义开发该接口的实现，并将实现打成jar包，上传到系统中。系统完成热部署，并切换该接口的实现。定义简单的接口这里以一个简单的计算器功能为例，接口定义比较简单，直接上代码。public interface Calculator { int calculate(int a, int b); int add(int a, int
Flutter从0到1：构建跨平台应用的新选择卓桢琳Blackbird
Flutter从0到1：构建跨平台应用的新选择去发现同类优质开源项目:https://gitcode.com/在移动开发领域，寻求一款既能提供高性能，又能实现跨平台的框架是开发者们永恒的话题。这就是我们要向您推荐的【Flutter从0到1】项目，它是一个详细、全面的Flutter学习资源库，旨在帮助初学者和有经验的开发者迅速掌握Flutter并构建出高质量的应用。项目简介Flutterfrom0t
SpringBoot 自动装配 SilvertipSage spring boot 后端 java
SpringBoot自动装配：自动装配是Springboot框架的一个核心特性之一。SpringBoot的自动装配通过条件注解和自动配置类，根据应用需求自动配置组件，简化配置过程，提高开发效率不需要手动配置许多繁琐的细节，而是通过自动装配来简化配置过程好处：简化配置，减少了出错的可能性，提高了开发效率，提升了应用程序的可维护性和可扩展性。自动把第三方组件的bean加到IOC容器里，在SpringB
shell脚本重启python脚本 mzgong python
#!/bin/bashwhiletrue#循环检测脚本是否停止doprocnum=$(ps-ef|grep"run.py"|grep-vgrep|wc-l)#记录正在运行run.py的数量echo"ps-efgrepreturn:"${procnum}#信息输出if[[${procnum}==0]];then#如果run.py正在运行数量等于0，脚本中断，需要重启filename=$(date+%
DeepSeek面试——分词算法 mzgong 人工智能算法
DeepSeek-V3分词算法一、核心算法：字节级BPE（Byte-levelBPE，BBPE）DeepSeek-V3采用字节级BPE（BBPE）作为核心分词算法，这是对传统BPE（BytePairEncoding）算法的改进版本。其核心原理是将文本分解为字节（Byte）序列，通过统计高频相邻字节对的共现频率进行逐层合并，最终形成128K扩展词表。二、BBPE的核心优势1.多语言统一处理能力跨语言
C语言从入门到精通李鲶鱼 c++学习 python
主要内容1.基础知识C语言概述：介绍C语言的历史、特点和发展。数据类型：讲解基本数据类型、常量、变量及其存储类别。运算符与表达达：涵盖赋值、算术、关系、逻辑等运算符和表达式。输入输出函数：介绍字符、字符串和格式化的输入输出方法。2.核心技术控制语句：包括选择结构（if、switch）和循环结构（while、for）。数组与指针：详细讲解一维数组、二维数组、字符数组和指针的使用。函数：函数的定义、声
C语言学习笔记-进阶（17）预处理详解 John.Lewis c语言学习笔记
1.预定义符号C语言设置了一些预定义符号，可以直接使用，预定义符号也是在预处理期间处理的。__FILE__//进⾏编译的源⽂件__LINE__//⽂件当前的⾏号__DATE__//⽂件被编译的⽇期__TIME__//⽂件被编译的时间__STDC__//如果编译器遵循ANSIC，其值为1，否则未定义举个例子：printf("file:%sline:%d\n",__FILE__,__LINE__);2
设计模式介绍 tntxia 设计模式
设计模式来源于土木工程师克里斯托弗亚历山大（http://en.wikipedia.org/wiki/Christopher_Alexander）的早期作品。他经常发表一些作品，内容是总结他在解决设计问题方面的经验，以及这些知识与城市和建筑模式之间有何关联。有一天，亚历山大突然发现，重复使用这些模式可以让某些设计构造取得我们期望的最佳效果。亚历山大与萨拉-石川佳纯和穆雷西乐弗斯坦合作
android高级组件使用(一) 百合不是茶 android RatingBar Spinner
1、自动完成文本框（AutoCompleteTextView） AutoCompleteTextView从EditText派生出来，实际上也是一个文本编辑框，但它比普通编辑框多一个功能：当用户输入一个字符后，自动完成文本框会显示一个下拉菜单，供用户从中选择，当用户选择某个菜单项之后，AutoCompleteTextView按用户选择自动填写该文本框。使用AutoCompleteTex
[网络与通讯]路由器市场大有潜力可挖掘 comsci 网络
如果国内的电子厂商和计算机设备厂商觉得手机市场已经有点饱和了,那么可以考虑一下交换机和路由器市场的进入问题..... 这方面的技术和知识,目前处在一个开放型的状态,有利于各类小型电子企业进入 &nbs
自写简单Redis内存统计shell 商人shang Linux shell 统计Redis内存
#!/bin/bash address="192.168.150.128:6666,192.168.150.128:6666" hosts=(${address//,/ }) sfile="staticts.log" for hostitem in ${hosts[@]} do ipport=(${hostitem
单例模式(饿汉 vs懒汉) oloz 单例模式
package 单例模式; /* * 应用场景:保证在整个应用之中某个对象的实例只有一个 * 单例模式种的《懒汉模式》 * */ public class Singleton { //01 将构造方法私有化，外界就无法用new Singleton()的方式获得实例 private Singleton(){}; //02 申明类得唯一实例 priva
springMvc json支持杨白白 json springmvc
1.Spring mvc处理json需要使用jackson的类库，因此需要先引入jackson包 2在spring mvc中解析输入为json格式的数据:使用@RequestBody来设置输入 @RequestMapping("helloJson") public @ResponseBody JsonTest helloJson() {
android播放，掃描添加本地音頻文件小桔子
最近幾乎沒有什麽事情，繼續鼓搗我的小東西。想在項目中加入一個簡易的音樂播放器功能，就像華為p6桌面上那麼大小的音樂播放器。用過天天動聽或者QQ音樂播放器的人都知道，可已通過本地掃描添加歌曲。不知道他們是怎麼實現的，我覺得應該掃描設備上的所有文件，過濾出音頻文件，每個文件實例化為一個實體，記錄文件名、路徑、歌手、類型、大小等信息。具體算法思想，
oracle常用命令 aichenglong oracle dba 常用命令
1 创建临时表空间 create temporary tablespace user_temp tempfile 'D:\oracle\oradata\Oracle9i\user_temp.dbf' size 50m autoextend on next 50m maxsize 20480m extent management local
25个Eclipse插件 AILIKES eclipse插件
提高代码质量的插件1. FindBugsFindBugs可以帮你找到Java代码中的bug，它使用Lesser GNU Public License的自由软件许可。2. CheckstyleCheckstyle插件可以集成到Eclipse IDE中去，能确保Java代码遵循标准代码样式。3. ECLemmaECLemma是一款拥有Eclipse Public License许可的免费工具，它提供了
Spring MVC拦截器+注解方式实现防止表单重复提交 baalwolf spring mvc
原理：在新建页面中Session保存token随机码，当保存时验证，通过后删除，当再次点击保存时由于服务器端的Session中已经不存在了，所有无法验证通过。 1.新建注解： ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
《Javascript高级程序设计(第3版)》闭包理解 bijian1013 JavaScript
“闭包是指有权访问另一个函数作用域中的变量的函数。”--《Javascript高级程序设计(第3版)》看以下代码： <script type="text/javascript"> function outer() { var i = 10; return f
AngularJS Module类的方法 bijian1013 JavaScript AngularJS Module
AngularJS中的Module类负责定义应用如何启动，它还可以通过声明的方式定义应用中的各个片段。我们来看看它是如何实现这些功能的。一.Main方法在哪里如果你是从Java或者Python编程语言转过来的，那么你可能很想知道AngularJS里面的main方法在哪里？这个把所
[Maven学习笔记七]Maven插件和目标 bit1129 maven插件
插件(plugin)和目标(goal) Maven，就其本质而言，是一个插件执行框架，Maven的每个目标的执行逻辑都是由插件来完成的，一个插件可以有1个或者几个目标，比如maven-compiler-plugin插件包含compile和testCompile，即maven-compiler-plugin提供了源代码编译和测试源代码编译的两个目标使用插件和目标使得我们可以干预
【Hadoop八】Yarn的资源调度策略 bit1129 hadoop
1. Hadoop的三种调度策略 Hadoop提供了3中作业调用的策略， FIFO Scheduler Fair Scheduler Capacity Scheduler 以上三种调度算法，在Hadoop MR1中就引入了，在Yarn中对它们进行了改进和完善.Fair和Capacity Scheduler用于多用户共享的资源调度 2. 多用户资源共享的调度
Nginx使用Linux内存加速静态文件访问 ronin47
Nginx是一个非常出色的静态资源web服务器。如果你嫌它还不够快，可以把放在磁盘中的文件，映射到内存中，减少高并发下的磁盘IO。先做几个假设。nginx.conf中所配置站点的路径是/home/wwwroot/res，站点所对应文件原始存储路径：/opt/web/res shell脚本非常简单，思路就是拷贝资源文件到内存中，然后在把网站的静态文件链接指向到内存中即可。具体如下：
关于Unity3D中的Shader的知识 brotherlamp unity unity资料 unity教程 unity视频 unity自学
首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，然后我们来看下Unity3D自带的60多个S
CopyOnWriteArrayList vs ArrayList bylijinnan java
package com.ljn.base; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import java.util.concurrent.CopyOnWriteArrayList; /** * 总述： * 1.ArrayListi不是线程安全的，CopyO
内存中栈和堆的区别 chicony 内存
1、内存分配方面：堆：一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式是类似于链表。可能用到的关键字如下：new、malloc、delete、free等等。栈：由编译器(Compiler)自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中
回答一位网友对Scala的提问 chenchao051 scala map
本来准备在私信里直接回复了，但是发现不太方便，就简要回答在这里。问题写道对于scala的简洁十分佩服，但又觉得比较晦涩，例如一例，Map("a" -> List(11,111)).flatMap(_._2)，可否说下最后那个函数做了什么，真正在开发的时候也会如此简洁？谢谢先回答一点，在实际使用中，Scala毫无疑问就是这么简单。
mysql 取每组前几条记录 daizj mysql 分组最大值最小值每组三条记录
一、对分组的记录取前N条记录：例如：取每组的前3条最大的记录 1.用子查询： SELECT * FROM tableName a WHERE 3> (SELECT COUNT(*) FROM tableName b WHERE b.id=a.id AND b.cnt>a. cnt) ORDER BY a.id,a.account DE
HTTP深入浅出 http请求 dcj3sjt126com http
HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP，使HTTP客户（如Web浏览器）能够从HTTP服务器(Web服务器)请求信息和服务，HTTP目前协议的版本是1.1.HTTP是一种无状态的协议，无状态是指Web浏览器和Web服务器之间不需要建立持久的连接，这意味着当一个客户端向服务器端发出请求，然后We
判断MySQL记录是否存在方法比较 dcj3sjt126com mysql
把数据写入到数据库的时，常常会碰到先要检测要插入的记录是否存在，然后决定是否要写入。　　我这里总结了判断记录是否存在的常用方法：　　sql语句： select count ( * ) from tablename; 　　然后读取count(*)的值判断记录是否存在。对于这种方法性能上有些浪费，我们只是想判断记录记录是否存在，没有必要全部都查出来。
对HTML XML的一点认识 e200702084 html xml
感谢http://www.w3school.com.cn提供的资料 HTML 文档中的每个成分都是一个节点。节点根据 DOM，HTML 文档中的每个成分都是一个节点。 DOM 是这样规定的：整个文档是一个文档节点每个 HTML 标签是一个元素节点包含在 HTML 元素中的文本是文本节点每一个 HTML 属性是一个属性节点注释属于注释节点 Node 层次
jquery分页插件 genaiwei jquery Web 前端分页插件
//jquery页码控件// 创建一个闭包 (function($) { // 插件的定义 $.fn.pageTool = function(options) { var totalPa
Mybatis与Ibatis对照入门于学习 Josh_Persistence mybatis ibatis 区别联系
一、为什么使用IBatis/Mybatis 对于从事 Java EE 的开发人员来说，iBatis 是一个再熟悉不过的持久层框架了，在 Hibernate、JPA 这样的一站式对象 / 关系映射（O/R Mapping）解决方案盛行之前，iBaits 基本是持久层框架的不二选择。即使在持久层框架层出不穷的今天，iBatis 凭借着易学易用、
C中怎样合理决定使用那种整数类型？秋风扫落叶 c 数据类型
如果需要大数值(大于32767或小于32767), 使用long 型。否则, 如果空间很重要 (如有大数组或很多结构), 使用 short 型。除此之外, 就使用 int 型。如果严格定义的溢出特征很重要而负值无关紧要, 或者你希望在操作二进制位和字节时避免符号扩展的问题, 请使用对应的无符号类型。但是, 要注意在表达式中混用有符号和无符号值的情况。 &nbs
maven问题 zhb8015 maven问题
问题1： Eclipse 中新建maven项目无法添加src/main/java 问题 eclipse创建maevn web项目，在选择maven_archetype_web原型后，默认只有src/main/resources这个Source Floder。按照maven目录结构，添加src/main/ja
(二)androidpn-server tomcat版源码解析之--push消息处理 spjich java androdipn 推送
在 (一)androidpn-server tomcat版源码解析之--项目启动这篇中，已经描述了整个推送服务器的启动过程，并且把握到了消息的入口即XmppIoHandler这个类，今天我将继续往下分析下面的核心代码，主要分为3大块，链接创建，消息的发送，链接关闭。先贴一段XmppIoHandler的部分代码 /** * Invoked from an I/O proc
用js中的formData类型解决ajax提交表单时文件不能被serialize方法序列化的问题中华好儿孙 JavaScript Ajax Web 上传文件 FormData
var formData = new FormData($("#inputFileForm")[0]); $.ajax({ type:'post', url:webRoot+"/electronicContractUrl/webapp/uploadfile", data:formData, async: false, ca
mybatis常用jdbcType数据类型 ysj5125094 mybatis mapper jdbcType
MyBatis 通过包含的jdbcType 类型 BIT FLOAT CHAR

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他