易与天行

最新-使用selenium爬取淘宝商品数据（扫码方式绕过反爬虫验证），并根据搜索关键词分类

文章目录

环境准备
爬虫的准备：
各函数

1.login（）
2.drop_scroll()
3.get_gooods（）
4.to_searchs（）
5.save_data（）

完整代码和数据

来个一级标题，记得点个star

视频演示：https://www.bilibili.com/video/BV1154y1v7tk/

使用selenium爬取淘宝商品数据（扫码方式绕过反爬虫验证），并根据搜索关键词分类

环境准备

博主python为3.8，应该3.x的都没问题
下载selenium：

pip install selenium

也可以使用清华镜像下载

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple selenium

下载浏览器的驱动包，博主使用的是Chrome，下载前，请查看自己的浏览器版本：
驱动镜像–链接，查看版本号，在地址栏输入Chrome://version

在链接中下载自己对应的驱动，如果没有自己的版本号，就试试相近的版本号，将exe文件移动到你的python目录下（其实是因为要配置环境变量，python配置过路径了，移动到它下面就不用在配置啦，你要是python路径也没有配置，就自己手动配置环境变量哦）：

此时，试试运行python代码：

from selenium import webdriver

driver = webdriver.Chrome()  # 创建driver对象

driver.get('https://www.taobao.com')  # 请求淘宝

弹出淘宝窗口，没有报错，说明可以开始愉快的爬虫啦！

爬虫的准备：

from selenium import webdriver
# 用于延迟等待
import time
# 正则
import re
import requests
import csv

我将各种解释，注释到代码中了，我就不过多解释了，看代码吧。

if __name__ == "__main__":
    driver = webdriver.Chrome()  # 创建driver对象
    #最大化窗口（我试过最大化方便扫码，但是好像会被淘宝识别出机器人，所以我后面换了种方法）
    # driver.maximize_window()  
    # 所有的数据将保存到datas中
    datas = []
    # 查找的关键词集合
    searchs = {'java语言','python','c++','安卓开发','JavaScript','html5','vue','人工智能与机器学习','数据结构','node.js','linux','计算机组成原理','汇编原理','swift语言','go语言'}
    # 扫码登录函数
    login()
    # 查找所有商品信息
    to_searchs(searchs)
    # 保存数据和图片
    save_data(datas)

各函数

1.login（）

扫码登录

def login():
    # 请求淘宝
    driver.get('https://www.taobao.com')  
    # 输入查询内容
    driver.find_element_by_xpath('//*[@id="q"]').send_keys('java')
    # 获取到搜索按钮后，点击
    driver.find_element_by_xpath(
        '//*[@id="J_TSearchForm"]/div[1]/button').click()
    # 改变窗口宽度,不要最大化，会被反爬虫检测到
    driver.set_window_size(1300, 800)
    # 点击二维码扫描
    driver.find_element_by_xpath('//*[@id="login"]/div[1]/i').click()
    # 等待扫描二维码，时间短了就改一改
    time.sleep(10)

2.drop_scroll()

拉动侧边滑动条，使页面数据加载完全

def drop_scroll():
    for x in range(1, 11, 2):
        # 停一下，慢慢拉，拉快了会出问题哦
        time.sleep(0.5)
        # 代表滑动条位置
        j = x/10
        js = 'document.documentElement.scrollTop = document.documentElement.scrollHeight * %f' % j
        # 运行上面的js代码
        driver.execute_script(js)

3.get_gooods（）

获取商品信息

def get_gooods(serach):
    # 获取分页面总数，由于自己的需求，没有翻页，翻页需要的最大值
    # 这里提醒大家，如果自己要翻页，请不要点击下一页按钮，也会被检测出来，（可观察后，改变地址栏）
    # token = driver.find_element_by_xpath('//*[@id="mainsrp-pager"]/div/div/div/div[1]').text
    # print(token)


    # 序号
    xh = 0
    # 分析淘宝页面后，获取商品div里面的数据
    divs = driver.find_elements_by_xpath(
        '//div[@class="items"]/div[@class="item J_MouserOnverReq  "]')
    # 遍历每个divs，获取商品详细信息
    for div in divs:
        # print(search)
        xh += 1
        # 获取图片地址
        img = div.find_element_by_xpath(
            './/div[@class="pic"]/a/img').get_attribute('data-src')
        # 拼接全地址，用于下载
        src_path = "https:"+img
        # 请求图片地址，并进行下载，重命名，格式为：分类_序号，没有img文件夹请自己新建
        open("./img/{}_{}.jpg".format(serach,xh), mode="wb").write(requests.get(src_path).content)
        # 获取标题
        title = div.find_element_by_css_selector('div.row.row-2.title').text
        # 获取价格
        price = div.find_element_by_xpath(
            './/div[@class="price g_price g_price-highlight"]/strong').text+'元'
        # 付款人数（销售数）
        fukuan = div.find_element_by_xpath('.//div[@class="deal-cnt"]').text
        # 一条数据
        product = {'分类': serach, '序号': xh, '标题': title,
                   'imgurl': img, '价格': price, '销售数': fukuan}
        print(product)
        # 向数组添加一条数据
        datas.append(product)

4.to_searchs（）

根据自己的关键词开始遍历每个关键词

def to_searchs(serachs):
    for serach in serachs:
        print(serach)
        # 获取文本框
        serachInput = driver.find_element_by_xpath('//*[@id="q"]')
        # 清空文本框
        serachInput.clear()
        # 输入查询内容
        serachInput.send_keys(serach)
        # 点击搜索按钮
        driver.find_element_by_xpath('//*[@id="J_SearchForm"]/button').click()
        # 拉动侧边滑动条，使页面数据加载完全
        drop_scroll()
        # 获取商品信息
        get_gooods(serach)

5.save_data（）

保存数据

def save_data(datas):
    # csv文件表头
    header = ['分类', '序号', '标题', 'imgurl', '价格', '销售数']
    with open('test1.csv', 'a', newline='') as f:
        # 提前预览列名，当下面代码写入数据时，会将其一一对应。
        writer = csv.DictWriter(f, fieldnames=header)
        # 写入列名（表头）
        writer.writeheader() 
        # 写入数据
        writer.writerows(datas)

完整代码和数据

请自行克隆代码哦，也有博主爬下来的一些数据，不需要数据，就copy那个py文件吧
gayhub地址：链接

来个一级标题，记得点个star

你可能感兴趣的:(杂学,小小技巧)

[杂学笔记] 封装、继承、多态，堆和栈的区别，堆和栈的区别，托管与非托管，c++的垃圾回收机制，实现一个单例模式注意事项 niu_sama 杂学笔记笔记 c++单例模式
文章目录1.封装、继承、多态2.堆和栈的区别3.指针和引用的区别4.托管与非托管5.c++的垃圾回收机制6.实现一个单例模式注意事项1.封装、继承、多态封装就是将数据和内部的方法封装到一个类中，对外隐藏内部实现细节，但是留下了公共接口提供给外部使用。继承：子类继承父类的属性和方法，并对其进行延申，使用代码复用和功能扩展。多态：不同的对象在使用同一个函数或者在同一个环境下有不同的行为。关于多态多态就
[杂学笔记]继承的应用场景、如何避免内存泄漏、函数模板的理解、多线程的应用场景、DNS解析的过程北顾南栀倾寒笔记笔记
目录1.继承的应用场景2.如何避免内存泄漏3.函数模板的理解4.多线程的应用场景5.DNS解析的过程1.继承的应用场景代码复用、实现多态、扩展现有的功能、构建层次结构。例如一个图形库，他可以创建一个基类，将图形公共的参数和方法放在基类内部实现，然后对各个图形创建子类，再子类中实现各个图形的个性化方法。2.如何避免内存泄漏手动管理内存：确保new和delete配对使用，在确保不在使用一块内存空间的时
[杂学笔记]STL容器的迭代器、CMake与Makefile、完美转发、NULL与nullptr的区别、GDB调式命令、平衡树与红黑树北顾南栀倾寒笔记 c++开发语言
目录1.STL容器的迭代器2.CMake与Makefile3.完美转发4.NULL与nullptr的区别5.GDB调式命令6.平衡树与红黑树1.STL容器的迭代器InputIterator输入迭代器、OutputIterator输出迭代器与ForwardIterator前向迭代器：只支持向前迭代的操作（++）BidirectionalIterator双向迭代器：支持++与--的操作RandomIt
数据可视化需要有什么技术支持 yoggie尤信息可视化
在这个信息爆炸的时代，数据无处不在，从个人健康追踪到企业运营决策，数据成为了我们生活中不可或缺的一部分。然而，原始数据本身往往是枯燥且难以理解的，这就需要一种方法将这些数据转化为易于理解和解释的形式——这就是数据可视化的作用。数据可视化不仅仅是将数据转换成图表那么简单，它是一门综合了计算机科学、统计学、心理学等多个领域的复杂学科。那么，要实现高效、准确的数据可视化，究竟需要哪些技术支持呢？本文将带
[杂学笔记]面向对象特性、右值引用与移动语义、push_back与emplace_back的区别、读写锁与智能指针对锁的管理、访问网站的全过程北顾南栀倾寒笔记网络 c++stl
1.面向对象特性面向对象的三大特性分别是封装、继承与多态，这三个特性的前提就是C++引入了类与对象的概念。封装指的就是将数据和函数方法进行包裹起来，对外部隐藏类对象的实现细节，只提供一些公共接口来和对象进行交互。好处在于将数据私有化，防止外部代码随意的访问和修改数据。继承是指一个类可以继承另一个类的属性和方法内容，并且可以再此基础之上添加新的属性和方法，或者重定义父类的属性和方法。继承可以实现代码
前端杂学录（七）真的不想学习啦前端前端 html5 javascript css
1.响应式布局方案1.媒体查询特点媒体查询是CSS的一部分，可以根据设备的特性（如宽度、高度、分辨率等）应用不同的样式。示例body{font-size:16px;}@media(max-width:768px){body{font-size:14px;}}@media(max-width:480px){body{font-size:12px;}}2.弹性布局（Flexbox）特点Flexbox是
[杂学笔记]OSI七层模型作用、HTTP协议中的各种方法、HTTP的头部字段、TLS握手、指针与引用的使用场景、零拷贝技术北顾南栀倾寒笔记服务器网络 c++开发语言 http 网络协议
1.OSI七层模型作用物理层：负责光电信号的传输，以及将光电信号转化为二进制数据数据链路层：主要负责将收到的二进制数据进一步的封装为数据帧报文。同时因为数据在网络中传递的时候，每一个主机都能够收到报文数据，该层的MAC地址就阻止了并非传递给本主机的数据进一步向上交付。网络层：主要负责地址管理和路由选择，通过IP地址和内部维护的路由表，可以将数据传输到指定的目标主机上。一个报文在网络中并非是直达目标
[杂学笔记]TCP和UDP的区别、异步I/O与I/O多路复用区别、事物的隔离级别、指针和引用的区别、继承体系下析构函数必须是虚函数、map与哈希map的区别北顾南栀倾寒笔记 tcp/ip udp c++开发语言 sql 哈希算法
目录1.TCP和UDP的区别2.异步I/O与I/O多路复用区别3.事务的隔离级别4.指针和引用的区别5.继承体系下，析构函数必须是虚函数6.map与哈希map的区别1.TCP和UDP的区别连接方面：TCP是面向连接的，在通信之前需要进行三次挥手，结束通信需要进行四次挥手。而UDP是不需要的，像寄信一样，只需要地址就可以了，不需要提前建立连接通路。可靠性方面：TCP是可靠传输协议，他通过序号、确认序
[杂学笔记]STL容器简单介绍、高并发原理、数据库索引北顾南栀倾寒笔记 c++开发语言 sql mysql 数据库
目录1.STL容器简单介绍2.高并发实现原理3.MySQL数据库索引介绍底层原理注意事项1.STL容器简单介绍vector容器vector容器底层管理了一个动态开辟的空间，有三个指针start、finish以及end_of_storage费别指向开头，存储数据的结尾以及开辟的动态内存空间的结尾处。该容器可以自动的管理内存空间，当内存不足的时候，会自动的申请更大的空间，然后将数据拷贝到新的空间，并释
[杂学笔记]TCP的三次握手与四次挥手、SYN洪水、TCP可靠性传输的体现、如何解决死锁问题、数组和队列的区别与优势、进程间通信的方式、为什么视频音频适合用UDP协议北顾南栀倾寒笔记 tcp/ip 网络开发语言音视频
目录1.TCP的三次握手与四次挥手三次握手四次挥手2.SYN洪水3.TCP可靠性传输的体现4.如何解决死锁5.数组和队列的区别与优势6.进程间通信的方式7.视频音频适用于UDP协议1.TCP的三次握手与四次挥手三次握手客户端会先发送SYN请求与服务端建立连接，服务端收到之后，会发送SYN+ACK响应报文，告诉客户端我可以和你建立连接，之后客户端就单方面建立了连接，之后发送ACK响应告诉服务端我收到
学习在VS中查看对象,类和类图游戏开发程序员
洗脑价值观by杂学的程序员工欲善其事必先利其器编辑器要玩熟练.ctrl+alt+J三个按键一起按就能召唤对象浏览器这个神器了.通过在这里,可以查看每个名称空间以及每个类的公平函数声明.比如图片中就是Array类的查看,可在右侧查看它的public函数.我们在类试图中也可以查看类的一些情况,图片中查看MyClss类,下部分就是此类的属性和函数.另外还有一个好的查看类关系的方法,就是查看类图,在项目上
成功日记——2019.01.31 Mikasa0
今天好困困，偷懒，不更……关于理财打开国信今天一片红啊，虽然还只是一知半解，但这红色却很喜人很应景！据说春节是A股一路上扬的佳节，期待应验。啥时候开始学保险啊，我真不敢给自己写下明天这两个字。毕竟现在年底，工作聚堆儿、俩娃放假在家、家事春节化，真真觉得挤不出时间啊！要不等过了春节吧，羞羞中……晨读笔记（保险）——《》午间加餐（杂学）——《》关于健身每周两次私教：周三→三点半到家，四点到健身房，六点
【我的杂七杂八】重来_xz
可能你和我一样，也是一位涉猎广而不精的「杂学家」。摄影、绘画、书法、写作，种种美好而有趣的事情，我都愿意去触碰、去探索。但是很显然，透彻地精通哪个技能，这太难了。时间有限，精力有限，尤其是，我也很难找到自己「真正热爱的事」。就算被斥责为「三分钟热度」又能怎么样呢？喜欢，就算不能带来任何实惠也乐此不疲；不喜欢，也不必为了“持之以恒”的美名而勉强。就算还没有遇到自己的一生所爱，然而，正是在寻找它们的过
学习C#中的结构类型杂学的程序员
洗脑价值观by杂学的程序员学结构类型的时候,举例子最多的地方就是设计一个数据结构,包含学生的学号,姓名,性别,年龄.....今天我们来学习下比简单类型复杂一点点的结构类型:他复杂的地方就是由几个数据组成的数据结构,这些类型可以是不同的类型.见图:我们来看看怎么使用它.只是多了一个前缀和".".myStruct.DayNum.后面我们学习类的时候,就会发现,其实类就是结构体的升级版本,或者说进化后的
水低为海，人低为王 7fa576dd0b66
有这样一幅对联，写得十分有趣，可以说是道出了低调做人的真谛。上联是：做杂事兼杂学当杂家杂七杂八尤有趣，下联是：先爬行后爬坡再爬山爬来爬去终登顶，横批是：低调做人。古人讲：“木秀于林，风必摧之；行高于人，众必非之。”为人处事，不能狂妄自大。因为，天狂有雨，人狂有祸。《菜根谭》中有这么一句话：“鹰立如睡，虎行似病，正是他攫人噬人手段处。故君子要聪明不露，才华不逞，才有肩鸿任钜的力量。”在猎食前，苍鹰总
吕慧君（信阳）网络初级11期第131天分享北方人_4bf2
爱孩子这个人从国庆节到今天自己憋了快半个月吧，最后的结果是，我可以试着越来越多的爱孩子这个人，不过多的掺杂学习成绩好坏的因素在里面。排名下降一点就下降点呗，至少孩子还在上学呀；烦燥多一些也没有关系，让他释放出来会不会就好一些呢；焦虑多了一些，那就陪伴他多一些，让他有一点点安全感是不是好些呢；“妈妈，看到同桌得了两个奖状，心中不是滋味”，“儿子，妈妈相信你也可以做到的”；“妈妈，后面的人总是说话，让
学习C#中的is as 杂学的程序员
洗脑价值观by杂学的程序员强制类型转换,如果成功,你就开心了,如果失败,你就得到了一个异常或BUG.请做好判断和保护.c#中is关键字与as关键字的区别与使用is关键字是判断类型，用于检查对象是否与给定类型兼容，不成功则不会抛出异常，如果兼容则返回true如果不兼容则返回false。as关键字是转换，可以将对象转换为指定类型，与is不同，转换成功将会返回转换后的对象，不成功则不会抛出异常而是返回n
学习C#中的字符串string 杂学的程序员
洗脑价值观by杂学的程序员人类有了文字,就可以记录下来历史了,而计算机有了字符串,黑客们的历史也就开始了.C#定义了一个基本的类string，专门用于对字符串的操作。记住,它是引用类型.这个类也是在名字空间System中定义的，是类System.String的别名。字符串应用非常广泛，常用的见下:后面学习更多的是代码+注释的方式,大家在学习方法上多跟着写写,调试输出看看.另外也注意积累英语单词,特
学习C#中的类型转换杂学的程序员
洗脑价值观by杂学的程序员如果你敲了代码,你就会明白其中的奥秘.我们在编写代码的时候,常常需要转换数据的类型.今天我们来看看类型转换的方式:C#中的类型转换有两种方式:(byte)表示使用的是显式强制转换。是明确要求编译器把数值从一个类型转到另一个类型.当我们从char到ushort，int到long,float,double可以使用隐式转换，直接用赋值即可,编译器会自动转换.但是当我们从doub
《论语》自注032：为政篇2.16子曰：“攻乎异端，斯害也已。” 喜欢论语的物理老师
2.16子曰：“攻乎异端，斯害也已。”这是一段注释起来争议颇多的话。都能自圆其说，各说各有理。大体有这样几种理解：1.孔子说：“做事情过或不及，都是祸害啊！”①攻：做。异端：中庸的两端，指“过”和'，不及”。②斯：连词，这就、那就的意思。也已：语气词。2.孔子说：“批判攻击那些不正确的议论，祸害就可以消灭了。”3.孔子说：“专向反对的一端用力，那就有害了。”4.孔子说：“专力攻治杂学技艺，这是有害
日精进第三天王珏_100e
敬爱的王院长，智慧的高管们，勤奋的家人们，大家晚上好，我是视光中心执行部王珏，今天是2018年8月15日，是我日精进第3天，跟大家分享我今天的感悟和成长，每天进步一点点，距离成功便不远！1比学习:学习是实现跃迁的重要途径，人生的重大转折点必定来自学习，我们想要跑得快，必须学杂学通，让自己成为一本行走的百科全书，可以随时传播知识，学习的意义大抵如此！2比改变:成功不是追求得来的，而是被改变后的自己主
Vue基础篇-计算&监听属性 Yin.云端 Vue vue 前端 mvvm
1.计算属性（a）关键词：cumputed{{strRender}}newVue({el:"#app",data:{str:"12345"},computed:{strRender(){this.str="54321"}}})（b）诞生原因模板中放入太多的逻辑会让模板过重且难以维护，为了使得计算清晰明了，计算属性就诞生了（c）小小技巧1.依赖其他计算属性（计算属性函数相互间使用）；2.vue实例间
探索学习中的道 wyssailing
老子道德经中说“道可道非常道，名可名非常名“”。那么学习中的道与法怎么解释呢？学而不精，杂学无数，似乎都是失败的教训。但大道至简，万物又皆相通。达芬奇是个全才，在各行各业都有建树。金庸小说中的杨过，杂学无数，最后万法汇于一炉，又成为了绝世高手。这些又都是成功典范。荀子说：“悟道”。是说要以悟道的方式来观察学习天地万物，那么万物都可学习。这个“道”作何解释呢？这里想到一些办法，做一些尝试，（尝试中，
启闲云困兽
算起岁数也算是一个产品老兵了，一直都在学习的路上，偶尔也会跟别人分享一下，突然间觉得要把自己的这些感悟记下来，不见得是真知灼见，也算是抛砖引玉的砖了。到了不惑的年纪，学习已经没有很强的功利心了，按照自己感兴趣的去学，去了解向往的世界，了解伟人的思想。在这其中反而跟自己的职业产生了关联，原来产品本就不是一门学科，所以生出了编写产品杂学的想法，不为分享一些知识和方法，只是分享一种从各种角度看产品的思维
杂学第十五篇：运维人常用linux命令（文件操作、k8s操作、日志查找操作等），动态更新踩坑又填坑杂学 linux 运维 kubernetes
导语作为程序员，一个后端程序员，总是避免不了要亲自上前线进行linux运维工作，那么一些必备的运维命令必须熟练掌握。以下为我在工作中经常使用的运维命令，希望对你有帮助查找命令搜索指定路径下的名字包含指定字符的指定文件-【find】注意：可以使用通配符，例如【"test*"】，指将目录名字包含test的文件。【"test?"】，指将目录名字包含test开头的文件。更详细的用法可以搜索。find指定路
12月22日周五早读分享杜冰倩的秘密
图片发自App0、今天是2017年12月22日，阴历十一月初五，星期五，京津今日限号5和0。天津天气：晴转多云，温度-3到8度，西南风3-4级。空气质量：中度污染。如下早读分享来自于「杂学杂问」（ID:zaxue8）1、环保部发布11月全国城市空气质量状况，较差的后10位城市依次是：太原、西安、邯郸、邢台、兰州、石家庄、保定、徐州、郑州和哈尔滨。较好的前10位城市是：舟山、海口、拉萨、厦门、福州、
Python爬虫原理解析 M小白是小白技术杂谈 python 爬虫 python爬虫
笔者公众号：技术杂学铺笔者网站：mwhitelab.com本文将从何为爬虫、网页结构、python代码实现等方面逐步解析网络爬虫。1.何为爬虫如今互联网上存储着大量的信息。作为普通网民，我们常常使用浏览器来访问互联网上的内容。但若是想要批量下载散布在互联网上的某一方面的信息（如某网站的所有图片，某新闻网站的所有新闻，又或者豆瓣上所有电影的评分），人为的使用浏览器挨个打开网站搜查则过于费时费力。人为
陆奇演讲-新范式、新时代、新机会愚昧之山绝望之谷开悟之坡笔记 AIGC 人工智能机器学习 python
新范式两个维度思考方式变了执行体系变了变革比较深，比较广，从三个维度分享产业发展的范式维度内在的结构性的体系是三位一体非常稳定的体系结构，源自于复杂学，是复杂体系稳定的结构每个人、每个组织、每个公司、一个社会、数字化产业，都是复杂体系系统构成分析信息子系统从环境当中获取信息成本结构性的变革会催生巨大的变化信息的获取成本从边际走向固定是核心原因代表公司IBM苹果模型子系统：知识针对所要达到的目的，把
孤独一旦开始就在难回头鬼纹
花了一年时间把自己从一个群居动物变成一个独居动物。这事一开始本是无意的随性而活，只是今天偶然回收发现自己已经变的只剩一个人了。回忆过往的经历，从精子到大学毕业，一直生活在人群中，最初的亲戚，到后来的同学，再到工作的伙伴。这些关系也就是主流的社会关系了，无论是古今还是中西。只是去年，我的世界变了，个那些熟人的话越聊越少，越来越喜欢一个人思考，一个人生活。有段时间我嘲笑自己，从小到大学了一堆的杂学，难
Python杂学--一文搞懂赋值、浅拷贝、深拷贝 z卡布达 Python学习 python
1.赋值（=）赋值其实就是对对象的直接引用。例子如下：由下方代码可知：把lz1赋值给lz2，lz1和lz2的地址(id)是相同的，向lz1添加一个元素，lz2的元素同步的也会发生修改。lz1=[1,2,3,4]lz2=lz1print(id(lz1))#输出：140608361616648print(id(lz2))#输出：140608361616648lz1.append(5)print(lz1
书其实只有三类西蜀石兰类
一个人一辈子其实只读三种书，知识类、技能类、修心类。知识类的书可以让我们活得更明白。类似十万个为什么这种书籍，我一直不太乐意去读，因为单纯的知识是没法做事的，就像知道地球转速是多少一样（我肯定不知道），这种所谓的知识，除非用到，普通人掌握了完全是一种负担，维基百科能找到的东西，为什么去记忆？知识类的书，每个方面都涉及些，让自己显得不那么没文化，仅此而已。社会认为的学识渊博，肯定不是站在
《TCP/IP 详解，卷1：协议》学习笔记、吐槽及其他 bylijinnan tcp
《TCP/IP 详解，卷1：协议》是经典，但不适合初学者。它更像是一本字典，适合学过网络的人温习和查阅一些记不清的概念。这本书，我看的版本是机械工业出版社、范建华等译的。这本书在我看来，翻译得一般，甚至有明显的错误。如果英文熟练，看原版更好： http://pcvr.nl/tcpip/ 下面是我的一些笔记，包括我看书时有疑问的地方，也有对该书的吐槽，有不对的地方请指正： 1.
Linux—— 静态IP跟动态IP设置 eksliang linux IP
一.在终端输入 vi /etc/sysconfig/network-scripts/ifcfg-eth0 静态ip模板如下： DEVICE="eth0" #网卡名称 BOOTPROTO="static" #静态IP（必须） HWADDR="00:0C:29:B5:65:CA" #网卡mac地址 IPV6INIT=&q
Informatica update strategy transformation 18289753290
更新策略组件：标记你的数据进入target里面做什么操作，一般会和lookup配合使用，有时候用0,1,1代表 forward rejected rows被选中，rejected row是输出在错误文件里，不想看到reject输出，将错误输出到文件，因为有时候数据库原因导致某些column不能update，reject就会output到错误文件里面供查看，在workflow的
使用Scrapy时出现虽然队列里有很多Request但是却不下载，造成假死状态酷的飞上天空 request
现象就是：程序运行一段时间，可能是几十分钟或者几个小时，然后后台日志里面就不出现下载页面的信息，一直显示上一分钟抓取了0个网页的信息。刚开始已经猜到是某些下载线程没有正常执行回调方法引起程序一直以为线程还未下载完成，但是水平有限研究源码未果。经过不停的google终于发现一个有价值的信息，是给twisted提出的一个bugfix 连接地址如下http://twistedmatrix.
利用预测分析技术来进行辅助医疗蓝儿唯美医疗
2014年，克利夫兰诊所（Cleveland Clinic）想要更有效地控制其手术中心做膝关节置换手术的费用。整个系统每年大约进行2600例此类手术，所以，即使降低很少一部分成本，都可以为诊所和病人节约大量的资金。为了找到适合的解决方案，供应商将视野投向了预测分析技术和工具，但其分析团队还必须花时间向医生解释基于数据的治疗方案意味着什么。克利夫兰诊所负责企业信息管理和分析的医疗
java 线程(一)：基础篇 DavidIsOK java 多线程线程
&nbs
Tomcat服务器框架之Servlet开发分析 aijuans servlet
最近使用Tomcat做web服务器，使用Servlet技术做开发时，对Tomcat的框架的简易分析：疑问：为什么我们在继承HttpServlet类之后，覆盖doGet(HttpServletRequest req, HttpServetResponse rep)方法后，该方法会自动被Tomcat服务器调用，doGet方法的参数有谁传递过来？怎样传递？分析之我见： doGet方法的
揭秘玖富的粉丝营销之谜与小米粉丝社区类似 aoyouzi 揭秘玖富的粉丝营销之谜
玖富旗下悟空理财凭借着一个微信公众号上线当天成交量即破百万，第七天成交量单日破了1000万;第23天时，累计成交量超1个亿……至今成立不到10个月，粉丝已经超过500万，月交易额突破10亿，而玖富平台目前的总用户数也已经超过了1800万，位居P2P平台第一位。很多互联网金融创业者慕名前来学习效仿，但是却鲜有成功者，玖富的粉丝营销对外至今仍然是个谜。　　近日，一直坚持微信粉丝营销
Java web的会话跟踪技术百合不是茶 url会话 Cookie会话 Seession会话 Java Web 隐藏域会话
会话跟踪主要是用在用户页面点击不同的页面时,需要用到的技术点会话:多次请求与响应的过程 1,url地址传递参数,实现页面跟踪技术格式:传一个参数的 url?名=值传两个参数的 url?名=值 &名=值关键代码
web.xml之Servlet配置 bijian1013 java web.xml Servlet配置
定义： <servlet> <servlet-name>myservlet</servlet-name> <servlet-class>com.myapp.controller.MyFirstServlet</servlet-class> <init-param> <param-name>
利用svnsync实现SVN同步备份 sunjing SVN 同步 E000022 svnsync 镜像
1. 在备份SVN服务器上建立版本库 svnadmin create test 2. 创建pre-revprop-change文件 cd test/hooks/ cp pre-revprop-change.tmpl pre-revprop-change 3. 修改pre-revprop-
【分布式数据一致性三】MongoDB读写一致性 bit1129 mongodb
本系列文章结合MongoDB，探讨分布式数据库的数据一致性，这个系列文章包括：数据一致性概述与CAP 最终一致性(Eventually Consistency) 网络分裂(Network Partition)问题多数据中心(Multi Data Center) 多个写者(Multi Writer)最终一致性一致性图表(Consistency Chart) 数据
Anychart图表组件-Flash图转IMG普通图的方法白糖_ Flash
问题背景：项目使用的是Anychart图表组件，渲染出来的图是Flash的，往往一个页面有时候会有多个flash图，而需求是让我们做一个打印预览和打印功能，让多个Flash图在一个页面上打印出来。那么我们打印预览的思路是获取页面的body元素，然后在打印预览界面通过$("body").append(html)的形式显示预览效果，结果让人大跌眼镜：Flash是
Window 80端口被占用 WHY? bozch 端口占用 window
平时在启动一些可能使用80端口软件的时候，会提示80端口已经被其他软件占用，那一般又会有那些软件占用这些端口呢？下面坐下总结： 1、web服务器是最经常见的占用80端口的，例如：tomcat , apache , IIS , Php等等； 2
编程之美-数组的最大值和最小值-分治法（两种形式） bylijinnan 编程之美
import java.util.Arrays; public class MinMaxInArray { /** * 编程之美数组的最大值和最小值分治法 * 两种形式 */ public static void main(String[] args) { int[] t={11,23,34,4,6,7,8,1,2,23}; int[]
Perl正则表达式 chenbowen00 正则表达式 perl
首先我们应该知道 Perl 程序中，正则表达式有三种存在形式，他们分别是：匹配：m/<regexp>;/ （还可以简写为 /<regexp>;/ ，略去 m）替换：s/<pattern>;/<replacement>;/ 转化：tr/<pattern>;/<replacemnt>;
[宇宙与天文]行星议会是否具有本行星大气层以外的权力呢? comsci
举个例子: 地球,地球上由200多个国家选举出一个代表地球联合体的议会,那么现在地球联合体遇到一个问题,地球这颗星球上面的矿产资源快要采掘完了....那么地球议会全体投票,一致通过一项带有法律性质的议案,既批准地球上的国家用各种技术手段在地球以外开采矿产资源和其它资源........ &
Oracle Profile 使用详解 daizj oracle profile 资源限制
Oracle Profile 使用详解转一、目的： Oracle系统中的profile可以用来对用户所能使用的数据库资源进行限制，使用Create Profile命令创建一个Profile，用它来实现对数据库资源的限制使用，如果把该profile分配给用户，则该用户所能使用的数据库资源都在该profile的限制之内。二、条件：创建profile必须要有CREATE PROFIL
How HipChat Stores And Indexes Billions Of Messages Using ElasticSearch & Redis dengkane elasticsearch Lucene
This article is from an interview with Zuhaib Siddique, a production engineer at HipChat, makers of group chat and IM for teams. HipChat started in an unusual space, one you might not
循环小示例，菲波拉契序列，循环解一元二次方程以及switch示例程序 dcj3sjt126com c 算法
# include <stdio.h> int main(void) { int n; int i; int f1, f2, f3; f1 = 1; f2 = 1; printf("请输入您需要求的想的序列："); scanf("%d", &n); for (i=3; i<n; i
macbook的lamp环境 dcj3sjt126com lamp
sudo vim /etc/apache2/httpd.conf /Library/WebServer/Documents 是默认的网站根目录重启Mac上的Apache服务这个命令很早以前就查过了，但是每次使用的时候还是要在网上查：停止服务：sudo /usr/sbin/apachectl stop 开启服务：s
java ArrayList源码下 shuizhaosi888 ArrayList源码
版本 jdk-7u71-windows-x64 JavaSE7 ArrayList源码上：http://flyouwith.iteye.com/blog/2166890 /** * 从这个列表中移除所有c中包含元素 */ public boolean removeAll(Collection<?> c) {
Spring Security（08）——intercept-url配置 234390216 Spring Security intercept-url 访问权限访问协议请求方法
intercept-url配置目录 1.1 指定拦截的url 1.2 指定访问权限 1.3 指定访问协议 1.4 指定请求方法 1.1 &n
Linux环境下的oracle安装 jayung oracle
linux系统下的oracle安装本文档是Linux(redhat6.x、centos6.x、redhat7.x) 64位操作系统安装Oracle 11g(Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production)，本文基于各种网络资料精心整理而成，共享给有需要的朋友。如有问题可联系：QQ：52-7
hotspot虚拟机 leichenlei java HotSpot jvm 虚拟机文档
JVM参数 http://docs.oracle.com/javase/6/docs/technotes/guides/vm/index.html JVM工具 http://docs.oracle.com/javase/6/docs/technotes/tools/index.html JVM垃圾回收 http://www.oracle.com
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” noaighost Web node.js
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” 眼里的Node.JS 初初接触node是一年前的事，那时候年少不更事。还在纠结什么语言可以编写出牛逼的程序，想必每个码农都会经历这个月经性的问题：微信用什么语言写的？facebook为什么推荐系统这么智能，用什么语言写的？dota2的外挂这么牛逼，用什么语言写的？……用什么语言写这句话，困扰人也是阻碍
快速开发Android应用 rensanning android
Android应用开发过程中，经常会遇到很多常见的类似问题，解决这些问题需要花时间，其实很多问题已经有了成熟的解决方案，比如很多第三方的开源lib，参考 Android Libraries 和 Android UI/UX Libraries。编码越少，Bug越少，效率自然会高。但可能由于根本没听说过、听说过但没用过、特殊原因不能用、自己已经有了解决方案等等原因，这些成熟的解决
理解Java中的弱引用 tomcat_oracle java 工作面试
　不久之前，我面试了一些求职Java高级开发工程师的应聘者。我常常会面试他们说，“你能给我介绍一些Java中得弱引用吗？”，如果面试者这样说，“嗯，是不是垃圾回收有关的？”，我就会基本满意了，我并不期待回答是一篇诘究本末的论文描述。　　然而事与愿违，我很吃惊的发现，在将近20多个有着平均5年开发经验和高学历背景的应聘者中，居然只有两个人知道弱引用的存在，但是在这两个人之中只有一个人真正了
标签输出html标签" target="_blank">关于标签输出html标签 xshdch jsp
http://back-888888.iteye.com/blog/1181202 关于<c:out value=""/>标签的使用，其中有一个属性是escapeXml默认是true(将html标签当做转移字符，直接显示不在浏览器上面进行解析)，当设置escapeXml属性值为false的时候就是不过滤xml，这样就能在浏览器上解析html标签， &nb

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他