GunnerXiang

python多线程爬取某网站全部H漫画

python多线程爬取某网站全部H漫画

首发于个人博客(客官大人来这里看啊!)：www.gunnerx.vip

前言

最近学习python多线程与爬虫相关知识，想试着练练手。正好想到常逛的一个正(瑟)经(琴)漫画的网站，决定想办法把上面全部漫画都爬下来，~~以便✋~~ 。

声明

事先声明，我只是个刚学爬虫不久的菜鸡，所以代码应该有很多有问题，和可以改进的地方，希望大家轻喷但是多多评论帮我指出问题

分析

要写爬虫首先当然是要分析网页喽。谷歌chrome和火狐firefox都能打开开发者工具分析，不过因为火狐的是中文界面，所以就选择fx。

打开网站,https://www.xxxxx.com (网址打码!)

由于过于瑟琴，这里就不放图了。

分析一番，发现比如一本h漫画叫a，那它的url就是https://www.xxxxx.com/中文h漫/a/1，它每一页的url，比如第3页，就是https://www.xxxxx.com/中文h漫/a/1/page/3。对每一页所在的页面分析，发现漫画的每一页的图片的真实url就在页面html的一个img标签中，如图

如图的img标签中的src属性便是图片的真实url，只要请求这个url便可卸载此张图片。

因为每一本漫画的所有页url都是按规律的，所以只要得到每本漫画的总页数便可构造他全部页的url，进而得到每一个图片的真实url，进行下载。

分析发现，漫画的每一个页面中都有一个快速选择页数的小控件，如图

分析html页面找到其对应的标签:

因此，只要找到这个标签便可解析得到总页数。

以上是针对如何爬取一本漫画的所有图片，若要爬取所有页面，只需先写一个爬虫把所有网站上所有h漫画的名字爬下保存下来，即可构建url。

综上，大致思路如下:

1.首先请求页面 https://www.xxxxx.com想办法爬取所有的漫画名字列表names(一共32页382本漫画)

2.对每一个漫画名字name的某一页p可构建出url：https://www.xxxxx.com/中字h漫/name/1/page/p

3.请求此页面并解析此页面，找到此页漫画图片的真实url地址jpg_url

3.请求jpg_url,以二进制形式下载图片并保存至本地

技术选型

技术选型方面，考虑使用requests库来构建http请求；引入concurrent.future库，维护一个线程池来实现多线程爬虫；html页面解析选用beautifulsoup库来处理;另外因为爬取时间较长所以可以引入smptlib,email来实现爬取完毕后自动发送邮件。

源码

一共三个脚本，第一个名字爬虫实现爬取网站上所有漫画的名字存入一个txt文档中以供图片爬虫调用，第二个图片爬虫脚本，第三个为实现发送邮件的脚本

get_names.py

# get_name.py
# 爬取主页所有漫画名字存入names.txt

import os
import time
from concurrent import futures

import requests
from bs4 import BeautifulSoup

# 请求一个url的函数，若请求失败，过2s重试，最多重试10次
def req_url(url):
    attempts = 0
    success = False
    while attempts < 10 and not success:
        try:
            r = requests.get(url=url, headers=headers)
            r.keep_alive = False
            success = True
            r.raise_for_status()
            return r
        except requests.exceptions.HTTPError:
            print('状态码非200!')
            return None
        except Exception:   # 若请求失败，过2s重试，最多重试10次
            time.sleep(2)
            attempts += 1
            print('****第{}次重连{}****'.format(attempts, url))
            if attempts == 10:
                print('连接失败! {}'.format(url))
                return None

# 取得一个页面内的所有漫画名并写入文件保存
def get_name(url):
    html = BeautifulSoup(req_url(url).text, 'lxml')
    for h5 in html.find_all('h5')[1:]:
        name = h5.a.get_text()
        print(name)
        with open('names.txt', 'a') as f:
            f.write(name)
            f.write('\n')

if __name__ == '__main__':
    # 设置最大重新连接次数
    requests.adapters.DEFAULT_RETRIES = 5
    # 域名
    top_url = 'https://www.xxxxx.com'	# 打码
    # 请求url列表
    urls = ['{}/page/{}'.format(top_url, i) for i in range(1, 33)]
    # 请求头
    headers = {
        'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10.14; rv:68.0) Gecko/20100101 Firefox/68.0'
    }
    # 8线程同时爬取
    with futures.ThreadPoolExecutor(max_workers=8) as pool:
        tasks = [pool.submit(get_name, url) for url in urls]

get_jpgs.py

# get_jpgs.py
# 爬取names.txt中的漫画

import os
import time
from concurrent import futures

import requests
from bs4 import BeautifulSoup

from send_email import send


# 请求一个url的函数，若请求失败，过2s重试，最多重试10次
def req_url(url):
    attempts = 0
    success = False
    while attempts < 10 and not success:
        try:
            r = requests.get(url=url, headers=headers)
            r.keep_alive = False
            success = True
            r.raise_for_status()
            return r
        except requests.exceptions.HTTPError:
            print('状态码非200!')
            urls_not200.append(url)
            return None
        except Exception:   # 若请求失败，过2s重试，最多重试10次
            time.sleep(2)
            attempts += 1
            print('****第{}次重连{}****'.format(attempts, url))
            if attempts == 10:
                print('连接失败! {}'.format(url))
                urls_fails.append(url)
                return None

# 取得当前漫画总页数
def get_page(name):
    name_url = '{}/中字h漫/{}/1'.format(url, name)
    r = req_url(name_url)
    if r is not None:
        html = BeautifulSoup(r.text, 'lxml')    # 解析html页面以找到页数
        select = html.find('select', id='single-pager')
        pages = (len(select.contents) - 1) // 2
        return pages
    return None



# 请求图片真实url并保存在本地
def get_jpg(name):
    stime = time.time()
    os.mkdir('imgs/{}'.format(name))
    pages = get_page(name)      # 取得当前漫画总页数
    if pages is not None:
        print('{} 总页数: {}'.format(name[0:6], pages))

        for page in range(1,pages+1):       # 遍历全部页码
            page_url = '{}/中字h漫/{}/1/p/{}'.format(url, name, page)
            r = req_url(page_url)
            if r is not None:
                html = BeautifulSoup(r.text, 'lxml')
                img = html.find('img',id='image-{}'.format(page-1))     # 取得图片所在标签
                jpg_url = img.attrs['data-src']         # 取得图片真实地址
                r = req_url(jpg_url)
                if r is not None:
                    jpg = r.content          # 下载图片
                    with open('imgs/{}/{}.jpg'.format(name,page), "wb")as f:   # 存入本地
                        f.write(jpg)
                    print('{} {}.jpg 保存完成!'.format(name[0:6],page))

        etime = time.time()
        print('**** ****')
        print('{}  全部保存完成，耗时 {:.2f}s'.format(name, etime-stime))
        print('**** ****')
        return name
    return None

if __name__ == '__main__':
    start_time = time.time()
    # 设置最大连接数
    requests.adapters.DEFAULT_RETRIES = 5
    # 域名，请求头
    url = 'https://www.xxxxx.com'	# 打码
    headers = {
        'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10.14; rv:68.0) Gecko/20100101 Firefox/68.0'
    }
    urls_not200 = []  # 保存状态码非200的url
    urls_fails = []  # 保存请求失败的url

    # 打开爬好的漫画名字文件并构建列表names
    with open('names.txt', 'r') as f:
        names = [line.rstrip('\n') for line in f]
    os.mkdir('imgs')

    # 线程池
    with futures.ThreadPoolExecutor(max_workers=25) as pool:    # 线程池，最大25个线程
        tasks = [pool.submit(get_jpg, name) for name in names]
        for task in futures.as_completed(tasks):
            print('----线程结束!----')

    time_sec = time.time() - start_time
    time_min = time_sec / 60
    time_hou = time_min / 60
    print('全部完成, 耗时 {:.2f}s! 即{:.2f}分钟,即{:.2f}小时'.format(time_sec, time_min, time_hou))
    send()
    print('urls_not200共{}个'.format(len(urls_not200)))
    print('urls_not200: ',urls_not200)
    print('urls_fails共{}个'.format(len(urls_fails)))
    print('urls_fails: ',urls_fails)

send_email.py

此脚本大部分参考 https://blog.csdn.net/LeoPhilo/article/details/89074232

以QQ邮箱为例，因为QQ 邮箱一般默认关闭SMTP服务，所以我们得先去开启它

# smtplib 用于邮件的发信动作
import smtplib
from email.mime.text import MIMEText
# email 用于构建邮件内容
from email.header import Header
# 用于构建邮件头

def send():
    # 发信方的信息：发信邮箱，QQ 邮箱授权码
    from_addr = '[email protected]'
    password = 'xxx'

    # 收信方邮箱
    to_addr = '[email protected]'

    # 发信服务器
    smtp_server = 'smtp.qq.com'

    # 邮箱正文内容，第一个参数为内容，第二个参数为格式(plain 为纯文本)，第三个参数为编码
    str = '爬取完毕，或者出错了!'
    msg = MIMEText(str, 'plain', 'utf-8')

    # 邮件头信息
    msg['From'] = Header(from_addr)
    msg['To'] = Header(to_addr)
    msg['Subject'] = Header('python test')

    # 开启发信服务，这里使用的是加密传输
    server = smtplib.SMTP_SSL(smtp_server)
    server.connect(smtp_server, 465)
    server = smtplib.SMTP_SSL(smtp_server)
    # 登录发信邮箱
    server.login(from_addr, password)
    # 发送邮件
    server.sendmail(from_addr, to_addr, msg.as_string())
    # 关闭服务器
    server.quit()

成果

名字太过se qing ，打码。

总结

8说了，开冲！

你可能感兴趣的:(python)

c#视觉应用开发中如何使用Emgu CV在C#中进行图像处理？ openwin_top C#视觉应用开发问题系列 c#图像处理开发语言
microPythonPython最小内核源码解析NI-motion运动控制c语言示例代码解析python编程示例系列python编程示例系列二python的Web神器Streamlit如何应聘高薪职位EmguCV是OpenCV的.NET包装器，可以让开发者在.NET语言（如C#）中使用OpenCV的功能进行图像处理。在进行图像处理时，EmguCV提供了丰富的API可以使用。以下是使用EmguCV
python xlrd 2.0.1版本不支持.xlsx格式 wxywang89 琐碎记录 python
pythonxlrd库的新版本2.0.1版本移除了对.xlsx格式的支持，只支持.xls格式。报错信息如下：File"/Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages/xlrd/__init__.py",line170,inopen_workbookraiseXLRDError(FILE_FO
Python 数学建模——假设检验 Desire.984 Python 数学建模 python 数学建模概率论
文章目录前言参数假设检验单个总体均值的假设检验σ\sigmaσ已知σ\sigmaσ未知两个总体均值的假设检验参考代码非参数假设检验分布拟合检验——卡方检验KS检验（Kolmogorov-Smirnov检验）Wilcoxon检验Wilcoxon符号秩检验Wilcoxon秩和检验前言假设检验是概率论中相当重要的内容。一般是先提出一个原假设H0H_0H0和一个对立的备择假设H1H_1H1，通过数学方
Python合成gif动图北山杉林 python 开发语言
这里主要用到一个库：imageioimportosimportimageiofig_path="path_to_figure/"all_file=os.listdir(home_path)all_file.sort()images=[]foriinall_file:file_name=os.path.join(fig_path,i)img=imageio.imread(file_name)imag
Anaconda和Python的区别王摇摆 ANACONDA python 开发语言经验学习日常
0.专业英语Python巨蟒Anaconda大蟒蛇1.简单区别1.1安装包大小不同python自身缺少numpy、matplotlib、scipy、scikit-learn…等一系列包需要安装pip来导入这些包才能进行相应运算。Anaconda(开源的Python包管理器)是一个python发行版，包含了conda、Python等180多个科学包及其依赖项。包含了大量的包，使用Anaconda无需
python-anaconda虚拟环境淋巴不想动 linux python 虚拟环境
为什么使用Anaconda？Python易用,但用好却不易,其中比较头疼的就是包管理和Python不同版本的问题,特别是当你使用Windows的时候。为了解决这些问题,有不少发行版的Python,比如WinPython、Anaconda等,这些发行版将python和许多常用的package打包,方便pythoners直接使用,此外,还有virtualenv、pyenv等工具管理虚拟环境。常见的问题
python中selenium中使用ajax_使用selenium和python捕获AJAX响应 weixin_39946534
我曾经截获了一些使用selenium向页面注入javascript的ajax调用.历史的不好的一面是,硒有时可能是,说“脆弱”.因此,无论如何我在进行注射时都会遇到硒异常.无论如何,我的想法是拦截XHR调用,并将其响应设置为我创建的一个新的dom元素,我可以从selenium操作.在拦截的条件下,你甚至可以使用发出请求的url来拦截你真正想要的那个(self._url)也许这有帮助.browser
python提取数据库数据到前端html5显示_python html提取数据库数据 weixin_39878745
python开源工具列表【持续更新】以下是个人在工作中整理的一些pythonwheel，供参考。这个列表包含与网页抓取和数据处理的Python库网络通用urllib-网络库(stdlib)。requests-网络库。grab–网络库(基于pycurl)。pycurl–网络库(绑定libcurl)。urllib3–...文章武耀文2018-04-253128浏览量8个用于业余项目的优秀Python库
python gif压缩_怎么用python把多个图片变成gif 格式？ weixin_39778393 python gif压缩
展开全部解决这个问题需要用到PIL库fromPILimportImageimportos第一步获得所有图像文件列表，过滤不需要扩展名filelist=[]path=os.getcwd()files=os.listdir(path)forfinfiles:if(os.path.isfile(path+'/'+f)):if(os.path.splitext(f)[1]==".BMP"):filelis
python selenium chrome获取每个请求内容_selenium 获取请求返回内容的解决方案 weixin_39735166 python selenium chrome获取每个请求内容
提出问题之前我的一篇博客说的是怎么利用selenium来做自动化监控。当出现异常时，我们需要记录页面源码、网络请求数据、截图等信息来方便我们诊断问题，基本上就够用了。但是，这两天遇到一个棘手的异常，时不时页面会弹出：“系统繁忙，请稍候再试！”，这时候我们去看网络请求数据，结果状态码全部都是200，没有其它信息，这压根没法定位不了问题。这就说明：网络出现异常的时候，仅靠状态码是不够的。我们最好能拿到
python的数学建模库_数学建模库 weixin_39737240 python的数学建模库
NumPy(NumericalPython)是Python语言的一个扩展程序库，支持大量的维度数组与矩阵运算，此外也针对数组运算提供大量的数学函数库。引用：importnumpyasnpNumpy简单创建数组：importnumpyasnp#创建简单的列表a=[1,2,3,4]#将列表转换为数组b=np.array(a)Numpy查看数组属性:数组元素个数:b.size数组形状:b.shape数组
linux提权:从入门,Linux提权：从入门到放弃 Kalu丁 linux提权:从入门
日站就要日个彻底。往往我们能拿下服务器的web服务，却被更新地比西方记者还快的管理员把内网渗透的种子扼杀在提权的萌芽里面。Linux系统的提权过程不止涉及到了漏洞，也涉及了很多系统配置。一下是我总结的一些提权方法。几点前提已经拿到低权shell被入侵的机器上面有nc，python，perl等linux非常常见的工具有权限上传文件和下载文件内核漏洞提权提到脏牛，运维流下两行眼泪，我们留下两行鼻血。内
即学即用的30个python常用代码落难Coder Python python
1.检查重复元素下面的方法可以检查给定列表中是否有重复的元素。它使用了set()属性，该属性将会从列表中删除重复的元素。defall_unique(lst):returnlen(lst)==len(set(lst))x=[1,1,2,2,3,2,3,4,5,6]y=[1,2,3,4,5]all_unique(x)#Falseall_unique(y)#True2.变位词检测两个字符串是否互为变位词
Pyecharts可视化数据大屏七夜zippoe 大数据大数据
Pyecharts是一个非常强大的Python数据可视化库，它可以用来创建各种图表，并通过配置参数将这些图表组合成数据大屏。以下是创建一个简单的数据大屏的步骤和示例代码。1.安装pyecharts首先，你需要安装pyecharts：pipinstallpyecharts2.创建图表使用pyecharts创建多个图表，如柱状图、折线图等。下面是一些示例：frompyecharts.chartsimp
Python科学计算实战：数学建模与数值分析应用数据小爬虫 api 电商api 数学建模 python 开发语言 pygame 前端 facebook 数据库
Python在科学计算和数学建模方面有着广泛的应用。以下是一个简单的例子，使用Python进行数学建模和数值分析。这个例子将演示如何使用Python来求解一元二次方程。1.一元二次方程一元二次方程是一个形如(ax^2+bx+c=0)的方程，其中(a\neq0)。2.求解方法求解一元二次方程，我们通常使用公式：[x=\frac{-b\pm\sqrt{b^2-4ac}}{2a}]3.Python实现i
【Python】文件读写（CSV、Excel）素颜清风宛如月 Python python
一、CSV文件1读csv文件1.1以数组方式读文件deflistReader():withopen("user.csv",encoding="UTF-8")ascsvFile:#读文件csvData=csv.reader(csvFile)#数据集合print(list(csvData))#遍历数据对象fordataincsvData:#csvData.line_num：每条数据的行号print("
ONNX Runtime、CUDA、cuDNN、TensorRT版本对应可keke ML&DL pytorch deep learning
文章目录ONNXRuntime的安装ONNXRuntime与CUDA、cuDNN的版本对应ONNXRuntime与ONNX的版本对应ONNXRuntime、TensorRT、CUDA版本对应ONNXRuntime的安装官方文档注意，到目前为止，onnxruntime-gpu在CUDA12.x和CUDA11.x下的安装命令是不同的，仔细阅读官方文档。验证安装python>>>importonnxru
菜鸟养成第5集小鹏Running 菜鸟养成记 python
浮点数相加最好不要直接判断，经过round处理后再判断比如在idle设置0.1+0.2==0.3（False）原因是二进制存储导致末尾可能不同，round(0.1+0.2,2)==0.3(True)复数表示法：complexcomplex(1,2)-->1+2j//向左取整-3//2-->-2python所有字符都是以字符串存在的+连接字符串，且只能和字符串类型相加，其他类型会报错，不同类型也不可
个人笔记--python代码--储存数据 pdc31czy 个人笔记 Python python 笔记
1.存储Error（txt文件）importnumpyasnp#Errorerror_u=np.linalg.norm(exact_u_current-predict_np_u,2)/np.linalg.norm(exact_u_current,2)error_v=np.linalg.norm(exact_v_current-predict_np_v,2)/np.linalg.norm(exact
python安装virtual虚拟环境 LookUpMan python
本文参考：https://www.cnblogs.com/guishou/p/7134386.html1.安装pipinstallvirtualenv2.创建虚拟环境virtualenv-pc:\python3\python.exevenvc:\python3\python.exe为指定python解释器的路径3.激活虚拟环境首先进入创建的虚拟环境下目录中的scripts中cdvenv/scrip
Python使用pymysql和xlrd2将Excel数据导入MySQL数据库悬崖上的金鱼6 数据库 python excel mysql oracle
在数据处理和管理中，有时候需要将Excel文件中的数据导入到MySQL数据库中进行进一步的分析和操作。本文将介绍如何使用Python编程语言实现这个过程。导入所需库importxlrd2#导入xlrd2库，用于读取Excel文件importpymysql#导入pymysql库，用于连接和操作MySQL数据库fromdatetimeimportdatetime#导入datetime库，用于处理日期和
python 变量进阶 ottox
目标变量的引用可变和不可变类型局部变量和全局变量01.变量的引用变量和数据都是保存在内存中的在Python中函数的参数传递以及返回值都是靠引用传递的1.1引用的概念在Python中变量和数据是分开存储的数据保存在内存中的一个位置变量中保存着数据在内存中的地址变量中记录数据的地址，就叫做引用使用id()函数可以查看变量中保存数据所在的内存地址注意：如果变量已经被定义，当给一个变量赋值的时候，本质上是
使用Python将多张图片转换为动态GIF图像 FLK_9090 python 开发语言 pillow
在本文中，我们将学习如何使用Python编写代码，将多张静态图片转换为一个动态的GIF图像。无论你的图片格式是JPEG（.jpg）还是PNG（.png），我们都将使用Python中的PIL库来实现这一功能。通过本文的学习，你将了解如何利用Python编写简洁、高效的代码来处理图像，并创建出生动的动画效果。介绍动态GIF图像是一种在网络上广泛使用的图像格式，它可以将一系列静态图片串联起来，形成连续的
Anaconda安装与Python虚拟环境配置保姆级图文教程(附速查字典)_anaconda配置python环境 2401_84976246 程序员 c语言 c++学习
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！目录1混乱的Python库2什么是Anacond
【Python】已解决：ModuleNotFoundError: No module named ‘cv2‘ 屿小夏 python opencv 开发语言
文章目录一、分析问题背景示例代码片段二、可能出错的原因三、错误代码示例四、正确代码示例安装OpenCV库正确的代码示例五、注意事项已解决：ModuleNotFoundError:Nomodulenamed‘cv2’一、分析问题背景在Python开发过程中，图像处理是一个常见的需求，OpenCV（cv2）是一个广泛使用的图像处理库。当开发者在运行涉及图像处理的代码时，可能会遇到ModuleNotFo
【已解决】onnx无法找到CUDA的路径烟花节已解决人工智能深度学习 python pip
报错RuntimeError:D:\a\_work\1\s\onnxruntime\python\onnxruntime_pybind_state.cc:857onnxruntime::python::CreateExecutionProviderInstanceCUDA_PATHissetbutCUDAwasntabletobeloaded.Pleaseinstallthecorrectvers
Python史上最全知识重点（超详细版）进阶篇码农必胜客 Python零基础入门 python 网络 java
Python进阶进程间通信：Manager(内置了好多数据结构，可以实现多进程间内存共享)frommultiprocessingimportManager,Processdefadd_data(p_dict,key,value):p_dict[key]=valueif__name__=="__main__":progress_dict=Manager().dict()fromqueueimport
python释放变量内存_Python变量内存管理 weixin_39669761
一、变量存哪了？x=10当我们在p1.py中定义一个变量x=10，那么计算机把这个变量值10存放在哪里呢了？我们回顾计算机的三大核心组件为：CPU、内存和硬盘。一定不是CPU，那是存放在内存还是硬盘中了呢？我们再回顾变量运行的三个过程，如果我们没有使用python解释器运行p1.py这个文件，那么x=10很明显只是很普通的四个字符x、=、1、0。而只有Python解释器运行了这个文件，那字符进入了
python 强制释放内存_python 内存释放问题,高手请帮帮忙 weixin_39593498 python 强制释放内存
该楼层疑似违规已被系统折叠隐藏此楼查看此楼我重复一楼的问题，range(1024*1024)确实占用很大内存，但是del后，内存几乎是马上就释放了，没有内存持续占用问题。我测试操作系统是macox10.5.6在实际应用中，range对大的数是不适合的，应该用xrange。可以参考：http://avinashv.net/2008/05/pythons-range-and-xrange/Origin
类方法、类实例方法和类静态方法（Python） Qh果壳 python 开发语言
目录1.类方法（ClassMethod）2.类实例方法（InstanceMethod）3.类静态方法（StaticMethod）在Python中，类方法、类实例方法和类静态方法是与类相关联的三种不同类型的方法。1.类方法（ClassMethod）：类方法是通过装饰器@classmethod来定义的，它的第一个参数是类本身（通常被命名为"cls"），而不是实例。类方法可以通过类名调用，也可以通过实例
多线程编程之理财周凡杨 java 多线程生产者消费者理财
现实生活中，我们一边工作，一边消费，正常情况下会把多余的钱存起来，比如存到余额宝，还可以多挣点钱，现在就有这个情况：我每月可以发工资20000万元（暂定每月的1号），每月消费5000（租房+生活费）元（暂定每月的1号），其中租金是大头占90%，交房租的方式可以选择（一月一交，两月一交、三月一交），理财：1万元存余额宝一天可以赚1元钱，
[Zookeeper学习笔记之三]Zookeeper会话超时机制 bit1129 zookeeper
首先，会话超时是由Zookeeper服务端通知客户端会话已经超时，客户端不能自行决定会话已经超时，不过客户端可以通过调用Zookeeper.close()主动的发起会话结束请求，如下的代码输出内容 Created /zoo-739160015 CONNECTEDCONNECTED .............CONNECTEDCONNECTED CONNECTEDCLOSEDCLOSED
SecureCRT快捷键 daizj secureCRT 快捷键
ctrl + a : 移动光标到行首ctrl + e ：移动光标到行尾crtl + b: 光标前移1个字符crtl + f: 光标后移1个字符crtl + h : 删除光标之前的一个字符ctrl + d ：删除光标之后的一个字符crtl + k ：删除光标到行尾所有字符crtl + u : 删除光标至行首所有字符crtl + w: 删除光标至行首
Java 子类与父类这间的转换周凡杨 java 父类与子类的转换
最近同事调的一个服务报错，查看后是日期之间转换出的问题。代码里是把 java.sql.Date 类型的对象强制转换为 java.sql.Timestamp 类型的对象。报java.lang.ClassCastException。代码：
可视化swing界面编辑朱辉辉33 eclipse swing
今天发现了一个WindowBuilder插件，功能好强大，啊哈哈，从此告别手动编辑swing界面代码，直接像VB那样编辑界面，代码会自动生成。首先在Eclipse中点击help，选择Install New Software,然后在Work with中输入WindowBui
web报表工具FineReport常用函数的用法总结（文本函数）老A不折腾 finereport web报表工具报表软件 java报表
文本函数 CHAR CHAR(number):根据指定数字返回对应的字符。CHAR函数可将计算机其他类型的数字代码转换为字符。 Number:用于指定字符的数字，介于1Number:用于指定字符的数字，介于165535之间（包括1和65535）。示例: CHAR(88)等于“X”。 CHAR(45)等于“-”。 CODE CODE(text):计算文本串中第一个字
mysql安装出错林鹤霄 mysql安装
[root@localhost ~]# rpm -ivh MySQL-server-5.5.24-1.linux2.6.x86_64.rpm Preparing... #####################
linux下编译libuv aigo libuv
下载最新版本的libuv源码，解压后执行： ./autogen.sh 这时会提醒找不到automake命令，通过一下命令执行安装（redhat系用yum，Debian系用apt-get）： # yum -y install automake # yum -y install libtool 如果提示错误：make: *** No targe
中国行政区数据及三级联动菜单 alxw4616
近期做项目需要三级联动菜单,上网查了半天竟然没有发现一个能直接用的! 呵呵,都要自己填数据....我了个去这东西麻烦就麻烦的数据上. 哎,自己没办法动手写吧. 现将这些数据共享出了,以方便大家.嗯,代码也可以直接使用文件说明 lib\area.sql -- 县及县以上行政区划分代码（截止2013年8月31日)来源：国家统计局发布时间：2014-01-17 15:0
哈夫曼加密文件百合不是茶哈夫曼压缩哈夫曼加密二叉树
在上一篇介绍过哈夫曼编码的基础知识,下面就直接介绍使用哈夫曼编码怎么来做文件加密或者压缩与解压的软件,对于新手来是有点难度的,主要还是要理清楚步骤; 加密步骤: 1,统计文件中字节出现的次数,作为权值 2,创建节点和哈夫曼树 3,得到每个子节点01串 4,使用哈夫曼编码表示每个字节
JDK1.5 Cyclicbarrier实例 bijian1013 java thread java多线程 Cyclicbarrier
CyclicBarrier类一个同步辅助类，它允许一组线程互相等待，直到到达某个公共屏障点 (common barrier point)。在涉及一组固定大小的线程的程序中，这些线程必须不时地互相等待，此时 CyclicBarrier 很有用。因为该 barrier 在释放等待线程后可以重用，所以称它为循环的 barrier。 CyclicBarrier支持一个可选的 Runnable 命令，
九项重要的职业规划 bijian1013 工作学习
一. 学习的步伐不停止古人说，活到老，学到老。终身学习应该是您的座右铭。世界在不断变化，每个人都在寻找各自的事业途径。您只有保证了足够的技能储
【Java范型四】范型方法 bit1129 java
范型参数不仅仅可以用于类型的声明上，例如 package com.tom.lang.generics; import java.util.List; public class Generics<T> { private T value; public Generics(T value) { this.value =
【Hadoop十三】HDFS Java API基本操作 bit1129 hadoop
package com.examples.hadoop; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FileStatus; import org.apache.hadoo
ua实现split字符串分隔 ronin47 lua split
LUA并不象其它许多"大而全"的语言那样，包括很多功能，比如网络通讯、图形界面等。但是LUA可以很容易地被扩展：由宿主语言(通常是C或 C++)提供这些功能，LUA可以使用它们，就像是本来就内置的功能一样。LUA只包括一个精简的核心和最基本的库。这使得LUA体积小、启动速度快，从而适合嵌入在别的程序里。因此在lua中并没有其他语言那样多的系统函数。习惯了其他语言的字符串分割函
java-从先序遍历和中序遍历重建二叉树 bylijinnan java
public class BuildTreePreOrderInOrder { /** * Build Binary Tree from PreOrder and InOrder * _______7______ / \ __10__ ___2 / \ / 4
openfire开发指南《连接和登陆》开窍的石头 openfire 开发指南 smack
第一步官网下载smack.jar包下载地址：http://www.igniterealtime.org/downloads/index.jsp#smack 第二步把smack里边的jar导入你新建的java项目中开始编写smack连接openfire代码 p
[移动通讯]手机后盖应该按需要能够随时开启 comsci 移动
看到新的手机，很多由金属材质做的外壳，内存和闪存容量越来越大，CPU速度越来越快，对于这些改进，我们非常高兴，也非常欢迎但是，对于手机的新设计，有几点我们也要注意第一：手机的后盖应该能够被用户自行取下来，手机的电池的可更换性应该是必须保留的设计,
20款国外知名的php开源cms系统 cuiyadll cms
内容管理系统，简称CMS，是一种简易的发布和管理新闻的程序。用户可以在后端管理系统中发布，编辑和删除文章，即使您不需要懂得HTML和其他脚本语言，这就是CMS的优点。在这里我决定介绍20款目前国外市面上最流行的开源的PHP内容管理系统，以便没有PHP知识的读者也可以通过国外内容管理系统建立自己的网站。 1. Wordpress WordPress的是一个功能强大且易于使用的内容管
Java生成全局唯一标识符 darrenzhu java uuid unique identifier id
How to generate a globally unique identifier in Java http://stackoverflow.com/questions/21536572/generate-unique-id-in-java-to-label-groups-of-related-entries-in-a-log http://stackoverflow
php安装模块检测是否已安装过, 使用的SQL语句 dcj3sjt126com sql
SHOW [FULL] TABLES [FROM db_name] [LIKE 'pattern'] SHOW TABLES列举了给定数据库中的非TEMPORARY表。您也可以使用mysqlshow db_name命令得到此清单。本命令也列举数据库中的其它视图。支持FULL修改符，这样SHOW FULL TABLES就可以显示第二个输出列。对于一个表，第二列的值为BASE T
5天学会一种 web 开发框架 dcj3sjt126com Web 框架 framework
web framework层出不穷，特别是ruby/python,各有10+个,php/java也是一大堆根据我自己的经验写了一个to do list,按照这个清单，一条一条的学习，事半功倍，很快就能掌握一共25条，即便很磨蹭，2小时也能搞定一条，25*2=50。只需要50小时就能掌握任意一种web框架各类web框架大同小异:现代web开发框架的6大元素，把握主线，就不会迷路建议把本文
Gson使用三(Map集合的处理,一对多处理) eksliang json gson Gson map Gson 集合处理
转载请出自出处：http://eksliang.iteye.com/blog/2175532 一、概述 Map保存的是键值对的形式，Json的格式也是键值对的，所以正常情况下，map跟json之间的转换应当是理所当然的事情。二、Map参考实例 package com.ickes.json; import java.lang.refl
cordova实现“再点击一次退出”效果 gundumw100 android
基本的写法如下： document.addEventListener("deviceready", onDeviceReady, false); function onDeviceReady() { //navigator.splashscreen.hide(); document.addEventListener("b
openldap configuration leaning note iwindyforest configuration
hostname // to display the computer name hostname <changed name> // to change go to: /etc/sysconfig/network, add/modify HOSTNAME=NEWNAME to change permenately dont forget to change /etc/hosts
Nullability and Objective-C 啸笑天 Objective-C
https://developer.apple.com/swift/blog/?id=25 http://www.cocoachina.com/ios/20150601/11989.html http://blog.csdn.net/zhangao0086/article/details/44409913 http://blog.sunnyxx
jsp中实现参数隐藏的两种方法 macroli JavaScript jsp
在一个JSP页面有一个链接，//确定是一个链接?点击弹出一个页面，需要传给这个页面一些参数。//正常的方法是设置弹出页面的src="***.do?p1=aaa&p2=bbb&p3=ccc"//确定目标URL是Action来处理?但是这样会在页面上看到传过来的参数，可能会不安全。要求实现src="***.do"，参数通过其他方法传！//////
Bootstrap A标签关闭modal并打开新的链接解决方案 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
Bootstrap里面的js modal控件使用起来很方便，关闭也很简单。只需添加标签 data-dismiss="modal" 即可。可是偏偏有时候需要a标签既要关闭modal，有要打开新的链接，尝试多种方法未果。只好使用原始js来控制。 <a href="#/group-buy" class="btn bt
二维数组在Java和C中的区别流淚的芥末 java c 二维数组数组
Java代码： public class test03 { public static void main(String[] args) { int[][] a = {{1},{2,3},{4,5,6}}; System.out.println(a[0][1]); } } 运行结果： Exception in thread "mai
systemctl命令用法 wmlJava linux systemctl
对比表，以 apache / httpd 为例任务旧指令新指令使某服务自动启动 chkconfig --level 3 httpd on systemctl enable httpd.service 使某服务不自动启动 chkconfig --level 3 httpd off systemctl disable httpd.service 检查服务状态 service h

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他