卑微阿文

网站有反爬机制就爬不了数据？那是你不会【反】反爬

目录

前言

一、什么是代理IP

二、使用代理IP反反爬

1.获取代理IP

2.设置代理IP

3.验证代理IP

4.设置代理池

5.定时更新代理IP

三、反反爬案例

1.分析目标网站

2.爬取目标网站

四、总结

前言

爬虫技术的不断发展，使得许多网站都采取了反爬机制，以保护自己的数据和用户隐私。常见的反爬手段包括设置验证码、IP封锁、限制访问频率等等。

但是，这些反爬机制并不能完全阻止爬虫的进攻，因为只要有技术，就一定有方法来破解。本文将介绍如何使用代理IP来反反爬，以及相关的Python代码和案例。

一、什么是代理IP

代理IP（Proxy IP）是指在访问网络时，使用的是代理服务器的IP地址，而不是自己的IP地址。代理服务器相当于一座桥梁，将我们请求的数据先代理一下，再转发到目标网站，从而达到隐藏我们真实IP地址的效果。

代理IP具有隐藏身份、突破访问限制、提高访问速度、保护个人隐私等作用。在反爬方面，使用代理IP可以很好地避免被封锁IP，从而爬取目标网站的数据。

二、使用代理IP反反爬

1.获取代理IP

获取代理IP最常见的方式是通过爬取免费代理网站或者购买收费代理服务。免费代理网站的免费IP质量参差不齐，且容易被封锁，而收费代理服务的IP质量相对较高，可靠性更高。

在获取代理IP时，需要注意以下几点：

获取的代理IP必须是可用的，否则无法正常访问目标网站；
获取的代理IP需要定时更新，避免被封锁或失效；
不要过于频繁地使用同一个代理IP，否则容易被目标网站识别出来。

2.设置代理IP

在使用代理IP时，需要将其设置到请求头中。以requests库为例，可以通过以下代码设置代理IP：

import requests

proxies = {
    'http': 'http://ip:port',
    'https': 'https://ip:port'
}

response = requests.get(url, proxies=proxies)

其中，`ip`和`port`是代理IP的地址和端口号，根据实际情况进行设置。

3.验证代理IP

在进行爬取之前，需要先验证代理IP是否可用。一般来说，验证代理IP的可用性可以通过访问http://httpbin.org/ip网站来进行验证。以requests库为例，可以通过以下代码验证代理IP是否可用：

import requests

proxies = {
    'http': 'http://ip:port',
    'https': 'https://ip:port'
}

try:
    response = requests.get('http://httpbin.org/ip', proxies=proxies, timeout=10)
    if response.status_code == 200:
        print('代理IP可用')
    else:
        print('代理IP不可用')
except:
    print('代理IP请求失败')

4.设置代理池

单个代理IP的可用时间有限，而且代理IP的质量也参差不齐，因此需要设置一个代理池，从中随机选择一个可用的代理IP进行访问。

代理池的实现可以通过列表、队列或数据库等方式进行。以列表为例，可以通过以下代码实现代理池的设置：

proxy_pool = [
    'http://ip1:port1',
    'http://ip2:port2',
    'http://ip3:port3',
    ...
]

proxy = random.choice(proxy_pool)

proxies = {
    'http': proxy,
    'https': proxy
}

其中，`random.choice(proxy_pool)`表示从代理池中随机选择一个代理IP进行访问。

5.定时更新代理IP

为了避免代理IP被封锁或失效，需要定时更新代理IP。更新代理IP的方法有很多种，可以通过爬取免费代理网站、购买收费代理服务或者自己搭建代理服务器等方式进行。在更新代理IP时，需要注意以下几点：

更新的代理IP必须是可用的；
更新的代理IP需要添加到代理池中，并在下一次请求中随机选择使用。

三、反反爬案例

下面以爬取豆瓣电影TOP250为例，介绍如何使用代理IP来反反爬。

1.分析目标网站

豆瓣电影TOP250的网址为：https://movie.douban.com/top250。我们需要获取其中的电影名称、电影链接、电影评分等信息。

打开浏览器的开发者工具，可以发现目标网站的数据请求链接为：https://movie.douban.com/top250?start=0&filter=，其中的`start`表示起始位置，每页有25条数据，共10页数据。我们需要遍历这10页数据，获取其中的电影信息。

2.爬取目标网站

首先，需要获取代理IP，这里使用的是免费代理网站，代码如下：

import requests
from bs4 import BeautifulSoup
import random

def get_proxy():
    url = 'https://www.zdaye.com/'
    headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
    response = requests.get(url, headers=headers)
    soup = BeautifulSoup(response.text, 'html.parser')
    trs = soup.find_all('tr')
    proxy_list = []
    for tr in trs[1:]:
        tds = tr.find_all('td')
        ip = tds[1].text
        port = tds[2].text
        proxy = 'http://{}:{}'.format(ip, port)
        proxy_list.append(proxy)
    return proxy_list

其中，`get_proxy()`函数用于获取代理IP，返回的是代理IP列表。

接下来，需要设置代理池，代码如下：

proxy_pool = get_proxy()

随机选择一个代理IP进行访问，代码如下：

proxy = random.choice(proxy_pool)

proxies = {
    'http': proxy,
    'https': proxy
}

然后，开始爬取目标网站，代码如下：

import requests
from bs4 import BeautifulSoup
import random

def get_proxy():
    url = 'https://www.zdaye.com/'
    headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
    response = requests.get(url, headers=headers)
    soup = BeautifulSoup(response.text, 'html.parser')
    trs = soup.find_all('tr')
    proxy_list = []
    for tr in trs[1:]:
        tds = tr.find_all('td')
        ip = tds[1].text
        port = tds[2].text
        proxy = 'http://{}:{}'.format(ip, port)
        proxy_list.append(proxy)
    return proxy_list

def get_movie_info(url, proxies):
    headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
    response = requests.get(url, headers=headers, proxies=proxies)
    soup = BeautifulSoup(response.text, 'html.parser')
    items = soup.find_all('div', class_='info')
    movie_list = []
    for item in items:
        name = item.find('span', class_='title').text
        href = item.find('a')['href']
        rating = item.find('span', class_='rating_num').text
        movie_info = {
            'name': name,
            'href': href,

            'rating': rating
        }
        movie_list.append(movie_info)
    return movie_list

if __name__ == '__main__':
    proxy_pool = get_proxy()
    movie_list = []
    for i in range(10):
        url = 'https://movie.douban.com/top250?start={}&filter='.format(i*25)
        proxy = random.choice(proxy_pool)
        proxies = {
            'http': proxy,
            'https': proxy
        }
        movie_list += get_movie_info(url, proxies)
    print(movie_list)

在运行代码时，可能会出现代理IP不可用的情况，可以通过多次尝试或者定时更新代理IP来解决。

四、总结

本文介绍了如何使用代理IP来反反爬，并给出了相关的Python代码和案例。在实际爬取数据时，还需要注意以下几点：

避免频繁请求目标网站，尽量减少对目标网站的负担；
模拟真实请求，设置合理的User-Agent、Referer等请求头参数；
处理反爬机制，如验证码、JS渲染、动态IP等。

总之，反爬机制是爬虫开发中不可避免的挑战，需要不断学习技术、探索方法、思考策略，才能够更好地应对挑战并获取所需数据。

你可能感兴趣的:(python,php,开发语言,tcp/ip,网络)

零信任架构阿湯哥架构
零信任架构（ZeroTrustArchitecture,ZTA）零信任架构是一种新型网络安全模型，核心理念是“永不信任，始终验证”（NeverTrust,AlwaysVerify）。它摒弃传统基于边界的安全防护（如防火墙隔离内外部网络），转而通过动态的、细粒度的访问控制，对所有用户、设备和数据流进行持续验证，最小化攻击面并防范内部威胁。一、零信任与传统安全模型的对比维度传统安全模型零信任模型信任基
Python自动化炒股：利用XGBoost和LightGBM进行股票市场预测的实战案例云策量化 Python自动化炒股量化投资量化软件 python 量化交易 QMT PTrade 量化炒股量化投资 deepseek
推荐阅读：《程序化炒股：如何申请官方交易接口权限？个人账户可以申请吗？》Python自动化炒股：利用XGBoost和LightGBM进行股票市场预测的实战案例在当今快节奏的金融市场中，自动化交易和预测模型成为了投资者和交易者的重要工具。Python以其强大的数据处理能力和丰富的机器学习库，成为了实现这些模型的首选语言。本文将带你了解如何使用XGBoost和LightGBM这两个流行的机器学习算法来
HarmonyNext实战：基于ArkTS的高性能3D渲染引擎开发 harmonyos-next
HarmonyNext实战：基于ArkTS的高性能3D渲染引擎开发引言3D渲染引擎是现代图形应用的核心，广泛应用于游戏开发、虚拟现实、工业设计等领域。HarmonyNext作为新一代操作系统，提供了强大的图形处理能力，而ArkTS作为其开发语言，能够帮助开发者高效实现高性能的3D渲染引擎。本文将详细讲解如何在HarmonyNext平台上使用ArkTS开发一个3D渲染引擎。我们将从3D渲染的基本原理
HarmonyNext实战：基于ArkTS的高性能区块链应用开发 harmonyos-next
HarmonyNext实战：基于ArkTS的高性能区块链应用开发引言区块链技术以其去中心化、不可篡改和透明性等特点，正在金融、供应链、物联网等领域掀起革命性变革。HarmonyNext作为新一代操作系统，提供了强大的分布式计算和网络通信能力，而ArkTS作为其开发语言，能够帮助开发者高效实现高性能的区块链应用。本文将详细讲解如何在HarmonyNext平台上使用ArkTS开发一个区块链应用。我们将
Ubuntu常用命令手册【自用笔记】大佬橙1215 Linux ubuntu 运维 Linux
Ubuntu常用命令手册【自用】目录Ubuntu常用命令手册【自用】1.杂项1.删除进程中包含"smb"字段的所有进程2.查看最近登录的ip2.xargs3.awk4.find5.grep6.sed7.timedatectl1.杂项1.删除进程中包含"smb"字段的所有进程sudokill-9$(ps-aux|grepsmb|awk'{print$2}')2.查看最近登录的ipcat/var/lo
基于HarmonyNext的ArkTS实战：构建跨平台企业级任务管理系统 harmonyos-next
基于HarmonyNext的ArkTS实战：构建跨平台企业级任务管理系统引言在现代企业中，任务管理系统是提升团队协作效率的重要工具。随着HarmonyNext的推出，ArkTS作为其核心开发语言，为开发者提供了强大的跨平台能力和高效的性能支持。本文将深入探讨如何利用ArkTS构建一个跨平台的企业级任务管理系统，涵盖从任务创建、分配到跟踪的完整流程。通过实战案例，我们将展示ArkTS在Harmony
HarmonyNext实战：基于ArkTS的分布式数据同步应用开发 harmonyos-next
HarmonyNext实战：基于ArkTS的分布式数据同步应用开发引言在分布式系统中，数据同步是一个核心问题，尤其是在多设备协同的场景下。HarmonyNext作为新一代操作系统，提供了强大的分布式能力，而ArkTS作为其开发语言，能够帮助开发者高效实现分布式数据同步。本文将详细讲解如何在HarmonyNext平台上使用ArkTS开发一个分布式数据同步应用。我们将从分布式数据同步的基本原理入手，逐
python缩进几个空格-解析Python的缩进规则的使用 weixin_39962675
Python中的缩进（Indentation）决定了代码的作用域范围。这一点和传统的c/c++有很大的不同（传统的c/c++使用花括号{}符，python使用缩进空格）。每行代码中开头的空格数（whitespace）用于计算该行代码的缩进级别（Indentationlevel），注意一个Tab等于8个空格（Space），缩进级别为0表示无缩进空格。Python中的每一条语句都有一个缩进级别,并且缩
Transformer 架构深度剖析时光旅人01号人工智能技术科普 transformer 深度学习人工智能 conda opencv 计算机视觉
一、Transformer架构核心设计1.1整体架构Transformer由编码器（Encoder）和解码器（Decoder）堆叠而成，每个层包含：多头自注意力（Multi-HeadSelf-Attention）前馈网络（Feed-ForwardNetwork,FFN）残差连接（ResidualConnection）和层归一化（LayerNorm）关键特性：完全基于注意力机制，摒弃了循环和卷积结构
批量检查微信小程序是否被封的Go代码微信微信小程序
概述：这段Go代码通过请求接口https://api.52an.fun/xcx/checkxcx.php?appid={appid}，批量检查多个微信小程序是否被封禁。接口返回的JSON数据中包含code字段，code为1表示小程序正常，code为0表示小程序被封禁，并且会返回封禁原因。程序会根据返回结果输出每个小程序的状态。Go代码示例：packagemainimport("encoding/j
IP 证书：为什么 2025 年所有云服务器都必须安装的 “数字防火墙”？ ssl证书
IP证书作为一种关键的安全工具，已成为所有云服务器都必须安装的“数字防火墙”。一、保障数据传输安全数据在云服务器与用户之间传输时，极易被黑客盯上。IP证书采用SSL协议对数据进行加密，就像给数据穿上了一层密不透风的铠甲。无论是用户登录信息、支付数据，还是企业的商业机密，加密后第三方难以窃听和篡改。例如，当电商用户在云服务器支持的平台上进行支付操作，IP证书能确保支付信息安全传输，避免被黑客窃取。同
企业级通配符 SSL 证书：企业网络安全的坚实护盾 ssl证书
一、什么是企业级通配符SSL证书企业级通配符SSL证书，是一种数字证书，它就像是企业在网络世界的“身份证”。与普通证书不同，其最大亮点在于一个证书能保护一个主域名及其下所有的子域名。这极大地简化了证书管理流程，企业无需为每个子域名单独申请和配置证书，一站式搞定网络加密需求。二、强大的加密保障在网络数据传输如水流般穿梭的时代，信息安全至关重要。企业级通配符SSL证书采用先进加密算法，将数据加密打包后
IP证书如何让企业提升网络信任度 ssl证书ip地址
IP证书，作为一种专门设计用于保护IP地址安全的数字证书，正逐渐成为提升企业网络信任度的关键工具。###IP证书申请入口申请时记得填写注册码230931，获取一对一技术支持一、身份验证与加密通信IP证书的核心在于通过PKI技术实现设备身份与IP地址的强绑定。当企业为服务器或设备部署IP证书后，通信双方通过交换证书验证身份，并协商对称密钥加密数据，确保通信的机密性与完整性。这一机制有效抵御了IP欺骗
80或者443端口不能开放也可签发的IP SSL证书 https
以IP地址来申请SSL证书的时候，通常需要以上传服务器文件的方式来验证IP地址的管理权限，这就涉及常规端口的开放，一般需要开放80或者443端口，如不能开放则无法签发SSL证书。DunTrust提供的IP地址证书，除了支持80或者443端口验证外，还支持其他端口验证。申请网址：www.yundunssl.comhttps://www.yundunssl.cn/下面是具体的申请流程注册账号：在Dun
批量检查QQ域名是否被封的C++代码示例 qq
概述：此C++代码示例展示了如何批量请求指定的API接口，检查QQ域名的状态。根据API返回的status值，status为1表示域名正常，status为0表示域名被封禁。我们将使用libcurl来进行HTTP请求，使用jsoncpp解析返回的JSON数据。目标：通过C++编写代码，批量请求https://api.52an.fun/qq/api.php?url=接口，检查多个QQ域名的封禁状态，并
【sklearn 04】DNN、CNN、RNN @金色海岸 sklearn dnn cnn
DNNDNN（DeepNeuralNetworks，深度神经网络）是一种相对浅层机器学习模型具有更多参数，需要更多数据进行训练的机器学习算法CNNCNN（convolutionalNeuralNetworks，卷积神经网络）是一种从局部特征开始学习并逐渐整合的神经网络。卷积神经网络通过卷积层来进行特征提取，通过池化层进行降维，相比较全连接的神经网络，卷积神经网络降低了模型复杂度，减少了模型的参数，
IntelliJ IDEA 2023.3.1安装指南从下载到配置的完整教程（附资源下载）心灵宝贝 intellij-idea java ide
安装IntelliJIDEA2023.3.1非常简单，以下是详细的安装步骤，适用于Windows、macOS和Linux系统。1.下载IntelliJIDEAIntelliJIDEA下载链接：https://pan.quark.cn/s/3ad975664934选择适合你的操作系统的版本：Ultimate版：功能全面，支持所有开发语言和框架（需付费）。Community版：免费版，适合Java和K
33.从入门到精通：Python3 正则表达式 re.match函数 re.search方法 re.match与re.search的区别摘星月为妆。 Python从入门到精通正则表达式
33.从入门到精通：Python3正则表达式re.match函数re.search方法re.match与re.search的区别Python3正则表达式re.match函数re.search方法re.match与re.search的区别Python3正则表达式在Python3中，可以使用re模块来进行正则表达式的匹配和处理。以下是一个简单的例子，说明如何使用re模块进行正则表达式匹配：import
Python与Web 3.0：重新定义数字身份验证的未来 Echo_Wish Python！实战！python 前端开发语言
Python与Web3.0：重新定义数字身份验证的未来随着Web3.0的迅猛发展，传统的身份验证方式正面临越来越大的挑战。从依赖中心化服务器存储用户数据，到如今去中心化、用户掌控数据的新时代，身份验证系统经历了前所未有的变革。而作为一个人工智能、区块链和Python技术的深度爱好者，我认为Python将成为构建Web3.0身份验证系统的重要工具。今天，我们就来聊聊如何结合Python与Web3.0
python中re.search()函数的用法前行的zhu pytorch 正则表达式正则表达式 python
说到使用正则匹配字符串，就不得不说三个常用的匹配检索方法：re.search(),re.match()和re.findall()。主要的区别是前两个方法只在目标字符串中匹配一次满足条件的正则表达式；而re.findall()方法匹配目标字符串中所有满足条件的正则表达式；另外re.match()只会匹配目标字符串开头是否满足正则表达式，若开头不满足则匹配失败，函数返回None；而re.search(
python 中 Re库函数 re.search() weixin_43964993 python python
re.search(pattern,string,flags=0)在一个字符串中搜索匹配正则表达式的第一个位置，返回match对象pattern:正则表达式的字符串或原生字符串表示string:待匹配字符串flags:正则表达式使用时的控制标记常用标记说明re.I re.IGNORECASE忽略正则表达式的大小写，[A‐Z]能够匹配小写字符re.M re.MULTILINE正则表达式中的^操作
python中search用法_Python中的python re.search方法详解 weixin_39688856 python中search用法
re.search扫描整个字符串并返回第一个成功的匹配，若string中包含pattern子串，则返回Match对象，否则返回None，注意，如果string中存在多个pattern子串，只返回第一个。re.search()方法用来精确匹配并提取第一个符合规律的对象，而对象内容的提取则使用search方法的属性group()来实现。函数语法：re.search(pattern,string,fla
计算机毕业设计springboot教务管理系统 0k1c1源码+系统+程序+lw文档+部署呦呦网络 spring boot java mysql
计算机毕业设计springboot教务管理系统0k1c1源码+系统+程序+lw文档+部署计算机毕业设计springboot教务管理系统0k1c1源码+系统+程序+lw文档+部署本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：ideaeclipse前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAVA运行环境：Win10、JDK1.8数据库：MySQL5
嵌入式八股，DHCP（Dynamic Host Configuration Protocol，动态主机配置协议） skeete 服务器 linux 网络
首先，上网是需要IP地址的，且每一个IP地址都是不重复，以防止冲突，如果每一个IP地址都需要手动的静态分配将会是一个非常麻烦的过程。DHCP（DynamicHostConfigurationProtocol，动态主机配置协议）是一种用于网络设备自动获取IP地址及其他网络配置参数的协议。它允许网络管理员通过集中管理的方式，动态分配IP地址，从而简化网络设备的配置过程，提高网络管理的效率和灵活性。2.
网络华为HCIA+HCIP网络基础 ssr——ssss 华为网络
目录通信与网络基础网络类型和网络拓扑网络参考模型和标准协议VRP文件系统命令行试图使用快捷键网工基础命令文件系统基本配置命令通信与网络基础通信，是指人与人、人与物、物与物之间通过某种媒介和行为进行的信息传递与交流。网络通信，是指终端设备之间通过计算机网络进行的通信。交换机:距离终端用户最近的设备，用于终端用户接入网络、对数据帧进行交换等。路由器:网络层设备，可以在因特网中进行数据报文转发。路由器根
pandas 读写excel jimox_ai pandas
在Python中，使用Pandas库读写Excel文件是一个常见的操作。Pandas提供了`read_excel`和`to_excel`方法来分别实现读取和写入Excel文件的功能。以下是一些基本的示例：###读取Excel文件```pythonimportpandasaspd#读取Excel文件df=pd.read_excel('path_to_your_excel_file.xlsx')#显示
linux的防火墙（iptables） JM丫 linux centos
防火墙的作用：linux防火墙主要是工作在网络层，针对TCP/IP数据包实施过滤和限制，属于典型的包过滤防火墙（或者为网络层防火墙）linux的防火墙分为两种，分别为netfiter和iptables，这两种都被称为防火墙，但是又有一些区别，具体的区别在于：1、netfilter：称为内核空间，是linux内核中实现包过滤的防火墙的内部结构，属于“内核态，又称为内核空间”防火墙功能体系。2、ipt
Ghostscript 简介与使用指南 gs80140 pdf
目录Ghostscript简介与使用指南1.什么是Ghostscript？2.Ghostscript的安装2.1在Windows上安装2.2在macOS上安装（使用Homebrew）2.3在Linux上安装（Ubuntu/Debian）3.Ghostscript的基本用法3.1查看PDF或PostScript文件3.2将PDF转换为PNG/JPEG3.3压缩PDF文件3.4合并多个PDF文件3.5
从LLM出发：由浅入深探索AI开发的全流程与简单实践（全文3w字）码事漫谈 AI 人工智能
文章目录第一部分：AI开发的背景与历史1.1人工智能的起源与发展1.2神经网络与深度学习的崛起1.3Transformer架构与LLM的兴起1.4当前AI开发的现状与趋势第二部分：AI开发的核心技术2.1机器学习：AI的基础2.1.1机器学习的类型2.1.2机器学习的流程2.2深度学习：机器学习的进阶2.2.1神经网络基础2.2.2深度学习的关键架构2.3Transformer架构：现代LLM的核
天吉智芯「星核」智能充气泵 —— 以芯为核，定义车载充气新标杆天吉智芯充气泵打气泵一体机人工智能单片机嵌入式硬件
一、品牌基因：12年车规级芯片的技术沉淀天吉智芯（TJX-CHIP）作为深圳天吉芯技术旗下高端品牌，深耕汽车电子领域12年，累计交付超500万颗车规级MCU芯片。「星核」充气泵是品牌首款终端产品，搭载自主研发的TJX8F003Pro车规级芯片（IATF16949认证），以芯片级定制重构充气泵的智能边界——不止是工具，更是汽车安全生态的智能终端。二、产品定位：全场景胎压管家，重新定义「可靠」目标用户
mondb入手木zi_鸣 mongodb
windows 启动mongodb 编写bat文件， mongod --dbpath D:\software\MongoDBDATA mongod --help 查询各种配置配置在mongob 打开批处理，即可启动，27017原生端口，shell操作监控端口扩展28017，web端操作端口启动配置文件配置，数据更灵活
大型高并发高负载网站的系统架构 bijian1013 高并发负载均衡
扩展Web应用程序一.概念简单的来说，如果一个系统可扩展，那么你可以通过扩展来提供系统的性能。这代表着系统能够容纳更高的负载、更大的数据集，并且系统是可维护的。扩展和语言、某项具体的技术都是无关的。扩展可以分为两种： 1.
DISPLAY变量和xhost(原创) czmmiao display
DISPLAY 在Linux/Unix类操作系统上, DISPLAY用来设置将图形显示到何处. 直接登陆图形界面或者登陆命令行界面后使用startx启动图形, DISPLAY环境变量将自动设置为:0:0, 此时可以打开终端, 输出图形程序的名称(比如xclock)来启动程序, 图形将显示在本地窗口上, 在终端上输入printenv查看当前环境变量, 输出结果中有如下内容:DISPLAY=:0.0
获取B/S客户端IP 周凡杨 java 编程 jsp Web 浏览器
最近想写个B/S架构的聊天系统，因为以前做过C/S架构的QQ聊天系统，所以对于Socket通信编程只是一个巩固。对于C/S架构的聊天系统，由于存在客户端Java应用，所以直接在代码中获取客户端的IP，应用的方法为： String ip = InetAddress.getLocalHost().getHostAddress(); 然而对于WEB
浅谈类和对象朱辉辉33 编程
类是对一类事物的总称，对象是描述一个物体的特征，类是对象的抽象。简单来说，类是抽象的，不占用内存，对象是具体的，占用存储空间。类是由属性和方法构成的，基本格式是public class 类名{ //定义属性 private/public 数据类型属性名； //定义方法 publ
android activity与viewpager+fragment的生命周期问题肆无忌惮_ viewpager
有一个Activity里面是ViewPager，ViewPager里面放了两个Fragment。第一次进入这个Activity。开启了服务，并在onResume方法中绑定服务后，对Service进行了一定的初始化，其中调用了Fragment中的一个属性。 super.onResume(); bindService(intent, conn, BIND_AUTO_CREATE);
base64Encode对图片进行编码 843977358 base64 图片 encoder
/** * 对图片进行base64encoder编码 * * @author mrZhang * @param path * @return */ public static String encodeImage(String path) { BASE64Encoder encoder = null; byte[] b = null; I
Request Header简介 aigo servlet
当一个客户端(通常是浏览器)向Web服务器发送一个请求是，它要发送一个请求的命令行，一般是GET或POST命令，当发送POST命令时，它还必须向服务器发送一个叫“Content-Length”的请求头(Request Header) 用以指明请求数据的长度，除了Content-Length之外，它还可以向服务器发送其它一些Headers，如：
HttpClient4.3 创建SSL协议的HttpClient对象 alleni123 httpclient 爬虫 ssl
public class HttpClientUtils { public static CloseableHttpClient createSSLClientDefault(CookieStore cookies){ SSLContext sslContext=null; try { sslContext=new SSLContextBuilder().l
java取反 -右移-左移-无符号右移的探讨百合不是茶位运算符位移
取反：在二进制中第一位，1表示符数，0表示正数 byte a = -1; 原码：10000001 反码：11111110 补码：11111111 //异或: 00000000 byte b = -2; 原码：10000010 反码：11111101 补码：11111110 //异或: 00000001
java多线程join的作用与用法 bijian1013 java 多线程
对于JAVA的join，JDK 是这样说的：join public final void join （long millis ）throws InterruptedException Waits at most millis milliseconds for this thread to die. A timeout of 0 means t
Java发送http请求(get 与post方法请求) bijian1013 java spring
PostRequest.java package com.bijian.study; import java.io.BufferedReader; import java.io.DataOutputStream; import java.io.IOException; import java.io.InputStreamReader; import java.net.HttpURL
【Struts2二】struts.xml中package下的action配置项默认值 bit1129 struts.xml
在第一部份，定义了struts.xml文件，如下所示： <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache.org/dtds/struts
【Kafka十三】Kafka Simple Consumer bit1129 simple
代码中关于Host和Port是割裂开的，这会导致单机环境下的伪分布式Kafka集群环境下，这个例子没法运行。实际情况是需要将host和port绑定到一起， package kafka.examples.lowlevel; import kafka.api.FetchRequest; import kafka.api.FetchRequestBuilder; impo
nodejs学习api ronin47 nodejs api
NodeJS基础什么是NodeJS JS是脚本语言，脚本语言都需要一个解析器才能运行。对于写在HTML页面里的JS，浏览器充当了解析器的角色。而对于需要独立运行的JS，NodeJS就是一个解析器。每一种解析器都是一个运行环境，不但允许JS定义各种数据结构，进行各种计算，还允许JS使用运行环境提供的内置对象和方法做一些事情。例如运行在浏览器中的JS的用途是操作DOM，浏览器就提供了docum
java-64.寻找第N个丑数 bylijinnan java
public class UglyNumber { /** * 64.查找第N个丑数具体思路可参考 [url] http://zhedahht.blog.163.com/blog/static/2541117420094245366965/[/url] * 题目：我们把只包含因子 2、3和5的数称作丑数（Ugly Number）。例如6、8都是丑数，但14
二维数组（矩阵）对角线输出 bylijinnan 二维数组
/** 二维数组对角线输出两个方向例如对于数组： { 1, 2, 3, 4 }, { 5, 6, 7, 8 }, { 9, 10, 11, 12 }, { 13, 14, 15, 16 }, slash方向输出： 1 5 2 9 6 3 13 10 7 4 14 11 8 15 12 16 backslash输出： 4 3
[JWFD开源工作流设计]工作流跳跃模式开发关键点(今日更新) comsci 工作流
既然是做开源软件的,我们的宗旨就是给大家分享设计和代码,那么现在我就用很简单扼要的语言来透露这个跳跃模式的设计原理大家如果用过JWFD的ARC-自动运行控制器,或者看过代码,应该知道在ARC算法模块中有一个函数叫做SAN(),这个函数就是ARC的核心控制器,要实现跳跃模式,在SAN函数中一定要对LN链表数据结构进行操作,首先写一段代码,把
redis常见使用 cuityang redis 常见使用
redis 通常被认为是一个数据结构服务器，主要是因为其有着丰富的数据结构 strings、map、 list、sets、 sorted sets 引入jar包 jedis-2.1.0.jar (本文下方提供下载) package redistest; import redis.clients.jedis.Jedis; public class Listtest
配置多个redis dalan_123 redis
配置多个redis客户端 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&quo
attrib命令 dcj3sjt126com attr
attrib指令用于修改文件的属性.文件的常见属性有:只读.存档.隐藏和系统. 只读属性是指文件只可以做读的操作.不能对文件进行写的操作.就是文件的写保护. 存档属性是用来标记文件改动的.即在上一次备份后文件有所改动.一些备份软件在备份的时候会只去备份带有存档属性的文件.
Yii使用公共函数 dcj3sjt126com yii
在网站项目中，没必要把公用的函数写成一个工具类，有时候面向过程其实更方便。在入口文件index.php里添加 require_once('protected/function.php'); 即可对其引用，成为公用的函数集合。 function.php如下： <?php /** * This is the shortcut to D
linux 系统资源的查看（free、uname、uptime、netstat） eksliang netstat linux uname linux uptime linux free
linux 系统资源的查看转载请出自出处：http://eksliang.iteye.com/blog/2167081 http://eksliang.iteye.com 一、free查看内存的使用情况语法如下： free [-b][-k][-m][-g] [-t] 参数含义 -b:直接输入free时，显示的单位是kb我们可以使用b(bytes),m
JAVA的位操作符 greemranqq 位运算 JAVA位移 <<>>>
最近几种进制，加上各种位操作符，发现都比较模糊，不能完全掌握，这里就再熟悉熟悉。 1.按位操作符：按位操作符是用来操作基本数据类型中的单个bit,即二进制位，会对两个参数执行布尔代数运算，获得结果。与（&）运算： 1&1 = 1, 1&0 = 0, 0&0 &
Web前段学习网站 ihuning Web
Web前段学习网站菜鸟学习：http://www.w3cschool.cc/ JQuery中文网：http://www.jquerycn.cn/ 内存溢出：http://outofmemory.cn/#csdn.blog http://www.icoolxue.com/ http://www.jikexue
强强联合：FluxBB 作者加盟 Flarum justjavac r
原文：FluxBB Joins Forces With Flarum作者：Toby Zerner译文：强强联合：FluxBB 作者加盟 Flarum译者：justjavac FluxBB 是一个快速、轻量级论坛软件，它的开发者是一名德国的 PHP 天才 Franz Liedke。FluxBB 的下一个版本(2.0)将被完全重写，并已经开发了一段时间。FluxBB 看起来非常有前途的，
java统计在线人数（session存储信息的） macroli java Web
这篇日志是我写的第三次了前两次都发布失败！郁闷极了！由于在web开发中常常用到这一部分所以在此记录一下，呵呵，就到备忘录了！我对于登录信息时使用session存储的，所以我这里是通过实现HttpSessionAttributeListener这个接口完成的。 1、实现接口类，在web.xml文件中配置监听类，从而可以使该类完成其工作。 public class Ses
bootstrp carousel初体验快速构建图片播放 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
img{ border: 1px solid white; box-shadow: 2px 2px 12px #333; _width: expression(this.width > 600 ? "600px" : this.width + "px"); _height: expression(this.width &
SparkSQL读取HBase数据，通过自定义外部数据源 superlxw1234 spark sparksql sparksql读取hbase sparksql外部数据源
关键字：SparkSQL读取HBase、SparkSQL自定义外部数据源前面文章介绍了SparSQL通过Hive操作HBase表。 SparkSQL从1.2开始支持自定义外部数据源(External DataSource)，这样就可以通过API接口来实现自己的外部数据源。这里基于Spark1.4.0，简单介绍SparkSQL自定义外部数据源，访
Spring Boot 1.3.0.M1发布 wiselyman spring boot
Spring Boot 1.3.0.M1于6.12日发布，现在可以从Spring milestone repository下载。这个版本是基于Spring Framework 4.2.0.RC1,并在Spring Boot 1.2之上提供了大量的新特性improvements and new features。主要包含以下： 1.提供一个新的sprin

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他