卑微阿文

C#攻克反爬虫之代理IP爬取

目录

前言

一、什么是代理IP

二、代理IP的获取

1. 免费代理IP网站

2. 第三方API

三、C#实现代理IP爬取

1. 安装HtmlAgilityPack和HttpClient

2. 获取代理IP

3. 使用代理IP发送请求

四、常见问题及解决方案

1. 代理IP的可用性

2. 频繁更换代理IP

总结

前言

随着互联网的发展，反爬虫技术也越来越成熟，很多网站都对爬取行为进行限制，例如限制访问频率、封禁IP等。为了规避这些限制，爬虫程序可以使用代理IP进行爬取。本文将介绍如何使用C#实现代理IP的爬取，并且解决一些常见的问题。

一、什么是代理IP

代理IP是一种用于隐藏真实IP地址的网络技术。通过使用代理服务器，我们可以将请求发送到代理服务器上，再由代理服务器代为发送请求，从而隐藏真实IP地址。代理服务器充当了客户端与目标服务器之间的中间人。在爬虫中，我们可以通过使用代理IP来规避目标网站的反爬虫策略。

二、代理IP的获取

1. 免费代理IP网站

免费代理IP网站是最常见的一种获取代理IP的方法。这些网站通常会提供公开的代理IP地址供开发者使用。通过爬取这些网站的代理IP列表，我们可以获取大量的代理IP地址。

2. 第三方API

除了免费代理IP网站外，还有一些第三方提供的代理IP API，比如站大爷代理ip、蝶鸟ip等。这些API通常需要付费使用，但提供的代理IP质量更高、稳定性更好。

三、C#实现代理IP爬取

使用C#实现代理IP爬取可以借助HtmlAgilityPack和HttpClient两个库。

1. 安装HtmlAgilityPack和HttpClient

使用NuGet包管理器，通过搜索"HtmlAgilityPack"和"HttpClient"，安装这两个库。

2. 获取代理IP

以下代码实现了从免费代理IP网站获取代理IP的功能：

using System;
using System.Net.Http;
using HtmlAgilityPack;

class Program
{
    static async Task Main(string[] args)
    {
        var httpClient = new HttpClient();
        var html = await httpClient.GetStringAsync("https://www.freeip.top/?page=1");

        var htmlDocument = new HtmlDocument();
        htmlDocument.LoadHtml(html);

        var ipNodes = htmlDocument.DocumentNode.SelectNodes("//tbody/tr/td[1]");
        var portNodes = htmlDocument.DocumentNode.SelectNodes("//tbody/tr/td[2]");

        foreach (var ipNode in ipNodes)
        {
            Console.WriteLine(ipNode.InnerText);
        }

        foreach (var portNode in portNodes)
        {
            Console.WriteLine(portNode.InnerText);
        }
    }
}

以上代码使用HttpClient库发送GET请求获取代理IP网站的HTML代码，然后使用HtmlAgilityPack库将HTML代码解析成DOM树，然后通过XPath选择器提取出IP地址和端口号。

3. 使用代理IP发送请求

获取到代理IP后，我们可以使用HttpClient库进行访问目标网站。以下代码演示了如何使用代理IP发送GET请求：

static async Task Main(string[] args)
{
    var httpClientHandler = new HttpClientHandler()
    {
        UseProxy = true,
        Proxy = new WebProxy("127.0.0.1", 8888) // 代理IP地址和端口号
    };

    var httpClient = new HttpClient(httpClientHandler);
    var html = await httpClient.GetStringAsync("https://www.example.com");

    Console.WriteLine(html);
}

以上代码创建了一个HttpClientHandler对象，设置了代理IP地址和端口号，然后将该对象传递给HttpClient对象。接下来，使用HttpClient对象发送GET请求获取目标网站的内容。

四、常见问题及解决方案

1. 代理IP的可用性

免费代理IP网站提供的代理IP质量参差不齐，有些代理IP可能已经失效。为了保证代理IP的可用性，我们可以使用多线程进行代理IP的检测。以下代码演示了如何使用多线程进行代理IP的检测：

static async Task Main(string[] args)
{
    var httpClient = new HttpClient();
    var html = await httpClient.GetStringAsync("https://www.zdaye.com");

    var htmlDocument = new HtmlDocument();
    htmlDocument.LoadHtml(html);

    var ipNodes = htmlDocument.DocumentNode.SelectNodes("//tbody/tr/td[1]");
    var portNodes = htmlDocument.DocumentNode.SelectNodes("//tbody/tr/td[2]");

    List> tasks = new List>();

    foreach (var ipNode in ipNodes)
    {
        var ip = ipNode.InnerText;
        var port = portNodes[ipNodes.IndexOf(ipNode)].InnerText;
        tasks.Add(IsProxyIpValid(httpClient, ip, port));
    }

    await Task.WhenAll(tasks);

    foreach (var task in tasks)
    {
        if (task.Result)
        {
            Console.WriteLine("该代理IP可用");
        }
        else
        {
            Console.WriteLine("该代理IP不可用");
        }
    }
}

static async Task IsProxyIpValid(HttpClient httpClient, string ip, string port)
{
    try
    {
        var httpClientHandler = new HttpClientHandler()
        {
            UseProxy = true,
            Proxy = new WebProxy(ip, int.Parse(port))
        };

        var httpClient = new HttpClient(httpClientHandler);
        var response = await httpClient.GetAsync("https://www.example.com");

        return response.StatusCode == HttpStatusCode.OK;
    }
    catch
    {
        return false;
    }
}

以上代码使用多线程检测代理IP的可用性，通过向目标网站发起请求，判断响应的状态码是否为200来判断代理IP的有效性。

2. 频繁更换代理IP

有些网站可能对单个IP地址的请求频率进行限制，因此我们可以使用多个代理IP轮流使用，从而规避频率限制。以下代码演示了如何在爬虫程序中轮流使用代理IP：

static async Task Main(string[] args)
{
    var httpClient = new HttpClient();

    var proxyIps = new List() { "127.0.0.1:8888", "127.0.0.1:8889", "127.0.0.1:8890" };
    var currentProxyIpIndex = 0;

    // 循环使用代理IP发送请求
    for (int i = 0; i < 10; i++)
    {
        var currentProxyIp = proxyIps[currentProxyIpIndex];

        var proxyIp = currentProxyIp.Split(':')[0];
        var proxyPort = currentProxyIp.Split(':')[1];

        var httpClientHandler = new HttpClientHandler()
        {
            UseProxy = true,
            Proxy = new WebProxy(proxyIp, int.Parse(proxyPort))
        };

        var httpClient = new HttpClient(httpClientHandler);
        var html = await httpClient.GetStringAsync("https://www.example.com");

        Console.WriteLine(html);

        currentProxyIpIndex = (currentProxyIpIndex + 1) % proxyIps.Count;
    }
}

以上代码使用循环和取模运算符实现了轮流使用代理IP的功能。每次发送请求时，选择下一个代理IP发送请求。这样可以保证每个请求都使用不同的代理IP，提高爬取的效率。

总结

本文介绍了使用C#实现代理IP爬取的方法，并解决了一些常见的问题。在实际的爬虫开发中，代理IP是一个非常有用的工具，可以帮助我们规避反爬虫策略，提高爬取效率。然而，需要注意的是，使用代理IP爬取也可能面临一些挑战，比如代理IP的可用性和频繁更换代理IP等问题，需要我们灵活应对。希望本文对大家理解代理IP爬取有所帮助。

你可能感兴趣的:(c#,爬虫,tcp/ip)

React入门到精通：掌握前端开发的必备技能！知识分享小能手学习心得体会编程语言如门 react.js 前端 javascript
介绍：React是一个由Facebook开发和维护的JavaScript库，用于构建用户界面，特别是用于构建单页应用程序和移动应用程序的用户界面。以下是对React的详细介绍：虚拟DOM：React通过使用虚拟DOM（DocumentObjectModel）来提高应用的性能。虚拟DOM是真实DOM的轻量级副本，React在虚拟DOM上进行操作，然后高效地更新真实DOM，这种方式比直接操作DOM要快
JSON全面解析：轻量级数据交换的核心技术新人码农11111 json python
目录JSON的本质特征⚙️序列化：数据到字符串的转换反序列化：字符串到数据的还原实际应用场景⚠️常见陷阱与解决方案最佳实践建议在当今数据驱动的时代，JSON（JavaScriptObjectNotation）已成为最流行的轻量级数据交换格式。本文将深入剖析JSON的核心特性及其在Python中的应用，帮助开发者高效处理数据序列化与反序列化。JSON的本质特征JSON采用纯文本格式，具有跨平台、易读
软路由 + 代理 IP 实现多手机不同公网 IP 分配教程九州ip动态 tcp/ip 智能手机网络协议
本文将详细介绍如何通过软路由结合代理IP，实现多台手机各自获取不同公网IP，步骤清晰可落地。一，应用场景1.例如手游工作室，为避免游戏检测系统制裁，需要一台设备一个IP，此时可通过实体机搭建ROS软路由，配合兔子IP，2.使每个手机连接不同的WiFi，实现每个WiFi对应一个独立IP，相互之间无关联，就如同每个WiFi都是一个遍布在全国各地的家庭路由器。二，选择软路由和代理IP服务1.软路由选择：
React 开发（一）：入门 - 从 0 到 1 的学习之旅全栈探索者chen react react.js 学习前端前端框架程序人生开发语言 javascript
React开发（一）：入门-从0到1的学习之旅1.前言在前端开发领域，React是一个备受推崇的JavaScript库，广泛应用于构建用户界面。它的组件化架构、虚拟DOM和高效的更新机制使得开发复杂的应用变得更加简洁和高效。在这篇文章中，我们将从零开始学习React，了解它的基本概念和如何搭建第一个项目。2.什么是React？React是一个用于构建用户界面的JavaScript库，由Facebo
云服务器、VPS、虚拟主机三者之间的区别一只IT攻城狮
一、VPSVPS（VirtualPrivateServer虚拟专用服务器）技术，将一台服务器分割成多个虚拟专享服务器的优质服务。实现VPS的技术分为容器技术，和虚拟化技术。在容器或虚拟机中，每个VPS都可分配独立公网IP地址、独立操作系统、实现不同VPS间磁盘空间、内存、CPU资源、进程和系统配置的隔离，为用户和应用程序模拟出“独占”使用计算资源的体验。VPS可以像独立服务器一样，重装操作系统，安
Linux检测远程端口是否打开的六种方法岚天start 运维网络 linux ssh 网络
Linux检测远程端口是否打开的六种方法服务器环境：[root@java-test-server~]#cat/etc/redhat-releaseCentOSLinuxrelease7.6.1810(Core)方法一：Telnet命令【yum-yinstalltelnet】#端口通显示如下（实验IP为自定义IP）[root@java-test-server~]#telnet88.88.88.888
【C# in .NET】18. 探秘接口：契约精神阿蒙Armon C#in .NET c#.net java
探秘接口：契约精神在C#类型系统中，接口扮演着“契约”与“能力”的双重角色，它既是代码抽象的核心工具，也是.NET运行时（CLR）类型系统的重要组成部分。本文将穿透接口的语法表象，从IL代码结构、CLR类型系统实现、方法调度机制三个维度，全面揭示接口的底层工作原理，并结合框架设计实践提炼接口使用的精髓。一、接口的底层本质：并非只是“纯抽象类”接口在C#语法中表现为方法签名的集合，但在CLR层面有着
今天开始奇先生的妙小姐
今天是1/29，我在上开始写作的第一天。这个决定是昨天下的。我持续在自己的iPad上写日记已经有小半年。一直妄想着自己搭一个平台，或者是做一个页面什么的。这种想法很自嗨，却没有实际能力，除了满足自我想象，没有任何意义和价值。昨天看菜头叔的书《你不重要，你的喜欢很重要》，菜头书不仅强调了写作的重要性，还强调了发表与获得评价的重要性。所以，我在昨天把一切准备妥当，今天开始行动。写作这个行为也不是突然一
VSCode WebView React 开源项目实战指南廉珏俭Mercy
VSCodeWebViewReact开源项目实战指南本指南旨在帮助您了解并快速上手vscode-webview-react开源项目，该项目提供了一个基于React和TypeScript的起点，用于在VisualStudioCode的Webview中开发扩展。以下是核心模块的详细介绍：1.项目目录结构及介绍├──package.json//项目配置文件，包括依赖、scripts命令等├──publi
2020-04-29 eMAGMA 基于基因的关联分析（Part1）程凉皮儿
输入数据准备本教程要求eMAGMA文件,软件(MAGMA)和辅助文件都在同一个目录下如果你的文件在不同的目录上，请在命令行加入路径信息cd/path/yourworkingfolder/eMAGMA解压缩软件包及辅助文件：magma_v1.07b.zip,NCBI37.3.zip和MDD2018_excluding23andMe(下载自PGCwebsite).unzip[filename].zip
高防IP与高防CDN有哪些区别呢？肖家山子龙
为了避免因为攻击导致的服务器瘫痪，运营商们通常会选择具备高防御的服务器来进行运营。如果是在运营过程中遭遇了攻击，不想去更换服务器的话。这个时候，就可以采用添加高防IP或者高防CDN的形式去防御了。那么在使用上，高防IP与高防CDN有哪些区别呢？区别一：应用场景的不同高防IP与高防CDN都是具备防御攻击特性的两种产品。但是在应用上，两者应用的范围是有区别的，高防IP主要是应用在游戏上居多。而高防CD
Leetcode 523. Continuous Subarray Sum SnailTyan
文章作者：Tyan博客：noahsnail.com|CSDN|1.DescriptionContinuousSubarraySum2.Solution解析：Version1，使用前缀和来解决，遍历数组，求前缀和，求前缀和与k的余数，余数在字典中存在时，则意味着当前前缀和减去之前的前缀和等于k的倍数，此时计算两个前缀和的长度差，如果大于等于2，则返回True，如果余数不存在，则将余数保存在字典中并记
我怕的不是你沉迷iPad，我怕的是你失去遇见其他美好事物的机会一玫艾姐
“正如大小拾光的介绍所说，除了植物芳疗、花草艺术，偶尔我们也会有些其他类型的文章。这些内容的产出，我们跟着灵感走。我们只是觉得，日常的平凡，是最美好的。”晚饭后，得知贾同学连续几天白天在家没练琴，再一看他正手捧iPad玩游戏，我不由河东狮吼了起来。转念一想，还是要正面管教，我就先回房自我冷静。过不多时，贾同学主动来找我，说让我把iPad收起来，并且保证少玩游戏。说罢，他放下iPad，跑去弹琴。听着
pytest-bdd 行为驱动自动化测试东汉末年出bug pytest python pytest-bdd
引言pytest-bdd是一个专为Python设计的行为驱动开发（BDD）测试框架，它允许开发人员使用自然语言（如Gherkin）来编写测试用例，从而使测试用例更易于理解和维护。安装通过pip安装pipinstallpytest-bdd介绍特性文件（FeatureFile）：定义了要测试的系统功能。通常以.feature为扩展名，并使用Gherkin语言编写。特性文件包含特性名称、描述以及一个或多
反编译工具apktool的下载安装及使用Mac版教程
反编译工具apktool的下载安装及使用注意：运行Apktool至少需要Java8！下载下载地址：https://apktool.org/docs/install进入下载地址找到Mac栏下找到wrapperscript.对着这个链接右键选择存储为，然后命名为apktool文件，不需要加后缀名根据提示点击latestversion下载最新版本Apktool，将下载的jar重命名为apktool.ja
黄仁勋对话Transformer七子：模型的未来在于数据质量，而非规模强化学习曾小健 #AI商业/产品/投融资前沿 #LLM大语言模型 transformer 深度学习人工智能
黄仁勋对话Transformer七子：模型的未来在于数据质量，而非规模乌鸦智能说2024-03-2216:14在今年的GTC大会上，英伟达CEO黄仁勋邀请了Transformer的七位作者（NikiParmar因故临时未能出席）参与圆桌论坛的讨论，这是Transformer团队首次在公开场合集体亮相。2017年，八位在谷歌工作的AI科学家发表了一篇名为《AttentionIsAllYouNeed》
JS获取 CSS 中定义var变量值前端贾公子 tensorflow 人工智能 python
目录示例代码CSS3:root选择器CSSStyleDeclarationgetPropertyValue()方法styleSheetscssRules关键特性使用示例注意事项典型应用场景WindowgetComputedStyle()方法WindowgetComputedStyle()方法和style的异同在JavaScript中，可以通过getComputedStyle()方法结合getPro
FATAL ERROR: Reached heap limit Allocation failed - JavaScript heap out of memory node编译时的内存溢出周不凢 node node.js
报错：FATALERROR:ReachedheaplimitAllocationfailed-JavaScriptheapoutofmemory原因：node编译时的内存溢出，因为打包文件过大，刚好超过内存的限制大小造成编译中断。解决方法1：通过package.json中的"build"加大内存增加--max_old_space_size参"scripts":{"dev":"nodebuild/d
深度对比：innerHTML vs 虚拟DOM——原理、性能与应用全解析止观止前端前端框架前端 html5 javascript reactjs xss
引言在现代Web开发中，高效操作DOM（文档对象模型）是构建高性能应用的关键。传统方法如innerHTML和新兴的虚拟DOM（VirtualDOM）技术代表了两种截然不同的DOM更新策略。innerHTML作为浏览器原生API，直接操纵HTML字符串；虚拟DOM则是通过JavaScript对象树进行优化更新，广泛应用于React、Vue等框架。本文深入对比两者的核心原理、技术细节、应用场景及优劣，
Paimon：Range Partition and Sort优化无主键表（Append-Only Table）查询 lifallen Paimon 数据库大数据数据结构 java apache
这个优化是通过对数据进行全局排序，从而让查询时能够跳过大量不相关的数据文件（DataSkipping），极大地减少I/O，提升查询速度。只需要在执行INSERT语句时，通过OPTIONSHint来启用和配置这个功能即可。RangePartitionAndSortForUnawareBucketTableITCase测试文件本身就是最好的例子。比如测试中的这句SQL：INSERTINTOtest_t
【C# in .NET】17. 探秘类成员-构造函数与析构函数：对象生命周期管理阿蒙Armon C#in .NET c#.net java
探秘类成员-构造函数与析构函数：对象生命周期管理在C#的类成员体系中，构造函数与析构函数承担着对象生命周期管理的核心职责。它们看似简单，却蕴含着与.NET运行时（CLR）深度交互的底层逻辑。本文将从IL代码解析、内存操作机制、CLR调度原理三个维度，全面揭秘这对特殊成员的工作原理，并结合实战场景提炼最佳实践。一、构造函数：对象诞生的幕后推手构造函数是类实例化过程中执行初始化操作的特殊方法，它的底层
【C# in .NET】9. 探秘委托：函数抽象的底层机制阿蒙Armon C#in .NET c#.net java
探秘委托：函数抽象的底层机制在C#的类型系统中，委托（Delegate）作为函数的抽象容器，架起了面向对象与函数式编程的桥梁。它不仅是事件驱动编程的核心，更是LINQ、异步编程等现代C#特性的基础。与类和结构体相比，委托的底层实现融合了引用类型的内存管理与函数指针的调用特性，涉及CLR对方法调度的深度优化。本文将从IL指令解析到JIT编译细节，全面揭示委托的本质机制，带你理解这一特殊类型如何在.N
【C# in .NET】2. 探秘数据类型：构建程序的基石阿蒙Armon C#in .NET c#.net java
探秘数据类型：构建程序的基石在C#编程中，数据类型是构建程序的基石。无论是简单的整数计算还是复杂的对象交互，都离不开对数据类型的精准运用。然而，大多数开发者对数据类型的理解往往停留在表面语法层面，忽视了其在.NET框架底层的运行机制。本文将从CLR（公共语言运行时）的视角，深入剖析C#数据类型的本质、内存布局与核心机制，带你看透数据类型背后的底层逻辑。一、数据类型的本质：CLR类型系统的双轨制.N
那个情人节送Harry Winston钻戒的土豪程序猿程序员1024故事集
情人节那天A在群里发了张F君的朋友圈，大呼这是今天见过的朋友圈里最土豪的礼物了！只见在法拉利的车里，娇艳的红玫瑰簇拥着一个HarryWinston的心形钻戒！原本只知道F君有钱，可没想到这么有钱。以前看GossipGirls里一众名媛的唯一选择就是HarryWinston，据说号称是钻石之王。以下是HarryWinston的百科资料：享誉全球超过百年的超级珠宝品牌，在切割钻石上的精湛工艺与周密谨慎
linux安装Node.js 环境，Docker 环境，Ruby 环境，MongoDB 环境，PostgreSQL 数据库，Go 开发环境，Python 虚拟环境 2401_87017622 数据库 linux node.js
在Linux上安装其他常见的开发环境可以根据具体需求而定，以下是一些常见的安装步骤：1.Node.js环境Node.js是一个基于ChromeV8引擎的JavaScript运行环境，适用于服务器端开发。安装Node.js：通过包管理器安装：sudoyuminstall-ygcc-c++makecurl-sLhttps://rpm.nodesource.com/setup_14.x|sudo-Eba
常用的折叠展开过渡动画效果css
如何实现优雅的折叠展开动画效果在现代Web设计中，折叠展开动画是一种常见且实用的交互方式，它可以帮助用户在保持界面简洁的同时，灵活控制内容的显示与隐藏。本文将分享如何使用HTML、CSS和JavaScript实现一个平滑流畅的折叠展开动画效果。基本原理折叠展开动画的核心原理是通过CSS过渡(transition)来控制元素的高度、内边距和其他样式属性的变化。当用户点击触发按钮时，JavaScrip
Redux架构解析：状态管理的核心原理止观止架构前端 react.js redux
Redux作为JavaScript应用的状态管理库，其技术架构与核心原理围绕可预测的状态管理设计，通过严格的单向数据流和函数式编程理念实现复杂应用的状态控制。以下从设计理念、核心架构、工作流程、源码实现等角度进行系统性剖析：一、设计理念与原则单一数据源（SingleSourceofTruth）整个应用的状态存储在一个全局Store对象中，形成唯一的状态树（StateTree）。优势：简化状态共享和
Http与Https区别和联系
一、HTTP详解HTTP（HyperTextTransferProtocol）是互联网数据通信的基础协议，用于客户端（浏览器）与服务器之间的请求-响应交互核心特性：1.无连接（Connectionless）每次请求/响应后立即断开TCP连接（早期HTTP/1.0）。HTTP/1.1默认启用持久连接（Connection:keep-alive），但逻辑上仍视为独立的请求2.无状态（Stateless
Mac 下 python 安装 virtualenv 出错 stay_f_h
如果是安装了anaconda的机器，直接用pipinstallvirtualenv可能会由于版本的问题出错，建议使用sudocondainstallvirtualenv安装。
scrapy 一定要自定义USER_AGENT 魔童转世
原因是因为有的网站设置的是不允许爬虫请求，而srapy默认请求是带着一个标识告诉网站我就是爬虫，网站当然不允许爬去了偶然间在一个网站上看到的内容并且也跳过坑USER_AGENT='Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/65.0.3325.181Safari/537.36'
项目中枚举与注解的结合使用飞翔的马甲 java enum annotation
前言：版本兼容，一直是迭代开发头疼的事，最近新版本加上了支持新题型，如果新创建一份问卷包含了新题型，那旧版本客户端就不支持，如果新创建的问卷不包含新题型，那么新旧客户端都支持。这里面我们通过给问卷类型枚举增加自定义注解的方式完成。顺便巩固下枚举与注解。一、枚举 1.在创建枚举类的时候，该类已继承java.lang.Enum类，所以自定义枚举类无法继承别的类，但可以实现接口。
【Scala十七】Scala核心十一：下划线_的用法 bit1129 scala
下划线_在Scala中广泛应用，_的基本含义是作为占位符使用。_在使用时是出问题非常多的地方，本文将不断完善_的使用场景以及所表达的含义 1. 在高阶函数中使用 scala> val list = List(-3,8,7,9) list: List[Int] = List(-3, 8, 7, 9) scala> list.filter(_ > 7) r
web缓存基础：术语、http报头和缓存策略 dalan_123 Web
对于很多人来说，去访问某一个站点，若是该站点能够提供智能化的内容缓存来提高用户体验，那么最终该站点的访问者将络绎不绝。缓存或者对之前的请求临时存储，是http协议实现中最核心的内容分发策略之一。分发路径中的组件均可以缓存内容来加速后续的请求，这是受控于对该内容所声明的缓存策略。接下来将讨web内容缓存策略的基本概念，具体包括如如何选择缓存策略以保证互联网范围内的缓存能够正确处理的您的内容，并谈论下
crontab 问题周凡杨 linux crontab unix
一： 0481-079 Reached a symbol that is not expected. 背景： */5 * * * * /usr/IBMIHS/rsync.sh
让tomcat支持2级域名共享session g21121 session
tomcat默认情况下是不支持2级域名共享session的，所有有些情况下登陆后从主域名跳转到子域名会发生链接session不相同的情况，但是只需修改几处配置就可以了。打开tomcat下conf下context.xml文件找到Context标签,修改为如下内容如果你的域名是www.test.com <Context sessionCookiePath="/path&q
web报表工具FineReport常用函数的用法总结（数学和三角函数）老A不折腾 Web finereport 总结
ABS ABS(number):返回指定数字的绝对值。绝对值是指没有正负符号的数值。 Number:需要求出绝对值的任意实数。示例: ABS(-1.5)等于1.5。 ABS(0)等于0。 ABS(2.5)等于2.5。 ACOS ACOS(number):返回指定数值的反余弦值。反余弦值为一个角度，返回角度以弧度形式表示。 Number:需要返回角
linux 启动java进程 sh文件墙头上一根草 linux shell jar
#!/bin/bash #初始化服务器的进程PId变量 user_pid=0; robot_pid=0; loadlort_pid=0; gateway_pid=0; ######### #检查相关服务器是否启动成功 #说明： #使用JDK自带的JPS命令及grep命令组合，准确查找pid #jps 加 l 参数，表示显示java的完整包路径 #使用awk，分割出pid
我的spring学习笔记5-如何使用ApplicationContext替换BeanFactory aijuans Spring 3 系列
如何使用ApplicationContext替换BeanFactory？ package onlyfun.caterpillar.device; import org.springframework.beans.factory.BeanFactory; import org.springframework.beans.factory.xml.XmlBeanFactory; import
Linux 内存使用方法详细解析 annan211 linux 内存 Linux内存解析
来源 http://blog.jobbole.com/45748/ 我是一名程序员，那么我在这里以一个程序员的角度来讲解Linux内存的使用。一提到内存管理，我们头脑中闪出的两个概念，就是虚拟内存，与物理内存。这两个概念主要来自于linux内核的支持。 Linux在内存管理上份为两级，一级是线性区，类似于00c73000-00c88000，对应于虚拟内存，它实际上不占用
数据库的单表查询常用命令及使用方法(-) 百合不是茶 oracle 函数单表查询
创建数据库; --建表 create table bloguser(username varchar2(20),userage number(10),usersex char(2)); 创建bloguser表,里面有三个字段 &nbs
多线程基础知识 bijian1013 java 多线程 thread java多线程
一．进程和线程进程就是一个在内存中独立运行的程序，有自己的地址空间。如正在运行的写字板程序就是一个进程。 “多任务”：指操作系统能同时运行多个进程（程序）。如WINDOWS系统可以同时运行写字板程序、画图程序、WORD、Eclipse等。线程：是进程内部单一的一个顺序控制流。线程和进程 a. 每个进程都有独立的
fastjson简单使用实例 bijian1013 fastjson
一.简介阿里巴巴fastjson是一个Java语言编写的高性能功能完善的JSON库。它采用一种“假定有序快速匹配”的算法，把JSON Parse的性能提升到极致，是目前Java语言中最快的JSON库；包括“序列化”和“反序列化”两部分，它具备如下特征：
【RPC框架Burlap】Spring集成Burlap bit1129 spring
Burlap和Hessian同属于codehaus的RPC调用框架，但是Burlap已经几年不更新，所以Spring在4.0里已经将Burlap的支持置为Deprecated,所以在选择RPC框架时，不应该考虑Burlap了。这篇文章还是记录下Burlap的用法吧，主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成
【Mahout一】基于Mahout 命令参数含义 bit1129 Mahout
1. mahout seqdirectory $ mahout seqdirectory --input (-i) input Path to job input directory(原始文本文件). --output (-o) output The directory pathna
linux使用flock文件锁解决脚本重复执行问题 ronin47 linux lock　重复执行
linux的crontab命令，可以定时执行操作，最小周期是每分钟执行一次。关于crontab实现每秒执行可参考我之前的文章《linux crontab 实现每秒执行》现在有个问题，如果设定了任务每分钟执行一次，但有可能一分钟内任务并没有执行完成，这时系统会再执行任务。导致两个相同的任务在执行。例如： <? // test .php
java-74-数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 bylijinnan java
public class OcuppyMoreThanHalf { /** * Q74 数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 * two solutions: * 1.O(n) * see <beauty of coding>--每次删除两个不同的数字，不改变数组的特性 * 2.O(nlogn) * 排序。中间
linux 系统相关命令 candiio linux
系统参数 cat /proc/cpuinfo cpu相关参数 cat /proc/meminfo 内存相关参数 cat /proc/loadavg 负载情况性能参数 1）top M：按内存使用排序 P：按CPU占用排序 1：显示各CPU的使用情况 k：kill进程 o：更多排序规则回车：刷新数据 2）ulimit ulimit -a：显示本用户的系统限制参
[经营与资产]保持独立性和稳定性对于软件开发的重要意义 comsci 软件开发
一个软件的架构从诞生到成熟，中间要经过很多次的修正和改造如果在这个过程中，外界的其它行业的资本不断的介入这种软件架构的升级过程中那么软件开发者原有的设计思想和开发路线
在CentOS5.5上编译OpenJDK6 Cwind linux OpenJDK
几番周折终于在自己的CentOS5.5上编译成功了OpenJDK6，将编译过程和遇到的问题作一简要记录，备查。 0. OpenJDK介绍 OpenJDK是Sun（现Oracle）公司发布的基于GPL许可的Java平台的实现。其优点： 1、它的核心代码与同时期Sun（-> Oracle）的产品版基本上是一样的，血统纯正，不用担心性能问题，也基本上没什么兼容性问题；（代码上最主要的差异是
java乱码问题 dashuaifu java乱码问题 js中文乱码
swfupload上传文件参数值为中文传递到后台接收中文乱码在js中用setPostParams（{"tag" : encodeURI( document.getElementByIdx_x("filetag").value，"utf-8")}）; 然后在servlet中String t
cygwin很多命令显示command not found的解决办法 dcj3sjt126com cygwin
cygwin很多命令显示command not found的解决办法修改cygwin.BAT文件如下 @echo off D: set CYGWIN=tty notitle glob set PATH=%PATH%;d:\cygwin\bin;d:\cygwin\sbin;d:\cygwin\usr\bin;d:\cygwin\usr\sbin;d:\cygwin\us
[介绍]从 Yii 1.1 升级 dcj3sjt126com PHP yii2
2.0 版框架是完全重写的，在 1.1 和 2.0 两个版本之间存在相当多差异。因此从 1.1 版升级并不像小版本间的跨越那么简单，通过本指南你将会了解两个版本间主要的不同之处。如果你之前没有用过 Yii 1.1，可以跳过本章，直接从"入门篇"开始读起。请注意，Yii 2.0 引入了很多本章并没有涉及到的新功能。强烈建议你通读整部权威指南来了解所有新特性。这样有可能会发
Linux SSH免登录配置总结 eksliang ssh-keygen Linux SSH免登录认证 Linux SSH互信
转载请出自出处：http://eksliang.iteye.com/blog/2187265 一、原理我们使用ssh-keygen在ServerA上生成私钥跟公钥，将生成的公钥拷贝到远程机器ServerB上后,就可以使用ssh命令无需密码登录到另外一台机器ServerB上。生成公钥与私钥有两种加密方式，第一种是
手势滑动销毁Activity gundumw100 android
老是效仿ios，做android的真悲催！有需求：需要手势滑动销毁一个Activity 怎么办尼？自己写？不用~，网上先问一下百度。结果： http://blog.csdn.net/xiaanming/article/details/20934541 首先将你需要的Activity继承SwipeBackActivity，它会在你的布局根目录新增一层SwipeBackLay
JavaScript变换表格边框颜色 ini JavaScript html Web html5 css
效果查看：http://hovertree.com/texiao/js/2.htm代码如下，保存到HTML文件也可以查看效果： <html> <head> <meta charset="utf-8"> <title>表格边框变换颜色代码-何问起</title> </head> <body&
Kafka Rest : Confluent kane_xie kafka REST confluent
最近拿到一个kafka rest的需求，但kafka暂时还没有提供rest api（应该是有在开发中，毕竟rest这么火），上网搜了一下，找到一个Confluent Platform，本文简单介绍一下安装。这里插一句，给大家推荐一个九尾搜索，原名叫谷粉SOSO，不想fanqiang谷歌的可以用这个。以前在外企用谷歌用习惯了，出来之后用度娘搜技术问题，那匹配度简直感人。环境声明：Ubu
Calender不是单例 men4661273 单例 Calender
在我们使用Calender的时候，使用过Calendar.getInstance()来获取一个日期类的对象，这种方式跟单例的获取方式一样，那么它到底是不是单例呢，如果是单例的话，一个对象修改内容之后，另外一个线程中的数据不久乱套了吗？从试验以及源码中可以得出，Calendar不是单例。测试： Calendar c1 =
线程内存和主内存之间联系 qifeifei java thread
1， java多线程共享主内存中变量的时候，一共会经过几个阶段， lock:将主内存中的变量锁定，为一个线程所独占。 unclock:将lock加的锁定解除，此时其它的线程可以有机会访问此变量。 read:将主内存中的变量值读到工作内存当中。 load:将read读取的值保存到工作内存中的变量副本中。
schedule和scheduleAtFixedRate tangqi609567707 java timer schedule
原文地址：http://blog.csdn.net/weidan1121/article/details/527307 import java.util.Timer;import java.util.TimerTask;import java.util.Date; /** * @author vincent */public class TimerTest {
erlang 部署 wudixiaotie erlang
1.如果在启动节点的时候报这个错： {"init terminating in do_boot",{'cannot load',elf_format,get_files}} 则需要在reltool.config中加入 {app, hipe, [{incl_cond, exclude}]}, 2.当generate时，遇到： ERROR

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他