进击的狐狸

由C#编写的多线程异步抓取网页的网络爬虫控制台程序

一、本程序的主要功能

对网络链接进行抓取，把链接地址保存成文件，如下图：

二、实现本程序的主要类

1、WebPage类

WebPage类编写者另有其人，类Link的定义在他博文的留言区，这是他的博文地址 http://blog.csdn.net/yysyangyangyangshan/article/details/6661886

WebPage类很强大，主要可以抓取一个网址里面的文本和链接。不过因为未经作者同意，不能转载，所以这里不贴出他的代码了。

需要注意的是，WebPage类里面的几个私有成员没有初始化，程序在链接数目比较大时会报错，所以需要小改动，把相关成员变量赋初始值，就可以了。另外这个类不能处理https开头的链接，注意有个“s”，只能处理http开头的链接，具体原因还在调查中。

2、Link类

WebPage类的成员变量需要定义的类，只有两个属性，并不复杂，具体去看他的博文留言区。

3、主程序Program类

这个类是我写的，主要是多线程处理WebPage类抓下来的网址链接，具体可以看下面源代码，注释的也比较详细，这里就不多说了，程序的运行截图如下：

///

/// 主程序编写作者：大黑

/// （WebPage类编写者另有其人，类Link的定义在他博文的留言区，这是他的博文地址http://blog.csdn.net/yysyangyangyangshan/article/details/6661886）

/// 描述：由C#编写的多线程异步抓取网页的网络爬虫控制台程序

/// 功能：目前只能提取网络链接，所用的两个记录文件并不需要很大。网页文本、图片、视频和html代码暂时不能抓取，请见谅。

/// 但需要注意，网页的数目是非常庞大的，如下代码理论上大概可以把整个互联网网页链接都抓下来。

/// 但事实上，由于处理器功能和网络条件（主要是网速）限制，一般的家用电脑最多能胜任12个线程左右的抓取任务，抓取速度有限。可以抓取，但需要时间和耐心。

/// 当然，这个程序把所有链接抓下来是可能的，因为链接占系统空间并不多，而且有记录文件的帮助，已抓取网页的数量可以堆积下去，

/// 甚至可以把所有的互联网网络链接都存取下来，当然，最好是分批次。建议设置maxNum为500-1000左右，慢慢累积下去。

/// 另外因为是控制台程序，有时候显示字符过多会系统会暂停显示，这时候只要点击控制台按下回车键就可以了。程序假死的时候，可以按回车键（Enter）试试。

/// 使用本程序，请确保已创建相应的记录文件，出于简化代码的考虑，本程序做的并不健壮，请见谅。

/// 默认的文件创建在E盘根目录“已抓取网址.txt”和“待抓取网址.txt”这两个文本文件中，使用者需要自行创建这两个文件，注意后缀名不要搞错。

/// 这两个文件里面的链接基本都是有效链接，可以单独处理使用。

/// 本爬虫程序的速度如下：

/// 10线程最快大概500个链接每分钟

/// 6-8线程最快大概400-500个链接每分钟

/// 2-4线程最快大概200-400个链接每分钟

/// 单线程最快大概70-100个链接每分钟

/// 之所以用多线程异步抓取完全是出于效率考虑，本程序多线程同步并不能带来速度的提升，只要抓取的网页不要太多重复和冗余就可以，异步并不意味着错误。

///

class Program

{

//默认的种子网址，可以改动。尽量保持不同的网址，可以提高效率。

//另外注意改的时候“,”符号要注意，别改错了，要英文逗号。

//默认是3线程3个种子网址，最多12线程12个网址，如果要12个以上，可以自己在后面添加。线程设定为12个以上时，必须添加网址，不然会出错

//每个网址对应一个线程，即6线程对应6网址，12线程对应12网址，改默认值的时候要注意parts和数组linkArray的对应关系。

//实测当CPU是i5处理器时，最多运行8-10线程，会伴有严重的卡顿。线程数越高，对CPU要求越高。一般CPU 2-4线程就可以。

static string[] linkArray = { "http://www.163.com/", "http://www.sohu.com/", "http://www.ifeng.com/",

"http://www.sina.com.cn/","http://wan.360.cn/?src=hao-mz-top01","http://www.pconline.com.cn/?ad=6347&360hot_site",

"http://ai.taobao.com/?pid=mm_26632323_6762370_25910879","http://www.apple.com/cn/","http://www.zol.com.cn/",

"http://www.yesky.com/","http://www.asus.com.cn/","http://edu.360.cn/yingyu/",

};

//设定存放已抓取网址列表的文件路径

static string urlCapturedDir = @"E:\已抓取网址.txt";

//设定存放未抓取网址列表的文件路径

static string myLinkDir = @"E:\待抓取网址.txt";

//同时抓取网址的线程数

private static int parts=3;

//目前抓取的网页数量

private static int count=0;

//设定的最多抓取网页的数量

private static int maxNum=500;

//待抓取的网址链表

private static List<string> myLink=new List<string>();

//已抓取的网址链表

private static List<string> urlCaptured=new List<string>();

//用于临时存放待抓取的某一个网址

private static string strLink = "";

public Program(string link)

{

myLink.Add(link);

}

public void doWork()

{

Console.WriteLine("working...");

while ((myLink.Count != 0) && (count < maxNum))

{

strLink = myLink[0];

if (!urlCaptured.Contains(strLink))

{

//加入已抓取队列

urlCaptured.Add(strLink);

//当前抓取的网页数量

count++;

//通过WebPage类抓取

WebPage tempWeb = new WebPage(strLink);

Console.WriteLine("网址" + strLink + "共有" + tempWeb.Links.Count + "个链接");

foreach (Link li in tempWeb.Links)

{

//确保不重复抓取

if (!myLink.Contains(li.NavigateUrl))

myLink.Add(li.NavigateUrl);

}

Console.WriteLine("待抓取网页的数目是：" + myLink.Count);

//确保不重复抓取，此句多线程运行会报错

while(myLink.Remove(strLink));

}

else

{

//删除重复网址

while (myLink.Remove(strLink)) ;

}

Console.WriteLine("目前共抓取了" + count + "个网页");

}

static void printLinks(List<string> links)

{

foreach(string s in links)

{

Console.WriteLine(s);

}

static void Main(string[] args)

{

//读取已处理网址列表（urlCaptured）

string[] lines = System.IO.File.ReadAllLines(urlCapturedDir);

int urlCapturedIndex = 0;

foreach (string line in lines)

{

//if (!urlCaptured.Contains(line))

{

urlCaptured.Add(line);

urlCapturedIndex++;

if(urlCapturedIndex%2000==0)

{

Console.WriteLine("已导入" + urlCapturedIndex + "项已抓取网址");

}

// 显示已抓取网址列表

Console.WriteLine("已读取已处理网址列表，共"+urlCaptured.Count+"条信息：");

//未抓取网址初始化

string[] lines2 = System.IO.File.ReadAllLines(myLinkDir);

int myLinkIndex = 0;

foreach (string line in lines2)

{

//Contains方法太耗时

//if (!myLink.Contains(line))

{

myLink.Add(line);

myLinkIndex++;

if(myLinkIndex%2000==0)

{

Console.WriteLine("已导入" + myLinkIndex + "项待抓取网址");

}

// 显示未抓取网址列表

Console.WriteLine("已读取未抓取网址列表，共" + myLink.Count + "条信息：");

System.Threading.Thread[] threads = new System.Threading.Thread[parts];

for (int i = 0; i < parts; i++)

{

string str_l = linkArray[i];

Program p = new Program(str_l);

System.Threading.Thread t = new System.Threading.Thread(new System.Threading.ThreadStart(p.doWork));

threads[i] = t;

threads[i].Name = "Thread" + i.ToString();

}

for (int i = 0; i < parts; i++)

{

threads[i].Start();

}

//为了确保 Main 函数不会尝试在辅助线程有机会执行结束之前将它终止

//Main 函数将一直循环，直到辅助线程对象的 IsAlive 属性设置为 false

//必须用while，表示线程都已经执行完了

for (int i = 0; i < parts; i++)

{

while (threads[i].IsAlive)

{

;

}

Console.WriteLine("一共抓取了" + urlCaptured.Count + "个网址");

Console.WriteLine("待处理的网址共有：" + myLink.Count + "个");

Console.WriteLine("检查重复项....");

List<string> temp_l = new List<string>();

foreach (string str in urlCaptured)

{

if (!temp_l.Contains(str))

{

temp_l.Add(str);

}

else

{

Console.WriteLine("网址" + str + "重复");

}

Console.WriteLine("共有" + (urlCaptured.Count - temp_l.Count) + "项是重复网址");

urlCaptured = temp_l;

Console.WriteLine("已抓取网址写入文件...");

//对已抓取的网址进行排序

urlCaptured.Sort();

using (System.IO.StreamWriter file =

new System.IO.StreamWriter(urlCapturedDir))

{

foreach(string s in urlCaptured)

{

file.WriteLine(s);

}

Console.WriteLine("已抓取网址写入完成");

Console.WriteLine("待处理网址写入文件...");

myLink.Sort();

using (System.IO.StreamWriter file =

new System.IO.StreamWriter(myLinkDir))

{

foreach (string s in myLink)

{

file.WriteLine(s);

}

Console.WriteLine("待抓取网址写入完成");

//下面的句子表示保持显示当前控制台命令行，不然控制台会一闪而过

Console.WriteLine("按任意键退出...");

Console.ReadKey();

}

源代码下载地址：http://download.csdn.net/detail/ciel_arc/9428747

默认的文件保存在E盘根目录“已抓取网址.txt”和“待抓取网址.txt”这两个文本文件中，使用者需要自行创建这两个文件，注意后缀名不要搞错。

c# EasyModbus Modbus TCP 通讯 babala_s c#服务器数据库
publicstaticModbusClientmodbusClient=null;publicMainViewModel(){modbusClient=newModbusClient("192.168.0.202",502);try{modbusClient.UnitIdentifier=1;//地址modbusClient.Baudrate=9600;modbusClient.Connecti
C# 分部类详解千亦学不会编程 c#开发语言
从C#2.0起支持分部类。分部类：是一个类的多个部分，编译器可把它们合并成一个完整的类。分部类的目的：将一个类的定义划分到多个文件中。通过分部类，由工具处理的文件可独立于开发者手动编码的文件。1.1定义分部类使用class前的上下文关键字partial来声明分部类。例子：partialclassProgram{}1.2分部方法从C#3.0引入分部方法概念，对C#2.0的分部类进行了扩展。分部方法只
探秘C# .NET Core Health Checks：从零打造全方位应用健康监测系统——实战代码解析与深度注释墨瑾轩一起学学C#【一】c#.netcore 开发语言
在C#中，.NETCoreHealthChecks提供了一种标准化的方式来监控应用程序及其依赖项的运行状态。这种健康检查机制允许开发人员轻松地集成各种自定义检查，确保系统的健康状况，并通过HTTP接口对外暴露检查结果，便于监控工具或服务发现组件进行自动化监控。以下我们将详细阐述如何在.NETCore中实现健康检查，并附带代码示例及详尽注释。1.安装HealthChecksNuGet包首先，需要在项
.NET c#知识点小补充豆皮没有豆 .Net基础-c#c#基础 .net
1.面向对象：（1)对象：在程序中我们可以把任何事物来映射显示生活中的万事万物，那么我们把这些事物称之为对象。对象：属性、方法(主动）、事件（被动）。（2)面向对象：使用这种语言通过描述属性以及行为进行构造一个对象。（3)集成开发环境：具有代码的编辑、编译、检测、运行。a.所有的文件（.cs/.java/.py/.html。。。。）只是装载代码的一个载体文件。b.其承载的代码若要实现其具有的功能，
软件开发面试题C#，.NET知识点（续） .房东的猫 c#.net
1.C#中的封装是什么，以及它的重要性。封装（Encapsulation）是面向对象编程（OOP）的一个基本概念。它指的是将对象的状态（属性）和行为（方法）绑定在一起，并且将这些细节隐藏起来，只暴露必要的接口给外部使用。这样做的好处包括：提高代码的安全性：通过将数据隐藏在类内部，并通过公共方法（getters和setters）来访问和修改这些数据，可以防止外部代码直接修改类的内部状态，从而保护数据
c# Xml 和 Json 转换方法记录 Greyscarf linux 运维服务器
c#xml转json在C#中，可以使用下面几种方法将XML转换为JSON：使用Newtonsoft.Json库：usingNewtonsoft.Json;usingNewtonsoft.Json.Converters;usingNewtonsoft.Json.Linq;usingSystem.Xml;//从XML字符串转换为JSON字符串stringxmlString="John30";XmlDo
C#请求队列后台服务 ~请叫我小祸害~ .NET/C#c#jvm 开发语言
队列执行1、首先需要一个公共类里面有我们的队列需要执行的方法这个方法最好是一个单独的不受别的控制器影响的class。因为你如果声明错位置的话一不小心就会把我们的队列重置。导致队列内容丢失造成损失。大家如果有某些方法运行时间太长但又需要快速给出结果，就可以利用队列，我们这边直接给她结果。然后具体操作我们在内部慢慢执行。//比如说我这里新建一个Class专门用来存放这个方法和队列内容容器publicc
.NET/C# 生成二维码 ~请叫我小祸害~ .NET/C#.net c#开发语言 javascript
大家好，在本章是如何通过.net/C#来生成二维码首先大家还是需要仔细阅读这篇文档有小细节就需要注意大家需要生成一些类，把我的方法复制进去，如果不想添加类的话，大家需要再主代码上更改引用信息找到我们所添加的方法不适用于零基础的朋友，适用于有点经验的懂一点代码的就行1、首先我们新建一个自己的项目.netcore或其他项目新建好后新建一个控制器我们需要在里面写自己的代码，在控制器里面生成一个index
C# WinForm【DataTable分页查询与数据导出到Excel】 Easonflowers VS实战 c#excel
准备：主要控件saveFileDialog保存文件bindingNavigator分页控件bindingSource绑定数据源引用命名空间usingSystem;usingSystem.Data;usingSystem.Windows.Forms;usingExcel=Microsoft.Office.Interop.Excel;usingSystem.Data.SqlClient;namespa
C# DataTable 导出CSV 文件并在客户端下载茶暖人凉 c#excel
publicstaticboolExportToCSV(System.Data.DataTabledt){stringstrLine="";stringpathFile=String.Format("{0}{1}.csv",HttpContext.Current.Server.MapPath("Excel/"),"客户列表");//文件保存路径及名称FileInfofi=newFileInfo(p
c#中将数据库数据导出到EXCEL中 lujunql 技术 excel 数据库 c#microsoft library string
我分以下几步进行介绍：1，新建一个C#应用程序，在对话框上放置一个按钮，Name=buttonOutput,Text=Output,用这个按钮激发导出程序；2，添加对“MicrosoftExcel9.0ObjectLibrary”的引用，根据自己计算机上安装Office版本的来确定Library的版本；3，在代码中加入引用：usingExcel;usingSystem.Reflection;4，在
C# WebAPI的几种返回类型方式她说彩礼65万 c#http
在ASP.NETCore中有三种返回数据和HTTP状态码的方式，最简单的就是直接返回指定的类型实例，如下代码所示：[ApiController][Route("[controller]")]publicclassWeatherForecastController:ControllerBase{[HttpGet]publicIEnumerableGet(){varrng=newRandom();re
工业相机视频播放(RTSP) CHHC1880 工业相机 rtsp ffmpeg 推流
需求：工业相机图像能在rtsp流上播放。实现手段：C#利用工业相机的SDK拿到图后，通过ffmpeg管道推给流媒体程序，再转流播放。模拟测试：两张图在rtsp上进行轮播
C# 项目常用库 OSwich wpf
1.MVVM框架(CommunityToolkit.Mvvm)平台和运行时库相独立-.NET2.0标准和.NET5（与UI框架无关）简单易用-在程序结构和编码范式上没有严格要求，即使用灵活自由组件-自由选择要使用的组件参考实现-精炼且性能好，提供了基础库的接口实现，但缺乏直接使用它们的具体类型这个包针对是.NET标准的，所以它能应用于任何平台：UWP，WinForms，WPF，Xamarin，Un
C# 通过chrome插件将HTML网页转换为PDF Eiceblue C#.NET PDF c#chrome html
将HTML网页内容转换为PDF格式能方便文档的后续打印、存档和分享等。之前介绍过如何通过QT插件将HTML转为PDF文件，本文将介绍另一个新的转换方法，通过谷歌浏览器Chrome插件将HTML网页转PDF文件。首先需要安装Spire.PDFfor.NET库（10.7.21版本及以上）。可以通过此链接下载产品包后手动添加引用，或者直接通过NuGet安装。https://www.e-iceblue.c
【零基础入门unity游戏开发——unity3D篇】物理系统 —— 3D物理材质Physics Material 向宇it #unity 3d 材质 c#游戏引擎开发语言编辑器
考虑到每个人基础可能不一样，且并不是所有人都有同时做2D、3D开发的需求，所以我把【零基础入门unity游戏开发】分为成了C#篇、unity通用篇、unity3D篇、unity2D篇。【C#篇】：主要讲解C#的基础语法，包括变量、数据类型、运算符、流程控制、面向对象等，适合没有编程基础的同学入门。【unity通用篇】：主要讲解unity的基础通用的知识，包括unity界面、unity脚本、unit
C#的简单工厂模式、工厂方法模式、抽象工厂模式观无 java c#开发语言
工厂模式是一种创建型设计模式，主要将对象的创建和使用分离，使得系统更加灵活和可维护。常见的工厂模式有简单工厂模式、工厂方法模式和抽象工厂模式，以下是C#实现的三个案例：简单工厂模式简单工厂模式通过一个工厂类来创建对象，而不需要把客户端代码与具体类的实现细节绑定在一起。usingSystem;//1.定义产品接口publicinterfaceIProduct{voidUse();}//2.创建具体产
rapidocr-onnxruntime库及在open-webui上传PDF 图像处理 (使用 OCR)应用原野AI 大模型部署 pdf ocr 深度学习 open-webui
背景rapidocr-onnxruntime是一个跨平台的OCR库，基于ONNXRuntime推理框架。目前已知运行速度最快、支持最广，完全开源免费并支持离线快速部署的多平台多语言OCR。缘起：百度paddle工程化不是太好，为了方便大家在各种端上进行ocr推理，我们将它转换为onnx格式，使用Python/C++/Java/Swift/C#将它移植到各个平台。名称来源：轻快好省并智能。基于深度学
C#接口(Interface)必须掌握的核心概念 ByteGeek‌ C#基础从入门到精通 c#开发语言 .net Winform VS
文章目录前言接口的定义接口的实现接口的继承接口的用途注意事项前言在C#编程语言中，‌接口（Interface）‌是一个至关重要的概念，它属于引用类型，主要用于指定一组方法，但不提供这些方法的实际实现。接口充当了一种契约或规范，类或其他类型可以通过实现这些接口来遵循这一契约。以下是对C#接口的详细阐述：接口的定义接口通过interface关键字进行定义，并且可以包含方法、属性、事件和索引器。然而，与
uniCloud 外部系统联登注册功能 C# 完整示例易天法地 c#开发语言 uniapp unicloud
APP端this.$http.post(`/uniCloudRegister`,{clientInfo:JSON.stringify(uni.getSystemInfoSync())}).then(res=>{uni.stopPullDownRefresh()uni.hideNavigationBarLoading()console.info(res)}).catch(err=>{console.
C# 技术使用笔记：泛型的使用方法 caifox菜狐狸 C#技术使用笔记 c#笔记开发语言泛型 List 装箱拆箱
1.泛型基础1.1泛型的定义与作用泛型是C#语言中一个非常强大且常用的特性，它允许在编写代码时使用类型参数来创建类、方法或接口，而不需要在编写代码时指定具体的类型。类型参数可以是任何类型，直到代码实际执行时，类型才会被确定。例如，常见的泛型类List，其中T就是类型参数，可以是int、string、自定义类Person等。使用泛型的主要好处包括：类型安全：编译器会确保类型安全，避免了运行时的类型转
C#中的设计模式：构建更加优雅的代码 Envyᥫᩣᩚ c#开发语言
C#在面向对象编程（OOP）方面的强大支持，我们可以探讨“C#中的设计模式”。这不仅有助于理解如何更好地组织代码，还能提高代码的可维护性和可扩展性。引言设计模式是软件工程中经过实践验证的解决方案模板，它们提供了一种标准化的方法来解决常见的开发问题。对于使用C#进行开发的程序员来说，理解和应用这些模式可以帮助创建结构良好、易于维护和扩展的应用程序。本文将介绍几种常用的设计模式，并展示如何用C#实现它
String类型为什么不可变 27xixi java高频 java
在大多数编程语言（如Java、Python、C#等）中，String类型被设计为不可变（Immutable），这意味着一旦一个字符串对象被创建，它的值就不能被修改。以下是这一设计的原因及具体表现：一、不可变性的表现直接修改字符串会创建新对象Stringstr="Hello";str=str+"World";//实际是创建了一个新字符串对象，而非修改原对象原字符串“Hello”未被修改，而是生成了新
32路模拟采集PCI总线带DIO用什么采集卡阿尔泰1999 数据分析嵌入式硬件科技
北京阿尔泰科技PCI5659是一-款多功能数据采集卡，具有32路12位100K采集频率，AD带16K字FIFO缓存，保证数据的连续性，并带16路可设方向的DIO功能。产品支持阿尔泰科技最新的ART-DAQ数据管理软件，提供QT、PYTHON、LABVIEW、VC、VB、VB.NET、C#等例子程序。模拟量输入通道数32路精度12位*大采样频率100KsPs多通道采样速度各通道*大采样频率/设置的采
C# 检查系统是否开启 Hyper - V 东百牧码人 c#开发语言
C#检查系统是否开启Hyper-V在使用C#开发应用程序时，有时需要判断系统是否开启了Hyper-V功能。Hyper-V是Windows系统提供的一款虚拟化技术，以下为你介绍几种在C#中检查系统是否开启Hyper-V的方法。方法一：通过查询系统注册表原理Hyper-V的状态信息会存储在系统注册表中，我们可以通过读取注册表中的相关键值来判断Hyper-V是否开启。示例代码usingMicrosoft
C#实现动态验证码生成器：安全防护与实际应用场景 WangMing_X C#实现各种功能工具集 c#安全开发语言验证码图片
一、核心应用场景用户登录/注册验证：防止恶意程序批量注册表单提交防护：确保关键操作由真人执行API接口限流：抵御自动化脚本攻击敏感操作验证：如支付、信息修改等关键步骤数据防爬机制：保护网站内容不被爬虫抓取二、技术实现方案1.基础架构设计//验证码服务架构+------------------------+|验证码生成模块|←随机字符|(CaptchaGenerator)|+------------
基于扩展方法实现C#安全集合操作工具包（含完整源码） WangMing_X C#实现各种功能工具集 c#安全集合
一、安全集合操作的价值在日常开发中，集合操作引发的NullReferenceException、IndexOutOfRangeException等异常占比高达35%。本工具包通过扩展方法实现以下核心场景的安全防护：安全索引访问防止数据绑定、列表遍历时的越界崩溃空集合防御处理避免foreach空集合导致的逻辑异常批量操作增强简化集合合并、筛选等批量操作深拷贝支持解决引用类型集合修改时的副作用问题二、
C#实现AES-CBC加密工具类（含完整源码及使用教程） WangMing_X C#实现各种功能工具集 c#AES-CBC加密
一、AES-CBC加密应用场景AES（AdvancedEncryptionStandard）作为全球公认的安全加密标准，广泛使用在以下场景：API通信加密：保护HTTP接口传输的敏感数据（如身份令牌、支付信息）文件安全存储：加密本地配置文件、数据库连接字符串等用户隐私保护：加密存储密码、身份证号等PII（个人身份信息）跨平台数据交换：与Java/Python等其他语言实现的加密系统互通物联网设备通
C#知识总结托塔1 c#开发语言
目录一、C#基础语法知识入门1.输入输出操作2.变量类型与常量2.1基础类型2.2常量3.转义字符4.类型转换4.1隐式转换规则4.2显式转换API5.运算符运算符分类与优先级6.流程控制6.1条件分支6.2循环6.3控制关键字7.异常处理二、C#基础语法知识基础1.枚举、数组、结构体vs类对比1.1枚举（Enum）1.2数组（一维/二维/交错）2.值类型vs引用类型3.字符串操作3.1核心方法3
C# Type类中Name、FullName、Namespace、AssemblyQualifiedName的区别鲤籽鲲 C#c#microsoft 开发语言 C#知识捡漏
总目录前言在C#中，Type类提供了多种属性来获取类型的相关信息。以下是Name、FullName、Namespace和AssemblyQualifiedName这几个属性的区别和具体用途。一、获取各名称属性示例namespaceReflectionDemo{publicclassUser{}internalclassProgram{staticvoidMain(string[]args){var
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>

由C#编写的多线程异步抓取网页的网络爬虫控制台程序

源代码下载地址：http://download.csdn.net/detail/ciel_arc/9428747

你可能感兴趣的:(C#)