桂亭亭

C# 网络爬虫+HtmlAgilityPack+Xpath+爬虫工具类的封装的使用

1 工具准备

2 思路准备

3 附加知识准备——XPath

简述

看看例子

用XPath来寻找标签

获取所有同名的标签

获取指定标签

一个实例

最后的补充

4 代码实现

5 爬虫工具类的封装

6 使用爬虫工具类爬虫

1 工具准备

1 Visual Studio 需要安装包 HtmlAgilityPack

2 命名空间的引入

在新建的程序头顶加入
using HtmlAgilityPack;
using HtmlDocument = HtmlAgilityPack.HtmlDocument;
3 注备好一双可以复制粘贴的小手，和一个还能跑的电脑，咯咯~

2 思路准备

图我已经给各位画好了，请参看

3 附加知识准备——XPath

简述

XPath 是一门在 XML 文档中查找信息的语言，虽然是被设计用来搜寻 XML 文档的，但是它也能应用于 HTML 文档，并且大部分浏览器也支持通过 XPath 来查询节点。在 Python 爬虫开发中，经常使用 XPath 查找提取网页中的信息，因此 XPath 非常重要。

XPath 使用路径表达式来选取 XML 文档中的节点或节点集。节点是沿着路径(path)或者步(steps)来选取的。接下来介绍如何选取节点，首先了解一下常用的路径表达式，来进行节点的选取，如下表所示：

表达式	描述
nodename	选取此节点的所有子节点
/	从根节点选取
//	选择任意位置的某个节点
.	选取当前节点
..	选取当前节点的父节点
@	选取属性

看看例子

bookstore	选取 bookstore 元素的所有子节点。
/bookstore	选取根元素 bookstore。注释：假如路径起始于正斜杠( / )，则此路径始终代表到某元素的绝对路径！
bookstore/book	选取属于 bookstore 的子元素的所有 book 元素。
//book	选取所有 book 子元素，而不管它们在文档中的位置。
bookstore//book	选择属于 bookstore 元素的后代的所有 book 元素，而不管它们位于 bookstore 之下的什么位置。
//@lang	选取名为 lang 的所有属性。

用XPath来寻找标签

获取所有同名的标签

我们只需要用: //标签名

即可，比如看下图我们使用了//ul寻找到了所有名为ul的标签了

获取指定标签

那么我们想要去选取具体的那个标签怎么办那？

有童鞋可能会想到，直接加下表访问但是！！在有时候是行不通的，

很简单，我们先将获取的的所以ul块对象存在数组中，然后使用下标访问就好了

只是这些我们要在C#中进行操作了，不能直接在网络控制台上进行操作了，咯咯~

/html/body/div[1]/div[2]/ul

一个实例

我们使用这串Xpath代码就可以获取到所有在指定位置下的li标签了

/html/body/div[1]/div[2]/ul/li

最后的补充

XPath 在进行节点选取的时候可以使用通配符*匹配未知的元素，同时使用操作符|一次选取多条路径，使用示例如下表所示。

XPath路径表达式	含义
/bookstore/*	选取 bookstore 元素的所有子元素
//*	选取文档中的所有元素
//title[`@*`]	选取所有带有属性的 title 元素
//book/title 丨 //book/price	选取 book 元素的所有 title 和 price 元素
//title 丨 //price	选取文档中的所有 title 和 price 元素
/bookstore/book/title 丨 //price	选取属于 bookstore 元素的 book 元素的所有 title 元素，以及文档中所有的 price 元素

4 代码实现

其实有了上面的基础知识，就可以自由发挥了，我这里抛砖引玉一下。

我们以美女图片大全_高清美女图片_性感美女写真_极品美女图片 - 美图131为例对MV图片的源地址，以及标签进行提取。

以下代码我们只用理解逻辑以及方法即可，可能也有很多漏洞与BUG，但这些不是重点滴！

        public void getdata()
        {
            //----全网首发----//
          
            //建立实例化htmlweb对象用于加载，处理网页
            HtmlWeb htmlWeb = new HtmlWeb();
            //设置为Encoding.UTF8编码，防止乱码
            htmlWeb.OverrideEncoding = Encoding.UTF8;
            
            //初始化网页地址
            String init_url = @"https://www.meitu131.com/meinv/";

            加载网页返回值为HtmlDocument类型，用var也行，哈哈
            HtmlDocument htmlDoc = htmlWeb.Load(init_url);
            
            //打印一下网页的HTML文档，看看效果
            //Console.WriteLine(htmlDoc.Text);
            //使用XPath定位元素
            string xpath = "";
            string init_xpath = "/html/body/div[1]/div[2]/ul/li";

            //获取本页所有li的节点数目，这便是本页图集的个数
            int new_page_sum = htmlDoc.DocumentNode.SelectNodes(init_xpath).Count;
            //对每个li节点进行提取，并拼接图集的网址
            for (int a_ = 0; a_ < new_page_sum; a_++)
            {
                xpath = "/html/body/div[1]/div[2]/ul/li[" + (a_ + 1) + "]/div[1]/a";
                init_img_src.Add("https://www.meitu131.com" + htmlDoc.DocumentNode.SelectSingleNode(xpath).Attributes["href"].Value.ToString());
            }
            //对每一页进行遍历，获取
            for (int b_ = 0; b_ < new_page_sum; b_++)
            {
                string temp_src = @init_img_src[b_];
                string temp_paxth_ = "//*[@id='main-wrapper']/div[2]/p/a/img";
                string temp_paxth = "//*[@id='pages']/a[1]";
                HtmlDocument htmlDoc_1 = htmlWeb.Load(temp_src);
                string c = htmlDoc_1.DocumentNode.SelectSingleNode(temp_paxth).InnerHtml.ToString();
                
                //获取当前图集所有页数page_sum[1]
                String[] page_sum = c.Split('/');
                for (int c_ = 0; c_ < 1; c_++)
                {
                    string temp_url;
                    if (c_ == 0)
                    {
                        temp_url = temp_src + "index.html";

                    }
                    else
                    {
                        temp_url = temp_src + "index_" + (c_ + 1) + ".html";
                    }

                    HtmlDocument htmlDoc_2 = htmlWeb.Load(temp_url);
                    end_img_url.Add(htmlDoc_1.DocumentNode.SelectSingleNode(temp_paxth_).Attributes["src"].Value.ToString());
                    end_img_name.Add(htmlDoc_1.DocumentNode.SelectSingleNode(temp_paxth_).Attributes["alt"].Value.ToString());
                }
            }
            textBox1.AppendText("数据获取完成，开始保存文件......");
        }

5 爬虫工具类的封装

为了更方便的爬虫，我对常用的方法进一步进行了封装，开箱即用。

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using System.Net;
using System.IO;
using System.Diagnostics;
using HtmlAgilityPack;
using System.Net.Http;

namespace 爬虫
{
    public static class pc_Help
    {
        /// 
        /// Url网络资源下载
        /// 
        /// 下载地址
        /// 资源名列表
        /// 资源Url列表
        /// 下载文件后缀（不加.）
        ///  毫秒运行时间 float
        public static string Download_Url(string Download_Path, List resource_name, List resource_url, string Download_Type)
        {
            try
            {
                string Download_Path_ = Download_Path;
                Stopwatch sw = new Stopwatch();
                sw.Start();

                int len = resource_name.Count;
                int num = 0;

                WebClient wb = new WebClient();
                DirectoryInfo info = new DirectoryInfo(Download_Path_);
                if (!info.Exists)
                {
                    Directory.CreateDirectory(Download_Path_);
                }
                for (int d_ = 0; d_ < len; d_++)
                {
                    Download_Path = $@"{Download_Path_}\{(num + 1)}{resource_name[d_]}.{Download_Type}";

                    num++;
                    wb.DownloadFile(resource_url[d_], Download_Path);
                }
                sw.Stop();
                return $"文件保存完成!耗时:{sw.ElapsedMilliseconds/1000}s\r\n";
            }
            catch (Exception e)
            {
                throw new Exception("保存数据出错", e);
            }
            }

        /// 
        /// 从Url地址下载HTML页面
        /// 
        /// 
        /// 
        public async static ValueTask LoadHtmlFromUrlAsync(string url)
        {
            
            //如果web不是空就异步下载html文档
            HtmlWeb web = new HtmlWeb();
            web.OverrideEncoding = Encoding.UTF8;
            return await web?.LoadFromWebAsync(url);
        }

        /// 
        /// 获取单个节点的扩展方法
        /// 
        /// 文档对象
        /// xPath路径
        /// 
        public static HtmlNode GetSingleNode(this HtmlDocument htmlDocument, string xPath)
        {
            return htmlDocument?.DocumentNode?.SelectSingleNode(xPath);
        }

        /// 
        /// 获取单个节点扩展方法
        /// 
        /// 文档对象
        /// xPath路径
        /// 
        public static HtmlNode GetSingleNode(this HtmlNode htmlNode, string xPath)
        {
            return htmlNode?.SelectSingleNode(xPath);
        }


        /// 
        /// 获取多个节点扩展方法
        /// 
        /// 文档对象
        /// xPath路径
        /// 一个列表
        public static HtmlNodeCollection GetNodes(this HtmlDocument htmlDocument, string xPath)
        {
            return htmlDocument?.DocumentNode?.SelectNodes(xPath);
        }

        /// 
        /// 获取多个节点扩展方法
        /// 
        /// 文档对象
        /// xPath路径
        /// 一个列表
        public static HtmlNodeCollection GetNodes(this HtmlNode htmlNode, string xPath)
        {
            return htmlNode?.SelectNodes(xPath);
        }


        /// 
        /// 下载图片
        /// 
        /// 地址
        /// 文件路径
        /// 存在即覆盖
        /// 
        //同步完成时的ValueTask，<>里可以是任何类型
        public async static ValueTask DownloadImg(string url, string filpath)
        {
            HttpClient hc = new HttpClient();
            try
            {
                //字节流异步写入
                var bytes = await hc.GetByteArrayAsync(url);
                //存在即覆盖
                using (FileStream fs = File.Create(filpath))
                {
                    fs.Write(bytes, 0, bytes.Length);
                }
                return File.Exists(filpath);
            }
            catch (Exception ex)
            {

                throw new Exception("下载图片异常", ex);
            }

        }


    }
}

6 使用爬虫工具类爬虫

这边给个例子，还是以我们以美女图片大全_高清美女图片_性感美女写真_极品美女图片 - 美图131为例

以下代码我们只用理解逻辑以及方法即可，可能也有很多漏洞与BUG，但这些不是重点滴！

 public async ValueTask getdata_()
        {
            try
            {
                HtmlDocument html_3 = await pc_Help.LoadHtmlFromUrlAsync(init_url);
                string stack_all_page_sum_string = pc_Help.GetSingleNode(html_3, "//*[@id='pages']/a[11]").Attributes["href"].Value.ToString();
                //正则匹配全站所有图集的个数
                Regex regex = new Regex(@"\d{2}");
                int stack_all_page_sum_int = Convert.ToInt32(regex.Match(stack_all_page_sum_string).ToString());
                if (pagesum < 24)
                {
                    HtmlDocument htmlDoc;
                    htmlDoc = await pc_Help.LoadHtmlFromUrlAsync(init_url);
                    string xpath = "";
                    //获取此页面上（具有多个图集封面的页面）的所有图集的初始页的数目
                    int new_page_sum = pc_Help.GetNodes(htmlDoc, "/html/body/div[1]/div[2]/ul/li").Count;
                    //拼接当前页面上（具有多个图集封面的页面）的所有图集的初始页的地址
                    for (int a_ = 0; a_ < pagesum; a_++)
                    {
                        xpath = "/html/body/div[1]/div[2]/ul/li[" + (a_ + 1) + "]/div[1]/a";
                        init_img_src.Add("https://www.meitu131.com" + pc_Help.GetSingleNode(htmlDoc, xpath).Attributes["href"].Value.ToString());
                    }

                    for (int b_ = 0; b_ < pagesum; b_++)
                    {
                        string temp_src = @init_img_src[b_];
                        string temp_paxth_ = "//*[@id='main-wrapper']/div[2]/p/a/img";
                        string temp_paxth = "//*[@id='pages']/a[1]";
                        HtmlDocument htmlDoc_1 = await pc_Help.LoadHtmlFromUrlAsync(temp_src);
                        string c = pc_Help.GetSingleNode(htmlDoc_1, temp_paxth).InnerHtml.ToString();
                        //获取本图集所有页数page_sum[1]
                        string[] page_sum = c.Split('/');
                        //Convert.ToInt32(page_sum[1])
                        //每个图集页面的拼接，与请求保存图片
                        for (int c_ = 0; c_ < length; c_++)
                        {
                            string temp_url;
                            if (c_ == 0)
                            {
                                temp_url = temp_src + "index.html";

                            }
                            else
                            {
                                temp_url = temp_src + "index_" + (c_ + 1) + ".html";
                            }

                            HtmlDocument htmlDoc_2 = await pc_Help.LoadHtmlFromUrlAsync(temp_url);
                            string src = pc_Help.GetSingleNode(htmlDoc_2, temp_paxth_).Attributes["src"].Value.ToString();
                            string alt = pc_Help.GetSingleNode(htmlDoc_2, temp_paxth_).Attributes["alt"].Value.ToString();
                            end_img_url.Add(src);
                            end_img_name.Add(alt);
                            num++;
                            textBox1.AppendText($"{num}-->{alt}-->{src}\r\n");
                        }
                    }
                }
                else
                {
                    for (int x_ = 0; x_ < pagesum; x_++)
                    {
                      
                    }
                    ero = false;
                    MessageBox.Show("待实现中....");
                }
                if (ero)
                {
                    textBox1.AppendText("数据获取完成，正在保存文件......\r\n");
                }
                else {
                    textBox1.AppendText("数据获取失败......\r\n");
                }
                return true;
            }

            catch (Exception ex)
            {

                throw new Exception("数据获取异常", ex);
            }

        }

训练入口+保存模型如若123 深度学习 python 人工智能
importargparsefromtorch.utils.dataimportDataLoaderfromtesting.testingimport*frommodels.model_coupled_v1importUnetfromdata.data_loadimport*importglobfromcollectionsimportOrderedDictdevice="cuda:0"iftor
转帖-在Eclipse中开发JSF ren_z_q JSF Eclipse Bean JSP Oracle
(转自http://www.blogjava.net/gaofeng/articles/127842.html作者:Java.net)Eclipse3.3刚刚发布,正在学习JSF,于是使用Eclipse3.3做了一个JSF的Demo,很简单,主要是页面的跳转、组件和Bean的绑定等基础...1、工具准备:Eclipse3.3WTP2.0(最好下载一个all-in-one的版本..省的麻烦)...依
paddleseg推理预测文件解析predict.py weightOneMillion 图像分割每天一篇PaddleSeg 学习 python 人工智能
1预测命令格式predict.py脚本是专门用来可视化预测案例的，命令格式如下所示：pythonpredict.py\--configconfigs/quick_start/bisenet_optic_disc_512x512_1k.yml\--model_pathoutput/iter_1000/model.pdparams\--ima
关于网络标准协会 hailuoing
1.IETF互联网工程任务组（InternetEngineeringTaskForce，IETF）负责互联网标准的开发和推动IETF由互联网结构委员会（InternetArchitectureBoard,IAB)监督，IAB向互联网协会(InternetSociety，ISOC)负责。现任IETF主席是BrianCarpenter。相关机构：互联网协会(ISOC-InternetSociety)I
C# 重启exploer.exe zw05011
重启exploer.exe，以加载新的注册表信息先杀掉，再启动。重启exploer.exe，以加载新的注册表信息先杀掉，再启动。usingSystem.Diagnostics;process[]processes=process.getprocesses();//获取所有进程信息for(inti=0;i
Java 和 JavaScript 的区别大乔乔布斯 java javascript 开发语言
尽管名字相似，JavaScript的名字中带有“Java”，确实让很多人误以为它与Java有紧密联系。但实际上，它们是完全不同的语言，只是在JavaScript的发展历史中与Java有一定的关联。1.JavaScript的诞生背景时间点：1995年，网景公司（Netscape）开发了一种轻量级的脚本语言，用于增强网页的交互性。开发者：JavaScript的发明者是布兰登·艾奇（BrendanEic
C# Process.Start()方法详解调用其他exe 程序刘欢(C#) winform winform Process.Start
System.Diagnostics.Process.Start();能做什么呢？它主要有以下几个功能：1、打开某个链接网址（弹窗）。2、定位打开某个文件目录。3、打开系统特殊文件夹，如“控制面板”等。那么它是怎么实现这几个功能的呢？在讲应用前，我们先来看看Process.Star()的构造方法。名称说明Process.Start()启动（或重用）此Process组件的StartInfo属性指定的
C# System.Diagnostics.Process.Start() Godsight C#基本语法
C#Process.Start()方法详解System.Diagnostics.Process.Start();能做什么呢？它主要有以下几个功能：1、打开某个链接网址（弹窗）。2、定位打开某个文件目录。3、打开系统特殊文件夹，如“控制面板”等。那么它是怎么实现这几个功能的呢？在讲应用前，我们先来看看Process.Star()的构造方法。名称说明Process.Start()启动（或重用）此Pro
golang-实现自己的事件驱动小屋子大侠服务端 golang
golang实现自己的事件驱动众所周知，go中的异步操作都已经封装在了运行时的过程中，有关socket的网络的异步操作都封装到了go的netpoll中，从而简化了编程形式。本文也就根据evio库总结而来。golang跨平台库如何编写golang的跨平台库，现在主流的方式如下：evserver│go.mod│main.go│└───show││show.go││show_darwin.go││sho
C、C++ 和 C# 编程语言的比较和联系 lisanndesu c语言 c++c#
导语：C、C++和C#是三种不同的编程语言，它们在语法、特性和应用领域等方面有着一些联系和区别。本文将深入探讨这三种语言之间的关系，并比较它们的特点和适用场景，以帮助开发者选择合适的编程语言。1.C、C++和C#简介C：C是一种过程化编程语言，由DennisRitchie在1972年开发。它主要用于系统级编程和性能要求较高的应用程序开发。C++：C++是在C语言基础上扩展而来的语言，由Bjarne
贪吃蛇游戏（代码篇）星霜旅人项目代码 c语言开发语言游戏
我们并不是为了满足别人的期待而活着。前言这是我自己做的第五个小项目---贪吃蛇游戏（代码篇）。后期我会继续制作其他小项目并开源至博客上。上一小项目是贪吃蛇游戏（必备知识篇），没看过的同学可以去看看：有关贪吃蛇必备知识的小项目https://blog.csdn.net/hsy1603914691/article/details/142455297?sharetype=blogdetail&share
计算机网络(北邮信息工程期末速通) arbelite 计算机网络
计算机网络计算机网络概述⭐计算机网络的组成和功能计算机网络的组成：从组成看，计算机网络主要由三大部分组成：硬件（hardware），软件（software），协议（protocol）。从工作方式看：可分为边缘部分（edgepart）和核心部分（corepart）。从功能组成来看：计算机网络由通信子网(CommunicationSubnetwork)和资源子网(ResourceSubnetwork)
从零开始学设计模式(四)：工厂模式（Factory Pattern）江夏、 Java Java基础设计模式 java 工厂模式设计模式
作者平台：|CSDN：blog.csdn.net/qq\_4115394…|掘金：juejin.cn/user/651387…|知乎：www.zhihu.com/people/1024…|GitHub：github.com/JiangXia-10…|公众号：1024笔记本文大概11588字，读完共需25分钟定义工厂模式(FactoryPattern)也是Java中最常用的设计模式之一。这种类型的设
rockylinux9.4单master节点k8s1.28集群部署大白菜和MySQL k8s 集群 kubernetes 容器云原生
kubernetes集群部署常见的k8s部署方式包括：二进制包、kubeadm工具、云服务提供商、或通过一些开源的工具搭建，例如：sealos、kuboard、Runcher、kubeSphere。本文使用kubeadm的部署方式，部署k8s1.28版本我本地安装资源规划如下：IP地址主机名称角色操作系统主机配置参考192.168.3.92master1masterrockylinux9.4(最小
华为云云原生王者之路集训营（黄金-第五章) ※网络笨猪※ 云厂商-公有云华为云云原生
华为云云原生王者之路集训营（黄金-第五章)1.11.1Kubernetes工作负载(Workload)介绍工作负载是在Kubernetes上运行的应用程序。无论你的负载是单一组件还是由多个一同工作的组件构成，在Kubernetes中你可以在一组Pods中运行它。在Kubernetes中，Pod代表的是集群上处于运行状态的一组容器。四种负载：无状态工作负载：管理的Pod集合是相互等价的，需要的时候可
【愚公系列】二十三种设计模式(一)-工厂方法模式(Factory Method Pattern) 愚公搬代码 (完)C#版设计模式和原则设计模式工厂方法模式 microsoft .net c#.netcore
标题详情作者简介愚公搬代码头衔华为云特约编辑，华为云云享专家，华为开发者专家，华为产品云测专家，CSDN博客专家，CSDN商业化专家，阿里云专家博主，阿里云签约作者，腾讯云优秀博主，腾讯云内容共创官，掘金优秀博主，亚马逊技领云博主，51CTO博客专家等。近期荣誉2022年度博客之星TOP2，2023年度博客之星TOP2，2022年华为云十佳博主，2023年华为云十佳博主等。博客内容.NET、Jav
【深度学习|变化检测孪生网络】基于共享权重的双流 U-Net 变化检测网络架构，附代码（一）努力学习的大大深度学习基础深度学习网络架构人工智能 python
【深度学习|变化检测孪生网络】基于共享权重的双流U-Net变化检测网络架构，附代码（一）【深度学习|变化检测孪生网络】基于共享权重的双流U-Net变化检测网络架构，附代码（一）文章目录【深度学习|变化检测孪生网络】基于共享权重的双流U-Net变化检测网络架构，附代码（一）基于共享权重的双流U-Net变化检测网络架构1.双流网络（SiameseNetwork）概述2.双流网络的应用——变化检测3.U
Ubuntu Server连接wifi Young4Dream Linux ubuntu linux 运维
背景家里服务器放在客厅太吵了,准备挪到阳台,所以买了TPwifi接收器,因此需要配置wifi连接.刚开始买了TendaAx300,结果不支持服务器系统,买前还是得和客服交流交流.准备驱动安装对于windows系统来说,这款接收器是免驱的,但在linux上需要安装相应型号驱动安装完成后,使用ipa查看网卡情况,一般wl开头的就是我们的主角.配置nmcli命令是配置的主要工具,需要先安装network
H3C-交换机telnet远程配置案例仓鼠OO 网络配置(H3C)H3C 网络运维
目录1.telnet简述2.网络拓扑3.实验需求4.配置步骤4.1网络基本配置4.2telnet配置5.telnet测试远程6.小结1.telnet简述Telnet是远程登录服务的一个协议，该协议定义了远程登录用户与服务器交互的方式。它允许用户在一台联网的计算机上登录到一个远程分时系统中，然后像使用自己的计算机一样使用该远程系统。Telnet使用客户-服务器模式进行工作。在用户端，需要启动一个Te
优雅驾驭 TryParse：技巧与实战全攻略东百牧码人 c#数据结构
一、引言在编程的世界里，数据类型的转换是我们经常会遇到的操作。而TryParse方法作为一种安全、高效的类型转换方式，在许多编程语言中都有着广泛的应用，比如C#、Java等。它能够帮助我们在将字符串转换为其他数据类型时，避免因格式不正确而引发的异常，使我们的程序更加健壮和稳定。今天，咱们就来聊聊如何优雅地使用TryParse，让你的代码既简洁又高效，展现出编程的艺术之美。二、TryParse基础解
自动化测试工具Ranorex Studio（五十一）-如何做基于图像的自动化机器视觉小小测试员自动化 ui 运维
如何做基于图像的自动化如果Ranorex不能明确地识别某些你的GUI元素，那么使用基于图像的机制来自动化它们将会大有帮助。C#//Createbitmaptosearchfor//withinapplicationformand//clickitBitmapbmp=Ranorex.Imaging.Load(@”..\..\GreenSeaTurtleSmall.bmp”);//Performsar
WPF常见面试题解答源之缘-OFD解决方案之道 WPF wpf
以下是WPF（WindowsPresentationFoundation）面试中常见的问题及解答，涵盖基础概念、高级功能和实际应用，帮助你更好地准备面试：基础概念什么是WPF？WPF是微软开发的用于构建桌面应用程序的UI框架，基于XAML（可扩展应用程序标记语言）和.NETFramework。它支持2D和3D图形、动画、数据绑定、多媒体等功能。WPF支持哪些类型的文档？WPF支持流格式和固定格式文
springcloud nacos 负载均衡权重牛马狗猪猴 springboot spring cloud 负载均衡 java
springcloudnacos负载均衡权重项目搭建代码在这里https://blog.csdn.net/weixin_45730866/article/details/128930496?spm=1001.2014.3001.5502假设我们consumer-order要调用consumer-user（这个服务启动了两个)；不知道怎么在idea启动两个相同的服务可以看看下面这个https://b
C# Json字符串生成工具的实现与应用徐子贡
本文还有配套的精品资源，点击获取简介：JSON是一种轻量级的数据交换格式，被广泛用于Web服务中，用以替代XML，因其简洁易处理特性。本课程主要介绍如何在C#中使用Json.NET库生成JSON字符串，并提供源码分析，帮助开发者理解并根据需求定制自己的Json字符串生成工具。课程将涵盖数据类型、库的使用、源码解析、工具定制、效率提升、扩展性以及如何将工具集成到项目中，从而加深对JSON生成原理的理
从 TCP/IP 演进看按序流与性能 dog250 tcp/ip 网络协议网络
前面谈到互联网从早期对等通信模型转入后来内容分发模型后的一系列问题，诸如拥塞，安全等，本文谈谈关于性能的更普遍方面。TCP/IP祖师爷1974年的开山论文AProtocolforPacketNetworkIntercommunication以及随后RFC675，标志着TCP/IP的正式诞生，在此之前还有一个里程碑事件，即RFC33NCP标准化。RFC33解决了分布式通信问题，而RFC675解决了异
C#在软件定义无线电（SDR）开发中的革命性应用——从概念到实践的全面解析墨夶 C#学习资料2 c#网络开发语言
在这个数字化与无线通信飞速发展的时代，软件定义无线电（SoftwareDefinedRadio,SDR）作为一项关键技术，正在改变着我们对传统无线电系统的认知。它不仅允许工程师们以软件的方式实现复杂的信号处理算法，而且还为各种新型无线应用提供了无限可能。然而，要真正驾驭这项技术并非易事，尤其是在选择合适的编程语言时更是如此。今天，我们将聚焦于C#这一强大而灵活的语言，探讨它是如何成为SDR开发的理
GET、POST请求工具类 Mr.xie1024 服务器 java http
HttpRequestUtil工具类importio.micrometer.core.instrument.util.StringUtils;importorg.slf4j.Logger;importorg.slf4j.LoggerFactory;importjava.io.*;importjava.net.HttpURLConnection;importjava.net.URL;importja
【报错】拉基础镜像： Error response from daemon: Get “https://registry-1.docker.io/v2/“: net/http: request ca Jackilina_Stone 【EH】报错处理 #docker 报错 docker
背景：#拉基础镜像dockerpullubuntu:20.04报错如下：Errorresponsefromdaemon:Get"https://registry-1.docker.io/v2/":net/http:requestcanceledwhilewaitingforconnection(Client.Timeoutexceededwhileawaitingheaders)解决方法：sudo
Golang 进阶4—— 网络编程小吴同学（wlx） golang
Golang进阶4——网络编程注意，该文档只适合有编程基础的同学，这里的go教程只给出有区别的知识点网络编程：把分布在不同地理区域的计算机与专门的外部设备用通信线路互连成一个规模大，功能强的网络系统，从而使众多的计算机可以方便的相互通信、共享硬件、软件等资源1.1客户端//客户端import("fmt""net"//所有网络编程都在这个包下)funcmain(){//打印fmt.Println("
centos7安装jumpserver堡垒机落花_忆流年运维项目 linux
堡垒机简介跳板机属于内控堡垒机范畴，是一种用于单点登陆的主机应用系统。跳板机就是一台服务器，维护人员在维护过程中，首先要统一登录到这台服务器上，然后从这台服务器再登录到目标设备进行维护。但跳板机的缺点是没有实现对运维人员操作行为的控制和审计，出现误操作或违规操作难以定位到原因和责任人；并且跳板机存在严重的安全风险，如果跳板机系统被攻入，则后端资源完全暴露无遗。对于个别资源（如telnet）可以通过
开发者关心的那些事圣子足道 ios 游戏编程 apple 支付
我要在app里添加IAP，必须要注册自己的产品标识符（product identifiers）。产品标识符是什么？产品标识符（Product Identifiers）是一串字符串，它用来识别你在应用内贩卖的每件商品。App Store用产品标识符来检索产品信息，标识符只能包含大小写字母（A-Z）、数字（0-9）、下划线（-）、以及圆点(.)。你可以任意排列这些元素，但我们建议你创建标识符时使用
负载均衡器技术Nginx和F5的优缺点对比 bijian1013 nginx F5
对于数据流量过大的网络中，往往单一设备无法承担，需要多台设备进行数据分流，而负载均衡器就是用来将数据分流到多台设备的一个转发器。目前有许多不同的负载均衡技术用以满足不同的应用需求，如软/硬件负载均衡、本地/全局负载均衡、更高
LeetCode[Math] - #9 Palindrome Number Cwind java Algorithm 题解 LeetCode Math
原题链接：#9 Palindrome Number 要求：判断一个整数是否是回文数，不要使用额外的存储空间难度：简单分析：题目限制不允许使用额外的存储空间应指不允许使用O(n)的内存空间，O(1)的内存用于存储中间结果是可以接受的。于是考虑将该整型数反转，然后与原数字进行比较。注：没有看到有关负数是否可以是回文数的明确结论，例如
画图板的基本实现 15700786134 画图板
要实现画图板的基本功能，除了在qq登陆界面中用到的组件和方法外，还需要添加鼠标监听器，和接口实现。首先，需要显示一个JFrame界面： public class DrameFrame extends JFrame { //显示
linux的ps命令被触发 linux
Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照，就是执行ps命令的那个时刻的那些进程，如果想要动态的显示进程信息，就可以使用top命令。要对进程进行监测和控制，首先必须要了解当前进程的情况，也就是需要查看当前进程，而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行
Android 音乐播放器下一曲连续跳几首歌肆无忌惮_ android
最近在写安卓音乐播放器的时候遇到个问题。在MediaPlayer播放结束时会回调 player.setOnCompletionListener(new OnCompletionListener() { @Override public void onCompletion(MediaPlayer mp) { mp.reset(); Log.i("H
java导出txt文件的例子知了ing java servlet
代码很简单就一个servlet,如下： package com.eastcom.servlet; import java.io.BufferedOutputStream; import java.io.IOException; import java.net.URLEncoder; import java.sql.Connection; import java.sql.Resu
Scala stack试玩, 提高第三方依赖下载速度矮蛋蛋 scala sbt
原文地址： http://segmentfault.com/a/1190000002894524 sbt下载速度实在是惨不忍睹, 需要做些配置优化下载typesafe离线包, 保存为ivy本地库 wget http://downloads.typesafe.com/typesafe-activator/1.3.4/typesafe-activator-1.3.4.zip 解压r
phantomjs安装(linux，附带环境变量设置) ，以及casperjs安装。 alleni123 linux spider
1. 首先从官网 http://phantomjs.org/下载phantomjs压缩包，解压缩到/root/phantomjs文件夹。 2. 安装依赖 sudo yum install fontconfig freetype libfreetype.so.6 libfontconfig.so.1 libstdc++.so.6 3. 配置环境变量 vi /etc/profil
JAVA IO FileInputStream和FileOutputStream，字节流的打包输出百合不是茶 java核心思想 JAVA IO操作字节流
在程序设计语言中，数据的保存是基本，如果某程序语言不能保存数据那么该语言是不可能存在的，JAVA是当今最流行的面向对象设计语言之一，在保存数据中也有自己独特的一面，字节流和字符流 1，字节流是由字节构成的，字符流是由字符构成的字节流和字符流都是继承的InputStream和OutPutStream ,java中两种最基本的就是字节流和字符流类 FileInputStream
Spring基础实例（依赖注入和控制反转） bijian1013 spring
前提条件：在http://www.springsource.org/download网站上下载Spring框架，并将spring.jar、log4j-1.2.15.jar、commons-logging.jar加载至工程1.武器接口 package com.bijian.spring.base3; public interface Weapon { void kil
HR看重的十大技能 bijian1013 提升能力 HR 成长
一个人掌握何种技能取决于他的兴趣、能力和聪明程度，也取决于他所能支配的资源以及制定的事业目标，拥有过硬技能的人有更多的工作机会。但是，由于经济发展前景不确定，掌握对你的事业有所帮助的技能显得尤为重要。以下是最受雇主欢迎的十种技能。　　一、解决问题的能力　　每天，我们都要在生活和工作中解决一些综合性的问题。那些能够发现问题、解决问题并迅速作出有效决
【Thrift一】Thrift编译安装 bit1129 thrift
什么是Thrift The Apache Thrift software framework, for scalable cross-language services development, combines a software stack with a code generation engine to build services that work efficiently and s
【Avro三】Hadoop MapReduce读写Avro文件 bit1129 mapreduce
Avro是Doug Cutting(此人绝对是神一般的存在）牵头开发的。开发之初就是围绕着完善Hadoop生态系统的数据处理而开展的（使用Avro作为Hadoop MapReduce需要处理数据序列化和反序列化的场景）,因此Hadoop MapReduce集成Avro也就是自然而然的事情。这个例子是一个简单的Hadoop MapReduce读取Avro格式的源文件进行计数统计，然后将计算结果
nginx定制500，502，503，504页面 ronin47 nginx　错误显示
server { listen 80; error_page 500/500.html; error_page 502/502.html; error_page 503/503.html; error_page 504/504.html; location /test {return502;}} 配置很简单，和配
java-1.二叉查找树转为双向链表 bylijinnan 二叉查找树
import java.util.ArrayList; import java.util.List; public class BSTreeToLinkedList { /* 把二元查找树转变成排序的双向链表题目：输入一棵二元查找树，将该二元查找树转换成一个排序的双向链表。要求不能创建任何新的结点，只调整指针的指向。 10 / \ 6 14 / \
Netty源码学习-HTTP-tunnel bylijinnan java netty
Netty关于HTTP tunnel的说明： http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/socket/http/package-summary.html#package_description 这个说明有点太简略了一个完整的例子在这里： https://github.com/bylijinnan
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别 coder_xpf jquery json map val()
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别数据库查询出来的map有一个字段为空通过System.out.println()输出 JSONUtil.serialize(map)： {"one":"1","two":"nul
Hibernate缓存总结 cuishikuan 开源 ssh javaweb hibernate缓存三大框架
一、为什么要用Hibernate缓存？ Hibernate是一个持久层框架，经常访问物理数据库。为了降低应用程序对物理数据源访问的频次，从而提高应用程序的运行性能。缓存内的数据是对物理数据源中的数据的复制，应用程序在运行时从缓存读写数据，在特定的时刻或事件会同步缓存和物理数据源的数据。二、Hibernate缓存原理是怎样的？ Hibernate缓存包括两大类：Hib
CentOs6 dalan_123 centos
首先su - 切换到root下面1、首先要先安装GCC GCC-C++ Openssl等以来模块：yum -y install make gcc gcc-c++ kernel-devel m4 ncurses-devel openssl-devel2、再安装ncurses模块yum -y install ncurses-develyum install ncurses-devel3、下载Erang
10款用 jquery 实现滚动条至页面底端自动加载数据效果 dcj3sjt126com JavaScript
无限滚动自动翻页可以说是web2.0时代的一项堪称伟大的技术，它让我们在浏览页面的时候只需要把滚动条拉到网页底部就能自动显示下一页的结果，改变了一直以来只能通过点击下一页来翻页这种常规做法。无限滚动自动翻页技术的鼻祖是微博的先驱：推特(twitter)，后来必应图片搜索、谷歌图片搜索、google reader、箱包批发网等纷纷抄袭了这一项技术，于是靠滚动浏览器滚动条
ImageButton去边框&Button或者ImageButton的背景透明 dcj3sjt126com imagebutton
在ImageButton中载入图片后，很多人会觉得有图片周围的白边会影响到美观，其实解决这个问题有两种方法一种方法是将ImageButton的背景改为所需要的图片。如：android:background="@drawable/XXX" 第二种方法就是将ImageButton背景改为透明，这个方法更常用在XML里； <ImageBut
JSP之c:foreach eksliang jsp forearch
原文出自：http://www.cnblogs.com/draem0507/archive/2012/09/24/2699745.html <c:forEach>标签用于通用数据循环，它有以下属性属性描述是否必须缺省值 items 进行循环的项目否无 begin 开始条件否 0 end 结束条件否集合中的最后一个项目 step 步长否 1
Android实现主动连接蓝牙耳机 gqdy365 android
在Android程序中可以实现自动扫描蓝牙、配对蓝牙、建立数据通道。蓝牙分不同类型，这篇文字只讨论如何与蓝牙耳机连接。大致可以分三步：一、扫描蓝牙设备： 1、注册并监听广播： BluetoothAdapter.ACTION_DISCOVERY_STARTED BluetoothDevice.ACTION_FOUND BluetoothAdapter.ACTION_DIS
android学习轨迹之四：org.json.JSONException: No value for hyz301 json
org.json.JSONException: No value for items 在JSON解析中会遇到一种错误，很常见的错误 06-21 12:19:08.714 2098-2127/com.jikexueyuan.secret I/System.out﹕ Result:{"status":1,"page":1,&
干货分享：从零开始学编程系列汇总 justjavac 编程
程序员总爱重新发明轮子，于是做了要给轮子汇总。从零开始写个编译器吧系列 (知乎专栏) 从零开始写一个简单的操作系统 (伯乐在线) 从零开始写JavaScript框架 (图灵社区) 从零开始写jQuery框架 (蓝色理想 ) 从零开始nodejs系列文章 (粉丝日志) 从零开始编写网络游戏
jquery-autocomplete 使用手册 macroli jquery Ajax 脚本
jquery-autocomplete学习一、用前必备官方网站：http://bassistance.de/jquery-plugins/jquery-plugin-autocomplete/ 当前版本：1.1 需要JQuery版本：1.2.6 二、使用 <script src="./jquery-1.3.2.js" type="text/ja
PLSQL-Developer或者Navicat等工具连接远程oracle数据库的详细配置以及数据库编码的修改超声波 oracle plsql
　　在服务器上将Oracle安装好之后接下来要做的就是通过本地机器来远程连接服务器端的oracle数据库，常用的客户端连接工具就是PLSQL-Developer或者Navicat这些工具了。刚开始也是各种报错，什么TNS:no listener;TNS:lost connection;TNS:target hosts...花了一天的时间终于让PLSQL-Developer和Navicat等这些客户
数据仓库数据模型之：极限存储--历史拉链表 superlxw1234 极限存储数据仓库数据模型拉链历史表
在数据仓库的数据模型设计过程中，经常会遇到这样的需求： 1. 数据量比较大; 2. 表中的部分字段会被update,如用户的地址，产品的描述信息，订单的状态等等; 3. 需要查看某一个时间点或者时间段的历史快照信息，比如，查看某一个订单在历史某一个时间点的状态，比如，查看某一个用户在过去某一段时间内，更新过几次等等; 4. 变化的比例和频率不是很大，比如，总共有10
10点睛Spring MVC4.1-全局异常处理 wiselyman spring mvc
10.1 全局异常处理使用@ControllerAdvice注解来实现全局异常处理; 使用@ControllerAdvice的属性缩小处理范围 10.2 演示演示控制器 package com.wisely.web; import org.springframework.stereotype.Controller; import org.spring

C# 网络爬虫+HtmlAgilityPack+Xpath+爬虫工具类的封装的使用

1 工具准备

2 思路准备

3 附加知识准备——XPath

简述

看看例子

用XPath来寻找标签

获取所有同名的标签

获取指定标签

一个实例

最后的补充

4 代码实现

5 爬虫工具类的封装

6 使用爬虫工具类爬虫

你可能感兴趣的:(C#,c#,.net,开发语言)