qq_45046083

网络爬虫简单概述

网络爬虫

1、概念

网络爬虫本质上就是一个程序或者脚本, 网络爬虫按照一定规则获取互联网中信息(数据), 一般来说爬虫被分为三大模块: 获取数据解析数据保存数据。

网络爬虫（又称为网页蜘蛛，网络机器人，在FOAF社区中间，更经常的称为网页追逐者），是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。

2、爬虫价值

爬虫的价值本质就是获取数据的价值. 数据的价值越高, 爬虫的价值越高
数据的价值: 一切皆为数据
例如: 获取到了大量的用户信息(基本信息, 购物信息, 浏览信息):
- 广告推荐用户行为分析(用户画像)
例如: 获取到了大量的商品的信息(基本信息, 价格):
- 比价网

3、爬虫的分类

常见分类有两种:

通用爬虫: 指的获取互联网中所有的数据, 不局限于网站, 行业, 分类
百度谷歌
垂直爬虫: 指的获取互联网中某一个网站, 某一个行业, 某一个分类下的数据
慢慢买笔趣阁

实际开发中: 一般书写那种爬虫：垂直爬虫(数据分析处理)

4、爬虫的开发流程

爬虫的执行流程:
确定首页URL
发送请求, 获取数据
解析数据
保存数据

5、爬虫三大模块

5.1、第一大模块：发送请求获取数据

5.1.1、关于Http请求

请求相关内容:
- 请求行 : 请求方式请求的URL 协议版本
- get 和 post 区别:
  - get将请求参数放置在url的后面, 而 post将请求参数放置请求体中
  - get请求不能无限制的拼接参数, post是没有限制的
  - post相对而言要比get安全
- 请求头:
  - user-agent : 指定浏览器的内核版本
  - cookie : 携带当前网站在浏览器中保存的cookie信息
  - referer : 防盗链
- 请求体
  - 只有post才有请求体, 请求参数
响应相关内容:
- 响应行: 状态码
  - 200
  - 302
  - 304
  - 404
  - 500
- 响应头 :
  - set-cookie : 服务器向浏览器写入cookie信息
  - location : 指定重定向的URL路径
- 响应体
  - 爬虫获取数据就是获取的响应体的内容

5.1.2、使用HttpClient发送Get请求

HttpClient 是Apache Jakarta Common 下的子项目，可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包，并且它支持 HTTP 协议最新的版本和建议。

httpClient专为java发送http请求而生的, 如果要httpClient ,需要先进行导包

        
        <dependency>
            <groupId>org.apache.httpcomponentsgroupId>
            <artifactId>httpclientartifactId>
            <version>4.5.6version>
        dependency>

java发送请求代码

public class HttpClientGet {
    public static void main(String[] args) throws IOException {
        //使用httpclient发送get请求
        //请求的url
        String url = "http://www.ujiuye.com/";
        //获取httpclient对象
        CloseableHttpClient httpClient = HttpClients.createDefault();
        //创建发送方式对象
        HttpGet get = new HttpGet(url);
        //设置请求头
        //get.setHeader("accept-language","zh-CN,zh;q=0.9");
        //发送请求
        CloseableHttpResponse response = httpClient.execute(get);
        //打印响应状态码
        System.out.println(response.getStatusLine().getStatusCode());
        if (response.getStatusLine().getStatusCode() == 200){
            //响应体
            HttpEntity entity = response.getEntity();
            //获取响应头
            //response.getHeaders("status");
            //通过工具类获取响应体(读取数据)
            //jdk解码方式：gb2312
            String res = EntityUtils.toString(entity, "gb2312");
            System.out.println(res);
        }
    }

}

5.1.3、使用HttpClient发送Post请求

首先还是需要导包

        
        <dependency>
            <groupId>org.apache.httpcomponentsgroupId>
            <artifactId>httpclientartifactId>
            <version>4.5.6version>
        dependency>

java代码

public class HttpClientPost {
    public static void main(String[] args) throws IOException {
        //使用httpclient的post请求发送请求
        //url地址
        String url = "https://www.chsi.com.cn/";
        //获取httpclient对象
        CloseableHttpClient httpClient = HttpClients.createDefault();
        //创建请求方式对象
        HttpPost httpPost = new HttpPost(url);
        //提交请求参数就是设置请求体对象
        List<BasicNameValuePair> list = new ArrayList<BasicNameValuePair>();
        list.add(new BasicNameValuePair("username","rose"));
        list.add(new BasicNameValuePair("password","123456"));
        HttpEntity reqEntity = new UrlEncodedFormEntity(list);
        httpPost.setEntity(reqEntity);
        //发送post请求
        CloseableHttpResponse response = httpClient.execute(httpPost);
        if (response.getStatusLine().getStatusCode() == 200){
            //获取响应对象
            HttpEntity entity = response.getEntity();
            //解析响应体
            String res = EntityUtils.toString(entity, "UTF-8");
            System.out.println(res);
        }
        //关闭请求
        httpClient.close();
    }
}

5.2、第二大模块：解析数据

5.2.1、JSoup解析方式

JSoup 是一款Java 的HTML解析器，可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API，可通过DOM，CSS以及类似于jQuery的操作方法来取出和操作数据。

5.2.2、使用流程

导入依赖


<dependency>
    <groupId>org.jsoupgroupId>
    <artifactId>jsoupartifactId>
    <version>1.11.3version>
dependency>

java代码

public class JSoupTest {
    /*
        解析html
     */
    @Test
    public void test1() throws Exception{
        //获取一个document对象
        Document document = Jsoup.parse("\n" +
                "\n" +
                "\n" +
                "    \n" +
                "    这是一段HTML字符串\n" +
                "\n" +
                "\n" +
                "\n" +
                "\n" +
                "");
        //通过标签名获取元素
        Elements elements = document.getElementsByTag("title");
        Element element = elements.get(0);
        String text = element.text();
        System.out.println(text);
    }
    
    
    
    
    /*
        解析代码片段
     */
    @Test
    public void test2() throws Exception{
        //获取一个document对象
        Document document = Jsoup.parseBodyFragment("这是一个HTML代码片段");
        Element element = document.getElementById("span");
        System.out.println(element.text());
    }
    
    
    
    
    /*
        解析file对象
     */
    @Test
    public void test3() throws Exception{
        //获取一个document对象
        File file = new File("F:/test.html");
        Document document = Jsoup.parse(file, "UTF-8");
        Elements elements = document.getElementsByTag("title");
        Element element = elements.get(0);
        System.out.println(element.text());
    }
}

5.2.3、小案例

获取中公有就业官网上提供的课程名称

首先还是需要导入HttpClient和JSoup依赖

        
        <dependency>
            <groupId>org.apache.httpcomponentsgroupId>
            <artifactId>httpclientartifactId>
            <version>4.5.6version>
        dependency>
        
        
        
		<dependency>
    		<groupId>org.jsoupgroupId>
   		 	<artifactId>jsoupartifactId>
    		<version>1.11.3version>
		dependency>

java代码解析

public class GetCourse {

    //JS方式
    @Test
    public  void test1() throws IOException {
        //获取优就业官网所有的课程的名字
        String url = "http://www.ujiuye.com/";
        CloseableHttpClient httpClient = HttpClients.createDefault();
        HttpGet get = new HttpGet(url);
        CloseableHttpResponse response = httpClient.execute(get);
        if (response.getStatusLine().getStatusCode() == 200){
            HttpEntity entity = response.getEntity();
            String res = EntityUtils.toString(entity, "gb2312");
            Document document = Jsoup.parse(res);
            //获取ul标签
            Elements elements = document.getElementsByClass("nav_left");
            //获取ul标签下的li标签
            Element UlEle = elements.get(0);
            Elements lis = UlEle.getElementsByTag("li");
            //遍历li获取a标签并获取标签内容
            for (Element li : lis) {
                Element a = li.getElementsByTag("a").get(0);
                System.out.println(a.text());
            }
        }
    }


    //JQuery方式
    @Test
    public void test2() throws IOException {
        //获取有就业官网所有的课程的名字
        String url = "http://www.ujiuye.com/";
        CloseableHttpClient httpClient = HttpClients.createDefault();
        HttpGet get = new HttpGet(url);
        CloseableHttpResponse response = httpClient.execute(get);
        if (response.getStatusLine().getStatusCode() == 200){
            HttpEntity entity = response.getEntity();
            String res = EntityUtils.toString(entity, "gb2312");
            Document document = Jsoup.parse(res);
            Elements elements = document.select(".nav_left>li>a>span");
            for (Element element : elements) {
                System.out.println(element.text());
            }
        }
    }
}

5.2.4、解析JSON字符串获取有价值信息

导入依赖

        <dependency>
            <groupId>org.apache.httpcomponentsgroupId>
            <artifactId>httpclientartifactId>
            <version>4.5.6version>
        dependency>

        <dependency>
            <groupId>com.alibabagroupId>
            <artifactId>fastjsonartifactId>
            <version>1.2.58version>
        dependency>

部分核心代码

public class GetNews {
    @Autowired
    private NewsServiceImpl service;
    @Test
    public void test() throws IOException, ParseException {
        int page = 0;
        while (true){
            //从腾讯娱乐网上，获取娱乐新闻信息
            String url = "https://pacaio.match.qq.com/irs/rcd?cid=146&token=49cbb2154853ef1a74ff4e53723372ce&ext=ent&page="+page+"&callback=__jp6";
            CloseableHttpClient httpClient = HttpClients.createDefault();
            HttpGet httpGet = new HttpGet(url);
            CloseableHttpResponse response = httpClient.execute(httpGet);
            //解析出有价值的信息
            if (response.getStatusLine().getStatusCode() == 200){
                //获取响应的数据
                String res = EntityUtils.toString(response.getEntity(), "utf-8");
                //转化成为Json字符串
                res = toJsonString(res);
                //解析json字符串
                HashMap map = JSON.parseObject(res, HashMap.class);
                Integer integer = (Integer)map.get("datanum");
                if (integer == 0){
                    return;
                }
                //获取Map中所有新闻数据的集合
                List<News> newsList = getNewsList(map);
                for (News news : newsList) {
                    //将有价值的数据保存到MySQL数据库
                    service.saveNews(news);
                }
            }
            System.out.println("已经获取第"+page+"页新闻");
            page++;
            

        }
    }



    /**
     * 转化为Json字符串
     * @param src
     * @return
     */
    public static String toJsonString(String src){
        String res = src;
        Integer begin = res.indexOf("{");
        Integer end = res.lastIndexOf(")");
        res = res.substring(begin, end);
        return res;
    }
    
    
    
    public static List<News> getNewsList(Map map) throws ParseException {
        SimpleDateFormat format = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
        List<News> list = new ArrayList<News>();
        //所有的新闻对应的JSON的数组对象
        JSONArray data = (JSONArray)map.get("data");
        for (Object object : data) {
            //一条新闻的JSON对应的Map对象
            Map newsMap = (Map) object;
            News news = new News();
            news.setTitle(newsMap.get("title").toString());
            news.setIntro(newsMap.get("intro").toString());
            news.setSource(newsMap.get("source").toString());
            news.setUrl(newsMap.get("url").toString());
            String publishTimeString = newsMap.get("publish_time").toString();
            Date date = format.parse(publishTimeString);
            news.setPublishTime(date);
            list.add(news);
        }
        return list;
    }
}

5.3、第三大模块：保存数据

解决前面两部分之后，第三部分比较简单，利用三层架构完成数据增添即可。

你可能感兴趣的:(spring,Mybatis,java,网络,json,mysql)

Golang：报错no required module provides package github.com/xx的解决方法凭君语未可 Golang 常见问题 golang github 开发语言
报错问题重现可能的原因及解决方法1.未初始化Go模块解决方法：2.没有添加依赖解决方法：3.网络问题解决方法：4.依赖版本问题解决方法：5.包未发布或路径拼写错误解决方法：6.`gomodtidy`未运行解决方法：7.代码中未使用依赖解决方法：8.`vendor`模式导致依赖无法找到解决方法：实际报错原因及分析解决方法问题重现在运行以下代码时：packagemainimport("context"
JavaWeb开发 - Filter过滤器详解秦老师Q JavaWeb基础 java web java-ee
前言本章节主要学习JavaWeb开发中的Filter过滤器技术，收录于JavaWeb基础专栏，该专栏主要学习JavaWeb开发原生框架、Servlet、JSP、请求对象、响应对象、Session会话对象、Filter过滤器、三层开发模型等知识点，欢迎童鞋们互相交流。觉得不错可以三连订阅喔。目标1.概念2.Filter介绍3.入门案例4.验证登录案例4.1登录代码4.2过滤器验证内容1.概念Filt
华为OD机试E卷 --跳格子3 --24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript python c语言
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c++算法源码题目描述小明和朋友们一起玩跳格子游戏，每个格子上有特定的分数score=[1,-1,-6,7,-17,7]，从起点score[0]开始，每次最大的步长为k，请你返回小明跳到终点score[n-1]时，能得到的最大得分。输入描述第一行输入总的格子数量n第二行输入每个格子的分数score[i]第三
记录 io.springfox 3.0.0 整合 spring boot 2.6.x 由于 springfox bug 引发问题树懒_Zz Spring spring boot bug windows
首先第一个问题就是不兼容：解决方案：@BeanpublicstaticBeanPostProcessorspringfoxHandlerProviderBeanPostProcessor(){returnnewBeanPostProcessor(){@OverridepublicObjectpostProcessAfterInitialization(Objectbean,StringbeanNa
drogon orm分页问题，req->getJsonObject()为空会导致Segmentation fault zh7314
2024年6月22日17:14:12req->getJsonObject()获取json数据的时候，如果没有提前判断if(req->getJsonObject()==nullptr){throwstd::invalid_argument("参数json不能为空");}autojsonPtr=req->getJsonObject();官方文档：https://github.com/drogonfra
MySQL：下划线处理 dingcho 存储数据 mysql 数据库
要查询MySQL中不包含下划线的字符串，可以使用NOTLIKE操作符。以下是一个示例SQL查询，它选出所有不包含下划线的记录：SELECT*FROMyour_tableWHEREyour_columnNOTLIKE'%_%';这样其实是查询不出来记录的，我们需要将其转义一下SELECT*FROMyour_tableWHEREyour_columnNOTLIKE'%\_%';
性能场景之异常场景 wfw123123 性能测试 html5 物联网 java 压力测试
谈到异常场景，其实大家并不陌生，我们在做功能测试的时候，也要考虑异常用例，例如：切换网络，断网，中断使用等等。那么，性能中的异常场景，我们具体该怎么做呢？设计哪些问题才能将异常场景覆盖完整？这就需要我们明确两个关键点：一是异常场景的范围，二是异常场景的设计逻辑。异常场景的范围我理解的异常场景中，基本上采用的就是是宕主机、断网络、宕应用这几种测试手段。此外，从主机、网络、应用等角度出发，还会有一些细
使用神经网络拟合6项参数 Andrew_Xzw 神经网络人工智能深度学习开发语言机器学习 python
使用神经网络拟合6项参数1.数据预处理1.1添加参数解析1.2数据预处理逻辑1.3数据归一化及划分1.4数据标签处理逻辑1.5数据转torch2.定义model2.1CNN_LSTM2.2Transformer3.定义train脚本3.1loss和optimizer3.2train3.3predict1.数据预处理1.1添加参数解析为了方便管理模型和训练等参数，统一用参数解析。defparse_a
Java 异常处理大哥的打嗝 JAVA java jvm servlet
Java是一种面向对象的编程语言，Java程序在运行时可能会发生各种异常，如空指针异常、文件读取异常、算术异常等。在Java中，异常是指程序运行时可能会发生的错误，例如输入不正确、内存不足等等，这些异常会影响程序的正常执行。因此，Java提供了异常处理机制来处理这些异常，以保证程序的稳定性和可靠性。Java中的异常处理机制是通过throw和try-catch语句实现的。在Java中，throw语句
Ubuntu问题集2.0 Glourier 小技巧 Linux ubuntu linux
目录1.实时显示网速、内存占用等2.创建虚拟环境3.设置命令走代理4.下载东西时ConnectionRefused5.通过ssh连接到另一台电脑6.Ctrl+C无法终止进程7.结束某个后台进程8.持久化安装9.桌面无反应10.装系统时缺少grub文件11.查看网络情况和本机IP12.令终端命令走代理13.释放缓存和swap14.Windows远程登录ubuntu桌面15.Sogou拼音皮肤安装不了
springboot3.x集成nacos 并实现多环境配置 web13595609705 java spring boot spring
一、springboot版本springboot3.0.x和springboot3.1.x可直接使用nacos-config-spring-boot-starter包。springboot>=3.2.x需要使用spring-cloud-starter-alibaba-nacos-config包，因为常规包在我发布该文时nacos官方还没更新，已更新的版本只支持到3.1.x，cloud的包2024年
华为OD机试C卷-- 机器人走迷宫（Java & JS & Python）飞码创造者华为OD机试题库华为od c语言机器人 javascript python java
获取题库不需要订阅专栏，可直接私信我进入CSDN领军人物top1博主的华为OD交流圈观看完整题库、最新面试实况、考试报告等内容以及大佬一对一答疑。题目描述1.房间由XY的方格组成，例如下图为6*4的大小。每一个方格以坐标(x，y)描述。2.机器人固定从方格(0，0)出发，只能向东或者向北前进。出口固定为房间的最东北角，如下图的方格(5，3)。用例保证机器人可以从入口走到出口。3.房间有些方格是墙壁
使用云服务器进行游戏开发的好处 wanhengidc 网络
企业选择使用云服务器来进行游戏开发，能够提供很多传统服务器所不具备的优势，不仅可以改善玩家的游戏体验感，还可以帮助提升开发效率，下面小编就来介绍一下使用云服务器进行游戏开发的好处都有什么。云服务器可以根据游戏的实际负载动态调整资源配置，当游戏在用户高峰期的时候也可以迅速增加计算和网络资源，在低峰期时还能够减少网络资源，为企业自身节省了一定的成本，有着很强的弹性扩展能力。选择使用云服务器也不需要额外
大神教你用Python实现Wake On Lan远程开机功能云计算运维工程师技术干活
这篇文章主要介绍了使用Python实现WakeOnLan远程开机功能，文中给大家补充介绍了python通过wakeonlan唤醒内网电脑开机，非常不错，感兴趣的朋友跟随小编一起学习吧Wake-On-LAN简称WOL，是一种电源管理功能；如果存在网络活动，则允许设备将操作系统从待机或休眠模式中唤醒。许多主板厂商支持IBM提出的网络唤醒标准。该标准允许网络管理员远程打开PC机电源，以便进行文件升级、资
如何快速在Windows 10 + Anaconda 3 中使用Mxnet及gluon qianchess mxnet使用 mxnet win10 anaconda gluon 人工智能
如何快速在Windows10+Anaconda3中使用Mxnet及gluon网络上Mxnet的安装以及使用方法很多，自从其作者之一李沐推出了基于Mxnet的深度学习课程之后，我也尝试着去使用了一下Mxnet。首先第一步就是在自己的系统中安装Mxnet及其相关组建。现在的Mxnet常常会跟其虚拟环境Gluon结合在一起，所以下文就一起阐述一下，顺便记录一下自己踩的坑。注意本文的大部分内容都可以在官网
蓝易云 - Linux系统中常见的远程管理协议！蓝易云 linux 运维服务器 http nginx https flutter
Linux系统中常见的远程管理协议有以下几种：1.SSH（SecureShell）：SSH是一种安全的远程登录协议，用于在网络上安全地远程登录到Linux服务器。它提供了加密的传输和身份验证机制，可以防止数据在传输过程中被拦截和篡改。SSH使用用户名和密码或公钥认证来验证用户身份，并允许用户在远程终端上执行命令。2.Telnet：Telnet是一种不安全的远程登录协议，用于在网络上远程登录到Lin
【漏洞复现】锐捷 RG-EW1200G 无线路由器登录绕过 A 八方漏洞复现安全
》》》产品描述《《《锐捷网络RG-EW1200G是一款有线无线全千兆双频无线路由器Q，适合平层家居、别墅、小型店铺、SOHO办公等场景使用。设备性能卓越，足以满足千兆上网需求;信号强劲，信号功率功率提升3倍，覆盖距离提升近1倍覆盖能力强。》》》漏洞描述《《《锐捷网络RG-EW1200G存在登录绕过逻辑漏洞，允许任何用户无需密码即可获得设备管理员权限》》》搜索语句《《《body="static/cs
JavaWeb 前端基础 html + CSS 快速入门 | 018 菜鸟阿康学习编程前端前端 html css
今日推荐语指望别人的救赎，势必走向毁灭——波伏娃日期学习内容打卡编号2025年01月17日JavaWeb前端基础html+CSS018前言哈喽，我是菜鸟阿康。今天正式进入JavaWeb的学习，简单学习html+CSS这2各前端基础部分，以下是我的重点总结，希望对你有所帮助。（建议先看左侧目录，先了解文章结构）（请忽略错误的大纲编号，我直接从笔记中粘贴过来的，就没严格纠正了，重点在内容！）文末和主页
利用代理模式实现日志功能郭亚航 java框架代理日志输出
场景实现一个类，该类实现了数学四则运算，实现日志功能，每次调用对应的运算时，输出相应的日志基本功能接口packagecom.javase.thread;publicinterfaceArithmetic{publicintadd(inti,intj);publicintsub(inti,intj);publicintmul(inti,intj);publicintdiv(inti,intj);}接
手摸手系列之---camel ftp监听接收解析xml报文并入库生成Java对象实战码上艺术家 camel xml camel
前言版本：SpringBoot2.4camel3.5.0最近在做跟一个第三方系统的对接，主要流程就是对方生成XML格式的报文，需要我方将其报文发送到海关申报，然后将申报完的数据再组装成XML报文格式发回到对方的FTP服务器。功能其实挺简单，用Apache的camel-ftp很容易就能实现，下面看看具体如何做吧。一、引入camel依赖：org.apache.camel.springbootcamel
手摸手系列之---camel ftp监听本地报文目录，并在报文生成后上传到远程第三方ftp服务器实战码上艺术家 camel 服务器运维
前言版本：SpringBoot2.4camel3.5.0上篇文章已经说过项目需求和主要流程，现在已经接收解析xml报文并入库生成Java对象。下一步就是处理完生成的数据生成XML报文，再返回给第三方ftp服务器了。下面看看怎么做。1.增加camel配置，本地监听目录和远程第三方ftp服务器URL。#camel配置camel:#camelftp服务路由地址route:id:XMLRouteftp:s
2.TIDB整体架构胡晗- tidb
与传统的单机数据库相比，TiDB具有以下优势：纯分布式架构，拥有良好的扩展性，支持弹性的扩缩容支持SQL，对外暴露MySQL的网络协议，并兼容大多数MySQL的语法，在大多数场景下可以直接替换MySQL默认支持高可用，在少数副本失效的情况下，数据库本身能够自动进行数据修复和故障转移，对业务透明支持ACID事务，对于一些有强一致需求的场景友好，例如：银行转账具有丰富的工具链生态，覆盖数据迁移、同步、
非科班研究生转码-零基础学java笔记总结复习（2） Javaer.Zhang的乞讨之路 java 大数据后端 android 算法
说明：该Java笔记是基于B站韩顺平老师讲的Java来总结提炼的，其中参考了韩老师总结的笔记。具体内容可到B站观看韩顺平老师的Java详细了解。省略号表示不重要。。。具体参考韩老师笔记。目录级别，例：第#章#.##.#.##.#.#.#正文重点内容使用加粗，下划线，红体字等表示。全部内容共28章。需要了解哪章进主页看序号即可。[本文为第二章]目录第2章JAVA概述2.1什么是程序2.2JAVA诞生
3D UNet和Swin-UNETR 学無芷境计算机视觉
3DUNet和Swin-UNETR都是用于医学图像分析的深度学习网络，它们对三维（3D）数据进行特征提取和分割。3DUNet3DUNet是UNet架构的一个变体，专门设计用于处理三维医学图像数据。UNet最初是为二维（2D）图像分割任务设计的，具有典型的编码器-解码器结构。3DUNet扩展了这种架构，以便更好地处理具有深度信息的体积数据，如CT或MRI扫描。主要特点：编码器：逐渐下采样图像，提取并
IoTDB 入门教程基础篇⑤——数据模型和基础概念小康师兄 Apache IoTDB 入门教程 IoTDB 物联网数据模型数据库时序数据库
文章目录一、前文二、数据模型2.1关系型数据库MySQL。2.2时序数据库TDengine2.3时序数据库InfluxDB2.4时序数据库IoTDB（本专栏的正主）三、基础概念3.1数据库（Database）3.2设备模板（元数据模板）3.3设备（实体）3.4物理量（字段）四、数据类型参考一、前文IoTDB入门教程——导读本文主要讲述IoTDB的数据模型和基础概念。不同的数据库都有不同侧重，IoT
JVM参数配置解析 niushoahan java jvm class javadoc deprecated java documentation
在Java、J2EE大型应用中，JVM非标准参数的配置直接关系到整个系统的性能。JVM非标准参数指的是JVM底层的一些配置参数，这些参数在一般开发中默认即可，不需要任何配置。但是在生产环境中，为了提高性能，往往需要调整这些参数，以求系统达到最佳新能。另外这些参数的配置也是影响系统稳定性的一个重要因素，相信大多数Java开发人员都见过“OutOfMemory”类型的错误。呵呵，这其中很可能就是JVM
3DUnetCNN 项目常见问题解决方案魏纯漫
3DUnetCNN项目常见问题解决方案3DUnetCNNPytorch3DU-NetConvolutionNeuralNetwork(CNN)designedformedicalimagesegmentation项目地址:https://gitcode.com/gh_mirrors/3d/3DUnetCNN项目基础介绍3DUnetCNN是一个基于PyTorch的3DU-Net卷积神经网络（CNN）
使用 Node.js 处理异步编程的挑战
Node.js是一个强大的JavaScript运行时环境，它以其非阻塞、事件驱动的特性闻名，使其在构建高并发应用程序时非常出色。然而，这种异步编程模型也带来了挑战，尤其是当我们需要处理复杂的异步操作时。本文将深入探讨Node.js中异步编程的挑战，并介绍一些常见的解决方案。异步编程的挑战在Node.js中，许多操作都是异步的，比如文件操作、网络请求、数据库查询等。虽然异步操作可以提高应用程序的性能
外版抖音TikTok显示网络不稳定的解决方案 android
在这个信息爆炸的时代，短视频平台如外版抖音TikTok已经成为了人们日常生活中不可或缺的一部分。然而，许多用户在使用过程中却常常遇到“网络不稳定”的提示，仿佛一场精彩的表演被突如其来的故障打断。这不仅影响了用户的观看体验，也给品牌推广带来了困扰。为了帮助大家更好地享受TikTok带来的乐趣，我们推荐IPIPGO直播专线，助力您轻松畅游全球网络。为何会出现网络不稳定的提示？首先，我们需要了解导致外版
java学习记录17 cwtlw java学习总结 java 学习开发语言笔记
泛型泛型概念Java泛型（generics）是JDK5引入的一个新特性，泛型提供了编译时类型安全检测机制，该机制允许程序员在编译时检测到非法的类型。泛型的本质是参数化类型，即给类型指定一个参数，然后在使用时再指定该参数的值，那么这个类型就可以在使用时决定了。这种参数类型可以用在类、接口和方法中，分别被称为泛型类、泛型接口、泛型方法。publicclassTestClass{privateTvalu
枚举的构造函数中抛出异常会怎样 bylijinnan java enum 单例
首先从使用enum实现单例说起。为什么要用enum来实现单例？这篇文章（ http://javarevisited.blogspot.sg/2012/07/why-enum-singleton-are-better-in-java.html）阐述了三个理由： 1.enum单例简单、容易，只需几行代码： public enum Singleton { INSTANCE;
CMake 教程 aigo C++
转自：http://xiang.lf.blog.163.com/blog/static/127733322201481114456136/ CMake是一个跨平台的程序构建工具，比如起自己编写Makefile方便很多。介绍：http://baike.baidu.com/view/1126160.htm 本文件不介绍CMake的基本语法，下面是篇不错的入门教程： http:
cvc-complex-type.2.3: Element 'beans' cannot have character Cb123456 spring Webgis
cvc-complex-type.2.3: Element 'beans' cannot have character Line 33 in XML document from ServletContext resource [/WEB-INF/backend-servlet.xml] is i
jquery实例:随页面滚动条滚动而自动加载内容 120153216 jquery
<script language="javascript"> $(function (){ var i = 4;$(window).bind("scroll", function (event){ //滚动条到网页头部的高度，兼容ie,ff,chrome var top = document.documentElement.s
将数据库中的数据转换成dbs文件何必如此 sql dbs
旗正规则引擎通过数据库配置器（DataBuilder）来管理数据库，无论是Oracle，还是其他主流的数据都支持，操作方式是一样的。旗正规则引擎的数据库配置器是用于编辑数据库结构信息以及管理数据库表数据，并且可以执行SQL 语句，主要功能如下。 1)数据库生成表结构信息：主要生成数据库配置文件(.conf文
在IBATIS中配置SQL语句的IN方式 357029540 ibatis
在使用IBATIS进行SQL语句配置查询时，我们一定会遇到通过IN查询的地方，在使用IN查询时我们可以有两种方式进行配置参数：String和List。具体使用方式如下： 1.String:定义一个String的参数userIds，把这个参数传入IBATIS的sql配置文件，sql语句就可以这样写： <select id="getForms" param
Spring3 MVC 笔记（一） 7454103 spring mvc bean REST JSF
自从 MVC 这个概念提出来之后 struts1.X struts2.X jsf 。。。。。这个view 层的技术一个接一个！都用过！不敢说哪个绝对的强悍！要看业务，和整体的设计！最近公司要求开发个新系统！
Timer与Spring Quartz 定时执行程序 darkranger spring bean 工作 quartz
有时候需要定时触发某一项任务。其实在jdk1.3，java sdk就通过java.util.Timer提供相应的功能。一个简单的例子说明如何使用，很简单： 1、第一步，我们需要建立一项任务，我们的任务需要继承java.util.TimerTask package com.test; import java.text.SimpleDateFormat; import java.util.Date;
大端小端转换，le32_to_cpu 和cpu_to_le32 aijuans C语言相关
大端小端转换，le32_to_cpu 和cpu_to_le32 字节序 http://oss.org.cn/kernel-book/ldd3/ch11s04.html 小心不要假设字节序. PC 存储多字节值是低字节为先(小端为先, 因此是小端), 一些高级的平台以另一种方式(大端)
Nginx负载均衡配置实例详解 avords
[导读] 负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡，单从字面上的意思来理解就可以解负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡
乱说的 houxinyou 框架敏捷开发软件测试
从很久以前，大家就研究框架，开发方法，软件工程，好多！反正我是搞不明白！这两天看好多人研究敏捷模型，瀑布模型！也没太搞明白. 不过感觉和程序开发语言差不多，瀑布就是顺序，敏捷就是循环. 瀑布就是需求、分析、设计、编码、测试一步一步走下来。而敏捷就是按摸块或者说迭代做个循环，第个循环中也一样是需求、分析、设计、编码、测试一步一步走下来。也可以把软件开发理
欣赏的价值——一个小故事 bijian1013 有效辅导欣赏欣赏的价值
　　第一次参加家长会，幼儿园的老师说："您的儿子有多动症，在板凳上连三分钟都坐不了，你最好带他去医院看一看。"　　回家的路上，儿子问她老师都说了些什么，她鼻子一酸，差点流下泪来。因为全班30位小朋友，惟有他表现最差；惟有对他，老师表现出不屑，然而她还在告诉她的儿子："老师表扬你了，说宝宝原来在板凳上坐不了一分钟，现在能坐三分钟。其他妈妈都非常羡慕妈妈，因为全班只有宝宝
包冲突问题的解决方法 bingyingao eclipse maven exclusions 包冲突
包冲突是开发过程中很常见的问题：其表现有： 1.明明在eclipse中能够索引到某个类，运行时却报出找不到类。 2.明明在eclipse中能够索引到某个类的方法，运行时却报出找不到方法。 3.类及方法都有，以正确编译成了.class文件，在本机跑的好好的，发到测试或者正式环境就抛如下异常： java.lang.NoClassDefFoundError: Could not in
【Spark七十五】Spark Streaming整合Flume-NG三之接入log4j bit1129 Stream
先来一段废话：实际工作中，业务系统的日志基本上是使用Log4j写入到日志文件中的，问题的关键之处在于业务日志的格式混乱，这给对日志文件中的日志进行统计分析带来了极大的困难，或者说，基本上无法进行分析，每个人写日志的习惯不同，导致日志行的格式五花八门，最后只能通过grep来查找特定的关键词缩小范围，但是在集群环境下，每个机器去grep一遍，分析一遍，这个效率如何可想之二，大好光阴都浪费在这上面了
sudoku solver in Haskell bookjovi sudoku haskell
这几天没太多的事做，想着用函数式语言来写点实用的程序，像fib和prime之类的就不想提了（就一行代码的事），写什么程序呢？在网上闲逛时发现sudoku游戏，sudoku十几年前就知道了，学生生涯时也想过用C/Java来实现个智能求解，但到最后往往没写成，主要是用C/Java写的话会很麻烦。现在写程序，本人总是有一种思维惯性，总是想把程序写的更紧凑，更精致，代码行数最少，所以现
java apache ftpClient bro_feng java
最近使用apache的ftpclient插件实现ftp下载，遇见几个问题，做如下总结。 1. 上传阻塞，一连串的上传，其中一个就阻塞了，或是用storeFile上传时返回false。查了点资料，说是FTP有主动模式和被动模式。将传出模式修改为被动模式ftp.enterLocalPassiveMode();然后就好了。看了网上相关介绍，对主动模式和被动模式区别还是比较的模糊，不太了解被动模
读《研磨设计模式》-代码笔记-工厂方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 工厂方法模式：使一个类的实例化延迟到子类 * 某次，我在工作不知不觉中就用到了工厂方法模式（称为模板方法模式更恰当。2012-10-29）： * 有很多不同的产品，它
面试记录语 chenyu19891124 招聘
或许真的在一个平台上成长成什么样，都必须靠自己去努力。有了好的平台让自己展示，就该好好努力。今天是自己单独一次去面试别人，感觉有点小紧张，说话有点打结。在面试完后写面试情况表，下笔真的好难，尤其是要对面试人的情况说明真的好难。今天面试的是自己同事的同事，现在的这个同事要离职了，介绍了我现在这位同事以前的同事来面试。今天这位求职者面试的是配置管理，期初看了简历觉得应该很适合做配置管理，但是今天面
Fire Workflow 1.0正式版终于发布了 comsci 工作 workflow Google
Fire Workflow 是国内另外一款开源工作流，作者是著名的非也同志，哈哈.... 官方网站是 http://www.fireflow.org 经过大家努力,Fire Workflow 1.0正式版终于发布了正式版主要变化: 1、增加IWorkItem.jumpToEx(...)方法，取消了当前环节和目标环节必须在同一条执行线的限制，使得自由流更加自由 2、增加IT
Python向脚本传参 daizj python 脚本传参
如果想对python脚本传参数，python中对应的argc, argv(c语言的命令行参数)是什么呢？需要模块：sys 参数个数：len(sys.argv) 脚本名： sys.argv[0] 参数1： sys.argv[1] 参数2： sys.argv[
管理用户分组的命令gpasswd dongwei_6688 passwd
NAME： gpasswd - administer the /etc/group file SYNOPSIS： gpasswd group gpasswd -a user group gpasswd -d user group gpasswd -R group gpasswd -r group gpasswd [-A user,...] [-M user,...] g
郝斌老师数据结构课程笔记 dcj3sjt126com 数据结构与算法
<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
yii2 cgridview加上选择框进行操作 dcj3sjt126com GridView
页面代码 <?=Html::beginForm(['controller/bulk'],'post');?> <?=Html::dropDownList('action','',[''=>'Mark selected as: ','c'=>'Confirmed','nc'=>'No Confirmed'],['class'=>'dropdown',])
linux mysql fypop linux
enquiry mysql version in centos linux yum list installed | grep mysql yum -y remove mysql-libs.x86_64 enquiry mysql version in yum repositoryyum list | grep mysql oryum -y list mysql* install mysq
Scramble String hcx2013 String
Given a string s1, we may represent it as a binary tree by partitioning it to two non-empty substrings recursively. Below is one possible representation of s1 = "great":
跟我学Shiro目录贴 jinnianshilongnian 跟我学shiro
历经三个月左右时间，《跟我学Shiro》系列教程已经完结，暂时没有需要补充的内容，因此生成PDF版供大家下载。最近项目比较紧，没有时间解答一些疑问，暂时无法回复一些问题，很抱歉，不过可以加群（334194438/348194195）一起讨论问题。 ----广告-----------------------------------------------------
nginx日志切割并使用flume-ng收集日志 liyonghui160com
nginx的日志文件没有rotate功能。如果你不处理，日志文件将变得越来越大，还好我们可以写一个nginx日志切割脚本来自动切割日志文件。第一步就是重命名日志文件，不用担心重命名后nginx找不到日志文件而丢失日志。在你未重新打开原名字的日志文件前，nginx还是会向你重命名的文件写日志，linux是靠文件描述符而不是文件名定位文件。第二步向nginx主
Oracle死锁解决方法 pda158 oracle
　select p.spid,c.object_name,b.session_id,b.oracle_username,b.os_user_name from v$process p,v$session a, v$locked_object b,all_objects c where p.addr=a.paddr and a.process=b.process and c.object_id=b.
java之List排序 shiguanghui list排序
在Java Collection Framework中定义的List实现有Vector，ArrayList和LinkedList。这些集合提供了对对象组的索引访问。他们提供了元素的添加与删除支持。然而，它们并没有内置的元素排序支持。　　你能够使用java.util.Collections类中的sort()方法对List元素进行排序。你既可以给方法传递
servlet单例多线程 utopialxw 单例多线程 servlet
转自http://www.cnblogs.com/yjhrem/articles/3160864.html 和 http://blog.chinaunix.net/uid-7374279-id-3687149.html Servlet 单例多线程 Servlet如何处理多个请求访问？Servlet容器默认是采用单实例多线程的方式处理多个请求的：1.当web服务器启动的

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他