cai-4

实训笔记8.28

8.28笔记
- 一、大数据计算场景主要分为两种
- - 1.1 离线计算场景
  - 1.2 实时计算场景
- 二、一般情况下大数据项目的开发流程
- - 2.1 数据采集存储阶段
  - 2.2 数据清洗预处理阶段
  - 2.3 数据统计分析阶段
  - 2.4 数据挖掘预测阶段
  - 2.5 数据迁移阶段
  - 2.6 数据可视化阶段
- 三、纯大数据离线计算项目
- - 3.1 预备知识
  - - 3.1.1 电商网站的概念
    - 3.1.2 什么是用户的行为日志数据以及用户的行为数据是怎么产生的
    - 3.1.3 用户行为日志数据的组成（记录哪些数据）
  - 3.2 项目的开发背景和意义
  - 3.3 项目的数据格式和数据来源问题
  - - 3.3.1 我们项目记录的用户行为格式如下
  - 3.4 项目的开发流程和技术选项
  - 3.5 项目的统计分析的指标
  - - 3.5.1 从终端纬度
    - 3.5.2 从用户纬度
    - 3.5.3 从地理纬度
    - 3.5.4 从时间纬度
    - 3.5.5 从来源纬度
  - 3.6 项目的前置阶段--数据的来源和产生问题

8.28笔记

一、大数据计算场景主要分为两种

1.1 离线计算场景

数据产生之后，不是立马处理数据，而是先把数据存放起来，积攒到一定的程度之后统一的进行计算处理操作

适用于我们的数据或者需求对时间要求不高的场景下，要求一个小时、一天、一周、一个月…出一次结果

Hadoop技术、Spark Core、Spark SQL技术

1.2 实时计算场景

数据产生之后，需要立马处理数据，不能等待

适用于我们业务需求对时间要求很高的场景，要求几毫秒或者几百毫秒之间立马算出结果

Spark Streaming、Flink、Storm技术

Hadoop计算因为它的架构设计，因此只能做离线计算；Spark基于内存进行运算的，因此Spark技术既可以胜任离线计算，也可以去做实时计算（不精）；Flink/storm技术专门为实时计算设计的

图计算、算法预测等等…

【注】再去进行大数据项目开发时，不是只使用一个技术完成的，而是使用一系列技术完成项目的开发大数据项目当中，使用一系列技术完成项目开发，技术和技术之间我们是有版本对应问题的，大数据技术主要有两种发行版本： Apache版本：开源免费，如果整合多个技术，需要自己整合（版本的对应关系、技术的配置等等） CDH版本：收费的，把常用的技术的版本关系全部给配置好了，技术配置要比apache简单。

二、一般情况下大数据项目的开发流程

2.1 数据采集存储阶段

【注意】数据得有一个产生的过程，数据产生一般不属于大数据环节

将需要使用大数据处理的数据，先使用数据采集技术将数据采集到大数据环境下进行持久化、海量化的保存。

2.2 数据清洗预处理阶段

采集存储的数据并不是都是有价值的数据（价值密度低），可能存在很多的错误的、缺失的、异常的数据，数据需要清洗预处理，清洗的目的是把无用的数据过滤掉，预处理的目的是为了将数据的格式统一起来，便于我们后期的统计分析。

2.3 数据统计分析阶段

从清洗预处理完成的时候基础上对数据进行聚合汇总，统计一些数据中隐含的一些价值信息

2.4 数据挖掘预测阶段

在统计分析的结果之上，可以预测或者继续深入挖掘数据中的更深层次的含义一般使用到大数据算法（算法工程师需要做的事情大数据开发有区别的）

2.5 数据迁移阶段

将统计分析的结果迁移到非大数据环境，为后期的操作做准备

2.6 数据可视化阶段

将统计分析完成的结果指标以可视化图表（柱状图、折线图）的形式进行展示。严格意义上来说数据可视化也不是大数据工程师需要做的事情。

三、纯大数据离线计算项目

电商网站用户行为日志分析平台，电信用户通话数据分析平台

电商网站用户行为日志分析平台项目主要是对电商网站产生的用户行为日志数据进行采集存储、清洗预处理、统计分析、数据可视化展示的。

3.1 预备知识

3.1.1 电商网站的概念

专门用来进行网站购物的平台，大数据最开始使用最广泛、最成熟的就是电商网站。项目主要针对的白龙马电商购物网站–公司的子公司

3.1.2 什么是用户的行为日志数据以及用户的行为数据是怎么产生的

用户行为数据不管什么网站都会有用户的行为数据记录，行为数据指的是用户在网站当中进行的一系列动作，背后都会触发一些程序记录用户的行为数据。用户行为数据我们会通过程序一般都记录到日志文件当中

用户行为数据基本都是源源不断的产生的（7*24小时不停止的产生）

网站的用户行为数据记录不是大数据开发工程师的事，而是软件开发人员的工作（前端、后端工作人员）无非就是产生数据的时候需要和大数据开发人员沟通记录用户的哪些数据而已

3.1.3 用户行为日志数据的组成（记录哪些数据）

用户的系统属性信息：用户使用的浏览器信息、用户使用的操作系统、用户的IP地址等等
用户的访问信息：用户触发的行为之后访问的网站信息\
用户的来源信息：用户行为触发之后访问的网站信息是从哪个网站过来的
点击的产品信息：点击的商品或者连接对应的产品的详细信息可以记录的点击产品的时候，可以从数据库查询商品的详细信息
用户的个人信息：点击网站某一个连接的时候，如果你登录了的话，前端请求的时候，会把用户的标识带上，后端可以根据用户标识去查询你在网站注册的信息（用户的性别、出生年月、用户的昵称、手机号、实名认证信息等等）
【补充】网站或者软件的组成
1. 前端（界面）
  1. 作用
```
 负责和用户进行交互的
```
  1. 技术
    1. web网站
      
      html/css/js vue/recat/angular
    2. 微信小程序
      
      wxml/wxss/js/json
    3. 手机app软件
      
      uniapp、c语言的网站制作技术，Object-C
    4. PC端软件
      
      Java GUI、python、C语言等等界面制作框架
2. 后端
  1. 作用
    1. 负责和前端之间进行交互（接受前端请求、响应前端数据）
    2. 处理前端所需的业务逻辑（需要连接数据库）
  2. 技术
    1. 比较简单的后端技术：nodejs、php(web全栈开发工程师)
    2. 比较成熟的后端技术：JavaEE（Servelt/JSP、SSM框架、SpringBoot）、Python（不常用）、C/C++
3. 数据库
  1. 作用
    
    负责进行数据的保存的
  2. 技术
    1. 存储结构化数据的数据库：MySQL oracle、SQL Server
    2. 存储临时性缓存数据的数据库：Redis
    3. 存储非结构化或者文档数据：mongodb

3.2 项目的开发背景和意义

背景：对于一个电商网站而言，大数据统计分析是非常有必要的，通过大数据的统计分析，我们可以得到很多和网站运营发展有关的指标信息。

用户行为数据（可以从不同的纬度进行统计分析）

3.3 项目的数据格式和数据来源问题

《白龙马电商用户行为日志分析平台》数据来源于网站记录的用户行为日志数据，日志数据我们是通过电商网站内嵌的埋点程序以及后端程序记录的。（埋点程序就是指的是网站的一些”暗箱“操作）来源问题一般我们知道即可，不需要我们自己去完成，来源一般都是软件开发人员完成的。项目的数据必然是7*24小时不间断产生的

3.3.1 我们项目记录的用户行为格式如下

149.74.183.133 - - 2018-09-24 19:38:17 "GET https://www.bailongma.com/register HTTP/1.0" 300 72815 https://www.bailongma.com/item/a Windows Internet Explorer Tridentwindows 广西 22.48 108.19 39

上面就是我们网站触发了某些行为（点击、浏览等等），记录的一条完整的用户行为数据（每一个字段之间以空格分割的）：

149.74.183.133     用户的IP地址（ip可以统计网站的访客数量）
--    个字段 两个字段一个代表用户的邮箱，一个代表用户的标识 （都是-- 代表的是没有记录） 
2018-09-24 19:38:17   两个字段 一个代表日期 一个代表时间 用户行为触发时间 "
GET https://www.bailongma.com/register HTTP/1.0"  三个字段代表用户行为触发之后访问的网站，请求方法  请求URL  请求的协议 
300         请求网站给的响应状态码  1xx  2xx(请求成功)  3xx(重定向，请求成功)  4xx(请求失败 404 前端的问题)   5xx(请求失败  后端代码的问题)  
72815      请求网站给我们的响应字节数 
https://www.bailongma.com/item/a  请求网站对应来源网站 
Windows Internet Explorer Tridentwindows    n个字段组成的（不确定）代表的是浏览器和操作系统信息 
广西   用户请求地址 
22.48   用户请求网站时所处的纬度 
108.19    用户请求网站时所处的经度 
39     用户的年龄信息

用户的系统属性信息、用户信息、访问信息、来源信息

3.4 项目的开发流程和技术选项

本次我们项目主要分为五个阶段开完成：数据采集存储阶段、数据清洗预处理阶段、数据统计分析阶段、数据迁移导出阶段、数据可视化阶段、任务调度阶段。

3.5 项目的统计分析的指标

3.5.1 从终端纬度

不同浏览器的用户使用量

3.5.2 从用户纬度

不同年龄段用户访问量

网站的独立访客数

网站的新老用户数量

3.5.3 从地理纬度

不同省份用户的访问量

3.5.4 从时间纬度

每一年用户的访问量

每一月用户的访问量

每天/每小时用户的访问量

不同季度的用户访问量

3.5.5 从来源纬度

网站站内和站外流量的对比

3.6 项目的前置阶段–数据的来源和产生问题

严格意义上来说不属于大数据环节的一部分，但是如果没有这个阶段，那么大数据就无从谈起

《白龙马电商用户行为日志分析平台》数据来源于我们网站的埋点程序，当用户在白龙马电商网站的界面上触发了某种动作（浏览、点击、鼠标的移入等等），网站的后端会把本次用户的行为以数据的形式记录到一个日志文件中。 149.74.183.133 - - 2018-09-24 19:38:17 “GET https://www.bailongma.com/register HTTP/1.0” 300 72815 https://www.bailongma.com/item/a Windows Internet Explorer Tridentwindows 广西 22.48 108.19 39

只要电商网站不关闭，那么数据源源不断的产生到日志文件当中。意味着网站的用户行为数据是7*24小时源源不断的会记录的。

【问题】白龙马电商网站是公司的内部产品，只有公司人员能使用，大家无法使用。如果我们要做这个项目，因为我们没有产生的数据的网站。

虽然我们没有网站，但是我们有网站以前产生的脱敏数据，因此我们就可以基于以前产生的脱敏数据，模拟数据产生的过程只需要按照数据的格式产生一批和脱敏数据格式一致的数据即可。产生的时候增加一点随机性（每分钟产生100条或者每隔10秒产生20条数据）。

package com.sxuek;

import java.io.*;
import java.text.SimpleDateFormat;
import java.util.*;

/**
 * 专门用来产生用户行为数据的  而且通过这个类模拟白龙马用户行为数据产生过程
 * 120.191.181.178 - - 2018-02-18 20:24:39 "POST https://www.bailongma.com/item/b HTTP/1.1" 203 69172 https://www.bailongma.com/register UCBrowser Webkit X3android 8.0 海南 20.02 110.20 36
 * ip地址 两个中划线  日期 时间  用户的请求网站(三个字段组成的)  请求网站的响应码  请求的响应字节数  来源网站   浏览器信息（n个字段）  省份  纬度  经度  年龄
 *
 * 模拟数据的时候--数据的真实性，IP地址随机生成  时间生成-数据产生的时间  来源网站和请求网址可以从脱敏数据中获取回来
 * 浏览器信息（从文件读取）
 */
public class DataGenerator {
    //1、定义一个存储IP地址的集合 一会产生模拟数据的时候，模拟数据当中ip地址从集合中随机获取一个
    private static List<String> ipList = new ArrayList<>();
    //2、定义一个集合，集合存放请求的白龙马的网址  模拟数据当中请求网址时从集合中随机获取一个即可
    private static List<String> requestList = new ArrayList<>();
    //3、定义一个集合，集合存放来源网站信息，模拟数据的来源网站时候我们可以从集合中随机获取一个即可
    private static List<String> refererList = new ArrayList<>();
    //4、定义一个集合 存放请求的响应状态码
    private static List<String> codeList = new ArrayList<>();
    //5、定义一个集合 存放浏览器信息  一会模拟产生数据时，浏览器信息从集合中随机获取
    private static List<String> userAgentList = new ArrayList<>();
    //6、定义一个集合，集合存放地理位置信息
    private static List<String> addressList = new ArrayList<>();

    /**
     * 初始化方法，初始化方法主要是给我们上面定义的集合先填充一点数据
     */
    private static void init(){
        /**
         * 1、填充状态码集合 一会随机从集合获取一条数据，默认情况下每一条数据的获取概率都是一样
         * 如果你想让某一个值获取概率大一点那么可以将这个值在集合多添加几次
         */
        codeList.addAll(Arrays.asList("200","203","300","301","200","203","300","301","200","203","300","301","200","203","300","301","400","401","403","500","503"));
        /**
         * 2、填充浏览器信息集合
         */
        userAgentList.add("Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; Win64; x64; Trident/4.0)");
        userAgentList.add("Mozilla/5.0 (Windows; U; Windows NT 5.2) Gecko/2008070208 Firefox/3.0.1");
        userAgentList.add("Mozilla/5.0 (Macintosh; PPC Mac OS X; U; en) Opera 8.0");
        userAgentList.add("Mozilla/5.0 (Windows; U; Windows NT 5.2) AppleWebKit/525.13 (KHTML, like Gecko) Version/3.1 Safari/525.13");
        userAgentList.add("Mozilla/5.0 (Windows; U; Windows NT 5.2) AppleWebKit/525.13 (KHTML, like Gecko) Chrome/0.2.149.27 Safari/525.13");
        userAgentList.add("Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.11 (KHTML, like Gecko) Chrome/20.0.1132.11 TaoBrowser/2.0 Safari/536.11");
        userAgentList.add("Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident/5.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; .NET4.0C; .NET4.0E; QQBrowser/7.0.3698.400) ");
        userAgentList.add("Mozilla/5.0 (Windows NT 5.1) AppleWebKit/535.11 (KHTML, like Gecko) Chrome/17.0.963.84 Safari/535.11 SE 2.X MetaSr 1.0");
        userAgentList.add("Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.11 (KHTML, like Gecko) Chrome/20.0.1132.11 TaoBrowser/2.0 Safari/536.11");
        /**
         * 填充ip地址  请求网站 来源网站  省份地理位置信息 四个集合
         * 四个集合的填充不能随便瞎写  集合从脱敏数据文件中读取对应的值填充进来
         */
        BufferedReader bufferedReader = null;
        try {
            bufferedReader = new BufferedReader(new FileReader("a.log"));
            String line = null;
            //这个数据是我们给大家发送的脱敏数据 脱敏数据大数据没法使用 原因是因为是旧数据
            while((line = bufferedReader.readLine()) != null){
                String[] array = line.split(" ");
                //脱敏数据中的IP地址放到ipList集合中
                ipList.add(array[0]);
                //需要把请求方式 请求网站 请求协议三个字段以空格组合放到requestList集合中
                requestList.add(array[5]+" "+array[6]+" "+array[7]);
                //来源信息把它加到来源列表当中
                refererList.add(array[10]);
                refererList.add("https://www.baidu.com/search");
                refererList.add("https://www.baidu.com/search");
                refererList.add("https://www.baidu.com/search");
                refererList.add("https://www.sougou.com/search");
                refererList.add("https://www.google.com/search");
                //把省份 维度 经度 加到地理位置数据中
                addressList.add(array[array.length-4]+" "+array[array.length-3]+" "+array[array.length-2]);
            }
        } catch (FileNotFoundException e) {
            throw new RuntimeException(e);
        } catch (IOException e) {
            throw new RuntimeException(e);
        } finally {
            if (bufferedReader != null){
                try {
                    bufferedReader.close();
                } catch (IOException e) {
                    throw new RuntimeException(e);
                }
            }
        }
    }

    /**
     * 程序执行入口
     * @param args
     */
    public static void main(String[] args) throws IOException, InterruptedException {
        //1、填充模拟数据集合
        init();
        /**
         * 2、模拟数据的目的是为了模拟真实的数据产生逻辑，
         * 真实场景下 数据是源源不断的产生的。所以我们模拟程序也是源源不断的产生的，不会停止的 除非你手动停止
         * 产生数据的时候，数据得有一个存放的一个文件路径 文件中通过IO流写入数据
         */
        Scanner scanner = new Scanner(System.in);
        System.out.println("请输入网站产生的用户行为日志数据文件的路径");
        String path = scanner.next();
        //定义IO输出流  用于模拟一会数据产生之后输出到日志文件的的过程
        BufferedWriter bufferedWriter = new BufferedWriter(new FileWriter(path));
        //随机类 用于产生随机数的
        Random random = new Random();
        //定义时间格式类 用于格式化时间的
        SimpleDateFormat sdf = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
        while (true){
            /**
             * 真实情况下 虽然数据是7*24小时产生的，但是并不是每时每刻都在产生数据，
             * 而是会间断性的产生的  比如每隔1-10s 产生10-50条数据
             * 尤其是在凌晨12:00 -6:00的时候 数据产生的非常缓慢
             */
            //1、先获取数据产生的一个时间
            Calendar calendar = Calendar.getInstance();
            boolean judgeNight = isJudgeNight(calendar);
            // num代表一次产生num条数据
            int num = 0;
            // time代表产生一次数据 休息多长时间
            int time = 0;
            if (judgeNight){
                //代表是凌晨的时间
                num = random.nextInt(10);
                time = 30000+random.nextInt(60001);
            }else{
                //代表的是非凌晨的时间
                num = random.nextInt(50);
                time = 1000+ random.nextInt(20001);
            }
            /**
             * for循环代表产生num条数据
             */
            for (int i = 0; i < num; i++) {
                /**
                 * 获取数据对应的值  然后拼接 输出即可
                 */
                //1、获取ip地址 [0,ipList.size()-1]
                String ip = ipList.get(random.nextInt(ipList.size()));
                //2、获取数据的生成时间
                Date date = new Date();
                //2023-08-28 18:00:00
                String dataGenTime = sdf.format(date);
                //3、随机获取请求的网址--行为触发之后请求的网址
                String request = requestList.get(random.nextInt(requestList.size()));
                //4、随机获取一个状态码
                String code = codeList.get(random.nextInt(codeList.size()));
                //5、随机产生一个响应字节数
                int bytes = random.nextInt(100000);
                //6、随机获取一个来源网站
                String referer = refererList.get(random.nextInt(refererList.size()));
                //7、随机获取一个浏览器信息
                String userAgent = userAgentList.get(random.nextInt(userAgentList.size()));
                //8、随机获取一个地理位置信息
                String address = addressList.get(random.nextInt(addressList.size()));
                //9、随机产生一个年龄
                int age = 18+ random.nextInt(71);
                //组装数据  可以使用StringBuffer完成 数据和数据之间一定要以空格分割
                String data = ip+" - - "+dataGenTime+" "+request+" "+code+" "+bytes+" "+referer+" "+userAgent+" "+address+" "+age;
                //将数据输出
                bufferedWriter.write(data);
                //写出一个换行符 保证一条用户行为数据独占一行
                bufferedWriter.newLine();
                //bufferWriter是处理流 输出数据必须加flush
                bufferedWriter.flush();
            }
            //生成num条数据之后 间隔time时间之后再继续生成
            Thread.sleep(time);
            System.out.println("间隔了"+time+"秒之后生成了"+num+"条数据");
        }
    }

    /**
     * 方法是用来判断是否为凌晨的时间
     * @param cal
     * @return
     */
    public static boolean isJudgeNight(Calendar cal){
        //先获取当前的时间
        Date currentTime = cal.getTime();
        //先获取当前日期下的凌晨时间段  两个时间 一个是开始的时间 一个是结束的时间
        //开始的时间是当天的00:00:00  结束时间 06:00:00
        cal.set(Calendar.HOUR_OF_DAY,0);
        cal.set(Calendar.MINUTE,0);
        cal.set(Calendar.SECOND,0);
        //获取当前时间对应的凌晨的开始时间
        Date startTime = cal.getTime();

        cal.set(Calendar.HOUR_OF_DAY,6);
        cal.set(Calendar.MINUTE,0);
        cal.set(Calendar.SECOND,0);
        //获取当前时间对应的结束时间
        Date endTime = cal.getTime();

        if (currentTime.after(startTime) && currentTime.before(endTime)){
            return true;
        }else{
            return false;
        }
    }
}

C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element((1) 2401_84976182 程序员 c语言 c++学习
既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上CC++开发知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新如果你需要这些资料，可以戳这里获取#include#include#includeusingnamespacestd;boolcmp(int
基于链家网的二手房数据采集清洗与可视化分析 Mint_Datazzh 项目 selenium 网络爬虫
个人学习内容笔记，仅供参考。项目链接：https://gitee.com/rongwu651/lianjia原文链接：基于链家网的二手房数据采集清洗与可视化分析–笔墨云烟研究内容该课题的主要目的是通过将二手房网站上的存量与已销售房源，构建一个二手房市场行情情况与房源特点的可视化平台。该平台通过HTML架构和Echarts完成可视化的搭建。因此，该课题的主要研究内容就是如何利用相关技术设计并实现这样
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
分布式学习笔记_04_复制模型 NzuCRAS 分布式学习笔记架构后端
常见复制模型使用复制的目的在分布式系统中，数据通常需要被分布在多台机器上，主要为了达到：拓展性：数据量因读写负载巨大，一台机器无法承载，数据分散在多台机器上仍然可以有效地进行负载均衡，达到灵活的横向拓展高容错&高可用：在分布式系统中单机故障是常态，在单机故障的情况下希望整体系统仍然能够正常工作，这时候就需要数据在多台机器上做冗余，在遇到单机故障时能够让其他机器接管统一的用户体验：如果系统客户端分布
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
入门html这篇文章就够了 ξ流ぁ星ぷ132 html 前端
HTML笔记文章目录HTML笔记html介绍什么是htmlhtml的作用HTML标签介绍常用标签标签and标签and标签u标签del删除线br标签用于换行pre标签，预处理标签span标签div标签sub标签andsup标签hr标签h1,h2...h6标签：HTML5中的语义标签：特殊字符img标签a标签第一种用法：超链接第二种用法：锚点video标签表格标签：form标签input标签selec
数字孪生技术为UI前端注入新活力：实现产品设计的沉浸式体验 ui设计前端开发老司机 ui
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!一、引言：从“平面交互”到“沉浸体验”的UI革命当用户在电商APP中翻看3D家具模型却无法感知其与自家客厅的匹配度，当设计师在2D屏幕上绘制汽车内饰却难以预判实际乘坐体验——传统UI设计的“平面化、静态化、割裂感”
OKHttp3源码分析——学习笔记 Sincerity_ 源码相关 Okhttp 源码解析读书笔记 httpclient cache
文章目录1.HttpClient与HttpUrlConnection的区别2.OKHttp源码分析使用步骤:dispatcher任务调度器,（后面有详细说明）Request请求RealCallAsyncCall3.OKHttp架构分析1.异步请求线程池,Dispather2.连接池清理线程池-ConnectionPool3.缓存整理线程池DisLruCache4.Http2异步事务线程池,http
vue3面试题(个人笔记) 武昌库里写JAVA 面试题汇总与解析课程设计 spring boot vue.js java 学习
vue3比vue2有什么优势？性能更好，打包体积更小，更好的ts支持，更好的代码组织，更好的逻辑抽离，更多的新功能。描述Vue3生命周期CompositionAPI的生命周期：onMounted()onUpdated()onUnmounted()onBeforeMount()onBeforeUpdate()onBeforeUnmount()onErrorCaptured()onRenderTrac
提升企业级数据处理效率！TDengine 四个集群优化点详解 TDengine （老段） TDengine 运维大数据数据库物联网时序数据库服务器运维 tdengine
为了帮助企业更好地进行大数据处理，我们在此前TDengine3.x系列版本中进行了几项与集群相关的优化和新功能开发，以提升集群的稳定性和在异常情况下的恢复能力。这些优化包括clusterID隔离、leaderrebalance、raftlearner和restorednode。本文将对这几项重要优化进行详细阐述，以解答企业在此领域的疑问，并帮助大家更好地应对相关挑战。clusterID隔离问题fi
Python学习笔记5|条件语句和循环语句 iamecho9 Python从0到1学习笔记 python 学习笔记
一、条件语句条件语句用于根据不同的条件执行不同的代码块。1、if语句基本语法：if布尔型语句1:代码块#语句1为True时执行的代码示例：age=int(input("请输入你的年龄:"))ifage>=18:print("你已成年")2、if-else语句如果if条件不成立，则执行else代码块：if布尔型语句1:代码块#语句1为True时执行的代码else:代码块#语句1为False时执行的代
swagger【个人笔记】撰卢笔记 java
文章目录swagger导入mave坐标在配置类(WebMvcConfiguration)中加入knife4j相关配置设置静态资源映射，主要是让拦截器放行swagger常用注解@Api(tags="\[描述这个类的作用]")@ApiModel(description="\[描述这个类的作用]")@ApiModelProPerty("描述这个类的作用")@ApiOperation("\[描述方法的作用
【个人笔记】负载均衡撰卢笔记负载均衡运维
文章目录nginx反向代理的好处负载均衡负载均很的配置方式均衡负载的方式nginx反向代理的好处提高访问速度进行负载均衡保证后端服务安全负载均衡负载均衡，就是把大量的请求按照我们指定的方式均衡的分配给集群中的每台服务器负载均很的配置方式upstreamwebservers{server192.168.100.128:8080server192.168.100.129:8080}server{lis
在 Obsidian 中本地使用 DeepSeek — 无需互联网！知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek
简介您是否想在Obsidian内免费使用类似于ChatGPT的本地LLM？如果是，那么本指南适合您！我将引导您完成在Obsidian中安装和使用DeepSeek-R1模型的确切步骤，这样您就可以在笔记中拥有一个由AI驱动的第二大脑。推荐文章《24GBGPU中的DeepSeekR1：UnslothAI针对671B参数模型进行动态量化》权重1，DeepSeek类《在RaspberryPi上运行语音识别
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
5G标准学习笔记14 - CSI--RS概述刘孬孬沉迷学习 5G 学习笔记信息与通信
5G标准学习笔记14-CSI–RS概述大家好~，这里是刘孬孬，今天带着大家一起学习一下5GNR中一个非常非常重要的参考信号------------------CSI-RS信号，CSI-RS不是持续发送，UE只能在网络明确配置了CSI-RS的情况下才能使用其进行信道测量。前言对于CSI-RS，肯定还离不开前面所说的CSI（channelstateinformation），前面也讲过CSI对于MIMO
5G标准学习笔记06-基于AI/ML波束管理刘孬孬沉迷学习 5G 学习笔记
5G标准学习笔记06-基于AI/ML波束管理前言前面对于孬孬学习了波束管理的概述，下面要进一步来看一下传统波束管理和现在3GPP中推动的AL/ML波束管理之前的区别联系。一、传统波束管理方法流程传统BM流程主要包括以下步骤：波束扫描（BeamSweeping）：gNB通过顺序发送多个窄波束（SSB或CSI-RS），覆盖整个服务区域，UE测量每个波束的信号质量（如L1-RSRP或L1-SINR）。波
5G标准学习笔记03- CSI 反馈增强概述刘孬孬沉迷学习 5G 笔记学习
5G标准学习笔记03-CSI反馈增强概述大家好，最近在研究AI/ML3gpp标准NR空口的有关内容，后面可能会给大家介绍一下对应的有关内容AI/ML在3GPP标准中的研究进展在AI/ML在NR空口的应用中，对应标准主要聚焦了3个case进行讨论研究分别是：CSI反馈增强；波束管理；定位精度增强；这三个内容可能比较涉及RAN1/2的具体内容，后面会基于这个进行一定的介绍。今天主要是主要介绍CSI反馈
运维笔记＜4＞ xxl-job打通 GeminiJM 运维 java xxl-job
新的一天，来点新的运维业务，今天是xxl-job的打通其实在非集群中，xxl-job的使用相对是比较简单的，相信很多人都有使用的经验这次我们的业务场景是在k8s集群中，用xxl-job来做定时调度加上第一次倒腾，也是遇到了不少问题，在这里做一些记录1.xxl-job的集群安装首先是xxl-job的集群安装先贴上xxl-jobsql初始化文件的地址：xxl-job/doc/db/tables_xxl
全面探索Kafka：架构、应用与流处理
Kafka：企业级消息系统与流处理平台的深度解析ApacheKafka作为分布式流处理平台，广泛应用于大数据处理和实时分析领域。本文将基于其官方文档，详细探讨Kafka的核心功能、应用场景以及如何进行有效管理。背景简介Kafka作为高吞吐量的消息系统，支持企业级的发布-订阅模式。它能够处理大量实时数据，并支持高并发读写操作。本文将依据Kafka官方文档的内容，逐层深入，从入门到高级应用，帮助读者全
Flink时间窗口详解 bxlj_jcj Flink flink 大数据
一、引言在大数据流处理的领域中，Flink的时间窗口是一项极为关键的技术，想象一下，你要统计一个电商网站每小时的订单数量。由于订单数据是持续不断产生的，这就形成了一个无界数据流。如果没有时间窗口的概念，你就需要处理无穷无尽的数据，难以进行有效的统计分析。而时间窗口的作用，就是将这无界的数据流按照时间维度切割成一个个有限的“数据块”，方便我们对这些数据进行处理和分析。比如，我们可以定义一个1小时的时
探索实时流处理的未来：Kafka Streams 深度指南秋或依
探索实时流处理的未来：KafkaStreams深度指南项目介绍欢迎进入KafkaStreams：实时流处理的世界！这不仅仅是一本书，更是一个通往流处理领域深层奥秘的门户。由PrashantPandey编著，这本书以ApacheKafka2.1中的KafkaStreams库为核心，为读者铺就了一条从理解基础概念到熟练掌握KafkaStreams编程的路径。无论是软件工程师、数据架构师，还是对大数据处
Elasticsearch搜索引擎存储：从原理到实践的全景解析 Python×CATIA工业智造搜索引擎 elasticsearch 大数据
引言在大数据时代，数据规模呈指数级增长，传统数据库的模糊查询、实时分析能力逐渐成为瓶颈。Elasticsearch（简称ES）凭借其分布式架构、实时搜索和灵活的数据分析能力，成为企业级搜索与存储的核心引擎。截至2025年，ES在全球日志分析、电商搜索、实时监控等场景的市场占有率超过60%。本文将从存储架构、核心技术、应用场景及优化策略四个维度，深入解析Elasticsearch的设计哲学与实践价值
两台pc如何高速度传输大文件费城之鹰其他两台电脑高速传输文件局域网不适用U盘传输资料网线直连两台电脑传资料
今天笔记本跑一个大一点的项目，8G的内存直接100%，i5的CPU直接75%并且在超频工作了，原本1.6Ghz的频率直接飙到了3.8Ghz，由于项目性质原因，采用的是公司配的笔记本，但是年初采购的联想E480，还在三包时间段内，公司不允许拆机增加内存，只能换一台新的台式机，听起来挺爽，有新设备，但是办公区域不准使用U盘这一类的存储设备，这就蛋疼了，大半年了项目代码，资料全在这个不够用的笔记本里，问
学习笔记(33):matplotlib绘制简单图表-绘制混淆矩阵热图宁儿数据安全 #机器学习学习笔记 matplotlib
学习笔记(33):matplotlib绘制简单图表-绘制混淆矩阵热图一、绘制混淆矩阵热图代码解析1.1、导入必要的库importmatplotlib.pyplotaspltfromsklearn.metricsimportconfusion_matriximportseabornassnsmatplotlib.pyplot：Python中最常用的绘图库，用于创建各种图表confusion_matr
玩转Docker | 使用Docker部署NotepadMX笔记应用程序心随_风动玩转Docker docker 笔记 eureka
玩转Docker|使用Docker部署NotepadMX笔记应用程序前言一、NotepadMX介绍工具简介主要特点二、系统要求环境要求环境检查Docker版本检查检查操作系统版本三、部署NotepadMX服务下载NotepadMX镜像编辑部署文件创建容器检查容器状态检查服务端口安全设置四、访问NotepadMX服务访问NotepadMX首页设置访问验证编辑笔记总结前言在如今快节奏的工作与学习中，一
【前端】异步任务风控验证与轮询机制技术方案（通用笔记版）
一、背景场景在某类生成任务中，例如用户点击“执行任务”按钮后触发一个较耗时的后端操作（如生成报告、渲染图像、转码视频等），由于其调用了模型、渲染服务或需要较长处理时间，为了防止接口被频繁恶意调用，系统需要加入风控验证机制。此外，因任务处理为异步，前端无法立即获得最终结果，因此需通过轮询方式定期查询任务状态，等待任务完成后展示结果。二、整体流程说明1.用户点击“执行任务”按钮：前端调用风控接口/ap
【Kafka专栏 13】Kafka的消息确认机制：不是所有的“收到”都叫“确认”！
作者名称：夏之以寒作者简介：专注于Java和大数据领域，致力于探索技术的边界，分享前沿的实践和洞见文章专栏：夏之以寒-kafka专栏专栏介绍：本专栏旨在以浅显易懂的方式介绍Kafka的基本概念、核心组件和使用场景，一步步构建起消息队列和流处理的知识体系，无论是对分布式系统感兴趣，还是准备在大数据领域迈出第一步，本专栏都提供所需的一切资源、指导，以及相关面试题，立刻免费订阅，开启Kafka学习之旅！
数据分析案例-电脑笔记本价格数据可视化分析3 艾派森数据分析信息可视化 python 数据分析数据挖掘电脑
‍♂️个人主页：@艾派森的个人主页✍作者简介：Python学习者希望大家多多支持，我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注+目录1.项目背景2.数据集介绍3.技术工具
LLaMA 学习笔记 AI算法网奇深度学习基础人工智能深度学习
目录LLaMA模型结构：模型微调手册：推理示例：指定位置加载模型测试ok：模型下载：llama-stack下载modelscope下载LLaMA优化技术RMSNormSwiGLU激活函数旋转位置编码（RoPE）LLaMA模型结构：llama3结构详解-CSDN博客模型微调手册：大模型微调LLaMA详细指南（准备环境、数据、配置微调参数+微调过程）_llama微调-CSDN博客显存占用：FP16/B
HQL之投影查询归来朝歌 HQL Hibernate 查询语句投影查询
在HQL查询中，常常面临这样一个场景，对于多表查询，是要将一个表的对象查出来还是要只需要每个表中的几个字段，最后放在一起显示？针对上面的场景，如果需要将一个对象查出来： HQL语句写“from 对象”即可 Session session = HibernateUtil.openSession();
Spring整合redis bylijinnan redis
pom.xml <dependencies>  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redi
org.hibernate.NonUniqueResultException: query did not return a unique result: 2 0624chenhong Hibernate
参考：http://blog.csdn.net/qingfeilee/article/details/7052736 org.hibernate.NonUniqueResultException: query did not return a unique result: 2 在项目中出现了org.hiber
android动画效果不懂事的小屁孩 android动画
前几天弄alertdialog和popupwindow的时候，用到了android的动画效果，今天专门研究了一下关于android的动画效果，列出来，方便以后使用。 Android 平台提供了两类动画。一类是Tween动画，就是对场景里的对象不断的进行图像变化来产生动画效果（旋转、平移、放缩和渐变）。第二类就是 Frame动画，即顺序的播放事先做好的图像，与gif图片原理类似。
js delete 删除机理以及它的内存泄露问题的解决方案换个号韩国红果果 JavaScript
delete删除属性时只是解除了属性与对象的绑定，故当属性值为一个对象时，删除时会造成内存泄露（其实还未删除）举例： var person={name:{firstname:'bob'}} var p=person.name delete person.name p.firstname -->'bob' // 依然可以访问p.firstname，存在内存泄露
Oracle将零干预分析加入网络即服务计划蓝儿唯美 oracle
由Oracle通信技术部门主导的演示项目并没有在本月较早前法国南斯举行的行业集团TM论坛大会中获得嘉奖。但是，Oracle通信官员解雇致力于打造一个支持零干预分配和编制功能的网络即服务（NaaS）平台，帮助企业以更灵活和更适合云的方式实现通信服务提供商（CSP）的连接产品。这个Oracle主导的项目属于TM Forum Live!活动上展示的Catalyst计划的19个项目之一。Catalyst计
spring学习——springmvc（二） a-john springMVC
Spring MVC提供了非常方便的文件上传功能。 1，配置Spring支持文件上传： DispatcherServlet本身并不知道如何处理multipart的表单数据，需要一个multipart解析器把POST请求的multipart数据中抽取出来，这样DispatcherServlet就能将其传递给我们的控制器了。为了在Spring中注册multipart解析器，需要声明一个实现了Mul
POJ-2828-Buy Tickets aijuans ACM_POJ
POJ-2828-Buy Tickets http://poj.org/problem?id=2828 线段树，逆序插入 #include<iostream>#include<cstdio>#include<cstring>#include<cstdlib>using namespace std;#define N 200010struct
Java Ant build.xml详解 asia007 build.xml
1,什么是antant是构建工具2,什么是构建概念到处可查到，形象来说，你要把代码从某个地方拿来，编译，再拷贝到某个地方去等等操作，当然不仅与此，但是主要用来干这个3,ant的好处跨平台 --因为ant是使用java实现的，所以它跨平台使用简单--与ant的兄弟make比起来语法清晰--同样是和make相比功能强大--ant能做的事情很多，可能你用了很久，你仍然不知道它能有
android按钮监听器的四种技术百合不是茶 android xml配置监听器实现接口
android开发中经常会用到各种各样的监听器,android监听器的写法与java又有不同的地方; 1,activity中使用内部类实现接口 ,创建内部类实例使用add方法与java类似创建监听器的实例 myLis lis = new myLis(); 使用add方法给按钮添加监听器
软件架构师不等同于资深程序员 bijian1013 程序员架构师架构设计
本文的作者Armel Nene是ETAPIX Global公司的首席架构师，他居住在伦敦，他参与过的开源项目包括 Apache Lucene,，Apache Nutch， Liferay 和 Pentaho等。如今很多的公司
TeamForge Wiki Syntax & CollabNet User Information Center sunjing TeamForge How do Attachement Anchor Wiki Syntax
the CollabNet user information center http://help.collab.net/ How do I create a new Wiki page? A CollabNet TeamForge project can have any number of Wiki pages. All Wiki pages are linked, and
【Redis四】Redis数据类型 bit1129 redis
概述 Redis是一个高性能的数据结构服务器，称之为数据结构服务器的原因是，它提供了丰富的数据类型以满足不同的应用场景，本文对Redis的数据类型以及对这些类型可能的操作进行总结。 Redis常用的数据类型包括string、set、list、hash以及sorted set.Redis本身是K/V系统，这里的数据类型指的是value的类型，而不是key的类型，key的类型只有一种即string
SSH2整合-附源码白糖_ eclipse spring tomcat Hibernate Google
今天用eclipse终于整合出了struts2+hibernate+spring框架。我创建的是tomcat项目，需要有tomcat插件。导入项目以后，鼠标右键选择属性，然后再找到“tomcat”项，勾选一下“Is a tomcat project”即可。具体方法见源码里的jsp图片，sql也在源码里。补充1：项目中部分jar包不是最新版的，可能导
[转]开源项目代码的学习方法 braveCS 学习方法
转自： http://blog.sina.com.cn/s/blog_693458530100lk5m.html http://www.cnblogs.com/west-link/archive/2011/06/07/2074466.html 1）阅读features。以此来搞清楚该项目有哪些特性2）思考。想想如果自己来做有这些features的项目该如何构架3）下载并安装d
编程之美-子数组的最大和（二维） bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; import java.util.Random; public class MaxSubArraySum2 { /** * 编程之美子数组之和的最大值（二维） */ private static final int ROW = 5; private stat
读书笔记-3 chengxuyuancsdn jquery笔记 resultMap配置 ibatis一对多配置
1、resultMap配置 2、ibatis一对多配置 3、jquery笔记 1、resultMap配置当<select resultMap="topic_data"> <resultMap id="topic_data">必须一一对应。 (1)<resultMap class="tblTopic&q
[物理与天文]物理学新进展 comsci
如果我们必须获得某种地球上没有的矿石,才能够进行某些能量输出装置的设计和建造,而要获得这种矿石,又必须首先进行深空探测,而要进行深空探测,又必须获得这种能量输出装置,这个矛盾的循环,会导致地球联盟在与宇宙文明建立关系的时候,陷入困境怎么办呢?
Oracle 11g新特性:Automatic Diagnostic Repository daizj oracle ADR
Oracle Database 11g的FDI（Fault Diagnosability Infrastructure）是自动化诊断方面的又一增强。 FDI的一个关键组件是自动诊断库（Automatic Diagnostic Repository-ADR）。在oracle 11g中，alert文件的信息是以xml的文件格式存在的，另外提供了普通文本格式的alert文件。这两份log文
简单排序:选择排序 dieslrae 选择排序
public void selectSort(int[] array){ int select; for(int i=0;i<array.length;i++){ select = i; for(int k=i+1;k<array.leng
C语言学习六指针的经典程序，互换两个数字 dcj3sjt126com c
示例程序，swap_1和swap_2都是错误的，推理从1开始推到2，2没完成，推到3就完成了 # include <stdio.h> void swap_1(int, int); void swap_2(int *, int *); void swap_3(int *, int *); int main(void) { int a = 3; int b =
php 5.4中php-fpm 的重启、终止操作命令 dcj3sjt126com PHP
php 5.4中php-fpm 的重启、终止操作命令: 查看php运行目录命令：which php/usr/bin/php 查看php-fpm进程数：ps aux | grep -c php-fpm 查看运行内存/usr/bin/php -i|grep mem 重启php-fpm/etc/init.d/php-fpm restart 在phpinfo()输出内容可以看到php
线程同步工具类 shuizhaosi888 同步工具类
同步工具类包括信号量（Semaphore）、栅栏（barrier）、闭锁（CountDownLatch）闭锁（CountDownLatch） public class RunMain { public long timeTasks(int nThreads, final Runnable task) throws InterruptedException { fin
bleeding edge是什么意思 haojinghua DI
不止一次，看到很多讲技术的文章里面出现过这个词语。今天终于弄懂了——通过朋友给的浏览软件，上了wiki。我再一次感到，没有辞典能像WiKi一样，给出这样体贴人心、一清二楚的解释了。为了表达我对WiKi的喜爱，只好在此一一中英对照，给大家上次课。 In computer science, bleeding edge is a term that
c中实现utf8和gbk的互转 jimmee c iconv utf8&gbk编码
#include <iconv.h> #include <stdlib.h> #include <stdio.h> #include <unistd.h> #include <fcntl.h> #include <string.h> #include <sys/stat.h> int code_c
大型分布式网站架构设计与实践 lilin530 应用服务器搜索引擎
1.大型网站软件系统的特点？ a.高并发，大流量。 b.高可用。 c.海量数据。 d.用户分布广泛，网络情况复杂。 e.安全环境恶劣。 f.需求快速变更，发布频繁。 g.渐进式发展。 2.大型网站架构演化发展历程？ a.初始阶段的网站架构。应用程序，数据库，文件等所有的资源都在一台服务器上。 b.应用服务器和数据服务器分离。 c.使用缓存改善网站性能。 d.使用应用
在代码中获取Android theme中的attr属性值 OliveExcel android theme
Android的Theme是由各种attr组合而成, 每个attr对应了这个属性的一个引用, 这个引用又可以是各种东西. 在某些情况下, 我们需要获取非自定义的主题下某个属性的内容 (比如拿到系统默认的配色colorAccent), 操作方式举例一则: int defaultColor = 0xFF000000; int[] attrsArray = { andorid.r.
基于Zookeeper的分布式共享锁 roadrunners zookeeper 分布式共享锁
首先，说说我们的场景，订单服务是做成集群的，当两个以上结点同时收到一个相同订单的创建指令，这时并发就产生了，系统就会重复创建订单。等等......场景。这时，分布式共享锁就闪亮登场了。共享锁在同一个进程中是很容易实现的，但在跨进程或者在不同Server之间就不好实现了。Zookeeper就很容易实现。具体的实现原理官网和其它网站也有翻译，这里就不在赘述了。官
两个容易被忽略的MySQL知识 tomcat_oracle mysql
1、varchar(5)可以存储多少个汉字，多少个字母数字？　　相信有好多人应该跟我一样，对这个已经很熟悉了，根据经验我们能很快的做出决定，比如说用varchar(200)去存储url等等，但是，即使你用了很多次也很熟悉了，也有可能对上面的问题做出错误的回答。　　这个问题我查了好多资料，有的人说是可以存储5个字符，2.5个汉字（每个汉字占用两个字节的话），有的人说这个要区分版本，5.0
zoj 3827 Information Entropy(水题) 阿尔萨斯 format
题目链接：zoj 3827 Information Entropy 题目大意：三种底，计算和。解题思路：调用库函数就可以直接算了，不过要注意Pi = 0的时候，不过它题目里居然也讲了。。。limp→0+plogb(p)=0，因为p是logp的高阶。 #include <cstdio> #include <cstring> #include <cmath&

实训笔记8.28