Astroline_kamu

云开发数据库的高级查询

写在前面：这是一篇工具文，如果没有需要，不建议看完；如果有需要，可以随时查询内容。

高级的一些查询，很多的数据是在查询的时候就做完了，正常理论来说，数据库是一定要对查询优化到极致的，如果能够将复杂的数据格式放到后台来处理的话，会节省大量的时间。

除非说你能够做到把业务处理的代码性能优化到极致的同时又让它可读性不差，并且易于更变，否则这种冗余是可以接受的。

然后，我就直接用一些复杂查询开场了蛤~

一些词法的基础说明
较大时间颗粒度查询
某月份订单的的总价
查询数据分类
条件分类查询
最后，多表联查案例
进阶的多表联查

接下来的内容在Nodejs版本：10.15，云开发sdk版本：~2.1.2下使用

先写一套基本的代码，接下来的所有代码都需要把这段内容加到中间

const cloud = require('wx-server-sdk')
cloud.init({
  env: cloud.DYNAMIC_CURRENT_ENV
})
const db = cloud.database();

// 后面两个按需引入即可
const _ = db.command;
const $ = db.command.aggregate;

exports.main = async (event, context) => {
    // 内容区
}

一些词法的基础说明

先说两个东西，project和group。
这两个东西，一个是对数据进行横向的操作，一个则是对数据的纵向操作，这么说可能不大明确，不过可以先看一下下面的一张表，而后听我娓娓道来。

name	age	gender	clan
Astroline	18	male	Dragon
Eve	11	girl	Arunoido

横纵的数据就是那么来的，横向数据是Astroline, 18, male, Dragon；而纵向数据则是name, Astroline, Eve

project是处理单条数据的，而group是处理纵向数据的，多用于数据的汇总、归类使用。

不管是project还是group，他们都是需要优先使用aggregate的。

较大时间颗粒度查询

一般来说，有些数据存在数据库的时候并不理想，没有规律，并不适合直接查询，而project这个参数，则是对数据进行一次预处理将数据转换为理想的数据。

这里举一个栗子：我想查询某个月的订单，但是我存入的时间格式为YYYY-mm-dd，而我的想法是查询出某一个月的所有数据，很明显这是一个非常困难的过程，我最初甚至是想在后台循环轮询月份的天数，然后把数据做整合。。。

这里的思路是用字符串操作将时间拆分为年、月、日不同的颗粒度；如果你用的是Datetime的形式存储的，也可以使用小程序里的时间操作工具做预处理，也是可以达到同样的效果的。

return db.collection('order')
  .aggregate()  // 注意这里哦，aggregate一定要加上，标记后面的查询为聚合阶段
  .project({
    price: true,
    quantity: true, 
    year: $.substr(['$create_time', 0, 4]),
    month: $.substr(['$create_time', 5, 2]),
    date: $.substr(['$create_time', 8, -1]),
  })
  // match也是聚合阶段的方法，匹配的是`project`预处理后的结果
  .match({
    year: '2020',
    month: '04'
  })
  .end();  // 和基础模板不同的，在aggregate里只能用.end()结尾，返回的数据和get()有所出入。
  // .get()返回的是data: [{name: 'Astroline'}, {name: 'Eve'}]；
  // .end()返回的是list: [{name: 'Astroline'}, {name: 'Eve'}]；

注：$即是聚合操作符号，这里使用了一个字符串操作的方法，然后在方法里面还有一个'$create_time'，这一段匹配的是订单里的一个字段，我这里匹配的是创建时间。

当然，上面的代码还是有问题，一方面是查询是死的，没有动态的数据；另一方面，微信数据库一次仅能查出来100条数据，所以需要做个拼接。

一套完整可用的代码贴在这里 代码比较长，建议先跑一遍再理解 仅需要把表名和时间传入即可使用，或者直接云数据库测试(需要删掉`skip`、`limit`，并且修改变量为实际表名)

const { collection, date } = event;
const MAX_LIMIT = 100;

// 日期分组 0年 1月 2日
const date_time = date.split('-');  // 根据自己的数据格式调整
const tasks = [];

// 取出集合记录总数 
const countResult = await db.collection(collection)
.aggregate()
.project({
    year: $.substr(['$create_time', 0, 4]),
    month: $.substr(['$create_time', 5, 2]),
})
.match({
    year: date_time[0],
    month: date_time[1]
})
.count('total')  // 聚合阶段的count和基础的count略微不同，返回的结果名称要标记上
.end();

const total = countResult['list'][0]['total'];
const batchTimes = Math.ceil(total / 100);

for (let i = 0; i < batchTimes; i++) {
    const promise = db.collection(collection)
    .aggregate()
    .project({
        name: true,
        quantity: true,
        price: true,
        year: $.substr(['$create_time', 0, 4]),
        month: $.substr(['$create_time', 5, 2]),
    })
    .match({
        year: date_time[0],
        month: date_time[1]
    })
    .skip(i * MAX_LIMIT)
    .limit(MAX_LIMIT)
    .end();

    tasks.push(promise)
}

  // 等待所有
  return (await Promise.all(tasks)).reduce((acc, cur) => {
    return {
      list: acc.list.concat(cur.list),
      errMsg: acc.errMsg,
    }
  })

某月份订单的的总价

然后业务就开始涉及到了一些汇总方面的内容了，因为汇总的内容不在小程序内部展示，于是我写了一套外部的API，避免云函数的运算过大(超时时间三秒钟)，导致的返回返回超时(其实超时时间可以修改，不过等三秒。。已经交互非常不友好了)

这次做的是一个某一个月份的订单价格汇总，因为如果把业务丢在云函数里，计算是会非常庞大的(查询速度不说，还要对查询出来的结果重新遍历)

const {
    date,
  } = event;

// 日期分组 0年 1月 2日
const date_time = date.split('-');

return db.collection('order')
    .aggregate()
    .project({
        price: true,
        quantity: true,
        create_time: true,
        totalPrice: $.multiply(['$quantity', '$price']),
        year: $.substr(['$create_time', 0, 4]),
        month: $.substr(['$create_time', 5, 2]),
    })
    .match({
        year: date_time[0],
        month: date_time[1]
    })
    .group({
        _id: 'Eve!',
        quantity: $.sum('$quantity'),
        price: $.sum('$totalPrice'),
    })
    .end();

注：在match和group阶段的数据都是基于project查出来的数据，举个栗子，如果你要把project里的quantity: true改成false的话，查出来的结果在进行group操作的时候quantity字段找不到，就会返回为0。

附：group支持的聚合操作

查询数据分类

这里就是要说到数据的分类了查询查询了，打个比方说，我需要查出今年的所有订单，每个月要一个汇总(一般搞数据可视化展示需要用到这种数据，咳)

我了解的有两种分类方式，一种是创建一组归类好的模板，然后用lookup拉外键查询，这种方式并不好，还需要额外建表，并且不够灵活；而第二种，就是我下面要说的了。

在做数据可视化，整理数据的时候我需要一组可以用在柱状图的数据，我不大想用后台创建一堆`POJO`类，然后就干脆放在了数据库里处理了...

const {
    date,
  } = event;

// 日期分组 0年 1月 2日
const date_time = date.split('-');

return db.collection('order')
    .aggregate()
    .project({
        quantity: true,
        create_time: true,
        totalPrice: $.multiply(['$quantity', '$price']),
        year: $.substr(['$create_time', 0, 4]),
        month: $.substr(['$create_time', 5, 2]),
    })
    .match({
        year: date_time[0],
        month: date_time[1]
    })
    .group({
        _id: '$month',
        price: $.sum('$totalPrice'),
        create_time: $.first('$create_time'),
        quantity: $.sum('$quantity'),
    })
    .end();

条件分类查询

当然，上一个业务提到的数据分类，我们还可以再改一下

比如说我加一点预处理的内容——

订单有四种：未成交未付款、成交未付款、成交已付款、取消订单(未成交且超时、订单被取消)。按照一般查询，我需要查询四次才可以把数据查出来(`match({ type: 0 })、match({ type: 1 })、match({ type: 2 })、match({ type: 3 })`)，而如果它是个横向的数据(一条数据里返回四种状态)，那对我来说是非常的舒服了。

const {
    date,
  } = event;

// 日期分组 0年 1月 2日
const date_time = date.split('-');

return db.collection('order')
    .aggregate()
    .project({
        price: true,
        status: true,
        quantity: true,
        year: $.substr(['$created', 0, 4]),
        month: $.substr(['$created', 5, 2]),
        date: $.substr(['$created', 8, -1]),
        // 判断条件
        uu: $.cond({  // Unsettled and unpaid 我想取名2u的，不过命名规范里不可以数字打头哦
            if: $.and([  // 这里仅展示一些复合的条件判断，一般订单不会出现status的....不过我还是做了一个判断，仅判断可用订单(1可用，0冻结)
                $.eq(['$type', 0]),  
                $.not($.eq(['$status', 0])) 
            ]),
            then: '$quantity',
            else: 0
        }),
        tp: $.cond({  // Transaction paid 成交已付款
             if: $.eq(['$type', 1]),
            then: '$quantity',
            else: 0
        }),
        tnp: $.cond({  // Transaction not paid 成交未付款
            if: $.eq(['$type', 2]),
            then: '$quantity',
            else: 0
        }),
        oo: $.cond({  // Outstanding orders 订单已取消 2o
             if: $.eq(['$type', 3]),
            then: '$quantity',
            else: 0
        }),
    })
    .match({
        year: date_time[0],
        month: date_time[1]
    })
  .group({  // js、python等语言我习惯用下划线，java、C#、ts一类的语言变量习惯用小驼峰，类名用大驼峰
        _id: 'Eve~',
        unsettled_and_unpaid: $.sum('$uu'),
        transaction_paid: $.sum('$tp'),
        transaction_not_paid: $.sum('$tnp'),
        outstanding_orders: $.sum('$oo')
  })
  .end()

最后，多表联查案例

我很少写电商类的程序，不过我还是知道电商里面有两个基本的表，商品类目以及商品表(项目体积若再大些，可能会拆出更细致的表)。

一般来说，这方面的业务处理方式不会用lookup做的，除非数据不多(比如类目表上面还有一个商家表，美团这样B2B的软件，这样就能很好的限制了查询出来的商品数量，可以使用lookup查出所有关联数据，换来极好的交互体验)

这里的场景模拟在用户在小程序端，点击某个商家，进入时候查看商品的查询(虽然我写的不是电商，不过还是能改成电商的查询的，并且我相信用电商这个命题会更容易理解的吧)。我决定将lookup拆成两部分来说，第一个部分是简单的查询，用于客户的使用；另一个部分是用于企业领导层查看的，做数据可视化使用。

(其实我根本不需要写基础的lookup查询，小程序官方文档里已经写的非常清楚了，主要是复杂的查询我写了一套出来)

有这么三张表，店铺表、类目表、商品表，关系为：店铺和类目是1:m，类目和商品是1:m。

const { storeId } = event;

// 一般一个店铺的类目不会超过100条的，所以大胆食用吧
return db.collection('category')
    .aggregate()
    .match({
        storeId: storeId
    })
    .lookup({
        from: 'product',
        localField: '_id',  // 小程序里的默认唯一标识是 _id
        foreignField: 'category_id',
        as: 'productList'
    })
    .end()

进阶的多表联查

在lookup里我依旧使用了很多复杂的处理，如pipeline、let变量，两种查询方式的权重是相同的，一条查询里不可能讲明两种方法，所以这里单独写了一条。

对我而言，我觉得这种查询除非是你想偷懒不写后台的业务处理，否则尽量不要写这种代码....

有一个需求，上级想要看到一个销售的柱状图数据...我真不想编各种各样奇奇怪怪的需求了。。。饶了我吧QAQ

我们需要看到一个商家不同的商品的销售状况如何，做柱状图统计...
我真想直接把项目里的查询贴出来...但是写的程序不允许我贴。。。只好再写一套查询用于博客记录...

const {  // 注意要传值
    date,
    store_id
  } = event;

// 日期分组 0年 1月 2日
const date_time = date.split('-');

return db.collection('product')
    .aggregate()
    .lookup({
        from: 'order',
        let: {  // 变量声明 引用的时候使用双$符号 如'$$product_id'
        product_id: '$_id'
        },
        pipeline:
        $.pipeline()  // 流水处理 你可以直接理解pipeline就是正常查询里的，只不过它针对的对象是外链的表 .aggregate()
                .project({
                    quantity: true,
                    price: true,
                    create_time: true,
                    year: $.substr(['$create_time', 0, 4]),
                    month: $.substr(['$create_time', 5, 2]),
                })
                .match(_.expr(  // 这里仅展示了一下lookup内的and操作符使用
                    $.and([
                        $.eq(['$product_id', '$$product_id']),  // 商品相同的内容
                        $.eq(['$year', date_time[0]]),  // 时间规定在月份
                        $.eq(['$year', date_time[1]]),  // 时间规定在月份
                    ])
                ))
                .group({
                    _id: 'Eve...',
                    quantity: $.sum('$quantity'),
                })
                .done(),  // pipeline需要用done结尾
        as: 'result'
    })
    .project({
        // 这个自己写好啦
        name: true,
        type: true,
        create_time: true,
        sold: $.arrayElemAt(['$result', 0]),  
    })
    .match({
        store_id: store_id,
    })
    .end();

注：比较神奇的操作，lookup是可以嵌套的，也就是传说中的传说中三表联查

该代码我没有跑过测试，知道有这么个东西即可，关于三表联查的内容是可以搜到的

const { storeId } = event;

// 一般一个店铺的类目不会超过100条的，所以大胆食用吧
return db.collection('store')
    .aggregate()
    .match({
        storeId: storeId
    })
    .lookup({
        from: 'category',
        localField: '_id',  // 小程序里的默认唯一标识是 _id
        foreignField: 'store_id',
        as: 'categoryList'
    })
    .lookup({
        from: 'product',
        localField: '_id',  // 小程序里的默认唯一标识是 _id
        foreignField: 'category_id',
        as: 'productList'
    })
    .end()

目录跳转：微信小程序云开发数据库查询指南

Long类型前后端数据不一致 igotyback 前端
响应给前端的数据浏览器控制台中response中看到的Long类型的数据是正常的到前端数据不一致前后端数据类型不匹配是一个常见问题，尤其是当后端使用Java的Long类型（64位）与前端JavaScript的Number类型（最大安全整数为2^53-1，即16位）进行数据交互时，很容易出现精度丢失的问题。这是因为JavaScript中的Number类型无法安全地表示超过16位的整数。为了解决这个问
LocalDateTime 转 String igotyback java 开发语言
importjava.time.LocalDateTime;importjava.time.format.DateTimeFormatter;publicclassMain{publicstaticvoidmain(String[]args){//获取当前时间LocalDateTimenow=LocalDateTime.now();//定义日期格式化器DateTimeFormatterformat
mysql禁用远程登录 igotyback mysql
去mysql库中的user表里，将host都改成localhost之后刷新权限FLUSHPRIVILEGES;
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
SQL Server_查询某一数据库中的所有表的内容 qq_42772833 SQL Server 数据库 sqlserver
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是从查询结果中选择TABLE_NAM
DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理 STU学生网页设计网页设计期末网页作业 html静态网页 html5期末大作业网页设计 web大作业
️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
【华为OD机试真题2023B卷 JAVA&JS】We Are A Team 若博豆 java 算法华为 javascript
华为OD2023（B卷）机试题库全覆盖，刷题指南点这里WeAreATeam时间限制：1秒|内存限制：32768K|语言限制：不限题目描述：总共有n个人在机房，每个人有一个标号（1<=标号<=n），他们分成了多个团队，需要你根据收到的m条消息判定指定的两个人是否在一个团队中，具体的：1、消息构成为：abc，整数a、b分别代
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
MYSQL面试系列-04 king01299 面试 mysql 面试
MYSQL面试系列-0417.关于redolog和binlog的刷盘机制、redolog、undolog作用、GTID是做什么的？innodb_flush_log_at_trx_commit及sync_binlog参数意义双117.1innodb_flush_log_at_trx_commit该变量定义了InnoDB在每次事务提交时，如何处理未刷入（flush）的重做日志信息（redolog）。它
MongoDB Oplog 窗口喝醉酒的小白 MongoDB 运维
在MongoDB中，oplog（操作日志）是一个特殊的日志系统，用于记录对数据库的所有写操作。oplog允许副本集成员（通常是从节点）应用主节点上已经执行的操作，从而保持数据的一致性。它是MongoDB副本集实现数据复制的基础。MongoDBOplog窗口oplog窗口是指在MongoDB副本集中，从节点可以用来同步数据的时间范围。这个窗口通常由以下因素决定：Oplog大小：oplog的大小是有限
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
【PG】常见数据库、表属性设置江无羡数据库
PG的常见属性配置方法数据库复制、备份相关表的复制标识单表操作批量表操作链接数据库复制、备份相关表的复制标识单表操作通过ALTER语句单独更改一张表的复制标识。ALTERTABLE[tablename]REPLICAIDENTITYFULL;批量表操作通过代码块的方式，对某个schema中的所有表一起更新其复制标识。SELECTtablename,CASErelreplidentWHEN'd'TH
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
Java 重写(Override)与重载(Overload) 叨唧唧的
Java重写(Override)与重载(Overload)重写(Override)重写是子类对父类的允许访问的方法的实现过程进行重新编写,返回值和形参都不能改变。即外壳不变，核心重写！重写的好处在于子类可以根据需要，定义特定于自己的行为。也就是说子类能够根据需要实现父类的方法。重写方法不能抛出新的检查异常或者比被重写方法申明更加宽泛的异常。例如：父类的一个方法申明了一个检查异常IOExceptio
简单了解 JVM 记得开心一点啊 jvm
目录♫什么是JVM♫JVM的运行流程♫JVM运行时数据区♪虚拟机栈♪本地方法栈♪堆♪程序计数器♪方法区/元数据区♫类加载的过程♫双亲委派模型♫垃圾回收机制♫什么是JVMJVM是JavaVirtualMachine的简称，意为Java虚拟机。虚拟机是指通过软件模拟的具有完整硬件功能的、运行在一个完全隔离的环境中的完整计算机系统（如：JVM、VMwave、VirtualBox）。JVM和其他两个虚拟机
关于Mysql 中 Row size too large (＞ 8126) 错误的解决和理解秋刀prince mysql mysql 数据库
提示：啰嗦一嘴，数据库的任何操作和验证前，一定要记得先备份！！！不会有错；文章目录问题发现一、问题导致的可能原因1、页大小2、行格式2.1compact格式2.2Redundant格式2.3Dynamic格式2.4Compressed格式3、BLOB和TEXT列二、解决办法1、修改页大小（不推荐）2、修改行格式3、修改数据类型为BLOB和TEXT列4、其他优化方式（可以参考使用）4.1合理设置数据
1分钟解决 -bash: mvn: command not found，在Centos 7中安装Maven Energet!c 开发语言
1分钟解决-bash:mvn:commandnotfound，在Centos7中安装Maven检查Java环境1下载Maven2解压Maven3配置环境变量4验证安装5常见问题与注意事项6总结检查Java环境Maven依赖Java环境，请确保系统已经安装了Java并配置了环境变量。可以通过以下命令检查：java-version如果未安装，请先安装Java。1下载Maven从官网下载：前往Apach
分享100个最新免费的高匿HTTP代理IP mcj8089 代理IP 代理服务器匿名代理免费代理IP 最新代理IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ 120.198.243.130:80,中国/广东省 58.251.78.71:8088,中国/广东省 183.207.228.22:83,中国/
mysql高级特性之数据分区 annan211 java 数据结构 mongodb 分区 mysql
mysql高级特性 1 以存储引擎的角度分析，分区表和物理表没有区别。是按照一定的规则将数据分别存储的逻辑设计。器底层是由多个物理字表组成。 2 分区的原理分区表由多个相关的底层表实现，这些底层表也是由句柄对象表示，所以我们可以直接访问各个分区。存储引擎管理分区的各个底层表和管理普通表一样(所有底层表都必须使用相同的存储引擎)，分区表的索引只是
JS采用正则表达式简单获取URL地址栏参数 chiangfai js 地址栏参数获取
GetUrlParam:function GetUrlParam(param){ var reg = new RegExp("(^|&)"+ param +"=([^&]*)(&|$)"); var r = window.location.search.substr(1).match(reg); if(r!=null
怎样将数据表拷贝到powerdesigner (本地数据库表) Array_06 powerDesigner
================================================== 1、打开PowerDesigner12，在菜单中按照如下方式进行操作 file->Reverse Engineer->DataBase 点击后，弹出 New Physical Data Model 的对话框 2、在General选项卡中 Model name:模板名字，自
logbackのhelloworld 飞翔的马甲日志 logback
一、概述 1.日志是啥？当我是个逗比的时候我是这么理解的：log.debug()代替了system.out.print(); 当我项目工作时，以为是一堆得.log文件。这两天项目发布新版本，比较轻松，决定好好地研究下日志以及logback。传送门1：日志的作用与方法： http://www.infoq.com/cn/articles/why-and-how-log 上面的作
新浪微博爬虫模拟登陆随意而生新浪微博
转载自：http://hi.baidu.com/erliang20088/item/251db4b040b8ce58ba0e1235 近来由于毕设需要，重新修改了新浪微博爬虫废了不少劲，希望下边的总结能够帮助后来的同学们。现行版的模拟登陆与以前相比，最大的改动在于cookie获取时候的模拟url的请求
synchronized 香水浓 java thread
Java语言的关键字，可用来给对象和方法或者代码块加锁，当它锁定一个方法或者一个代码块的时候，同一时刻最多只有一个线程执行这段代码。当两个并发线程访问同一个对象object中的这个加锁同步代码块时，一个时间内只能有一个线程得到执行。另一个线程必须等待当前线程执行完这个代码块以后才能执行该代码块。然而，当一个线程访问object的一个加锁代码块时，另一个线程仍然
maven 简单实用教程 AdyZhang maven
1. Maven介绍 1.1. 简介 java编写的用于构建系统的自动化工具。目前版本是2.0.9，注意maven2和maven1有很大区别，阅读第三方文档时需要区分版本。 1.2. Maven资源见官方网站；The 5 minute test，官方简易入门文档；Getting Started Tutorial，官方入门文档；Build Coo
Android 通过 intent传值获得null aijuans android
我在通过intent 获得传递兑现过的时候报错，空指针,我是getMap方法进行传值，代码如下 1 2 3 4 5 6 7 8 9 public void getMap(View view){ Intent i =
apache 做代理报如下错误：The proxy server received an invalid response from an upstream baalwolf response
网站配置是apache＋tomcat,tomcat没有报错，apache报错是： The proxy server received an invalid response from an upstream server. The proxy server could not handle the request GET /. Reason: Error reading fr
Tomcat6 内存和线程配置 BigBird2012 tomcat6
1、修改启动时内存参数、并指定JVM时区（在windows server 2008 下时间少了8个小时）在Tomcat上运行j2ee项目代码时，经常会出现内存溢出的情况，解决办法是在系统参数中增加系统参数： window下，在catalina.bat最前面 set JAVA_OPTS=-XX:PermSize=64M -XX:MaxPermSize=128m -Xms5
Karam与TDD bijian1013 Karam TDD
一.TDD 测试驱动开发（Test-Driven Development,TDD）是一种敏捷（AGILE）开发方法论，它把开发流程倒转了过来，在进行代码实现之前，首先保证编写测试用例，从而用测试来驱动开发（而不是把测试作为一项验证工具来使用）。 TDD的原则很简单： a.只有当某个
[Zookeeper学习笔记之七]Zookeeper源代码分析之Zookeeper.States bit1129 zookeeper
public enum States { CONNECTING, //Zookeeper服务器不可用，客户端处于尝试链接状态 ASSOCIATING, //？？？ CONNECTED, //链接建立，可以与Zookeeper服务器正常通信 CONNECTEDREADONLY, //处于只读状态的链接状态，只读模式可以在
【Scala十四】Scala核心八：闭包 bit1129 scala
Free variable A free variable of an expression is a variable that’s used inside the expression but not defined inside the expression. For instance, in the function literal expression (x: Int) => (x
android发送json并解析返回json ronin47 android
package com.http.test; import org.apache.http.HttpResponse; import org.apache.http.HttpStatus; import org.apache.http.client.HttpClient; import org.apache.http.client.methods.HttpGet; import
一份IT实习生的总结 brotherlamp PHP php资料 php教程 php培训 php视频
今天突然发现在不知不觉中自己已经实习了 3 个月了，现在可能不算是真正意义上的实习吧，因为现在自己才大三，在这边撸代码的同时还要考虑到学校的功课跟期末考试。让我震惊的是，我完全想不到在这 3 个月里我到底学到了什么，这是一件多么悲催的事情啊。同时我对我应该 get 到什么新技能也很迷茫。所以今晚还是总结下把，让自己在接下来的实习生活有更加明确的方向。最后感谢工作室给我们几个人这个机会让我们提前出来
据说是2012年10月人人网校招的一道笔试题-给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。将重物放到天平左侧，问在两边如何添加砝码 bylijinnan java
public class ScalesBalance { /** * 题目： * 给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。（假设N无限大，但一种重量的砝码只有一个） * 将重物放到天平左侧，问在两边如何添加砝码使两边平衡 * * 分析： * 三进制 * 我们约定括号表示里面的数是三进制，例如 47=(1202
dom4j最常用最简单的方法 chiangfai dom4j
要使用dom4j读写XML文档,需要先下载dom4j包,dom4j官方网站在 http://www.dom4j.org/目前最新dom4j包下载地址:http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.zip 解开后有两个包,仅操作XML文档的话把dom4j-1.6.1.jar加入工程就可以了,如果需要使用XPath的话还需要
简单HBase笔记 chenchao051 hbase
一、Client-side write buffer 客户端缓存请求描述：可以缓存客户端的请求，以此来减少RPC的次数，但是缓存只是被存在一个ArrayList中，所以多线程访问时不安全的。可以使用getWriteBuffer()方法来取得客户端缓存中的数据。默认关闭。二、Scan的Caching 描述： next( )方法请求一行就要使用一次RPC,即使
mysqldump导出时出现when doing LOCK TABLES daizj mysql mysqdump 导数据
　　执行　mysqldump -uxxx -pxxx -hxxx -Pxxxx database tablename > tablename.sql　导出表时，会报 mysqldump: Got error: 1044: Access denied for user 'xxx'@'xxx' to database 'xxx' when doing LOCK TABLES 解决
CSS渲染原理 dcj3sjt126com Web
从事Web前端开发的人都与CSS打交道很多，有的人也许不知道css是怎么去工作的，写出来的css浏览器是怎么样去解析的呢？当这个成为我们提高css水平的一个瓶颈时，是否应该多了解一下呢？一、浏览器的发展与CSS
《阿甘正传》台词 dcj3sjt126com
Part Ⅰ: 《阿甘正传》Forrest Gump经典中英文对白 Forrest: Hello! My names Forrest. Forrest Gump. You wanna Chocolate? I could eat about a million and a half othese. My momma always said life was like a box ochocol
Java处理JSON dyy_gusi json
Json在数据传输中很好用，原因是JSON 比 XML 更小、更快，更易解析。在Java程序中，如何使用处理JSON，现在有很多工具可以处理，比较流行常用的是google的gson和alibaba的fastjson，具体使用如下： 1、读取json然后处理 class ReadJSON { public static void main(String[] args)
win7下nginx和php的配置 geeksun nginx
1. 安装包准备 nginx : 从nginx.org下载nginx-1.8.0.zip php：从php.net下载php-5.6.10-Win32-VC11-x64.zip， php是免安装文件。 RunHiddenConsole: 用于隐藏命令行窗口 2. 配置 # java用8080端口做应用服务器，nginx反向代理到这个端口即可 p
基于2.8版本redis配置文件中文解释 hongtoushizi redis
转载自： http://wangwei007.blog.51cto.com/68019/1548167 在Redis中直接启动redis-server服务时, 采用的是默认的配置文件。采用redis-server xxx.conf 这样的方式可以按照指定的配置文件来运行Redis服务。下面是Redis2.8.9的配置文
第五章常用Lua开发库3-模板渲染 jinnianshilongnian nginx lua
动态web网页开发是Web开发中一个常见的场景，比如像京东商品详情页，其页面逻辑是非常复杂的，需要使用模板技术来实现。而Lua中也有许多模板引擎，如目前我在使用的lua-resty-template，可以渲染很复杂的页面，借助LuaJIT其性能也是可以接受的。如果学习过JavaEE中的servlet和JSP的话，应该知道JSP模板最终会被翻译成Servlet来执行；而lua-r
JZSearch大数据搜索引擎颠覆者 JavaScript
系统简介：大数据的特点有四个层面：第一，数据体量巨大。从TB级别，跃升到PB级别；第二，数据类型繁多。网络日志、视频、图片、地理位置信息等等。第三，价值密度低。以视频为例，连续不间断监控过程中，可能有用的数据仅仅有一两秒。第四，处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”——Volume，Variety，Value，Velocity。大数据搜索引
10招让你成为杰出的Java程序员 pda158 java 编程框架
如果你是一个热衷于技术的 Java 程序员，那么下面的 10 个要点可以让你在众多 Java 开发人员中脱颖而出。　　 1. 拥有扎实的基础和深刻理解 OO 原则　　对于 Java 程序员，深刻理解 Object Oriented Programming（面向对象编程）这一概念是必须的。没有 OOPS 的坚实基础，就领会不了像 Java 这些面向对象编程语言
tomcat之oracle连接池配置小网客 oracle
tomcat版本7.0 配置oracle连接池方式：修改tomcat的server.xml配置文件： <GlobalNamingResources> <Resource name="utermdatasource" auth="Container" type="javax.sql.DataSou
Oracle 分页算法汇总 vipbooks oracle sql 算法 .net
这是我找到的一些关于Oracle分页的算法，大家那里还有没有其他好的算法没？我们大家一起分享一下！ -- Oracle 分页算法一 select * from ( select page.*,rownum rn from (select * from help) page -- 20 = (currentPag