朴拙数科

mongoDB高级用法汇总深度更新深度去重文档数组内部重复

删除正则匹配

mycol.remove({"city_url":{"$regex":"fang"}})

查看数据数目

myxx = {'id': items['id'], 'province': items['province'], 'city': items['city']}
mydoc =companycol.count_documents(myxx)

更新数据

更新改名

for i in mycol.find({"province":"陕西省"}):
    i.update({"province":"陕西省"}, {'$rename': {'updateDate': 'priceMonth'}}, False, True)

结合多线程更改经纬度center

list_=[i["_id"] for i in list(mycol.find())]
len(list_)
from multiprocessing.dummy import Pool as ThreadPool
def pross(id_):
    mycol.update({'_id':id_}, {"$set":{'center':处理函数(list(mycol.find({'_id':id_}))[0])}}, False, True)
pool = ThreadPool(10)
pool.map(pross,list_)
pool.close()
pool.join()

mongoDB的for循环，最推荐

db.anjuke_second_hand_house_price_0104.find(
{"referencePriceList": [],"projectName":"子云溪苑"}# 查询条件
).snapshot().forEach( function (elem) { db.anjuke_second_hand_house_price_0104.update( { _id: elem._id }, 
{ $set: { referencePriceList: [{"date": elem.priceMonth, "price": elem.referencePrice }]} } ); } );

去重

pandas去重更新数据

不适用于大批量数据

@logger.catch
def mongoDB_duplicates_inster(mycolInsert,mycolInserted,Primary_key):
    # ls_df = pd.DataFrame(list(mycolInserted.find()))
    T1 = time.perf_counter()
    mycolInsert_df=pd.DataFrame(mycolInsert.find()).drop_duplicates(Primary_key)
    # mycolInsert_df.index=list(range(len(mycolInsert_df)))
    mycolInserted_df=pd.DataFrame(mycolInserted.find())
    not_duplicate_to_database_dict=pd.concat([mycolInsert_df,mycolInserted_df,mycolInserted_df]).drop_duplicates(Primary_key,keep=False).to_dict(orient='records')
    T2 = time.perf_counter()
    print('程序运行时间:%s毫秒' % ((T2 - T1) * 1000))
    return not_duplicate_to_database_dict
from multiprocessing.dummy import Pool as ThreadPool

second_hand_house_price_total_bendi = mydb["second_hand_house_price_total"]# collection集合（类似SQL的表）
not_duplicate_to_database_dict1=mongoDB_duplicates_inster(second_hand_house_price_total_bendi,second_hand_house_price_total,["city","projectName","priceMonth"])
list_1=not_duplicate_to_database_dict1#list(mycol1.find())
def pross(item):
    second_hand_house_price_total.insert_one(item)#.update({'_id':id_}, {'$rename': {'updateDate': 'priceMonth'}}, False, True)
pool = ThreadPool(10)
pool.map(pross,list_1)
pool.close()
pool.join()

[{'certId': 'D237052106',
  'pubDate': '2022-06-22',
  'endDate': '2022-12-31',
  'certType': '建筑业企业资质',
  'pubDepartment': '山东省住房和城乡建设厅',
  'certName': ['建筑装修装饰工程专业承包二级',
   '消防设施工程专业承包一级',
   '防水防腐保温工程专业承包二级',
   '建筑机电安装工程专业承包一级',
   '地基基础工程专业承包一级',
   '建筑工程施工总承包一级']},
 {'certId': 'D337052103',
  'pubDate': '2022-06-20',
  'endDate': '2022-12-31',
  'certType': '建筑业企业资质',
  'pubDepartment': '日照市行政审批服务局',
  'certName': ['环保工程专业承包三级', '钢结构工程专业承包三级', '水利水电工程施工总承包三级', '市政公用工程施工总承包三级']},
 {'certId': 'E237046852',
  'pubDate': '2022-10-31',
  'endDate': '2027-10-31',
  'certType': '监理资质',
  'pubDepartment': '山东省住房和城乡建设厅',
  'certName': ['工程监理房屋建筑工程专业甲级']}]

一句sql，按照一个字段排序然后排序后面的去重删掉

db.表名.aggregate(
[
{$match: {"Housing_type": {$ne:[]},//"projectName": "武汉雅居乐花园别墅",} //查询数组类型字段，根据需求可更改},
{$sort: {"_id": 1}}, //排序
{ $group:{_id:{province:'$province',region:'$region',city:'$city',projectName:'$projectName',dataSource:'$dataSource'
 },count:{$sum:1}
 ,dups:{$addToSet:'$_id'}
 }
},
{ $match:{count:{$gt:1}}},
],
{ allowDiskUse:true})
.forEach(function(doc){
 doc.dups.shift();//表示从数组第一个值开始删除；作用是剔除重复数据其中一个_id，让后面的删除语句不会删除所有数据
 db.表名.remove({_id:{$in:doc.dups}});
})

统计每个楼栋的预售证数量，并过滤出预售证数量大于1的楼栋

db.getCollection('approval_sell_presell').aggregate([
		//{$match:{'documentNumber':'深房许字（2021）宝安017号'}},
		{$unwind:'$buildingInformation'},
		{$group:{_id:['$documentNumber','$buidingInformation.buildingName'],ct:{$sum:1}}},
		{$match:{ct:{$gt:1}}}
		//{}
   // { $group: { _id : '$buildingInformation.buildingName', count: { $sum : 1 } } },
   // { $match: { count: { $gt : 1} } }
])

这是一个 MongoDB 的聚合操作，它将从"approval_sell_presel" 集合中查询文档，并对这些文档进行分组、统计和过滤。具体来讲，它会执行以下步骤:
1.Sunwind: 将文档中的某个数组展开，每个数组元素都会作为一个新的文档输出
2.Sgroup: 将文档分组，根据 buildingName 字段进行分组，并统计每组文档的数量。
3.$match: 过滤文档，只保留 count 字段大于1的文档。
整个聚台操作的目的是统计每个楼栋的预售证数量，并过滤出预售证数量大于1的楼栋。注意: 这个聚操作中，Smatch;documentNumberu6df1u623fu8bb8u5b57uf082021uf09u5b9du5b89017u537) 这一行是注释,不会对聚合结果产生累

结合python的去重

for r in self.new_collection.find({'city': '哈尔滨市'}, no_cursor_timeout=True):
    dnr = r.get('documentNumber')
    pne = r.get('projectName')
    region = r.get('region')
    myxx = {'documentNumber': dnr, 'projectName': pne, 'city': '哈尔滨市', 'province': '黑龙江省', 'region': region}
    mydoc = self.new_collection.count_documents(myxx)
    if mydoc > 1:
        new_msg = self.new_collection.find_one(myxx, sort=([('pubDate', pymongo.DESCENDING), ('_id', pymongo.DESCENDING)]))
        # pde = new_msg.get('pubDate')
        nid = new_msg.get('_id')
        self.new_collection.delete_many({'documentNumber': dnr, 'projectName': pne, 'city': '哈尔滨市', 'province': '黑龙江省', 'region': region, '_id': {'$ne': nid}})
        print(r['documentNumber'])

深度查询MongoDB文档数组内部重复，并结合Python进行深度去重

db.getCollection("Enterprise_qualification").aggregate([
		//{$match:{'documentNumber':'深房许字（2021）宝安017号'}},
		{$unwind:'$certList'},//将文档中的certList全部展开，每个数组元素都会作为一个新的文档输出
		{$group:{_id:['$corpId','$certList.certId'],//以corpId和certList.certId作为主键进行分组聚合
		ct:{$sum:1}}},//找到重复的元素
		{$match:{ct:{$gt:1}}}
])
//uniscId是公司统一信用编码
db.getCollection("Enterprise_qualification").aggregate([
		{$match:{'uniscId':'91110115102058481M'}},
//{$match:{
//'enterpriseName':'91110115102058481M'}},
		//{$match:{'documentNumber':'深房许字（2021）宝安017号'}},
		{$unwind:'$certList'},//将文档中的certList全部展开，每个数组元素都会作为一个新的文档输出
		{$group:{_id:['$uniscId','$certList.certId'],//以corpId和certList.certId作为主键进行分组聚合
		ct:{$sum:1}}},//找到重复的元素
		{$match:{ct:{$gt:1}}}
])

某文档数组“certList”内部元素重复

{
    "legalMan": "程伟志",
    "corpId": "002105291258786099",
    "regionFullname": "安徽省-黄山市",
    "enterpriseName": "黄山德弘建设工程有限公司",
    "uniscId": "91341023MA2MRW3A6E",
    "districtCode": "341000",
    "address": "碧阳镇渔亭路南侧山水同和小区A10-1",
    "certList": [
        {
            "certId": "D234520668",
            "pubDate": "2022-12-29",
            "endDate": "2026-05-24",
            "certType": "建筑业企业资质",
            "pubDepartment": "安徽省住房和城乡建设厅",
            "certName": [
                "古建筑工程专业承包二级",
                "市政公用工程施工总承包二级",
                "建筑装修装饰工程专业承包二级",
                "环保工程专业承包二级"
            ]
        },
        {
            "certId": "D234520668",
            "pubDate": "2022-09-23",
            "endDate": "2026-05-24",
            "certType": "建筑业企业资质",
            "pubDepartment": "安徽省住房和城乡建设厅",
            "certName": [
                "市政公用工程施工总承包二级",
                "建筑装修装饰工程专业承包二级"
            ]
        },
        {
            "certId": "D234520668",
            "pubDate": "2021-06-09",
            "endDate": "2026-05-24",
            "certType": "建筑业企业资质",
            "pubDepartment": "安徽省住房和城乡建设厅",
            "certName": [
                "建筑装修装饰工程专业承包二级"
            ]
        },
        {
            "certId": "D334101149",
            "pubDate": "2020-06-11",
            "endDate": "2022-12-31",
            "certType": "建筑业企业资质",
            "pubDepartment": "黄山市住房和城乡建设局",
            "certName": [
                "建筑工程施工总承包三级"
            ]
        },
        {
            "certId": "D334101149",
            "pubDate": "2020-06-11",
            "endDate": "2022-12-31",
            "certType": "建筑业企业资质",
            "pubDepartment": "黄山市住房和城乡建设局",
            "certName": [
                "建筑工程施工总承包三级"
            ]
        },
        {
            "certId": "D334101149",
            "pubDate": "2020-06-11",
            "endDate": "2022-12-31",
            "certType": "建筑业企业资质",
            "pubDepartment": "黄山市住房和城乡建设局",
            "certName": [
                "建筑工程施工总承包三级"
            ]
        }
    ],
    "pubDate": "2022-12-29"
}

深度查重并且统计重复的城市

db.getCollection("数据表").aggregate([
  {'$match':{'buildingInformation': {'$ne': [], }}},
  {$unwind:'$buildingInformation'},//将文档中的certList全部展开，每个数组元素都会作为一个新的文档输出
  {$group:{_id:{'city': '$city', 'projectName': '$projectName', 'documentNumber': '$documentNumber', 'bName': '$buildingInformation.buildingName'},//以corpId和certList.certId作为主键进行分组聚合
  ct:{$sum:1}}},//找到重复的元素
  {$match:{ct:{$gt:1}}},
	{$group: {_id: '$_id.city', city2: {'$sum': 1}}},
	{$match: {city2: {$gt:1}}}
], { allowDiskUse:true})

数组certList里certId为D234520668的发布时间，不定期或者每年更新pubDate

综合案例：合并去重相同企业资质，并排序企业资质的发布时间，得到最终的资质列表数据

合并去重相同，排序企业资质的发布时间，得到最终的资质列表数据

new_collection = new_db['Enterprise_qualification']#


# 合并相同企业资质编号的资质证书名称
def list_hebing(list1):
    list2=[]
    for k in list1:
        list2+=k
    list2=sorted(list(set(list2)))
    return list2
import pandas as pd

lilistmongodb=list(new_collection.aggregate([
		# {'$match':{'uniscId':'91110115102058481M'}},
		{'$unwind':'$certList'},
		{'$group':{'_id':['$uniscId','$certList.certId'],'ct':{'$sum':1}}},
		{'$match':{'ct':{'$gt':1}}}
]))


lilistmongodb=list(set([i['_id'][0] for i in lilistmongodb]))

def same_certId_def(Certificate_list):
    # try:
    ls_df = pd.DataFrame(Certificate_list)
    ls_df = ls_df.sort_values(["pubDate"], ascending=False)  # 降序排序
    ls_df = ls_df.drop_duplicates(["certId", "pubDate"])
    if type(ls_df["certName"][0]) == str:

        ls_group = ls_df.groupby("certId").apply(
            lambda x: list(x["certName"]))
        group_dict = dict(ls_group)
        ls_df["certName"] = ls_df["certId"]
        ls_df["certName"] = ls_df["certName"].map(group_dict)
        ls_df = ls_df.drop_duplicates(["certId", "endDate"])
        ls_df = ls_df[['certId', 'organDate', 'endDate', 'certType', 'organName', 'certName']]
        ls_df.columns = ['certId', 'pubDate', 'endDate', 'certType', 'pubDepartment', 'certName']


    elif type(ls_df["certName"][0]) == list:
        # ls_group = ls_df.groupby("certId").apply(
        #     lambda x: list(x["certName"]) if type(x["certName"]) == str else list_hebing(x["certName"]))
        ls_group = ls_df.groupby("certId").apply(
            lambda x: list_hebing(x["certName"]))
        group_dict = dict(ls_group)
        ls_df["certName"] = ls_df["certId"]
        ls_df["certName"] = ls_df["certName"].map(group_dict)
        ls_df = ls_df.drop_duplicates(["certId", "endDate"])

    ls_df = ls_df.sort_values(["endDate"], ascending=False)  # 升序排序 , ascending=False
    ls_df = ls_df.drop_duplicates("certId")
    ls_df = ls_df.sort_values(["endDate"])  # 升序排序 , ascending=False

    l_dict = ls_df.to_dict(orient='records')
    return l_dict

#     except:
#         print(Certificate_list)
#         print("合并企业资质异常")
# print(same_certId_def(c))
print(len(lilistmongodb))

n=0
for k in lilistmongodb:
    n=n+1
    print(n)
    result=new_collection.find_one({"uniscId": k})
    # 北京兴安幕墙装饰有限公司
    # print(same_certId_def(result["certList"]))
    new_collection.update_one(result,{"$set":{"certList":same_certId_def(result["certList"])}}, False, True)
    # list11=[""]{"_id":k["_id"]}

Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
SQL Server_查询某一数据库中的所有表的内容 qq_42772833 SQL Server 数据库 sqlserver
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是从查询结果中选择TABLE_NAM
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
MongoDB Oplog 窗口喝醉酒的小白 MongoDB 运维
在MongoDB中，oplog（操作日志）是一个特殊的日志系统，用于记录对数据库的所有写操作。oplog允许副本集成员（通常是从节点）应用主节点上已经执行的操作，从而保持数据的一致性。它是MongoDB副本集实现数据复制的基础。MongoDBOplog窗口oplog窗口是指在MongoDB副本集中，从节点可以用来同步数据的时间范围。这个窗口通常由以下因素决定：Oplog大小：oplog的大小是有限
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
【PG】常见数据库、表属性设置江无羡数据库
PG的常见属性配置方法数据库复制、备份相关表的复制标识单表操作批量表操作链接数据库复制、备份相关表的复制标识单表操作通过ALTER语句单独更改一张表的复制标识。ALTERTABLE[tablename]REPLICAIDENTITYFULL;批量表操作通过代码块的方式，对某个schema中的所有表一起更新其复制标识。SELECTtablename,CASErelreplidentWHEN'd'TH
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
关于Mysql 中 Row size too large (＞ 8126) 错误的解决和理解秋刀prince mysql mysql 数据库
提示：啰嗦一嘴，数据库的任何操作和验证前，一定要记得先备份！！！不会有错；文章目录问题发现一、问题导致的可能原因1、页大小2、行格式2.1compact格式2.2Redundant格式2.3Dynamic格式2.4Compressed格式3、BLOB和TEXT列二、解决办法1、修改页大小（不推荐）2、修改行格式3、修改数据类型为BLOB和TEXT列4、其他优化方式（可以参考使用）4.1合理设置数据
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
MongoDB知识概括 GeorgeLin98 持久层 mongodb
MongoDB知识概括MongoDB相关概念单机部署基本常用命令索引-IndexSpirngDataMongoDB集成副本集分片集群安全认证MongoDB相关概念业务应用场景：传统的关系型数据库（如MySQL），在数据操作的“三高”需求以及应对Web2.0的网站需求面前，显得力不从心。解释：“三高”需求：①Highperformance-对数据库高并发读写的需求。②HugeStorage-对海量数
Mongodb Error: queryTxt ETIMEOUT xxxx.wwwdz.mongodb.net 佛一脚 error react mongodb 数据库
背景每天都能遇到奇怪的问题，做个记录，以便有缘人能得到帮助！换了一台电脑开发nextjs程序。需要连接mongodb数据，对数据进行增删改查。上一台电脑好好的程序，新电脑死活连不上mongodb数据库。同一套代码，没任何修改，搞得我怀疑人生了，打开浏览器进入mongodb官网毫无问题，也能进入线上系统查看数据，网络应该是没问题。于是我尝试了一下手机热点，这次代码能正常跑起来，连接数据库了！！！是不
入门MySQL——查询语法练习 K_un
前言：前面几篇文章为大家介绍了DML以及DDL语句的使用方法，本篇文章将主要讲述常用的查询语法。其实MySQL官网给出了多个示例数据库供大家实用查询，下面我们以最常用的员工示例数据库为准，详细介绍各自常用的查询语法。1.员工示例数据库导入官方文档员工示例数据库介绍及下载链接：https://dev.mysql.com/doc/employee/en/employees-installation.h
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
ubuntu安装wordpress lissettecarlr
1安装nginx网上安装方式很多，这就就直接用apt-get了apt-getinstallnginx不用启动啥，然后直接在浏览器里面输入IP:80就能看到nginx的主页了。如果修改了一些配置可以使用下列命令重启一下systemctlrestartnginx.service2安装mysql输入安装前也可以更新一下软件源，在安装过程中将会让你输入数据库的密码。sudoapt-getinstallmy
深入浅出 -- 系统架构之负载均衡Nginx的性能优化 xiaoli8748_软件开发系统架构系统架构负载均衡 nginx
一、Nginx性能优化到这里文章的篇幅较长了，最后再来聊一下关于Nginx的性能优化，主要就简单说说收益最高的几个优化项，在这块就不再展开叙述了，毕竟影响性能都有多方面原因导致的，比如网络、服务器硬件、操作系统、后端服务、程序自身、数据库服务等，对于性能调优比较感兴趣的可以参考之前《JVM性能调优》中的调优思想。优化一：打开长连接配置通常Nginx作为代理服务，负责分发客户端的请求，那么建议开启H
【RabbitMQ 项目】服务端：数据管理模块之绑定管理月夜星辉雪 rabbitmq 分布式
文章目录一.编写思路二.代码实践一.编写思路定义绑定信息类交换机名称队列名称绑定关键字：交换机的路由交换算法中会用到没有是否持久化的标志，因为绑定是否持久化取决于交换机和队列是否持久化，只有它们都持久化时绑定才需要持久化。绑定就好像一根绳子，两端连接着交换机和队列，当一方不存在，它就没有存在的必要了定义绑定持久化类构造函数：如果数据库文件不存在则创建，打开数据库，创建binding_table插入
计算机毕业设计PHP仓储综合管理系统（源码+程序+VUE+lw+部署） java毕设程序源码王哥 php 课程设计 vue.js
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程。欢迎交流项目运行环境配置：phpStudy+Vscode+Mysql5.7+HBuilderX+Navicat11+Vue+Express。项目技术：原生PHP++Vue等等组成，B/S模式+Vscode管理+前后端分离等等。环境需要1.运行环境：最好是小皮phpstudy最新版，我们在这个版本上开发的。其他版本理论上也可以。2.开发
3.增删改查--连接查询问女何所忆
关系型数据库的一个特点就是，多张表之间存在关系，以致于我们可以连接多张表进行查询操作，所以连接查询会是关系型数据库中最常见的操作。连接查询主要分为三种，交叉连接、内连接和外连接，我们一个个说。1、交叉连接交叉连接其实连接查询的第一个阶段，它简单表现为两张表的笛卡尔积形式，具体例子：如果你没学过数学中的笛卡尔积概念，你可以这样简单的理解这里的交叉连接：两张表的交叉连接就是一个连接合并的过程，T1表中
docker from指令的含义_多个FROM-含义 weixin_39722188 docker from指令的含义
小编典典什么是基本图片？一组文件，加上EXPOSE端口ENTRYPOINT和CMD。您可以添加文件并基于该基础图像构建新图像，Dockerfile并以FROM指令开头：后面提到的图像FROM是新图像的“基础图像”。这是否意味着如果我neo4j/neo4j在FROM指令中声明，则在运行映像时，neo数据库将自动运行并且可在端口7474的容器中使用？仅当您不覆盖CMD和时ENTRYPOINT。但是图像
Redis:缓存击穿我的程序快快跑啊缓存 redis java
缓存击穿(热点key)：部分key(被高并发访问且缓存重建业务复杂的)失效,无数请求会直接到数据库，造成巨大压力1.互斥锁：可以保证强一致性线程一：未命中之后，获取互斥锁，再查询数据库重建缓存，写入缓存，释放锁线程二：查询未命中，未获得锁(已由线程一获得)，等待一会，缓存命中互斥锁实现方式：redis中setnxkeyvalue:改变对应key的value,仅当value不存在时执行，以此来实现互
mysql学习教程，从入门到精通，TOP 和MySQL LIMIT 子句（15）知识分享小能手大数据数据库 MySQL mysql 学习 oracle 数据库开发语言 adb 大数据
1、TOP和MySQLLIMIT子句内容在SQL中，不同的数据库系统对于限制查询结果的数量有不同的实现方式。TOP关键字主要用于SQLServer和Access数据库中，而LIMIT子句则主要用于MySQL、PostgreSQL（通过LIMIT/OFFSET语法）、SQLite等数据库中。下面将分别详细介绍这两个功能的语法、语句以及案例。1.1、TOP子句（SQLServer和Access）1.1
ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your †徐先森® Oracle数据库 Web相关错误集
createtablestudents(idintunsignedprimarykeyauto_increment,namevarchar(50)notnull,ageintunsigned,highdecimal(3,2),genderenum('男','女','中性','保密','妖')default'保密',cls_idintunsigned);在对数据库插入如上带有中文带有默认值的字段的时
Redis 有哪些危险命令？如何防范？花小疯 redis 缓存数据库危险命令大数据
Redis有哪些危险命令？Redis的危险命令主要有以下几个：1.keys客户端可查询出所有存在的键。2.flushdb删除Redis中当前所在数据库中的所有记录，并且此命令从不会执行失败。3.flushall删除Redis中所有数据库中的所有记录，不止是当前所在数据库，并且此命令从不会执行失败。4.config客户端可修改Redis配置。怎么禁用和重命名危险命令？看下redis.conf默认配置
【Golang】 Golang 的 GORM 库中的 Rows 函数不爱洗脚的小滕 golang 开发语言后端
文章目录前言一、Rows函数解释二、代码实现三、总结前言在使用Go语言进行数据库操作时，GORM（GoObject-RelationalMapping）库是一个常用的工具。它提供了一种简洁和强大的方式来处理数据库操作。本文将介绍GORM库中的Rows函数，这是一个用于执行原生SQL查询并返回结果的函数。一、Rows函数解释在GORM库中，Rows函数用于执行原生SQL查询并返回*sql.Rows结
接口测试如何设计测试用例李蕴Ronnie
接口测试用例设计方式针对每个必填参数，都设计一条参数为空的测试用例必填参数不存在传的参数值在数据库中不存在添加数据接口，传入已有的数据重复添加编辑数据接口，各个字段分别编辑，合并编辑参数数据类型限制，针对每个参数设计一条参数值类型不符合的逆向用例参数自身取值范围，针对所有参数，设计一条每个参数值在取值范围内最大值的正向测试用例是否满足前提条件（token、headers），几个前提条件几条用例针对
Hadoop架构 henan程序媛 hadoop 大数据分布式
一、案列分析1.1案例概述现在已经进入了大数据(BigData)时代，数以万计用户的互联网服务时时刻刻都在产生大量的交互，要处理的数据量实在是太大了，以传统的数据库技术等其他手段根本无法应对数据处理的实时性、有效性的需求。HDFS顺应时代出现，在解决大数据存储和计算方面有很多的优势。1.2案列前置知识点1.什么是大数据大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的大量数据集合，
非关系型数据库天秤-white nosql
一、为什么要用Nosql1.单机MySQL的时代。一个基本的网站访问量一般不会太大，单个数据库完全足够。那时候更多使用的静态网页html，服务器根本没有太大压力。这时候网站的瓶颈是什么？-数据量如果太大，一个机器放不下。-数据量太大需要建立数据的索引（B+Tree），一个服务器内存放不下。-访问量读写混合，一个服务器承受不了。2.memcached缓存+MySQL+垂直拆分（读写分离）。网站80%
六、全局锁和表锁：给表加个字段怎么有这么多阻碍 nieniemin
数据库锁设计的初衷是处理并发问题。作为多用户共享的资源，当出现并发访问的时候，数据库需要合理地控制资源的访问规则。而锁就是用来实现这些访问规则的重要数据结构。根据加锁的范围，MySQL里面的锁大致可以分成全局锁、表级锁和行锁三类。6.1全局锁全局锁就是对整个数据库实例加锁。MySQL提供了一个加全局读锁的方法，命令是Flushtableswithreadlock(FTWRL)。当你需要让整个库处于
对股票分析时要注意哪些主要因素？会飞的奇葩猪股票分析云掌股吧
　　众所周知，对散户投资者来说，股票技术分析是应战股市的核心武器，想学好股票的技术分析一定要知道哪些是重点学习的，其实非常简单，我们只要记住三个要素：成交量、价格趋势、振荡指标。一、成交量　　大盘的成交量状态。成交量大说明市场的获利机会较多，成交量小说明市场的获利机会较少。当沪市的成交量超过150亿时是强市市场状态，运用技术找综合买点较准；
【Scala十八】视图界定与上下文界定 bit1129 scala
Context Bound，上下文界定，是Scala为隐式参数引入的一种语法糖，使得隐式转换的编码更加简洁。隐式参数首先引入一个泛型函数max，用于取a和b的最大值 def max[T](a: T, b: T) = { if (a > b) a else b } 因为T是未知类型，只有运行时才会代入真正的类型，因此调用a >
C语言的分支——Object-C程序设计阅读有感 darkblue086 apple c 框架 cocoa
自从1972年贝尔实验室Dennis Ritchie开发了C语言，C语言已经有了很多版本和实现，从Borland到microsoft还是GNU、Apple都提供了不同时代的多种选择，我们知道C语言是基于Thompson开发的B语言的，Object-C是以SmallTalk-80为基础的。和C++不同的是，Object C并不是C的超集，因为有很多特性与C是不同的。 Object-C程序设计这本书
去除浏览器对表单值的记忆周凡杨 html 记忆 autocomplete form 浏览
&n
java的树形通讯录 g21121 java
最近用到企业通讯录，虽然以前也开发过，但是用的是jsf，拼成的树形，及其笨重和难维护。后来就想到直接生成json格式字符串，页面上也好展现。 // 首先取出每个部门的联系人 for (int i = 0; i < depList.size(); i++) { List<Contacts> list = getContactList(depList.get(i
Nginx安装部署 510888780 nginx linux
Nginx ("engine x") 是一个高性能的 HTTP 和反向代理服务器，也是一个 IMAP/POP3/SMTP 代理服务器。 Nginx 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的，第一个公开版本0.1.0发布于2004年10月4日。其将源代码以类BSD许可证的形式发布，因它的稳定性、丰富的功能集、示例配置文件和低系统资源
java servelet异步处理请求墙头上一根草ｊａｖａ异步返回ｓｅｒｖｌｅｔ
servlet3.0以后支持异步处理请求，具体是使用AsyncContext ，包装httpservletRequest以及httpservletResponse具有异步的功能， final AsyncContext ac = request.startAsync(request, response); ac.s
我的spring学习笔记8-Spring中Bean的实例化 aijuans Spring 3
在Spring中要实例化一个Bean有几种方法： 1、最常用的（普通方法） <bean id="myBean" class="www.6e6.org.MyBean" /> 使用这样方法，按Spring就会使用Bean的默认构造方法，也就是把没有参数的构造方法来建立Bean实例。（有构造方法的下个文细说） 2、还
为Mysql创建最优的索引 annan211 mysql 索引
索引对于良好的性能非常关键，尤其是当数据规模越来越大的时候，索引的对性能的影响越发重要。索引经常会被误解甚至忽略，而且经常被糟糕的设计。索引优化应该是对查询性能优化最有效的手段了，索引能够轻易将查询性能提高几个数量级，最优的索引会比较好的索引性能要好2个数量级。 1 索引的类型 (1) B-Tree 不出意外，这里提到的索引都是指 B-
日期函数百合不是茶 oracle sql 日期函数查询
ORACLE日期时间函数大全 TO_DATE格式(以时间:2007-11-02 13:45:25为例) Year: yy two digits 两位年显示值:07 yyy three digits 三位年显示值:007
线程优先级 bijian1013 java thread 多线程 java多线程
多线程运行时需要定义线程运行的先后顺序。线程优先级是用数字表示，数字越大线程优先级越高，取值在1到10，默认优先级为5。实例： package com.bijian.study; /** * 因为在代码段当中把线程B的优先级设置高于线程A,所以运行结果先执行线程B的run()方法后再执行线程A的run()方法 * 但在实际中，JAVA的优先级不准，强烈不建议用此方法来控制执
适配器模式和代理模式的区别 bijian1013 java 设计模式
一.简介适配器模式：适配器模式（英语：adapter pattern）有时候也称包装样式或者包装。将一个类的接口转接成用户所期待的。一个适配使得因接口不兼容而不能在一起工作的类工作在一起，做法是将类别自己的接口包裹在一个已存在的类中。 &nbs
【持久化框架MyBatis3三】MyBatis3 SQL映射配置文件 bit1129 Mybatis3
SQL映射配置文件一方面类似于Hibernate的映射配置文件，通过定义实体与关系表的列之间的对应关系。另一方面使用<select>,<insert>,<delete>，<update>元素定义增删改查的SQL语句，这些元素包含三方面内容 1. 要执行的SQL语句 2. SQL语句的入参，比如查询条件 3. SQL语句的返回结果
oracle大数据表复制备份个人经验 bitcarter oracle 大表备份大表数据复制
前提：数据库仓库A（就拿oracle11g为例）中有两个用户user1和user2,现在有user1中有表ldm_table1,且表ldm_table1有数据5千万以上，ldm_table1中的数据是从其他库B（数据源）中抽取过来的，前期业务理解不够或者需求有变，数据有变动需要重新从B中抽取数据到A库表ldm_table1中。
HTTP加速器varnish安装小记 ronin47 http varnish 加速
上午共享的那个varnish安装手册，个人看了下，有点不知所云，好吧~看来还是先安装玩玩！苦逼公司服务器没法连外网，不能用什么wget或yum命令直接下载安装，每每看到别人博客贴出的在线安装代码时，总有一股羡慕嫉妒“恨”冒了出来。。。好吧，既然没法上外网，那只能麻烦点通过下载源码来编译安装了！ Varnish 3.0.4下载地址： http://repo.varnish-cache.org/
java-73-输入一个字符串，输出该字符串中对称的子字符串的最大长度 bylijinnan java
public class LongestSymmtricalLength { /* * Q75题目：输入一个字符串，输出该字符串中对称的子字符串的最大长度。 * 比如输入字符串“google”，由于该字符串里最长的对称子字符串是“goog”，因此输出4。 */ public static void main(String[] args) { Str
学习编程的一点感想 Cb123456 编程感想 Gis
写点感想，总结一些，也顺便激励一些自己.现在就是复习阶段，也做做项目. 本专业是GIS专业，当初觉得本专业太水，靠这个会活不下去的，所以就报了培训班。学习的时候，进入状态很慢，而且当初进去的时候，已经上到Java高级阶段了，所以.....，呵呵，之后有点感觉了，不过，还是不好好写代码，还眼高手低的，有
[能源与安全]美国与中国 comsci 能源
现在有一个局面：地球上的石油只剩下N桶，这些油只够让中国和美国这两个国家中的一个顺利过渡到宇宙时代，但是如果这两个国家为争夺这些石油而发生战争，其结果是两个国家都无法平稳过渡到宇宙时代。。。。而且在战争中，剩下的石油也会被快速消耗在战争中，结果是两败俱伤。。。在这个大
SEMI-JOIN执行计划突然变成HASH JOIN了的原因分析 cwqcwqmax9 oracle
甲说： A B两个表总数据量都很大，在百万以上。 idx1 idx2字段表示是索引字段 A B 两表上都有 col1字段表示普通字段 select xxx from A where A.idx1 between mmm and nnn and exists (select 1 from B where B.idx2 =
SpringMVC-ajax返回值乱码解决方案 dashuaifu Ajax springMVC response 中文乱码
SpringMVC-ajax返回值乱码解决方案一：（自己总结，测试过可行） ajax返回如果含有中文汉字，则使用：（如下例：） @RequestMapping(value="/xxx.do") public @ResponseBody void getPunishReasonB
Linux系统中查看日志的常用命令 dcj3sjt126com OS
因为在日常的工作中，出问题的时候查看日志是每个管理员的习惯，作为初学者，为了以后的需要，我今天将下面这些查看命令共享给各位 cat tail -f 日志文件说明 /var/log/message 系统启动后的信息和错误日志，是Red Hat Linux中最常用的日志之一 /var/log/secure 与安全相关的日志信息 /var/log/maillog 与邮件相关的日志信
[应用结构]应用 dcj3sjt126com PHP yii2
应用主体应用主体是管理 Yii 应用系统整体结构和生命周期的对象。每个Yii应用系统只能包含一个应用主体，应用主体在入口脚本中创建并能通过表达式 \Yii::$app 全局范围内访问。补充: 当我们说"一个应用"，它可能是一个应用主体对象，也可能是一个应用系统，是根据上下文来决定[译：中文为避免歧义，Application翻译为应
assertThat用法 eksliang JUnit assertThat
junit4.0 assertThat用法一般匹配符1、assertThat( testedNumber, allOf( greaterThan(8), lessThan(16) ) ); 注释： allOf匹配符表明如果接下来的所有条件必须都成立测试才通过，相当于“与”（&&） 2、assertThat( testedNumber, anyOf( g
android点滴2 gundumw100 应用服务器 android 网络应用 OS HTC
如何让Drawable绕着中心旋转？ Animation a = new RotateAnimation(0.0f, 360.0f, Animation.RELATIVE_TO_SELF, 0.5f, Animation.RELATIVE_TO_SELF,0.5f); a.setRepeatCount(-1); a.setDuration(1000); 如何控制Andro
超简洁的CSS下拉菜单 ini html Web 工作 html5 css
效果体验：http://hovertree.com/texiao/css/3.htmHTML文件： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>简洁的HTML+CSS下拉菜单-HoverTree</title>
kafka consumer防止数据丢失 kane_xie kafka offset commit
kafka最初是被LinkedIn设计用来处理log的分布式消息系统，因此它的着眼点不在数据的安全性（log偶尔丢几条无所谓），换句话说kafka并不能完全保证数据不丢失。尽管kafka官网声称能够保证at-least-once，但如果consumer进程数小于partition_num，这个结论不一定成立。考虑这样一个case，partiton_num=2
@Repository、@Service、@Controller 和 @Component mhtbbx DAO spring bean prototype
@Repository、@Service、@Controller 和 @Component 将类标识为Bean Spring 自 2.0 版本开始，陆续引入了一些注解用于简化 Spring 的开发。@Repository注解便属于最先引入的一批，它用于将数据访问层 (DAO 层 ) 的类标识为 Spring Bean。具体只需将该注解标注在 DAO类上即可。同时，为了让 Spring 能够扫描类
java 多线程高并发读写控制误区 qifeifei java thread
先看一下下面的错误代码，对写加了synchronized控制，保证了写的安全，但是问题在哪里呢？ public class testTh7 { private String data; public String read(){ System.out.println(Thread.currentThread().getName() + "read data "
mongodb replica set(副本集)设置步骤 tcrct java mongodb
网上已经有一大堆的设置步骤的了，根据我遇到的问题，整理一下，如下：首先先去下载一个mongodb最新版，目前最新版应该是2.6 cd /usr/local/bin wget http://fastdl.mongodb.org/linux/mongodb-linux-x86_64-2.6.0.tgz tar -zxvf mongodb-linux-x86_64-2.6.0.t
rust学习笔记 wudixiaotie 学习笔记
1.rust里绑定变量是let，默认绑定了的变量是不可更改的，所以如果想让变量可变就要加上mut。 let x = 1; let mut y = 2; 2.match 相当于erlang中的case，但是case的每一项后都是分号，但是rust的match却是逗号。 3.match 的每一项最后都要加逗号，但是最后一项不加也不会报错，所有结尾加逗号的用法都是类似。 4.每个语句结尾都要加分

mongoDB高级用法汇总 深度更新 深度去重 文档数组内部重复