新缸中之脑

用扩散AI生成的合成数据的质量评估方法【4个指标】

在线工具推荐： Three.js AI纹理开发包 - YOLO合成数据生成器 - GLTF/GLB在线编辑 - 3D模型格式在线转换 - 3D场景编辑器

为了生成有用的图像数据集，我们使用真实世界的照片数据集作为指南针，探索即时工程的艺术。我们的稳定扩散（Stable Diffusion）实验显示了生成模仿现实世界场景的多样化且令人信服的图像的复杂性。

由于很难手动确定某些即时修改何时会改善我们的合成数据集或使其变得更糟，因此我们引入了一个包含4个指标的定量框架来对任何合成数据集的质量进行评分。本文逐步演示了这些质量分数如何指导及时的工程工作以生成更好的综合数据集。同样的系统评估还可以帮助你优化合成数据生成器的其他方面。

如果你的机器学习任务需要自动标注局部区域，比如目标检测，那么用稳定扩散就不容易实现自动标注，更好的方法是使用 UnrealSynth这样的基于游戏引擎的合成数据生成器，能够自动生成包含标注的图像集，非常方便：

https://tools.nsdt.cloud/UnrealSynth

1、评估合成数据集的质量

根据任何提示生成合成数据后，你会想知道合成数据集的优点/缺点。虽然可以通过简单地逐一查看生成的样本来获得想法，但这既费力又不系统。 Cleanlab Studio 提出了一种自动化方法来定量评估合成数据集的质量。当你提供真实数据和应该增强它的合成数据时，该方法会计算四个分数，从不同方面对比你的合成数据与真实数据：

不真实（Unrealistic）：此分数衡量合成数据与真实数据的难以区分程度。高值表明存在许多看起来不切实际的合成样本，这些样本显然是假的。从数学上讲，该分数的计算方法为 1 减去具有真实或合成二进制标签的联合数据集中所有合成图像的平均标签问题分数。
不具有代表性（Unrepresentative）：该分数衡量真实数据在合成数据样本中的代表性程度。高值表明可能存在合成样本分布无法捕获的真实数据分布的尾部（或罕见事件）。从数学上讲，该分数的计算方式为 1 减去具有真实或合成二进制标签的联合数据集中所有真实图像的平均标签问题分数。
变化太少（Unvaried）：该分数衡量合成样本之间的差异程度。高值表明合成数据生成器过于重复，生成了许多看起来彼此相似的样本。从数学上讲，该分数的计算方式为 1 减去与其他合成样本接近重复的合成样本的比例。
非原创（Unoriginal）：该分数衡量合成数据的新颖性。高值表明许多合成样本看起来像是真实数据集中发现的内容的副本，即合成数据生成器可能过于紧密地记忆真实数据而无法泛化。从数学上讲，该分数的计算方式为 1 减去与真实数据集中的示例几乎重复的合成样本的比例。

这些的具体例子是它们所揭示的分数和缺点，将在本文中进一步介绍。你可以按照本教程计算自己的合成图像/文本/表格数据的这些分数（并了解它们的数学细节）。这四个定量分数可通过单一 Python 方法计算，帮助你严格比较不同的合成数据生成器（即提示模板），特别是当通过手动检查样本无法立即清楚差异时。

2、零食数据集

在本文中，我们在合成图像生成方面的工作基于 Snacks 数据集。该数据集包含 20 种不同类别食品的 4838 张实际照片。

来自 Snacks 数据集的随机照片

该数据集描述了广泛的零食类型（从水果到饮料）并且具有丰富的深度（每一类食物都以多种方式描述，具有不同的外观/背景）。我们的目标是生成一个合成数据集，该数据集可用于：代替真实的 Snacks 数据集，或者使用额外的合成图像来增强原始数据。正如我们将看到的，正确捕捉这些图像的丰富性并非易事（即使在这个有限的零食领域）。

3、根据提示生成图像

稳定扩散（Stable Diffusion）是一种随机文本到图像模型，可以生成从同一文本提示采样的不同图像。为稳定扩散设计一个好的提示来生成合成图像数据集需要考虑我们试图模仿的真实图像的几个特征。

3.1 输出格式

首先要考虑的是所需的输出格式。这涉及图像的媒介和风格，这会影响生成图像的整体外观和感觉。鉴于我们的零食数据集中的所有图像都是零食的照片，因此在生成的图像中保留这种摄影风格非常重要。我们可以通过在提示中加入诸如“……的照片”之类的指令来做到这一点。

我们通过使用基本提示生成大量 992 个图像来开始我们的实验。对于我们的零食图像数据集，它很简单：

prompt = "A photo of a snack"

根据我们的基本提示生成的一些合成图像

这个提示很简单，并且产生视觉上连贯的图像。然而，这些图像往往是通用的，并且常常缺乏对零食类型的明确定义。

为了定量评估从此提示生成的合成图像数据（与真实 Snacks 数据集的图像进行比较），我们使用一种简洁的方法来计算 Cleanlab Studio 的 Python API 中提供的合成数据集问题分数：

scores = score_synthetic_dataset(real_and_synthetic_dataset)

根据上述提示生成的合成图像数据集的最终分数（值越高越差）为：

实验	不具代表性	不真实	缺少变化	非原创
基线提示	0.98223	0.95918	0.0	0.0

这些分数揭示了有关我们的提示生成的合成数据集的见解：

不真实的分数较高表明合成图像与真实图像之间存在明显差异（见下文）。
不具代表性的高分表明合成图像没有捕捉到 Snacks 数据集的多样性和细微差别。
缺少变化和非原创的分数为0表明我们生成的图像不重复，并且与真实数据相比显得足够新颖。这是有道理的，因为稳定扩散具有高度的不确定性，并且尚未在我们的 Snacks 数据集上进行明确的微调。

Cleanlab Studio 检测到的基线实验中的合成图像看起来明显是假的（不真实的高分）。

总体而言，从这个单一提示生成的图像几乎没有变化，并且所描绘的零食类型通常不清楚。值得注意的是，稳定扩散的图像生成过程并不提供有关其旨在生成的零食类型的直接信息。从像这样的单个提示模板中不太可能获得丰富且具有代表性的合成数据集。

3.2 主题

图像的主题是我们的提示工程策略中要考虑的下一个方面。我们可以通过合并有关目标分类的信息来使提示更加具体。这使我们能够更好地控制生成的图像内容，旨在使合成数据集与原始数据集中的类分布保持一致。

对于我们的零食数据集，主题与每张图像中显示的特定零食类型直接相关。

# Pseudocode
for each class_name in class_names:
    if class_name starts with a vowel:
        prompt = "A photo of an " + class_name
    else:
        prompt = "A photo of a " + class_name

通过以这种方式包含主题，每个提示都变得更有针对性。我们现在不再使用通用的“零食照片”，而是使用“香蕉照片”或“苹果照片”等明确提示。通过使用这些特定于类别的提示为每个类别生成 96 个图像，我们的目标是创建更准确地代表 Snacks 数据集中找到的各个类别的图像。为了使此方法顺利运行，类名应该清晰、具体且一致。如果它们不明确或模糊，生成的图像可能与预期主题不准确匹配。

一些根据基于主题的提示生成的合成图像

为了评估基于类别的提示生成的合成数据，我们再次采用自动质量评分方法：

scores = score_synthetic_dataset(real_and_synthetic_dataset)

我们的新实验生成的合成数据集得出以下分数：

实验	不具代表性	不真实	缺少变化	非原创
主题聚焦提示	0.99674	0.95775	0.0261	0.0

不真实的分数的边际下降表明，在以类别为中心的提示驱动下，特定的合成图像现在紧密地反映了同一类型的真实图像，并且总体上显得更加真实。
尽管提示侧重于类别，但不具有代表性的分数的增加表明，由提示“……的照片”产生的合成图像集合并不能完全捕获 Snacks 数据集中更广泛的多样性。
缺少变化的分数增加表明一些合成图像可能是彼此几乎相同的版本（这并不意外，因为我们的新提示不太开放）。这是使提示更加具体的危险，生成的合成数据将变得不那么多样化！
Cleanlab Studio 检测到的合成图像之间几乎重复，导致较高的缺少变化分数。
非原创分数仍然很低，表明我们的合成样本似乎都不是直接从真实数据复制的（这是预期的，因为我们从未在本文中使用真实数据训练稳定扩散生成器）。

3.3 上下文

我们可以用来改进提示的另一件事是上下文。指主体所处的背景或周围情况。通过稳定扩散，模型在很大程度上决定了生成图像的背景或设置。但是，通过在之前的课堂提示中添加“上下文规则”，我们可以尝试影响图像的这一部分。

我们的增强提示如下所示：

prompt = class_prompt + " " + context_rule

就我们的零食数据集而言，我们对零食通常可能出现的可想象场景或上下文进行了启发式选择。对于实际应用，建议基于对现有数据的分析（例如不同背景的相对频率），有条理地选择上下文。

context_rules = [
    "in a bowl", 
    "on a plate", 
    "in a bag", 
    "at the supermarket", 
    "in a basket",
    "on a shelf",
]

一些根据我们的上下文增强提示生成的合成图像

我们生成了一个包含 4800 张来自不同类别 + 上下文组合的图像的合成数据集。为了衡量上下文增强提示的有效性，我们再次使用 Cleanlab 的自动质量评分：

scores = score_synthetic_dataset(real_and_synthetic_dataset)

我们的合成数据集本次迭代的得分为：

实验	不具代表性	不真实	缺少变化	非原创
上下文提示	0.99931	0.99604	0.0117	0.0

分析结果如下：

不具代表性的分数的进一步增加强调，虽然上下文驱动的提示提供了一个新的角度，但期望它们自己捕获全部可能的图像是不合理的。

描述 Cleanlab Studio 检测到的场景的真实图像在合成数据集中代表性不足。第一行显示了几张真实的图像，其中包括人们和零食。底行显示在合成数据集中没有很好地表示的欠光图像。

不真实分数的增加表明，某些合成图像在受到我们的上下文规则约束时，显得不太自然，从而使它们与真实图像更容易区分。并非每个上下文规则都适合每个类；想象“盘子里的果汁”或“篮子里的冰淇淋”可能会产生与现实不一致的荒谬图像。

稳定扩散在图像生成方面表现出色，但捕捉现实世界的全部多样性仍然是一个挑战。虽然我们的基线数据集是多种多样的，但它在监督学习环境中却表现不佳。另一方面，课堂提示提高了真实感，但留下了许多真实图像的代表性不足。令人惊讶的是，特定的背景提示加剧了这种代表性不足的情况。我们的外卖？课堂提示是我们获得更丰富的合成数据集的最佳选择。为了真正超越并填补这些空白，完善我们的上下文提示是前进的方向。

在所有提示中，不切实际且不具代表性的分数都相当高。稳定扩散倾向于在提示中对主题进行精美、理想化的描述。这与真实数据集的自发性和多变性形成鲜明对比，真实数据集包含了我们在合成图像中无法真正观察到的各种照明条件、复杂的背景和模糊的上下文。

4、你的提示能激发出一千张独特的图像吗？

如今，提示工程（Prompt Engineering）是有效生成合成图像的关键。本文演示了一种使用稳定扩散模型和 Snacks 数据集生成多样化且真实的合成图像数据集的方法。这些策略也可以应用于许多其他环境。设计有效提示的艺术是一种微妙的平衡——阐明太多细节可能会导致过于具体的图像，而保持太模糊可能会导致缺乏多样性。

Cleanlab Studio提出的对合成数据质量的定量评估对这一迭代过程有很大帮助。通过自动化评估阶段，它使你能够更加专注于完善提示和改进合成图像（而不是费力地了解自己是否取得了进展）。

原文链接：稳定扩散合成数据的评估 — BimAnt

PPT 图形制作神器推荐：从基础到 AI 的高效工具指南
在当今信息飞速传播的时代，PPT已成为展示观点、传递信息的重要媒介。一份出色的PPT，不仅要有清晰的逻辑和丰富的内容，美观且直观的图形更是吸引观众注意力、提升信息传达效率的关键。无论是商务汇报中展示数据趋势的图表，还是教学课件里解释概念的示意图，恰当的PPT图形都能让演示效果事半功倍。那么，如何高效地生成这些助力PPT出彩的图形呢？接下来，我们将深入探讨多种实用方法，并着重为您推荐功能强大的Pic
KTO（Kahneman-Tversky Optimization）技术详解与工程实现 DK_Allen 大模型深度学习 pytorch 人工智能 KTO
KTO（Kahneman-TverskyOptimization）技术详解与工程实现一、KTO核心思想KTO是基于行为经济学前景理论（ProspectTheory）的偏好优化方法，突破传统偏好学习需要成对数据的限制，仅需单样本绝对标注（好/坏）即可优化模型。其创新性在于：损失函数设计：将人类对"收益"和"损失"的非对称心理反应量化数据效率：无需构建偏好对（y_w>y_l），直接利用松散标注二、KT
使用Ora2Pg迁移Oracle数据到openGauss hid_clf-2oizpt7skaq oracle 数据库
下载及安装Ora2Pg1.下载说明PerlDBD：SearchtheCPAN-metacpan.org#只需在搜索输入框中输入模块的全名（例如：DBD::Oracle、DBD::Pg）Ora2Pg：Ora2Pg:MigratesOracletoPostgreSQL在Windows下，应该安装StrawberryPerl（StrawberryPerlforWindows）和操作系统对应的Oracle
layui table 合并相同的列 wendyNo JS js
效果table.render({elem:'#samples',url:'/index/Develorderss/samplelists?od_id='+od_id//数据接口,page:{//支持传入laypage组件的所有参数（某些参数除外，如：jump/elem）-详见文档layout:['prev','page','next','count','skip','limit']//自定义分页布
PHP Laravel 如何查询字段类型为json的数据-WhereJsonContains、orWhereJsonContains
创建表CREATETABLE`suppliers`(`id`bigintunsignedNOTNULLAUTO_INCREMENT,`supplier_name`varchar(255)CHARACTERSETutf8mb4COLLATEutf8mb4_unicode_ciDEFAULTNULLCOMMENT'供应商名称',`address`jsonDEFAULTNULLCOMMENT'地址：数据
MySQL 触发器中判断 NULL 值不生效？问题解析与解决方案
前言在MySQL数据库开发中，触发器是一个非常实用的功能，它能在数据表发生插入、更新或删除操作时自动执行指定的逻辑。但在实际使用中，很多开发者会遇到一个棘手的问题：当触发器中涉及NULL值判断时，预期的逻辑往往不生效。本文就来详细分析这一问题的原因，并提供具体的解决方案。一、问题现象：为什么NULL判断在触发器中“失灵”？先来看一个常见的错误示例。假设我们有一张user表，包含name（姓名）和a
如何使用Ora2Pg迁移Oracle数据库到openGauss openGauss小助手 openGauss技术分享数据库 oracle postgresql
Ora2Pg介绍Ora2Pg是一个将Oracle迁移至PostgreSQL的开源工具，通过连接Oracle数据库，自动扫描并提取其中的对象结构及数据，产生SQL脚本，通过手动或自动的方式将其应用到PostgreSQL。官方网站：https://ora2pg.darold.net/Ora2Pg优秀特性支持导出数据库绝大多数对象类型，包括表、视图、序列、索引、外键、约束、函数、存储过程等。提供PL/S
oracle pg 文件级迁移,从Oracle迁移到AntDB(二)-- ora2pg-对象和数据的导出导入
使用Ora2pg和psqlcopy方式进行数据迁移author:yafeishitags:AntDB,ora2pg,oracleAntDB:github_url,基于postgresql的高性能分布式数据库使用Ora2pg和psqlcopy方式进行数据迁移准备工作使用本文档的前提本文档指导如何使用ora2pg进行oracle到ADB的数据迁移，但是在参照本文档操作之前，有以下条件必须满足：-ADB
freertos 外设同步 is0815 stm32 arm开发
是的，多个任务共享SPI、I2C、UART等外设时，通常必须加锁，否则会出现资源竞争、数据错乱、通信失败等问题。这是RTOS编程中常见的同步问题。为什么需要加锁？外设通常是共享资源，比如：SPI是一个总线，发送和接收过程是连续的，不能被中断打断；I2C通常只有一个控制器（master），多任务如果同时发起通信，会造成仲裁冲突；UART发送过程可能被打断，导致拼接成一条乱码。✅加锁的方法1.使用互斥
公众号 SEO 排名优化效果跟踪：基础数据记录表 xinxinseo_ 搜索引擎微信公众平台微信百度大数据
在进行公众号SEO排名优化时，系统记录和分析数据是评估优化效果、调整策略的关键。以下为精心设计的基础数据记录表模板，涵盖核心指标，助你清晰掌握优化进展。一、文章基础数据记录表文章标题发布时间阅读量点赞数在看数留言数分享数阅读完成率平均阅读时长搜索来源阅读量搜索来源占比[填写文章标题][具体年月日时分][数字][数字][数字][数字][数字][百分比][X分X秒][数字][百分比][填写文章标题][
0.基本环境配置、数据库介绍 ersanshi055 生信小菜鸟生信基本知识 r语言生信分析
目录一、R与Rstudio的下载与安装二、R包安装与加载1.R包安装2.R包加载三、常用R包1.tidyverse2.ggplot2四、常用数据库1.GEO2.TGGA一、R与Rstudio的下载与安装介绍：Home-RDocumentation下载：R:CRAN:MirrorsRstudio：DownloadRStudio-PositR、Rstudio安装：根据指引安装，R和Rstudio比较占
java 同步redis到mysql_Yii2 redis同步数据到mysql 兰艳知己 java 同步redis到mysql
将redis数据写入mysql中：本次案例讲解将如何将商城中商品浏览次数通过缓存记录并写入mysql中具体的redis安装过程暂且就省略了.....一、安装redis插件|配置rediscomposerrequireyiisoft/yii2-redis找到common的config文件，在components下加入redis配置参数'redis'=>['class'=>'yii\redis\Con
TDengine 集群节点管理 TDengine （老段） TDengine SQL 手册 tdengine 数据库时序数据库大数据物联网 iotdb iot
简介组成TDengine集群的物理实体是dnode(datanode的缩写)，它是一个运行在操作系统之上的进程。在dnode中可以建立负责时序数据存储的vnode(virtualnode)，在多节点集群环境下当某个数据库的replica为3时，该数据库中的每个vgroup由3个vnode组成；当数据库的replica为1时，该数据库中的每个vgroup由1个vnode组成。如果要想配置某个数据库为
一场 6 点半开启的慢跑，是我们对八周年最真实的记录
今天，涛思数据八岁了。从2017年成立到现在，已经过去了整整八年。我们用一款开源时序数据库——TDengine，把中国团队的技术能力写进了全球开发者的代码库，也写进了越来越多行业用户的生产系统。八年时间，说长不长，说短也不短。我们经历了初创时的摸索，度过了技术路径尚未被验证的阶段，也一步步走到了今天这个节点：我们仍在奔跑，但不再孤身。这一次，我们选择用一条“慢跑”路线，回望这八年的路。详情关注TD
Python中什么时候需要返回值，什么时候不需要返回值？？？似乎很简单 Python学习日记 python 开发语言
在Python中，函数是否需要返回值取决于它的设计目的和功能需求。需要返回值的情况计算结果需要被后续代码使用当函数的主要目的是计算或生成数据，且调用方需要这些结果时：defadd(a,b):returna+b#结果需要被其他代码使用total=add(3,5)#需要返回值需要传递状态或信息如果函数执行后需要告诉调用方是否成功、返回状态码或错误信息：defvalidate_input(input):
Python中的高阶函数---便捷的语法书写！！！！，可以简化一些函数的书写！！！似乎很简单 Python学习日记 python 开发语言学习笔记
目录1.map()函数示例1：单可迭代对象（平方运算）示例2：多可迭代对象（元素相加）2.mapvs列表推导式什么是列表推导式（ListComprehension）？对比示例列表推导式的优势map的优势5.实际应用场景场景1：批量转换数据类型场景2：多列数据处理场景3：链式操作6.性能与注意事项总结3.sorted()函数1.语法：sorted(iterable,*,key=None,revers
redis做同步或异步队列瞧着不像好人呐 redis redis java 数据库
redis实现队列主要是使用数据结构中的list，相当于Java中的ArrayList因为它是按照塞入顺序排序的结构，我们就可以按照左边塞入，右边取出的方式来实现先入先出的队列需求。publicvoidrpush(Stringkey,Stringvalue){Jedisjedis=null;try{jedis=jedisPool.getResource();jedis.rpush(key,valu
HarmonyOS 入门到精通：为什么状态管理是鸿蒙开发的核心？逻极 harmonyos 鸿蒙笔记 harmonyos 华为鸿蒙入门到精通状态管理状态模式 arkts
在现代应用开发中，状态管理是构建响应式应用的基石。对于鸿蒙这种面向全场景的分布式操作系统，状态管理机制显得尤为重要。它不仅是实现复杂交互逻辑的关键，还直接关系到应用的性能、可维护性和用户体验。什么是状态管理？状态是指UI组件所依赖的、会随时间变化的数据。状态管理则是对这些变化数据的有效组织和控制，包括：状态的创建与初始化：在应用启动或组件加载时，为状态变量分配初始值，确保组件能够正确渲染初始界面。
企业内网系统：从传统开发到智能赋能的进化之路飞算JavaAI开发助手科技人工智能大数据 java
在当今数字化浪潮中，企业内网系统作为支撑日常运营的核心基础设施，其开发效率与质量直接关系到企业的竞争力。传统开发模式下，程序员需要手动完成需求分析、架构设计、代码编写、测试调试等全流程工作，不仅耗时费力，还容易因人为疏忽导致质量隐患。而随着人工智能技术的突破性进展，以飞算JavaAI为代表的智能开发工具正在重塑企业内网系统的开发范式，为程序员提供从设计到落地的全链路智能支持。一、传统企业内网系统开
MCP协议采用客户端-服务器架构的深层逻辑与架构对比分析
一、架构选择的核心动因1.功能解耦与安全边界的强制性要求MCP采用客户端-服务器（C/S）架构的核心动因源于AI系统与真实世界交互的特殊性：权限分层控制：主机（Host）作为协调层，严格划分客户端（Client）与服务端（Server）的操作权限。例如医疗场景中，诊断模型（Client）仅能通过医院授权的主机访问脱敏病历服务器，无法直接接触原始数据。沙箱隔离需求：每个MCP服务器运行在独立容器中（
时序数据库 TDengine × SSRS：专为工业、能源场景打造的报表解决方案
每当听到“做报表”三个字，是不是内心都会先叹口气？尤其在工业、能源、制造等场景，面对那些结构固定、字段繁多、格式要求严苛的报表任务，用Excel手动拼，真的是既费时又容易出错。现在解决方案来了——时序数据库TDengine与SQLServerReportingServices（SSRS）已经完成无缝集成！高性能时序数据库+企业级报表平台，帮你用更少的操作、更高的效率，制作出更稳定、更规范的专业报表
Docker 高级管理 -- 容器通信技术与数据持久化婷儿z docker 容器运维
目录第一节:容器通信技术一：Docker容器的网络模式1：Bridge模式2：Host模式3：Container模式4：None模式5：Overlay模式6：Macvlan模式7：自定义网络模式二：端口映射关键对比三：容器互联关键对比四：容器间通信实现案例1.网络创建选项2.容器通信实现步骤3.通信方式对比第二节：数据持久化技术一：Docker的数据管理1.数据卷核心概念2.数据卷核心作用3.数据
Hutool TreeUtil快速构建树形数据结构 yifanghub 工具类 java
在管理菜单、部门结构等场景时，我们经常需要将数据库中的层级数据转换为树形结构。本文将通过Hutool的TreeUtil工具类，实现零递归快速构建树形结构。一、环境准备JDK1.8+SpringBoot2.xHutool5.8.16MySQL8.0二、数据准备--创建部门表CREATETABLE`sys_dept`(`id`intNOTNULLAUTO_INCREMENT,`dept_name`va
Seaborn高阶玩法全解析：从复杂图表到多图布局的可视化实战指南
数据可视化就像给数据“画肖像”——初级阶段是勾勒轮廓，高级阶段则是赋予灵魂。在Python可视化生态中，Seaborn凭借“一行代码出美图”的优雅，成为数据分析的“画笔利器”。但你是否遇到过这样的场景：想同时展示数据分布与统计量，却被基础图表限制；想批量绘制分面图，手动拼接效率低下；想让图表更具设计感，却对颜色搭配和注解技巧一知半解？本文将带你解锁Seaborn的高阶玩法，从复杂图表绘制到多图布局
从0到1：SQL注入与XSS攻防实战——数据库安全加固全攻略小张在编程 sql xss 数据库
引言2023年某电商平台用户数据泄露事件中，黑客仅用一行username='OR'1'='1的登录输入，就拖走了百万用户信息；另一家社交网站更离谱，用户在评论区输入alert('xss')，竟让千万级用户的浏览器成了“提线木偶”。这些看似简单的攻击，为何能撕开企业安全防线？今天我们就来拆解SQL注入与XSS的“作案手法”，并给出一套可落地的数据库安全加固方案——毕竟，防住这两类攻击，能解决80%的
使用 p6spy，拦截到持久层执行的sql及参数 Peter-OK 一些问题 p6spy sql
声明：文章内容是自己使用后整理，大部分工具代码出自大牛，但因无法确认出处，故仅在此处由衷的对无私分享源代码的作者表示感谢与致敬！本人在拦截到sql的基础上加了分析功能和异常告警功能1、导入p6spy的jar包，如果是maven项目引入pomp6spyp6spy3.9.12、修改datasource数据源的driverClassName驱动和url地址为com.p6spy.engine.spy.P6
uniapp [安卓苹果App端] - 实现获取请求手机位置权限+开启定位获取经纬度/省市区地址等，检测权限手机定位是否开启并引导用户同意授权，uniApp app端调用本机开启本机定位权限及IP属地前端开发大师鸭 +Uniapp 开发问题汇总 uni-app 手机定位权限手机位置权限 uniapp安卓苹果系统权限用户拒绝定位权限后怎么办开启位置并获取IP定位数据经纬度及省市区县详细地址数据
前言网上的教程乱七八糟且兼容性太差，本文提供优质示例。在uni-appApp端（安卓APP|苹果APP）开发中，详解在app平台端实现获取手机位置权限及开启定位功能（原生实现不依赖第三方插件和地图），有权限则开启位置定位获取用户经纬度+IP属地+省市区县详细地址数据等操作，反之无权限则提示开启位置权限与引导用户授权操作，uniAppapp端实现判断是否拥有定位权限及提示引导用户授权同意，完美兼容安
SpringBoot3+JPA+MySQL实现多数据源的读写分离(基于EntityManagerFactory) 没刮胡子 java 软件开发技术实战专栏 SpringBoot3 JPA MySQL 多数据源读写分离
1、简介在SpringBoot中配置多个数据源并实现自动切换EntityManager，这里我编写了一个RoutingEntityManagerFactory和AOP（面向切面编程）的方式来实现。这里我配置了两个数据源：primary和secondary，其中primary主数据源用来写入数据，secondary从数据源用来读取数据。注意1：使用Springboot3的读写分离，首先要保证主库和从
scanpy保存图片的常用方法汇总 Bio Coder 空间转录组 &单细胞 scanpy 保存图片汇总
在使用Scanpy（一个用于单细胞RNA测序数据分析的Python库）时，保存图片（如可视化结果）是常见的操作。Scanpy的绘图功能主要基于Matplotlib和Seaborn，保存图片的方法也与这些库的保存机制一致。以下是Scanpy保存图片的详细方法及注意事项：1.基本保存图片的方法Scanpy的绘图函数（如sc.pl.umap、sc.pl.tsne、sc.pl.pca等）通常会返回Matp
spring-data-jpa+spring+hibernate+druid配置
参考链接：http://doc.okbase.net/liuyitian/archive/109276.htmlhttp://my.oschina.net/u/1859292/blog/312188最新公司的web项目需要用到spring-data-jpa作为JPA的实现框架，同时使用阿里巴巴的开源数据库连接池druid。关于这两种框架的介绍我在这里就不多赘述。直接进入配置页面：spring的配置
Dom 周华华 JavaScript html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
【Spark九十六】RDD API之combineByKey bit1129 spark
1. combineByKey函数的运行机制 RDD提供了很多针对元素类型为(K,V)的API，这些API封装在PairRDDFunctions类中，通过Scala隐式转换使用。这些API实现上是借助于combineByKey实现的。combineByKey函数本身也是RDD开放给Spark开发人员使用的API之一首先看一下combineByKey的方法说明：
msyql设置密码报错：ERROR 1372 (HY000): 解决方法详解 daizj mysql 设置密码
MySql给用户设置权限同时指定访问密码时，会提示如下错误： ERROR 1372 (HY000): Password hash should be a 41-digit hexadecimal number；问题原因：你输入的密码是明文。不允许这么输入。解决办法：用select password('你想输入的密码');查询出你的密码对应的字符串，然后
路漫漫其修远兮吾将上下而求索周凡杨学习思索
王国维在他的《人间词话》中曾经概括了为学的三种境界古今之成大事业、大学问者，罔不经过三种之境界。“昨夜西风凋碧树。独上高楼，望尽天涯路。”此第一境界也。“衣带渐宽终不悔，为伊消得人憔悴。”此第二境界也。“众里寻他千百度，蓦然回首，那人却在灯火阑珊处。”此第三境界也。学习技术，这也是你必须经历的三种境界。第一层境界是说，学习的路是漫漫的，你必须做好充分的思想准备，如果半途而废还不如不要开始。这里，注
Hadoop(二)对话单的操作朱辉辉33 hadoop
Debug： 1、 A = LOAD '/user/hue/task.txt' USING PigStorage(' ') AS (col1,col2,col3); DUMP A; //输出结果前几行示例： (>ggsnPDPRecord(21),,) (-->recordType(0),,) (-->networkInitiation(1),,)
web报表工具FineReport常用函数的用法总结（日期和时间函数）老A不折腾 finereport 报表工具 web开发
web报表工具FineReport常用函数的用法总结（日期和时间函数）说明：凡函数中以日期作为参数因子的，其中日期的形式都必须是yy/mm/dd。而且必须用英文环境下双引号(" ")引用。 DATE DATE(year,month,day):返回一个表示某一特定日期的系列数。 Year:代表年，可为一到四位数。 Month:代表月份。
c++ 宏定义中的##操作符墙头上一根草 C++
#与##在宏定义中的--宏展开 #include <stdio.h> #define f(a,b) a##b #define g(a) #a #define h(a) g(a) int main() { &nbs
分析Spring源代码之，DI的实现 aijuans spring DI 现源代码
(转) 分析Spring源代码之，DI的实现 2012/1/3 by tony 接着上次的讲，以下这个sample [java] view plain copy print
for循环的进化 alxw4616 JavaScript
// for循环的进化 // 菜鸟 for (var i = 0; i < Things.length ; i++) { // Things[i] } // 老鸟 for (var i = 0, len = Things.length; i < len; i++) { // Things[i] } // 大师 for (var i = Things.le
网络编程Socket和ServerSocket简单的使用百合不是茶网络编程基础 IP地址端口
网络编程;TCP/IP协议网络:实现计算机之间的信息共享,数据资源的交换协议:数据交换需要遵守的一种协议,按照约定的数据格式等写出去端口:用于计算机之间的通信每运行一个程序，系统会分配一个编号给该程序，作为和外界交换数据的唯一标识 0~65535 查看被使用的
JDK1.5 生产消费者 bijian1013 java thread 生产消费者 java多线程
ArrayBlockingQueue：一个由数组支持的有界阻塞队列。此队列按 FIFO（先进先出）原则对元素进行排序。队列的头部是在队列中存在时间最长的元素。队列的尾部是在队列中存在时间最短的元素。新元素插入到队列的尾部，队列检索操作则是从队列头部开始获得元素。 ArrayBlockingQueue的常用方法：
JAVA版身份证获取性别、出生日期及年龄 bijian1013 java 性别出生日期年龄
工作中需要根据身份证获取性别、出生日期及年龄，且要还要支持15位长度的身份证号码，网上搜索了一下，经过测试好像多少存在点问题，干脆自已写一个。 CertificateNo.java package com.bijian.study; import java.util.Calendar; import
【Java范型六】范型与枚举 bit1129 java
首先，枚举类型的定义不能带有类型参数，所以，不能把枚举类型定义为范型枚举类，例如下面的枚举类定义是有编译错的 public enum EnumGenerics<T> { //编译错，提示枚举不能带有范型参数 OK, ERROR; public <T> T get(T type) { return null;
【Nginx五】Nginx常用日志格式含义 bit1129 nginx
1. log_format 1.1 log_format指令用于指定日志的格式，格式： log_format name(格式名称) type(格式样式) 1.2 如下是一个常用的Nginx日志格式： log_format main '[$time_local]|$request_time|$status|$body_bytes
Lua 语言 15 分钟快速入门 ronin47 lua 基础
- - 单行注释 - - [[ [多行注释] - - ]] - - - - - - - - - - - 1. 变量 & 控制流 - - - - - - - - - - num = 23 - - 数字都是双精度 str = 'aspythonstring'
java-35.求一个矩阵中最大的二维矩阵 ( 元素和最大 ) bylijinnan java
the idea is from: http://blog.csdn.net/zhanxinhang/article/details/6731134 public class MaxSubMatrix { /**see http://blog.csdn.net/zhanxinhang/article/details/6731134 * Q35 求一个矩阵中最大的二维
mongoDB文档型数据库特点开窍的石头 mongoDB文档型数据库特点
MongoDD: 文档型数据库存储的是Bson文档-->json的二进制特点：内部是执行引擎是js解释器，把文档转成Bson结构，在查询时转换成js对象。 mongoDB传统型数据库对比传统类型数据库：结构化数据，定好了表结构后每一个内容符合表结构的。也就是说每一行每一列的数据都是一样的文档型数据库：不用定好数据结构，
[毕业季节]欢迎广大毕业生加入JAVA程序员的行列 comsci java
一年一度的毕业季来临了。。。。。。。。正在投简历的学弟学妹们。。。如果觉得学校推荐的单位和公司不适合自己的兴趣和专业，可以考虑来我们软件行业，做一名职业程序员。。。软件行业的开发工具中，对初学者最友好的就是JAVA语言了，网络上不仅仅有大量的
PHP操作Excel – PHPExcel 基本用法详解 cuiyadll PHP Excel
导出excel属性设置//Include classrequire_once('Classes/PHPExcel.php');require_once('Classes/PHPExcel/Writer/Excel2007.php');$objPHPExcel = new PHPExcel();//Set properties 设置文件属性$objPHPExcel->getProperties
IBM Webshpere MQ Client User Issue (MCAUSER) darrenzhu IBM jms user MQ MCAUSER
IBM MQ JMS Client去连接远端MQ Server的时候，需要提供User和Password吗？答案是根据情况而定，取决于所定义的Channel里面的属性Message channel agent user identifier (MCAUSER)的设置。 http://stackoverflow.com/questions/20209429/how-mca-user-i
网线的接法 dcj3sjt126com
一、PC连HUB (直连线)A端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。 B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。二、PC连PC （交叉线）A端：(568A)：白绿，绿，白橙，蓝，白蓝，橙，白棕，棕； B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。三、HUB连HUB&nb
Vimium插件让键盘党像操作Vim一样操作Chrome dcj3sjt126com chrome vim
什么是键盘党？键盘党是指尽可能将所有电脑操作用键盘来完成，而不去动鼠标的人。鼠标应该说是新手们的最爱，很直观，指哪点哪，很听话！不过常常使用电脑的人，如果一直使用鼠标的话，手会发酸，因为操作鼠标的时候，手臂不是在一个自然的状态，臂肌会处于绷紧状态。而使用键盘则双手是放松状态，只有手指在动。而且尽量少的从鼠标移动到键盘来回操作，也省不少事。在chrome里安装 vimium 插件
MongoDB查询（2）——数组查询[六] eksliang mongodb MongoDB查询数组
MongoDB查询数组转载请出自出处：http://eksliang.iteye.com/blog/2177292 一、概述 MongoDB查询数组与查询标量值是一样的，例如，有一个水果列表，如下所示： > db.food.find() { "_id" : "001", "fruits" : [ "苹
cordova读写文件（1） gundumw100 JavaScript Cordova
使用cordova可以很方便的在手机sdcard中读写文件。首先需要安装cordova插件：file 命令为： cordova plugin add org.apache.cordova.file 然后就可以读写文件了，这里我先是写入一个文件，具体的JS代码为： var datas=null;//datas need write var directory=&
HTML5 FormData 进行文件jquery ajax 上传到又拍云 ileson jquery Ajax html5 FormData
html5 新东西：FormData 可以提交二进制数据。页面test.html <!DOCTYPE> <html> <head> <title> formdata file jquery ajax upload</title> </head> <body> <
swift appearanceWhenContainedIn:(version1.2 xcode6.4) 啸笑天 version
swift1.2中没有oc中对应的方法： + (instancetype)appearanceWhenContainedIn:(Class <UIAppearanceContainer>)ContainerClass, ... NS_REQUIRES_NIL_TERMINATION; 解决方法：在swift项目中新建oc类如下： #import &
java实现SMTP邮件服务器 macroli java 编程
电子邮件传递可以由多种协议来实现。目前，在Internet 网上最流行的三种电子邮件协议是SMTP、POP3 和 IMAP，下面分别简单介绍。　　◆ SMTP 协议　　简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)是一个运行在TCP/IP之上的协议，用它发送和接收电子邮件。SMTP 服务器在默认端口25上监听。SMTP客户使用一组简单的、基于文本的
mongodb group by having where 查询sql qiaolevip 每天进步一点点学习永无止境 mongo 纵观千象
SELECT cust_id, SUM(price) as total FROM orders WHERE status = 'A' GROUP BY cust_id HAVING total > 250 db.orders.aggregate( [ { $match: { status: 'A' } }, { $group: {
Struts2 Pojo（六） Luob. POJO strust2
注意：附件中有完整案例 1.采用POJO对象的方法进行赋值和传值 2.web配置 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee&q
struts2步骤 wuai struts
1、添加jar包 2、在web.xml中配置过滤器 <filter> <filter-name>struts2</filter-name> <filter-class>org.apache.st