ShowMeAI

人工智能 | ShowMeAI资讯日报 #2022.06.01

ShowMeAI日报系列全新升级！覆盖AI人工智能工具&框架 | 项目&代码 | 博文&分享 | 数据&资源 | 研究&论文等方向。点击查看 历史文章列表，在公众号内订阅话题 #ShowMeAI资讯日报，可接收每日最新推送。点击 专题合辑&电子月刊 快速浏览各专题全集。点击这里回复关键字日报免费获取AI电子月刊与资料包。

1.工具&框架

工具库：compose - 面向预测工程自动化的机器学习工具

tags：[预测工程，自动化，机器学习]

‘compose - A machine learning tool for automated prediction engineering’ by alteryx

GitHub：http://github.com/alteryx/compose

工具：labelGo - 基于labelImg及YOLOV5的图形化半自动标注工具

tags：[数据标注，图像标注，半自动化]

‘labelGo - YOLOV5 semi-automatic annotation tool (Based on labelImg)’ by Cheng-Yu Fang

GitHub：http://github.com/cnyvfang/labelGo-Yolov5AutoLabelImg

工具库：Fiddle - 适合机器学习应用的Python配置管理库，支持深度学习参数配置

tags：[机器学习，配置管理，参数配置]

‘Fiddle - a Python-first configuration library particularly well suited to ML applications’ by google

GitHub：http://github.com/google/fiddle

工具库：ERNIE - 文心大模型ERNIE

tags：[ERNIE，大模型]

‘Official implementations for various pre-training models of ERNIE-family, covering topics of Language Understanding & Generation, Multimodal Understanding & Generation, and beyond.’ by PaddlePaddle

GitHub：http://github.com/PaddlePaddle/ERNIE

工具库：UnionML - 构建和部署机器学习微服务

tags：[部署，服务，微服务，机器学习]

‘UnionML - the easiest way to build and deploy machine learning microservices’ by unionai-oss

GitHub：http://github.com/unionai-oss/unionml

工具库：BasicSR - 超分辨率开发工具集

tags：[超分辨率]

‘BasicSR - Basic Super-Resolution codes for development. Includes ESRGAN, SFT-GAN for training and testing.’ by Xintao

GitHub：http://github.com/XPixelGroup/BasicSR

工具：GRASS GIS - 免费开源的地理信息系统(GIS)

tags：[GIS，地理信息]

‘GRASS GIS - free and open source Geographic Information System (GIS)’ by Open Source Geospatial Foundation

GitHub：http://github.com/OSGeo/grass

2.项目&代码

项目：Python示例代码集

tags：[python]

‘My Python Examples’ by geekcomputers

GitHub：http://github.com/geekcomputers/Python

项目：InsightFace: 最先进的2D和3D人脸分析项目

tags：[人脸识别，人脸分析]

‘InsightFace: 2D and 3D Face Analysis Project - State-of-the-art 2D and 3D Face Analysis Project’ by Deep Insight

GitHub：http://github.com/deepinsight/insightface

书籍项目代码：《Rasa实战：构建开源对话机器人》官方随书代码

tags：[对话系统，问答]

GitHub：http://github.com/Chinese-NLP-book/rasa_chinese_book_code

3.博文&分享

博文：机器学习核心概念的可视化解释

tags：[机器学习，可视化]

‘MLU-Explain - Visual explanations of core machine learning concepts’

Link：https://mlu-explain.github.io/

博文：如何构建高效(且有用)的面板

tags：[面板]

《How to Build Effective (and Useful) Dashboards》by Marie Lefevre

Link：http://towardsdatascience.com/how-to-build-effective-and-useful-dashboards-711759534639

教程：从零开始的Kubernetes攻防

tags：[Kubernetes，攻防]

GitHub：http://github.com/neargle/my-re0-k8s-security

4.数据&资源

数据集：WTW-Dataset：现实场景表格检测识别数据集**

tags：[表格检测，数据集]

‘WTW-Dataset - an official implementation for the WTW Dataset in "Parsing Table Structures in the Wild " on table detection and table structure recognition.’ by wangwen-whu

GitHub：http://github.com/wangwen-whu/WTW-Dataset

数据集：DialogSum: 现实生活场景对话摘要数据集

tags：[对话，摘要，数据集]

‘DialogSum: A Real-life Scenario Dialogue Summarization Dataset - DialogSum: A Real-life Scenario Dialogue Summarization Dataset - Findings of ACL 2021’ by cylnlp

GitHub：http://github.com/cylnlp/DialogSum

数据集：SILVR: 合成沉浸式大容量全景数据集

tags：[图像，全景，数据集]

‘SILVR: A Synthetic Immersive Large-Volume Plenoptic Dataset - A Synthetic Immersive Large-Volume Plenoptic Dataset’ by IDLab Media

GitHub：http://github.com/IDLabMedia/large-lightfields-dataset

资源列表：机器学习数学基础学习资源集

tags：[AI数学基础]

‘Mathematics for Machine Learning - A collection of resources to learn mathematics for machine learning’ by DAIR.AI

GitHub：http://github.com/dair-ai/Mathematics-for-ML

资源列表：多标签图像识别相关资源大列表

tags：[多标签，图像]

‘Everything about Multi-label Image Recognition.’ by Tao Pu

GitHub：http://github.com/putao537/Awesome-Multi-label-Image-Recognition

资源列表：对话推荐系统论文列表

tags：[对话，推荐系统]

‘CRS Papers - Conversational Recommender System (CRS) paper list. 对话推荐系统论文列表’ by Chenzhan Shang

GitHub：http://github.com/Zilize/CRSPapers

5.研究&论文

可以点击这里回复关键字日报，免费获取整理好的6月论文合辑。

论文：PaddleSpeech: An Easy-to-Use All-in-One Speech Toolkit

论文标题：PaddleSpeech: An Easy-to-Use All-in-One Speech Toolkit

论文时间：20 May 2022

所属领域：Speech/语音

对应任务：Automatic Speech Recognition，Environmental Sound Classification，Keyword Spotting，Speaker Diarization，Speaker Identification，Speaker Recognition，Speaker Verification，Speech Recognition，Speech Synthesis，Speech-to-Text Translation，Text-To-Speech Synthesis，自动语音识别，环境声音分类，关键词识别，说话人区分，说话人识别，说话人识别，说话人验证，语音识别，语音合成，语音到文本翻译，文本到语音合成

论文地址：https://arxiv.org/abs/2205.12007

代码实现：https://github.com/PaddlePaddle/PaddleSpeech,https://github.com/PaddlePaddle/DeepSpeech

论文作者：HUI ZHANG, Tian Yuan, Junkun Chen, Xintong Li, Renjie Zheng, Yuxin Huang, Xiaojie Chen, Enlei Gong, Zeyu Chen, Xiaoguang Hu, dianhai yu, Yanjun Ma, Liang Huang

论文简介：PaddleSpeech is an open-source all-in-one speech toolkit./PaddleSpeech 是一个开源的一体化语音工具包。

论文摘要：PaddleSpeech is an open-source all-in-one speech toolkit. It aims at facilitating the development and research of speech processing technologies by providing an easy-to-use command-line interface and a simple code structure. This paper describes the design philosophy and core architecture of PaddleSpeech to support several essential speech-to-text and text-to-speech tasks. PaddleSpeech achieves competitive or state-of-the-art performance on various speech datasets and implements the most popular methods. It also provides recipes and pretrained models to quickly reproduce the experimental results in this paper. PaddleSpeech is publicly avaiable at https://github.com/PaddlePaddle/PaddleSpeech .

PadderSpeech是一个开源的多功能语音工具包。它旨在通过提供易于使用的命令行界面和简单的代码结构，促进语音处理技术的开发和研究。本文描述了PadleSpeech的设计理念和核心架构，以支持几个基本的语音到文本和文本到语音任务。PadleSpeech在各种语音数据集上实现了极具竞争力或最先进的性能，并实现了最流行的方法。它还提供了配方和预训练模型，以快速再现本文中的实验结果。

论文：Thermodynamics-informed graph neural networks

论文标题：Thermodynamics-informed graph neural networks

论文时间：3 Mar 2022

所属领域：图神经网络

论文地址：https://arxiv.org/abs/2203.01874

代码实现：https://github.com/quercushernandez/ThermodynamicsGNN

论文作者：Quercus Hernández, Alberto Badías, Francisco Chinesta, Elías Cueto

论文简介：In this paper we present a deep learning method to predict the temporal evolution of dissipative dynamic systems./本文提出了一种预测耗散动力系统时间演化的深度学习方法。

论文摘要：In this paper we present a deep learning method to predict the temporal evolution of dissipative dynamic systems. We propose using both geometric and thermodynamic inductive biases to improve accuracy and generalization of the resulting integration scheme. The first is achieved with Graph Neural Networks, which induces a non-Euclidean geometrical prior with permutation invariant node and edge update functions. The second bias is forced by learning the GENERIC structure of the problem, an extension of the Hamiltonian formalism, to model more general non-conservative dynamics. Several examples are provided in both Eulerian and Lagrangian description in the context of fluid and solid mechanics respectively, achieving relative mean errors of less than 3% in all the tested examples. Two ablation studies are provided based on recent works in both physics-informed and geometric deep learning.

在本文中，我们提出了一种深度学习方法来预测耗散动态系统的时间演化。我们建议使用几何和热力学感应偏差来提高所得积分方案的准确性和泛化性。第一个是通过图神经网络实现的，它引入了具有置换不变节点和边更新函数的非欧几里得几何先验。第二个偏差是通过学习问题的 GENERIC 结构（哈密顿形式主义的扩展）来强制建模更一般的非保守动力学。在流体力学和固体力学的背景下，欧拉和拉格朗日描述中分别提供了几个示例，在所有测试示例中实现了小于 3% 的相对平均误差。基于物理信息和几何深度学习的最新工作，提供了两项消融研究。

论文：Towards Total Recall in Industrial Anomaly Detection

论文标题：Towards Total Recall in Industrial Anomaly Detection

论文时间：15 Jun 2021

所属领域：Anomaly Detection/异常检测

对应任务：Anomaly Detection，Few Shot Anomaly Detection，Outlier Detection，异常检测，少样本异常检测，离群检测

论文地址：https://arxiv.org/abs/2106.08265

代码实现：https://github.com/amazon-research/patchcore-inspection , https://github.com/openvinotoolkit/anomalib ,
https://github.com/hcw-00/PatchCore_anomaly_detection ,
https://github.com/mindspore-ai/models/tree/master/official/cv/patchcore , https://github.com/rvorias/ind_knn_ad

论文作者：Karsten Roth, Latha Pemula, Joaquin Zepeda, Bernhard Schölkopf, Thomas Brox, Peter Gehler

论文简介：Being able to spot defective parts is a critical component in large-scale industrial manufacturing./能够发现有缺陷的零件是大规模工业制造中的一个关键组成部分。

论文摘要：Being able to spot defective parts is a critical component in large-scale industrial manufacturing. A particular challenge that we address in this work is the cold-start problem: fit a model using nominal (non-defective) example images only. While handcrafted solutions per class are possible, the goal is to build systems that work well simultaneously on many different tasks automatically. The best performing approaches combine embeddings from ImageNet models with an outlier detection model. In this paper, we extend on this line of work and propose \textbf{PatchCore}, which uses a maximally representative memory bank of nominal patch-features. PatchCore offers competitive inference times while achieving state-of-the-art performance for both detection and localization. On the challenging, widely used MVTec AD benchmark PatchCore achieves an image-level anomaly detection AUROC score of up to 99.6%, more than halving the error compared to the next best competitor. We further report competitive results on two additional datasets and also find competitive results in the few samples regime.\freefootnote{∗ Work done during a research internship at Amazon AWS.} Code:http://github.com/amazon-research/patchcore-inspection .

能够发现有缺陷的零件是大规模工业制造中的一个关键组成部分。我们在这项工作中解决的一个特殊挑战是冷启动问题：仅使用标称（无缺陷）示例图像拟合模型。虽然每个类都有手工制作的解决方案，但目标是构建能够自动同时在许多不同任务上工作的系统。性能最好的方法是将ImageNet模型的嵌入与异常检测模型相结合。在本文中，我们对这一工作进行了扩展，并提出了\textbf{PatchCore}，它使用具有最大代表性的标称补丁特征的内存库。PatchCore提供了有竞争力的推理时间，同时在检测和定位方面实现了最先进的性能。在这一极具挑战性的、广泛使用的MVTec AD benchmark PatchCore上，图像级异常检测AUROC得分高达99.6%，与下一个最佳竞争对手相比，误差减少了一半以上。我们进一步报告了另外两个数据集的竞争结果，并在少数样本制度中发现了竞争结果。

论文：FedBN: Federated Learning on Non-IID Features via Local Batch Normalization

论文标题：FedBN: Federated Learning on Non-IID Features via Local Batch Normalization

论文时间：ICLR 2021

所属领域：Computer Vision/计算机视觉

对应任务：Autonomous Driving，Federated Learning，自主驾驶、联邦学习

论文地址：https://arxiv.org/abs/2102.07623

代码实现：https://github.com/adap/flower,https://github.com/med-air/FedBN , https://github.com/TsingZ0/PFL-Non-IID

论文作者：Xiaoxiao Li, Meirui Jiang, Xiaofei Zhang, Michael Kamp, Qi Dou

论文简介：The emerging paradigm of federated learning (FL) strives to enable collaborative training of deep models on the network edge without centrally aggregating raw data and hence improving data privacy./新兴的联邦学习 (FL) 范式致力于在网络边缘进行深度模型的协作训练，而无需集中聚合原始数据，从而提高数据隐私。

论文摘要：The emerging paradigm of federated learning (FL) strives to enable collaborative training of deep models on the network edge without centrally aggregating raw data and hence improving data privacy. In most cases, the assumption of independent and identically distributed samples across local clients does not hold for federated learning setups. Under this setting, neural network training performance may vary significantly according to the data distribution and even hurt training convergence. Most of the previous work has focused on a difference in the distribution of labels or client shifts. Unlike those settings, we address an important problem of FL, e.g., different scanners/sensors in medical imaging, different scenery distribution in autonomous driving (highway vs. city), where local clients store examples with different distributions compared to other clients, which we denote as feature shift non-iid. In this work, we propose an effective method that uses local batch normalization to alleviate the feature shift before averaging models. The resulting scheme, called FedBN, outperforms both classical FedAvg, as well as the state-of-the-art for non-iid data (FedProx) on our extensive experiments. These empirical results are supported by a convergence analysis that shows in a simplified setting that FedBN has a faster convergence rate than FedAvg. Code is available at https://github.com/med-air/FedBN .

新兴的联邦学习 (FL) 范式致力于在网络边缘进行深度模型的协作训练，而无需集中聚合原始数据，从而提高数据隐私。在大多数情况下，跨本地客户端的独立且相同分布的样本的假设不适用于联邦学习设置。在这种设置下，神经网络的训练性能可能会根据数据分布而有很大差异，甚至会损害训练的收敛性。之前的大部分工作都集中在标签分布或客户转移的差异上。与这些设置不同，我们解决了 FL 的一个重要问题，例如，医学成像中的不同扫描仪/传感器，自动驾驶中不同的风景分布（高速公路与城市），本地客户端存储的示例与其他客户端相比具有不同的分布，我们表示为特征转移非独立同分布。在这项工作中，我们提出了一种有效的方法，该方法使用局部批量归一化来缓解平均模型之前的特征偏移。由此产生的方案，称为 FedBN，在我们广泛的实验中优于经典的 FedAvg，以及非独立同分布数据 (FedProx) 的最新技术。这些实证结果得到了收敛分析的支持，该分析在简化的设置中显示 FedBN 的收敛速度比 FedAvg 更快。

论文：Green Hierarchical Vision Transformer for Masked Image Modeling

论文标题：Green Hierarchical Vision Transformer for Masked Image Modeling

论文时间：26 May 2022

所属领域：Computer Vision/计算机视觉

对应任务：bject Detection，目标检测，物体检测

论文地址：https://arxiv.org/abs/2205.13515

代码实现：https://github.com/layneh/greenmim

论文作者：Lang Huang, Shan You, Mingkai Zheng, Fei Wang, Chen Qian, Toshihiko Yamasaki

论文简介：We present an efficient approach for Masked Image Modeling (MIM) with hierarchical Vision Transformers (ViTs), e. g., Swin Transformer, allowing the hierarchical ViTs to discard masked patches and operate only on the visible ones./我们提出了一种使用分层视觉Transformers (ViT) 进行掩蔽图像建模 (MIM) 的有效方法，例如Swin Transformer，允许分层 ViT 丢弃掩码补丁并仅对可见补丁进行操作。

论文摘要：We present an efficient approach for Masked Image Modeling (MIM) with hierarchical Vision Transformers (ViTs), e.g., Swin Transformer, allowing the hierarchical ViTs to discard masked patches and operate only on the visible ones. Our approach consists of two key components. First, for the window attention, we design a Group Window Attention scheme following the Divide-and-Conquer strategy. To mitigate the quadratic complexity of the self-attention w.r.t. the number of patches, group attention encourages a uniform partition that visible patches within each local window of arbitrary size can be grouped with equal size, where masked self-attention is then performed within each group. Second, we further improve the grouping strategy via the Dynamic Programming algorithm to minimize the overall computation cost of the attention on the grouped patches. As a result, MIM now can work on hierarchical ViTs in a green and efficient way. For example, we can train the hierarchical ViTs about 2.7× faster and reduce the GPU memory usage by 70%, while still enjoying competitive performance on ImageNet classification and the superiority on downstream COCO object detection benchmarks. Code and pre-trained models have been made publicly available at https://github.com/LayneH/GreenMIM .

我们提出了一种使用分层视觉Transformer (ViT) 进行掩蔽图像建模 (MIM) 的有效方法，例如 Swin Transformer，允许分层 ViT 丢弃掩蔽补丁并仅对可见补丁进行操作。我们的方法包括两个关键部分。首先，对于窗口注意力，我们按照分治策略设计了一个组窗口注意力方案。为了减轻 self-attention w.r.t. 的二次复杂度。补丁的数量，组注意鼓励统一分区，可以将任意大小的每个局部窗口内的可见补丁分组为相同大小，然后在每个组中执行掩码自注意。其次，我们通过动态规划算法进一步改进了分组策略，以最小化分组块上注意力的总体计算成本。因此，MIM 现在可以以绿色高效的方式处理分层 ViT。例如，我们可以将分层 ViT 的训练速度提高约 2.7 倍，并将 GPU 内存使用量减少 70%，同时在 ImageNet 分类上仍享有有竞争力的性能以及在下游 COCO 对象检测基准上的优势。

论文：Deep Video Harmonization with Color Mapping Consistency

论文标题：Deep Video Harmonization with Color Mapping Consistency

论文时间：2 May 2022

所属领域：Computer Vision/计算机视觉

对应任务：Video Harmonization/视频协调

论文地址：https://arxiv.org/abs/2205.00687

代码实现：https://github.com/bcmi/video-harmonization-dataset-hyoutube

论文作者：Xinyuan Lu, Shengyuan Huang, Li Niu, Wenyan Cong, Liqing Zhang

论文简介：Video harmonization aims to adjust the foreground of a composite video to make it compatible with the background./视频协调旨在调整合成视频的前景，使其与背景兼容。

论文摘要：Video harmonization aims to adjust the foreground of a composite video to make it compatible with the background. So far, video harmonization has only received limited attention and there is no public dataset for video harmonization. In this work, we construct a new video harmonization dataset HYouTube by adjusting the foreground of real videos to create synthetic composite videos. Moreover, we consider the temporal consistency in video harmonization task. Unlike previous works which establish the spatial correspondence, we design a novel framework based on the assumption of color mapping consistency, which leverages the color mapping of neighboring frames to refine the current frame. Extensive experiments on our HYouTube dataset prove the effectiveness of our proposed framework. Our dataset and code are available at https://github.com/bcmi/Video-Harmonization-Dataset-HYouTube .

视频协调旨在调整复合视频的前景，使其与背景兼容。到目前为止，视频协调只受到有限的关注，并且没有用于视频协调的公共数据集。在这项工作中，我们通过调整真实视频的前景来创建合成合成视频，构建了一个新的视频协调数据集 HYouTube。此外，我们考虑了视频协调任务中的时间一致性。与建立空间对应关系的先前工作不同，我们设计了一个基于颜色映射一致性假设的新颖框架，该框架利用相邻帧的颜色映射来细化当前帧。在我们的 HYouTube 数据集上进行的大量实验证明了我们提出的框架的有效性。

论文：Extracting Triangular 3D Models, Materials, and Lighting From Images

论文标题：Extracting Triangular 3D Models, Materials, and Lighting From Images

论文时间：24 Nov 2021

所属领域：Computer Vision/计算机视觉

论文地址：https://arxiv.org/abs/2111.12503

代码实现：https://github.com/NVlabs/nvdiffrec , https://github.com/nvlabs/tiny-cuda-nn

论文作者：Jacob Munkberg, Jon Hasselgren, Tianchang Shen, Jun Gao, Wenzheng Chen, Alex Evans, Thomas Müller, Sanja Fidler

论文简介：We present an efficient method for joint optimization of topology, materials and lighting from multi-view image observations.

论文摘要：We present an efficient method for joint optimization of topology, materials and lighting from multi-view image observations. Unlike recent multi-view reconstruction approaches, which typically produce entangled 3D representations encoded in neural networks, we output triangle meshes with spatially-varying materials and environment lighting that can be deployed in any traditional graphics engine unmodified. We leverage recent work in differentiable rendering, coordinate-based networks to compactly represent volumetric texturing, alongside differentiable marching tetrahedrons to enable gradient-based optimization directly on the surface mesh. Finally, we introduce a differentiable formulation of the split sum approximation of environment lighting to efficiently recover all-frequency lighting. Experiments show our extracted models used in advanced scene editing, material decomposition, and high quality view interpolation, all running at interactive rates in triangle-based renderers (rasterizers and path tracers). Project website: https://nvlabs.github.io/nvdiffrec/ .

我们提出了一种从多视图图像观察中联合优化拓扑、材料和照明的有效方法。与最近的多视图重建方法（通常产生在神经网络中编码的纠缠 3D 表示）不同，我们输出的三角形网格具有空间变化的材料和环境照明，可以在未经修改的任何传统图形引擎中部署。我们利用最近在可微渲染、基于坐标的网络中的工作来紧凑地表示体积纹理，以及可微行进四面体以直接在表面网格上实现基于梯度的优化。最后，我们引入了环境照明的分裂和近似的可微公式，以有效地恢复全频照明。实验表明我们提取的模型用于高级场景编辑、材质分解和高质量视图插值，所有这些模型都在基于三角形的渲染器（光栅化器和路径跟踪器）中以交互速率运行。

论文：6D Rotation Representation For Unconstrained Head Pose Estimation

论文标题：6D Rotation Representation For Unconstrained Head Pose Estimation

论文时间：25 Feb 2022

所属领域：Computer Vision/计算机视觉

对应任务：Head Pose Estimation，Pose Estimation，Pose Prediction，头部姿势估计，姿势估计，姿势预测

论文地址：https://arxiv.org/abs/2202.12555

代码实现：https://github.com/thohemp/6drepnet

论文作者：Thorsten Hempel, Ahmed A. Abdelrahman, Ayoub Al-Hamadi

论文简介：In this paper, we present a method for unconstrained end-to-end head pose estimation./本文提出了一种无约束端到端头位姿估计方法。

论文摘要：In this paper, we present a method for unconstrained end-to-end head pose estimation. We address the problem of ambiguous rotation labels by introducing the rotation matrix formalism for our ground truth data and propose a continuous 6D rotation matrix representation for efficient and robust direct regression. This way, our method can learn the full rotation appearance which is contrary to previous approaches that restrict the pose prediction to a narrow-angle for satisfactory results. In addition, we propose a geodesic distance-based loss to penalize our network with respect to the SO(3) manifold geometry. Experiments on the public AFLW2000 and BIWI datasets demonstrate that our proposed method significantly outperforms other state-of-the-art methods by up to 20%. We open-source our training and testing code along with our pre-trained models: https://github.com/thohemp/6DRepNet .

在本文中，我们提出了一种无约束的端到端头部姿态估计方法。我们通过为我们的地面实况数据引入旋转矩阵形式来解决模糊旋转标签的问题，并提出一个连续的 6D 旋转矩阵表示，以实现高效和稳健的直接回归。这样，我们的方法可以学习完整的旋转外观，这与以前将姿势预测限制在窄角以获得令人满意的结果的方法相反。此外，我们提出了一种基于测地距离的损失来惩罚我们的网络关于 SO(3) 流形几何。在公共 AFLW2000 和 BIWI 数据集上的实验表明，我们提出的方法显着优于其他最先进的方法高达 20%。

论文：Pseudo Numerical Methods for Diffusion Models on Manifolds

论文标题：Pseudo Numerical Methods for Diffusion Models on Manifolds

论文时间：ICLR 2022

所属领域：Computer Vision/计算机视觉

对应任务：Denoising，Image Generation，去噪，图像生成

论文地址：https://arxiv.org/abs/2202.09778

代码实现：https://github.com/luping-liu/PNDM , https://github.com/compvis/latent-diffusion , https://github.com/voletiv/mcvd-pytorch

论文作者：Luping Liu, Yi Ren, Zhijie Lin, Zhou Zhao

论文简介：Under such a perspective, we propose pseudo numerical methods for diffusion models (PNDMs)./去噪扩散概率模型（DDPM）可以生成高质量的样本，如图像和音频样本，我们提出了用于扩散模型（PNDM）的伪数值方法。

论文摘要：Denoising Diffusion Probabilistic Models (DDPMs) can generate high-quality samples such as image and audio samples. However, DDPMs require hundreds to thousands of iterations to produce final samples. Several prior works have successfully accelerated DDPMs through adjusting the variance schedule (e.g., Improved Denoising Diffusion Probabilistic Models) or the denoising equation (e.g., Denoising Diffusion Implicit Models (DDIMs)). However, these acceleration methods cannot maintain the quality of samples and even introduce new noise at a high speedup rate, which limit their practicability. To accelerate the inference process while keeping the sample quality, we provide a fresh perspective that DDPMs should be treated as solving differential equations on manifolds. Under such a perspective, we propose pseudo numerical methods for diffusion models (PNDMs). Specifically, we figure out how to solve differential equations on manifolds and show that DDIMs are simple cases of pseudo numerical methods. We change several classical numerical methods to corresponding pseudo numerical methods and find that the pseudo linear multi-step method is the best in most situations. According to our experiments, by directly using pre-trained models on Cifar10, CelebA and LSUN, PNDMs can generate higher quality synthetic images with only 50 steps compared with 1000-step DDIMs (20x speedup), significantly outperform DDIMs with 250 steps (by around 0.4 in FID) and have good generalization on different variance schedules. Our implementation is available at https://github.com/luping-liu/PNDM .

去噪扩散概率模型 (DDPM) 可以生成高质量的样本，例如图像和音频样本。但是，DDPM 需要数百到数千次迭代才能产生最终样本。一些先前的工作通过调整方差计划（例如，改进的去噪扩散概率模型）或去噪方程（例如，去噪扩散隐式模型（DDIM））成功地加速了 DDPM。然而，这些加速方法无法保持样本质量，甚至在高速加速时引入新的噪声，限制了它们的实用性。为了在保持样本质量的同时加速推理过程，我们提供了一个全新的观点，即 DDPM 应该被视为求解流形上的微分方程。在这种观点下，我们提出了扩散模型（PNDM）的伪数值方法。具体来说，我们弄清楚了如何求解流形上的微分方程，并表明 DDIM 是伪数值方法的简单案例。我们将几种经典数值方法改为相应的伪数值方法，发现伪线性多步法在大多数情况下是最好的。根据我们的实验，通过直接在 Cifar10、CelebA 和 LSUN 上使用预训练模型，与 1000 步 DDIM（20 倍加速）相比，PNDM 只需 50 步即可生成更高质量的合成图像，显着优于 250 步的 DDIM（约FID 中为 0.4），并且对不同的方差计划具有良好的泛化性。

论文：Hierarchical Text-Conditional Image Generation with CLIP Latents

论文标题：Hierarchical Text-Conditional Image Generation with CLIP Latents

论文时间：13 Apr 2022

所属领域：Computer Vision/计算机视觉

对应任务：Conditional Image Generation，Image Generation，Text-to-Image Generation，Zero-Shot Text-to-Image Generation，条件图像生成，图像生成，文本到图像生成，零样本文本到图像生成

论文地址：https://arxiv.org/abs/2204.06125

代码实现：https://github.com/lucidrains/DALLE2-pytorch

论文作者：Aditya Ramesh, Prafulla Dhariwal, Alex Nichol, Casey Chu, Mark Chen

论文简介：Contrastive models like CLIP have been shown to learn robust representations of images that capture both semantics and style./像CLIP这样的对比模型已经被证明可以学习捕获语义和风格的图像的健壮表示。

论文摘要：Contrastive models like CLIP have been shown to learn robust representations of images that capture both semantics and style. To leverage these representations for image generation, we propose a two-stage model: a prior that generates a CLIP image embedding given a text caption, and a decoder that generates an image conditioned on the image embedding. We show that explicitly generating image representations improves image diversity with minimal loss in photorealism and caption similarity. Our decoders conditioned on image representations can also produce variations of an image that preserve both its semantics and style, while varying the non-essential details absent from the image representation. Moreover, the joint embedding space of CLIP enables language-guided image manipulations in a zero-shot fashion. We use diffusion models for the decoder and experiment with both autoregressive and diffusion models for the prior, finding that the latter are computationally more efficient and produce higher-quality samples.

像 CLIP 这样的对比模型已被证明可以学习捕捉语义和风格的图像的鲁棒表示。为了利用这些表示来生成图像，我们提出了一个两阶段模型：一个先验生成一个给定文本标题的 CLIP 图像嵌入，一个解码器生成以图像嵌入为条件的图像。我们表明，显式生成图像表示可以提高图像多样性，同时在照片真实感和标题相似性方面的损失最小。我们以图像表示为条件的解码器还可以生成图像的变体，同时保留其语义和风格，同时改变图像表示中缺少的非必要细节。此外，CLIP 的联合嵌入空间能够以零镜头方式进行语言引导的图像操作。我们对解码器使用扩散模型，并对先验模型使用自回归模型和扩散模型进行实验，发现后者在计算上更高效，并产生更高质量的样本。

我们是 ShowMeAI，致力于传播AI优质内容，分享行业解决方案，用知识加速每一次技术成长！点击查看 历史文章列表，在公众号内订阅话题 #ShowMeAI资讯日报，可接收每日最新推送。点击 专题合辑&电子月刊 快速浏览各专题全集。点击这里回复关键字日报免费获取AI电子月刊与资料包。

作者：韩信子@ShowMeAI
历史文章列表
专题合辑&电子月刊
欢迎回复，拜托点赞，留言推荐中有价值的文章、工具或建议，我们都会尽快回复哒~

你可能感兴趣的:(ShowMeAI资讯日报,首席AI资讯收纳官,人工智能,计算机视觉,机器学习,深度学习,自然语言处理)

最新虚拟串口 Virtual Serial Port Driver V11.0.1068 已经汉化中游鱼虚拟串口汉化虚拟串口 VSPD11.0.1047
最新虚拟串口VirtualSerialPortDriverV11.0.1068已经汉化1、简介1.1、项目技术分析1.2、项目及技术应用场景1.3、项目特点1.4、总结2、软件功能2.1、创建任意数量的虚拟串口对（pairs）2.2、回环(loopback)端口捆绑2.3、串口分割（Splitting）2.4、结合COM端口（Joining）2.5、创建捆绑连接（bundles）2.6、自动切换端
DNS考点
在网络工程师、系统工程师、运维工程师、安全工程师等岗位的面试中，DNS（DomainNameSystem，域名系统）是高频必考知识点。DNS作为互联网的“电话簿”，负责将人类可读的域名（如www.example.com）解析为机器可识别的IP地址（如192.0.2.1），是网络通信的基础组件。以下是系统化的核心考点梳理，涵盖DNS基础概念、工作原理、协议细节及应聘高频问题。一、DNS基础考点1.D
【狂神说JAVA】JVM快速入门-1 Jackson Cortex jvm java
链接http://player.bilibili.com/player.html?aid=76728711&bvid=BV1iJ411d7jS&cid=131232435&page=1http://player.bilibili.com/player.html?aid=76728711&bvid=BV1iJ411d7jS&cid=131232435&page=1内容一、探究JVM0、面试题谈谈对J
Agent架构与工作原理：理解智能体的核心机制 hdzw20 agent学习 ai 机器学习 agent 智能体
Agent架构与工作原理：深入理解智能体的核心机制AIAgent的核心组成部分一个完整的AIAgent通常由以下几个核心模块组成：1.规划模块（PlanningModule）规划模块是Agent的"大脑"，负责制定行动策略。它接收目标任务，分析当前状态，并制定一系列行动计划。规划可以是：短期规划：针对当前步骤的即时决策长期规划：面向整体目标的战略性规划动态规划：根据执行结果实时调整计划2.记忆模块
Python训练 + Go优化 + C#部署：端到端AI模型的跨语言实践威哥说编程人工智能学习资料库 python golang c#
在现代AI应用中，如何高效地训练、优化、并最终部署AI模型是一项复杂且具有挑战性的任务。在这一过程中，选择合适的编程语言和工具可以显著提高效率和系统的性能。Python作为AI领域的主流语言，具有丰富的深度学习框架（如PyTorch和TensorFlow），在模型训练方面处于领先地位。然而，针对计算密集型任务（如数据预处理、加密等），Go语言因其高效的并发处理和出色的性能，成为优化计算的理想选择。
nginx 配置 https http R_miss nginx https http
nginx配置https域名访问参考文档https://blog.csdn.net/heng_yan/article/details/938740351.域名已经分配好这时需要和项目进行关联，能通过域名访问连接调通分配的域名：https://xxx.com2个证书文件：xxx.key文件,xxx.pem证书放在服务器上的使用本地命令把文件放在服务器上2.进入liunx服务器先查询服务器是否配置过n
【PGCCC】PostgreSQL 18 Beta 1发布，有哪些亮点？ PGCCC-PostgeSQL培训认证 postgresql 数据库
PostgreSQL全球开发组于2025年5月8日发布了第一个PostgreSQL18Beta版本，现已开放下载。虽然细节可能会有所改变，但是该版本包含了PostgreSQL18最终正式版中所有新功能的预览。以下是PostgreSQL18引入的部分关键功能亮点。性能优化异步I/O（AIO），通过全新的异步I/O子系统提升I/O吞吐量并隐藏延迟。Linux系统可使用io_uring，其他平台则提供基
程序是如何生成的-以c语言为例
一，序言从代码到能跑的程序，整个过程就像“把外文翻译成母语，再组装成能直接用的东西”，一步步来更清楚：源代码（程序员写的代码，如C语言文件）↓预处理（处理#开头的命令，如#include、#define）↓编译（把预处理后的代码转成汇编语言）↓汇编（把汇编语言转成二进制机器码，生成目标文件，如main.o）↓链接（合并多个目标文件和库文件，解决函数/变量地址问题）↓可执行文件（生成能直接运行的文件
2023-01-04 我们的民谣2022——音乐的纯粹与感情的唤起 Amy艾米的星空
ai奇艺的音乐综艺一直做的不错，从《我是唱作人》到《乐队的夏天》，留下了很多经典的片段和歌曲。2022年年底开启的《我们的民谣2022》也妥妥地戳中了大部分爱音乐人的心窝。搞音乐创作的，或者通俗的说，唱歌的人，都很纯粹。因为音乐是感情的抒发，没有充沛的感情，没有敏感的心灵，很难创作出经典的作品，引起听者的共鸣。像乐队的夏天里面，很多乐队的人都真性情，很有个性。正因为他们能够保持自己的独特性，他们的
乐惠国际怎么去学习操作技巧？该怎么分辨是否安全？御老师
微交易市场形式千变万化，稍有不慎就会导致亏损，为了把握盈利机会，最大限度降低风险，对基本面进行分析是必做功课。微交易中的基本面，指的是各种重大新闻、财政热点，这些动态资讯与市场行情走势息息相关，需要重点关注。那么，分析消息面时要注意哪些事项?搜索【庞老师微信：wtz677】一起学习盈利技巧一、注意资讯的时效性时效性是新闻的生命，直接关系到新闻信息的价值。在互联网时代，投资人可以突破地域限制，快速获
apache ignite系列（二）：配置 weixin_30521161
ignite有两种配置方式，一种是基于XML文件的配置，一种是基于JAVA代码的配置：这里将ignite常用的配置集中罗列出来了，一般建议使用xml配置。1，基于XML的配置-->org.cord.*-->java.lang.Longcom.palic.demo.data.domain.CommRate-->-->-->-->-->-->-->-->-->-->-->127.0.0.1:48500
大模型(LLM)推理框架汇总 AIGC大模型吱屋猪 langchain 人工智能 AI-native 百度产品经理神经网络自然语言处理
MLCLLMsubmodulesinMLCLLM大模型(LLM)好性能通用部署方案，陈天奇(tvm发起者)团队开发.项目链接docs:https://llm.mlc.ai/docs/github:https://github.com/mlc-ai/mlc-llm支持的平台和硬件platforms&hardware支持的模型|Architecture|PrebuiltModelVariants||—
Flutter基础（前端教程①⑦-Column竖直-Row水平-Warp包裹-Stack堆叠） aaiier Flutter flutter
MainAxisAlignment是一个枚举类，用于控制主轴（MainAxis）方向上子组件的排列和对齐方式。MainAxisAlignment的常用取值及效果：MainAxisAlignment.start子组件沿主轴的起点对齐（Row左对齐，Column顶部对齐）MainAxisAlignment.end子组件沿主轴的终点对齐（Row右对齐，Column底部对齐）MainAxisAlignme
DL00478-涡轮叶片缺陷检测数据集yolo格式1300张左右
涡轮叶片缺陷检测数据集yolo格式1300张左右涡轮叶片缺陷检测数据集YOLO格式解析：提升研究与论文写作的关键要点在研究涡轮叶片缺陷检测的过程中，数据集的选择和格式处理是一个至关重要的环节。特别是当你打算通过卷积神经网络（CNN）等深度学习模型进行缺陷检测时，数据集的标注和格式化直接影响到模型的训练效果和论文的质量。本文将重点探讨涡轮叶片缺陷检测数据集的YOLO格式，并分析如何利用这一格式为研究
婚礼前三天，男友跟白月光官宣(程月林琛江婉仪)全本完结小说_小说完结免费婚礼前三天，男友跟白月光官宣(程月林琛江婉仪) 绾绾呐
小说：《婚礼前三天，男友跟白月光官宣》主角：程月林琛江婉仪简介：我和林琛恋爱六年。婚礼前三天，他却发了跟白月光官宣的朋友圈。我转头找了个男大学生扯证。静静看着他若无其事地表演。婚礼当天我换了新郎，他却疯了。晚上十点，婚庆公司又一次打来电话催我选婚纱方案。我点开聊天框才发现，早上给林琛发去问他意见的消息到现在还没回复。电话打过去却提示对方已经关机。估摸着他是忙着参加朋友为他举办的单身派对，我也没多想
小红书之城：移动互联网社区构架产品如何实现自我迭代 AlanBai
“「一座虚拟的城市」，小红书这样定义自己的社区平台。在这座花费五年时间搭建起来的「城市」里，超过一亿用户就像居民，「潮起潮落，人来人往」，而小红书的思考，也围绕着如何吸引更多的「居民」，留下那些旅途中经过的「游客」，以及如何守住自己的「城市精神」展开。”在极客公园Rebuild2018科技创新峰会上，小红书首席产品官邓超发表了主题为《关于互联网社区的再定义与新发现——如何打造年轻人聚集的生活方式社
web登录注册页面 m0_67391518 面试学习路线阿里巴巴前端 java html mysql 数据库
目录web登录注册页面效果图结构图Java代码User.javaUserMapper.javaIndexServlet.javaRegisterServlet.javaDButil.javaxml配置文件mybatis-config.xmldb.propertiesweb.xmlhtml与cssindex.jspindex.cssregister.htmlregister.css文章目录web登录
边缘计算监控突围：Prometheus在5G MEC环境中的瘦身方案
作者：开源大模型智能运维FreeAiOps引言：5GMEC场景下的监控挑战与机遇随着5G多接入边缘计算（MEC）的普及，监控系统面临前所未有的挑战：资源碎片化：边缘节点通常部署在资源受限的硬件上（如ARM服务器、工业网关），CPU和内存容量仅为传统云服务器的1/5网络波动性：MEC设备常位于基站侧或工厂车间，面临高丢包率（5%-15%）和间歇性断网问题数据爆炸：单台MEC设备可能承载数百个物联网终
京东零售重磅开源 | OxyGent：像搭乐高一样组装AI团队，实现群体智能京东零售技术零售开源人工智能
京东零售Oxygen团队正式开源发布多智能体协作框架——OxyGent。这一创新框架致力于帮助开发者高效组装多智能体协作系统，实现智能体间的无缝协作、弹性扩展与全链路可追溯。推动人工智能从“单点突破”迈向“群体智能”时代。OxyGent已在开源社区正式上线。开源地址：https://github.com/jd-opensource/OxyGent官网地址：https://oxygent.jd.co
具身智能的视觉-语言导航综述
24年2月来自曲阜师范、华东师大和哈工大的论文“Vision-LanguageNavigationwithEmbodiedIntelligence:ASurvey”。作为人工智能领域的长期愿景，具身智能的核心目标是提升智体与环境的感知、理解和交互能力。视觉-语言导航（VLN）作为实现具身智能的重要研究路径，致力于探索智体如何利用自然语言与人进行有效沟通，接收并理解指令，并最终依靠视觉信息实现精准导
Android UI 组件系列（五）：CheckBox、RadioButton 与 Switch 控件详解
博客专栏：Android初级入门UI组件与布局源码：通过网盘分享的文件：Android入门布局及UI相关案例链接:https://pan.baidu.com/s/1EOuDUKJndMISolieFSvXXg?pwd=4k9n提取码:4k9n引言在Android开发中，用户与应用的交互往往离不开各种“选择”操作，例如：注册表单中选择兴趣爱好（可多选）设置界面中切换通知、Wi-Fi开关（开/关状态）
具身智能：从理论到实践的跨越
具身智能（EmbodiedAI）的概念起源与发展是一个跨越半个多世纪的学术探索历程，其核心思想在不同学科的交叉碰撞中逐渐成型。以下从理论源头、技术奠基、术语演进三个维度展开解析，揭示这一概念的学术脉络与产业价值：一、理论源头：从图灵的哲学构想到认知科学的具身化转向1.图灵的"感官机器"设想（1950年）在人工智能奠基性论文《计算机器与智能》中，图灵提出了两种智能发展路径：抽象计算路径：如国际象棋等
聊聊artemis的SlowConsumerReaperRunnable go4it
序本文主要研究一下artemis的SlowConsumerReaperRunnableSlowConsumerPolicyactivemq-artemis-2.11.0/artemis-server/src/main/java/org/apache/activemq/artemis/core/settings/impl/SlowConsumerPolicy.javapublicenumSlowCo
PyCharm高效入门指南：从零开始掌握Python开发利器软考和人工智能学堂 Python开发经验强化学习 PyCharm
引言PyCharm是JetBrains公司推出的一款强大的Python集成开发环境(IDE)，被全球数百万Python开发者所青睐。无论你是Python初学者还是经验丰富的开发者，掌握PyCharm都能显著提升你的开发效率。本文将带你从零开始，全面了解PyCharm的核心功能和使用技巧。1.PyCharm的安装与配置1.1下载与安装首先访问JetBrains官网下载PyCharm。PyCharm有
家庭服务具身智能机器人体系架构
硬件方面：差速移动机器人+六轴协作机械臂，软件方面选择ROS系统：底盘控制move_group，机械臂操纵MoveIt，大模型方面采用VLM+LLM：（1）视觉语言模型（VLM），用来实现环境理解与指令解析，候选模型为LLaVA和Qwen-VL。微调VLM需要2~4周，工作量主要是准备环境数据和标注期望输出。（2）大语言模型（LLM），用来实现任务分解与技能调用，候选工具有LangChain（任务
开源模型应用落地-qwen模型小试-Qwen2.5-7B-Instruct-玩转ollama（一）开源技术探险家开源模型-实际应用落地 #深度学习自然语言处理语言模型
一、前言在AI大模型百花齐放的时代，很多人都对新兴技术充满了热情，都想尝试一下。然而，实际上要入门AI技术的门槛非常高。除了需要高端设备，还需要面临复杂的部署和安装过程，这让很多人望而却步。在这样的背景下，Ollama的出现为广大开发者和爱好者提供了一条便捷的道路，极大地降低了应用机器学习的门槛。Ollama的优势在于其极致的简化。通过这个平台，用户可以轻松下载、运行和管理各种机器学习模型，而无需
android tabLayout 切换fragment fragment生命周期 mmsx Android 常用开发技术 android tab TabLayout fragment
1、TabLayout与Fragment结合使用的常见方式通常会使用FragmentPagerAdapter或FragmentStatePagerAdapter与ViewPager配合，再将TabLayout与ViewPager关联，实现通过TabLayout切换Fragment。以下是布局文件示例activity_main.xml：
【MoodVine】DeepSeek聊天持久化（2）：Spring AI + Redis实现对话记忆管理一只鱼吖【西瓜和晚霞】MoodVine spring redis java
在上一篇文章中，我们介绍了如何引入SpringAI，本文将深入探讨如何实现聊天记录的持久化存储。一、初始方案：内存存储的局限性在项目初期，我们使用简单的内存存储实现聊天记录管理：创建ChatController@RestController@RequestMapping("/chat")publicclassChatController{privatefinalOllamaChatModeloll
C练题笔记之：牛客-HJ012.字符串反转
题目：描述接受一个只包含小写字母的字符串，然后输出该字符串反转后的字符串。（字符串长度不超过1000）输入描述：输入一行，为一个只包含小写字母的字符串。输出描述：输出该字符串反转后的字符串。示例1输入：abcd复制输出：dcba结果：解题思路：获取字符串，用双指针，一头一尾开始交换，直至到中间。代码：#include#includeintmain(){charstr[1024]={};scanf(
牛客 - 倒置字符串(java)
题目解题思路解题代码题链接题目解题思路解题代码importjava.util.*;publicclassMain{//定义翻转字符数组的方法publicstaticvoidreverse(char[]arr,intstart,intend){while(start
Linux的Initrd机制被触发 linux
Linux 的 initrd 技术是一个非常普遍使用的机制，linux2.6 内核的 initrd 的文件格式由原来的文件系统镜像文件转变成了 cpio 格式，变化不仅反映在文件格式上， linux 内核对这两种格式的 initrd 的处理有着截然的不同。本文首先介绍了什么是 initrd 技术，然后分别介绍了 Linux2.4 内核和 2.6 内核的 initrd 的处理流程。最后通过对 Lin
maven本地仓库路径修改 bitcarter maven
默认maven本地仓库路径：C:\Users\Administrator\.m2 修改maven本地仓库路径方法： 1.打开E:\maven\apache-maven-2.2.1\conf\settings.xml 2.找到
XSD和XML中的命名空间 darrenzhu xml xsd schema namespace 命名空间
http://www.360doc.com/content/12/0418/10/9437165_204585479.shtml http://blog.csdn.net/wanghuan203/article/details/9203621 http://blog.csdn.net/wanghuan203/article/details/9204337 http://www.cn
Java 求素数运算周凡杨 java 算法素数
网络上对求素数之解数不胜数，我在此总结归纳一下，同时对一些编码，加以改进，效率有成倍热提高。第一种：原理: 6N(+-)1法任何一个自然数，总可以表示成为如下的形式之一： 6N，6N+1，6N+2，6N+3，6N+4，6N+5 (N=0，1，2，…)
java 单例模式 g21121 java
想必单例模式大家都不会陌生，有如下两种方式来实现单例模式： class Singleton { private static Singleton instance=new Singleton(); private Singleton(){} static Singleton getInstance() { return instance; }
Linux下Mysql源码安装 510888780 mysql
1.假设已经有mysql-5.6.23-linux-glibc2.5-x86_64.tar.gz (1)创建mysql的安装目录及数据库存放目录解压缩下载的源码包，目录结构，特殊指定的目录除外：
32位和64位操作系统墙头上一根草 32位和64位操作系统
32位和64位操作系统是指：CPU一次处理数据的能力是32位还是64位。现在市场上的CPU一般都是64位的，但是这些CPU并不是真正意义上的64 位CPU，里面依然保留了大部分32位的技术，只是进行了部分64位的改进。32位和64位的区别还涉及了内存的寻址方面，32位系统的最大寻址空间是2 的32次方= 4294967296（bit）= 4（GB）左右，而64位系统的最大寻址空间的寻址空间则达到了
我的spring学习笔记10-轻量级_Spring框架 aijuans Spring 3
一、问题提问： → 请简单介绍一下什么是轻量级？轻量级（Leightweight）是相对于一些重量级的容器来说的，比如Spring的核心是一个轻量级的容器，Spring的核心包在文件容量上只有不到1M大小，使用Spring核心包所需要的资源也是很少的，您甚至可以在小型设备中使用Spring。
mongodb 环境搭建及简单CURD antlove Web Install curd NoSQL mongo
一搭建mongodb环境 1. 在mongo官网下载mongodb 2. 在本地创建目录 "D:\Program Files\mongodb-win32-i386-2.6.4\data\db" 3. 运行mongodb服务 [mongod.exe --dbpath "D:\Program Files\mongodb-win32-i386-2.6.4\data\
数据字典和动态视图百合不是茶 oracle 数据字典动态视图系统和对象权限
数据字典（data dictionary）是 Oracle 数据库的一个重要组成部分，这是一组用于记录数据库信息的只读（read-only）表。随着数据库的启动而启动,数据库关闭时数据字典也关闭数据字典中包含数据库中所有方案对象（schema object）的定义(包括表，视图，索引，簇，同义词，序列，过程，函数，包，触发器等等) 数据库为一
多线程编程一般规则 bijian1013 java thread 多线程 java多线程
如果两个工两个以上的线程都修改一个对象，那么把执行修改的方法定义为被同步的，如果对象更新影响到只读方法，那么只读方法也要定义成同步的。不要滥用同步。如果在一个对象内的不同的方法访问的不是同一个数据，就不要将方法设置为synchronized的。
将文件或目录拷贝到另一个Linux系统的命令scp bijian1013 linux unix scp
一.功能说明 scp就是security copy，用于将文件或者目录从一个Linux系统拷贝到另一个Linux系统下。scp传输数据用的是SSH协议，保证了数据传输的安全，其格式如下： scp 远程用户名@IP地址：文件的绝对路径
【持久化框架MyBatis3五】MyBatis3一对多关联查询 bit1129 Mybatis3
以教员和课程为例介绍一对多关联关系，在这里认为一个教员可以叫多门课程，而一门课程只有1个教员教，这种关系在实际中不太常见，通过教员和课程是多对多的关系。示例数据：地址表： CREATE TABLE ADDRESSES ( ADDR_ID INT(11) NOT NULL AUTO_INCREMENT, STREET VAR
cookie状态判断引发的查找问题 bitcarter form cgi
先说一下我们的业务背景： 1.前台将图片和文本通过form表单提交到后台，图片我们都做了base64的编码，并且前台图片进行了压缩 2.form中action是一个cgi服务 3.后台cgi服务同时供PC，H5，APP 4.后台cgi中调用公共的cookie状态判断方法（公共的，大家都用，几年了没有问题）问题：（折腾两天。。。。） 1.PC端cgi服务正常调用，cookie判断没
通过Nginx,Tomcat访问日志(access log)记录请求耗时 ronin47
一、Nginx通过$upstream_response_time $request_time统计请求和后台服务响应时间 nginx.conf使用配置方式： log_format main '$remote_addr - $remote_user [$time_local] "$request" ''$status $body_bytes_sent "$http_r
java-67- n个骰子的点数。把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 bylijinnan java
public class ProbabilityOfDice { /** * Q67 n个骰子的点数 * 把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 * 在以下求解过程中，我们把骰子看作是有序的。 * 例如当n=2时，我们认为（1，2）和（2，1）是两种不同的情况 */ private stati
看别人的博客，觉得心情很好 Cb123456 博客心情
以为写博客，就是总结，就和日记一样吧，同时也在督促自己。今天看了好长时间博客: 职业规划: http://www.iteye.com/blogs/subjects/zhiyeguihua android学习: 1.http://byandby.i
[JWFD开源工作流]尝试用原生代码引擎实现循环反馈拓扑分析 comsci 工作流
我们已经不满足于仅仅跳跃一次，通过对引擎的升级，今天我测试了一下循环反馈模式，大概跑了200圈，引擎报一个溢出错误在一个流程图的结束节点中嵌入一段方程，每次引擎运行到这个节点的时候，通过实时编译器GM模块，计算这个方程，计算结果与预设值进行比较，符合条件则跳跃到开始节点，继续新一轮拓扑分析，直到遇到
JS常用的事件及方法 cwqcwqmax9 js
事件描述 onactivate 当对象设置为活动元素时触发。 onafterupdate 当成功更新数据源对象中的关联对象后在数据绑定对象上触发。 onbeforeactivate 对象要被设置为当前元素前立即触发。 onbeforecut 当选中区从文档中删除之前在源对象触发。 onbeforedeactivate 在 activeElement 从当前对象变为父文档其它对象之前立即
正则表达式验证日期格式 dashuaifu 正则表达式 IT其它 java其它
正则表达式验证日期格式 function isDate(d){ var v = d.match(/^(\d{4})-(\d{1,2})-(\d{1,2})$/i); if(!v) { this.focus(); return false; } } <input value="2000-8-8" onblu
Yii CModel.rules() 方法、validate预定义完整列表、以及说说验证 dcj3sjt126com yii
public array rules () {return} array 要调用 validate() 时应用的有效性规则。返回属性的有效性规则。声明验证规则，应重写此方法。每个规则是数组具有以下结构：array('attribute list', 'validator name', 'on'=>'scenario name', ...validation
UITextAttributeTextColor = deprecated in iOS 7.0 dcj3sjt126com ios
In this lesson we used the key "UITextAttributeTextColor" to change the color of the UINavigationBar appearance to white. This prompts a warning "first deprecated in iOS 7.0." Ins
判断一个数是质数的几种方法 EmmaZhao Math python
质数也叫素数，是只能被1和它本身整除的正整数，最小的质数是2，目前发现的最大的质数是p=2^57885161-1【注1】。判断一个数是质数的最简单的方法如下： def isPrime1(n): for i in range(2, n): if n % i == 0: return False return True 但是在上面的方法中有一些冗余的计算，所以
SpringSecurity工作原理小解读坏我一锅粥 SpringSecurity
SecurityContextPersistenceFilter ConcurrentSessionFilter WebAsyncManagerIntegrationFilter HeaderWriterFilter CsrfFilter LogoutFilter Use
JS实现自适应宽度的Tag切换 ini JavaScript html Web css html5
效果体验：http://hovertree.com/texiao/js/3.htm 该效果使用纯JavaScript代码，实现TAB页切换效果，TAB标签根据内容自适应宽度，点击TAB标签切换内容页。 HTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"
Hbase Rest API : 数据查询 kane_xie REST hbase
hbase（hadoop）是用java编写的，有些语言（例如python）能够对它提供良好的支持，但也有很多语言使用起来并不是那么方便，比如c#只能通过thrift访问。Rest就能很好的解决这个问题。Hbase的org.apache.hadoop.hbase.rest包提供了rest接口，它内嵌了jetty作为servlet容器。启动命令：./bin/hbase rest s
JQuery实现鼠标拖动元素移动位置（源码+注释）明子健 jquery js 源码拖动鼠标
欢迎讨论指正！ print.html代码： <!DOCTYPE html> <html> <head> <meta http-equiv=Content-Type content="text/html;charset=utf-8"> <title>发票打印</title> &l
Postgresql 连表更新字段语法 update qifeifei PostgreSQL
下面这段sql本来目的是想更新条件下的数据，可是这段sql却更新了整个表的数据。sql如下： UPDATE tops_visa.visa_order SET op_audit_abort_pass_date = now() FROM tops_visa.visa_order as t1 INNER JOIN tops_visa.visa_visitor as t2 ON t1.
将redis,memcache结合使用的方案? tcrct redis cache
公司架构上使用了阿里云的服务，由于阿里的kvstore收费相当高，打算自建，自建后就需要自己维护，所以就有了一个想法，针对kvstore(redis)及ocs(memcache)的特点，想自己开发一个cache层，将需要用到list，set，map等redis方法的继续使用redis来完成，将整条记录放在memcache下，即findbyid，save等时就memcache，其它就对应使用redi
开发中遇到的诡异的bug wudixiaotie bug
今天我们服务器组遇到个问题：我们的服务是从Kafka里面取出数据，然后把offset存储到ssdb中，每个topic和partition都对应ssdb中不同的key，服务启动之后，每次kafka数据更新我们这边收到消息，然后存储之后就发现ssdb的值偶尔是-2,这就奇怪了，最开始我们是在代码中打印存储的日志，发现没什么问题，后来去查看ssdb的日志，才发现里面每次set的时候都会对同一个key