旷视

CVPR 2020 | 旷视研究院提出UnrealText，从3D虚拟世界合成逼真的文字图像

IEEE国际计算机视觉与模式识别会议 CVPR 2020 (IEEE Conference on Computer Vision and Pattern Recognition) 大会官方论文结果公布，旷视研究院 16 篇论文被收录（其中含 6篇 Oral 论文），研究领域涵盖物体检测与行人再识别（尤其是遮挡场景），人脸识别，文字检测与识别，实时视频感知与推理，小样本学习，迁移学习，3D感知，GAN与图像生成，计算机图形学，语义分割，细粒度图像，对抗样本攻击等众多领域，取得多项领先的技术研究成果，这与已开放/开源的旷视AI生产力平台Brain++密不可分。

本文是CVPR 2020论文系列解读第9篇。旷视研究院研究提出了一个合成场景文字图像的创新思路，这个合成引擎可以用3D图形引擎来渲染图像，其中文字和场景可以作为整体来渲染。一系列实验结果显示出本文方法的优越性。目前代码已开源。

论文名称：UnrealText: Synthesizing Realistic Scene Text Images from the Unreal World

论文链接：https://arxiv.org/abs/2003.10608

论文代码：https://jyouhou.github.io/UnrealText/

导语

近年来，虽然文字检测与识别任务在神经网络技术的复苏下取得巨大飞跃，但这些深度学习模型也给带来了不少挑战。一方面，需要海量数据才能有效进行训练；另外，数据获取的成本十分高昂，有时还相当困难。

不仅如此，若想让模型在具体应用场景下获得不错的性能，还需要收集相应场景下的数据，这进一步加剧了数据的成本难题。因此，场景文字（scene text）任务中，数据合成及数据合成算法扮演了重要的角色。同时，数据合成还能提供大量真实数据因成本问题而不具有的详细标签信息。

目前，学界已提出多个有价值的合成算法。尤其是在场景文字识别领域，单是在合成数据上训练就已被接受为一个标准操作。然而，当一些研究员尝试用合成数据与真实数据同时训练模型时，却发现在大多数数据集上只取得了小幅性能提升。

与文字识别相反，场景文字检测领域目前仍然严重依赖真实数据。合成数据对于模型性能的提升并不必要。从现有合成器原理来看，大多比较类似。首先，系统会分析图像的背景，即使用现成的模型来进行语义分割和深度估计；然后，从分割出来的区域提取文字可能会嵌入的位置；最后，文字图像（前景）会依据估计出的深度信息来弯折、变形，嵌入背景图像。

但是问题在于，现有模型分析图像背景可能不够精准且较粗糙。如果这些误差进一步传递至文字生成模组，则会使得生成的文字嵌入到不恰当的位置上。另外，文字的嵌入过程也忽略了图像整体层面的因素，如光照和场景中的遮挡。对这两个因素的忽略使得文字会突兀地从背景中显现出来，让合成图像难以达到真实图像的水平。

简介

在本文中，旷视研究院提出一个数据合成引擎，可以从3D虚拟世界合成逼真的场景文字图像；它基于Unreal Engine 4（UE4）引擎构建，故称之为UnrealText。具体而言，合成的文字可以认为是前景带有纹理的平面多边形网格。这些网格被置于3D世界中合适的位置，经过渲染后，与场景融为一体。

图1：UnrealText合成效果图

如图1所示，UnrealText较现有方法有如下优势：1）文字与场景整体渲染，在光照、遮挡和视角变换上皆实现了逼真效果；2）可以获取关于场景的精确信息，比如法向量、深度、物体网格等，因此能生成更好的文字区域信息。这些优势对于训练检测器来说至关重要。

为了进一步探究UnearText的潜力，研究员设计了3个关键部件：1）一个可以探索虚拟场景并生成相机视角的搜索算法，获得更多多样化且自然的背景；2）一个有规律改变环境光照条件以模仿真实世界变化的环境随机化模组；3）一个基于网格的文字区域生成方法，通过分析3D网格信息寻找合适的文字放置区域。

3D虚拟世界中的场景文字

UrealText基于UE4和UnrealCV插件构建：1）它能生成照片级真实度的图像；2）高效渲染、生成一张新的场景文字图像，仅需1到1.5秒；3）它是一个通用的、兼容现有3D场景模型的引擎。

图2：本文合成方法的基本工作流程

图2是本文方法的整体流程，可以看到，它由一个视角搜索模组、一个环境随机化模组、一个文字区域生成模组和一个文字渲染模组构成。

视角搜索

视角搜索（viewfinder）模组的功能是根据3D场景自动决定相机的一系列位置和翻转情况，期间需要保证选择合理、变化明显，不能选择诸如从物体网格内部看出去的视角（如图3右下方）。

图3：第一行(1)-(4)为随机游走算法的效果展示；第二行为本文方法和随机采样的视角的效果对比

基于学习的方法如导航和探索算法可能需要额外的训练数据，并且还不能保证可以泛化到不同的3D场景。因此，研究员转向到使用基于规则的方法，设计了一个受物理约束的3D随机游走算法，它同时还带有相机锚以更好地增强游走算法的效果（图3第一行）。

受物理约束的3D随机游走方法。该方法会从一个有效的位置开始游走，目的是找到下一个有效且变化不能太细微的位置。相对于有效位置，无效位置是指诸如物体网格内部或远离场景边界的情况。所谓位置变化不能太细微，是指变化后的位置不能过于接近现有位置，否则，新视角会和现有视角类似。本文提出的3D随机游走方法使用了光线投射方法（ray-casting），它受物理规则约束，可以通过检查物理环境来决定游走的位置。

具体来说，在每一步首先会随机改变相机翻转的俯仰（pitch）和偏移（yaw）值，让相机指向一个新的方向；然后从相机位置向视角方向投射光线。光线当抵达任何物体网格（或传播到一个固定长度）后会停止传播。在设计中，从现有位置到光线停止位置间的路径不能存在障碍物，即光线不会透过物体网格进行传播。所以，沿着光线路径的所有位置点都是有效的。最后，通过设定采样标准，保证视角变化不能太细微，该随机游走算法实现了可以生成多种相机视角的功能。

辅助游走算法的相机锚。鉴于本文提出的随机游走算法在对场景不同位置的探索上不够高效，因此，研究员在3D场景中手工选择了N个相机锚作为起始点，每过T步，就重置相机位置。需要说明的是，这些位置点的选择没有严格的要求，只要保证视角能涵盖整个空间即可。

环境随机化

为了让引擎生成的环境具有真实世界一般的变化因素，比如光照条件，研究员会随机改变场景中所有光线的密度、颜色、方向。此外，团队还会增加烟雾条件，随机调整其浓度。环境的随机化操作可以保证提供多样化图像，训练出更加强大的检测器。

文字区域生成

真实世界中，文字通常嵌入在可以很好定义的表面上，如交通牌。因此本文提出了一个通过围绕3D世界中的物体网格进行探测来实现文字区域查找的方法。另外，考虑到对每个物体网格都进行检查很耗时间，因此提出一个两阶段流程：1）首先，检索ground truth的表面法向量图，生成最初的文字候选区域；2）然后，用物体网格把这个候选区域投影到3D世界并进行修正。进一步研究员从修正的区域采样出一个子集进行渲染。为了避免候选区域之间出现遮挡，研究员会把它们投影回屏幕空间，然后一个个丢掉重叠区域，直至遮挡消失。

从法向量图获取初始文字候选区域。在计算机图形学中，法向量值都是垂直于一个表面的单位向量。当投影到2D的屏幕空间时，有类似法向量值的区域就可能是一个可以很好定义的嵌入文字的区域。具体而言，研究员通过用64×64像素的网格在表面法向量图上滑动，检索平滑的表面法向量来查找有效的图像区域。进一步，随机采样至多10个不重叠的有效图像区域，来作为最初的文字候选区域。

在3D世界修正候选区域。如图4所示，2D屏幕空间中的方形初始候选区域会在投影到3D世界后发生扭曲变形。

图4：对初始文字候选区域的修正效果

因此，需要首先矫正投射到3D世界的候选区域。研究员将初始区域的中心投射到3D空间，然后在围绕该点的相关网格表面上重新初始化一个正交框（下面的边与地平面平行，正交于引力方向）。然后，扩大宽度或高度，实现修正。

文字渲染

生成文字图像。当完成图像中的文字区域的修正，文字生成模组会采样文字内容，然后使用特定的字体和颜色渲染文字图像。文字的行数和每行的字符数由字体大小和在2D空间中修正的候选区域大小来决定，从而保证字符不会太小，具有可读性。

在3D世界中渲染文字。研究员首先会对修正后的候选区域进行三角划分，以生成与底面紧密相连的平面三角形网格。然后将文字图像作为纹理加载到生成的网格上。此外，研究员还会随机采样纹理属性，比如漫反射、镜面反射比例。

实验

场景文字检测

为验证UnrealText的有效性，研究员使用当前领先的文字检测模型EAST来训练，并在真实数据集上进行测试。

完全在合成数据集上训练。研究员首先完全使用合成数据集训练EAST模型，对比不同合成数据集的训练性能，如表1所示。可以发现，由于不同合成数据集训练样本的数量差异，研究员在控制训练数据的前提下做了对比。所有情况下，本文方法训练的EAST模型皆显著超越其它方法。

表1：在不同合成数据集上训练的EAST模型的检测结果（F1分数）对比

合成数据集的互补。考虑到UnrealText是从3D场景模型来生成图像，与从真实图像背景生成图像存在潜在的画风差异，研究员还用本文的合成数据和基于真实图像的合成数据VISD联合训练EAST模型，以测试效果，见表1最后一行。可以发现同样是在10K训练数据的前提下，混合训练的效果要好于单用任何一种数据训练的效果。

与真实数据协同训练。一般而言，合成数据的一个重要角色是用于模型的预训练，然后人们会进一步用某一具体领域真实数据集来提升性能。本文首先用不同合成数据对EAST进行了预训练，然后用具体领域的数据来微调模型，结果如表2。可以发现，用本文合成数据来协同训练的模型性能显著超越了其它方法。

表2：EAST在合成数据集上预训练并用真实数据微调后的性能对比

在完整合成数据集上的协同训练。同样如表2所示，当研究员用本文方法合成的完整数据集进行预训练后，最终的模型性能得到了进一步提升，甚至在MLT17上的F1分数达到了74.1，超越了最近的SOTA结果（CRAFT 73.9，LOMO 73.1）。虽然增幅不大，但也说明本文方法的有效性。

场景文字识别

场景中拉丁文字的识别。研究员选用了基线模型ASTER，采用了ICDAR 2019 ArT 挑战赛拉丁文字识别组冠军模型的配置，结果如表6所示。

表6：在英语数据集上的结果

可以看到，在限制训练的单词图像数量为1M的前提下，用本文合成数据训练的模型性能明显高于其他合成数据集，同时在SVTP这样有着多种文字样式和复杂背景的数据集下的测试结果也表明，本文方法能很好提升场景文字识别系统在复杂案例上的表现。进一步，在更大的数据量训练下，本文方法合成的数据依然展现出了显著的优越性。

场景中多语言文字的识别。MLT 2017数据集虽然包含了多种语言，但是一直以来人们主要还是用它来进行文字检测的研究，因为大家没有足够的多语言文字识别训练数据。为此，研究员专门建立了一个包含MLT 2017中10个语言的多语言数据集，以供本次乃至未来进一步研究使用。

表3：场景中多语言文字识别结果（其中MLT数据集将英语、法语、德语、意大利语均归为拉丁语类）

从结果可以看到，无论是单独使用，还是混合MLT-19进行使用，本文合成数据下的模型训练在总体性能上较先前工作均有显著提升，且在部分语言上（拉丁+7.6%, 混合+21.6%）更加突出。

结论

在本文中，旷视研究院提出一个合成场景文字图像的新引擎UnrealText，可以借助3D图形引擎来渲染图像，并且把文字和场景作为整体来渲染。一系列实验结果表明了该方法在文字检测/识别模型上的有效性。本文还研究了该引擎的不同部件，并相信该工作朝着更佳的合成算法迈出了坚实的一步。

参考文献

Ankush Gupta, Andrea Vedaldi, and Andrew Zisserman. Synthetic data for text localization in natural images. In Proc. CVPR, pages 2315–2324, 2016.
Max Jaderberg, Karen Simonyan, Andrea Vedaldi, and Andrew Zisserman. Synthetic data and artificial neural networks for natural scene text recognition. arXiv preprint arXiv:1406.2227, 2014.
Hui Li, Peng Wang, Chunhua Shen, and Guyu Zhang. Show, attend and read: A simple and strong baseline for irregular text recognition. AAAI, 2019.
Shangbang Long, Yushuo Guan, Bingxuan Wang, Kaigui Bian, and Cong Yao. Alchemy: Techniques for rectification based irregular scene text recognition. arXiv preprint arXiv: 1908.11834, 2019.
Tao Wang, David J Wu, Adam Coates, and Andrew Y Ng. End-to-end text recognition with convolutional neural networks. In 2012 21st International Conference on Pattern Recognition (ICPR), pages 3304–3308. IEEE, 2012.
Fangneng Zhan, Shijian Lu, and Chuhui Xue. Verisimilar image synthesis for accurate detection and recognition of texts in scenes. In Proc. ECCV, 2018.

入群交流

欢迎加入旷视文字识别技术交流群

或者添加farman7230入群

往期解读

CVPR 2020 | 旷视研究院提出PVN3D：基于3D关键点投票网络的单目6DoF位姿估计算法
CVPR 2020 | 旷视研究院提出SAT：优化解决半监督视频物体分割问题
CVPR 2020 | 旷视研究院提出新方法，优化解决遮挡行人重识别问题
CVPR 2020 Oral | 旷视研究院提出Circle Loss，革新深度特征学习范式
CVPR 2020 Oral | 旷视研究院提出双边分支网络BBN：攻坚长尾分布的现实世界任务
CVPR 2020 Oral | 旷视研究院提出针对语义分割的动态路径选择网络
CVPR 2020 | 旷视研究院提出数据不确定性算法 DUL，优化人脸识别性能
CVPR 2020 Oral | 旷视研究院提出密集场景检测新方法：一个候选框，多个预测结果

传送门

欢迎大家关注如下 旷视研究院 官方微信号????

npm、cnpm、pnpm、yarn包管理工具别傻傻分不清楚了青苔猿猿 nodejs npm 前端 node.js pnpm yarn cnpm node包管理器
干啥的：nodejs的包管理工具。用于自动化处理包的安装、更新、配置和管理。它们之间的主要区别在于它们各自的实现方式、性能优化、以及一些特有的功能。怎么用：1、npm1.1、描述NodePackageManager默认包管理器从npm公共仓库中安装、共享和分发代码包npm在项目中创建一个node_modules文件夹，其中包含所有的依赖项。每个项目的依赖都是独立安装的，这可能会导致重复的包和较大的
npm、cnpm、pnpm、yarn的区别迷途小码农零零发前端知识库 npm 前端 node.js
npm,cnpm,pnpm,和yarn都是JavaScript的包管理工具，用于自动化处理包的安装、更新、配置和管理。它们之间的主要区别在于它们各自的实现方式、性能优化、以及一些特有的功能。npmnpm(NodePackageManager)是Node.js的默认包管理器，也是最早被广泛接受和使用的JavaScript包管理工具。它允许用户从npm公共仓库中安装、共享和分发代码包。npm在项目中创
Java基础入门3《IDEA使用与数据类型详解》圆圆Alice Alice的Java学习笔记 intellij idea java
Hi，我又出现了，是Alice，今天我学习的是，刚刚入门，肯定是先搞定各种开发工具，还一些理解性的内容，视频来源于‘蓝桥研究院’.....本节笔记重点提要：本节笔记重点提要：1.IntellijIdea下载与安装2.IntellijIdea使用3.使用IntellijIdea打印一个界面（案列）4.变量5.Java的数据类型、数据范围、符号的意义——————————————————————————
Python 函数魔法书：基础、范例、避坑、测验与项目实战李智 - 重庆 Python 精讲精练 -从入门到实战 python 经验分享编程技巧编程实战水平考试
Python函数魔法书：基础、范例、避坑、测验与项目实战内容简介本系列文章是为Python3学习者精心设计的一套全面、实用的学习指南，旨在帮助读者从基础入门到项目实战，全面提升编程能力。文章结构由5个版块组成，内容层层递进，逻辑清晰。基础速通：n个浓缩提炼的核心知识点，夯实编程基础；经典范例：10个贴近实际的应用场景，深入理解Python3的编程技巧和应用方法；避坑宝典：10个典型错误解析，提供解
构建 Q&A 系统：基于文档和模型的问答 drebander AI 编程 springAI
在现代企业中，自动化的问答系统可以极大地提升工作效率，特别是在文档处理、客户支持和知识管理等领域。通过结合SpringAI和文档检索技术，可以轻松构建一个智能的问答系统，帮助用户从文档中快速获取信息。本文将展示如何利用SpringAI构建一个可以根据文档内容回答问题的智能Q&A系统。1.构建智能Q&A系统的背景现代的Q&A系统不仅需要能理解用户的问题，还需要能够从大量文档中找到相关的答案。传统的问
React Native常见报错解决整理飞翔的熊blabla react
转载于:https://blog.csdn.net/u010127332/article/details/83622209ReactNative从开发环境到入门练手，再到跑几个开源demo的整个过程中，遇到了不少问题，以下是对报错现象及解决方法的记录：Mac上运行iOS项目问题1：npmERR!UnexpectedendofJSONinputwhileparsingnear‘…ire-main-f
node.js学习记录——npm下包慢、 VIXeH node.js npm node.js 学习
从npm官网下载速度会很慢，可以从taobao的镜像服务器来下，该指令修改了npm下载包的默认地址，改成了taobao的镜像服务器。npmconfigsetregistry=https://registry.npm.taobao.org/查看是否修改成功更方便的方法//通过npm包管理器，将nrm安装为全局可用的工具npminrm-g//查看所有可用的镜像源nrmls/将下包的镜像源切换为taob
数据分析系列----beautifulsoup4模块羽晨同学 Python 数据分析前端服务器
个人主页：羽晨同学个人格言:“成为自己未来的主人~”beautifulSoup4是一个用于从HTML或XML文件中提取数据的Python模块。使用BeautifulSoup模块，你可以提取到需要的任何信息。BeautifulSoup4是BeautifulSoup系列模块的第四个大版本。在使用这个模块之前，先要确保我们拿到了网页的源代码，怎么拿到网页的源代码，我们在上一篇文章中有说到，不会的同学可以
PyAutoGUI使用教程小剪子vv Python python
PyAutoGUI使用教程目录PyAutoGUI使用教程1基础知识2一般函数3故障保险4鼠标函数4.1鼠标移动4.2鼠标拖动4.3鼠标单击4.4鼠标滚动4.5鼠标按下4.6缓动/渐变（Tween/Easing）函数5键盘函数5.1文字输入5.2快捷键5.3hold()上下文管理器6消息框函数7截图函数7.1截屏7.2图像定位8参考PyAutoGUI允许Python脚本控制鼠标和键盘，并自动与其他应
ubuntu18.04安装nvm管理本机node和npm 爱学习的狮王 Linux/Shell node npm 前端 node.js nvm
ubuntu18.04安装nvm管理本机node和npmnvm的使用方法1.安装nvm2.加载nvm3.安装执行版本4.设置默认版本(可选)5.检查:6.将配置加入到shell配置文件中(默认已经加入)如果系统全局的Node.js存在，但被nvm覆盖了，可以通过禁用或卸载nvm恢复到系统版本。1.取消nvm的版本管理2.然后从shell配置文件（例如~/.bashrc,~/.zshrc或~/.ba
使用 Python 和 scikit-learn 实现 KNN 分类：以鸢尾花数据集为例弥树子 python scikit-learn 分类
在机器学习的世界里，K-NearestNeighbors（KNN）算法是一种简单而强大的分类方法。它基于一个直观的想法：相似的数据点往往属于同一类别。本文将通过Python的scikit-learn库实现KNN分类，以经典的鸢尾花数据集为例，展示从数据加载到模型评估的完整流程。1.KNN算法简介KNN是一种监督学习算法，主要用于分类和回归任务。它的工作原理非常简单：对于一个新的数据点，算法会查找训
【计算机视觉】图像滤波油泼辣子多加计算机视觉计算机视觉人工智能 python 神经网络
1.图像滤波定义图像滤波是一种非常重要的图像处理技术，图像平滑、边缘检测、边缘增强、去除噪声都属于图像滤波，图像滤波是一种基于邻域的算法。通过图像滤波，可以实现图像平滑、边缘检测；图像平滑也叫图像模糊，用以去除图像中的噪声、伪影等，它是图像处理和计算机视觉的常见步骤。函数模糊类型特点使用场景cv.blur均值模糊简单快速，所有像素权重相等基础平滑和降噪cv.GaussianBlur高斯模糊中心权重
python绘图实例 charlie_wang007 python python
pythonPlt实例背景：业务的健身数据，有一个字段是其他附加信息，格式是json，需要查出该字段，解出json，拿到目标数据，按要求聚合，如燃脂是0.25的有几个目的：要验证运营页面的概览数据是否正确策略：从表中查出数据，格式化，用plt绘制，与被测页面的图形数据对比代码如下：#coding:utf8importMySQLdbimportjsonimportpandasaspdimportnu
MAUI 入门教程系列(1.框架简介) dotNET跨平台 java android linux python 人工智能
前言在2020年5月,微软宣布了MAUI跨平台框架,MAUI是Xamarin.Forms演变而来,这也就意味着,如果你原来具备Xamarin.Forms开发经验,你可以流畅的过渡到MAUI开发当中。原本于2021年底发布的MAUI正式版被推迟到了2022年5月底发布。现在,你目前可以通过安装VS2022预览版进行安装MAUI开发选项。此版本中,将不会存在Xamarin.Forms项目模板。MAUI
Python简单Web开发 patrick_wang_bigdata python
WSGI介绍HTTP协议和HTML的介绍不在这里说明，可以去看廖雪峰老师的教程了解这方面内容。一个web应用的本质是：浏览器发送一个HTTP请求服务器收到请求，生成一个HTML文档服务器把HTML文档作为HTTP响应的Body发送给浏览器浏览器收到HTTP响应，从HTTP响应Body中取出HTML并显示最简单的web应用就是先把HTML保存好，然后需要时直接响应给HTTP请求。对Python而言，
深度探索：Java 中注解与 AOP 的完美协作阿贾克斯的黎明 java java
在Java开发领域，随着应用程序的规模和复杂度不断攀升，如何高效地管理代码、实现横切关注点的分离成为了开发者们面临的关键挑战。注解（Annotations）和面向切面编程（Aspect-OrientedProgramming，AOP）的出现，为我们提供了强大的工具来优雅地应对这些难题。今天，就让我们深入探讨一下它们是如何协同工作，为代码注入强大活力的。一、注解：代码中的隐形标记注解，从本质上来说，
LLM架构与优化：从理论到实践的关键技术 XianxinMao 人工智能
标题：“LLM架构与优化：从理论到实践的关键技术”文章信息摘要：文章探讨了大型语言模型（LLM）开发与应用中的关键技术，包括Transformer架构、注意力机制、采样技术、Tokenization等基础理论，以及模型部署、应用开发、优化等实践技能。重点分析了预训练、后训练、监督微调（SFT）和偏好对齐（PreferenceAlignment）在提升模型性能中的作用，并对比了直接偏好优化（DPO）
Github趋势榜的新年冠军，竟是用AI玩数独 beyondma AI与最新技术演进 AI MINST Github
今天笔者无意中打开Github发现了这个目前趋势榜霸榜的项目是是一个利用AI玩数独的项目AI_Sudoku（Github发址：https://github.com/neeru1207/AI_Sudoku）笔者体验了一下感觉还是比较有意思的，AI_Sudoku本质上就是使用图像识别的方式来完成MINST数字识别，然后再使用dancinglinksx算法解出数独问题，对于初学者来说既能解决AI的入门问
【设计模式-行为型】迭代器模式博一波设计模式迭代器模式
一、什么是迭代器模式迭代器模式，顾名思义，同样的为了让大家更加了解啥是迭代器。我们通过电影情结来说明，不知道大家有没有看过一个剧烧脑的科幻大片--《盗梦空间》。影片讲述了由造梦师（莱昂纳多·迪卡普里奥扮演的）带领特工团队进入他人梦境，从潜意识中盗取机密并重塑他人梦境的故事。其中个东西叫做造梦机，无论是谁（稍微不太准确），加以培训（使用造梦机）都可以进入多层梦境。这就是个典型的迭代器模式。盗梦空间中
LeetCode：62.不同路径 xiaoshiguang3 代码随想录-跟着Carl学算法 leetcode 算法 java 动态规划
跟着carl学算法，本系列博客仅做个人记录，建议大家都去看carl本人的博客，写的真的很好的！代码随想录LeetCode：62.不同路径一个机器人位于一个mxn网格的左上角（起始点在下图中标记为“Start”）。机器人每次只能向下或者向右移动一步。机器人试图达到网格的右下角（在下图中标记为“Finish”）。问总共有多少条不同的路径？示例1：输入：m=3,n=7输出：28示例2：输入：m=3,n=
ogre 学习笔记 - Day 1 頖╃縌 ①oO% #ogre 学习笔记游戏引擎
ogre学习笔记-Day1OGRE:Object-OrientedGraphicsRenderingEngine从名称可以得出，OGRE是一个渲染引擎下载地址https://www.ogre3d.org/最新版ogre-13.1.0编译工具cmake-gui,vs2019,vscodeConfigureconfigure时发现ogre会自动从github下载/编译依赖项，github速度有可能很慢
Windows WPS ppt幻灯片保存文件时候 PPT文件大小变大 ppt文件太大解决方案土牛兄弟 Windows wps powerpoint
WindowsWPSppt幻灯片保存文件时候PPT文件大小突然变大，原先只有10M的大小增加到40M关于wps的ppt文件变大，指的是：明明ppt幻灯片页数和图片都不多，只是稍微修改两个文字，保存时，文件大小增加了不少，关于这个问题我尽量了大量的分析，大部分是因为wps的ppt默认是将所有字体嵌入到ppt中，方便他人编辑和修改。您可以按照如下方法进行操作：1、打开【文件】->【选项】2、进入【常规
Python 3.9它来啦！！！ python程序员小'鹏 python 编程语言经验分享程序人生
Python3.9，来了！小编本身就是一名python开发工程师，我自己花了三天时间整理了一套python学习教程，从最基础的python脚本到web开发，爬虫，数据分析，数据可视化，机器学习，等，这些资料有想要的小伙伴"点击"即可领取过去一年，来自世界各地的开发者们一直在致力于Python3.8的改进。Python3.9beta版本已经存在了一段时间，第一个正式版本于2020年10月5日发布。每
ABAP git客户端
在多模态模型的架构上，ChatGPT的绘图能力主要依赖以下几个核心组件：跨模态编码器（Cross-ModalEncoder）：跨模态编码器的作用是将文本和图像的特征进行对齐。GPT可以将用户输入的文本描述转换为文本特征表示，然后利用跨模态编码器将这些特征映射到图像特征空间。这种方式确保模型能够理解描述性语言中不同细节是如何与图像特征对应的。
程序员学Spring Boot 入门：一文读懂JavaEE以及Java EE架构！人邮异步社区分布式编程语言 spring 数据库大数据
1JavaEE1.1JavaEE我1999年接触JSP，从2001年开始正式接触JavaEE技术，当时面对JavaEE那么多组件和规范（比如，EJB技术），确实有点蒙圈。编写一个企业应用居然用到了那么多技术，曾经的电信项目，启动需要10分钟，每次发布都需要一个小时。作为新手的我是不能理解的，这也是当时大多数程序员的心态。然而JavaEE，针对复杂企业系统所指定的规范和实现，能满足复杂企业应用需求，
el-input限制只能输入数字 Orange301511 大前端 vue.js elementui javascript
el-input限制只能输入数字问题：vue项目使用el-input限制只能输入数字1.当我们通过设置type="number"时，在中文输入法输入的时候；当失去焦点时会录入英文字符。所以该方案不是最佳方案2.当我们使用vue的修饰符v-model.number约束为number时;此时字母e依然可以输入。所以该方案不是最佳解决方案3.在el-input的v-on:input="value=val
为什么你努力了却没升职？99%的人都忽视了这个真相！人工智能
0你的问题，我知道！我一整年工作这么拼，项目结果也不错，咋晋升挂？我在岗四五年了，而他就三年，为啥主管提名它？但这只是打工人视角看晋升的一厢情愿。晋升本质晋升并非奖励。若过去功劳特多，也应用绩效、年终奖奖励，而非晋升。大多企业，晋升也非论资排辈，不是你在岗位久，就该晋升。在企业角度才能看懂，晋升是企业的内部人才选拔，选拔：对公司未来发展更有价值能承担更大责任的人那这人才选拔标准到底是啥？大多从战功
20250124 Flink中窗口开始时间和結束時間靈臺清明 Flink flink 大数据
增量聚合的ProcessWindowFunction#ProcessWindowFunction可以与ReduceFunction或AggregateFunction搭配使用，使其能够在数据到达窗口的时候进行增量聚合。当窗口关闭时，ProcessWindowFunction将会得到聚合的结果。这样它就可以增量聚合窗口的元素并且从ProcessWindowFunction`中获得窗口的元数据。你也可
什么是包装ERP 雪叶雨林行业资讯 ERP 人工智能大数据
包装企业在现代生产和供应链管理中面临着日益复杂的挑战，如何有效管理资源、优化流程和提高效率成为了企业发展的关键。包装企业资源计划（PackagingERP）作为一种集成管理系统，旨在通过信息化手段提升企业的整体运营水平。包装ERP的定义包装ERP是专为包装行业设计的一种企业资源计划系统，涵盖了生产、库存、采购、销售等多个模块。其核心目的是通过数据集成和流程优化，帮助企业实现资源的高效配置和管理，从
linux批量提取文本,关于bash：如何使用sed从字符串中提取多个文本和数字？国家级做梦冠军 linux批量提取文本
本问题已经有最佳答案，请猛点这里访问。如何使用"sed"从一行中提取3个或更多单独的文本我有以下几行：echo到目前为止，我可以通过执行以下操作来提取"DOB-029"sed-n's/.*$DOB-[0-9]*$.*/\1/p'但我没有得到其他文字，例如姓名或职位。我的预期输出应该是MikeDOB-029Post-555已编辑假设我在文件中有一个列表，我想从整个列表中提取特定的文本/ID，然后
JAVA中的Enum 周凡杨 java enum 枚举
Enum是计算机编程语言中的一种数据类型---枚举类型。在实际问题中，有些变量的取值被限定在一个有限的范围内。例如，一个星期内只有七天我们通常这样实现上面的定义： public String monday; public String tuesday; public String wensday; public String thursday
赶集网mysql开发36条军规 Bill_chen mysql 业务架构设计 mysql调优 mysql性能优化
(一)核心军规 (1)不在数据库做运算 cpu计算务必移至业务层； (2)控制单表数据量 int型不超过1000w，含char则不超过500w；合理分表；限制单库表数量在300以内； (3)控制列数量字段少而精，字段数建议在20以内
Shell test命令 daizj shell 字符串 test 数字文件比较
Shell test命令 Shell中的 test 命令用于检查某个条件是否成立，它可以进行数值、字符和文件三个方面的测试。数值测试参数说明 -eq 等于则为真 -ne 不等于则为真 -gt 大于则为真 -ge 大于等于则为真 -lt 小于则为真 -le 小于等于则为真实例演示： num1=100 num2=100if test $[num1]
XFire框架实现WebService(二) 周凡杨 java webservice
有了XFire框架实现WebService(一)，就可以继续开发WebService的简单应用。 Webservice的服务端(WEB工程)：两个java bean类： Course.java package cn.com.bean; public class Course { private
重绘之画图板朱辉辉33 画图板
上次博客讲的五子棋重绘比较简单，因为只要在重写系统重绘方法paint（）时加入棋盘和棋子的绘制。这次我想说说画图板的重绘。画图板重绘难在需要重绘的类型很多，比如说里面有矩形，园，直线之类的，所以我们要想办法将里面的图形加入一个队列中，这样在重绘时就
Java的IO流西蜀石兰 java
刚学Java的IO流时，被各种inputStream流弄的很迷糊，看老罗视频时说想象成插在文件上的一根管道，当初听时觉得自己很明白，可到自己用时，有不知道怎么代码了。。。每当遇到这种问题时，我习惯性的从头开始理逻辑，会问自己一些很简单的问题，把这些简单的问题想明白了，再看代码时才不会迷糊。 IO流作用是什么？答：实现对文件的读写，这里的文件是广义的； Java如何实现程序到文件
No matching PlatformTransactionManager bean found for qualifier 'add' - neither 林鹤霄
java.lang.IllegalStateException: No matching PlatformTransactionManager bean found for qualifier 'add' - neither qualifier match nor bean name match! 网上找了好多的资料没能解决，后来发现：项目中使用的是xml配置的方式配置事务，但是
Row size too large (> 8126). Changing some columns to TEXT or BLOB aigo column
原文：http://stackoverflow.com/questions/15585602/change-limit-for-mysql-row-size-too-large 异常信息： Row size too large (> 8126). Changing some columns to TEXT or BLOB or using ROW_FORMAT=DYNAM
JS 格式化时间 alxw4616 JavaScript
/** * 格式化时间 2013/6/13 by 半仙 [email protected] * 需要 pad 函数 * 接收可用的时间值. * 返回替换时间占位符后的字符串 * * 时间占位符:年 Y 月 M 日 D 小时 h 分 m 秒 s 重复次数表示占位数 * 如 YYYY 4占4位 YY 占2位<p></p> * MM DD hh mm
队列中数据的移除问题百合不是茶队列移除
队列的移除一般都是使用的remov();都可以移除的,但是在昨天做线程移除的时候出现了点问题,没有将遍历出来的全部移除, 代码如下; // package com.Thread0715.com; import java.util.ArrayList; public class Threa
Runnable接口使用实例 bijian1013 java thread Runnable java多线程
Runnable接口 a. 该接口只有一个方法：public void run(); b. 实现该接口的类必须覆盖该run方法 c. 实现了Runnable接口的类并不具有任何天
oracle里的extend详解 bijian1013 oracle 数据库 extend
扩展已知的数组空间，例： DECLARE TYPE CourseList IS TABLE OF VARCHAR2(10); courses CourseList; BEGIN -- 初始化数组元素，大小为3 courses := CourseList('Biol 4412 ', 'Psyc 3112 ', 'Anth 3001 '); --
【httpclient】httpclient发送表单POST请求 bit1129 httpclient
浏览器Form Post请求浏览器可以通过提交表单的方式向服务器发起POST请求，这种形式的POST请求不同于一般的POST请求 1. 一般的POST请求，将请求数据放置于请求体中，服务器端以二进制流的方式读取数据，HttpServletRequest.getInputStream()。这种方式的请求可以处理任意数据形式的POST请求，比如请求数据是字符串或者是二进制数据 2. Form
【Hive十三】Hive读写Avro格式的数据 bit1129 hive
1. 原始数据 hive> select * from word; OK 1 MSN 10 QQ 100 Gtalk 1000 Skype 2. 创建avro格式的数据表 hive> CREATE TABLE avro_table(age INT, name STRING)STORE
nginx+lua+redis自动识别封解禁频繁访问IP ronin47
在站点遇到攻击且无明显攻击特征，造成站点访问慢，nginx不断返回502等错误时，可利用nginx+lua+redis实现在指定的时间段内，若单IP的请求量达到指定的数量后对该IP进行封禁，nginx返回403禁止访问。利用redis的expire命令设置封禁IP的过期时间达到在指定的封禁时间后实行自动解封的目的。一、安装环境： CentOS x64 release 6.4(Fin
java-二叉树的遍历-先序、中序、后序（递归和非递归）、层次遍历 bylijinnan java
import java.util.LinkedList; import java.util.List; import java.util.Stack; public class BinTreeTraverse { //private int[] array={ 1, 2, 3, 4, 5, 6, 7, 8, 9 }; private int[] array={ 10,6,
Spring源码学习-XML 配置方式的IoC容器启动过程分析 bylijinnan java spring IOC
以FileSystemXmlApplicationContext为例，把Spring IoC容器的初始化流程走一遍： ApplicationContext context = new FileSystemXmlApplicationContext ("C:/Users/ZARA/workspace/HelloSpring/src/Beans.xml&q
[科研与项目]民营企业请慎重参与军事科技工程 comsci 企业
军事科研工程和项目并非要用最先进，最时髦的技术，而是要做到“万无一失” 而民营科技企业在搞科技创新工程的时候，往往考虑的是技术的先进性，而对先进技术带来的风险考虑得不够，在今天提倡军民融合发展的大环境下，这种“万无一失”和“时髦性”的矛盾会日益凸显。。。。。。所以请大家在参与任何重大的军事和政府项目之前，对
spring 定时器-两种方式 cuityang spring quartz 定时器
方式一：间隔一定时间运行 <bean id="updateSessionIdTask" class="com.yang.iprms.common.UpdateSessionTask" autowire="byName" /> <bean id="updateSessionIdSchedule
简述一下关于BroadView站点的相关设计 damoqiongqiu view
终于弄上线了，累趴，戳这里http://www.broadview.com.cn 简述一下相关的技术点前端：jQuery+BootStrap3.2+HandleBars，全站Ajax（貌似对SEO的影响很大啊！怎么破？），用Grunt对全部JS做了压缩处理，对部分JS和CSS做了合并（模块间存在很多依赖，全部合并比较繁琐，待完善）。后端：U
运维 PHP问题汇总 dcj3sjt126com windows2003
1、Dede(织梦)发表文章时,内容自动添加关键字显示空白页解决方法：后台>系统>系统基本参数>核心设置>关键字替换（是/否），这里选择“是”。后台>系统>系统基本参数>其他选项>自动提取关键字，这里选择“是”。 2、解决PHP168超级管理员上传图片提示你的空间不足网站是用PHP168做的，反映使用管理员在后台无法
mac 下安装php扩展 - mcrypt dcj3sjt126com PHP
MCrypt是一个功能强大的加密算法扩展库，它包括有22种算法，phpMyAdmin依赖这个PHP扩展，具体如下：下载并解压libmcrypt-2.5.8.tar.gz。在终端执行如下命令： tar zxvf libmcrypt-2.5.8.tar.gz cd libmcrypt-2.5.8/ ./configure --disable-posix-threads --
MongoDB更新文档 [四] eksliang mongodb Mongodb更新文档
MongoDB更新文档转载请出自出处：http://eksliang.iteye.com/blog/2174104 MongoDB对文档的CURD，前面的博客简单介绍了，但是对文档更新篇幅比较大，所以这里单独拿出来。语法结构如下： db.collection.update( criteria, objNew, upsert, multi) 参数含义参数
Linux下的解压，移除，复制，查看tomcat命令 y806839048 tomcat
重复myeclipse生成webservice有问题删除以前的，干净 1、先切换到：cd usr/local/tomcat5/logs 2、tail -f catalina.out 3、这样运行时就可以实时查看运行日志了 Ctrl+c 是退出tail命令。有问题不明的先注掉 cp /opt/tomcat-6.0.44/webapps/g
Spring之使用事务缘由(3-XML实现) ihuning spring
用事务通知声明式地管理事务事务管理是一种横切关注点。为了在 Spring 2.x 中启用声明式事务管理，可以通过 tx Schema 中定义的 <tx:advice> 元素声明事务通知，为此必须事先将这个 Schema 定义添加到 <beans> 根元素中去。声明了事务通知后，就需要将它与切入点关联起来。由于事务通知是在 <aop:
GCD使用经验与技巧浅谈啸笑天 GC
前言 GCD(Grand Central Dispatch)可以说是Mac、iOS开发中的一大“利器”，本文就总结一些有关使用GCD的经验与技巧。 dispatch_once_t必须是全局或static变量这一条算是“老生常谈”了，但我认为还是有必要强调一次，毕竟非全局或非static的dispatch_once_t变量在使用时会导致非常不好排查的bug，正确的如下： 1
linux（Ubuntu）下常用命令备忘录1 macroli linux 工作 ubuntu
在使用下面的命令是可以通过--help来获取更多的信息1,查询当前目录文件列表：ls ls命令默认状态下将按首字母升序列出你当前文件夹下面的所有内容，但这样直接运行所得到的信息也是比较少的，通常它可以结合以下这些参数运行以查询更多的信息： ls / 显示/.下的所有文件和目录 ls -l 给出文件或者文件夹的详细信息 ls -a 显示所有文件，包括隐藏文
nodejs同步操作mysql qiaolevip 学习永无止境每天进步一点点 mysql nodejs
// db-util.js var mysql = require('mysql'); var pool = mysql.createPool({ connectionLimit : 10, host: 'localhost', user: 'root', password: '', database: 'test', port: 3306 });
一起学Hive系列文章 superlxw1234 hive Hive入门
[一起学Hive]系列文章目录贴，入门Hive，持续更新中。 [一起学Hive]之一—Hive概述，Hive是什么 [一起学Hive]之二—Hive函数大全-完整版 [一起学Hive]之三—Hive中的数据库(Database)和表(Table) [一起学Hive]之四-Hive的安装配置 [一起学Hive]之五-Hive的视图和分区 [一起学Hive
Spring开发利器：Spring Tool Suite 3.7.0 发布 wiselyman spring
Spring Tool Suite(简称STS)是基于Eclipse，专门针对Spring开发者提供大量的便捷功能的优秀开发工具。在3.7.0版本主要做了如下的更新：将eclipse版本更新至Eclipse Mars 4.5 GA Spring Boot(JavaEE开发的颠覆者集大成者，推荐大家学习)的配置语言YAML编辑器的支持(包含自动提示，