GitChat技术杂谈

深度学习在摄影技术中的应用与发展

本文来自作者言有三在 GitChat 上分享「深度学习在摄影技术中的应用与发展」，「阅读原文」查看交流实录。

「文末高能」

编辑 | 哈比

我是一个 AI 行业的从业者，也是一个摄影爱好者。

之前我在《言有三工作室》公众号分享过一篇文章，《干掉柯洁的下一步，阿尔法狗创始人又要毁掉这个行业（深度学习）》，感兴趣可以去看看。

其中主要说的就是，DeepMind 的研究，已经让算法掌握了自动学习到构图，滤镜的能力。在这样的背景下，我决定认真从头开始分享分享计算机算法，尤其是最新的深度学习技术在其中发挥的作用。

本次的分享面向的对象是普通大众，本着稍求甚解的原则，我接下来会在尽量照顾受众的同时，也说说技术。

1. 我们想让计算机做什么

摄影，说的粗浅一点，就是拍照。摄影本身并不是一个技术很高的活，稍加训练，就能成为合格的摄影师。

当然，摄影本身也可以是一门艺术，好的作品往往会带入情绪等等。这是一个充满抽象与主观因素的领域。但我们不能因此陷在这个点上，不然下面就没法说了。

好的照片，让大众心情愉悦，欣赏点赞的照片，是有共性的，而计算机玩摄影，就是要解决这个问题，怎么学习到摄影师和大众的审美。

所以下面正式抛出关键词：photo aesthetics。

2. 要研究的到底是一个什么样的问题

所谓 photo aesthetics，即计算机美学，这是计算机视觉的一个研究方向。

它研究通过计算机来学会人的审美，狭义而简单的来说，就是判断一张图片是高质量的，还是低质量的，也就是好与坏，数学上这是一个 2 分类问题。

很多早期的研究，以及相应的数据库 CUHK【1】，CUHKPQ【2】的标注，都是为这个而服务。

从下图相关论文的数量趋势来看，现在是一个很活跃的领域。从研究的现状来看，这也是一个远远没有饱和的区域。

上面说了，最简单也是最直观最早期的研究，就是分辨一张图是好，还是不好，是个 2 分类问题。

但是 2 分类问题有它的两个重大的局限性：

美学不是一个很严谨的数学问题，而是有很强的主观性，有很多的图，介于好图与非好图之间，难以 2 分类，分界面实在不清晰。这导致问题本身定义不明确，数据的标注也很困难。
如果只是一直做 2 分类问题研究，那很多的应用无法实现，直接点的如图像检索排名，间接点的如构图推荐，自适应滤镜。

演变到后来，先是升级到了回归问题，不仅分好坏，还要打个等级分。

什么意思呢？每一个样本的标注不再是 2 分类，不仅仅是包含好图与坏图的标注，而是有了一个量化的分数，比如 AVA 数据集【3】分数的标注从 1 到 10。

研究就变成了如何回归出其标注的分数，最后给出每张图片的平均分数。从应用层面上讲，主要包括了图像检索，自动构图，智能滤镜，甚至是直接创作。

以上，就是通常意义下的 photo aesthetics 包含的内容，核心思想就是学习分辨与创作好图。

3. photo aesthetics 的主要研究思路

在说具体方法和应用之前，还是先说说我们的研究思路。从技术的突破来说，以深度学习为界限，可以从传统方法和深度学习方法来说。

不过对于大多数问题和应用这两者最大的区别就是：前者是手动设计特征，后者是自动学习特征。

所以，这里不从传统方法和深度学习方法的维度来说，而是从研究问题的演变发展上说。

(1) 二分类问题

1 说了，最开始的时候，美学问题仅仅是被当做一个 2 分类问题。

早期的数据集 CUHK【1】，CUHKPQ【2】，都只包含 2 分类的标注，也就是数据集中的图片被人为分为了质量高与低的图。

如下图 (a) 是质量高的，(b) 是质量低的，没有疑问。

【2】可以认为是在【1】的基础上问题的延续，它弥补了【1】中的巨大不足，就是不再对所有图片一视同仁，而是不同类型的照片区分对待。

上图是一个示例，在研究过程中对不同的类别，开始采用不同的特征，考虑了图像的多样性 (diversity)。这是必须的，因为摄影中对待不同类型的照片，就是必须用不同的表现手法。

比如人像摄影中，尤其是近照，需要控制好光照，使用大光圈。而风景照中最需要的是好的构图与丰富的色彩表达。

2 分类问题研究方法的进步，就是不断利用新的深度学习模型去提取特征，从 alexnet【4】，到 googlenet【5】到 resnet【6】等的尝试，以后专题介绍。

(2) 回归问题

由于 2 分类的局限性，自然而然的就演变成了回归问题。这个时候也就出现了新的供我们使用的数据库，AVA【3】。

这是一个很大的数据库，包括 250000 张照片。每一张照片，都有一个评分从 1~10 分。同时还有语义级别和照片风格的标注，以后我们详说。

比较新的研究有【7】。

相比于 2 分类问题，其实回归问题也没有太多新的东西，从数学上来说，无非就是输出维度变了，loss function 变了。

不过在学习具体分数值的过程中，有些研究更进一步，预测了分数的分布。也就是不仅仅预测了图片的质量分数，还预测了它的分数概率图，比如【8】。

(3) 相对美学问题

这个的出发点，是从人的主观上进行考虑。对于人来说，容易判断的是一张图片的相对好坏，而不是绝对分数。同时又由于更可靠稳定的有打分标注的数据集的获取成本之高，催生了一些研究。

就是在学习的过程中，没有一个绝对的分数来指导你。【8】，【9】都是相关研究。

从训练上来看，这一般输入的训练是多个图像，可能是两个图像，也可能是多个图像，一起丢进网络去学习哪一个更好。

下面是一个结果展示，右边的比左边的质量高。相对美学，在图像检索和图像增强中是有很大的作用的。

(4) 多任务学习问题

最简单粗暴的方法，就是不管是什么图像，都直接提特征，分类也好，回归也好。但是，显然这是不可能很好的解决问题的。

摄影美学是讲究因材施教的，不同类型的图像，审美标准完全不同。

那么，直接对所有的图片，采用同样的方法学习，是不通，所以就有方法，或利用图像 style，semantic 信息进行弱监督，或直接将 style 和 score，semantic 一起学【10】。

至于怎么做，按住不表，下回再论。

4. 传统的方法怎么研究

在深度学习还没有遍地开发，在神经网络还处于低谷时期，有没有人在玩计算机摄影？当然有。

他们是怎么玩的？传统方法必然要手动设计大量特征来研究计算机美学这个问题。那主要都有什么特征呢？

主要分为底层的图像特征和与摄影有关的特征：

底层的图像特征，包括 Subject-Background Contrast，Color Distribution Feature，Hue harmanic，Contrast 和 brightness，clearness and the colorfulness，由于篇幅限制，这里就不每一都讲述具体细节，先，以及通用的图像特征 SIFI，Hog，Bag- of-Visual-Words (BOV) 等。
与摄影有关的特征包括，the rule of thirds，the Low Depth of Field Indicators，exposure 等。

每一个，我都举一个例子。

4.1 Hue harmanic

这是从色调的特性上来分析一张图是不是好图。一张好的静物摄影，色调一般会比较单一，不会五颜六色的各种颜色都杂糅在一起。

如下面的图【1】，单调干净的色调。

好的色调和配色，才会有好的视觉感受，也会呈现出和谐。

文【2】是文【1】的后续研究，补充了摄影中的另 2 个原理，即 90 color scheme 和 complementary color scheme。

这个是设计学里的经典配色方案，从下面的色调轮中看，具有视觉美感的主色调搭配方案，常常是区间相隔 180 度，或者 90 度左右。

具体计算这个 hue 的复杂度，就是要把图像转换到 HSV 空间，得到 H 通道。然后将其等分成多个 bins，设定阈值，来计算色调的种类。

4.2 The rule of thirds

玩摄影的人，一定对三分构图法非常熟悉。三分构图法则，是非常安全而普遍的摄影准则。同样，在我的摄影公众号《言有三工作室》中也仔细谈过这个问题，感兴趣可以去读。

文【3】通过将图像分为 9 宫格，然后计算每一个宫格的色调，来评判图像主体是否处于三分的位置。

更具体以后公众号再详细说。

5. 基于深度学习的方法

从 2000 左右算起，传统的方法也研究了 10 年左右，但是仅仅只限于对照片进行分类，打打分【1-3】，离实际的应用，还是有很大的差距。

深度学习技术的发展，从各方面都提升了这个领域的发展，下面从有监督学习和无监督学习两个方面来说说。

5.1 有监督学习

上面第 3 章其实也提过了，由于目前的美学数据集都比较小，所以研究离不开迁移学习的思路。

也就是从其他任务训练好的模型中提取特征，然后将该特征，在现有的美学数据集上，换上美学评估的新 loss 或者依旧采用经典分类和回归问题中的 loss 函数，来 finetune 网络。

那么网络的时候，自然而然地遵循着从 alexnet【4】，到 googlenet【5】到 resnet【6】的路线。

文章【4】，是比较早期的应用，采用了一个双通道的网络，是不是很 alexnet？

分别输入 global view 和 local view。local view 是多个 random crop，可以学习到多个局部响应。

从上面的网络结构和输入你就可以想到，这基本上也就是拿来做做分类了。实际上也是如此，上文就是拿来做二分类，以及图像风格的分类。

用了更复杂的 googlenet 的【5】，也一样在研究二分类问题。更进一步的是，他们通过观察 featuremap 的响应特点，来试图总结高质量图和低质量图的规律，并认为前者会有更多的激活。

在后来问题从分类问题，转换为回归问题之后，文【6】就利用上了最新的 resnet，一股脑研究了分数的分布特性。

网络结构本身，没什么变化。就是几个卷积 + 全连接层，但是因为为了适应不同的输入尺度，消除由于 resize，crop 等造成的精度损失，采用了自适应的 spp layer(adaptive spatial pyramid pooling )，同时添加了语义分类信息作为弱监督，也提出了 huber loss，与通用的回归问题 loss，euclidnean loss 做了比较。

取得了当下最好的结果，AVA 上分类超过了 80%，这也是当下 state-of-out 的水平了。

总之，有监督方法，集中在利用已有的经典网络，采用不失真的多尺度输入，添加语义等信息作为监督，设计新的 loss 上努力。可以说，比较成熟，翻不起大江大浪了。

5.2 无监督学习

无监督学习的典型代表，就是 GAN。Lecun 说的当下算起十年间最值得研究的领域。GAN 从超分辨率，到风格化，其实早就杀进了摄影相关的领域。

目前，比较活跃的研究，集中在智能调整，或者说智能滤镜这一块。因为美学是个比较抽象的问题，这一块是依赖于标注的有监督学习的软肋。

汤晓鸥他们最新的研究，EnhanceGAN，也成功地学习到了颜色，对比度等调整方法，并能够同时完成图像增强与调整构图的目的。

但最值得兴奋的是，它不需要成对的标注图像了（这是通过 gan，和一批有着 2 分类标签的高质量图和低质量图来实现的）。

大的可靠的数据集太难得了，尤其是成对的后期处理图和原图，获取成本非常之高，所以利用 GAN 来学习到最优的后期，是很有价值的。cycle-gan【19】就更像是一个有点调皮的应用，

从下面它论文首页的图，我们就能够看出来。它可以实现风格化的转化，冬天和夏天风格的转化，甚至马和斑马的转换。你完全可以大开脑洞，想想还可以有什么应用。

最重要的是，它依旧不需要成对的图像来应用，也就是不需要提供一对一对的原图和处理后的后期图。

我相信，这就是未来，毕竟还有增强学习呢【21】。更多地细节，以后我们慢慢在讨论。

6. 基于深度学习的应用

总的来说，随着深度学习技术的发展，很多应用可以落地了，主要包含以下几个大方向。

(1) 图像检索【20】

我们在搜索引擎中搜索图片时，自然是希望能够尽量返回质量高的图，恨不得是高清原图。但是目前的搜索引擎并不能做到。

因为，目前的都是基于 tag 做的检索，而不是图像本身的质量。

下面就在百度中搜了一个学校美照，出来的效果不怎么样。学校没得到体现，人像很多也是普普通通的大头照，从摄影师的角度来看，真的很一般。

当然，你也可以去搜索更多的关键词，反正我在使用过程中常常不满意。Google 图片质量比百度高，但是也还有很大的发展空间。

(2) 图像自动构图

自动裁剪这个，自打用上 iphone 起，它的照片管理工具就自带这个功能了，但是其他好用的 app，我还没有发现。这是个什么问题，专业点的说法，就是摄影构图。

它做的就是去除不必要的元素，合理安排画面中的元素分布。每一个摄影师拍完照做后期时，第一步肯定就是做图像裁剪。

就算是最后没有裁剪，第一步也会看是不是需要裁剪！

为什么？

因为你拍照的时候，很多时候来不及细细的去构图，只有在后期认真想的时候，才会去精细地调整。

据我体验，目前 iphone 照片管理软件的自动裁剪功能，主要还是对人像管用，下面给大家看个例子就知道了。干脆把两张前后对比图拿过来大家瞧瞧，想想为什么要这么裁剪？

自动裁剪前与自动裁剪后：

可以看出，去除了更多的干扰，使画面更加平衡与和谐。

关于更多的构图摄影知识，请关注我另一个摄影公众号《言有三工作室》，里面有大量的教程可以学习体验。

至于构图的一些研究，可以参考【11】【12】，下回说细节。

(3) 自适应滤镜

现在就没有一个 app 能够自动推荐滤镜，后期很多的时候是很繁琐的。对于菜鸟来说，只能去各种尝试已有的滤镜。

对于高手来说，需要很多时间来积累经验，也需要时间去选择更好的方案。费时费力，还不一定能达到最好的效果，所以，我们其实都很期待出现一个 app，能够自动帮我们选择一个好的风格滤镜。

可惜，现在比较优秀的后期 app，如 snapseed，泼辣修图，也仅仅是能够对图像的对比度，亮度等自适应地做些调整。

关于现有的发展，更详细的介绍，在我的摄影公众号《言有三工作室》的文章《Apple 和 Google 他们为小白们的修图大业做了什么？》中有详细的说明，大家有兴趣可以自行前往阅读。

现在比较好的研究，也有一些。像名字取得比较吓人的【13】，号称 end-to-end 可以把手机照片提升至单反画质，不过实际效果看来，主要是减少了阴影，总体上学习到了使图像变得更加通透。

缺点是对比度经常放的太高，同时因为采用了 GAN，放大了噪声。

这种事当然不能少了汤晓鸥他们团队，EnhanceGAN 算是很新的应用了【14】，也成功地学习到了颜色，对比度等调整方法，不是 end-to-end 的方法，而是 image-crop 与 enhancement 交叉训练。

最大的优点是不需要成对的标注图像了（这是通过 gan，和一批有着 2 分类标签的高质量图和低质量图来实现的）。

早期的方法【15】是需要成对的标注图像，成本太高，所以数据集不可能很大。以后不需要成对图像做训练的方法，必将成为主流。

(4) 风格化

这个，其实已经踏进艺术的创作，而不仅仅是摄影的范畴了。行内人士可能还记得《image style transfer using convolutional neural networks》【16】这篇文章，后来催生了 prisma，当时那个很火的滤镜。

整个的流程就如同下面这样，一张原图，一个风格，最后做融合。

不过，没过多久，就退烧了。毕竟，那样玩图太 “高级”，不是大众刚需，也就没见人玩了。但是，并不是说他就不重要的了。

像 pixtopix【17】这样的文章出来之后，风格化仍然有很大的市场。比如黑白图像上色，比如图像风格转化（夏天冬天风格转化）【18】，甚至做得极端点，cycle-gan【19】这样的，不需要成对地标注，把斑马和马相互转换的有意思的研究。

未来，还大有可为！

7. 深度学习未来发展方向

总的来说，包含以下几个大方向；

难点

怎么利用数学的方法去建模内部的美学规则。
怎样自适应调整不同的图片之间的美学差异。
如何准确判断一张图采用的技术。
怎样获取一个标注详细的大数据库。

热点

网络结构设计相关问题，如多尺度多 patch。
图片风格，语义信息的应用。
怎么自动获取数据的标注。
最新技术在其中的应用，GAN。

这一次，只是一个入门介绍，后续，敬请期待！

作者简介：言有三，原 360 AI 研究院工程师，一个摄影爱好者。

想了解更多的细节，就来我计算机视觉公众号《视若观火》，以及摄影公众号《言有三工作室》吧，同时头条号《言有三工作室》也会有同步的内容。当然，摄影平台 500px 和图虫，更是天天更新噢。

Y. Ke, X. Tang, and F. Jing. The design of high-level features for photo quality assessment. In CVPR, 2006. 1, 3, 6
W. Luo, X. Wang, and X. Tang. Content-based photo quality assessment. In ICCV, 2011. 1, 3, 6, 7
Perronnin F, Marchesotti L, Murray N. AVA: A large-scale database for aesthetic visual analysis[C]// IEEE Conference on Computer Vision and Pattern Recognition. IEEE Computer Society, 2012:2408-2415.
Lu X, Lin Z, Jin H, et al. RAPID: Rating Pictorial Aesthetics using Deep Learning[J]. IEEE Transactions on Multimedia, 2015, 17(11):2021-2034.
Jin X, Wu L, He Z, et al. Efficient Deep Aesthetic Image Classification using Connected Local and Global Features[J]. 2017:1-6.
Murray N, Gordo A. A deep architecture for unified aesthetic prediction[J]. 2017.
Malu G, Bapi R S, Indurkhya B. Learning Photography Aesthetics with Deep CNNs[J]. 2017.
PKong S, Shen X, Lin Z, et al. Photo Aesthetics Ranking Network with Attributes and Content Adaptation[J]. 2016:662-679.
Chandakkar P S, Gattupalli V, Li B. A Computational Approach to Relative Aesthetics[J]. 2017.
Kao Y, He R, Huang K. Deep Aesthetic Quality Assessment with Semantic Information[J]. IEEE Transactions on Image Processing A Publication of the IEEE Signal Processing Society, 2017, 26(3):1482.
Chen Y L, Huang T W, Chang K H, et al. Quantitative Analysis of Automatic Image Cropping Algorithms: A Dataset and Comparative Study[J]. 2017:226-234.
Wang W, Shen J. Deep Cropping via Attention Box Prediction and Aesthetics Assessment[J]. 2017.
Ignatov A, Kobyshev N, Timofte R, et al. DSLR-Quality Photos on Mobile Devices with Deep Convolutional Networks[J]. 2017.
Deng Y, Chen C L, Tang X. Aesthetic-Driven Image Enhancement by Adversarial Learning[J]. 2017.
Yan Z, Zhang H, Paris S, et al. Automatic Photo Adjustment Using Deep Neural Networks[J]. Acm Transactions on Graphics, 2016, 35(2):11.
Gatys L A, Ecker A S, Bethge M. Image Style Transfer Using Convolutional Neural Networks[C]// Computer Vision and Pattern Recognition. IEEE, 2016:2414-2423.
Isola P, Zhu J Y, Zhou T, et al. Image-to-Image Translation with Conditional Adversarial Networks[J]. 2016.
Luan F, Paris S, Shechtman E, et al. Deep Photo Style Transfer[J]. 2017.
Zhu J Y, Park T, Isola P, et al. Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks[J]. 2017.
Baraldi L, Grana C, Cucchiara R. Scene-driven Retrieval in Edited Videos using Aesthetic and Semantic Deep Features[J]. 2016:23-29.
Li D, Wu H, Zhang J, et al. A2-RL: Aesthetics Aware Reinforcement Learning for Automatic Image Cropping[J]. 2017.

近期热文

《这样做，你的面试成功率将达到 90%》

《如何用 TensorFlow 让一切看起来更美？》

《Web 安全：前端攻击 XSS 深入解析》

《300万粉丝，全国最大的线上抽奖平台，深度解析》

《高可用、高性能？接口设计的 16 个原则》

免费福利

「阅读原文」看交流实录，你想知道的都在这里

你可能感兴趣的:(深度学习在摄影技术中的应用与发展)

在PyTorch框架上训练ImageNet时，Dataloader加载速度慢怎么解决？ cda2024 pytorch 人工智能 python
在深度学习领域，PyTorch因其灵活性和易用性而受到广泛欢迎。然而，在实际应用中，特别是在处理大规模数据集如ImageNet时，Dataloader的加载速度往往成为瓶颈。本文将深入探讨这一问题，并提供多种解决方案，帮助你在PyTorch框架上高效地训练ImageNet。1.问题背景ImageNet是一个包含超过1400万张图像的大规模数据集，被广泛用于图像分类任务的研究。在PyTorch中，D
Python已正确安装Numpy但无法调用？——探索背后的奥秘 cda2024 python numpy 开发语言
在Python编程的世界里，Numpy作为一款重要的科学计算库，其高效的数据处理能力深受广大开发者喜爱。然而，有时候我们明明已经成功安装了Numpy库，却在尝试导入时遇到种种问题，例如常见的ModuleNotFoundError或ImportError错误信息。这不仅令人困惑，甚至会中断我们的开发进度。那么，问题究竟出在哪里呢？本文将深入探讨这一现象背后的原因，并提出有效的解决方案。一、理解Num
【pip安装时报错403】WARNING: Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None)) 待磨的钝刨 pip http 网络协议
文章目录可能由于设置了代理，导致不信任相关主机。1.在后面加`--trusted-host`选项用于指定信任的主机。2.设置代理后进行安装2.1关闭代理2.2.用你的代理服务器地址、端口以及认证信息替换示例中的内容。3.换成手机热点直接解决可能由于设置了代理，导致不信任相关主机。HTTP403错误通常表示访问被拒绝，可能是由于权限问题导致的。这可能是由于访问限制、认证问题或网络代理等原因引起的。1
Leecode刷题C语言之最少翻转次数使二进制矩阵回文① 带多刺的玫瑰 c语言开发语言
执行结果:通过执行用时和内存消耗如下：题目：最少翻转次数使二进制矩阵回文①给你一个mxn的二进制矩阵grid。如果矩阵中一行或者一列从前往后与从后往前读是一样的，那么我们称这一行或者这一列是回文的。你可以将grid中任意格子的值翻转，也就是将格子里的值从0变成1，或者从1变成0。请你返回最少翻转次数，使得矩阵要么所有行是回文的，要么所有列是回文的。示例1：输入：grid=[[1,0,0],[0,0
Leecode刷题C语言之统计好节点的数目带多刺的玫瑰 c语言算法数据结构
执行结果:通过执行用时和内存消耗如下：题目：统计好节点的数目现有一棵无向树，树中包含n个节点，按从0到n-1标记。树的根节点是节点0。给你一个长度为n-1的二维整数数组edges，其中edges[i]=[ai,bi]表示树中节点ai与节点bi之间存在一条边。如果一个节点的所有子节点为根的子树包含的节点数相同，则认为该节点是一个好节点。返回给定树中好节点的数量。子树指的是一个节点以及它所有后代节点构
迈入数智时代的恒生电子：四大新品推动金融数智化从量变走向质变数据猿算法大数据人工智能机器学习区块链
数据智能产业创新服务媒体——聚焦数智·改变商业最近两三年，国内金融科技行业风云迭起。而随着《数据安全法》、《征信业管理条例》和《征信业务管理办法》等一系列法规政策的相继出台，金融科技将步入良性发展轨道。中国人民银行行长易纲日前在国际清算银行（BIS）监管大型科技公司国际会议上表示，在数字经济时代，金融与科技融合发展是全球性趋势，科技向善是人类命运共同体的内在要求，如何在提升金融业创新能力的同时防范
来聊一聊 ElasticSearch 最新版的 Java 客户端 Java程序V Java elasticsearch java 大数据
可能不少小伙伴都注意到了，从ElasticSearch7.17这个版本开始，原先的Java高级客户端JavaHighLevelRESTClient废弃了，不支持了。老实说，ElasticSearch算是我用过的所有Java工具中，更新最为激进的一个了，在Es7中废弃了TransportClient，7.17又废弃了TransportClient，那么现在用啥呢？现在的客户端叫做Elasticsea
用AI生成PPT，办公效率提升新方式 HUIPPT剑盾ai 人工智能科技 powerpoint 软件 aigc
用AI生成PPT，办公效率提升新方式！在快节奏的时代，如何优雅应对高效办公的挑战？或许你也有这样的经历：开会前临时被要求制作PPT，一阵头大，却只能硬着头皮上。科技的发展为我们带来了更智能的解决方案，比如AI制作PPT，让原本耗时费力的工作变得轻松快捷。现在AI技术正悄然改变我们的办公方式，其中AI生成PPT无疑是效率提升的利器。它不仅能帮你快速完成PPT设计，还能实现内容精准匹配，甚至根据需求优
Python 获取管理员权限一台电脑可以让你哭吗 Python python 开发语言
方法一：使用ctypes库调用系统APIPython中的【ctypes】库允许我们调用操作系统的动态链接库函数，来获取管理员权限。importctypesimportsysdefis_admin():try:returnctypes.windll.shell32.IsUserAnAdmin()except:returnFalseifnotis_admin():ctypes.windll.shell
【QT进阶】Qt线程与并发之线程和并发的简单介绍不吃~香菜 QT进阶 qt 开发语言线程并发
往期回顾：【QT进阶】Qthttp编程之实现websocketserver服务器端-CSDN博客【QT进阶】Qthttp编程之实现websocketclient客户端-CSDN博客【QT进阶】Qt线程与并发之创建线程的三种方法(超详细介绍)-CSDN博客【QT进阶】Qt线程与并发之线程和并发的简单介绍一、什么是线程和并发主要是做一个简单的补充说明1、线程线程是程序执行的最小单元，是操作系统能够进行
es+kibana+logstash快速安装上手 DoloresOOO elk elk docker docker-compose linux
Elasticsearch安装上手Elasticsearch安装与简单配置目录结构bin脚本文件，启动脚本，安装插件，运行统计数据等config集群配置文件JDKjava运行环境data数据文件libjava类库logs日志文件modules包含所有的ES模块plugins包含所有已安装的插件JVM配置修改jvm-config/jvm.options7.1下载的默认是1GB配置的建议Xmx和Xms
效率提升70%，迁移时间减半！Denodo平台破解数据编织部署5大难题 Denodo 大数据数据库人工智能数据分析数据仓库数据编织数据库架构
在如今数据驱动的时代，数据编织已逐步成为企业数据管理的关键技术。无论是每天处理数百次查询的小规模部署，还是涉及数百名开发人员、数千次查询并且需要同时监控多个环境的大规模部署，管理数据编织部署都面临着一系列挑战。本文将深度解析如何利用Denodo平台的强大功能，帮助企业高效应对这些挑战，并确保数据编织部署的顺利实施。一、数据编织部署的5大常见挑战多团队协作冲突在大型项目中，不同开发团队可能同时修改相
参照和谐色调为PPT图形设置统一格式的要点 PPT百科 powerpoint 人工智能 ppt 经验分享
大家好～今天和大家聊一聊PPT设计中如何通过和谐色调为图形设置统一格式，让整体设计看起来既专业又有视觉吸引力。PPT不仅仅是一个展示工具，它更是传达信息的载体。无论是公司汇报、学术展示，还是产品推广，一个有条理、色调统一的PPT都能大大提升你的演示效果。而和谐色调的应用，不仅能让你的图形更具美感，还能提高观众的理解力和记忆度。所以，今天我们就来深入探讨一下，如何在PPT设计中使用色调来为图形设置统
使用 Goroutines 和 Channels 实现高效并发编程
Go是一门以并发为核心设计的编程语言，其Goroutines和Channels提供了轻量级且高效的并发模型。在现代软件开发中，性能和并发是两个至关重要的因素，而Go的设计让开发者能够以一种简单、直观的方式实现高效的并发程序。本文将深入探讨Goroutines和Channels的核心原理，分析它们的实际使用场景，并通过代码示例展示如何利用它们构建高效的并发应用程序。Goroutines：轻量级的并发
招聘 | 具身智能机器人方向全职作者量子位
关注前沿科技量子位未来同事你好。你知道“具身智能机器人”了吗？是否希望成为这个时代性技术和产品的长期报道者？现在，我们正在招聘这样一位专注于具身智能机器人方向的原创作者。岗位是全职，工作地点base：北京中关村。工作职责：1、关注具身智能领域新动态新进展；2、持续挖掘撰写具身智能独家原创内容；3、与具身智能领域玩家建立良好联系；4、构建体系化认知和行业洞察。岗位要求：1、对具身智能、前沿科技等科技
Vue - watchEffect()的使用来一碗刘肉面 Vue vue.js javascript 前端
在Vue3中，watchEffect()是一个用于自动追踪响应式数据变化并执行副作用的API。与watch()不同，watchEffect()不需要手动指定要观察的数据，而是会自动根据内部访问的响应式数据进行依赖追踪。这使得watchEffect()更加简洁和直观，适用于某些需要副作用的场景。简单说：立即执行一个函数，同时响应式地追踪其依赖，并在依赖的数据更改时重新执行该函数。基本语法：watch
C语言【指针】(1) 姜行运 c语言算法 c++
指针1.内存和地址2.指针变量和地址2.1取地址操作符（&）2.2指针变量和解引⽤操作符（*）3.assert断言4.const修饰指针5.指针的使用和传址调用1.内存和地址我们知道计算机上CPU（中央处理器）在处理数据的时候，需要的数据是在内存中读取的，处理后的数据也会放回内存中，电脑上内存是8GB/16GB/32GB等，那这些内存空间如何⾼效的管理呢？其实也是把内存划分为⼀个个的内存单元，每个
深度学习篇---Anaconda&LabelImg Ronin-Lotus 深度学习篇深度学习人工智能学习 python 程序人生机器学习计算机视觉
文章目录前言第一部分：Anaconda是什么？1.简介2.特点（1）包管理器Conda（2）环境管理（3）预装包（4）跨平台（5）社区支持3.安装WindowsLinux3.基本命令（1）conda--version（2）condaupdateconda（3）condacreate--namemyenvpython=3.6（4）condaactivatemyenv（5）condadeactivat
基于dlib/face recognition人脸识别推拉流实现 #北极星star 人脸识别 opencv 计算机视觉人工智能
目录一.环境搭建二.推拉流代码三.人脸检测推拉流一.环境搭建1.下载RTSP服务器MediaMTX与FFmpegFFmpeg是一款功能强大的开源多媒体处理工具，而MediaMTX则是一个轻量级的流媒体服务器。两者结合，可以实现将本地视频或者实时摄像头画面推送到RTSP流，从而实现视频直播、监控等功能。FFmpeg:负责将本地视频或实时摄像头画面编码成RTSP流所需要的格式，并发送给MediaMTX
Apache Tika 详解王小工开源 apache
ApacheTika是一个开源的、跨平台的库，专门用于检测、提取和解析多种文件格式的元数据。以下是对ApacheTika的详细解析：一、概述ApacheTika旨在为各种类型的数据提取提供一个单一的API，它支持多种文件格式，包括文档、图片、音频和视频等。作为一个底层库，Tika经常无缝地集成到其他应用或服务中，以增强对文件内容处理的能力。它广泛应用于搜索引擎的资料整理、内容管理系统的内容提取以及
CentOS 7.9(linux) 设置 MySQL 8.0.30 开机启动详解小胡说技书手册/开发图谱运维 Java+SSM+DB linux centos mysql
文章目录一、运行级别简介二、MySQL服务安装与运行验证三、通过chkconfig配置开机启动四、验证开机启动配置五、总结一、运行级别简介运行级别（Runlevel）定义了系统的运行模式，常见的运行级别如下：运行级别描述0关机模式（系统停止运行）。1单用户模式（维护模式，类似安全模式）。2多用户模式，无网络支持。3完整的多用户模式，带网络支持（常用）。4用户自定义模式（通常未使用）。5图形界面模式
Python如何声明以管理员方式运行？ cda2024 python 开发语言
Python作为一门高级编程语言，以其简洁优雅的语法和丰富的库支持，在数据科学、网络爬虫、自动化脚本等领域有着广泛的应用。但在实际开发过程中，有时会遇到需要获取较高权限才能完成的任务，比如访问某些系统文件夹或者执行一些系统级别的操作。这时，就需要我们让Python程序以管理员身份运行了。那么，Python是如何做到这一点的呢？本文将带您深入了解Python声明以管理员方式运行的方法，并通过实际案例
【学习总结|DAY034】Maven高级 123yhy传奇学习 maven java
在Web后端开发中，Maven作为强大的项目管理工具，其高级特性对于优化项目结构、提高开发效率至关重要。本文将结合实际代码示例，深入介绍Maven的分模块设计与开发、继承与聚合以及私服相关知识。一、分模块设计与开发（一）为什么要分模块设计将项目按功能拆分为多个子模块，能极大提升项目的可维护性、扩展性，方便模块间调用与资源共享。以电商项目为例，若将商品、搜索、购物车、订单等功能混在一个模块，代码会变
python mysql库的三个库mysqlclient mysql-connector-python pymysql如何选择，他们之间的区别 zhangfeng1133 数据库 python mysql
三者的区别1.mysqlclient特点：是一个用于Python的MySQL数据库驱动程序，用于与MySQL数据库进行交互。依赖于MySQL的本地库，因此在安装时需要确保系统上已安装了必要的依赖项，如libmysqlclient-dev等。性能较好，但安装过程可能较为复杂，尤其是在某些操作系统上。安装：直接使用pip安装可能会遇到各种问题，如缺少依赖项、编译失败等。可以尝试使用预编译的二进制文件（
连通区域计算选与握 #图像处理
（一）two-pass四邻域连通区域计算1、先将图像二值化2、第一次按行扫描图像时，图像中的每个像素值从上到下，从左到右扫描，给每一个有效的像素值一个标签label，规则如下：（1）如果该像素的4邻域中左边像素值和上边像素值都为0且都没有标签，则给该像素一个新的标签label（2）如果该像素的4邻域中左边像素值或上边像素值有一个为1，则该像素的标签是像素值为1的标签（3）如果该像素的4邻域中左边像
java.lang.NoClassDefFoundError 报错解决 GeniuswongAir java 开发语言
找不到Class的报错原因有很多种，无非是文件路径、包名、AndroidManifest.xml配置、缓存、等等。我这个的原因是，在Kotlin包里面导入了一个java写的Activity，导致不找到Class。解决：（加上这个配置就好了）android{sourceSets{main{java.srcDirs+='src/main/kotlin'}}FATALEXCEPTION:mainProc
把gphoto2弄到Android手机上，来控制单反相机 GeniuswongAir android kotlin
2024年更新内容：之前很难的事情，现在来看，很轻松就实现了。今年空余时间比较多，我已经把iOS版本开发出来了，目前支持索尼、佳能、尼康；把gphoto2弄到Android手机上，来控制单反相机OTG线把相机和Android手机连起来，控制相机但是，做件事都不会那么容易的。先是发现了gphoto2这个全世界最全的相机控制的开源库，通过ndk交叉编译是可以在Android上运行的。现在的问题就是，编
Kafka 生产者中的ack的配置欧阳冰轩 Kafka kafka 分布式
在同步发送的前提下，⽣产者在获得集群返回的ack之前会⼀直阻塞。那么集群什么时候返回ack呢？此时ack有3个配置：1.ack=0kafka-cluster不需要任何的broker收到消息，就⽴即返回ack给⽣产者，最容易丢消息的，效率是最⾼的2.ack=1（默认）：多副本之间的leader已经收到消息，并把消息写⼊到本地的log中，才会返回ack给⽣产者，性能和安全性是最均衡的3.ack=-1/
Autosar代码中SchM模块在忙活什么说不得明天 Autosar模块在忙活什么 java 开发语言
写在前面：入行一段时间了，基于个人理解整理一些东西，如有错误，欢迎各位大佬评论区指正！！！在初始化代码中可以看到EcuM_StartupTwo中有两行代码，调用了SchM_Init和SchM_StartTiming两个函数。那么SchM模块又是什么作用呢？1.功能说明它用于调度和管理基础软件模块中的任务和事件。SchM提供了任务的启动、停止和同步等功能，确保各个基础软件模块能够有序地执行。SchM
C动态库的生成与在Python和QT中的调用方法琳琳简单点 python 开发语言 qt c++c语言
目录一、动态库生成1）C语言生成动态库2）c++类生成动态库二、动态库调用1）Python调用DLL2）QT调用DLL三、存在的一些问题1）python调用封装了类的DLL可能调用不成功2）DLL格式不匹配的问题四、总结动态库文件在程序开发中运用很常见，但C和C++代码生成动态库文件，以及在使用时均存在一些差异，本文对两者的差异进行了讲解，并通过具体的实例加以说明。实例均在Windows系统下进行
java工厂模式 3213213333332132 java 抽象工厂
工厂模式有 1、工厂方法 2、抽象工厂方法。下面我的实现是抽象工厂方法, 给所有具体的产品类定一个通用的接口。 package 工厂模式; /** * 航天飞行接口 * * @Description * @author FuJianyong * 2015-7-14下午02:42:05 */ public interface SpaceF
nginx频率限制+python测试 ronin47 nginx 频率 python
部分内容参考：http://www.abc3210.com/2013/web_04/82.shtml 首先说一下遇到这个问题是因为网站被攻击，阿里云报警，想到要限制一下访问频率，而不是限制ip（限制ip的方案稍后给出）。nginx连接资源被吃空返回状态码是502，添加本方案限制后返回599，与正常状态码区别开。步骤如下：
java线程和线程池的使用 dyy_gusi ThreadPool thread Runnable timer
java线程和线程池一、创建多线程的方式 java多线程很常见，如何使用多线程，如何创建线程，java中有两种方式，第一种是让自己的类实现Runnable接口，第二种是让自己的类继承Thread类。其实Thread类自己也是实现了Runnable接口。具体使用实例如下： 1、通过实现Runnable接口方式 1 2
Linux 171815164 linux
ubuntu kernel http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.1.2-unstable/ 安卓sdk代理 mirrors.neusoft.edu.cn 80 输入法和jdk sudo apt-get install fcitx su
Tomcat JDBC Connection Pool g21121 Connection
Tomcat7 抛弃了以往的DBCP 采用了新的Tomcat Jdbc Pool 作为数据库连接组件，事实上DBCP已经被Hibernate 所抛弃，因为他存在很多问题，诸如：更新缓慢，bug较多，编译问题，代码复杂等等。 Tomcat Jdbc P
敲代码的一点想法永夜-极光 java 随笔感想
入门学习java编程已经半年了,一路敲代码下来,现在也才1w+行代码量,也就菜鸟水准吧,但是在整个学习过程中,我一直在想,为什么很多培训老师,网上的文章都是要我们背一些代码?比如学习Arraylist的时候,教师就让我们先参考源代码写一遍,然
jvm指令集程序员是怎么炼成的 jvm 指令集
转自：http://blog.csdn.net/hudashi/article/details/7062675#comments 将值推送至栈顶时 const ldc push load指令 const系列该系列命令主要负责把简单的数值类型送到栈顶。(从常量池或者局部变量push到栈顶时均使用) 0x02 &nbs
Oracle字符集的查看查询和Oracle字符集的设置修改 aijuans oracle
本文主要讨论以下几个部分：如何查看查询oracle字符集、修改设置字符集以及常见的oracle utf8字符集和oracle exp 字符集问题。一、什么是Oracle字符集 Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储，处理，检索数据。它使数据库工具，错误消息，排序次序，日期，时间，货
png在Ie6下透明度处理方法 antonyup_2006 css 浏览器 Firebug IE
由于之前到深圳现场支撑上线，当时为了解决个控件下载，我机器上的IE8老报个错，不得以把ie8卸载掉，换个Ie6,问题解决了，今天出差回来，用ie6登入另一个正在开发的系统，遇到了Png图片的问题，当然升级到ie8(ie8自带的开发人员工具调试前端页面JS之类的还是比较方便的，和FireBug一样，呵呵)，这个问题就解决了，但稍微做了下这个问题的处理。我们知道PNG是图像文件存储格式，查询资
表查询常用命令高级查询方法(二) 百合不是茶 oracle 分页查询分组查询联合查询
----------------------------------------------------分组查询 group by having --平均工资和最高工资 select avg(sal)平均工资,max(sal) from emp ; --每个部门的平均工资和最高工资
uploadify3.1版本参数使用详解 bijian1013 JavaScript uploadify3.1
使用：绑定的界面元素<input id='gallery'type='file'/>$("#gallery").uploadify({设置参数，参数如下}); 设置的属性： id: jQuery(this).attr('id'),//绑定的input的ID langFile: 'http://ww
精通Oracle10编程SQL(17)使用ORACLE系统包 bijian1013 oracle 数据库 plsql
/* *使用ORACLE系统包 */ --1.DBMS_OUTPUT --ENABLE:用于激活过程PUT,PUT_LINE,NEW_LINE,GET_LINE和GET_LINES的调用 --语法：DBMS_OUTPUT.enable(buffer_size in integer default 20000); --DISABLE:用于禁止对过程PUT,PUT_LINE,NEW
【JVM一】JVM垃圾回收日志 bit1129 垃圾回收
将JVM垃圾回收的日志记录下来，对于分析垃圾回收的运行状态，进而调整内存分配(年轻代，老年代，永久代的内存分配)等是很有意义的。JVM与垃圾回收日志相关的参数包括： -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -Xloggc -XX:+PrintGC 通
Toast使用白糖_ toast
Android中的Toast是一种简易的消息提示框，toast提示框不能被用户点击，toast会根据用户设置的显示时间后自动消失。创建Toast 两个方法创建Toast makeText(Context context, int resId, int duration) 参数：context是toast显示在
angular.identity boyitech AngularJS AngularJS API
angular.identiy 描述: 返回它第一参数的函数. 此函数多用于函数是编程. 使用方法: angular.identity(value); 参数详解: Param Type Details value * to be returned. 返回值: 传入的value 实例代码: <!DOCTYPE HTML>
java-两整数相除，求循环节 bylijinnan java
import java.util.ArrayList; import java.util.List; public class CircleDigitsInDivision { /** * 题目：求循环节，若整除则返回NULL，否则返回char*指向循环节。先写思路。函数原型：char*get_circle_digits(unsigned k,unsigned j)
Java 日期周年 Chen.H java C++c C#
/** * java日期操作(月末、周末等的日期操作) * * @author * */ public class DateUtil { /** */ /** * 取得某天相加(减)後的那一天 * * @param date * @param num *
[高考与专业]欢迎广大高中毕业生加入自动控制与计算机应用专业 comsci 计算机
不知道现在的高校还设置这个宽口径专业没有,自动控制与计算机应用专业,我就是这个专业毕业的,这个专业的课程非常多,既要学习自动控制方面的课程,也要学习计算机专业的课程,对数学也要求比较高.....如果有这个专业,欢迎大家报考...毕业出来之后,就业的途径非常广..... 以后
分层查询（Hierarchical Queries） daizj oracle 递归查询层次查询
Hierarchical Queries If a table contains hierarchical data, then you can select rows in a hierarchical order using the hierarchical query clause: hierarchical_query_clause::= start with condi
数据迁移 daysinsun 数据迁移
最近公司在重构一个医疗系统，原来的系统是两个.Net系统，现需要重构到java中。数据库分别为SQL Server和Mysql，现需要将数据库统一为Hana数据库，发现了几个问题，但最后通过努力都解决了。 1、原本通过Hana的数据迁移工具把数据是可以迁移过去的，在MySQl里面的字段为TEXT类型的到Hana里面就存储不了了，最后不得不更改为clob。 2、在数据插入的时候有些字段特别长
C语言学习二进制的表示示例 dcj3sjt126com c basic
进制的表示示例 # include <stdio.h> int main(void) { int i = 0x32C; printf("i = %d\n", i); /* printf的用法 %d表示以十进制输出 %x或%X表示以十六进制的输出 %o表示以八进制输出 */ return 0; }
NsTimer 和 UITableViewCell 之间的控制 dcj3sjt126com ios
情况是这样的: 一个UITableView, 每个Cell的内容是我自定义的 viewA viewA上面有很多的动画, 我需要添加NSTimer来做动画, 由于TableView的复用机制, 我添加的动画会不断开启, 没有停止, 动画会执行越来越多. 解决办法: 在配置cell的时候开始动画, 然后在cell结束显示的时候停止动画查找cell结束显示的代理
MySql中case when then 的使用 fanxiaolong casewhenthenend
select "主键", "项目编号", "项目名称","项目创建时间", "项目状态","部门名称","创建人" union (select pp.id as "主键", pp.project_number as &
Ehcache（01）——简介、基本操作 234390216 cache ehcache 简介 CacheManager crud
Ehcache简介目录 1 CacheManager 1.1 构造方法构建 1.2 静态方法构建 2 Cache 2.1&
最容易懂的javascript闭包学习入门 jackyrong JavaScript
http://www.ruanyifeng.com/blog/2009/08/learning_javascript_closures.html 闭包（closure）是Javascript语言的一个难点，也是它的特色，很多高级应用都要依靠闭包实现。下面就是我的学习笔记，对于Javascript初学者应该是很有用的。一、变量的作用域要理解闭包，首先必须理解Javascript特殊
提升网站转化率的四步优化方案 php教程分享数据结构 PHP 数据挖掘 Google 活动
网站开发完成后,我们在进行网站优化最关键的问题就是如何提高整体的转化率，这也是营销策略里最最重要的方面之一，并且也是网站综合运营实例的结果。文中分享了四大优化策略：调查、研究、优化、评估，这四大策略可以很好地帮助用户设计出高效的优化方案。 PHP开发的网站优化一个网站最关键和棘手的是，如何提高整体的转化率，这是任何营销策略里最重要的方面之一，而提升网站转化率是网站综合运营实力的结果。今天，我就分
web开发里什么是HTML5的WebSocket？ naruto1990 Web html5 浏览器 socket
当前火起来的HTML5语言里面，很多学者们都还没有完全了解这语言的效果情况，我最喜欢的Web开发技术就是正迅速变得流行的 WebSocket API。WebSocket 提供了一个受欢迎的技术，以替代我们过去几年一直在用的Ajax技术。这个新的API提供了一个方法，从客户端使用简单的语法有效地推动消息到服务器。让我们看一看6个HTML5教程介绍里的 WebSocket API：它可用于客户端、服
Socket初步编程——简单实现群聊 Everyday都不同 socket 网络编程初步认识
初次接触到socket网络编程，也参考了网络上众前辈的文章。尝试自己也写了一下，记录下过程吧：服务端：（接收客户端消息并把它们打印出来） public class SocketServer { private List<Socket> socketList = new ArrayList<Socket>(); public s
面试：Hashtable与HashMap的区别（结合线程） toknowme
昨天去了某钱公司面试，面试过程中被问道 Hashtable与HashMap的区别？当时就是回答了一点，Hashtable是线程安全的，HashMap是线程不安全的，说白了，就是Hashtable是的同步的，HashMap不是同步的，需要额外的处理一下。今天就动手写了一个例子，直接看代码吧 package com.learn.lesson001; import java
MVC设计模式的总结 xp9802 设计模式 mvc 框架 IOC
随着Web应用的商业逻辑包含逐渐复杂的公式分析计算、决策支持等，使客户机越来越不堪重负，因此将系统的商业分离出来。单独形成一部分，这样三层结构产生了。其中‘层’是逻辑上的划分。三层体系结构是将整个系统划分为如图2.1所示的结构[3] （1）表现层（Presentation layer）：包含表示代码、用户交互GUI、数据验证。该层用于向客户端用户提供GUI交互，它允许用户