提高駕駛技術：用GAN去除(愛情)動作片中的馬賽克和衣服

作爲一名久經片場的老司機，早就想寫一些探討駕駛技術的文章。這篇就介紹利用生成式對抗網絡（GAN）的兩個基本駕駛技能：

1) 去除(愛情)動作片中的馬賽克

2) 給(愛情)動作片中的女孩穿(tuo)衣服

生成式模型

上一篇《用GAN生成二維樣本的小例子》中已經簡單介紹了GAN，這篇再簡要回顧一下生成式模型，算是補全一個來龍去脈。

生成模型就是能夠產生指定分佈數據的模型，常見的生成式模型一般都會有一個用於產生樣本的簡單分佈。例如一個均勻分佈，根據要生成分佈的概率密度函數，進行建模，讓均勻分佈中的樣本經過變換得到指定分佈的樣本，這就可以算是最簡單的生成式模型。比如下面例子：

圖中左邊是一個自定義的概率密度函數，右邊是相應的1w個樣本的直方圖，自定義分佈和生成這些樣本的代碼如下：

from functools import partial

import numpy

from matplotlib import pyplot

# Define a PDF

x_samples = numpy.arange(-3, 3.01, 0.01)

PDF = numpy.empty(x_samples.shape)

PDF[x_samples < 0] = numpy.round(x_samples[x_samples < 0] + 3.5) / 3

PDF[x_samples >= 0] = 0.5 * numpy.cos(numpy.pi * x_samples[x_samples >= 0]) + 0.5

PDF /= numpy.sum(PDF)

# Calculate approximated CDF

CDF = numpy.empty(PDF.shape)

cumulated = 0

for i in range(CDF.shape[0]):

cumulated += PDF[i]

CDF[i] = cumulated

# Generate samples

generate = partial(numpy.interp, xp=CDF, fp=x_samples)

u_rv = numpy.random.random(10000)

x = generate(u_rv)

# Visualization

fig, (ax0, ax1) = pyplot.subplots(ncols=2, figsize=(9, 4))

ax0.plot(x_samples, PDF)

ax0.axis([-3.5, 3.5, 0, numpy.max(PDF)*1.1])

ax1.hist(x, 100)

pyplot.show()

對於一些簡單的情況，我們會假設已知有模型可以很好的對分佈進行建模，缺少的只是合適的參數。這時候很自然只要根據觀測到的樣本，學習參數讓當前觀測到的樣本下的似然函數最大，這就是最大似然估計(Maximum Likelihood Estimation)：

MLE是一個最基本的思路，實踐中用得很多的還有KL散度(Kullback–Leibler divergence)，假設真實分佈是P，採樣分佈是Q，則KL散度爲：

從公式也能看出來，KL散度描述的是兩個分佈的差異程度。換個角度來看，讓產生的樣本和原始分佈接近，也就是要讓這倆的差異減小，所以最小化KL散度就等同於MLE。從公式上來看的話，我們考慮把公式具體展開一下：

公式的第二項就是熵，先不管這項，用H(P)表示。接下來考慮一個小trick：從Q中抽樣n個樣本{x1, x2, ..., xn}，來估算P(x)的經驗值(empirical density function)：

其中 δ() 是狄拉克 δ 函數，把這項替換到上面公式的P(x)：

因爲是離散的採樣值，所以

中只有 x=xi 的時候狄拉克 δ 函數才爲1，所以考慮 x=xi 時這項直接化爲 1：

第一項正是似然的負對數形式。

說了些公式似乎跑得有點遠了，其實要表達還是那個簡單的意思：通過減小兩個分佈的差異可以讓一個分佈逼近另一個分佈。仔細想想，這正是GAN裏面adversarial loss的做法。

很多情況下我們面臨的是更爲複雜的分佈，比如上篇文章中的例子，又或是實際場景中更復雜的情況，比如生成不同人臉的圖像。這時候，作爲具有universal approximation性質的神經網絡是一個看上去不錯的選擇[1]：

所以雖然GAN裏面同時包含了生成網絡和判別網絡，但本質來說GAN的目的還是生成模型。從生成式模型的角度，Ian Goodfellow總結過一個和神經網絡相關生成式方法的「家譜」[1]：

在這其中，當下最流行的就是 GAN 和 Variational AutoEncoder(VAE)，兩種方法的一個簡明示意如下[3]：

本篇不打算展開講什麼是VAE，不過通過這個圖，和名字中的autoencoder也大概能知道，VAE中生成的loss是基於重建誤差的。而只基於重建誤差的圖像生成，都或多或少會有圖像模糊的缺點，因爲誤差通常都是針對全局。比如基於MSE(Mean Squared Error)的方法用來生成超分辨率圖像，容易出現下面的情況[4]：

在這個二維示意中，真實數據分佈在一個U形的流形上，而MSE系的方法因爲loss的形式往往會得到一個接近平均值所在的位置（藍色框）。

GAN在這方面則完爆其他方法，因爲目標分佈在流形上。所以只要大概收斂了，就算生成的圖像都看不出是個啥，清晰度常常是有保證的，而這正是去除女優身上馬賽克的理想特性！

馬賽克->清晰畫面：超分辨率(Super Resolution)問題

說了好些鋪墊，終於要進入正題了。首先明確，去馬賽克其實是個圖像超分辨率問題，也就是如何在低分辨率圖像基礎上得到更高分辨率的圖像：

視頻中超分辨率實現的一個套路是通過不同幀的低分辨率畫面猜測超分辨率的畫面，有興趣瞭解這個思想的朋友可以參考我之前的一個答案：如何通過多幀影像進行超分辨率重構？

不過基於多幀影像的方法對於女優身上的馬賽克並不是很適用，所以這篇要講的是基於單幀圖像的超分辨率方法。

SRGAN

說到基於GAN的超分辨率的方法，就不能不提到SRGAN[4]：《Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network》。這個工作的思路是：基於像素的MSE loss往往會得到大體正確，但是高頻成分模糊的結果。所以只要重建低頻成分的圖像內容，然後靠GAN來補全高頻的細節內容，就可以了：

這個思路其實和最早基於深度網絡的風格遷移的思路很像（有興趣的讀者可以參考我之前文章瞎談CNN：通過優化求解輸入圖像的最後一部分），其中重建內容的content loss是原始圖像和低分辨率圖像在VGG網絡中的各個ReLU層的激活值的差異：

生成細節adversarial loss就是GAN用來判別是原始圖還是生成圖的loss：

把這兩種loss放一起，取個名叫perceptual loss。訓練的網絡結構如下：

正是上篇文章中講過的C-GAN，條件C就是低分辨率的圖片。SRGAN生成的超分辨率圖像雖然PSNR等和原圖直接比較的傳統量化指標並不是最好，但就視覺效果，尤其是細節上，勝過其他方法很多。比如下面是作者對比bicubic插值和基於ResNet特徵重建的超分辨率的結果：

可以看到雖然很多細節都和原始圖片不一樣，不過看上去很和諧，並且細節的豐富程度遠勝於SRResNet。這些栩栩如生的細節，可以看作是GAN根據學習到的分佈信息「聯想」出來的。

對於更看重「看上去好看」的超分辨率應用，SRGAN顯然是很合適的。當然對於一些更看重重建指標的應用，比如超分辨率恢復嫌疑犯面部細節，SRGAN就不可以了。

pix2pix

雖然專門用了一節講SRGAN，但本文用的方法其實是pix2pix[5]。這項工作剛在arxiv上發佈就引起了不小的關注，它巧妙的利用GAN的框架解決了通用的Image-to-Image translation的問題。舉例來說，在不改變分辨率的情況下：把照片變成油畫風格；把白天的照片變成晚上；用色塊對圖片進行分割或者倒過來；爲黑白照片上色；…每個任務都有專門針對性的方法和相關研究，但其實總體來看，都是像素到像素的一種映射啊，其實可以看作是一個問題。這篇文章的巧妙，就在於提出了pix2pix的方法，一個框架，解決所有這些問題。方法的示意圖如下：

就是一個Conditional GAN，條件C是輸入的圖片。除了直接用C-GAN，這項工作還有兩個改進：

1）利用U-Net結構生成細節更好的圖片[6]

U-Net是德國Freiburg大學模式識別和圖像處理組提出的一種全卷積結構。和常見的先降採樣到低維度，再升採樣到原始分辨率的編解碼(Encoder-Decoder)結構的網絡相比，U-Net的區別是加入skip-connection，對應的feature maps和decode之後的同樣大小的feature maps按通道拼(concatenate)一起，用來保留不同分辨率下像素級的細節信息。U-Net對提升細節的效果非常明顯，下面是pix2pix文中給出的一個效果對比：

可以看到，各種不同尺度的信息都得到了很大程度的保留。

2）利用馬爾科夫性的判別器(PatchGAN)

pix2pix和SRGAN的一個異曲同工的地方是都有用重建解決低頻成分，用GAN解決高頻成分的想法。在pix2pix中，這個思想主要體現在兩個地方。一個是loss函數，加入了L1 loss用來讓生成的圖片和訓練的目標圖片儘量相似，而圖像中高頻的細節部分則交由GAN來處理：

還有一個就是 PatchGAN，也就是具體的GAN中用來判別是否生成圖的方法。PatchGAN的思想是，既然GAN只負責處理低頻成分，那麼判別器就沒必要以一整張圖作爲輸入，只需要對NxN的一個圖像patch去進行判別就可以了。這也是爲什麼叫Markovian discriminator，因爲在patch以外的部分認爲和本patch互相獨立。

具體實現的時候，作者使用的是一個NxN輸入的全卷積小網絡，最後一層每個像素過sigmoid輸出爲真的概率，然後用BCEloss計算得到最終loss。這樣做的好處是因爲輸入的維度大大降低，所以參數量少，運算速度也比直接輸入一張快，並且可以計算任意大小的圖。作者對比了不同大小patch的結果，對於256x256的輸入，patch大小在70x70的時候，從視覺上看結果就和直接把整張圖片作爲判別器輸入沒什麼區別了：

生成帶局部馬賽克的訓練數據

利用pix2pix，只要準備好無碼和相應的有碼圖片就可以訓練去馬賽克的模型了，就是這麼簡單。那麼問題是，如何生成有馬賽克的圖片？

有毅力的話，可以手動加馬賽克，這樣最爲精準。這節介紹一個不那麼準，但是比隨機強的方法：利用分類模型的激活區域進行自動馬賽克標註。

基本思想是利用一個可以識別需要打碼圖像的分類模型，提取出這個模型中對應類的CAM（Class Activation Map）[7]，然後用馬賽克遮住響應最高的區域即可。這裏簡單說一下什麼是CAM，對於最後一層是全局池化(平均或最大都可以)的CNN結構，池化後的feature map相當於是做了個加權相加來計算最終的每個類別進入softmax之前的激活值。CAM的思路是，把這個權重在池化前的feature map上按像素加權相加，最後得到的單張的激活圖就可以攜帶激活當前類別的一些位置信息，這相當於一種弱監督（classification-->localization）：

上圖是一個CAM的示意，用澳洲梗類別的CAM，放大到原圖大小，可以看到小狗所在的區域大致是激活響應最高的區域。

那麼就缺一個可以識別XXX圖片的模型了，網上還恰好就有個現成的，yahoo於2016年發佈的開源色情圖片識別模型 Open NSFW(Not Safe For Work)，鏈接如下：

http://t.cn/RceUCu0

CAM的實現並不難，結合Open NSFW自動打碼的代碼和使用放在了這裏：

http://t.cn/Rop9Ak6

(成功打碼的)效果差不多是下面這樣子：

去除(愛情)動作片中的馬賽克

這沒什麼好說的了，一行代碼都不用改，只需要按照前面的步驟把數據準備好，然後按照pix2pix官方的使用方法訓練就可以了：

Torch版pix2pix：

http://t.cn/RfoJxZF

pyTorch版pix2pix(Cycle-GAN二合一版)：

http://t.cn/RXJHrUV

從D盤裏隨隨便便找了幾千張圖片，用來執行了一下自動打碼和pix2pix訓練(默認參數)，效果是下面這樣：

什麼？你問說好給女優去馬賽克呢？女優照片呢？

還是要說一下，在真人照片上的效果比蘑菇和花強。

對偶學習（Dual Learning）

去馬賽克已經講完了，接下來就是給女孩穿(tuo)衣服了，動手之前，還是先講一下鋪墊：對偶學習和 Cycle-GAN。

對偶學習是MSRA於2016年提出的一種用於機器翻譯的增強學習方法[8]，目的是解決海量數據配對標註的難題，個人覺得算是一種弱監督方法（不過看到大多數文獻算作無監督）。以機器翻譯爲例，對偶學習基本思想如下圖[9]：

左邊的灰衣男只懂英語，右邊的黑衣女只懂中文，現在的任務就是，要學習如何翻譯英語到中文。對偶學習解決這個問題的思路是：給定一個模型 f :x-y 剛開始無法知道f翻譯得是否正確，但是如果考慮上 f 的對偶問題 g:y-x，那麼我可以嘗試翻譯一個英文句子到中文，再翻譯回來。這種轉了一圈的結果 x'=g(f(x))，灰衣男是可以用一個標準（BLEU）判斷 x' 和 x 是否一個意思，並且把結果的一致性反饋給這兩個模型進行改進。同樣的，從中文取個句子，這樣循環翻譯一遍，兩個模型又能從黑衣女那裏獲取反饋並改進模型。其實這就是強化學習的過程，每次翻譯就是一個action，每個action會從環境（灰衣男或黑衣女）中獲取reward，對模型進行改進，直至收斂。

也許有的人看到這裏會覺得和上世紀提出的Co-training很像，這個在知乎上也有討論：

如何理解劉鐵巖老師團隊在NIPS 2016上提出的對偶學習（Dual Learning）？

個人覺得還是不一樣的，Co-Training是一種multi-view方法，比如一個輸入x，如果看作是兩個拼一起的特徵x=(x1, x2)，並且假設 x1 和 x2 互相獨立，那麼這時候訓練兩個分類器 f1() 和 f2() 對於任意樣本 x 應該有f1(x1)=f2(x2)。這對沒有標註的樣本是很有用的，相當於利用了同一個樣本分類結果就應該一樣的隱含約束。所以Co-Training的典型場景是少量標註+大量未標註的半監督場景。並且f1和f2其實是兩個不同，但是domain指向相同的任務。而Dual Learning中 f 和 g 是對偶任務，利用的隱含約束是 x-y-x 的cycle consistency。對輸入的特徵也沒有像Co-Training有那麼明確的假設，學習方法上也不一樣，Dual Learning算是強化學習。

CycleGAN和未配對圖像翻譯(Unpaired Image-to-Image Translation)

CycleGAN，翻譯過來就是：輪着幹，是結合了對偶學習和GAN一個很直接而巧妙的想法[10]，示意圖如下：

X和Y分別是兩種不同類型圖的集合，比如穿衣服的女優和沒穿衣服的女優。所以給定一張穿了衣服的女優，要變成沒穿衣服的樣子，就是個圖片翻譯問題。CycleGAN示意圖中(b)和(c)就是Dual Learning：

在Dual Learning基礎上，又加入了兩個判別器D_X和D_Y用來進行對抗訓練，讓翻譯過來的圖片儘量逼近當前集合中的圖片：

全考慮一起，最終的loss是：

也許有人會問，那不加cycle-consistency，直接用GAN學習一個X\rightarrow Y的映射，讓生成的Y的樣本儘量畢竟Y裏本身的樣本可不可以呢？這個作者在文中也討論了，會產生GAN訓練中容易發生的mode collapse問題。mode collapse問題的一個簡單示意如下[1]：

上邊的是真實分佈，下邊的是學習到的分佈，可以看到學習到的分佈只是完整分佈的一部分，這個叫做partial mode collapse，是訓練不收斂情況中常見的一種。如果是完全的mode collapse，就是說生成模型得到的都是幾乎一樣的輸出。而加入Cycle-consistency會讓一個domain裏不同的樣本都儘量映射到另一個domain裏不同的地方，理想情況就是雙射（bijection）。直觀來理解，如果通過X\rightarrow Y都映射在Y中同一個點，那麼這個點y通過Y\rightarrow X映射回來顯然不可能是多個不同的x，所以加入cycle-consistency就幫助避免了mode collapse。這個問題在另一篇和CycleGAN其實本質上沒什麼不同的方法DiscoGAN中有更詳細的討論[11]，有興趣的話可以參考。

有一點值得注意的是，雖然名字叫CycleGAN，並且套路也和C-GAN很像，但是其實只有adversarial，並沒有generative。因爲嚴格來說只是學習了X\rightarrow Y和Y\rightarrow X的mapping，所謂的generative network裏並沒有隨機性。有一個和CycleGAN以及DiscoGAN其實本質上也沒什麼不同的方法叫DualGAN[12]，倒是通過dropout把隨機性加上了。不過所有加了隨機性產生的樣本和原始樣本間的cycle-consistency用的還是l1 loss，總覺得這樣不是很對勁。當然現在GAN這麼熱門，其實只要是用了adversarial loss的基本都會取個名字叫XXGAN，也許是可以增加投稿命中率。

另外上節中提到了Co-Training，感覺這裏也應該提一下CoGAN[13]，因爲名字有些相似，並且也可以用於未配對的圖像翻譯。CoGAN的大體思想是：如果兩個Domain之間可以互相映射，那麼一定有一些特徵是共有的。比如男人和女人，雖然普遍可以從長相區分，但不變的是都有兩個眼睛一個鼻子一張嘴等等。所以可以在生成的時候，把生成共有特徵和各自特徵的部分分開，示意圖如下：

其實就是兩個GAN結構，其中生成網絡和判別網絡中比較高層的部分都採用了權值共享（虛線相連的部分），沒有全職共享的部分分別處理不同的domain。這樣每次就可以根據訓練的domain生成一個樣本在兩個domain中不同的對應，比如戴眼鏡和沒戴眼鏡：

分別有了共有特徵和各自domain特徵，那麼做mapping的思路也就很直接了[14]：

在GAN前邊加了個domain encoder，然後對每個domain能得到三種樣本給判別器區分：直接採樣，重建採樣，從另一個domain中transfer後的重建採樣。訓練好之後，用一個domain的encoder+另一個domain的generator就很自然的實現了不同domain的轉換。用在圖像翻譯上的效果如下：

還有個巧妙的思路，是把CoGAN拆開，不同domain作爲C-GAN條件的更加顯式的做法[15]：

第一步用噪聲Z作爲和domain無關的共享表徵對應的latent noise，domain信息作爲條件C訓練一個C-GAN。第二步，訓練一個encoder，利用和常見的encode-decode結構相反的decode(generate)-encode結構。學習好的encoder可以結合domain信息，把輸入圖像中和domain無關的共享特徵提取出來。第三步，把前兩步訓練好的encoder和decoder(generator)連一起，就可以根據domain進行圖像翻譯了。

CoGAN一系的方法雖然結構看起來更復雜，但個人感覺理解起來要比dual系的方法更直接，並且有latent space，可解釋性和屬性對應也好一些。

又扯遠了，還是回到正題：

給女優穿上衣服

其實同樣沒什麼好說的，Cycle-GAN和pix2pix的作者是一撥人，文檔都寫得非常棒，準備好數據，分成穿衣服的和沒穿衣服的兩組，按照文檔的步驟訓練就可以：

Torch版Cycle-GAN：

http://t.cn/R6pEHV5

pyTorch版Cycle-GAN（pix2pix二合一版)：

http://t.cn/RXJHrUV

Cycle-GAN收斂不易，我用了128x128分辨率訓練了各穿衣服和沒穿衣服的女優各一千多張，同樣是默認參數訓練了120個epoch，最後小部分成功「穿衣服」的結果如下：

雖然都有些突兀，但好歹是穿上衣服了。注意馬賽克不是圖片裏就有的，是我後來加上去的。

那麼，脫衣服的例子在哪裏？

參考文獻

[1] I. Goodfellow. Nips 2016 tutorial: Generative adversarial networks. arXiv preprint arXiv:1701.00160, 2016.

[2] A. B. L. Larsen, S. K. S?nderby, Generating Faces with Torch. Torch | Generating Faces with Torch

[3] A. B. L. Larsen, S. K. S?nderby, H. Larochelle, and O. Winther. Autoencoding beyond pixels using a learned similarity metric. In ICML, pages 1558–1566, 2016.

[4] C. Ledig, L. Theis, F. Huszar, J. Caballero, A. Aitken, A. Tejani, J. Totz, Z. Wang, and W. Shi. Photo-realistic single image super-resolution using a generative adversarial network. arXiv:1609.04802, 2016.

[5] P. Isola, J.-Y. Zhu, T. Zhou, and A. A. Efros. Image-to-image translation with conditional adversarial networks. arxiv, 2016.

[6] O. Ronneberger, P. Fischer, and T. Brox. U-net: Convolutional networks for biomedical image segmentation. In MICCAI, pages 234–241. Springer, 2015.

[7] B. Zhou, A. Khosla, A. Lapedriza, A. Oliva, and A. Torralba. Learning deep features for discriminative localization. arXiv preprint arXiv:1512.04150, 2015.

[8] He, D., Xia, Y., Qin, T., Wang, L., Yu, N., Liu, T.-Y., and Ma, W.-Y. (2016a). Dual learning for machine translation. In the Annual Conference on Neural Information Processing Systems (NIPS), 2016.

[9] Tie-Yan Liu, Dual Learning: Pushing the New Frontier of Artificial Intelligence, MIFS 2016

[10] J.-Y. Zhu, T. Park, P. Isola, and A. A. Efros. Unpaired image-to-image translation using cycle-consistent adversarial networkss. arXiv preprint arXiv:1703.10593, 2017.

[11] T. Kim, M. Cha, H. Kim, J. Lee, and J. Kim. Learning to Discover Cross-Domain Relations with Generative Adversarial Networks. ArXiv e-prints, Mar. 2017.

[12] Z. Yi, H. Zhang, P. T. Gong, et al. DualGAN: Unsupervised dual learning for image-to-image translation. arXiv preprint arXiv:1704.02510, 2017.

[13] M.-Y. Liu and O. Tuzel. Coupled generative adversarial networks. In Advances in Neural Information Processing Systems (NIPS), 2016.

[14] M.-Y. Liu, T. Breuel, and J. Kautz. Unsupervised image-to-image translation networks. arXiv preprint arXiv:1703.00848, 2017.

[15] Dong, H., Neekhara, P., Wu, C., Guo, Y.: Unsupervised image-to-image translation with generative adversarial networks. arXiv preprint arXiv:1701.02676, 2017.

你可能感兴趣的:(gans)

生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
剑指offer 面试题05. 替换空格 Hubhub
题目描述leetcode地址代码classSolution{public:stringreplaceSpace(strings){stringans="";for(autoe:s){if(e==''){ans+="%20";}else{ans+=e;}}returnans;}};
圣索菲亚大教堂变身清真寺，意味着什么？茶与酒
位于土耳其伊斯坦布尔的圣索菲亚大教堂，是世界上最伟大的古迹之一。它具有一千五百多年历史，被列入教科文组织的世界遗产名录。圣索菲亚大教堂地处亚欧大陆交界处，不仅是东西方文化的混合体，还见证了基督教和伊斯兰教的对峙与融合。它在历史上曾经历过数次身份转变：基督教堂、清真寺、博物馆……最近，土耳其宣布它的身份将再一次发生变化，引来国际上的广泛关注。正文ErdogansignsdecreeallowingH
牛客周赛 Round 58（下）筱姌算法
能做到的吧题目描述登录—专业IT笔试面试备考平台_牛客网运行代码#include#includeusingnamespacestd;stringfindMax(strings){intn=s.length();stringans=s;for(inti=0;ians)ans=s;swap(s[i],s[j]);}}returnans;}intmain(){intt;cin>>t;while(t--)
股票中的情侣——配对交易鸿鹄Max
什么是配对交易？配对交易（PairsTrading）是指八十年代中期华尔街著名投行MorganStanley的数量交易员NunzioTartaglia成立的一个数量分析团队提出的一种市场中性投资策略，，其成员主要是物理学家、数学家、以及计算机学家。GanapathyVidyamurthy在《PairsTrading:QuantitativeMethodsandAnalysis》一书中定义配对交易为
洛谷的各种状态 Digital_Enigma 理论篇 Python 算法 c++
启动一下洛谷能把我创亖今天来盘点一下洛谷的各种状态各个评测状态首先是我们最最最喜欢的AC：英文全名Accept，意思是程序通过。接下来是比较好对付的（自然也是对于我来说）WA：英文全名WrongAnswer，意思是答案错误。CE：英文全名CompileError，意思是编译错误。TLE：英文全名TimeLimitExceeded，意思是超出时间限制。MLE：英文全名MemoryLimitExcee
LeetCode #14 最长公共前缀 HU兔兔
classSolution{public:stringlongestCommonPrefix(vector&strs){if(strs.size()==0){return"";}stringans;inti=0;intj;while(i=strs[j].size()||strs[j][i]!=strs[0][i]){returnans;}j++;}ans.push_back(strs[0][i])
PyTorch库学习之nn.ConvTranspose2d(模块) Midsummer-逐梦 #torch pytorch 学习人工智能
PyTorch库学习之nn.ConvTranspose2d(模块)一、简介nn.ConvTranspose2d是PyTorch中的一个模块，用于实现二维转置卷积（也称为反卷积或上采样卷积）。转置卷积通常用于生成比输入更大的输出，例如在生成对抗网络（GANs）和卷积神经网络（CNNs）的解码器部分。二、语法和参数语法torch.nn.ConvTranspose2d(in_channels,out_c
day-48 一个小组的最大实力值菜-卷算法
思路想把所有非零数相乘，再统计负数的个数，如果负数为奇数个，则把乘机除以最大的那个负数即为答案，如果为偶数个，那么乘机即为答案解题过程但要考虑特殊情况：1.只有零和一个负数，返回零2.全为零，返回零CodeclassSolution{publiclongmaxStrength(int[]nums){longans=1;intnum=0;Arrays.sort(nums);intlen=nums.l
小琳AI课堂:生成对抗网络（GANs）小琳ai 小琳AI课堂人工智能生成对抗网络神经网络
大家好，这里是小琳AI课堂！今天我们要聊一聊生成对抗网络（GANs），这个让AI界沸腾的技术。想象一下，有两个小精灵在玩“你画我猜”的游戏，一个负责画画（生成器），一个负责猜画的是真是假（判别器）。这个游戏可不是随便玩玩的，它能在图像生成、风格转换等领域创造奇迹哦！GANs的神奇之处生成器和判别器的较量：生成器就像一个魔术师，能把随机噪声变成逼真的图片。判别器则是个严格的裁判，要分辨出这些图片是真
【生命之树】 Kent_J_Truman 蓝桥杯算法爆int 深度优先算法图论
题目思路求联通区域中的最大和值代码#includeusingnamespacestd;constintN=1e5+10,M=Nb{e[idx]=b,ne[idx]=h[a],h[a]=idx++;}intn;longlongans=null;longlongdfs(intf,intu){longlongbsx=0;//branchessummaxfor(intk=h[u];~k;k=ne[k]){
C#中的$和@的用法 Vae_Mars AI对话中的其他知识 c#开发语言
1.解释说明-$：字符串内插允许您在字符串字面量中包含表达式，这些表达式在运行时会被计算并转换为字符串。使用前缀，可以在字符串中直接引用变量和表达式，而不需要使用+运算符来连接字符串。-@：在逐字字符串中，反斜杠\不是转义字符，所有的空白字符（包括空格、制表符和换行符）都会被原样包含在字符串中。这通常用于编写包含文件路径或格式化文本的字符串。2.程序示例//$的使用inti=5;stringans
【技术博客】生成式对抗网络模型综述 MomodelAI
34-生成式对抗网络模型综述作者：张真源GANGAN简介生成式对抗网络(Generativeadversarialnetworks,GANs)的核心思想源自于零和博弈，包括生成器和判别器两个部分。生成器接收随机变量并生成“假”样本，判别器则用于判断输入的样本是真实的还是合成的。两者通过相互对抗来获得彼此性能的提升。判别器所作的其实就是一个二分类任务，我们可以计算他的损失并进行反向传播求出梯度，从而
Stable Diffusion算法、结构全流程概述 lanlinbuaa stable diffusion python
StableDiffusion能力强、功能多、插件广，本文拟概述SD的全流程，方便梳理算法各结构的关系SD发展的重点论文DenoisingDiffusionProbabilisticModels（首次提出去噪扩散模型DDPM）DiffusionModelsBeatGANsonImageSynthesis（OpenAI改进UNet，DM超越GAN，ClassifierGuidance）High-Re
不同编程网站应当注意的点见合8 比赛总结 c++c语言
文章目录引入：洛谷：POJ：C语言：C++:CF：个人建议：补充：引入：小伙伴们有没有遇到过这种情况：到一个新的网站去编程，思路、算法完全正确，提交上去却是WrongAnswer，RuntimeError，ComplieError，TimeLimitExceed。这里，我总结了以下几个网站的注意点：洛谷：link提交时右上角有一个选项为O2优化。这并不可以随便选。可能有些暴力程序开了O2就过了，但
B学谷-程序员的AI必修课，10小时精通AIGC编程（51资源） aigc
//xia仔ke：B学谷-程序员的AI必修课，10小时精通AIGC编程AIGC编程的未来发展展望与技术示例代码随着人工智能和生成式对抗网络（GANs）的迅速发展，AIGC（AIGeneratedContent）编程正逐渐崭露头角。AIGC编程指的是利用AI技术来自动生成或辅助生成源代码的过程。它不仅可以加速开发过程，还可以为开发者提供新的创意和解决方案。本文将探讨AIGC编程的未来发展展望，并展示
CT-CTA不理解的点 qq_1248742467 pytorch
由于是将训练CT数据的模型用来跑MRI，因此有些操作不是很理解，并且也不会，请教哈各位大佬Question1首先使用一个生成模型netG_A2B将输入real_A2转换成输出fake_B，这通常是在如图像到图像的转换任务中常见的做法，例如在使用对抗生成网络（GANs）来增强医学图像或改变图像风格的应用中。然后利用函数to_windowdata将real_B和生成的fake_B通过窗宽（WW）和窗位
【GigaGAN论文精读】Scaling up GANs for Text-to-Image Synthesis 旋转的油纸伞人脸相关人工智能从入门到实战深度学习生成模型计算机视觉 GAN GigaGAN
【GigaGAN论文精读】ScalingupGANsforText-to-ImageSynthesis0、前言Abstract1.Introduction（图放在文末）2.RelatedWorks2.1Text-to-imagesynthesis.2.2GAN-basedimagesynthesis.2.3Super-resolutionforlarge-scaletext-to-imagemod
寒假11-洛谷打题记录要成为编程高手的Yu 算法 c++数据结构
#define_CRT_SECURE_NO_WARNINGS1#include#include#includeusingnamespacestd;intn,m,k;intfire[1000010];intice[1000010];longlongans=0;boolcompare(intn1,intn2){returnn1>n2;}intmain(){cin>>n>>m>>k;for(inti=1
模拟-替换数字 ༺❀ൢ望༒月❀ൢ❀ 算法-每日一练算法
替换数字题目链接#include#includeusingnamespacestd;intmain(){stringstr;stringans;cin>>str;for(inti=0;i=48&&str[i]<=57){ans+="number";}else{ans+=str[i];}}cout<<ans;}
二分答案_排序_1873_E. Building an Aquarium 三冬四夏会不会有点漫长 #1100 算法数据结构
#includeusingnamespacestd;constintN=2e5+10;inta[N];intn;longlongfind(intx){longlongans=0;for(inti=0;i>n>>x;for(inti=0;i>a[i];sort(a,a+n);intl=0,r=x;while(l>1;if(find(mid)>t;while(t--)solve();return0;}
fast.ai 深度学习笔记（六）绝不原创的飞龙人工智能人工智能 python 深度学习
深度学习2：第2部分第12课原文：medium.com/@hiromi_suenaga/deep-learning-2-part-2-lesson-12-215dfbf04a94译者：飞龙协议：CCBY-NC-SA4.0来自fast.ai课程的个人笔记。随着我继续复习课程以“真正”理解它，这些笔记将继续更新和改进。非常感谢Jeremy和Rachel给了我这个学习的机会。生成对抗网络（GANs）视频
CSP-X模拟赛一王胤皓补题报告 Edge_Coduck_S07738 C/C++编程算法数据结构 c++c语言学习
日期：2023.10.1考试时间：9:30---->11:30学号：S07738姓名：王胤皓一、我的题目分数（有点尴尬）T1爬楼梯（stair）：（WrongAnswer）0分T2字符折线图（sline）：（WrongAnswer）50分T3吉利数（lucknum）:（WrongAnswer）40分T4路灯照明（lighting）：（WrongAnswer）30分二、考试过程：第一道题：第一道题爬
Reverse Integer BLUE_fdf9
题目Givena32-bitsignedinteger,reversedigitsofaninteger.答案key:用long判断是否overflowclassSolution{publicintreverse(intx){booleansign=x>0;x=Math.abs(x);longans=0;//Reversedigitsnowwhile(x>0){intt=x%10;x=x/10;l
Leetcode—60. 排列序列【困难】源代码•宸 LeetCode刷题 leetcode 算法职场和发展经验分享 c++数学
2024每日刷题（113）Leetcode—60.排列序列算法思想实现代码classSolution{public:stringgetPermutation(intn,intk){vectornums(n);//f[i]=i!vectorf(n+1,1);stringans;iota(nums.begin(),nums.end(),1);for(inti=2;i=0;i--){intj=k/f[i
2019-04-24 day39-ansible自动化管理实践 Ffvc
Day39作者：方维超归档：课堂笔记时间：2019/4/24目录ansible自动化管理实践思想：95.相信可能你就无限可能，相信不可能，就是自废武功。人无信（信用、自信）不立，鸟无头不飞。ansible重点步骤实践测试项目：（回顾实践）image.pngimage.pngimage.pngimage.pngimage.pngansible模块和模块参数讲解（相当于Linux的命令和参数）comm
abc339(A-C) 像风一样_ c++算法
1,A语法题,不多说#includeusingnamespacestd;#defineintlonglongsignedmain(){ios::sync_with_stdio(false);cin.tie(0);cout.tie(0);strings;cin>>s;stringans;for(inti=s.size()-1;i>=0;i--){if(s[i]!='.')ans=s[i]+ans;e
数论_最小公倍数_最大公约数_结论_分类讨论_1916_B. Two Divisors 三冬四夏会不会有点漫长 #CF 900-1000 算法
#includeusingnamespacestd;intgcd(inta,intb){returnb>0?gcd(b,a%b):a;}voidsolve(){inta,b;cin>>a>>b;longlongans=(longlong)a*b/gcd(a,b);longlongx=0;if(ans>b)x=ans;elsex=b/a*b;cout>t;while(t--)solve();retu
Leetcode—38. 外观数列【中等】源代码•宸 LeetCode刷题 leetcode 算法职场和发展 c++数据结构经验分享
2024每日刷题（111）Leetcode—38.外观数列实现代码classSolution{public:stringcountAndSay(intn){stringans="1";while(--n){stringnext;for(inti=0;i
十六科技公司的吹鼓手投资银行亚瑟王666
2007年，美国有五家主要投资公司。雷曼兄弟，摩根斯坦利（MorganStanley），高盛（GoldmanSachs），美林，贝尔斯登。2008经济危机，贝尔斯登破产，雷曼兄弟破产。雷曼兄弟破产。美林被收购。911对经济影响也相当大。最大的保险公司友邦也岌岌可危。很多人的养老保险都在里边，不少银行和它有关。于是必须救。高盛由于有巴菲特支持，度过危机。投行是双刃剑，会帮你抬股价，也会限制你的自由。
JVM StackMapTable 属性的作用及理解 lijingyao8206 jvm 字节码 Class文件 StackMapTable
在Java 6版本之后JVM引入了栈图(Stack Map Table)概念。为了提高验证过程的效率，在字节码规范中添加了Stack Map Table属性，以下简称栈图，其方法的code属性中存储了局部变量和操作数的类型验证以及字节码的偏移量。也就是一个method需要且仅对应一个Stack Map Table。在Java 7版
回调函数调用方法百合不是茶 java
最近在看大神写的代码时,.发现其中使用了很多的回调 ,以前只是在学习的时候经常用到 ,现在写个笔记记录一下代码很简单: MainDemo :调用方法得到方法的返回结果
[时间机器]制造时间机器需要一些材料 comsci 制造
根据我的计算和推测,要完全实现制造一台时间机器,需要某些我们这个世界不存在的物质和材料... 甚至可以这样说,这种材料和物质,我们在反应堆中也无法获得......
开口埋怨不如闭口做事邓集海邓集海做人做事工作
“开口埋怨，不如闭口做事。”不是名人名言，而是一个普通父亲对儿子的训导。但是，因为这句训导，这位普通父亲却造就了一个名人儿子。这位普通父亲造就的名人儿子，叫张明正。　　　　张明正出身贫寒，读书时成绩差，常挨老师批评。高中毕业，张明正连普通大学的分数线都没上。高考成绩出来后，平时开口怨这怨那的张明正，不从自身找原因，而是不停地埋怨自己家庭条件不好、埋怨父母没有给他创造良好的学习环境。　　　　
jQuery插件开发全解析，类级别与对象级别开发 IT独行者 jquery 开发插件　函数
jQuery插件的开发包括两种：一种是类级别的插件开发，即给 jQuery添加新的全局函数，相当于给 jQuery类本身添加方法。 jQuery的全局函数就是属于 jQuery命名空间的函数，另一种是对象级别的插件开发，即给 jQuery对象添加方法。下面就两种函数的开发做详细的说明。 1 、类级别的插件开发类级别的插件开发最直接的理解就是给jQuer
Rome解析Rss 413277409 Rome解析Rss
import java.net.URL; import java.util.List; import org.junit.Test; import com.sun.syndication.feed.synd.SyndCategory; import com.sun.syndication.feed.synd.S
RSA加密解密无量加密解密 rsa
RSA加密解密代码代码有待整理 package com.tongbanjie.commons.util; import java.security.Key; import java.security.KeyFactory; import java.security.KeyPair; import java.security.KeyPairGenerat
linux 软件安装遇到的问题 aichenglong linux 遇到的问题 ftp
1 ftp配置中遇到的问题 500 OOPS: cannot change directory 出现该问题的原因:是SELinux安装机制的问题.只要disable SELinux就可以了修改方法:1 修改/etc/selinux/config 中SELINUX=disabled 2 source /etc
面试心得 alafqq 面试
最近面试了好几家公司。记录下；支付宝，面试我的人胖胖的，看着人挺好的；博彦外包的职位，面试失败；阿里金融，面试官人也挺和善，只不过我让他吐血了。。。由于印象比较深，记录下； 1，自我介绍 2，说下八种基本类型；（算上string。楼主才答了3种，哈哈，string其实不是基本类型，是引用类型） 3，什么是包装类，包装类的优点； 4，平时看过什么书？NND，什么书都没看过。。照样
java的多态性探讨百合不是茶 java
java的多态性是指main方法在调用属性的时候类可以对这一属性做出反应的情况 //package 1; class A{ public void test(){ System.out.println("A"); } } class D extends A{ public void test(){ S
网络编程基础篇之JavaScript-学习笔记 bijian1013 JavaScript
1.documentWrite <html> <head> <script language="JavaScript"> document.write("这是电脑网络学校"); document.close(); </script> </h
探索JUnit4扩展：深入Rule bijian1013 JUnit Rule 单元测试
本文将进一步探究Rule的应用，展示如何使用Rule来替代@BeforeClass，@AfterClass，@Before和@After的功能。在上一篇中提到，可以使用Rule替代现有的大部分Runner扩展，而且也不提倡对Runner中的withBefores()，withAfte
[CSS]CSS浮动十五条规则 bit1129 css
这些浮动规则，主要是参考CSS权威指南关于浮动规则的总结，然后添加一些简单的例子以验证和理解这些规则。 1. 所有的页面元素都可以浮动 2. 一个元素浮动后，会成为块级元素，比如<span>,a, strong等都会变成块级元素 3.一个元素左浮动，会向最近的块级父元素的左上角移动，直到浮动元素的左外边界碰到块级父元素的左内边界；如果这个块级父元素已经有浮动元素停靠了
【Kafka六】Kafka Producer和Consumer多Broker、多Partition场景 bit1129 partition
0.Kafka服务器配置 3个broker 1个topic，6个partition，副本因子是2 2个consumer，每个consumer三个线程并发读取 1. Producer package kafka.examples.multibrokers.producers; import java.util.Properties; import java.util.
zabbix_agentd.conf配置文件详解 ronin47 zabbix 配置文件
Aliaskey的别名，例如 Alias=ttlsa.userid:vfs.file.regexp[/etc/passwd,^ttlsa:.:([0-9]+),,,,\1]，或者ttlsa的用户ID。你可以使用key：vfs.file.regexp[/etc/passwd,^ttlsa:.: ([0-9]+),,,,\1]，也可以使用ttlsa.userid。备注: 别名不能重复，但是可以有多个
java--19.用矩阵求Fibonacci数列的第N项 bylijinnan fibonacci
参考了网上的思路，写了个Java版的： public class Fibonacci { final static int[] A={1,1,1,0}; public static void main(String[] args) { int n=7; for(int i=0;i<=n;i++){ int f=fibonac
Netty源码学习-LengthFieldBasedFrameDecoder bylijinnan java netty
先看看LengthFieldBasedFrameDecoder的官方API http://docs.jboss.org/netty/3.1/api/org/jboss/netty/handler/codec/frame/LengthFieldBasedFrameDecoder.html API举例说明了LengthFieldBasedFrameDecoder的解析机制，如下：实
AES加密解密 chicony 加密解密
AES加解密算法，使用Base64做转码以及辅助加密： package com.wintv.common; import javax.crypto.Cipher; import javax.crypto.spec.IvParameterSpec; import javax.crypto.spec.SecretKeySpec; import sun.misc.BASE64Decod
文件编码格式转换 ctrain 编码格式
package com.test; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.io.OutputStream;
mysql 在linux客户端插入数据中文乱码 daizj mysql 中文乱码
1、查看系统客户端，数据库，连接层的编码查看方法： http://daizj.iteye.com/blog/2174993 进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+------
好代码是廉价的代码 dcj3sjt126com 程序员读书
长久以来我一直主张：好代码是廉价的代码。当我跟做开发的同事说出这话时，他们的第一反应是一种惊愕，然后是将近一个星期的嘲笑，把它当作一个笑话来讲。当他们走近看我的表情、知道我是认真的时，才收敛一点。当最初的惊愕消退后，他们会用一些这样的话来反驳： “好代码不廉价，好代码是采用经过数十年计算机科学研究和积累得出的最佳实践设计模式和方法论建立起来的精心制作的程序代码。” 我只
Android网络请求库——android-async-http dcj3sjt126com android
在iOS开发中有大名鼎鼎的ASIHttpRequest库，用来处理网络请求操作，今天要介绍的是一个在Android上同样强大的网络请求库android-async-http，目前非常火的应用Instagram和Pinterest的Android版就是用的这个网络请求库。这个网络请求库是基于Apache HttpClient库之上的一个异步网络请求处理库，网络处理均基于Android的非UI线程，通
ORACLE 复习笔记之SQL语句的优化 eksliang SQL优化 Oracle sql语句优化 SQL语句的优化
转载请出自出处：http://eksliang.iteye.com/blog/2097999 SQL语句的优化总结如下 sql语句的优化可以按照如下六个步骤进行：合理使用索引避免或者简化排序消除对大表的扫描避免复杂的通配符匹配调整子查询的性能 EXISTS和IN运算符下面我就按照上面这六个步骤分别进行总结：
浅析：Android 嵌套滑动机制（NestedScrolling） gg163 android 移动开发滑动机制嵌套
谷歌在发布安卓 Lollipop版本之后，为了更好的用户体验，Google为Android的滑动机制提供了NestedScrolling特性 NestedScrolling的特性可以体现在哪里呢？ 比如你使用了Toolbar，下面一个ScrollView，向上滚
使用hovertree菜单作为后台导航 hvt JavaScript jquery .net hovertree asp.net
hovertree是一个jquery菜单插件，官方网址：http://keleyi.com/jq/hovertree/ ，可以登录该网址体验效果。 0.1.3版本：http://keleyi.com/jq/hovertree/demo/demo.0.1.3.htm hovertree插件包含文件： http://keleyi.com/jq/hovertree/css
SVG 教程（二）矩形天梯梦 svg
SVG <rect> SVG Shapes SVG有一些预定义的形状元素，可被开发者使用和操作：矩形 <rect> 圆形 <circle> 椭圆 <ellipse> 线 <line> 折线 <polyline> 多边形 <polygon> 路径 <path>
一个简单的队列 luyulong java 数据结构队列
public class MyQueue { private long[] arr; private int front; private int end; // 有效数据的大小 private int elements; public MyQueue() { arr = new long[10]; elements = 0; front
基础数据结构和算法九：Binary Search Tree sunwinner Algorithm
A binary search tree (BST) is a binary tree where each node has a Comparable key (and an associated value) and satisfies the restriction that the key in any node is larger than the keys in all
项目出现的一些问题和体会 Steven-Walker DAO Web servlet
第一篇博客不知道要写点什么，就先来点近阶段的感悟吧。这几天学了servlet和数据库等知识，就参照老方的视频写了一个简单的增删改查的，完成了最简单的一些功能，使用了三层架构。 dao层完成的是对数据库具体的功能实现，service层调用了dao层的实现方法，具体对servlet提供支持。 &
高手问答：Java老A带你全面提升Java单兵作战能力！ ITeye管理员 java
本期特邀《Java特种兵》作者：谢宇，CSDN论坛ID: xieyuooo 针对JAVA问题给予大家解答，欢迎网友积极提问，与专家一起讨论! 作者简介：淘宝网资深Java工程师，CSDN超人气博主，人称“胖哥”。 CSDN博客地址： http://blog.csdn.net/xieyuooo 作者在进入大学前是一个不折不扣的计算机白痴，曾经被人笑话过不懂鼠标是什么，