somTian

当推荐系统遇上深度学习

原文：

Deep Learning Meets Recommendation Systems

Published by Wann-Jiun Ma at ** January 24, 2017

https://blog.nycdatascience.com/student-works/deep-learning-meets-recommendation-systems/

Contributed by Wann-Jiun Ma. He is currently attending the NYC Data Science Academy Online Data Science Bootcamp program. This post is based on his final capstone project and is finished in two weeks (part-time).

Introduction

几乎每个人都喜欢花时间与家人和朋友一起观看电影。当我们坐在我们的沙发上选择我们将要在接下来的两个小时里观看的电影时，结果花费了20分钟也找不到一个合适的电影，这样的经历真是太令人失望了当我们需要选择电影并且节省时间时，我们绝对需要计算机程序向我们推荐电影。显然，电影推荐已经成为我们生活的重要组成部分。据数据科学中心 Data Science Central 统计，尽管数据很难得到，但据很多知情人士估计，对于像亚马逊和Netflix这样的主要电子商务平台，推荐系统可能会承担多达10％至25％的增量收入。在这里，我研究了电影推荐的一些基本推荐算法，并尝试将深度学习整合到我的电影推荐系统中。

电影是娱乐和视觉艺术相结合的绝佳例子。电影海报通常可以直接快速的将电影的情况传递给观众。根据 DesignMantic的说法，“任何电影的发布和预先发布，他们的海报是引发炒作的主要因素，一半以上的人（即目标受众）是基于电影海报决定是否预订门票并观看电影“。我们甚至可以通过查看海报的排版来预测任何电影的氛围场景（movie’s mood by just looking at the typography of is poster）。这听起来有点像魔术，但绝对有可能通过查看其海报来预测电影的流派。对于我自己，我只是看它的海报来决定是否看电影。例如，既然我不是漫画电影的粉丝，所以每当我看到有卡通主题或颜色的电影海报，我知道这些电影不是我的选择之内。这个决策过程非常简单，不需要任何评论阅读（不确定人们有时间阅读评论）。因此，除了一些标准的电影推荐算法之外，我还使用深度学习来处理电影海报，并尝试寻找类似的电影给用户推荐。目标是模仿人类的视觉能力，并通过观看基于深度学习的电影海报来构建直观的电影推荐者。这个项目的灵感来自Ethan Rosenthal的博文 Ethan Rosenthal’s blog posts ，我在他的博文中修改了他的代码，以适应这里使用的算法。

我们使用从MovieLens网站MovieLens 下载的电影数据集。该数据集由1071个用户应用于9,066部电影的100,000个评级和1,300个标签应用程序组成。数据集最近更新于10/2016。

Collaborative Filtering

大致来说，有三种类型的推荐系统（不包括简单排名方法）：

基于内容的推荐
协同过滤
混合模型

对于基于内容的推荐系统content-based recommendation ，这是一个回归问题，我们尝试使用项目内容作为特征进行用户到项目的评分预测。另一方面，对于基于协同过滤的推荐系统 collaborative filtering ，我们通常不会提前知道特征内容，并且通过使用不同用户之间的相似性（用户可以给出相同项目的相似评分）和项目之间的相似性（类似的电影可能会被用户评分相似），我们会学习潜在的特征，同时对用户对商品的评分做出预测。另外，在学习了项目的特征之后，我们可以根据以前的使用信息来测量项目之间的相似度，并向用户推荐最相似的项目。基于内容和协作过滤的建议是十多年前的最先进的技术。显然，有许多不同的模型和算法来提高预测性能。例如，对于我们预先没有用户到项目评级信息的情况，我们可以使用所谓的隐性矩阵因式分解 implicit matrix factorization，并用一些偏好和置信度度量来替换用户到项目的评级，例如用户点击相应项目执行协作过滤的次数。此外，我们还可以结合基于内容的协同过滤方法，将内容用作“侧面信息”来提高预测性能。这种混合方法通常通过“学习排名”算法”Learning to Rank”实现。

在这个项目中，我将重点放在基于协同过滤的方法上。首先，我将讨论使用项目（用户）相似度来进行用户对项目的评估预测而无需回归，也可以根据项目的相似度进行推荐。然后，我将讨论如何使用回归来学习潜在的特征并同时做出建议。之后，我们将会看到如何在推荐系统中使用深度学习。

Item Similarity

对于基于协同过滤的推荐系统，第一个构建块构建了每个行代表用户的评分矩阵，每列对应于该用户给予特定电影的平分。我们建立我们的评分矩阵如下：

    df = pd.read_csv('ratings.csv', sep=',')
    df_id = pd.read_csv('links.csv', sep=',')
    df = pd.merge(df, df_id, on=['movieId'])

    rating_matrix = np.zeros((df.userId.unique().shape[0], max(df.movieId)))
    for row in df.itertuples():
        rating_matrix[row[1]-1, row[2]-1] = row[3]
    rating_matrix = rating_matrix[:,:9000]

其中“ratings.csv”包含用户ID，电影ID，评分和时间信息，“link.csv”包含电影ID，IMDB id和TMDB id。我们结合这两个表，因为每个电影需要IMDB id信息才能从电影数据库网站 The Movie Database使用其API获取电影海报。我们检查我们的评分矩阵的稀疏度如下：

    sparsity = float(len(ratings.nonzero()[0]))
    sparsity /= (ratings.shape[0] * ratings.shape[1])
    sparsity *= 100

其中评分矩阵稀疏，只有非零项的1.40％。现在，为了训练和测试，我们将评级矩阵分成两个较小的矩阵。我们从评级矩阵中移除10个评级，并将它们放在测试集中。

train_matrix = rating_matrix.copy()
test_matrix = np.zeros(ratings_matrix.shape)

for i in xrange(rating_matrix.shape[0]):
    rating_idx = np.random.choice(
        rating_matrix[i, :].nonzero()[0], 
        size=10, 
        replace=True)
    train_matrix[i, rating_idx] = 0.0
    test_matrix[i, rating_idx] = rating_matrix[i, rating_idx]

where, s(u,v) *is just the cosine similarity measure between user *u and user v.

   similarity_user = train_matrix.dot(train_matrix.T) + 1e-9
    norms = np.array([np.sqrt(np.diagonal(similarity_user))])
    similarity_user = ( similarity_user / (norms * norms.T) )

    similarity_movie = train_matrix.T.dot(train_matrix) + 1e-9
    norms = np.array([np.sqrt(np.diagonal(similarity_movie))])
    similarity_movie = ( similarity_movie / (norms * norms.T) )

使用用户之间的相似性，我们能够对每个用户对电影的评分进行预测，并且还可以计算我们的用户到电影评分预测的相应MSE。通过考虑类似用户给出的评级来进行预测。特别是，我们可以根据以下公式进行用户到电影的评分预测。

rˆui=(∑is(u,v)rvi∑v∥s(u,v)∥)

其中用户u到电影i的预测是用户v给予电影i的用户u和v之间的相似度作为权重的等级的加权和（归一化）。

    from sklearn.metrics import mean_squared_error

    prediction = similarity_user.dot(train_matrix) / np.array([np.abs(similarity_user).sum(axis=1)]).T
    prediction = prediction[test_matrix.nonzero()].flatten()
    test_vector = test_matrix[test_matrix.nonzero()].flatten()
    mse = mean_squared_error(prediction, test_vector)

    print 'MSE = ' + str(mse)

我们的预测获得的MSE是9.8252。这个数字是什么意思？这是好还是坏的推荐？通过查看MSE得分来评估我们的预测性能不是非常直观。因此，我们通过直接查看电影推荐来评估表现。我们会查询感兴趣的电影，并要求我们的系统向我们推荐几部电影。首先要做的是获取相应的电影海报，以便我们可以看到推荐的电影是什么。我们使用IMDB ID号码从电影数据库网站 The Movie Database使用其API获取电影海报。

    import requests
    import json

    from IPython.display import Image
    from IPython.display import display
    from IPython.display import HTML

    idx_to_movie = {}
    for row in df_id.itertuples():
        idx_to_movie[row[1]-1] = row[2]
    idx_to_movie    

    k = 6  
    idx = 0
    movies = [ idx_to_movie[x] for x in np.argsort(similarity_movie[idx,:])[:-k-1:-1] ] 
    movies = filter(lambda imdb: len(str(imdb)) == 6, movies)

    n_display = 5
    URL = [0]*n_display
    IMDB = [0]*n_display
    i = 0
    for movie in movies:
        (URL[i], IMDB[i]) = get_poster(movie, base_url)
        i += 1 

    images = ''
    for i in range(n_display):
        images += "" \
                    % URL[i]

    display(HTML(images))

现在，这很有趣！我们来看看我们的建议。我们将显示四个最相似的电影以及我们查询的动作。我们查询的电影放在左边，后面是四个推荐的电影。我们来试试查询“Heat”。

Heat是1995年的美国犯罪电影，由Robert De Niro，Al Pacino主演。结果看起来不错离开拉斯维加斯可能不是一个很好的建议。我猜是因为Nicolas Cage在电影“The ROCK”中，对于热爱的观众来说，这是一个很好的推荐。因此，它可能是使用相似矩阵与协同过滤的缺点之一。我们来试试更多的例子。

看起来不错，Toy Story 2绝对应该向喜欢Toy Story的观众推荐。但是，Forrest Gump对我来说并没有太大的意义。显然，汤姆·汉克斯（Tom Hanks）的声音在玩具总动员电影中，所以推荐了阿甘。请注意，只要查看海报，就可以在玩具总动员和福雷斯特·甘普之间分辨出电影类型，情绪等差异，对吧？当他看到海报假设每个孩子都喜欢玩具总动员时，孩子可能会忽略Forrest Gump。

Alternating and Stochastic Gradient Descent

在前面的讨论中，我们简单地计算用户和项目的余弦相似度，并使用这种相似性度量来预测用户对项目的评分，并提出项目到项目的推荐。我们现在把我们的问题作为一个回归问题。我们为所有用户引入所有电影和权重向量x的潜在特征。目标是简单地将评分预测的MSE（L2规范正则化术语）最小化。

rˆui=xTuyi

L=∑u,i(ru,i−xTuyi)2+λ∑u∥xu∥+σ∑∥yi∥

注意，现在权重向量和特征向量都是决策变量。显然这并不是一个凸问题。就目前来说，不用担心这个非凸的问题的收敛性。有很多方法来解决这个非凸优化问题。一种方法是以交替的方式求解权重向量（用户）和特征向量（用于电影）。当我们求解权重向量时，我们假定特征向量是常数向量。另一方面，当我们解决特征向量时，我们假设权重向量是常数向量。解决这个回归问题的另一种方法是组合权重向量和特征向量的更新，并在相同的迭代中进行更新。此外，可以实现随机梯度下降以加速计算。在这里，我使用随机梯度下降法来解决这个回归问题。我的预测的MSE如下所示。

MSE比使用相似矩阵获得的小得多。当然，我们也可以使用网格搜索和交叉验证来调整我们的模型和算法的参数。

再次，我们来看看我们的建议，通过查询感兴趣的电影。

看起来效果并不好，我不知道这四部电影是通过查询热推荐给我的。他们看起来完全不匹配Heat。他们看起来像浪漫/戏剧电影。如果我发现一部类似于美国电影大片电影明星的电影，我想要观看一场电视剧？我觉得很好的MSE结果可能给我们一个非常糟糕的建议。

那么让我们来讨论基于协同过滤的推荐系统的弱点。

协同过滤方法通过使用数据查找类似的用户和电影，这导致流行项目比不受欢迎的项目更容易被推荐。
由于没有与这些电影相关的许多使用数据，协作过滤很难为用户推荐任何新电影。

在接下来的讨论中，我们将考虑采用不同的方法来解决协同过滤问题。我们用深度的学习向用户推荐电影。

Deep Learning

我们将在Keras中使用VGG16训练我们的神经网络。我们的数据集中没有目标，我们只考虑第四到最后一层作为特征向量。我们使用此特征向量来表征我们的数据集中的每个电影。在训练我们的神经网络之前，有一些预处理步骤。训练过程总结如下。

    df_id = pd.read_csv('links.csv', sep=',')

    idx_to_movie = {}
    for row in df_id.itertuples():
        idx_to_movie[row[1]-1] = row[2]  

    total_movies = 9000

    movies = [0]*total_movies
    for i in range(len(movies)):
        if i in idx_to_movie.keys() and len(str(idx_to_movie[i])) == 6:
            movies[i] = (idx_to_movie[i]) 
    movies = filter(lambda imdb: imdb != 0, movies)
    total_movies  = len(movies)

    URL = [0]*total_movies 
    IMDB = [0]*total_movies 
    URL_IMDB = {"url":[],"imdb":[]}
    i = 0
    for movie in movies:
        (URL[i], IMDB[i]) = get_poster(movie, base_url)
        if URL[i] != base_url+"":
            URL_IMDB["url"].append(URL[i])
            URL_IMDB["imdb"].append(IMDB[i])
        i += 1 
    # URL = filter(lambda url: url != base_url+"", URL)
    df = pd.DataFrame(data=URL_IMDB) 

    total_movies = len(df)  

    import urllib

    poster_path = "/Users/wannjiun/Desktop/nycdsa/project_5_recommender/posters/"
    for i in range(total_movies):
        urllib.urlretrieve(df.url[i], poster_path + str(i) + ".jpg")

    from keras.applications import VGG16
    from keras.applications.vgg16 import preprocess_input
    from keras.preprocessing import image as kimage

    image = [0]*total_movies
    x = [0]*total_movies
    for i in range(total_movies):
        image[i] = kimage.load_img(poster_path + str(i) + ".jpg", target_size=(224, 224))
        x[i] = kimage.img_to_array(image[i])
        x[i] = np.expand_dims(x[i], axis=0)
        x[i] = preprocess_input(x[i])   

    model = VGG16(include_top=False, weights='imagenet')

    prediction = [0]*total_movies
    matrix_res = np.zeros([total_movies,25088])
    for i in range(total_movies):
        prediction[i] = model.predict(x[i]).ravel()
        matrix_res[i,:] = prediction[i] 

    similarity_deep = matrix_res.dot(matrix_res.T)
    norms = np.array([np.sqrt(np.diagonal(similarity_deep))])
    similarity_deep = similarity_deep / norms / norms.T

在代码中，我们首先从TMDB网站使用IMDB id的API获取电影海报，然后我们向VGG16提供海报并训练我们的神经网络，最后，我们使用VGG16学习的功能计算余弦相似度。在我们得到电影相似性之后，我们可以推荐类似的电影，使用最高的相似度。请注意，VGG16学习的总共有25088个特征，我们使用这些特征来表示我们的数据集中的每个电影。

让我们看看使用深度学习的推荐。

对Heat的推荐没有爱情戏剧！这些海报肯定有一些共同的特点。他们是深蓝色，有人在海报等。再次，让我们试一下Toy Story。

Forrest Gump没有被推荐！结果看起来不错！我非常喜欢这样做，所以让我们再来一些例子。

请注意，这些海报中有一到两个人，非常冷的主题或风格。

这些海报想让观众知道相应的电影是有趣的，响亮的，密集的，并且在他们中有很多的动作，所以海报的颜色和图像是非常强大的。

另一方面，这些海报想要向观众展示相应的电影是关于一个人的。

我们发现一些类似于功夫熊猫的电影。

这是一个非常有趣的一个。我们确实发现了类似的怪物，也发现了Tom Cruse！

所有这些海报都有一个类似姿势的女人。等待！是Shaq！？

我们成功地找到了蜘蛛侠！

这一个发现了类似排版的海报。

Conclusions

在推荐系统中有几种使用深度学习的方法：

无监督的学习方法。
预测协同过滤产生的潜在特征。
使用深度学习产生的功能作为辅助信息。

电影海报有元素，引起观众兴趣和兴趣。在这个项目中，我们使用深度学习作为一种无监督的学习方法，并通过处理电影海报来学习电影的相似性。显然，这只是在推荐系统中使用深度学习的第一步。有很多事情我们可以尝试。例如，我们可以使用深度学习来预测协同过滤所产生的潜在特征。 Spotify已经对类似的方法进行了音乐推荐。而不是图像处理，他们考虑使用深度学习来预测通过处理一首歌曲的声音从协同过滤得到的潜在特征。另一个可能的方法是使用深入学习的特征作为辅助信息来提高预测精度。

References:

– http://blog.ethanrosenthal.com/2015/11/02/intro-to-collaborative-filtering/

– http://blog.ethanrosenthal.com/2016/01/09/explicit-matrix-factorization-sgd-als/

– http://blog.ethanrosenthal.com/2016/10/19/implicit-mf-part-1/

– http://blog.ethanrosenthal.com/2016/11/07/implicit-mf-part-2/

– http://blog.ethanrosenthal.com/2016/12/05/recasketch-keras/

– https://www.designmantic.com/blog/2016-movie-poster-design-trends/

– https://www.designmantic.com/blog/movie-moods-in-typography/

– http://www.datasciencecentral.com/profiles/blogs/understanding-and-selecting-recommenders-1

– http://www.datasciencecentral.com/profiles/blogs/5-types-of-recommenders

– http://benanne.github.io/2014/08/05/spotify-cnns.html

– Andrew Ng, “Machine Learning,” Recommender Systems, 2016

– Aaron van den Oord, et al., “Deep content-based music recommendation,” NIPS, 2013

– Yifan Hu, et al., “Collaborative Filtering for Implicit Feedback Datasets,”

– Ste en Rendle, “BPR: Bayesian Personalized Ranking from Implicit Feedback,”

吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
吴恩达深度学习笔记(24)-为什么要使用深度神经网络？极客Array
为什么使用深层表示？（Whydeeprepresentations?）我们都知道深度神经网络能解决好多问题，其实并不需要很大的神经网络，但是得有深度，得有比较多的隐藏层，这是为什么呢？我们一起来看几个例子来帮助理解，为什么深度神经网络会很好用。首先，深度网络在计算什么？如果你在建一个人脸识别或是人脸检测系统，深度神经网络所做的事就是，当你输入一张脸部的照片，然后你可以把深度神经网络的第一层，当成一
【深度学习笔记】1 数据操作 RIKI_1 深度学习深度学习笔记人工智能
注：本文为《动手学深度学习》开源内容，仅为个人学习记录，无抄袭搬运意图数据操作在深度学习中，我们通常会频繁地对数据进行操作。作为动手学深度学习的基础，本节将介绍如何对内存中的数据进行操作。在PyTorch中，torch.Tensor是存储和变换数据的主要工具。如果你之前用过NumPy，你会发现Tensor和NumPy的多维数组非常类似。然而，Tensor提供GPU计算和自动求梯度等更多功能，这些使
【深度学习笔记】6_4 循环神经网络的从零开始实现 RIKI_1 深度学习深度学习笔记 rnn
注：本文为《动手学深度学习》开源内容，部分标注了个人理解，仅为个人学习记录，无抄袭搬运意图6.4循环神经网络的从零开始实现在本节中，我们将从零开始实现一个基于字符级循环神经网络的语言模型，并在周杰伦专辑歌词数据集上训练一个模型来进行歌词创作。首先，我们读取周杰伦专辑歌词数据集：importtimeimportmathimportnumpyasnpimporttorchfromtorchimport
【深度学习笔记】6_10 双向循环神经网络bi-rnn RIKI_1 深度学习深度学习笔记 rnn
注：本文为《动手学深度学习》开源内容，部分标注了个人理解，仅为个人学习记录，无抄袭搬运意图6.10双向循环神经网络之前介绍的循环神经网络模型都是假设当前时间步是由前面的较早时间步的序列决定的，因此它们都将信息通过隐藏状态从前往后传递。有时候，当前时间步也可能由后面时间步决定。例如，当我们写下一个句子时，可能会根据句子后面的词来修改句子前面的用词。双向循环神经网络通过增加从后往前传递信息的隐藏层来更
深度学习笔记１：神经网络端到端学习笔记撒哈拉土狼深度学习
许多重要问题都可以抽象为变长序列学习问题（sequencetosequencelearning），如语音识别、机器翻译、字符识别。这类问题的特点是，1)输入和输出都是序列（如连续值语音信号/特征、离散值的字符），2)序列长度都不固定，3)并且输入输出序列长度没有对应关系。因此，传统的神经网络模型（DNN，CNN，RNN）不能直接以端到端的方式解决这类问题的建模和学习问题。解决变长序列的端到端学习，
吴恩达深度学习-L1 神经网络和深度学习总结向来痴_ 深度学习人工智能
作业地址：吴恩达《深度学习》作业线上版-知乎(zhihu.com)写的很好的笔记：吴恩达《深度学习》笔记汇总-知乎(zhihu.com)我的「吴恩达深度学习笔记」汇总帖（附18个代码实战项目）-知乎(zhihu.com)此处只记录需要注意的点，若想看原笔记请移步。1.1深度学习入门我们只需要管理神经网络的输入和输出，而不用指定中间的特征，也不用理解它们究竟有没有实际意义。1.2简单的神经网络——逻
深度学习笔记：推理服务 TaoTao Li tensorflow 深度学习深度学习人工智能机器学习
在线推理服务解决的问题样本处理特征抽取(生成)特征抽取过程特征定义通用定义具体定义特征抽取加速Embeding查询NN计算DL框架计算优化图优化量化优化异构计算CodeGen总结参考资料解决的问题模型训练解决模型效果问题，模型推理解决模型实时预测问题。推理服务是把训练好的模型部署到线上，进行实时预测的过程。如阿里的RTP系统顾名思义，实时预测是相对于非实时预测(离线预测)而言，非实时预测是将训练好
fast.ai 深度学习笔记（三）绝不原创的飞龙人工智能人工智能深度学习笔记
深度学习2：第1部分第6课原文：medium.com/@hiromi_suenaga/deep-learning-2-part-1-lesson-6-de70d626976c译者：飞龙协议：CCBY-NC-SA4.0来自fast.ai课程的个人笔记。随着我继续复习课程以“真正”理解它，这些笔记将继续更新和改进。非常感谢Jeremy和Rachel给了我这个学习的机会。第6课[##2017年深度学习优
深度学习笔记 stoAir 深度学习笔记人工智能
DeepLearningBasic神经网络：algorithm1input1outputinput2input3input4algorithm2监督学习：1个x对应1个y；Sigmoid:激活函数sigmoid=11+e−xsigmoid=\frac{1}{1+e^{-x}}sigmoid=1+e−x1ReLU:线性整流函数；##LogisticRegression-->binaryclassif
fast.ai 深度学习笔记（六）绝不原创的飞龙人工智能人工智能 python 深度学习
深度学习2：第2部分第12课原文：medium.com/@hiromi_suenaga/deep-learning-2-part-2-lesson-12-215dfbf04a94译者：飞龙协议：CCBY-NC-SA4.0来自fast.ai课程的个人笔记。随着我继续复习课程以“真正”理解它，这些笔记将继续更新和改进。非常感谢Jeremy和Rachel给了我这个学习的机会。生成对抗网络（GANs）视频
fast.ai 深度学习笔记（一）绝不原创的飞龙人工智能人工智能深度学习笔记
深度学习2：第1部分第1课原文：medium.com/@hiromi_suenaga/deep-learning-2-part-1-lesson-1-602f73869197译者：飞龙协议：CCBY-NC-SA4.0来自fast.ai课程的个人笔记。随着我继续复习课程以“真正”理解它，这些笔记将继续更新和改进。非常感谢Jeremy和Rachel给了我这个学习的机会。第一课开始[0:00]：为了训练
吴恩达深度学习笔记(15）-浅层神经网络之神经网络概述极客Array
神经网络概述（NeuralNetworkOverview）从今天开始你将学习如何实现一个神经网络。这里只是一个概述，详细的在后面会讲解，看不懂也没关系，先有个概念，就是前向计算然后后向计算，理解了这个就可以了，有一些公式和表达在后面会详细的讲解。在我们深入学习具体技术之前，我希望快速的带你预览一下后续几天你将会学到的东西。现在我们开始快速浏览一下如何实现神经网络。之前我们讨论了逻辑回归，我们了解了
Tensorflow实战深度学习笔记一独立开发者Lau
人类直观能力----人工智能（自然语言理解、图像识别、语音识别等）。经验----机器学习。训练----特征相关度。特征提取深度学习---自动地将简单的特征组合成更加复杂的特征，并使用这些复杂特征解决问题。深度学习--------不等于模仿人类大脑。
吴恩达深度学习笔记(82)-深度卷积神经网络的发展史极客Array
为什么要探索发展史(实例分析)？我们首先来看看一些卷积神经网络的实例分析，为什么要看这些实例分析呢？上周我们讲了基本构建，比如卷积层、池化层以及全连接层这些组件。事实上，过去几年计算机视觉研究中的大量研究都集中在如何把这些基本构件组合起来，形成有效的卷积神经网络。最直观的方式之一就是去看一些案例，就像很多人通过看别人的代码来学习编程一样，通过研究别人构建有效组件的案例是个不错的办法。实际上在计算机
深度学习笔记：灾难性遗忘 UQI-LIUWJ 机器学习笔记
1灾难性遗忘介绍当神经网络被训练去学习新的任务时，它可能会完全忘记如何执行它以前学过的任务。这种现象尤其在所谓的“连续学习”（continuouslearning）或“增量学习”（incrementallearning）场景中很常见2不同视角下看待灾难性遗忘以及对应的解决方法2.1从梯度的视角2.1.1从梯度的视角看灾难性遗忘我们有两个不同任务的损失曲面，用平滑的曲面训练完之后，再在坑坑洼洼的曲面
深度学习笔记（九）——tf模型导出保存、模型加载、常用模型导出tflite、权重量化、模型部署絮沫深度学习深度学习笔记人工智能
文中程序以Tensorflow-2.6.0为例部分概念包含笔者个人理解，如有遗漏或错误，欢迎评论或私信指正。本篇博客主要是工具性介绍，可能由于软件版本问题导致的部分内容无法使用。首先介绍tflite:TensorFlowLite是一组工具，可帮助开发者在移动设备、嵌入式设备和loT设备上运行模型，以便实现设备端机器学习。框架具有的主要特性：延时（数据无需往返服务器）隐私（没有任何个人数据离开设备）
深度学习笔记（八）——构建网络的常用辅助增强方法：数据增强扩充、断点续训、可视化和部署预测絮沫深度学习深度学习笔记人工智能
文中程序以Tensorflow-2.6.0为例部分概念包含笔者个人理解，如有遗漏或错误，欢迎评论或私信指正。截图和程序部分引用自北京大学机器学习公开课要构建一个完善可用的神经网络，除了设计网络结构以外，还需要添加一些辅助代码来增强网络运行的稳定性，鲁棒性。可以用来增强的方向主要有个，首先是数据输入前的预处理环节，其次是数据在训练过程中的优化，最后的数据在训练结束后的导出和可视化，同时能够及时保存结
深度学习笔记（七）——基于Iris/MNIST数据集构建基础的分类网络算法实战絮沫深度学习算法深度学习笔记
文中程序以Tensorflow-2.6.0为例部分概念包含笔者个人理解，如有遗漏或错误，欢迎评论或私信指正。截图和程序部分引用自北京大学机器学习公开课认识网络的构建结构在神经网络的构建过程中，都避不开以下几个步骤：导入网络和依赖模块原始数据处理和清洗加载训练和测试数据构建网络结构，确定网络优化方法将数据送入网络进行训练，同时判断预测效果保存模型部署算法，使用新的数据进行预测推理使用Keras快速构
《动手学深度学习》学习笔记第10章注意力机制北方骑马的萝卜《手动深度学习》笔记深度学习学习笔记
本系列为《动手学深度学习》学习笔记书籍链接：动手学深度学习笔记是从第四章开始，前面三章为基础知识，有需要的可以自己去看看关于本系列笔记：书里为了让读者更好的理解，有大篇幅的描述性的文字，内容很多，笔记只保留主要内容，同时也是对之前知识的查漏补缺《动手学深度学习》学习笔记第4章多层感知机《动手学深度学习》学习笔记第5章深度学习计算《动手学深度学习》学习笔记第6章卷积神经网络《动手学深度学习》学习笔记
深度学习笔记（六）——网络优化（2）：参数更新优化器SGD、SGDM、AdaGrad、RMSProp、Adam 絮沫深度学习深度学习笔记人工智能
文中程序以Tensorflow-2.6.0为例部分概念包含笔者个人理解，如有遗漏或错误，欢迎评论或私信指正。截图和程序部分引用自北京大学机器学习公开课前言在前面的博文中已经学习了构建神经网络的基础需求，搭建了一个简单的双层网络结构来实现数据的分类。并且了解了激活函数和损失函数在神经网络中发挥的重要用途，其中，激活函数优化了神经元的输出能力，损失函数优化了反向传播时参数更新的趋势。我们知道在简单的反
李沐—动手学深度学习笔记比三毛多一根头发笔记
目录引言1.2机器学习中的关键组件1.3.1监督学习2.预备知识2.1数据操作2.1.3.广播机制2.1.4.索引和切片2.1.5.节省内存2.1.6.转换为其他Python对象2.2.数据预处理2.2.1.读取数据集2.2.2.处理缺失值2.2.3.转换为张量格式2.3.线性代数2.3.2.向量2.3.5.张量算法的基本性质2.3.6.降维3.线性神经网络4.多层感知机4.1多层感知机4.1.1
深度学习笔记（四）——使用TF2构建基础网络的常用函数+简单ML分类实现絮沫深度学习深度学习笔记分类
文中程序以Tensorflow-2.6.0为例部分概念包含笔者个人理解，如有遗漏或错误，欢迎评论或私信指正。截图和程序部分引用自北京大学机器学习公开课TF2基础常用函数1、张量处理类强制数据类型转换：a1=tf.constant([1,2,3],dtype=tf.float64)print(a1)a2=tf.cast(a1,tf.int64)#强制数据类型转换print(a2)查找数据中的最小值和
深度学习笔记（三）——NN网络基础概念（神经元模型，梯度下降，反向传播，张量处理）絮沫深度学习深度学习笔记网络
文中程序以Tensorflow-2.6.0为例部分概念包含笔者个人理解，如有遗漏或错误，欢迎评论或私信指正。截图部分引用自北京大学机器学习公开课人工智能算法的主流分类首先明白一个概念，广义上的人工智能算法并不是只有MachineLearning或DeepLearning，而是一个相对的，能够使用计算机模拟人类智能在一定场景下自动实现一些功能。所以系统控制论中的很多最优控制算法同样可以称之为智能算法
深度学习笔记（五）——网络优化（1）：学习率自调整、激活函数、损失函数、正则化絮沫深度学习深度学习笔记网络 tensorflow
文中程序以Tensorflow-2.6.0为例部分概念包含笔者个人理解，如有遗漏或错误，欢迎评论或私信指正。截图和程序部分引用自北京大学机器学习公开课通过学习已经掌握了主要的基础函数之后具备了搭建一个网络并使其正常运行的能力，那下一步我们还需要进一步对网络中的重要节点进行优化并加深认知。首先我们知道NN（自然神经）网络算法能够相比传统建模类算法发挥更好效果的原因是网络对复杂非线性函数的拟合效果更好
《动手学深度学习》学习笔记第9章现代循环神经网络北方骑马的萝卜《手动深度学习》笔记深度学习学习笔记
本系列为《动手学深度学习》学习笔记书籍链接：动手学深度学习笔记是从第四章开始，前面三章为基础知识，有需要的可以自己去看看关于本系列笔记：书里为了让读者更好的理解，有大篇幅的描述性的文字，内容很多，笔记只保留主要内容，同时也是对之前知识的查漏补缺9.现代循环神经网络前一章中我们介绍了循环神经网络的基础知识，这种网络可以更好地处理序列数据。我们在文本数据上实现了基于循环神经网络的语言模型，但是对于
《动手学深度学习》学习笔记第8章循环神经网络北方骑马的萝卜《手动深度学习》笔记深度学习学习笔记
本系列为《动手学深度学习》学习笔记书籍链接：动手学深度学习笔记是从第四章开始，前面三章为基础知识，有需要的可以自己去看看关于本系列笔记：书里为了让读者更好的理解，有大篇幅的描述性的文字，内容很多，笔记只保留主要内容，同时也是对之前知识的查漏补缺8.循环神经网络到目前为止我们默认数据都来自于某种分布，并且所有样本都是独立同分布的（independentlyandidenticallydistri
深度学习笔记（二）——Tensorflow环境的安装絮沫深度学习深度学习笔记 tensorflow
本篇文章只做基本的流程概述，不阐述具体每个软件的详细安装流程，具体的流程网上教程已经非常丰富。主要是给出完整的安装流程，以供参考环境很重要一个好的算法环境往往能够帮助开发者事半功倍，入门学习的时候往往搭建好环境就已经成功了一半。在机器学习或者深度学习的设计研究中，人们往往会使用已经有的网络框架来构建网络模型和设计各种识别分类或者生成算法。主要可以给我们学习和使用的框架这里推荐两个：Tensorfl
2022-01-23 深度学习笔记 Luo_淳专业学习深度学习人工智能
深度学习笔记引言：机器学习——自动寻找函数。1.你想要找什么函数？①Regression——Theoutputofthefunctionisascalar.②BinaryClassification——OnlyoutputYesorNo.举例：输入句子，输出句子positive还是negtive。③Multi-classClassification——分类，输入图片，输出图片中物品的类型。
深度学习笔记：下载鸢尾花数据集，并展示所有的属性 BioVS python tensorflow numpy
背景：深度学习课程作业。通过此作业，可了解tensorflow、matplotlib、pandas和numpy。可学习到matplot画图及细节设计，如图的颜色、字体大小、循环画图方法等代码：importtensorflowastfimportmatplotlib.pyplotaspltimportpandasaspdimportnumpyasnpTRAIN_URL="http://downloa
关于旗正规则引擎中的MD5加密问题何必如此 jsp MD5 规则加密
一般情况下，为了防止个人隐私的泄露，我们都会对用户登录密码进行加密，使数据库相应字段保存的是加密后的字符串，而非原始密码。在旗正规则引擎中，通过外部调用，可以实现MD5的加密，具体步骤如下： 1.在对象库中选择外部调用，选择“com.flagleader.util.MD5”，在子选项中选择“com.flagleader.util.MD5.getMD5ofStr({arg1})”； 2.在规
【Spark101】Scala Promise/Future在Spark中的应用 bit1129 Promise
Promise和Future是Scala用于异步调用并实现结果汇集的并发原语，Scala的Future同JUC里面的Future接口含义相同，Promise理解起来就有些绕。等有时间了再仔细的研究下Promise和Future的语义以及应用场景，具体参见Scala在线文档：http://docs.scala-lang.org/sips/completed/futures-promises.html
spark sql 访问hive数据的配置详解 daizj spark sql hive thriftserver
spark sql 能够通过thriftserver 访问hive数据，默认spark编译的版本是不支持访问hive，因为hive依赖比较多，因此打的包中不包含hive和thriftserver,因此需要自己下载源码进行编译，将hive，thriftserver打包进去才能够访问，详细配置步骤如下： 1、下载源码 2、下载Maven,并配置此配置简单，就略过
HTTP 协议通信周凡杨 java httpclient http 通信
一：简介 HTTPCLIENT，通过JAVA基于HTTP协议进行点与点间的通信！二：代码举例测试类： import java
java unix时间戳转换 g21121 java
把java时间戳转换成unix时间戳： Timestamp appointTime=Timestamp.valueOf(new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date())) SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd hh:m
web报表工具FineReport常用函数的用法总结（报表函数）老A不折腾 web报表 finereport 总结
说明：本次总结中，凡是以tableName或viewName作为参数因子的。函数在调用的时候均按照先从私有数据源中查找，然后再从公有数据源中查找的顺序。 CLASS CLASS(object):返回object对象的所属的类。 CNMONEY CNMONEY(number,unit)返回人民币大写。 number:需要转换的数值型的数。 unit:单位，
java jni调用c++ 代码报错墙头上一根草 java C++jni
# # A fatal error has been detected by the Java Runtime Environment: # # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x00000000777c3290, pid=5632, tid=6656 # # JRE version: Java(TM) SE Ru
Spring中事件处理de小技巧 aijuans spring Spring 教程 Spring 实例 Spring 入门 Spring3
Spring 中提供一些Aware相关de接口，BeanFactoryAware、 ApplicationContextAware、ResourceLoaderAware、ServletContextAware等等，其中最常用到de匙ApplicationContextAware.实现ApplicationContextAwaredeBean，在Bean被初始后，将会被注入 Applicati
linux shell ls脚本样例 annan211 linux linux ls源码 linux 源码
#! /bin/sh - #查找输入文件的路径 #在查找路径下寻找一个或多个原始文件或文件模式 # 查找路径由特定的环境变量所定义 #标准输出所产生的结果通常是查找路径下找到的每个文件的第一个实体的完整路径 # 或是filename :not found 的标准错误输出。 #如果文件没有找到则退出码为0 #否则即为找不到的文件个数 #语法 pathfind [--
List,Set,Map遍历方式 (收集的资源,值得看一下) 百合不是茶 list set Map遍历方式
List特点：元素有放入顺序，元素可重复 Map特点：元素按键值对存储，无放入顺序 Set特点：元素无放入顺序，元素不可重复（注意：元素虽然无放入顺序，但是元素在set中的位置是有该元素的HashCode决定的，其位置其实是固定的） List接口有三个实现类：LinkedList，ArrayList，Vector LinkedList：底层基于链表实现，链表内存是散乱的，每一个元素存储本身
解决SimpleDateFormat的线程不安全问题的方法 bijian1013 java thread 线程安全
在Java项目中，我们通常会自己写一个DateUtil类，处理日期和字符串的转换，如下所示： public class DateUtil01 { private SimpleDateFormat dateformat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); public void format(Date d
http请求测试实例（采用fastjson解析） bijian1013 http 测试
在实际开发中，我们经常会去做http请求的开发，下面则是如何请求的单元测试小实例，仅供参考。 import java.util.HashMap; import java.util.Map; import org.apache.commons.httpclient.HttpClient; import
【RPC框架Hessian三】Hessian 异常处理 bit1129 hessian
RPC异常处理概述 RPC异常处理指是，当客户端调用远端的服务，如果服务执行过程中发生异常，这个异常能否序列到客户端？如果服务在执行过程中可能发生异常，那么在服务接口的声明中，就该声明该接口可能抛出的异常。在Hessian中，服务器端发生异常，可以将异常信息从服务器端序列化到客户端，因为Exception本身是实现了Serializable的
【日志分析】日志分析工具 bit1129 日志分析
1. 网站日志实时分析工具 GoAccess http://www.vpsee.com/2014/02/a-real-time-web-log-analyzer-goaccess/ 2. 通过日志监控并收集 Java 应用程序性能数据(Perf4J) http://www.ibm.com/developerworks/cn/java/j-lo-logforperf/ 3.log.io 和
nginx优化加强战斗力及遇到的坑解决 ronin47 nginx 优化
　　　先说遇到个坑，第一个是负载问题，这个问题与架构有关，由于我设计架构多了两层，结果导致会话负载只转向一个。解决这样的问题思路有两个：一是改变负载策略，二是更改架构设计。　　　由于采用动静分离部署，而nginx又设计了静态，结果客户端去读nginx静态，访问量上来，页面加载很慢。解决：二者留其一。最好是保留apache服务器。　　　来以下优化：　　　
java-50-输入两棵二叉树A和B，判断树B是不是A的子结构 bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/25411174201011445550396/ import ljn.help.*; public class HasSubtree { /**Q50. * 输入两棵二叉树A和B，判断树B是不是A的子结构。例如，下图中的两棵树A和B，由于A中有一部分子树的结构和B是一
mongoDB 备份与恢复开窍的石头 mongDB备份与恢复
Mongodb导出与导入 1: 导入/导出可以操作的是本地的mongodb服务器,也可以是远程的. 所以,都有如下通用选项: -h host 主机 --port port 端口 -u username 用户名 -p passwd 密码 2: mongoexport 导出json格式的文件
[网络与通讯]椭圆轨道计算的一些问题 comsci 网络
如果按照中国古代农历的历法，现在应该是某个季节的开始，但是由于农历历法是3000年前的天文观测数据，如果按照现在的天文学记录来进行修正的话，这个季节已经过去一段时间了。。。。。也就是说，还要再等3000年。才有机会了，太阳系的行星的椭圆轨道受到外来天体的干扰，轨道次序发生了变
软件专利如何申请 cuiyadll 软件专利申请
软件技术可以申请软件著作权以保护软件源代码，也可以申请发明专利以保护软件流程中的步骤执行方式。专利保护的是软件解决问题的思想，而软件著作权保护的是软件代码（即软件思想的表达形式）。例如，离线传送文件，那发明专利保护是如何实现离线传送文件。基于相同的软件思想，但实现离线传送的程序代码有千千万万种，每种代码都可以享有各自的软件著作权。申请一个软件发明专利的代理费大概需要5000-8000申请发明专利可
Android学习笔记 darrenzhu android
1.启动一个AVD 2.命令行运行adb shell可连接到AVD,这也就是命令行客户端 3.如何启动一个程序 am start -n package name/.activityName am start -n com.example.helloworld/.MainActivity 启动Android设置工具的命令如下所示： # am start -
apache虚拟机配置，本地多域名访问本地网站 dcj3sjt126com apache
现在假定你有两个目录，一个存在于 /htdocs/a，另一个存在于 /htdocs/b 。现在你想要在本地测试的时候访问 www.freeman.com 对应的目录是 /xampp/htdocs/freeman ,访问 www.duchengjiu.com 对应的目录是 /htdocs/duchengjiu。 1、首先修改C盘WINDOWS\system32\drivers\etc目录下的
yii2 restful web服务[速率限制] dcj3sjt126com PHP yii2
速率限制为防止滥用，你应该考虑增加速率限制到您的API。例如，您可以限制每个用户的API的使用是在10分钟内最多100次的API调用。如果一个用户同一个时间段内太多的请求被接收，将返回响应状态代码 429 (这意味着过多的请求)。要启用速率限制, [[yii\web\User::identityClass|user identity class]] 应该实现 [[yii\filter
Hadoop2.5.2安装——单机模式 eksliang hadoop hadoop单机部署
转载请出自出处：http://eksliang.iteye.com/blog/2185414 一、概述 Hadoop有三种模式单机模式、伪分布模式和完全分布模式，这里先简单介绍单机模式，默认情况下，Hadoop被配置成一个非分布式模式，独立运行JAVA进程，适合开始做调试工作。二、下载地址 Hadoop 网址http:
LoadMoreListView+SwipeRefreshLayout（分页下拉）基本结构 gundumw100 android
一切为了快速迭代 import java.util.ArrayList; import org.json.JSONObject; import android.animation.ObjectAnimator; import android.os.Bundle; import android.support.v4.widget.SwipeRefreshLayo
三道简单的前端HTML/CSS题目 ini html Web 前端 css 题目
使用CSS为多个网页进行相同风格的布局和外观设置时，为了方便对这些网页进行修改，最好使用（）。http://hovertree.com/shortanswer/bjae/7bd72acca3206862.htm 在HTML中加入<table style=”color:red; font-size:10pt”>，此为（）。http://hovertree.com/s
overrided方法编译错误 kane_xie override
问题描述：在实现类中的某一或某几个Override方法发生编译错误如下： Name clash: The method put(String) of type XXXServiceImpl has the same erasure as put(String) of type XXXService but does not override it 当去掉@Over
Java中使用代理IP获取网址内容（防IP被封，做数据爬虫） mcj8089 免费代理IP 代理IP 数据爬虫 JAVA设置代理IP 爬虫封IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ Java语言有两种方式使用代理IP访问网址并获取内容，方式一，设置System系统属性 // 设置代理IP System.getProper
Nodejs Express 报错之 listen EADDRINUSE qiaolevip 每天进步一点点学习永无止境 nodejs 纵观千象
当你启动 nodejs服务报错： >node app Express server listening on port 80 events.js:85 throw er; // Unhandled 'error' event ^ Error: listen EADDRINUSE at exports._errnoException (
C++中三种new的用法 _荆棘鸟_ C++new
转载自：http://news.ccidnet.com/art/32855/20100713/2114025_1.html 作者: mt 其一是new operator，也叫new表达式；其二是operator new，也叫new操作符。这两个英文名称起的也太绝了，很容易搞混，那就记中文名称吧。new表达式比较常见，也最常用，例如： string* ps = new string("
Ruby深入研究笔记1 wudixiaotie Ruby
module是可以定义private方法的 module MTest def aaa puts "aaa" private_method end private def private_method puts "this is private_method" end end