cherry1307

吴恩达神经网络与深度学习——神经网络基础习题2

神经网络思维的逻辑回归

判断图像上是否有猫

图像预处理

问题叙述
包
可视化
数据集尺寸
reshape
标准化数据集

总结

学习算法的一般结构
构建我们算法的各个部分

sigmoid函数
初始化参数
前向传播和反向传播
梯度下降法
预测

将所有函数合并到模型中
例子
迭代次数对代价函数的影响
测试自己的图像

神经网络思维的逻辑回归

1.初始化参数
2.计算代价函数及其导数
3.使用梯度下降

判断图像上是否有猫

图像预处理

问题叙述

你得到了一个数据集(“data.h5”)，包含:
-标记为cat ( y = 1 )或非cat ( y = 0 )的m个训练集
-标记为cat或非cat的m个测试集
-图像大小为(num_px,num_px,3)，其中3代表3个通道( RGB )。
你将建立一个简单的图像识别算法，可以正确地将图片分类为猫或非猫。

包

numpy 
h5py
matplotlib
PIL
scipy

# %load lr_utils.py

import numpy as np
import h5py
    
    
def load_dataset():
    train_dataset = h5py.File('datasets/train_catvnoncat.h5', "r")
    train_set_x_orig = np.array(train_dataset["train_set_x"][:]) # your train set features
    train_set_y_orig = np.array(train_dataset["train_set_y"][:]) # your train set labels

    test_dataset = h5py.File('datasets/test_catvnoncat.h5', "r")
    test_set_x_orig = np.array(test_dataset["test_set_x"][:]) # your test set features
    test_set_y_orig = np.array(test_dataset["test_set_y"][:]) # your test set labels

    classes = np.array(test_dataset["list_classes"][:]) # the list of classes
    
    train_set_y_orig = train_set_y_orig.reshape((1, train_set_y_orig.shape[0]))
    test_set_y_orig = test_set_y_orig.reshape((1, test_set_y_orig.shape[0]))
    
    return train_set_x_orig, train_set_y_orig, test_set_x_orig, test_set_y_orig, classes

可视化

index = 25
example = train_set_x_orig[index]
plt.imshow(train_set_x_orig[index])
print ("y = " + str(train_set_y[:, index]) + ", it's a '" + classes[np.squeeze(train_set_y[:, index])].decode("utf-8") +  "' picture.")

数据集尺寸

### START CODE HERE ### (≈ 3 lines of code)
m_train = train_set_x_orig.shape[0]
m_test = test_set_x_orig.shape[0]
num_px = train_set_x_orig.shape[2]
### END CODE HERE ###
print("m_train:"+str(m_train))
print("m_test:"+str(m_test))
print("num_px:"+str(num_px))

reshape

# Reshape the training and test examples

### START CODE HERE ### (≈ 2 lines of code)
train_set_x_flatten = train_set_x_orig.reshape(train_set_x_orig.shape[0],-1).T
test_set_x_flatten = test_set_x_orig.reshape(test_set_x_orig.shape[0],-1).T
### END CODE HERE ###
print ("train_set_x_flatten shape: " + str(train_set_x_flatten.shape))
print ("train_set_y shape: " + str(train_set_y.shape))
print ("test_set_x_flatten shape: " + str(test_set_x_flatten.shape))
print ("test_set_y shape: " + str(test_set_y.shape))
print ("sanity check after reshaping: " + str(train_set_x_flatten[0:5,0]))

标准化数据集

train_set_x = train_set_x_flatten/255.
test_set_x = test_set_x_flatten/255.

总结

图像预处理步骤：
1.找出训练集及测试集个数及图像尺寸( m _ train，m _ test，num _ px，...) )
2.resgape数据集，使每个图像成为一个大小为( num _ px * num _ px * 3，1 )的向量
3.“标准化”数据

学习算法的一般结构

-初始化模型的参数
-通过最小化成本来学习模型的参数
-使用学习到的参数进行预测(在测试集上)
-分析结果并得出结论

构建我们算法的各个部分

sigmoid函数

# GRADED FUNCTION: sigmoid

def sigmoid(z):
    """
    Compute the sigmoid of z

    Arguments:
    z -- A scalar or numpy array of any size.

    Return:
    s -- sigmoid(z)
    """

    ### START CODE HERE ### (≈ 1 line of code)
    s = 1 / ( 1 + np.exp(-z))
    ### END CODE HERE ###
    
    return s

初始化参数

def initialize_with_zeros(dim):
    """
    This function creates a vector of zeros of shape (dim, 1) for w and initializes b to 0.
    
    Argument:
    dim -- size of the w vector we want (or number of parameters in this case)
    
    Returns:
    w -- initialized vector of shape (dim, 1)
    b -- initialized scalar (corresponds to the bias)
    """
    
    ### START CODE HERE ### (≈ 1 line of code)
    w = np.zeros(shape=(dim,1),dtype=np.float32)
    b = 0
    ### END CODE HERE ###

    assert(w.shape == (dim, 1))
    assert(isinstance(b, float) or isinstance(b, int))
    
    return w, b

dim = 2
w, b = initialize_with_zeros(dim)
print ("w = " + str(w))
print ("b = " + str(b))

前向传播和反向传播

# GRADED FUNCTION: propagate

def propagate(w, b, X, Y):
    """
    Implement the cost function and its gradient for the propagation explained above

    Arguments:
    w -- weights, a numpy array of size (num_px * num_px * 3, 1)
    b -- bias, a scalar
    X -- data of size (num_px * num_px * 3, number of examples)
    Y -- true "label" vector (containing 0 if non-cat, 1 if cat) of size (1, number of examples)

    Return:
    cost -- negative log-likelihood cost for logistic regression
    dw -- gradient of the loss with respect to w, thus same shape as w
    db -- gradient of the loss with respect to b, thus same shape as b
    
    Tips:
    - Write your code step by step for the propagation. np.log(), np.dot()
    """
    
    m = X.shape[1]
    
    # FORWARD PROPAGATION (FROM X TO COST)
    ### START CODE HERE ### (≈ 2 lines of code)
    yhat = sigmoid(np.dot(w.T,X)+b)
    cost =-1/m*np.sum(Y*np.log(yhat)+(1-Y)*np.log(1-yhat),axis = 1) 
    ### END CODE HERE ###
    
    # BACKWARD PROPAGATION (TO FIND GRAD)
    ### START CODE HERE ### (≈ 2 lines of code)
    dZ = yhat -Y
    dw = 1/m*np.dot(X,dZ.T)
    db = 1/m*np.sum(dZ,axis = 1 ,keepdims = True)
    ### END CODE HERE ###

    assert(dw.shape == w.shape)
    assert(db.dtype == float)
    cost = np.squeeze(cost)
    assert(cost.shape == ())
    
    grads = {"dw": dw,
             "db": db}
    
    return grads, cost

w, b, X, Y = np.array([[1],[2]]), 2, np.array([[1,2],[3,4]]), np.array([[1,0]])
grads, cost = propagate(w, b, X, Y)
print ("dw = " + str(grads["dw"]))
print ("db = " + str(grads["db"]))
print ("cost = " + str(cost))

梯度下降法

# GRADED FUNCTION: optimize

def optimize(w, b, X, Y, num_iterations, learning_rate, print_cost = False):
    """
    This function optimizes w and b by running a gradient descent algorithm
    
    Arguments:
    w -- weights, a numpy array of size (num_px * num_px * 3, 1)
    b -- bias, a scalar
    X -- data of shape (num_px * num_px * 3, number of examples)
    Y -- true "label" vector (containing 0 if non-cat, 1 if cat), of shape (1, number of examples)
    num_iterations -- number of iterations of the optimization loop
    learning_rate -- learning rate of the gradient descent update rule
    print_cost -- True to print the loss every 100 steps
    
    Returns:
    params -- dictionary containing the weights w and bias b
    grads -- dictionary containing the gradients of the weights and bias with respect to the cost function
    costs -- list of all the costs computed during the optimization, this will be used to plot the learning curve.
    
    Tips:
    You basically need to write down two steps and iterate through them:
        1) Calculate the cost and the gradient for the current parameters. Use propagate().
        2) Update the parameters using gradient descent rule for w and b.
    """
    
    costs = []
    
    for i in range(num_iterations):
        
        
        # Cost and gradient calculation (≈ 1-4 lines of code)
        ### START CODE HERE ### 
        grads, cost = propagate(w=w, b=b, X=X, Y=Y)
        ### END CODE HERE ###
        
        # Retrieve derivatives from grads
        dw = grads["dw"]
        db = grads["db"]
        
        # update rule (≈ 2 lines of code)
        ### START CODE HERE ###
        w = w - learning_rate*dw
        b = b -  learning_rate*db
        ### END CODE HERE ###
        
        # Record the costs
        if i % 100 == 0:
            costs.append(cost)
        
        # Print the cost every 100 training examples
        if print_cost and i % 100 == 0:
            print ("Cost after iteration %i: %f" %(i, cost))
    
    params = {"w": w,
              "b": b}
    
    grads = {"dw": dw,
             "db": db}
    
    return params, grads, costs

params, grads, costs = optimize(w, b, X, Y, num_iterations= 100, learning_rate = 0.009, print_cost = False)

print ("w = " + str(params["w"]))
print ("b = " + str(params["b"]))
print ("dw = " + str(grads["dw"]))
print ("db = " + str(grads["db"]))

预测

# GRADED FUNCTION: predict

def predict(w, b, X):
    '''
    Predict whether the label is 0 or 1 using learned logistic regression parameters (w, b)
    
    Arguments:
    w -- weights, a numpy array of size (num_px * num_px * 3, 1)
    b -- bias, a scalar
    X -- data of size (num_px * num_px * 3, number of examples)
    
    Returns:
    Y_prediction -- a numpy array (vector) containing all predictions (0/1) for the examples in X
    '''
    
    m = X.shape[1]
    Y_prediction = np.zeros((1,m))
    w = w.reshape(X.shape[0], 1)
    
    # Compute vector "A" predicting the probabilities of a cat being present in the picture
    ### START CODE HERE ### (≈ 1 line of code)
    A = sigmoid(np.dot(w.T,X)+b)
    ### END CODE HERE ###
    
    [print(x) for x in A]
    for i in range(A.shape[1]):
        
        # Convert probabilities A[0,i] to actual predictions p[0,i]
        ### START CODE HERE ### (≈ 4 lines of code)
        if A[0, i] >= 0.5:
            Y_prediction[0, i] = 1
            
        else:
            Y_prediction[0, i] = 0
        ### END CODE HERE ###
    assert(Y_prediction.shape == (1, m))
    
    return Y_prediction

print ("predictions = " + str(predict(w, b, X)))

将所有函数合并到模型中

# GRADED FUNCTION: model

def model(X_train, Y_train, X_test, Y_test, num_iterations = 2000, learning_rate = 0.5, print_cost = False):
    """
    Builds the logistic regression model by calling the function you've implemented previously
    
    Arguments:
    X_train -- training set represented by a numpy array of shape (num_px * num_px * 3, m_train)
    Y_train -- training labels represented by a numpy array (vector) of shape (1, m_train)
    X_test -- test set represented by a numpy array of shape (num_px * num_px * 3, m_test)
    Y_test -- test labels represented by a numpy array (vector) of shape (1, m_test)
    num_iterations -- hyperparameter representing the number of iterations to optimize the parameters
    learning_rate -- hyperparameter representing the learning rate used in the update rule of optimize()
    print_cost -- Set to true to print the cost every 100 iterations
    
    Returns:
    d -- dictionary containing information about the model.
    """
    
    ### START CODE HERE ###
    # initialize parameters with zeros (≈ 1 line of code)
    w, b = initialize_with_zeros(X_train.shape[0])
    # Gradient descent (≈ 1 line of code)
    parameters, grads, costs = optimize(w, b, X_train, Y_train, num_iterations, learning_rate, print_cost)
    
    # Retrieve parameters w and b from dictionary "parameters"
    w = parameters["w"]
    b = parameters["b"]
    
    # Predict test/train set examples (≈ 2 lines of code)
    Y_prediction_test = predict(w, b, X_test)
    Y_prediction_train = predict(w, b, X_train)

    ### END CODE HERE ###

    # Print train/test Errors
    print("train accuracy: {} %".format(100 - np.mean(np.abs(Y_prediction_train - Y_train)) * 100))
    print("test accuracy: {} %".format(100 - np.mean(np.abs(Y_prediction_test - Y_test)) * 100))

    
    d = {"costs": costs,
         "Y_prediction_test": Y_prediction_test, 
         "Y_prediction_train" : Y_prediction_train, 
         "w" : w, 
         "b" : b,
         "learning_rate" : learning_rate,
         "num_iterations": num_iterations}
    
    return d

d = model(train_set_x, train_set_y, test_set_x, test_set_y, num_iterations = 2000, learning_rate = 0.005, print_cost = True)

例子

# Example of a picture that was wrongly classified.
index = 1
plt.imshow(test_set_x[:,index].reshape((num_px, num_px, 3)))
print ("y = " + str(test_set_y[0,index]) + ", you predicted that it is a \"" + classes[int(d["Y_prediction_test"][0,index])].decode("utf-8") +  "\" picture.")

迭代次数对代价函数的影响

# Plot learning curve (with costs)
costs = np.squeeze(d['costs'])
plt.plot(costs)
plt.ylabel('cost')
plt.xlabel('iterations (per hundreds)')
plt.title("Learning rate =" + str(d["learning_rate"]))
plt.show()

测试自己的图像

## START CODE HERE ## (PUT YOUR IMAGE NAME) 
my_image = "my_image.jpg"   # change this to the name of your image file 
## END CODE HERE ##

# We preprocess the image to fit your algorithm.
fname = "images/" + my_image
image = np.array(plt.imread(fname))
my_image = skimage.transform.resize(image, output_shape=(num_px,num_px)).reshape((1, num_px*num_px*3)).T
my_predicted_image = predict(d["w"], d["b"], my_image)

plt.imshow(image)
print("y = " + str(np.squeeze(my_predicted_image)) + ", your algorithm predicts a \"" + classes[int(np.squeeze(my_predicted_image)),].decode("utf-8") +  "\" picture.")

【ShuQiHere】《机器学习的进化史『下』：从神经网络到深度学习的飞跃》 ShuQiHere 机器学习深度学习神经网络
【ShuQiHere】引言：神经网络与深度学习的兴起在上篇文章中，我们回顾了机器学习的起源与传统模型的发展历程，如线性回归、逻辑回归和支持向量机（SVM）。然而，随着数据规模的急剧增长和计算能力的提升，传统模型在处理复杂问题时显得力不从心。在这种背景下，神经网络重新进入了研究者们的视野，并逐步演变为深度学习，成为解决复杂问题的强大工具。今天，我们将进一步探索从神经网络到深度学习的进化历程，揭示这些
神经网络深度学习梯度下降算法优化海棠如醉人工智能深度学习
【神经网络与深度学习】以最通俗易懂的角度解读[梯度下降法及其优化算法]，这一篇就足够（很全很详细）_梯度下降在神经网络中的作用及概念-CSDN博客https://blog.51cto.com/u_15162069/2761936梯度下降数学原理
李宏毅机器学习笔记 2.回归 Simone Zeng 机器学习机器学习
最近在跟着Datawhale组队学习打卡，学习李宏毅的机器学习/深度学习的课程。课程视频：https://www.bilibili.com/video/BV1Ht411g7Ef开源内容：https://github.com/datawhalechina/leeml-notes本篇文章对应视频中的P3。另外，最近我也在学习邱锡鹏教授的《神经网络与深度学习》，会补充书上的一点内容。通过上一次课1.机器
深度学习路线，包括书籍和视频 jjm2002 深度学习深度学习人工智能
深度学习是一个广泛而快速发展的领域，涉及多种技术和应用。以下是一个深度学习学习路线，包括书籍和视频资源。入门阶段：理解基础知识：书籍：《深度学习》（DeepLearning）IanGoodfellow,YoshuaBengio和AaronCourville著。这是深度学习领域的权威书籍，适合初学者。书籍：《神经网络与深度学习》（NeuralNetworksandDeepLearning）Micha
神经网络与深度学习 Neural Networks and Deep Learning 课程笔记第一周林间得鹿吴恩达深度学习系列课程笔记深度学习神经网络笔记
神经网络与深度学习NeuralNetworksandDeepLearning课程笔记第一周文章目录神经网络与深度学习NeuralNetworksandDeepLearning课程笔记第一周深度学习简介什么是神经网络使用神经网络进行监督学习为什么神经网络会兴起本文是吴恩达深度学习系列课程的学习笔记。深度学习简介什么是神经网络深度学习一般是指训练神经网络。那么什么是神经网络？课程以房价预测的例子来说明
小白初探｜神经网络与深度学习神奇的代码在哪里人工智能深度学习神经网络人工智能外接显卡
一、学习背景由于工作的原因，需要开展人工智能相关的研究，虽然不用参与实际研发，但在项目实施过程中发现，人工智能的项目和普通程序开发项目不一样，门槛比较高，没有相关基础没法搞清楚人力、财力如何投入，很难合理管控成本以及时间。为搞清楚情况，老年博主决定一步一个脚印，好好自学。在写本文时，博主已学到一定阶段了，趁有时间，通过博文记录下来，以免遗忘。二、学习准备常年的学习告诉我们，一门学科要快速入门，主流
神经网络与深度学习Pytorch版 Softmax回归笔记砍树＋c＋v 深度学习神经网络 pytorch 人工智能 python 回归笔记
Softmax回归目录Softmax回归1.独热编码2.Softmax回归的网络架构是一个单层的全连接神经网络。3.Softmax回归模型概述及其在多分类问题中的应用4.Softmax运算在多分类问题中的应用及其数学原理5.小批量样本分类的矢量计算表达式6.交叉熵损失函数7.模型预测及评价8.小结Softmax回归，也称为多类逻辑回归，是一种用于解决多分类问题的机器学习算法。它与普通的logist
【吴恩达-神经网络与深度学习】第3周：浅层神经网络倏然希然_ 深度学习与神经网络神经网络深度学习人工智能
目录神经网络概览神经网络表示含有一个隐藏层的神经网络（双层神经网络）计算神经网络的输出多样本的向量化向量化实现的解释激活函数（Activationfunctions）一些选择激活函数的经验法则：为什么需要非线性激活函数？激活函数的导数神经网络的梯度下降法（选修）直观理解反向传播随机初始化神经网络概览右上角方括号[]里面的数字表示神经网络的层数可以把许多sigmoid单元堆叠起来形成一个神经网络：第
2023年度佳作：AIGC、AGI、GhatGPT、人工智能大语言模型的崛起与挑战鸭鸭渗透人工智能 AIGC agi 语言模型自然语言处理
目录前言01《ChatGPT驱动软件开发》内容简介02《ChatGPT原理与实战》内容简介03《神经网络与深度学习》04《AIGC重塑教育》内容简介05《通用人工智能》目录前言2023年是人工智能大语言模型大爆发的一年，一些概念和英文缩写也在这一年里集中出现，很容易混淆，甚至把人搞懵。LLM：LargeLanguageModel，即大语言模型，旨在理解和生成人类语言。LLM的特点是规模庞大，包含成
Pytorch 实现强化学习策略梯度Reinforce算法爱喝咖啡的加菲猫强化学习强化学习神经网络 pytorch
一、公式推导这里参考邱锡鹏大佬的《神经网络与深度学习》第三章进阶模型部分，链接《神经网络与深度学习》。`伪代码：二、核心代码defmain():env=gym.make('CartPole-v0')obs_n=env.observation_space.shape[0]act_n=env.action_space.nlogger.info('obs_n{},act_n{}'.format(obs_
基于图神经网络与深度学习的商品推荐算法谦谦菜鸟深度学习机器学习人工智能
传统做法现阶段局限创新方法结果相关工作目前推荐算法基于矩阵分解的推荐算法基于深度学习的推荐算法基于图神经网络的推荐算法创新点模型设计本文的核心任务是训练出一个模型LGDL模型框架嵌入层ID特征嵌入评论文本特征嵌入前向传播层关联关系提取偏好特征提取评分预测层模型优化传统做法利用深度学习方法从用户ID、评论文本等数据中提取其中所隐藏的用户物品特征，根据该特征预测用户对新物品的打分从而给出推荐是传统推荐
神经网络与深度学习（五）——人工神经网络和卷积神经网络吴丞楚20012100032
姓名：吴丞楚学号：20012100032学院：竹园三号书院【嵌牛导读】简要介绍NN与CNN【嵌牛鼻子】深度学习神经网络【嵌牛提问】NN与CNN的区别有哪些人工神经网络简称神经网络(NN)，是目前各种神经网络的基础，其构造是仿造生物神经网络，将神经元看成一个逻辑单元，其功能是用于对函数进行估计和近似，是一种自适应系统，通俗的讲就是具备学习能力。其作用，目前为止就了解到分类。其目的就是在圈和叉之间画出
学习笔记--神经网络与深度学习之卷积神经网络 qssssss79 深度学习神经网络深度学习学习
目录1.卷积1.1一维卷积1.2卷积的作用1.3卷积扩展1.4二维卷积1.5互相关2.卷积神经网络2.1用卷积代替全连接2.2卷积层2.3汇聚层（池化层）2.4卷积网络结构3.其它卷积种类3.1空洞卷积3.2转置卷积/微步卷积4典型的卷积神经网络4.1LeNet-54.2AlexNet4.3Inception4.4残差网络利用全连接前馈网络处理图像时的问题：（1）参数太多：对于输入的10010
计划1 JLcucumber
1.吴恩达DL2021(强推|双字)2021版吴恩达深度学习课程Deeplearning.ai_哔哩哔哩_bilibiliPart1神经网络与深度学习（6+19+12+8）共45Part2训练、开发、测试集（14+10+11）共35Part3机器学习策略（13+11）共24Part4计算机视觉（11+14+14+(5+6)）共50Part5序列模型（12+10+15）共372.经典网络模型论文ht
[23-24 秋学期] NNDL-作业2 HBU 洛杉矶县牛肉板面深度学习人工智能机器学习深度学习
前言：本文解决《神经网络与深度学习》-邱锡鹏第二章课后题。对于习题2-1，平方损失函数在机器学习课程中学习过，但是惭愧的讲，在完成这篇博客前我对均方误差和平方损失函数的概念还有些混淆。交叉熵损失函数我未曾了解过，只在决策树一节中学习过关于熵entropy的基本概念。借此机会弄清原理，并且尝试着学会应用它。对于习题2-12，考察对混淆矩阵的理解程度和计算。其中宏平均和微平均是我未曾学习过的概念，借此
【22-23 春学期】AI作业5-深度学习基础 HBU_David AI 深度学习人工智能 python
人工智能、机器学习、深度学习之间的关系神经网络与深度学习的关系“深度学习”和“传统浅层学习”的区别和联系神经元、人工神经元MP模型单层感知机SLP异或问题XOR多层感知机MLP前馈神经网络FNN激活函数ActivationFunction为什么要使用激活函数？常用激活函数有哪些？均方误差和交叉熵损失函数，哪个适合于分类？哪个适合于回归？为什么？
神经网络与深度学习day01-基础知识小鬼缠身、深度学习神经网络人工智能 python
今天开始新学期，然后就是每周要在这里发这周的实验报告，CSDN对不起了，你可能不情愿，但是必须要稍微容纳一下我(这个菜比)在这里吹了。第一周的基础知识训练：1、导入numpy库importnumpy2、建立一个一维数组a=[4,5,6]。输出：(1)a的类型；(2)a的各维度的大小；(3)a的第一个元素a=[4,5,6]print(type(a))print(numpy.shape(a))prin
HBU_神经网络与深度学习实验10 卷积神经网络：基于ResNet18网络完成图像分类任务 ZodiAc7 cnn 深度学习 python
目录写在前面的一些内容一、实践：基于ResNet18网络完成图像分类任务1.数据处理(1)数据集介绍(2)数据读取(3)构造Dataset类2.模型构建3.模型训练4.模型评价5.模型预测二、实验Q&A写在前面的一些内容本文为HBU_神经网络与深度学习实验（2022年秋）实验10的实验报告，此文的基本内容参照[1]Github/卷积神经网络-下.ipynb，检索时请按对应序号进行检索。本实验编程语
Python练习题：猜数字游戏 BioVS python 开发语言
#题目来源于MOOC课程《神经网络与深度学习》，程序为自己独立编写题目：随机产生一个1-10之间的整数，并提示用户输入1-10的整数进行猜测，判断是否猜中。每次猜完后，提示“太大了”或者“太小了”，猜对之后提示“恭喜你，猜对了！”，并退出程序。当用户才出数字后，询问是否想要继续下一轮游戏，并记录显示用户已参加轮次。对应python程序：importrandomtimes=1#存放第几轮游戏，用于后
2023年度盘点：AIGC、AGI、GhatGPT、人工智能大模型必读书单家有娇妻张兔兔粉丝送书活动 AIGC agi 人工智能福利送书
2023年度盘点智能大模型必读书单概述好书推荐01《ChatGPT驱动软件开发》02《ChatGPT原理与实战》03《神经网络与深度学习》04《AIGC重塑教育》05《通用人工智能》写在末尾：主页传送门：传送送书系列：送书第一期：考研必备书单送书第二期：CTF那些事儿送书第三期：数据要素安全流通送书第四期：MLOps工程实践：工具、技术与企业级应用送书第五期：Python数据挖掘：入门进阶与实用案
搜索与人工智能码海串游人工智能
前言第一：通过博弈树搜索和启发式搜索的例子了解基于搜索的通用问题求解方法第二：了解人工智能发展的历程和社会影响第三：了解机器学习的基本思想和典型应用第四：了解人工智能应用开发的基本模式内容1.博弈树与剪纸、零和博弈，极大极小策略博弈树与搜索，α与β剪枝以及著名的计算机博弈的例子2.启发式搜索启发式函数，启发式搜索过程，3.人工智能与机器学习人工智能发展历程，专家系统，机器学习，神经网络与深度学习。
2023年度AI盘点 AIGC|AGI|ChatGPT|人工智能大模型 herosunly 优质书籍推荐人工智能 AIGC agi
文章目录0.前言1.《ChatGPT驱动软件开发》2.《ChatGPT原理与实战》3.《神经网络与深度学习》4.《AIGC重塑教育》5.《通用人工智能》0.前言 2023年是人工智能大语言模型大爆发的一年，一些概念和英文缩写也在这一年里集中出现，很容易混淆，甚至把人搞懵。LLM：LargeLanguageModel，即大语言模型，旨在理解和生成人类语言。LLM的特点是规模庞大，包含成百、上千亿的
DL Homework 11 熬夜患者 DL Homework 人工智能深度学习
目录1.被优化函数编辑(代码来源于邱锡鹏老师的神经网络与深度学习的实验）L1.pyop.py（1）SimpleBatchGD（2）Adagrad（3）RMSprop（4）Momentum（5）Adam2.被优化函数编辑3.解释不同轨迹的形成原因，并分析各个算法的优缺点（1）SimpleBatchGD（2）Adagrad（3）RMSprop（4）Momentum（5）Adam总结在展开本次作业之前，
2020-12-07 吴恩达-神经网络与深度学习-第三周编程练习 Vivivivi安
Github地址：https://github.com/Poissons/wuenda-Deep-Learning-And-Neural-Network-third-week-excercise.git
2020-12-03 吴恩达-神经网络与深度学习-第二周编程练习 Vivivivi安
最近听吴恩达老师的课，写课后作业Github地址：https://github.com/Poissons/wuenda-Deep-Learning-And-Neural-Network-second-week-excercise
2023年度AI盘点 AIGC|AGI|ChatGPT|人工智能大模型雪碧有白泡泡粉丝福利活动人工智能 AIGC agi
前言「作者主页」：雪碧有白泡泡「个人网站」：雪碧的个人网站2023年是人工智能大语言模型大爆发的一年，一些概念和英文缩写也在这一年里集中出现，很容易混淆，甚至把人搞懵。文章目录前言01《ChatGPT驱动软件开发》02《ChatGPT原理与实战》03《神经网络与深度学习》《AIGC重塑教育》05《通用人工智能》LLM：LargeLanguageModel，即大语言模型，旨在理解和生成人类语言。LL
年度大盘点：AIGC、AGI、GhatGPT震撼登场！揭秘人工智能大模型的奥秘与必读书单洁洁！ external AIGC agi 人工智能
这里写目录标题前言01《ChatGPT驱动软件开发》02《ChatGPT原理与实战》03《神经网络与深度学习》04《AIGC重塑教育》05《通用人工智能》前言在2023年，人工智能领域经历了一场前所未有的大爆发，特别是在语言模型领域。新的概念和英文缩写如AIGC、AGI、GhatGPT等频繁出现，给人们带来了极大的困惑和好奇。这些突如其来的名词和缩写不仅让人摸不着头脑，还引发了对人工智能发展的种种
2023年度佳作：AIGC、AGI、GhatGPT、人工智能大语言模型的崛起与挑战库库的里昂杂谈人工智能 AIGC agi 语言模型自然语言处理
目录前言01《ChatGPT驱动软件开发》内容简介02《ChatGPT原理与实战》内容简介03《神经网络与深度学习》04《AIGC重塑教育》内容简介05《通用人工智能》目录前言2023年是人工智能大语言模型大爆发的一年，一些概念和英文缩写也在这一年里集中出现，很容易混淆，甚至把人搞懵。LLM：LargeLanguageModel，即大语言模型，旨在理解和生成人类语言。LLM的特点是规模庞大，包含成
循环神经网络-RNN记忆能力实验 [HBU] 洛杉矶县牛肉板面深度学习 rnn 深度学习人工智能
目录一、循环神经网络二、循环神经网络的记忆能力实验三、数据集构建数据集的构建函数加载数据并进行数据划分构造Dataset类四、模型构建嵌入层SRN层五、模型训练训练指定长度的数字预测模型多组训练损失曲线展示六、模型评价参考《神经网络与深度学习》中的公式(6.50)，改进SRN的循环单元，加入隐状态之间的残差连接，并重复数字求和实验。观察是否可以缓解长程依赖问题？总结参考原文章：aistudio.b
[23-24 秋学期]NNDL 作业6 卷积 [HBU] 洛杉矶县牛肉板面深度学习深度学习人工智能卷积神经网络
目录一、概念二、探究不同卷积核的作用后接：关于使用pycharm输出卷积图像后图片仍然不清晰的可能原因以及解决方法总结：前言：卷积常用于特征提取实验过程中注意认真体会“特征提取”，弄清楚为什么卷积能够提取特征。一、概念用自己的语言描述“卷积、卷积核、特征图、特征选择、步长、填充、感受野”。大致看了一遍邱锡鹏《神经网络与深度学习》的卷积一节。谈谈我对这些名词概念的理解(理解不足描述不准请见谅)。个人
java类加载顺序 3213213333332132 java
package com.demo; /** * @Description 类加载顺序 * @author FuJianyong * 2015-2-6上午11:21:37 */ public class ClassLoaderSequence { String s1 = "成员属性"; static String s2 = "
Hibernate与mybitas的比较 BlueSkator sql Hibernate 框架 ibatis orm
第一章 Hibernate与MyBatis Hibernate 是当前最流行的O/R mapping框架，它出身于sf.net，现在已经成为Jboss的一部分。 Mybatis 是另外一种优秀的O/R mapping框架。目前属于apache的一个子项目。 MyBatis 参考资料官网：http:
php多维数组排序以及实际工作中的应用 dcj3sjt126com PHP usort uasort
自定义排序函数返回false或负数意味着第一个参数应该排在第二个参数的前面, 正数或true反之, 0相等usort不保存键名uasort 键名会保存下来uksort 排序是对键名进行的 <!doctype html> <html lang="en"> <head> <meta charset="utf-8&q
DOM改变字体大小周华华前端
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
c3p0的配置 g21121 c3p0
c3p0是一个开源的JDBC连接池，它实现了数据源和JNDI绑定，支持JDBC3规范和JDBC2的标准扩展。c3p0的下载地址是：http://sourceforge.net/projects/c3p0/这里可以下载到c3p0最新版本。以在spring中配置dataSource为例：  <bean name="prope
Java获取工程路径的几种方法 510888780 java
第一种： File f = new File(this.getClass().getResource("/").getPath()); System.out.println(f); 结果: C:\Documents%20and%20Settings\Administrator\workspace\projectName\bin 获取当前类的所在工程路径; 如果不加“
在类Unix系统下实现SSH免密码登录服务器 Harry642 免密 ssh
1.客户机 (1)执行ssh-keygen -t rsa -C "[email protected]"生成公钥，xxx为自定义大email地址 (2)执行scp ~/.ssh/id_rsa.pub root@xxxxxxxxx:/tmp将公钥拷贝到服务器上，xxx为服务器地址 (3)执行cat
Java新手入门的30个基本概念一 aijuans java java 入门新手
在我们学习Java的过程中,掌握其中的基本概念对我们的学习无论是J2SE,J2EE,J2ME都是很重要的,J2SE是Java的基础,所以有必要对其中的基本概念做以归纳,以便大家在以后的学习过程中更好的理解java的精髓,在此我总结了30条基本的概念。　　Java概述:　　目前Java主要应用于中间件的开发(middleware)---处理客户机于服务器之间的通信技术,早期的实践证明,Java不适合
Memcached for windows 简单介绍 antlove java Web windows cache memcached
1. 安装memcached server a. 下载memcached-1.2.6-win32-bin.zip b. 解压缩，dos 窗口切换到 memcached.exe所在目录，运行memcached.exe -d install c.启动memcached Server,直接在dos窗口键入 net start "memcached Server&quo
数据库对象的视图和索引百合不是茶索引 oeacle数据库视图
视图视图是从一个表或视图导出的表，也可以是从多个表或视图导出的表。视图是一个虚表，数据库不对视图所对应的数据进行实际存储，只存储视图的定义，对视图的数据进行操作时,只能将字段定义为视图,不能将具体的数据定义为视图为什么oracle需要视图; &
Mockito(一) --入门篇 bijian1013 持续集成 mockito 单元测试
Mockito是一个针对Java的mocking框架，它与EasyMock和jMock很相似，但是通过在执行后校验什么已经被调用，它消除了对期望行为（expectations）的需要。其它的mocking库需要你在执行前记录期望行为（expectations），而这导致了丑陋的初始化代码。 &nb
精通Oracle10编程SQL(5)SQL函数 bijian1013 oracle 数据库 plsql
/* * SQL函数 */ --数字函数 --ABS(n):返回数字n的绝对值 declare v_abs number(6,2); begin v_abs:=abs(&no); dbms_output.put_line('绝对值：'||v_abs); end; --ACOS(n):返回数字n的反余弦值，输入值的范围是-1~1，输出值的单位为弧度
【Log4j一】Log4j总体介绍 bit1129 log4j
Log4j组件：Logger、Appender、Layout Log4j核心包含三个组件：logger、appender和layout。这三个组件协作提供日志功能：日志的输出目标日志的输出格式日志的输出级别(是否抑制日志的输出) logger继承特性 A logger is said to be an ancestor of anothe
Java IO笔记白糖_ java
public static void main(String[] args) throws IOException { //输入流 InputStream in = Test.class.getResourceAsStream("/test"); InputStreamReader isr = new InputStreamReader(in); Bu
Docker 监控 ronin47 docker监控
目前项目内部署了docker，于是涉及到关于监控的事情，参考一些经典实例以及一些自己的想法，总结一下思路。 1、关于监控的内容监控宿主机本身监控宿主机本身还是比较简单的，同其他服务器监控类似，对cpu、network、io、disk等做通用的检查，这里不再细说。额外的，因为是docker的
java-顺时针打印图形 bylijinnan java
一个画图程序要求打印出： 1.int i=5; 2.1 2 3 4 5 3.16 17 18 19 6 4.15 24 25 20 7 5.14 23 22 21 8 6.13 12 11 10 9 7. 8.int i=6 9.1 2 3 4 5 6 10.20 21 22 23 24 7 11.19
关于iReport汉化版强制使用英文的配置方法 Kai_Ge iReport汉化英文版
对于那些具有强迫症的工程师来说，软件汉化固然好用，但是汉化不完整却极为头疼，本方法针对iReport汉化不完整的情况，强制使用英文版，方法如下：在 iReport 安装路径下的 etc/ireport.conf 里增加红色部分启动参数，即可变为英文版。 # ${HOME} will be replaced by user home directory accordin
[并行计算]论宇宙的可计算性 comsci 并行计算
现在我们知道,一个涡旋系统具有并行计算能力.按照自然运动理论,这个系统也同时具有存储能力,同时具备计算和存储能力的系统,在某种条件下一般都会产生意识...... 那么,这种概念让我们推论出一个结论 &nb
用OpenGL实现无限循环的coverflow dai_lm android coverflow
网上找了很久，都是用Gallery实现的，效果不是很满意，结果发现这个用OpenGL实现的，稍微修改了一下源码，实现了无限循环功能源码地址： https://github.com/jackfengji/glcoverflow public class CoverFlowOpenGL extends GLSurfaceView implements GLSurfaceV
JAVA数据计算的几个解决方案1 datamachine java Hibernate 计算
老大丢过来的软件跑了10天，摸到点门道，正好跟以前攒的私房有关联，整理存档。 -----------------------------华丽的分割线------------------------------------- 数据计算层是指介于数据存储和应用程序之间，负责计算数据存储层的数据，并将计算结果返回应用程序的层次。J &nbs
简单的用户授权系统,利用给user表添加一个字段标识管理员的方式 dcj3sjt126com yii
怎么创建一个简单的(非 RBAC)用户授权系统通过查看论坛，我发现这是一个常见的问题，所以我决定写这篇文章。本文只包括授权系统.假设你已经知道怎么创建身份验证系统(登录)。数据库首先在 user 表创建一个新的字段(integer 类型),字段名 'accessLevel',它定义了用户的访问权限扩展 CWebUser 类在配置文件(一般为 protecte
未选之路 dcj3sjt126com 诗
作者:罗伯特*费罗斯特黄色的树林里分出两条路, 可惜我不能同时去涉足, 我在那路口久久伫立, 我向着一条路极目望去, 直到它消失在丛林深处. 但我却选了另外一条路, 它荒草萋萋,十分幽寂; 显得更诱人,更美丽, 虽然在这两条小路上, 都很少留下旅人的足迹. 那天清晨落叶满地, 两条路都未见脚印痕迹. 呵,留下一条路等改日再
Java处理15位身份证变18位蕃薯耀 18位身份证变15位 15位身份证变18位身份证转换
15位身份证变18位，18位身份证变15位 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--应用上下文配置【AppConfig】 hanqunfeng springmvc4
从spring3.0开始，Spring将JavaConfig整合到核心模块，普通的POJO只需要标注@Configuration注解，就可以成为spring配置类，并通过在方法上标注@Bean注解的方式注入bean。 Xml配置和Java类配置对比如下： applicationContext-AppConfig.xml <!-- 激活自动代理功能参看：
Android中webview跟JAVASCRIPT中的交互 jackyrong JavaScript html android 脚本
在android的应用程序中,可以直接调用webview中的javascript代码,而webview中的javascript代码,也可以去调用ANDROID应用程序(也就是JAVA部分的代码).下面举例说明之: 1 JAVASCRIPT脚本调用android程序要在webview中,调用addJavascriptInterface(OBJ,int
8个最佳Web开发资源推荐 lampcy 编程 Web 程序员
Web开发对程序员来说是一项较为复杂的工作，程序员需要快速地满足用户需求。如今很多的在线资源可以给程序员提供帮助，比如指导手册、在线课程和一些参考资料，而且这些资源基本都是免费和适合初学者的。无论你是需要选择一门新的编程语言，或是了解最新的标准，还是需要从其他地方找到一些灵感，我们这里为你整理了一些很好的Web开发资源，帮助你更成功地进行Web开发。这里列出10个最佳Web开发资源，它们都是受
架构师之面试------jdk的hashMap实现 nannan408 HashMap
1.前言。如题。 2.详述。 (1)hashMap算法就是数组链表。数组存放的元素是键值对。jdk通过移位算法（其实也就是简单的加乘算法），如下代码来生成数组下标(生成后indexFor一下就成下标了）。 static int hash(int h) { h ^= (h >>> 20) ^ (h >>>
html禁止清除input文本输入缓存 Rainbow702 html 缓存 input 输入框 change
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; <input type="text" autocomplete="off" n
POJO和JavaBean的区别和联系 tjmljw POJO java beans
POJO 和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Pure Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比 POJO复杂很多， Java Bean 是可复用的组件，对 Java Bean 并没有严格的规
java中单例的五种写法 liuxiaoling java 单例
/** * 单例模式的五种写法： * 1、懒汉 * 2、恶汉 * 3、静态内部类 * 4、枚举 * 5、双重校验锁 */ /** * 五、双重校验锁，在当前的内存模型中无效 */ class LockSingleton { private volatile static LockSingleton singleton; pri

吴恩达神经网络与深度学习——神经网络基础习题2

吴恩达神经网络与深度学习——神经网络基础习题2

神经网络思维的逻辑回归

判断图像上是否有猫

图像预处理

问题叙述

包

可视化

数据集尺寸

reshape

标准化数据集

总结

学习算法的一般结构

构建我们算法的各个部分

sigmoid函数

初始化参数

前向传播和反向传播

梯度下降法

预测

将所有函数合并到模型中

例子

迭代次数对代价函数的影响

测试自己的图像

你可能感兴趣的:(神经网络与深度学习)