取个程序猿的名字

人工智能实践——激活函数损失函数优化器的代码实现

激活函数：

tf.nn.sigmoid或者tf.sigmoid
tf.math.tanh 或者tf.keras.activations.tanh
tf.nn.relu或者tf.keras.activations.relu
前者适用于无keras包，后者在keras搭建中使用

损失函数：

假设有n个输出节点
MSE:
y_onehot = tf.one_hot(y_train, depth=n)
loss = tf.reduce_mean(tf.square(y_onehot - y))
CE:
y_onehot = tf.one_hot(y_train, depth=n)
loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(y_onehot, y))

优化器：

GDO

Tf.train.GradientDescentOptimizer(learning_rate, use_locking=False,
name='GradientDescent)
也就是我们最朴素的方法
v[t] = -ε*▽f(θ[t])
Θ[t+1] = θ[t] +v[t]

SGD

SGD全名 stochastic gradient descent，即随机梯度下降
即从样本中抽取子样本进行梯度训练

train_db = tf.data.Dataset.from_tensor_slices((x_train, y_train)).batch(32)
test_db = tf.data.Dataset.from_tensor_slices((x_test, y_test)).batch(10)
batch()即划分为子样本进行训练

缺点:
1：由于是抽取,因此不可避免的,得到的梯度肯定有误差.因此学习速率需要逐渐减小.否则模型无法收敛 2：因为误差,所以每一次迭代的梯度受抽样的影响比较大,也就是说梯度含有比较大的噪声,不能很好的反映真实梯度.
优化方法：采用学习率衰减
learning_rate = learning_rate_base * learning_rate_decay ** (epoch / learning_rate_step)

最常见的标准化方法就是Z标准化，也是SPSS中最为常用的标准化方法，spss默认的标准化方法就是z-score标准化。

也叫标准差标准化，这种方法给予原始数据的均值（mean）和标准差（standard deviation）进行数据的标准化。

经过处理的数据符合标准正态分布，即均值为0，标准差为1，其转化函数为：

x* = (x - μ ) / σ

其中μ为所有样本数据的均值，σ为所有样本数据的标准差。
z-score标准化方法适用于属性A的最大值和最小值未知的情况，或有超出取值范围的离群数据的情况。该种归一化方式要求原始数据的分布可以近似为高斯分布，否则归一化的效果会变得很糟糕。

momentum-SGD

SGD方法的一个缺点是，其更新方向完全依赖于当前的batch，因而其更新十分不稳定，每次迭代计算的梯度含有比较大的噪音。解决这一问题的一个简单的做法便是引入momentum。

momentum即动量，它模拟的是物体运动时的惯性，即更新的时候在一定程度上保留之前更新的方向，同时利用当前batch的梯度微调最终的更新方向。这样一来，可以在一定程度上增加稳定性，从而学习地更快，并且还有一定摆脱局部最优的能力。

特点:

前后梯度方向一致时,能够加速学习
前后梯度方向不一致时,能够抑制震荡

beta = 0.9
m_w = beta * m_w + (1 - beta) * grads[0]
m_b = beta * m_b + (1 - beta) * grads[1]
w1.assign_sub(learning_rate * m_w)
b1.assign_sub(learning_rate * m_b)

AdaGrad

优点: 能够实现学习率的自动更改。如果这次梯度大,那么学习速率衰减的就快一些;如果这次梯度小,那么学习速率衰减的慢一些

缺点: 任然要设置一个变量ϵ ,经验表明，在普通算法中也许效果不错，会使得学习率单调递减至0，可能会使得训练过程提前结束，即便后续还有数据也无法学到必要的知识。

v_w += tf.square(grads[0])
v_b += tf.square(grads[1])
w1.assign_sub(learning_rate * grads[0] / tf.sqrt(v_w))
b1.assign_sub(learning_rate * grads[1] / tf.sqrt(v_b))

从上面的代码可以看到 grads[0] / tf.sqrt(v_w) v_w += tf.square(grads[0])
从这数学式中我们可以看到相当于 grads[0]/ tf.square(grads[0])
即若**grads[i]**过大，则我们要缩小梯度
grads过小，我们要放大梯度
当然如果把 learning_rate/tf.sqrt(v_w) 整体看作学习率，也说明若如果这次梯度大,那么学习速率衰减的就快一些;如果这次梯度小,那么学习速率衰减的慢一些

AdaDelta

由于AdaGrad单调递减的学习率变化过于激进，我们考虑一个改变二阶动量计算方法的策略：不累积全部历史梯度，而只关注过去一段时间窗口的下降梯度。这也就是AdaDelta名称中Delta的来历。

修改的思路很简单。前面我们讲到，指数移动平均值大约就是过去一段时间的平均值，因此我们用这一方法来计算二阶累积动量：这就避免了二阶动量持续累积、导致训练过程提前结束的问题了。
beta = 0.9
v_w = beta * v_w + (1 - beta) * tf.square(grads[0])
v_b = beta * v_b + (1 - beta) * tf.square(grads[1])
w1.assign_sub(learning_rate * grads[0] / tf.sqrt(v_w))
b1.assign_sub(learning_rate * grads[1] / tf.sqrt(v_b))
我们可以看到，对于历史时间的梯度，每次都会*beta，这会导致越远历史占比越小，近似达到动态窗口的目的。

Adam

Adam(Adaptive Moment Estimation)本质上是带有动量项的RMSprop，它利用梯度的一阶矩估计和二阶矩估计动态调整每个参数的学习率。Adam的优点主要在于经过偏置校正后，每一次迭代学习率都有个确定范围，使得参数比较平稳。
通俗来讲：
是前述方法的集大成者。我们看到，SGD-M在SGD基础上增加了一阶动量，AdaGrad和AdaDelta在SGD基础上增加了二阶动量。把一阶动量和二阶动量都用起来，就是Adam了——Adaptive +Momentum。

global_step = global_step.assign_add(1)
m_w = beta1 * m_w + (1 - beta1) * grads[0]
m_b = beta1 * m_b + (1 - beta1) * grads[1]
v_w = beta2 * v_w + (1 - beta2) * tf.square(grads[0])
v_b = beta2 * v_b + (1 - beta2) * tf.square(grads[1])
m_w_correction = m_w / (1 - tf.pow(beta1, int(global_step)))
m_b_correction = m_b / (1 - tf.pow(beta1, int(global_step)))
v_w_correction = v_w / (1 - tf.pow(beta2, int(global_step)))
v_b_correction = v_b / (1 - tf.pow(beta2, int(global_step)))
w1.assign_sub(learning_rate * m_w_correction / tf.sqrt(v_w_correction))
b1.assign_sub(learning_rate * m_b_correction / tf.sqrt(v_b_correction))

测试

将鸢尾花数据集合带入测试，得到结果如下：【准确率都是100%】
SGD:
loss: 0.12647321820259094
time: 12.007081508636475

momentum-SGD:
loss: 0.12340985238552094
time: 12.843583583831787

AdaGrad:
loss: 0.10842594504356384
time: 12.665419578552246

AdaDelta:
loss: 0.04672025144100189
time: 13.282380819320679

Adam：
loss: 0.04928009212017059
time: 15.38596796989441
可以看到AdaDelta和Adam表现最好，但是时间也是最多。
所以在不同时候要选用不同的方法
下面这篇博文也许能告诉你为什么有些时候我们仍要用SGD，类似于老式相机和美颜手机的区别

https://blog.csdn.net/jiachen0212/article/details/80086926

实现代码

import tensorflow as tf
import os
from sklearn import datasets
from matplotlib import pyplot as plt
import numpy as np
import time
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'  # 只显示error，不显示其他信息
def standardize(train):
    # 数据标准化（标准正态分布）
    x_data = train.T
    for i in range(4):
        x_data[i] = (x_data[i] - np.mean(x_data[i])) / np.std(x_data[i])
    return x_data.T

x_data = datasets.load_iris().data
y_data = datasets.load_iris().target

x_data = standardize(x_data)

# 随机打乱数据
np.random.seed(116)
np.random.shuffle(x_data)
np.random.seed(116)
np.random.shuffle(y_data)

x_train = x_data[:-30]
y_train = y_data[:-30]
x_test = x_data[-30:]
y_test = y_data[-30:]

x_train = tf.cast(x_train, tf.float32)
x_test = tf.cast(x_test, tf.float32)


# from_tensor_slices函数切分传入的 Tensor 的第一个维度，生成相应的 dataset
train_db = tf.data.Dataset.from_tensor_slices((x_train, y_train)).batch(32)
test_db = tf.data.Dataset.from_tensor_slices((x_test, y_test)).batch(10)

# seed: 随机数种子，是一个整数，当设置之后，每次生成的随机数都一样
w1 = tf.Variable(tf.random.truncated_normal([4, 3], stddev=0.1, seed=1))
b1 = tf.Variable(tf.random.truncated_normal([3], stddev=0.1, seed=1))

#SGD的参数
# learning_rate_step = 10
# learning_rate_decay = 0.8
# learning_rate_base = 1
# global_step = epoch = 500
#momentum-SGD的参数
# learning_rate_step = 10
# learning_rate_decay = 0.8
# learning_rate_base = 1
# global_step = epoch = 500
# m_w, m_b = 0, 0
#adagrad的参数
# learning_rate_step = 10
# learning_rate_decay = 0.8
# learning_rate_base = 1
# v_w, v_b = 0, 0
# global_step = epoch = 500
#adadelta的参数
# learning_rate_step = 10
# learning_rate_decay = 0.8
# learning_rate_base = 1
# v_w, v_b = 0, 0
# global_step = epoch = 500
#adam的参数
learning_rate_step = 10
learning_rate_decay = 0.8
learning_rate_base = 1
delta_w, delta_b = 0, 0
beta = 0.9
global_step = tf.Variable(0, trainable=False)
m_w, m_b = 0, 0
v_w, v_b = 0, 0
beta1, beta2 = 0.9, 0.999
epoch = 500

train_loss_results = []
test_acc = []
lr = []
loss_all = 0

now_time = time.time()
for epoch in range(epoch):
    learning_rate = learning_rate_base * learning_rate_decay ** (epoch / learning_rate_step)
    lr.append(learning_rate)
    for step, (x_train, y_train) in enumerate(train_db):

        with tf.GradientTape() as tape:
            y = tf.matmul(x_train, w1) + b1
            # y = tf.math.tanh(y)
            y_onehot = tf.one_hot(y_train, depth=3)
            # loss = tf.reduce_mean(tf.square(y_onehot - y))
            loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(y_onehot, y))
            loss_all += loss.numpy()
        grads = tape.gradient(loss, [w1, b1])

        #SGD
        # w1.assign_sub(learning_rate * grads[0])
        # b1.assign_sub(learning_rate * grads[1])

        #momentum-SGD
        # beta = 0.9
        # m_w = beta * m_w + (1 - beta) * grads[0]
        # m_b = beta * m_b + (1 - beta) * grads[1]
        # w1.assign_sub(learning_rate * m_w)
        # b1.assign_sub(learning_rate * m_b)

        # adagrad
        # v_w += tf.square(grads[0])
        # v_b += tf.square(grads[1])
        # w1.assign_sub(learning_rate * grads[0] / tf.sqrt(v_w))
        # b1.assign_sub(learning_rate * grads[1] / tf.sqrt(v_b))

        # adadelta
        # beta = 0.9
        # v_w = beta * v_w + (1 - beta) * tf.square(grads[0])
        # v_b = beta * v_b + (1 - beta) * tf.square(grads[1])
        # w1.assign_sub(learning_rate * grads[0] / tf.sqrt(v_w))
        # b1.assign_sub(learning_rate * grads[1] / tf.sqrt(v_b))

        # adam
        global_step = global_step.assign_add(1)
        m_w = beta1 * m_w + (1 - beta1) * grads[0]
        m_b = beta1 * m_b + (1 - beta1) * grads[1]
        v_w = beta2 * v_w + (1 - beta2) * tf.square(grads[0])
        v_b = beta2 * v_b + (1 - beta2) * tf.square(grads[1])

        m_w_correction = m_w / (1 - tf.pow(beta1, int(global_step)))
        m_b_correction = m_b / (1 - tf.pow(beta1, int(global_step)))
        v_w_correction = v_w / (1 - tf.pow(beta2, int(global_step)))
        v_b_correction = v_b / (1 - tf.pow(beta2, int(global_step)))

        w1.assign_sub(learning_rate * m_w_correction / tf.sqrt(v_w_correction))
        b1.assign_sub(learning_rate * m_b_correction / tf.sqrt(v_b_correction))

        if step % 10 == 0:
            print("step=", step, 'loss:', float(loss))
            print("lr=", learning_rate)

    train_loss_results.append(loss_all / 3)
    loss_all = 0

    # test(做测试）
    total_correct, total_number = 0, 0
    for step, (x_test, y_test) in enumerate(test_db):
        y = tf.matmul(x_test, w1) + b1
        y = tf.nn.sigmoid(y)

        pred = tf.argmax(y, axis=1)

        # 因为pred的dtype为int64，在计算correct时会出错，所以需要将它转化为int32
        pred = tf.cast(pred, dtype=tf.int32)
        correct = tf.cast(tf.equal(pred, y_test), dtype=tf.int32)
        correct = tf.reduce_sum(correct)
        total_correct += int(correct)
        total_number += x_test.shape[0]
    acc = total_correct / total_number
    test_acc.append(acc)
    print("test_acc:", acc)
    print("---------------------")
total_time = time.time() - now_time
print("total_time", total_time)

# 绘制 loss 曲线
plt.title('Loss Function Curve')
plt.xlabel('Epoch')
plt.ylabel('Loss')
plt.plot(train_loss_results, label="$Loss$")
plt.legend()
plt.show()

# 绘制 Accuracy 曲线
plt.title('Acc Curve')
plt.xlabel('Epoch')
plt.ylabel('Acc')
plt.plot(test_acc, label="$Accuracy$")
plt.legend()
plt.show()

# 绘制 Learning_rate 曲线
plt.title('Learning Rate Curve')
plt.xlabel('Global steps')
plt.ylabel('Learning rate')
plt.plot(range(epoch + 1), lr, label="$lr$")
plt.legend()
plt.show()

Python基础语法和Ubuntu常用命令（人工智能实践笔记）奔跑的小仙女 linux 深度学习 Python 人工智能基础 ubuntu命令
linux常用终端命令：~$pwd当前路径：~$ls有什么文件：~$mkdirpython当前目录建立名为python目录：~$ls：~$cdpython进入python目录：~$python进入python解释器注意：使用pwd命令打印当前在哪个目录，打印的是绝对路径。绝对路径：是以根目录（“/”）为起点的完整目录，为你所要到的目录为终点。相对路径：是以根目录（“.”）为起点的完整目录，为你所要
中国大学生计算机设计大赛—人工智能实践赛赛道—赛后感想我药打十个学科竞赛人工智能 python
1.比赛介绍中国大学生计算机设计大赛是我国高校面向本科生最早的赛事之一，是全国普通高校大学生竞赛排行榜榜单赛事之一。自2008年开赛至2019年，一直由教育部高校与计算机相关教指委等或独立或联合主办。大赛的目的是以赛促学、以赛促教、以赛促创，为国家培养德智体美劳全面发展的创新型、复合型、应用型人才服务。2023年（第16届）中国大学生计算机设计大赛是由北京语言大学、中国人民大学、华东师范大学、东南
2021-07-02 fisher-nuc tensorflow 神经网络
基于TensorFlow搭建的几种经典的卷积神经网络注：本文是本人一门课程的期末大作业，在学习曹建老师（人工智能实践：TensorFlow笔记）的课程时记录的笔记。在进行整理后写的一篇小文章，具体详解可以在B站或者MOOC上搜索相关课程。课程网站：https://www.icourse163.org/learn/PKU-1002536002?tid=1003797005#/learn/announ
AI人工智能实践技术全面指南：从基础知识到前沿应用 zmjia111 机器学习 python 人工智能机器学习 python YOLO SCI 开发语言自编码器
人工智能（ArtificialIntelligence），英文缩写为AI。[24]它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是新一轮科技革命和产业变革的重要驱动力量。人工智能是智能学科重要的组成部分，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器，该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系
tensorflow2.0 （1）使用LeNet5网络预测cifar10数据集中分类向往的地中海 tensorflow2冲吧神经网络 tensorflow 深度学习
参考内容北京大学，软微学院，曹健老师，《人工智能实践：TensorFlow2.0笔记》运行环境Python3.7tensorflow2.6训练数据集：cifar10前言曹老师用的是Class形式构造的网络结构，搜了一些博客，也没能做到将保存的网络模型加载，并预测自己下载的图片。自己需要学的东西还有太多太多了。这里，换了一种思路，用Sequential形式构造网络，训练，保存模型，预测自己的图片。1
国外的7个联络中心的生成式人工智能实践软件工匠人工智能 chatgpt 大数据
来自国外大厂的7个联络中心的生成式人工智能实践——“从自动化电话后的处理到自动生成知识文章，有许多应用可能会激发服务领导者的兴趣。”生成式AI的兴起有望改变游戏规则。有人甚至将其比作互联网、智能手机和云计算的曙光。然而，炒作还没有消退。如果有的话，技术提供商正越来越兴奋于其带来的创新潜力。联络中心系统供应商也不例外。他们已经开发出许多由生成式AI提供动力的解决方案，旨在改变客户服务运营。到目前为止
对于TensorFlow+Keras深度学习人工智能实践应用中“NameError: name 'x_train_image' is not defined”的问题解决渣渣琪 Python入门 Python基础 Tensorflow keras python
首先出现问题：我一开始一直以为是我keras装错了，所以这里一直报错。后来仔细检查了发现不是。按照书上第58面打的代码，读取了MNIST数据然后执行：发现报错：因为是新手，在网上搜了半天，没找到原因，后来发现原来是书上大小写不统一，python是严格区分大小写的改完之后就成功了。
人工智能实践——Restauraut+ 食物识别分析与营养规划系统 Deep_Dreamer 人工智能深度学习 python 计算机视觉
项目背景描述：项目以落地性强、准确度高为主要宗旨。对于餐厅而言。目前，由于使用收银机，餐厅的付款流程仍然是人工的且效率低下的。收银员会检查顾客点了什么食物，然后在收银台上进行结算。效率并不高。因此，食物识别设备和自动食物价格估算可以解决这些问题。食物识别分析旨在优化餐厅付款付款流程，并使用计算机视觉方法自动估算食物价格。传统的方法有餐盘识别价格计算法，该方法通过设置价格区间，不同的价格对应不同颜色
TensorFlow2.0搭建Keras神经网络锦绣拾年
TensorFlow2.0搭建Keras神经网络【曹健老师人工智能实践课笔记】主要方法model=tf.keras.models.Sequentialmodel.compilemodel.fitmodel.summary【查阅Keras文档快速入门】kerassequential顺序模型是多个网络层的线性堆叠。你可以通过将网络层实例的列表传递给Sequential的构造器，来创建一个Sequent
DL with python(16)——tensorflow实现InceptionNet(GoogLeNet) 佟湘玉滴玉 Python深度学习深度学习 python
本文涉及到的是中国大学慕课《人工智能实践：Tensorflow笔记》第五讲第14节的内容，对tensorflow环境下经典卷积神经网络的搭建进行介绍，其基础是DLwithpython(14)——tensorflow实现CNN的“八股”中的代码，将其中第三步的代码替换为本文中的代码均可直接运行，其他部分无需改变。经典的卷积神经网络有以下几种，这里介绍结构较为复杂的InceptionNet，其实现的方
随机森林python反欺诈_携程金融自动化迭代反欺诈模型体系 weixin_39761696 随机森林python反欺诈
文章作者：携程技术团队编辑整理：Hoh内容来源：《携程人工智能实践》导读：支付欺诈风险是携程金融风控团队的主要防控对象，它一般是指用户卡片信息或账号信息泄露后，欺诈分子利用这些信息在携程平台进行销赃，侵害用户资金安全，给用户和携程平台带来损失。携程金融风控团队需要在不影响正常用户自由出行的前提下，对这样的风险交易进行精准识别并实时拦截，从而保护用户资金安全。支付欺诈风险具备以下3点特性。1.高对抗
人工智能实践入门Tensorflow2.0笔记-Day2 神经网络优化过程下雨天的小鱼 tensorflow python 深度学习 tensorflow 神经网络机器学习
Tensorflow学习笔记1（北大公开课）目录神经网络优化过程一、整体知识概览二、代码实现1、预备知识2、衰减学习率3、损失函数4、正则化5、优化器神经网络优化过程继续学Tensorflow2.0，主要把这一章的课程内容做了简单整理，我也是新手，难免有错，欢迎大家指出错误、学习交流、共同进步。一、整体知识概览第二章主要讲预备知识、网络复杂度计算、指数衰减学习率、激活函数、损失函数、过拟合问题及缓
人工智能实践入门-Day0小鱼安装Tensorflow之各种报错踩坑及全面解决方法下雨天的小鱼 tensorflow tensorflow python 深度学习 pip anaconda
之前已经安装了python3.7和pycharm，没装anaconda和tensorflow,第一次安装tensorflow没有经验，各种报错，哭了。。也没有人可以问，笨手笨脚踩了无数坑555，自己通过搜索倒腾了一天终于解决了所有问题，谨写此文希望能帮到和我一样的小白。。。大佬不要笑我Tensorflow安装日记--目录一、安装平台二、目标环境三、安装过程报错解决过程一、安装平台windows10
TensorFlow2安装（超详细步骤-人工智能实践）不唐 Python 深度学习 TensorFlow tensorflow 深度学习 python
TensorFlow2安装教程1前言1.1版本记录1.2工具简介2详细步骤及安装语句2.1安装Anaconda2.2TensoFlow安装2.3验证是否成功2.4PyCharm下载与安装2.5PyCharm环境配置2.5.1不唐初尝试1前言点滴进步，加油！最近在MOOC看北京大学的曹健老师的《人工智能实践：Tensorflow笔记》课程。其中第一章的第8节提到了详细的TensorFlow安装过程。
PyTorch实战01：Anaconda及PyTorch安装夜孔良-Parzival 人工智能 pytorch python 深度学习
这次写PyTorch系列的人工智能实践，算是自己学习的一个积累而且我还是挺喜欢CSDN的，虽然不一定能挣到钱，但也希望能给大家带来点什么主要内容就是自己的实践过程及其中遇到的一些问题，不足之处，还望大佬们多多指正环境安装1安装Anaconda1.1下载Anaconda1.2安装即配置Anaconda1.3可能出现的错误2安装Pytorch2.1下载Pytorch2.2下载CUDAToolkit2.
人工智能学习第一篇（tensorflow笔记）＆ Pumbaa tensorflow
本文是在学习北大课程“人工智能实践：tensorflow笔记”的基础上，自己做的笔记，用于温故知新。张量（Tensor）:多维数组（列表）阶：张量的维数（从0开始）张量可以表示0阶到n阶数组（列表）eg1:importtensorflowastfa=tf.constant([1,5],dtype=tf.int64)print(a)print(a.dtype)print(a.shape)结果：tf.
用tensorflow搭建全连接神经网络实现mnist数据集的识别 humuhumunukunukuapua 爱好 machine learning mnist tensorflow
说明：本代码来自于北京大学曹健老师的MOOC人工智能实践：Tensorflow笔记第五讲I前向传播网络搭建在mnist_forward.py中搭建两层全连接网络，这里面就是定义层数，节点数，激活函数这些。输入节点数目就是mnist数据集的图片28*28大小，用784行的向量作为输入。第一层y1=relu（x*w1+b1）其中y1为500行的向量。那么w1里面就有784*500个变量啦～～b1是50
人工智能实践：Tensorflow笔记 Class 2：神经网络优化 By4te 机器学习 Python tensorflow 人工智能神经网络
目录2.1基础知识2.2复杂度学习率1.复杂度2.学习率2.3激活函数1.sigmoid函数2.tanh函数3.relu函数4.leaky-relu函数2.4损失函数1.均方误差2.自定义损失函数3.交叉熵损失函数4.softmax与交叉熵结合2.5缓解过拟合正则化2.6优化器1.SGD2.SGDM3.Adagrad4.RMSProp5.Adam2.1基础知识2.2复杂度学习率1.复杂度2.学习率
《人工智能实践：Tensorflow笔记》听课笔记24_7.1卷积神经网络 RENeast 人工智能人工智能
附：课程链接第七讲.卷积神经网络7.1卷积神经网络由于个人使用Win7系统，并未完全按照课程所讲，以下记录的也基本是我的结合课程做的Windows系统+PyCharm操作。且本人有python基础，故一些操作可能简略。并未完全按照网课。记住编写代码时，除注释内容外，字符均使用英文格式。一、回顾及展开前两讲中我们利用全连接网络实现了对mnist数据集的训练，我们已学会使用数据集训练模型，并让训练好的
《人工智能实践：Tensorflow笔记》听课笔记12_3.2前向传播 RENeast 人工智能人工智能
附：课程链接第三讲.Tensorflow框架3.2前向传播由于个人使用Win7系统，并未完全按照课程所讲，以下记录的也基本是我的结合课程做的Windows系统+PyCharm操作。且本人有python基础，故一些操作可能简略。并未完全按照网课。记住编写代码时，除注释内容外，字符均使用英文格式。本节课程目标：搭建第一个神经网络，总结搭建八股。6.神经网络的参数：是指神经元线上的权重w，用变量表示，一
《人工智能实践：Tensorflow笔记》听课笔记1_1.1概述 RENeast 人工智能人工智能听课笔记
上学的时候天天熬夜。放假了闲鱼的一匹，之前立的flag也要赶紧达成了，否则开学无颜见师长了。导师给我推荐的中国大学MOOC的《人工智能实践：Tensorflow笔记》，北京大学，软件与微电子学院的曹健老师主讲。近期我会尽快完成此课的学习，并将听课笔记发到此处以监督自身。顺序也基本按照课程中的顺序。知识也基本都是通用的，应该没有涉及侵权问题，在此感谢这门优秀的课程，给我们更多的机会提升自我，希望我真
人工智能实践：Tensorflow2.0笔记北京大学MOOC（2-1）寂灭如一北京大学MOOC python 神经网络 tensorflow
人工智能实践：Tensorflow2.0笔记北京大学MOOC（2-1）说明一、神经网络的优化1.神经网络复杂度2.学习率策略2.1学习率概念回顾2.2动态调整学习率2.2.1指数衰减学习率及其API2.2.2分段常数衰减学习率及其API3.激活函数3.1激活函数的引入3.1激活函数应该具有的特点3.2常见的激活函数及其API3.2.1sigmoid函数3.2.2tanh函数3.2.3ReLU函数3
人工智能实践：Tensorflow2.0笔记北京大学MOOC（1-2）寂灭如一北京大学MOOC 人工智能 tensorflow 神经网络
人工智能实践：Tensorflow2.0笔记北京大学MOOC（1-2）说明二、TensorFlow2.1基本概念与常用函数1.基本概念-张量Tensor1.1TensorFlow库中的数据类型1.2张量Tensor的创建方式1.2.1方式一tf.constant函数1.2.2方式二tf.convert_to_tensor函数1.2.3方式三tf.zeros/ones/fill函数1.2.4方式四t
人工智能实践：Tensorflow2.0笔记北京大学MOOC（1-3）寂灭如一北京大学MOOC 人工智能 tensorflow 神经网络
人工智能实践：Tensorflow2.0笔记北京大学MOOC（1-3）说明三、搭建第一个神经网络训练模型1.准备数据1.1鸢尾花数据集回顾1.2鸢尾花数据集读入1.3鸢尾花数据集乱序1.3将数据集分割成永不相见的训练集和测试集1.4配成[输入特征,标签]对,之后将每次喂入一小撮(batch)2.搭建网络3.参数优化4.测试效果5.acc/loss可视化6.完整代码7.初步优化7.1本地读取鸢尾花数
人工智能实践：Tensorflow2.0笔记北京大学MOOC（1-1）寂灭如一北京大学MOOC 人工智能 tensorflow 深度学习
人工智能实践：Tensorflow2.0笔记北京大学MOOC（1-1）说明一、神经网络计算过程1.人工智能三学派2.神经网络设计过程2.1人脑中的神经网络形成过程2.2计算机模仿神经网络连接关系3.神经网络设计过程3.1数据集介绍3.2网络搭建与训练3.2.1神经元的计算模型3.2.2全连接网络的搭建3.2.3定义损失函数3.2.3.1损失函数3.2.3.2梯度下降法传送门说明本文内容整理自中国大
人工智能实践：Tensorflow笔记 Saber_e tensorflow笔记深度学习神经网络人工智能
Tensorflow2.0入门学习笔记人工智能实践：Tensorflow笔记tensorflow2-GPU安装神经网络的计算过程，搭建出第一个神经网络第一个例子：用神经网络进行鸢尾花分类一些常用的TF2函数（后面可能用到）神经网络的优化方法，学习率，激活函数，损失函数以及正则化的使用学习率的设置激活函数损失函数缓解过拟合参数优化器神经网络搭建八股，六步法神经网络八股扩展自制数据集数据增强，扩充补给
人工智能实践：Tensorflow课程：神经网络计算 Twinkle1231 神经网络人工智能 tensorflow
文章目录1.人工智能三学派2.神经网络设计过程3.张量生成4.Tensorflow2常用函数1.人工智能三学派行为主义：基于控制论，构建感知-动作控制系统；符号主义：基于算数逻辑表达式，求解问题时先把问题描述为表达式，再求解表达式；连接主义：仿生学，模仿神经元连接关系。2.神经网络设计过程用神经网络给鸢尾花分类(Iris)1.搭建网络2.喂入数据3.前向传播4.损失函数损失函数可以定量判断W、b的
keras多层感知机+titanic数据集夺笋123 #机器学习框架的应用小例 keras 算法人工智能
目录关于数据集数据集下载数据预览数据集预处理删除列数据查看各个特征值的缺失值情况null值填充字符串数据转化为数值dataframe数据转化为ndarray数据数据标准化总述keras多层感知机模型构建线性模型构建模型编译及训练训练结果可视化测试数据集模型保存关于数据集数据集下载传送门：kaggle官网本博客参考：《tensorflow+keras深度学习人工智能实践应用林大贵著》数据预览列数据说
人工智能实践——第八周【卷积网络与tensorboard】取个程序猿的名字人工智能实践人工智能实践
卷积神经网络：全连接网络的缺陷：1：数据量过大，运算负担重2：参数过大，出现过拟合现象有效提取图像特征的方法正方形卷积核(过滤器)，遍历图片上的每个点图片区域内，相对应的每一个像素值乘以卷积核内相对应点的权重，求和，再加上偏置。输出图片边长=（输入图片边长–卷积核长+1）/步长此图：（（5–3+1）/1=3有些时候需要输出图片边长和输入图片边长相同，则裹上n层0padding可以看到，原来55，增
TensorFlow2.1入门学习笔记(3)——Pillow数字图像处理 Wang Yuexin python 计算机视觉深度学习 tensorflow 自动驾驶
个人博客：wyxogo.top在正式学习tensorflow2.0之前需要有一定的python基础，对numpy，matplotlib等库有基本的了解，笔者还是AI小白，通过写博客来记录自己的学习过程，同时对所学的东西进行总结。主要学习的资料西安科技大学：神经网络与深度学习——TensorFlow2.0实战，北京大学：人工智能实践Tensorflow笔记博客从tf常用的库开始，需要学习python
mondb入手木zi_鸣 mongodb
windows 启动mongodb 编写bat文件， mongod --dbpath D:\software\MongoDBDATA mongod --help 查询各种配置配置在mongob 打开批处理，即可启动，27017原生端口，shell操作监控端口扩展28017，web端操作端口启动配置文件配置，数据更灵活
大型高并发高负载网站的系统架构 bijian1013 高并发负载均衡
扩展Web应用程序一.概念简单的来说，如果一个系统可扩展，那么你可以通过扩展来提供系统的性能。这代表着系统能够容纳更高的负载、更大的数据集，并且系统是可维护的。扩展和语言、某项具体的技术都是无关的。扩展可以分为两种： 1.
DISPLAY变量和xhost(原创) czmmiao display
DISPLAY 在Linux/Unix类操作系统上, DISPLAY用来设置将图形显示到何处. 直接登陆图形界面或者登陆命令行界面后使用startx启动图形, DISPLAY环境变量将自动设置为:0:0, 此时可以打开终端, 输出图形程序的名称(比如xclock)来启动程序, 图形将显示在本地窗口上, 在终端上输入printenv查看当前环境变量, 输出结果中有如下内容:DISPLAY=:0.0
获取B/S客户端IP 周凡杨 java 编程 jsp Web 浏览器
最近想写个B/S架构的聊天系统，因为以前做过C/S架构的QQ聊天系统，所以对于Socket通信编程只是一个巩固。对于C/S架构的聊天系统，由于存在客户端Java应用，所以直接在代码中获取客户端的IP，应用的方法为： String ip = InetAddress.getLocalHost().getHostAddress(); 然而对于WEB
浅谈类和对象朱辉辉33 编程
类是对一类事物的总称，对象是描述一个物体的特征，类是对象的抽象。简单来说，类是抽象的，不占用内存，对象是具体的，占用存储空间。类是由属性和方法构成的，基本格式是public class 类名{ //定义属性 private/public 数据类型属性名； //定义方法 publ
android activity与viewpager+fragment的生命周期问题肆无忌惮_ viewpager
有一个Activity里面是ViewPager，ViewPager里面放了两个Fragment。第一次进入这个Activity。开启了服务，并在onResume方法中绑定服务后，对Service进行了一定的初始化，其中调用了Fragment中的一个属性。 super.onResume(); bindService(intent, conn, BIND_AUTO_CREATE);
base64Encode对图片进行编码 843977358 base64 图片 encoder
/** * 对图片进行base64encoder编码 * * @author mrZhang * @param path * @return */ public static String encodeImage(String path) { BASE64Encoder encoder = null; byte[] b = null; I
Request Header简介 aigo servlet
当一个客户端(通常是浏览器)向Web服务器发送一个请求是，它要发送一个请求的命令行，一般是GET或POST命令，当发送POST命令时，它还必须向服务器发送一个叫“Content-Length”的请求头(Request Header) 用以指明请求数据的长度，除了Content-Length之外，它还可以向服务器发送其它一些Headers，如：
HttpClient4.3 创建SSL协议的HttpClient对象 alleni123 httpclient 爬虫 ssl
public class HttpClientUtils { public static CloseableHttpClient createSSLClientDefault(CookieStore cookies){ SSLContext sslContext=null; try { sslContext=new SSLContextBuilder().l
java取反 -右移-左移-无符号右移的探讨百合不是茶位运算符位移
取反：在二进制中第一位，1表示符数，0表示正数 byte a = -1; 原码：10000001 反码：11111110 补码：11111111 //异或: 00000000 byte b = -2; 原码：10000010 反码：11111101 补码：11111110 //异或: 00000001
java多线程join的作用与用法 bijian1013 java 多线程
对于JAVA的join，JDK 是这样说的：join public final void join （long millis ）throws InterruptedException Waits at most millis milliseconds for this thread to die. A timeout of 0 means t
Java发送http请求(get 与post方法请求) bijian1013 java spring
PostRequest.java package com.bijian.study; import java.io.BufferedReader; import java.io.DataOutputStream; import java.io.IOException; import java.io.InputStreamReader; import java.net.HttpURL
【Struts2二】struts.xml中package下的action配置项默认值 bit1129 struts.xml
在第一部份，定义了struts.xml文件，如下所示： <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache.org/dtds/struts
【Kafka十三】Kafka Simple Consumer bit1129 simple
代码中关于Host和Port是割裂开的，这会导致单机环境下的伪分布式Kafka集群环境下，这个例子没法运行。实际情况是需要将host和port绑定到一起， package kafka.examples.lowlevel; import kafka.api.FetchRequest; import kafka.api.FetchRequestBuilder; impo
nodejs学习api ronin47 nodejs api
NodeJS基础什么是NodeJS JS是脚本语言，脚本语言都需要一个解析器才能运行。对于写在HTML页面里的JS，浏览器充当了解析器的角色。而对于需要独立运行的JS，NodeJS就是一个解析器。每一种解析器都是一个运行环境，不但允许JS定义各种数据结构，进行各种计算，还允许JS使用运行环境提供的内置对象和方法做一些事情。例如运行在浏览器中的JS的用途是操作DOM，浏览器就提供了docum
java-64.寻找第N个丑数 bylijinnan java
public class UglyNumber { /** * 64.查找第N个丑数具体思路可参考 [url] http://zhedahht.blog.163.com/blog/static/2541117420094245366965/[/url] * 题目：我们把只包含因子 2、3和5的数称作丑数（Ugly Number）。例如6、8都是丑数，但14
二维数组（矩阵）对角线输出 bylijinnan 二维数组
/** 二维数组对角线输出两个方向例如对于数组： { 1, 2, 3, 4 }, { 5, 6, 7, 8 }, { 9, 10, 11, 12 }, { 13, 14, 15, 16 }, slash方向输出： 1 5 2 9 6 3 13 10 7 4 14 11 8 15 12 16 backslash输出： 4 3
[JWFD开源工作流设计]工作流跳跃模式开发关键点(今日更新) comsci 工作流
既然是做开源软件的,我们的宗旨就是给大家分享设计和代码,那么现在我就用很简单扼要的语言来透露这个跳跃模式的设计原理大家如果用过JWFD的ARC-自动运行控制器,或者看过代码,应该知道在ARC算法模块中有一个函数叫做SAN(),这个函数就是ARC的核心控制器,要实现跳跃模式,在SAN函数中一定要对LN链表数据结构进行操作,首先写一段代码,把
redis常见使用 cuityang redis 常见使用
redis 通常被认为是一个数据结构服务器，主要是因为其有着丰富的数据结构 strings、map、 list、sets、 sorted sets 引入jar包 jedis-2.1.0.jar (本文下方提供下载) package redistest; import redis.clients.jedis.Jedis; public class Listtest
配置多个redis dalan_123 redis
配置多个redis客户端 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&quo
attrib命令 dcj3sjt126com attr
attrib指令用于修改文件的属性.文件的常见属性有:只读.存档.隐藏和系统. 只读属性是指文件只可以做读的操作.不能对文件进行写的操作.就是文件的写保护. 存档属性是用来标记文件改动的.即在上一次备份后文件有所改动.一些备份软件在备份的时候会只去备份带有存档属性的文件.
Yii使用公共函数 dcj3sjt126com yii
在网站项目中，没必要把公用的函数写成一个工具类，有时候面向过程其实更方便。在入口文件index.php里添加 require_once('protected/function.php'); 即可对其引用，成为公用的函数集合。 function.php如下： <?php /** * This is the shortcut to D
linux 系统资源的查看（free、uname、uptime、netstat） eksliang netstat linux uname linux uptime linux free
linux 系统资源的查看转载请出自出处：http://eksliang.iteye.com/blog/2167081 http://eksliang.iteye.com 一、free查看内存的使用情况语法如下： free [-b][-k][-m][-g] [-t] 参数含义 -b:直接输入free时，显示的单位是kb我们可以使用b(bytes),m
JAVA的位操作符 greemranqq 位运算 JAVA位移 <<>>>
最近几种进制，加上各种位操作符，发现都比较模糊，不能完全掌握，这里就再熟悉熟悉。 1.按位操作符：按位操作符是用来操作基本数据类型中的单个bit,即二进制位，会对两个参数执行布尔代数运算，获得结果。与（&）运算： 1&1 = 1, 1&0 = 0, 0&0 &
Web前段学习网站 ihuning Web
Web前段学习网站菜鸟学习：http://www.w3cschool.cc/ JQuery中文网：http://www.jquerycn.cn/ 内存溢出：http://outofmemory.cn/#csdn.blog http://www.icoolxue.com/ http://www.jikexue
强强联合：FluxBB 作者加盟 Flarum justjavac r
原文：FluxBB Joins Forces With Flarum作者：Toby Zerner译文：强强联合：FluxBB 作者加盟 Flarum译者：justjavac FluxBB 是一个快速、轻量级论坛软件，它的开发者是一名德国的 PHP 天才 Franz Liedke。FluxBB 的下一个版本(2.0)将被完全重写，并已经开发了一段时间。FluxBB 看起来非常有前途的，
java统计在线人数（session存储信息的） macroli java Web
这篇日志是我写的第三次了前两次都发布失败！郁闷极了！由于在web开发中常常用到这一部分所以在此记录一下，呵呵，就到备忘录了！我对于登录信息时使用session存储的，所以我这里是通过实现HttpSessionAttributeListener这个接口完成的。 1、实现接口类，在web.xml文件中配置监听类，从而可以使该类完成其工作。 public class Ses
bootstrp carousel初体验快速构建图片播放 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
img{ border: 1px solid white; box-shadow: 2px 2px 12px #333; _width: expression(this.width > 600 ? "600px" : this.width + "px"); _height: expression(this.width &
SparkSQL读取HBase数据，通过自定义外部数据源 superlxw1234 spark sparksql sparksql读取hbase sparksql外部数据源
关键字：SparkSQL读取HBase、SparkSQL自定义外部数据源前面文章介绍了SparSQL通过Hive操作HBase表。 SparkSQL从1.2开始支持自定义外部数据源(External DataSource)，这样就可以通过API接口来实现自己的外部数据源。这里基于Spark1.4.0，简单介绍SparkSQL自定义外部数据源，访
Spring Boot 1.3.0.M1发布 wiselyman spring boot
Spring Boot 1.3.0.M1于6.12日发布，现在可以从Spring milestone repository下载。这个版本是基于Spring Framework 4.2.0.RC1,并在Spring Boot 1.2之上提供了大量的新特性improvements and new features。主要包含以下： 1.提供一个新的sprin