BY@QEL

SAEtensorflow编程

# -*- coding: utf-8 -*-
__author__ = "YuanBian"
__data__ = '2019/7/15 21:10'

import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
import scipy.io as scio

"""
堆栈自编码
2560-->1280-->640-->320-->160-->80-->softmax
"""



# region 训练参数
savedir = "./stacked_encoder/"  # 检查点文件保存路径
savefile = 'tool_wear_model.cpkt'  # 检查点文件名
global data
data = np.zeros([60, 2560], np.float32)
global loss_value
loss_value = []
dir_num = 146  # 用几个文件，每个文件60x2560
batch_size = 200  # 一次迭代所使用的样本量
# 训练参数
learning_rate = 0.1
epoch_num = 1200  # 循环几次
num_steps = int((dir_num*60*epoch_num) / batch_size)  # 迭代次数，每次迭代更新网络参数
display_step = 10
examples_to_show = 10

n_input = 2560
n_hidden_1 = 1280
n_hidden_2 = 640
n_hidden_3 = 320
n_hidden_4 = 160
n_hidden_5 = 80
n_classes = 10
# endregion
# region 数据读取和batch制作
for i in range(1, dir_num+1):
    data_dir = "D:\\最近\\AE\\fft_%s.mat" % str(i)
    dataset = scio.loadmat(data_dir)
    dataset = dataset["fftArray_x"]
    dataset = dataset.astype(np.float32)
    if data[0][0] != 0:
        data = np.concatenate((data, dataset), axis=0)
    else:
        data = dataset

dataset = tf.data.Dataset.from_tensor_slices(data)  # 读取，每一个元素为行值
# dataset = dataset.shuffle(buffer_size=1000)
dataset = dataset.repeat(epoch_num)
data_batches = dataset.batch(batch_size, )  #
#  batch的制作和利用
iterator = data_batches.make_initializable_iterator()
next_element = iterator.get_next()

lable = np.load(r"D:\最近\AE\classLabel.npy")
class_lable = tf.data.Dataset.from_tensor_slices(lable)
class_lable = class_lable.repeat(epoch_num)
lable_batches = class_lable.batch(batch_size, )  #
#  batch的制作和利用
lable_iterator = lable_batches.make_initializable_iterator()
next_lable = lable_iterator.get_next()
#endregion


# region 网络结构

# 第一层输入
x = tf.placeholder(dtype=tf.float32, shape=[None, n_input])
y = tf.placeholder(dtype=tf.float32, shape=[None, n_input])
keep_prob = tf.placeholder(dtype=tf.float32)

# 第二层输入
l2x = tf.placeholder(dtype=tf.float32, shape=[None, n_hidden_1])
l2y = tf.placeholder(dtype=tf.float32, shape=[None, n_hidden_1])

# 第三层输入
l3x = tf.placeholder(dtype=tf.float32, shape=[None, n_hidden_2])
l3y = tf.placeholder(dtype=tf.float32, shape=[None, n_hidden_2])

# 第四层输入
l4x = tf.placeholder(dtype=tf.float32, shape=[None, n_hidden_3])
l4y = tf.placeholder(dtype=tf.float32, shape=[None, n_hidden_3])

# 第五层输入
l5x = tf.placeholder(dtype=tf.float32, shape=[None, n_hidden_4])
l5y = tf.placeholder(dtype=tf.float32, shape=[None, n_hidden_4])

# softmax层
softmax_x = tf.placeholder(dtype=tf.float32, shape=[None, n_hidden_5])
softmax_y = tf.placeholder(dtype=tf.float32, shape=[None, n_classes])

# endregion

# region w,b
'''
最后用的是网络前边的w,b
'''
weights = {
        # 网络1 2560-1280-2560
        'l1_h1': tf.Variable(tf.truncated_normal(shape=[n_input, n_hidden_1], stddev=0.1)),  # 级联使用
        'l1_out': tf.Variable(tf.truncated_normal(shape=[n_hidden_1, n_input], stddev=0.1)),
        # 网络2 1280-640-1280
        'l2_h1': tf.Variable(tf.truncated_normal(shape=[n_hidden_1, n_hidden_2], stddev=0.1)),  # 级联使用
        'l2_out': tf.Variable(tf.truncated_normal(shape=[n_hidden_2, n_hidden_1], stddev=0.1)),
        # 网络3 640-320-640
        'l3_h1': tf.Variable(tf.truncated_normal(shape=[n_hidden_2, n_hidden_3], stddev=0.1)),  # 级联使用
        'l3_out': tf.Variable(tf.truncated_normal(shape=[n_hidden_3, n_hidden_2], stddev=0.1)),
        # 网络4 320-160-320
        'l4_h1': tf.Variable(tf.truncated_normal(shape=[n_hidden_3, n_hidden_4], stddev=0.1)),  # 级联使用
        'l4_out': tf.Variable(tf.truncated_normal(shape=[n_hidden_4, n_hidden_3], stddev=0.1)),
        # 网络5 320-160-320
        'l5_h1': tf.Variable(tf.truncated_normal(shape=[n_hidden_4, n_hidden_5], stddev=0.1)),  # 级联使用
        'l5_out': tf.Variable(tf.truncated_normal(shape=[n_hidden_5, n_hidden_4], stddev=0.1)),
        # # 网络softmax
        'out': tf.Variable(tf.truncated_normal(shape=[n_hidden_5, n_classes], stddev=0.1))  # 级联使用
    }
biases = {
        # 网络1 2560-1280-2560
        'l1_b1': tf.Variable(tf.zeros(shape=[n_hidden_1])),  # 级联使用
        'l1_out': tf.Variable(tf.zeros(shape=[n_input])),
        # 'l1_out': tf.Variable(tf.zeros(shape=[n_input])),
        # 网络2 1280-640-1280
        'l2_b1': tf.Variable(tf.zeros(shape=[n_hidden_2])),  # 级联使用
        'l2_out': tf.Variable(tf.zeros(shape=[n_hidden_1])),
        # 网络3 640-320-640
        'l3_b1': tf.Variable(tf.zeros(shape=[n_hidden_3])),  # 级联使用
        'l3_out': tf.Variable(tf.zeros(shape=[n_hidden_2])),
        # 网络4 320-160-320
        'l4_b1': tf.Variable(tf.zeros(shape=[n_hidden_4])),  # 级联使用
        'l4_out': tf.Variable(tf.zeros(shape=[n_hidden_3])),
        # 网络5 160-80-160
        'l5_b1': tf.Variable(tf.zeros(shape=[n_hidden_5])),  # 级联使用
        'l5_out': tf.Variable(tf.zeros(shape=[n_hidden_4])),

        #  网络softmax
        'out': tf.Variable(tf.zeros(shape=[n_classes]))  # 级联使用
}



# endregion

#region stack各结网络输入和计算优化
'''
定义第一层网络结构  
'''
l1_h1 = tf.nn.sigmoid(tf.add(tf.matmul(x, weights['l1_h1']), biases['l1_b1']))
# l1_h1_dropout = tf.nn.dropout(l1_h1, keep_prob)
l1_reconstruction = tf.nn.sigmoid(tf.add(tf.matmul(l1_h1, weights['l1_out']), biases['l1_out']))
# l1_h2_dropout = tf.nn.dropout(l1_h2, keep_prob)
# l1_reconstruction = tf.nn.sigmoid(tf.add(tf.matmul(l1_h1, weights['l1_out']), biases['l1_out']))
y = x
# 计算代价
l1_cost = tf.reduce_mean((l1_reconstruction - y) ** 2)
# 定义优化器
l1_optm = tf.train.AdamOptimizer(learning_rate).minimize(l1_cost)

'''
定义第2层网络结构  
'''
l2_h1 = tf.nn.sigmoid(tf.add(tf.matmul(l2x, weights['l2_h1']), biases['l2_b1']))
l2_reconstruction = tf.nn.sigmoid(tf.add(tf.matmul(l2_h1, weights['l2_out']), biases['l2_out']))
l2_cost = tf.reduce_mean((l2_reconstruction - l2y) ** 2)
l2_optm = tf.train.AdamOptimizer(learning_rate).minimize(l2_cost)

'''
定义第3层网络结构  
'''
l3_h1 = tf.nn.sigmoid(tf.add(tf.matmul(l3x, weights['l3_h1']), biases['l3_b1']))
l3_reconstruction = tf.nn.sigmoid(tf.add(tf.matmul(l3_h1, weights['l3_out']), biases['l3_out']))
l3_cost = tf.reduce_mean((l3_reconstruction - l3y) ** 2)
l3_optm = tf.train.AdamOptimizer(learning_rate).minimize(l3_cost)

'''
定义第4层网络结构  
'''
l4_h1 = tf.nn.sigmoid(tf.add(tf.matmul(l4x, weights['l4_h1']), biases['l4_b1']))
l4_reconstruction = tf.nn.sigmoid(tf.add(tf.matmul(l4_h1, weights['l4_out']), biases['l4_out']))
l4_cost = tf.reduce_mean((l4_reconstruction - l4y) ** 2)
l4_optm = tf.train.AdamOptimizer(learning_rate).minimize(l4_cost)

'''
定义第5层网络结构  
'''
l5_h1 = tf.nn.sigmoid(tf.add(tf.matmul(l5x, weights['l5_h1']), biases['l5_b1']))
l5_reconstruction = tf.nn.sigmoid(tf.add(tf.matmul(l5_h1, weights['l5_out']), biases['l5_out']))
l5_cost = tf.reduce_mean((l5_reconstruction - l5y) ** 2)
l5_optm = tf.train.AdamOptimizer(learning_rate).minimize(l5_cost)

'''
定义softmax,分类器
'''
softmax_lables =tf.nn.softmax(tf.add(tf.matmul(softmax_x, weights['out']), biases['out']))
real_lables = tf.placeholder(tf.float32, [None, n_classes])
soft_cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits=softmax_lables, labels=real_lables))
soft_opt = tf.train.AdamOptimizer(learning_rate).minimize(soft_cost)

'''
定义级联级网络结构
将前5个网络级联在一起，建立第6个网络，并定义网络结构
'''
# 1 联 2
l1_l2_out = tf.nn.sigmoid(tf.add(tf.matmul(l1_h1, weights['l2_h1']), biases['l2_b1']))
# 2 联 3
l2_l3_out = tf.nn.sigmoid(tf.add(tf.matmul(l1_l2_out, weights['l3_h1']), biases['l3_b1']))
l3_l4_out = tf.nn.sigmoid(tf.add(tf.matmul(l2_l3_out, weights['l4_h1']), biases['l4_b1']))
l4_l5_out = tf.nn.sigmoid(tf.add(tf.matmul(l3_l4_out, weights['l5_h1']), biases['l5_b1']))
l5_class_out = tf.nn.softmax(tf.add(tf.matmul(l4_l5_out, weights['out']), biases['out']))

cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits=l5_class_out, labels=real_lables))
optm = tf.train.AdamOptimizer(learning_rate).minimize(cost)
# num_batch = int(np.ceil(mnist.train.num_examples / batch_size))
#endregion

# region 训练
init_global = tf.global_variables_initializer()
init_local = tf.local_variables_initializer()
'''
训练第一个AE
'''
gpu_options = tf.GPUOptions(per_process_gpu_memory_fraction=0.333)
with tf.Session(config=tf.ConfigProto(gpu_options=gpu_options)) as sess:
# sess = tf.Session(config=tf.ConfigProto(gpu_options=gpu_options))
    sess.run(init_local)
    sess.run(init_global)
    sess.run(iterator.initializer)
    print('网络第一层开始训练')
    for i in range(1, num_steps + 1):
        # Prepare Data
        #  Run optimization op (backprop) and cost op (to get loss value)
        _, l = sess.run([l1_optm, l1_cost], feed_dict={x: sess.run(next_element)})
        # Display logs per step
        if i % display_step == 0 or i == 1:
            loss_value.append(l)
            print('Step %i: Minibatch Loss: %f' % (i, l))
    print('网络第一层训练完成')
# sess = tf.Session(config=tf.ConfigProto(gpu_options=gpu_options))
    print('网络第二层 开始训练')
    sess.run(iterator.initializer)  # batch之前调运完成了已经，init之后再生成batch，且要放在循环外
    for i in range(1, num_steps + 1):
        # Run optimization op (backprop) and cost op (to get loss value)
        l1_out = sess.run(l1_h1, feed_dict={x: sess.run(next_element)}) # , keep_prob: 1.0
        _, l = sess.run([l2_optm, l2_cost], feed_dict={l2x: l1_out, l2y: l1_out})
        # Display logs per step
        if i % display_step == 0 or i == 1:
            loss_value.append(l)
            print('Step %i: Minibatch Loss: %f' % (i, l))
    print('网络第二层 训练完成')
# with tf.Session(config=tf.ConfigProto(gpu_options=gpu_options)) as sess:  # sess = tf.Session(config=tf.ConfigProto(gpu_options=gpu_options))
    print('网络第三层 开始训练')
    sess.run(iterator.initializer)  # batch之前调运完成了已经，init之后再生成batch，且要放在循环外
    for i in range(1, num_steps + 1):
        # Run optimization op (backprop) and cost op (to get loss value)
        l1_out = sess.run(l1_h1, feed_dict={x: sess.run(next_element)}) # , keep_prob: 1.0
        l2_out = sess.run(l2_h1, feed_dict={l2x: l1_out})  # , keep_prob: 1.0
        _, l = sess.run([l3_optm, l3_cost], feed_dict={l3x: l2_out, l3y: l2_out})
        # Display logs per step
        if i % display_step == 0 or i == 1:
            loss_value.append(l)
            print('Step %i: Minibatch Loss: %f' % (i, l))
    print('网络第三层 训练完成')
# with tf.Session(config=tf.ConfigProto(gpu_options=gpu_options)) as sess:  # sess = tf.Session(config=tf.ConfigProto(gpu_options=gpu_options))
    print('网络第四层 开始训练')
    sess.run(iterator.initializer)  # batch之前调运完成了已经，init之后再生成batch，且要放在循环外
    for i in range(1, num_steps + 1):
        # Run optimization op (backprop) and cost op (to get loss value)
        l1_out = sess.run(l1_h1, feed_dict={x: sess.run(next_element)}) # , keep_prob: 1.0
        l2_out = sess.run(l2_h1, feed_dict={l2x: l1_out})  # , keep_prob: 1.0
        l3_out = sess.run(l3_h1, feed_dict={l3x: l2_out})
        _, l = sess.run([l4_optm, l4_cost], feed_dict={l4x: l3_out, l4y: l3_out})
        # Display logs per step
        if i % display_step == 0 or i == 1:
            loss_value.append(l)
            print('Step %i: Minibatch Loss: %f' % (i, l))
    print('网络第四层 训练完成')
# with tf.Session(config=tf.ConfigProto(gpu_options=gpu_options)) as sess:  # sess = tf.Session(config=tf.ConfigProto(gpu_options=gpu_options))
    print('网络第五层 开始训练')
    sess.run(iterator.initializer)  # batch之前调运完成了已经，init之后再生成batch，且要放在循环外
    for i in range(1, num_steps + 1):
        # Run optimization op (backprop) and cost op (to get loss value)
        l1_out = sess.run(l1_h1, feed_dict={x: sess.run(next_element)})  # , keep_prob: 1.0
        l2_out = sess.run(l2_h1, feed_dict={l2x: l1_out})  # , keep_prob: 1.0
        l3_out = sess.run(l3_h1, feed_dict={l3x: l2_out})
        l4_out = sess.run(l4_h1, feed_dict={l4x: l3_out})
        _, l = sess.run([l5_optm, l5_cost], feed_dict={l5x: l4_out, l5y: l4_out})
        # Display logs per step
        if i % display_step == 0 or i == 1:
            loss_value.append(l)
            print('Step %i: Minibatch Loss: %f' % (i, l))
    print('网络第五层 训练完成')

    print('softmax层开始训练')
    sess.run(iterator.initializer)  # batch之前调运完成了已经，init之后再生成batch，且要放在循环外
    sess.run(lable_iterator.initializer)
    for i in range(1, num_steps):
        # Run optimization op (backprop) and cost op (to get loss value)
        l1_out = sess.run(l1_h1, feed_dict={x: sess.run(next_element)})  # , keep_prob: 1.0
        l2_out = sess.run(l2_h1, feed_dict={l2x: l1_out})  # , keep_prob: 1.0
        l3_out = sess.run(l3_h1, feed_dict={l3x: l2_out})
        l4_out = sess.run(l4_h1, feed_dict={l4x: l3_out})
        l5_out = sess.run(l5_h1, feed_dict={l5x: l4_out})
        _, l = sess.run([soft_opt, soft_cost], feed_dict={softmax_x: l5_out, real_lables: sess.run(next_lable)})
        # Display logs per step
        if i % display_step == 0 or i == 1:
            loss_value.append(l)
            print('Step %i: Minibatch Loss: %f' % (i, l))
    print('softmax层训练完成')

    print('级联微调开始训练')
    sess.run(iterator.initializer)  # batch之前调运完成了已经，init之后再生成batch，且要放在循环外
    sess.run(lable_iterator.initializer)
    for i in range(1, num_steps):
        # Run optimization op (backprop) and cost op (to get loss value)
        _, l = sess.run([optm, cost], feed_dict={x: sess.run(next_element), real_lables: sess.run(next_lable)})
        # Display logs per step
        if i % display_step == 0 or i == 1:
            loss_value.append(l)
            print('Step %i: Minibatch Loss: %f' % (i, l))
    print("级联微调结束")

    sess.run(iterator.initializer)  # batch之前调运完成了已经，init之后再生成batch，且要放在循环外
    sess.run(lable_iterator.initializer)
    correct_prediction = tf.equal(tf.argmax(l5_class_out, 1), tf.argmax(sess.run(next_lable), 1))
    # 计算准确率
    accuracy = tf.reduce_mean(tf.cast(correct_prediction, dtype=tf.float32))
    for i in range(num_steps):
        print(sess.run(accuracy, feed_dict={x: sess.run(next_element)}))


plt.plot(loss_value)
plt.show()
# endregion

最后要解决的是怎么给AE加正则项，防止各层权重一样。

问题：为什么我的第一层之后就所有的每一行的特征都一样了啊，，是因为sigmoid函数的原因吗？

第二层损失函数全是0

怀疑：

噪音影响大，又没归一化处理，所以算标准差突起的峰值影响很大！！有可能只提了突起峰值的特诊！！处理方法，直接消除异常峰峰值和归一化？
网络设置不对
数据不好？？？？跳跃大
loss函数取得不对！！！！！！！

验证：

因为第二层的loss一直为0 ，所以查看第一层的输出，果然是基本上每一行完全一样，然后查看第一层的reconstruction,即第一层AE训练的输出，发现全都一样，放弃了频谱中的一些细节信号，有好几个高峰值是对应的!!!!!所以是损失函数没取对，因为大部分的小数都被忽略，高峰值在平方差损失中占比重特别大！！！！
改进：换损失函数

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
JavaScript 中，深拷贝（Deep Copy）和浅拷贝（Shallow Copy）跳房子的前端前端面试 javascript 开发语言 ecmascript
在JavaScript中，深拷贝（DeepCopy）和浅拷贝（ShallowCopy）是用于复制对象或数组的两种不同方法。了解它们的区别和应用场景对于避免潜在的bugs和高效地处理数据非常重要。以下是对深拷贝和浅拷贝的详细解释，包括它们的概念、用途、优缺点以及实现方式。1.浅拷贝（ShallowCopy）概念定义：浅拷贝是指创建一个新的对象或数组，其中包含了原对象或数组的基本数据类型的值和对引用数
深度 Qlearning：在直播推荐系统中的应用 AGI通用人工智能之禅程序员提升自我硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
深度Q-learning：在直播推荐系统中的应用关键词：深度Q-learning,强化学习,直播推荐系统,个性化推荐1.背景介绍1.1问题的由来随着互联网技术的飞速发展,直播平台如雨后春笋般涌现。面对海量的直播内容,用户很难快速找到自己感兴趣的内容。因此,个性化推荐系统在直播平台中扮演着越来越重要的角色。1.2研究现状目前,主流的个性化推荐算法包括协同过滤、基于内容的推荐等。这些方法在一定程度上缓
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构汤萌妮Margaret
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构scalable_agent项目地址:https://gitcode.com/gh_mirrors/sc/scalable_agent在当今的人工智能研究前沿，深度强化学习（DRL）因其在复杂任务中的卓越表现而备受瞩目。本文要介绍的是一个开源于GitHub的重量级项目：“ScalableDistributedDeep-RLwithImp
云服务业界动态简报-20180128 Captain7
一、青云青云QingCloud推出深度学习平台DeepLearningonQingCloud，包含了主流的深度学习框架及数据科学工具包，通过QingCloudAppCenter一键部署交付，可以让算法工程师和数据科学家快速构建深度学习开发环境，将更多的精力放在模型和算法调优。二、腾讯云1.腾讯云正式发布腾讯专有云TCE(TencentCloudEnterprise)矩阵，涵盖企业版、大数据版、AI
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
ResNet的半监督和半弱监督模型 Valar_Morghulis
Billion-scalesemi-supervisedlearningforimageclassificationhttps://arxiv.org/pdf/1905.00546.pdfhttps://github.com/facebookresearch/semi-supervised-ImageNet1K-models/权重在timm中也有：https://hub.fastgit.org/r
联邦学习 Federated learning Google I/O‘19 笔记努力搬砖的星期五笔记联邦学习机器学习机器学习 tensorflow
FederatedLearning:MachineLearningonDecentralizeddatahttps://www.youtube.com/watch?v=89BGjQYA0uE文章目录FederatedLearning:MachineLearningonDecentralizeddata1.DecentralizeddataEdgedevicesGboard:mobilekeyboa
PCL 怎样可视化深度图像 LeonDL168 PCL 计算机视觉人工智能视觉检测图像处理算法
本小节讲解如何可视化深度图像的两种方法，在3D视窗中以点云形式进行可视化（深度图像来源于点云），另一种是，将深度值映射为颜色，从而以彩色图像方式可视化深度图像。代码首先，在PCL（PointCloudLearning）中国协助发行的书提供光盘的第7章例2文件夹中，打开名为range_image_visualization.cpp的代码文件，同文件夹下可以找到相关的测试点云文件room_scan1.
el-dialog高度设置夏之小星星前端 vue.js elementui css
el-dialog高度设置::v-deep.el-dialog{height:78vh;overflow:auto;}
elementuiPlus取消el-input的边框 qq_39016177 elementui
elementuiPlus取消el-input的边框1.通常取消边框的方法设置border为none2.还有其他类似边框的例如outlinebox-shadow这两个属性都是会产生边框效果3.el-input需要更改的话–如下需要修改box-shadow为空即可上代码:deep(.el-input__wrapper){align-items:center;background-color:#F7F
【双语新闻】AGI安全与对齐，DeepMind近期工作曲奇人工智能安全 agi 安全 llama 人工智能
我们想与AF社区分享我们最近的工作总结。以下是关于我们正在做什么，为什么会这么做以及我们认为它的意义所在的一些详细信息。我们希望这能帮助人们从我们的工作基础上继续发展，并了解他们的工作如何与我们相关联。byRohinShah,SebFarquhar,AncaDragan21stAug2024AIAlignmentForumWewantedtosharearecapofourrecentoutput
Awesome TensorFlow weixin_30594001 人工智能移动开发大数据
AwesomeTensorFlowAcuratedlistofawesomeTensorFlowexperiments,libraries,andprojects.Inspiredbyawesome-machine-learning.WhatisTensorFlow?TensorFlowisanopensourcesoftwarelibraryfornumericalcomputationusin
【ShuQiHere】探索人工智能核心：机器学习的奥秘 ShuQiHere 人工智能机器学习
【ShuQiHere】什么是机器学习？机器学习（MachineLearning,ML）是人工智能（ArtificialIntelligence,AI）中最关键的组成部分之一。它使得计算机不仅能够处理数据，还能从数据中学习，从而做出预测和决策。无论是语音识别、自动驾驶还是推荐系统，背后都依赖于机器学习模型。机器学习与传统的编程不同，它不再依赖于人类编写的固定规则，而是通过数据自我改进模型，从而更灵活
综述论文“A Survey of Zero-Shot Learning: Settings, Methods, and Applications” 硅谷秋水机器学习机器学习神经网络深度学习
该零样本学习综述，发表于ACMTrans.Intell.Syst.Technol.10,2,Article13(January2019)摘要：大多数机器学习方法着重于对已经在训练中看到其类别的实例进行分类。实际上，许多应用程序需要对实例进行分类，而这些实例的类以前没有见过。零样本学习（Zero-ShotLearning）是一种强大而有前途的学习范例，其中训练实例涵盖的类别与想分类的类别是不相交的。
机器学习 VS 表示学习 VS 深度学习 Efred.D 人工智能机器学习深度学习人工智能
文章目录前言一、机器学习是什么?二、表示学习三、深度学习总结前言本文主要阐述机器学习,表示学习和深度学习的原理和区别.一、机器学习是什么?机器学习(machinelearning),是从有限的数据集中学习到一定的规律,再把学到的规律应用到一些相似的样本集中做预测.机器学习的历史可以追溯到20世纪40年代McCulloch提出的人工神经元网络,目前学界大致把机器学习分为传统机器学习和机器学习两个类别
端到端的自动驾驶论文与代码整理大别山伧父自动驾驶
LearningbyCheatinggithubcodearxivpaperconferenceonrobotlearning最新进展(May2021)Checkoutourlatestfollow-upwork:WorldonRails(2020)Checkoutoursubmissiontothe2020CARLAChallenge!pass
Lt-8 Multithreading yanlingyun0210 java
IntendedLearningOutcomesTounderstandtheconceptofconcurrency.Tounderstandthedifferenceofaprocessandathread.TodefineathreadusingtheThreadclassandRunnableinterface.TocontrolthreadswithvariousThreadmethod
如何使用Pytorch-Metric-Learning？鱼儿也有烦恼 PyTorch pytorch
文章目录如何使用Pytorch-Metric-Learning？1.Pytorch-Metric-Learning库9个模块的功能1.1Sampler模块1.2Miner模块1.3Loss模块1.4Reducer模块1.5Distance模块1.6Regularizer模块1.7Trainer模块1.8Tester模块1.9Utils模块2.如何使用PyTorchMetricLearning库中的
[Kaiming]Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification MTandHJ neural networks
文章目录概主要内容PReLUKaiming初始化ForwardcaseBackwardcaseHeK,ZhangX,RenS,etal.DelvingDeepintoRectifiers:SurpassingHuman-LevelPerformanceonImageNetClassification[C].internationalconferenceoncomputervision,2015:1
深度神经网络详解：原理、架构与应用阿达C 活动 dnn 计算机网络人工智能神经网络机器学习深度学习
深度神经网络（DeepNeuralNetwork，DNN）是机器学习领域中最为重要和广泛应用的技术之一。它模仿人脑神经元的结构，通过多层神经元的连接和训练，能够处理复杂的非线性问题。在图像识别、自然语言处理、语音识别等领域，深度神经网络展示了强大的性能。本文将深入解析深度神经网络的基本原理、常见架构及其实际应用。一、深度神经网络的基本原理1.1神经元和感知器神经元是深度神经网络的基本组成单元。一个
前端开发需要了解的算法知识史努比的大头算法前端
手写深拷贝functiondeepClone(obj){//处理基础数据类型和函数if(obj===null||typeofobj!=='object'){returnobj;}//处理数组if(Array.isArray(obj)){returnobj.map(item=>deepClone(item));}//处理对象constclonedObj={};for(constkeyinobj){i
推荐开源项目：PyTorch-Metric-Learning 潘惟妍
推荐开源项目：PyTorch-Metric-Learningpytorch-metric-learningTheeasiestwaytousedeepmetriclearninginyourapplication.Modular,flexible,andextensible.WritteninPyTorch.项目地址:https://gitcode.com/gh_mirrors/py/pytorc
推荐：FastAPI驱动的稳定扩散LLMs演示项目褚知茉Jade
推荐：FastAPI驱动的稳定扩散LLMs演示项目FastAPI-for-Machine-Learning-Live-DemoThisrepositorycontainsthefilestobuildyourveryownAIimagegenerationwebapplication!OutlinedarethecorecomponentsoftheFastAPIwebframework,anda
【python】【Ray的概述】资源存储库 python 开发语言
Overview概述Rayisanopen-sourceunifiedframeworkforscalingAIandPythonapplicationslikemachinelearning.Itprovidesthecomputelayerforparallelprocessingsothatyoudon’tneedtobeadistributedsystemsexpert.Rayminimi
什么是监督学习（Supervised Learning）救救孩子把 AI AI 学习
一、监督学习概述监督学习（SupervisedLearning）是一种极具威力的机器学习方法，能够训练算法以识别数据中的模式，并据此进行精准的预测或分类。借助已有的标记数据，监督学习模型学会了从输入到输出的映射关系，进而在各类实际问题中实现自动化决策。无论是医疗诊断、金融市场分析、客户行为预测，还是提升生产效率以及个性化推荐系统等领域，监督学习都彰显出巨大的潜力与价值。随着技术的持续进步，监督学习
LLM系列(4)：通义千问7B在Swift/DeepSpeed上微调秘诀与实战陷阱避坑指南汀、人工智能 LLM工业级落地实践人工智能自然语言处理 prompt Swifi DeepSpeed 通义千问 Qwen
LLM系列(4)：通义千问7B在Swift/DeepSpeed上微调秘诀与实战陷阱避坑指南阿里云于2023年8月3日开源通义千问70亿参数模型，包括通用模型Qwen-7B以及对话模型Qwen-7B-Chat，这也是国内首个开源自家大模型的大厂。在诸多权威大模型能力测评基准上，如MMLU、C-Eval、GSM8K、HumanEval、WMT22，通义千问7B均取得了同参数级别开源模型中的最好表现，
使用3DUNet训练自己的数据集（pytorch）— 医疗影像分割编程日记✧ 智能医疗 pytorch 人工智能 python 计算机视觉图像处理深度学习健康医疗
代码：lee-zq/3DUNet-Pytorch:3DUNetimplementedwithpytorch(github.com)文章<cicek16miccai.pdf(uni-freiburg.de)3DU-Net:LearningDenseVolumetricSegmentation
探索任务的隐秘世界：推荐Task2Vec 邓越浪Henry
探索任务的隐秘世界：推荐Task2Vecaws-cv-task2vecOfficialcodeforthepaper"Task2Vec:TaskEmbeddingforMeta-Learning"(https://arxiv.org/abs/1902.03545,ICCV2019)项目地址:https://gitcode.com/gh_mirrors/aw/aws-cv-task2vec在机器学习
关于旗正规则引擎规则中的上传和下载问题何必如此文件下载压缩 jsp 文件上传
文件的上传下载都是数据流的输入输出，大致流程都是一样的。一、文件打包下载 1.文件写入压缩包 string mainPath="D:\upload\"; 下载路径 string tmpfileName=jar.zip; &n
【Spark九十九】Spark Streaming的batch interval时间内的数据流转源码分析 bit1129 Stream
以如下代码为例（SocketInputDStream）： Spark Streaming从Socket读取数据的代码是在SocketReceiver的receive方法中，撇开异常情况不谈(Receiver有重连机制，restart方法，默认情况下在Receiver挂了之后，间隔两秒钟重新建立Socket连接)，读取到的数据通过调用store(textRead)方法进行存储。数据
spark master web ui 端口8080被占用解决方法 daizj 8080 端口占用 spark master web ui
spark master web ui 默认端口为8080，当系统有其它程序也在使用该接口时，启动master时也不会报错，spark自己会改用其它端口，自动端口号加1，但为了可以控制到指定的端口，我们可以自行设置，修改方法： 1、cd SPARK_HOME/sbin 2、vi start-master.sh 3、定位到下面部分
oracle_执行计划_谓词信息和数据获取周凡杨 oracle 执行计划
oracle_执行计划_谓词信息和数据获取(上) 一：简要说明在查看执行计划的信息中，经常会看到两个谓词filter和access，它们的区别是什么，理解了这两个词对我们解读Oracle的执行计划信息会有所帮助。简单说，执行计划如果显示是access，就表示这个谓词条件的值将会影响数据的访问路径（表还是索引），而filter表示谓词条件的值并不会影响数据访问路径，只起到
spring中datasource配置 g21121 dataSource
datasource配置有很多种，我介绍的一种是采用c3p0的，它的百科地址是： http://baike.baidu.com/view/920062.htm  <bean name="propertiesConfig" class="org.springframework.b
web报表工具FineReport使用中遇到的常见报错及解决办法（三）老A不折腾 finereport FAQ 报表软件
这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、repeated column width is largerthan paper width：这个看这段话应该是很好理解的。比如做的模板页面宽度只能放
mysql 用户管理墙头上一根草 linux mysql user
1.新建用户 //登录MYSQL@>mysql -u root -p@>密码//创建用户mysql> insert into mysql.user(Host,User,Password) values(‘localhost’,'jeecn’,password(‘jeecn’));//刷新系统权限表mysql>flush privileges;这样就创建了一个名为：
关于使用Spring导致c3p0数据库死锁问题 aijuans spring Spring 入门 Spring 实例 Spring3 Spring 教程
这个问题我实在是为整个 springsource 的员工蒙羞如果大家使用 spring 控制事务，使用 Open Session In View 模式， com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.
百度词库联想 annan211 百度
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> <title>RunJS</title&g
int数据与byte之间的相互转换实现代码百合不是茶位移 int转byte byte转int 基本数据类型的实现
在BMP文件和文件压缩时需要用到的int与byte转换,现将理解的贴出来; 主要是要理解;位移等概念 http://baihe747.iteye.com/blog/2078029 int转byte; byte转int; /** * 字节转成int,int转成字节 * @author Administrator *
简单模拟实现数据库连接池 bijian1013 java thread java多线程简单模拟实现数据库连接池
简单模拟实现数据库连接池实例1： package com.bijian.thread; public class DB { //private static final int MAX_COUNT = 10; private static final DB instance = new DB(); private int count = 0; private i
一种基于Weblogic容器的鉴权设计 bijian1013 java weblogic
服务器对请求的鉴权可以在请求头中加Authorization之类的key，将用户名、密码保存到此key对应的value中，当然对于用户名、密码这种高机密的信息，应该对其进行加砂加密等，最简单的方法如下： String vuser_id = "weblogic"; String vuse
【RPC框架Hessian二】Hessian 对象序列化和反序列化 bit1129 hessian
任何一个对象从一个JVM传输到另一个JVM，都要经过序列化为二进制数据(或者字符串等其他格式，比如JSON)，然后在反序列化为Java对象，这最后都是通过二进制的数据在不同的JVM之间传输(一般是通过Socket和二进制的数据传输)，本文定义一个比较符合工作中。 1. 定义三个POJO Person类 package com.tom.hes
【Hadoop十四】Hadoop提供的脚本的功能 bit1129 hadoop
1. hadoop-daemon.sh 1.1 启动HDFS ./hadoop-daemon.sh start namenode ./hadoop-daemon.sh start datanode 通过这种逐步启动的方式，比start-all.sh方式少了一个SecondaryNameNode进程，这不影响Hadoop的使用，其实在 Hadoop2.0中，SecondaryNa
中国互联网走在“灰度”上 ronin47 管理灰度
中国互联网走在“灰度”上（转）文/孕峰第一次听说灰度这个词，是任正非说新型管理者所需要的素质。第二次听说是来自马化腾。似乎其他人包括马云也用不同的语言说过类似的意思。灰度这个词所包含的意义和视野是广远的。要理解这个词，可能同样要用“灰度”的心态。灰度的反面，是规规矩矩，清清楚楚，泾渭分明，严谨条理，是决不妥协，不转弯，认死理。黑白分明不是灰度，像彩虹那样
java-51-输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。 bylijinnan java
public class PrintMatrixClockwisely { /** * Q51.输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。例如：如果输入如下矩阵： 1 2 3 4 5 6 7 8 9
mongoDB 用户管理开窍的石头 mongoDB用户管理
1:添加用户第一次设置用户需要进入admin数据库下设置超级用户（use admin） db.addUsr({user:'useName',pwd:'111111',roles:[readWrite,dbAdmin]}); 第一个参数用户的名字第二个参数
[游戏与生活]玩暗黑破坏神3的一些问题 comsci 生活
暗黑破坏神3是有史以来最让人激动的游戏。。。。但是有几个问题需要我们注意玩这个游戏的时间，每天不要超过一个小时，且每次玩游戏最好在白天结束游戏之后，最好在太阳下面来晒一下身上的暗黑气息，让自己恢复人的生气 &nb
java 二维数组如何存入数据库 cuiyadll java
using System; using System.Linq; using System.Text; using System.Windows.Forms; using System.Xml; using System.Xml.Serialization; using System.IO; namespace WindowsFormsApplication1 {
本地事务和全局事务Local Transaction and Global Transaction(JTA) darrenzhu java spring local global transaction
Configuring Spring and JTA without full Java EE http://spring.io/blog/2011/08/15/configuring-spring-and-jta-without-full-java-ee/ Spring doc -Transaction Management http://docs.spring.io/spri
Linux命令之alias - 设置命令的别名，让 Linux 命令更简练 dcj3sjt126com linux alias
用途说明设置命令的别名。在linux系统中如果命令太长又不符合用户的习惯，那么我们可以为它指定一个别名。虽然可以为命令建立“链接”解决长文件名的问题，但对于带命令行参数的命令，链接就无能为力了。而指定别名则可以解决此类所有问题【1】。常用别名来简化ssh登录【见示例三】，使长命令变短，使常用的长命令行变短，强制执行命令时询问等。常用参数格式：alias 格式：ali
yii2 restful web服务[格式响应] dcj3sjt126com PHP yii2
响应格式当处理一个 RESTful API 请求时，一个应用程序通常需要如下步骤来处理响应格式：确定可能影响响应格式的各种因素，例如媒介类型，语言，版本，等等。这个过程也被称为 content negotiation。资源对象转换为数组，如在 Resources 部分中所描述的。通过 [[yii\rest\Serializer]]
MongoDB索引调优（2）——[十] eksliang mongodb MongoDB索引优化
转载请出自出处：http://eksliang.iteye.com/blog/2178555 一、概述上一篇文档中也说明了，MongoDB的索引几乎与关系型数据库的索引一模一样，优化关系型数据库的技巧通用适合MongoDB，所有这里只讲MongoDB需要注意的地方二、索引内嵌文档可以在嵌套文档的键上建立索引，方式与正常
当滑动到顶部和底部时，实现Item的分离效果的ListView gundumw100 android
拉动ListView，Item之间的间距会变大，释放后恢复原样； package cn.tangdada.tangbang.widget; import android.annotation.TargetApi; import android.content.Context; import android.content.res.TypedArray; import andr
程序员用HTML5制作的爱心树表白动画 ini JavaScript jquery Web html5 css
体验效果：http://keleyi.com/keleyi/phtml/html5/31.htmHTML代码如下： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"><head><meta charset="UTF-8" > <ti
预装windows 8 系统GPT模式的ThinkPad T440改装64位 windows 7旗舰版 kakajw ThinkPad 预装改装 windows 7 windows 8
该教程具有普遍参考性，特别适用于联想的机器，其他品牌机器的处理过程也大同小异。该教程是个人多次尝试和总结的结果，实用性强，推荐给需要的人！缘由小弟最近入手笔记本ThinkPad T440，但是特别不能习惯笔记本出厂预装的Windows 8系统，而且厂商自作聪明地预装了一堆没用的应用软件，消耗不少的系统资源（本本的内存为4G，系统启动完成时，物理内存占用比
Nginx学习笔记 mcj8089 nginx
一、安装nginx 1、在nginx官方网站下载一个包，下载地址是： http://nginx.org/download/nginx-1.4.2.tar.gz 2、WinSCP(ftp上传工
mongodb 聚合查询每天论坛链接点击次数 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 18 */ { "_id" : ObjectId("5596414cbe4d73a327e50274"), "msgType" : "text", "sendTime" : ISODate("2015-07-03T08:01:16.000Z"
java术语（PO/POJO/VO/BO/DAO/DTO） Luob. DAO POJO DTO po VO BO
PO(persistant object) 持久对象在o/r 映射的时候出现的概念,如果没有o/r映射,就没有这个概念存在了.通常对应数据模型(数据库),本身还有部分业务逻辑的处理.可以看成是与数据库中的表相映射的java对象.最简单的PO就是对应数据库中某个表中的一条记录,多个记录可以用PO的集合.PO中应该不包含任何对数据库的操作. VO(value object) 值对象通
算法复杂度 Wuaner Algorithm
Time Complexity & Big-O： http://stackoverflow.com/questions/487258/plain-english-explanation-of-big-o http://bigocheatsheet.com/ http://www.sitepoint.com/time-complexity-algorithms/

SAEtensorflow编程

你可能感兴趣的:(deep,learning)