中国大学MOOC-人工智能实践：Tensorflow笔记-课程笔记 Chapter6

本篇博客为学习中国大学MOOC-人工智能实践：Tensorflow笔记课程时的个人笔记记录。具体课程情况可以点击链接查看。（这里推一波中国大学MOOC，很好的学习平台，质量高，种类全，想要学习的话很有用的）
本篇是第六章的学习笔记,前面五章的笔记可以翻看我的博客~

Chapter 6 全连接网络实践

关于上节课留下来的断点续训问题

修改mnist_backward.py文件
修改后的文件内容如下,修改的地方进行了标记

#coding:utf-8
import tensorflow as tf 
from tensorflow.examples.tutorials.mnist import input_data
import mnist_forward
import os

BATCH_SIZE = 200
LEARNING_RATE_BASE = 0.1
LEARNING_RATE_DECAY = 0.99
REGULARIZER = 0.0001
STEPS = 50000
MOVING_AVERAGE_DECAY = 0.99
MODEL_SAVE_PATH = 'G:/model/'   #这里是我选择放置训练好的model的路径,根据自己的需要进行修改
MODEL_NAME = 'mnist_model'
DATA_PATH = 'G:/datasets/mnist' #这里是我放置dataset的路径,根据自己的需要进行修改

def backward(mnist):
    x = tf.placeholder(tf.float32, [None, mnist_forward.INPUT_NODE])
    y_ = tf.placeholder(tf.float32, [None, mnist_forward.OUTPUT_NODE])
    y = mnist_forward.forward(x, REGULARIZER)
    global_step = tf.Variable(0, trainable=False)
    ce = tf.nn.sparse_softmax_cross_entropy_with_logits(logits=y,labels=tf.argmax(y_, 1))
    cem = tf.reduce_mean(ce)
    loss = cem + tf.add_n(tf.get_collection('losses'))
    learning_rate = tf.train.exponential_decay(LEARNING_RATE_BASE,global_step,mnist.train.num_examples / BATCH_SIZE,LEARNING_RATE_DECAY,staircase = True)
    train_step = tf.train.GradientDescentOptimizer(learning_rate).minimize(loss, global_step=global_step)
    ema = tf.train.ExponentialMovingAverage(MOVING_AVERAGE_DECAY, global_step)
    ema_op = ema.apply(tf.trainable_variables())
    with tf.control_dependencies([train_step, ema_op]):
        train_op = tf.no_op(name = 'train')
    saver = tf.train.Saver()
    with tf.Session() as sess:
        init_op = tf.global_variables_initializer()
        sess.run(init_op)
        # 加入断点续训功能 #################################################modified
        ckpt = tf.train.get_checkpoint_state(MODEL_SAVE_PATH)
        if ckpt and ckpt.model_checkpoint_path:
            saver.restore(sess, ckpt.model_checkpoint_path)
        # 读入原本训练的结果,继续训练############end
        for i in range(STEPS):
            xs, ys = mnist.train.next_batch(BATCH_SIZE)
            _, loss_value, step = sess.run([train_op, loss, global_step], feed_dict={x: xs, y_: ys})
            if i % 1000 == 0:
                print("After %d training steps, loss on training batch is %g." % (step, loss_value))
                saver.save(sess, os.path.join(MODEL_SAVE_PATH,MODEL_NAME),global_step=global_step)

def main():
    mnist = input_data.read_data_sets(DATA_PATH, one_hot = True)
    backward(mnist)

if __name__ == '__main__':
    main()

6.1 输入手写数字图片输出识别结果

Q:如何对输入的真实图片,输出预测的结果,
输入层是784个节点,每个节点是[0,1]之间的浮点数,
输出层是10个可能性概率组成的以为数组

def application():
    testNum = input("input the number of test pictures:")
    for i in range (testNum):
        testPic = raw_input("the path of test pictures:")
        testPicArr = pre_pic(testPic)
        preValue = restore_model(testPicArr)
        print("The prediction number is:",preValue)

相比第五章的代码新增代码文件 mnist_app.py
具体的代码文件 mnist_app.py 内容如下：

#coding:utf-8
import tensorflow as tf 
import numpy as np 
from PIL import Image 
import matplotlib.pyplot as plt
import mnist_backward
import mnist_forward

def restore_model(testPicArr):
    with tf.Graph().as_default() as tg:
        x = tf.placeholder(tf.float32, [None, mnist_forward.INPUT_NODE])
        y = mnist_forward.forward(x, None)
        preValue = tf.arg_max(y, 1)
        variable_averages = tf.train.ExponentialMovingAverage(mnist_backward.MOVING_AVERAGE_DECAY)
        variables_to_restore = variable_averages.variables_to_restore()
        saver = tf.train.Saver(variables_to_restore)

        with tf.Session() as sess:
            ckpt = tf.train.get_checkpoint_state(mnist_backward.MODEL_SAVE_PATH)
            if ckpt and ckpt.model_checkpoint_path:
                saver.restore(sess, ckpt.model_checkpoint_path)
                preValue = sess.run(preValue, feed_dict={x:testPicArr})
                return preValue
            else:
                print("No checkpoint file found")
                return -1

def pre_pic(picName):
    img = Image.open(picName)
    #img = img.convert("L")
    reIm = img.resize((28,28), Image.ANTIALIAS)
    im_arr = np.array(reIm.convert('L'))
    threshold = 100
    for i in range(28):
        for j in range(28):
            im_arr[i][j] = 255-im_arr[i][j]
            if (im_arr[i][j]0
            else: im_arr[i][j] = 255
    plt.figure("figure")
    plt.imshow(im_arr)
    plt.show()
    nm_arr = im_arr.reshape([1, 784])
    nm_arr = nm_arr.astype(np.float32)
    img_ready = np.multiply(nm_arr, 1.0/255.0)
    return img_ready

def application():
    '''
    testNum = int(input("input the number of test picture: "))
    for i in range(testNum):
        testPic = input("the path of test picture: ")
        testPicArr = pre_pic(testPic)
        preValue = restore_model(testPicArr)
        print("The prediction number is:", preValue)
        '''
    for i in range(10):
        imName = 'pic/'+str(i)+'.jpg'
        print("ImageName is:", imName)
        testPicArr = pre_pic(imName)
        preValue = restore_model(testPicArr)
        print("The prediction number is:", preValue)

def main():
    application()

if __name__ == '__main__':
    main()

注意:这里我修改了老师上课使用的代码,改成自动循环十张测试图片,每次读入一张图片,然后处理完成后显示该图片,手动关闭图片窗口程序会继续运行输出测试结果.老师原本使用的代码我注释掉了,可以自行修改.
测试使用的十张手写数字图片我没有找到,于是自己制作了一份,从0~9十张手写数字图片,压缩了一下上传到了CSDN,需要的朋友可以自行下载,(可能我写的太丑了,有几个数字就是识别不对,不过个人感觉也很正常,毕竟只是这么简单的全连接层,识别效果不是很理想也很正常,加上我自己制作的数据集和mnist本身的样式可能差的比较远.)
十张测试图片下载链接:https://download.csdn.net/download/tuzixini/10560123
下载后解压放在和代码同一目录下就好.

6.2 制作数据集

Q:如何制作数据集,实现特定应用
tfrecords文件
tfrecords文件是一种二进制文件,可先将图片和标签制作成该格式的文件,使用tensorflow进行数据读取,会提高内存利用率.
使用tf.train.Example的协议存储训练数据,训练数据的特征用键值对的形式表示.
如:’img_raw’:值 ‘label’:值值是Byteslist/FloatList/int64List
用SerializeToString()把数据序列化成字符串存储.
生成tfrecords文件

writer = tf.python_io.TFRecordWriter(tfRecoderName) #新建一个writer
for 循环遍历每张图片和标签:
    example = tf.train.Example(features=tf.train.Features(feature={'img_raw':tf.train.Feature(bytes_list=tf.train.BytesList(value=[img_raw])), 'label':tf.train.Feature(int64_list=tf.train.List(value=labels))})) # 把每张图片和标签封装到Example中
    writer.write(example.SerializeToString()) #把example进行序列化
writer.close()

解析tfrecords文件

filename_queue = tf.train.string_input_producer([tfRecord_path])
reader = tf.TFRecordReader() # 新建一个reader
_, serialized_example = reader.read(filename_queue)
features = tf.parse_single_example(serialized_example, feature={'img_raw':tf.FixedLenFeature([],tf.string),'label':tf.FixedLenFeature([10],tf.int64)})
img = tf.decode_raw(features['img_raw'],tf.uint8)
img.set_shape([784])
img = tf.cast(img,tf.float32)*(1./255)
label = tf.cast(features['label'], tf.float32)

相比6.1 新增代码文件 mnist_generateds.py, 同时修改了mnist_backward.py文件和mnist_test.py文件中图片和标签获取的接口.
mnist_generateds.py 代码内容如下:

#coding:utf-8
import tensorflow as tf 
import numpy as np 
from PIL import Image
import os 

image_train_path = './mnist_data_jpg/mnist_train_jpg_60000/'
label_train_path = './mnist_data_jpg/mnist_train_jpg_60000.txt'
tfRecord_train = './data/mnist_train.tfrecords'
image_test_path = './mnist_data_jpg/mnist_test_jpg_10000/'
label_test_path = './mnist_data_jpg/mnist_train_jpg_10000.txt'
tfRecord_test = './data/mnist_test.tfrecords'
data_path = './data'
resize_height = 28
resize_width = 28

def write_tfRecord(tfRecordName, image_path, label_path):
    writer = tf.python_io.TFRecordWriter(tfRecordName)
    num_pic = 0
    f = open(label_path, 'r')
    contents = f.readlines()
    f.close()
    for content in contents:
        value = content.split()
        image_path = image_path + value[0]
        img = Image.open(image_path)
        img_raw = img.tobytes()
        labels = [0]*10
        labels[int(value[1])] = 1
        example = tf.train.Example(features=tf.train.Features(feature={
            'img_raw': tf.train.Feature(bytes_list=tf.train.BytesList(value=[img_raw])),
            'label': tf.train.Feature(int64_list=tf.train.Int64List(value=labels))
        }))
        writer.write(example.SerializeToString())
        num_pic += 1
        print("the number of picture:", num_pic)
    writer.close()
    print("Write tfrecord sussessful")

def generate_tfRecord():
    isExists = os.path.exists(data_path)
    if not isExists:
        os.makedirs(data_path)
        print("The directory was create successfully")
    else:
        print ("directory already exists")
    write_tfRecord(tfRecord_train, image_train_path, label_train_path)
    write_tfRecord(tfRecord_test, image_test_path, label_test_path)

def read_tfRecord(tfRecord_path):
    filename_queue = tf.train.string_input_producer([tfRecord_path])
    reader = tf.TFRecordReader() # 新建一个reader
    _, serialized_example = reader.read(filename_queue)
    features = tf.parse_single_example(serialized_example, feature={'img_raw':tf.FixedLenFeature([],tf.string),'label':tf.FixedLenFeature([10],tf.int64)})
    img = tf.decode_raw(features['img_raw'],tf.uint8)
    img.set_shape([784])
    img = tf.cast(img,tf.float32)*(1./255)
    label = tf.cast(features['label'], tf.float32)
    return img, label

def get_tfRecord(num, isTrain=True):
    if isTrain:
        tfRecord_path = tfRecord_train
    else:
        tfRecord_path= tfRecord_test
    img, label = read_tfRecord(tfRecord_path)
    img_batch, label_batch = tf.train.shuffle_batch([img, label],batch_size=num,num_threads=2,capacity=1000,min_after_dequeue=700)
    return img_batch, label_batch

def main():
    generate_tfRecord()

if __name__ == '__main__':
    main()

使用多线程提升图片标签批获取的效率
把批获取的操作放到线程协调器开启和关闭的中间

# 开启线程协调器
coord = tf.train.Coordinator()
threads = tf.train.start_queue_runners(sess=sess, coord=coord)

pass

# 关闭线程协调器
coord.request_stop()
coord.join(threads)

修改后用于Chapter 6 的mnist_backward.py代码如下

#coding:utf-8
import tensorflow as tf 
from tensorflow.examples.tutorials.mnist import input_data
import mnist_forward
import os
# chapter 6 添加 ## start
import mnist_generateds
## end

BATCH_SIZE = 200
LEARNING_RATE_BASE = 0.1
LEARNING_RATE_DECAY = 0.99
REGULARIZER = 0.0001
STEPS = 50000
MOVING_AVERAGE_DECAY = 0.99
MODEL_SAVE_PATH = 'G:/model/'   #这里是我选择放置训练好的model的路径,根据自己的需要进行修改
MODEL_NAME = 'mnist_model'
DATA_PATH = 'G:/datasets/mnist' #这里是我放置dataset的路径,根据自己的需要进行修改
# chapter 6 添加 ## start
train_num_examples = 60000
## end

def backward(mnist):
    x = tf.placeholder(tf.float32, [None, mnist_forward.INPUT_NODE])
    y_ = tf.placeholder(tf.float32, [None, mnist_forward.OUTPUT_NODE])
    y = mnist_forward.forward(x, REGULARIZER)
    global_step = tf.Variable(0, trainable=False)
    ce = tf.nn.sparse_softmax_cross_entropy_with_logits(logits=y,labels=tf.argmax(y_, 1))
    cem = tf.reduce_mean(ce)
    loss = cem + tf.add_n(tf.get_collection('losses'))

    # chapter 5 使用,在chapter 6被注释
    # learning_rate = tf.train.exponential_decay(LEARNING_RATE_BASE,global_step,mnist.train.num_examples / BATCH_SIZE,LEARNING_RATE_DECAY,staircase = True)
    # 替换为:
    learning_rate = tf.train.exponential_decay(LEARNING_RATE_BASE,global_step,train_num_examples / BATCH_SIZE,LEARNING_RATE_DECAY,staircase = True)
    ## end

    train_step = tf.train.GradientDescentOptimizer(learning_rate).minimize(loss, global_step=global_step)
    ema = tf.train.ExponentialMovingAverage(MOVING_AVERAGE_DECAY, global_step)
    ema_op = ema.apply(tf.trainable_variables())
    with tf.control_dependencies([train_step, ema_op]):
        train_op = tf.no_op(name = 'train')
    saver = tf.train.Saver()

    # chapter 6 添加 ## start
    img_batch, label_batch = mnist_generateds.generate_tfRecord(BATCH_SIZE, isTrain=True)
    ## end

    with tf.Session() as sess:
        init_op = tf.global_variables_initializer()
        sess.run(init_op)
        # 加入断点续训功能 ###########################################################################modified
        ckpt = tf.train.get_checkpoint_state(MODEL_SAVE_PATH)
        if ckpt and ckpt.model_checkpoint_path:
            saver.restore(sess, ckpt.model_checkpoint_path)
        # 读入原本训练的结果,继续训练

        # chapter 6 添加 ## start
        coord = tf.train.Coordinator()
        threads = tf.train.start_queue_runners(sess=sess, coord=coord)
        ## end

        for i in range(STEPS):
            # chapter 5 使用,在chapter 6被注释
            # xs, ys = mnist.train.next_batch(BATCH_SIZE)
            # 替换为:
            xs, ys = sess.run([img_batch, label_batch])
            ## end

            _, loss_value, step = sess.run([train_op, loss, global_step], feed_dict={x: xs, y_: ys})
            if i % 1000 == 0:
                print("After %d training steps, loss on training batch is %g." % (step, loss_value))
                saver.save(sess, os.path.join(MODEL_SAVE_PATH,MODEL_NAME),global_step=global_step)

        # chapter 6 添加 ## start
        coord.request_stop()
        coord.join(threads)
        ## end

def main():
    mnist = input_data.read_data_sets(DATA_PATH, one_hot = True)
    backward(mnist)

if __name__ == '__main__':
    main()

修改后用于Chapter6 的 mnist_test.py 文件代码如下:

#coding:utf-8
import time
import tensorflow as tf 
from tensorflow.examples.tutorials.mnist import input_data
import mnist_backward
import mnist_forward
## Chapter 6 添加
import mnist_generateds
# end
TEST_INTERVAL_SECS = 5
DATA_PATH = 'G:/datasets/mnist' #这里是我放置dataset的路径,根据自己的需要进行修改

## chapter 6 添加
TEST_NUM = 10000
# end

def test(mnist):
    with tf.Graph().as_default() as g:
        x = tf.placeholder(tf.float32, [None, mnist_forward.INPUT_NODE])
        y_ = tf.placeholder(tf.float32, [None, mnist_forward.OUTPUT_NODE])
        y = mnist_forward.forward(x, None)
        ema = tf.train.ExponentialMovingAverage(mnist_backward.MOVING_AVERAGE_DECAY)
        ema_restore = ema.variables_to_restore()
        saver = tf.train.Saver(ema_restore)
        correct_prediction = tf.equal(tf.argmax(y, 1), tf.argmax(y_, 1))
        accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

        ## Chapter 6 添加
        img_batch, label_batch = mnist_generateds.get_tfRecord(TEST_num, isTrain=False)
        # end

        while True:
            with tf.Session() as sess:
                ckpt = tf.train.get_checkpoint_state(mnist_backward.MODEL_SAVE_PATH)
                if ckpt and ckpt.model_checkpoint_path:
                    saver.restore(sess, ckpt.model_checkpoint_path)
                    global_step = ckpt.model_checkpoint_path.split('/')[-1].split('-')[-1]

                    ## chapter 6 添加
                    coord = tf.train.Coordinator()
                    threads = tf.train.start_queue_runners(sess=sess, coord=coord)
                    xs,ys = sess.run([img_batch, label_batch])
                    # end
                    ## chapter 5 使用,在chapter 6注释
                    # accuracy_score = sess.run(accuracy, feed_dict={x: mnist.test.images, y_: mnist.test.labels})
                    # 替换为:
                    accuracy_score = sess.run(accuracy, feed_dict={x: xs, y_: ys})
                    # end
                    print("After %s training steps, test accuracy = %g" % (global_step, accuracy_score))

                    ## chapter 6添加
                    coord.request_stop()
                    coord.join(threads)
                    # end
                else:
                    print("No checkpoint file found!")
                    return
            time.sleep(TEST_INTERVAL_SECS)

def main():
    mnist = input_data.read_data_sets(DATA_PATH, one_hot=True)
    test(mnist)

if __name__ == '__main__':
    main()

自然语言处理系列六十六》对话机器人项目实战》对话机器人原理与介绍陈敬雷-充电了么-CEO兼CTO python 人工智能算法自然语言处理机器人人工智能 AIGC chatgpt gpt ai
注：此文章内容均节选自充电了么创始人，CEO兼CTO陈敬雷老师的新书《自然语言处理原理与实战》（人工智能科学与技术丛书）【陈敬雷编著】【清华大学出版社】文章目录自然语言处理系列六十六对话机器人项目实战》对话机器人原理与介绍对话机器人项目代码实战总结自然语言处理系列六十六对话机器人项目实战》对话机器人原理与介绍对话机器人是一个用来模拟人类对话或聊天的计算机程序，本质上是通过机器学习和人工智能等技术让
《机器学习》—— XGBoost（xgb.XGBClassifier）分类器张小生180 机器学习人工智能
文章目录一、XGBoost分类器的介绍二、XGBoost（xgb.XGBClassifier）分类器与随机森林分类器（RandomForestClassifier）的区别三、XGBoost（xgb.XGBClassifier）分类器代码使用示例一、XGBoost分类器的介绍XGBoost分类器是一种基于梯度提升决策树（GradientBoostingDecisionTree，GBDT）的集成学习算
关于深度森林的一点理解 Y.G Bingo 机器学习方法机器学习神经网络
2017年年初，南京大学周志华老师上传了一篇名为：DeepForest：TowardsAnAlternativetoDeepNeuralNetworks的论文，一石激起千层浪，各大媒体纷纷讨论着，这似乎意味着机器学习的天色要变，实则不然，周志华老师通过微博解释道，此篇论文不过是为机器学习打开了另一扇窗，是另一种思维，而不是真的去替代深度神经网络（DNN）。下面我就简单概括一下我对这篇论文的理解，如
汽车智能驾驶算法汇总芊言芊语汽车算法
汽车智能驾驶算法是自动驾驶技术的核心，它们集成了多个学科的知识，包括计算机视觉、机器学习、控制理论、路径规划等。以下是对汽车智能驾驶算法的一个详细汇总，内容分为几个关键部分进行阐述。一、计算机视觉算法计算机视觉是智能驾驶算法中用于识别和理解环境的关键技术。它主要包括图像处理、特征提取和对象识别等步骤。图像处理：通过摄像头等设备获取车辆前方的图像，然后进行预处理，如灰度化、二值化、滤波等操作，以提高
一文告诉你程序员该掌握和应用大模型大耳朵爱学习语言模型人工智能自然语言处理 AI大模型大模型程序员大模型入门
训练大模型：场景：自训练大模型人才需求：算法工程师门槛：极高机会：较高特点：这个方向需要深厚的算法和机器学习知识，适合那些对研究和开发新模型感兴趣的人。微调大模型：场景：垂直大模型人才需求：算法工程师门槛：高机会：高特点：专注于特定领域的大模型优化，适合有一定领域知识且希望在细分市场深耕的工程师。AIAgent：场景：工作流人才需求：懂业务和大模型的研发工程师门槛：较高机会：一般特点：需要结合业务
2021-03-26 每日打卡来多喜
昨日完成情况：1.3k跑，没有做帕梅拉。感觉早上醒来的太早，一整天人都有一点昏昏沉沉，感觉荒废了一天。2.其他两项全部没完成，感觉想做的事情太多，反而容易什么都不做。本来想学pca,但是看了一下觉得要先复习机器学习，然后就在纠结中什么都没做。感想：冲劲十足的周一周二，慢慢的懒下来。。。要继续保持运动和自我学习。要继续考虑如何定下适量的每日任务。今日打卡：1.排球2.去他妈家3.整理房间4.填完合同
理性拥抱机器学习热潮：ML祖师爷Tom Mitchell最新洞见「已注销」
来源：雷锋网作者：杨晓凡本文共3484字，建议阅读7分钟。本文与你分享TomMitchell教授的最新洞见。编者按：上个月，全球移动互联网大会GMIC2018在北京开幕。此次主题为"AI生万物，谐音爱生万物，科学技术要有人文的温度，机器有爱，真芯英雄"的大会上，全球人工智能领袖汇聚全球业界顶尖领袖，探讨在基础硬件、大数据与开源平台、深度学习为代表的算法等人工智能领域的最新洞见，是年度行业发展的风向
2021-01-02随笔 0清婉0
人工智能时代最重要的是机器学习，像数据分析、图像识别、数据挖掘、自然语言处理、语音识别等都是以其为基础的，也可以说人工智能的各种应用都需要机器学习来支撑。现在各大公司越来越注重数据的价值，人工成本也是越来越高，所以机器学习也就变得不可或缺了。数据分析、自然语言处理、语音识别，这将是作为前端人员的我，在2021年学习的重点。现收集几本关于数据分析的书籍，作为参考书籍学习：1.《跟着迪哥学Python
深度学习速通系列:鲁棒性和稳定性 Ven% 深度学习速通系列深度学习自然语言处理人工智能 python nlp
在机器学习中，鲁棒性和稳定性是评估模型性能的两个关键指标，它们对于确保模型在实际应用中的可靠性至关重要。鲁棒性（Robustness）定义：鲁棒性指的是模型对于输入数据的扰动、噪声、异常值或对抗性攻击的抵抗能力。一个鲁棒的模型能够在面对这些不利因素时保持其性能。提高鲁棒性的方法：数据增强：通过对训练数据进行变换（如旋转、缩放、裁剪等），使模型能够更好地泛化到未见过的数据。对抗训练：在训练过程中引入
基于opencv-mediapipe的手势识别困了不能睡 opencv 计算机视觉人工智能
上一篇文章介绍了基于opencv的手势识别，如果大家运行了我的代码，会发现代码中找出手部轮廓的效果不是很理想。当时我在网上找寻解决的办法，刚好找到了mediapip库，然后我就利用opencv和mediapipe这两个库重新进行了手势识别的代码编写。效果还不错，写篇文章记录一下。1.mediapipe简介Mediapipe是google的一个开源项目，可以提供开源的、跨平台的常用机器学习(mach
机器学习案例-决策树实现鸢尾花分类 Ausgelebt 机器学习相关 python 分类
机器学习案例-决策树实现鸢尾花分类目录机器学习案例-决策树实现鸢尾花分类1.选题目的和意义2.主要研究内容2.1决策树算法分类（区别于树的结构和构造算法）2.2决策树算法详解2.3决策树的应用3.算法设计3.1数据分析3.1.1Iris数据集基本介绍3.1.2样本标签值分布3.1.3样本特征值分布3.1.4相关性热力图3.2建立决策树3.3模型调优3.3.1决策树深度（预剪枝）3.3.2选取部分特
探索数据变换：Transform在数据分析中的重要性 Lill_bin 杂谈数据分析数据挖掘数据库架构人工智能机器学习
在数据分析和机器学习领域，数据变换（Transform）是一个至关重要的步骤，它直接影响到模型的性能和结果的准确性。本文将深入探讨数据变换的概念、方法以及它在现代数据分析中的应用。1.数据变换的定义数据变换是指将原始数据通过某种数学方法转换为另一种形式的过程。这种转换旨在提高数据的可解释性、降低噪声、增强特征的区分度，或是为了满足特定算法的预处理需求。2.常见的数据变换方法2.1标准化（Stand
【Python之Streamlit】第1章：Streamlit简介 civilpy python 开发语言
第1章：Streamlit简介1.1Streamlit是什么？Streamlit是一个开源的Python框架，用于快速、轻松地构建交互式Web应用程序。它旨在让开发人员能够专注于应用程序的业务逻辑，而不是底层的Web开发难题。借助Streamlit，您可以使用简单的Python代码即可创建交互式数据可视化、机器学习模型演示和可部署的仪表板。1.2Streamlit的主要特点无代码界面：无需编写HT
人工智能对我们影响有多大？我们大学生该如何去把握和更加合理的去利用？ Direct_Yang 人工智能学习程序人生学习方法改行学it 创业创新
人工智能对我们的生活影响有多大人工智能给我们的生活带来了巨大的影响！它像魔术师一样，帮我们解决问题、提供建议，甚至预测未来。从智能手机到智能家居，人工智能让我们的生活变得更便捷、更智能。它是我们生活中的得力助手，让我们感受到科技的魅力！方向一：人工智能的领域人工智能涵盖了许多不同的领域，包括但不限于以下几个方面：机器学习：机器学习是人工智能的一个重要分支，它涉及让计算机系统从数据中学习并改进性能，
线性代数|机器学习-P33卷积神经网络ImageNet和卷积规则取个名字真难呐算法机器学习矩阵人工智能线性代数
文章目录1.ImageNet2.卷积计算2.1两个多项式卷积2.2函数卷积2.3循环卷积3.周期循环矩阵和非周期循环矩阵4.循环卷积特征值4.1卷积计算的分解4.2运算量4.3二维卷积公式5.KroneckerProduct1.ImageNetImageNet的论文paper链接如下：详细请直接阅读相关论文即可通过网盘分享的文件：imagenet_cvpr09.pdf链接:https://pan.
【conda】完整指南：如何配置 Conda 环境与镜像源丶2136 conda conda
目录1.Conda配置概述2.配置镜像源2.1查找合适的镜像源2.2配置镜像源2.3优先级设置3.环境管理3.1设置默认环境路径3.2默认环境3.3环境清理3.4自定义命令4.其他常用配置选项4.1配置日志级别4.2缓存设置4.3自动更新总结conda是一个功能强大的包和环境管理工具，广泛用于数据科学、机器学习和科学计算领域。为了最大化利用conda，了解其配置选项至关重要。本文将深入探讨cond
如何在Java中实现高效的分布式梯度下降算法省赚客app开发者 java 分布式算法
如何在Java中实现高效的分布式梯度下降算法大家好，我是微赚淘客系统3.0的小编，是个冬天不穿秋裤，天冷也要风度的程序猿！在本文中，我们将探讨如何在Java中实现高效的分布式梯度下降算法。分布式梯度下降（DistributedGradientDescent）是一种常用于训练大规模机器学习模型的优化方法，特别是在处理大规模数据集时非常有效。本文将介绍如何设计和实现这一算法，以提高训练效率。分布式梯度
强化学习（二）----- 马尔可夫决策过程MDP Duckie-duckie 机器学习数据数据分析数据挖掘机器学习算法
1.马尔可夫模型的几类子模型大家应该还记得马尔科夫链(MarkovChain)，了解机器学习的也都知道隐马尔可夫模型(HiddenMarkovModel，HMM)。它们具有的一个共同性质就是马尔可夫性(无后效性)，也就是指系统的下个状态只与当前状态信息有关，而与更早之前的状态无关。马尔可夫决策过程(MarkovDecisionProcess,MDP)也具有马尔可夫性，与上面不同的是MDP考虑了动作
顶级的python入门教程！小白到大师，从这篇教程开始！马大哈（Python） python pycharm 开发语言学习青少年编程
1.为什么要学习Python？学习Python的原因有很多，以下是几个主要的原因：广泛应用：Python被广泛应用于Web开发、数据科学、人工智能、机器学习、自动化运维、网络爬虫、科学计算、游戏开发等多个领域。掌握Python意味着你可以在这些领域中找到丰富的职业机会。入门简单：Python的语法简洁明了，易于学习和理解，对于编程初学者来说非常友好。它的代码风格一致，可读性强，有助于培养良好的编程
机器学习之 K-均值聚类算法维生素￥机器学习机器学习算法均值算法
K-均值（K-means）聚类算法是一种常用的无监督学习算法，用于将数据集划分为K个不同的簇。该算法通过迭代的方式将数据点分配到最近的簇中，并更新簇的中心，直到收敛为止。一、K-均值聚类算法的基本步骤：初始化K个簇的中心点（可以随机选择或者根据数据集初始化）。将每个数据点分配到最近的簇中。更新每个簇的中心点为该簇所有数据点的平均值。重复步骤2和3，直到簇的中心点不再改变或达到指定的迭代次数。二、K
机器学习中的 K-均值聚类算法及其优缺点安科瑞蒋静机器学习算法均值算法
K-均值聚类算法是一种常用的无监督学习算法，用于将一组数据点划分为K个不同的聚类。该算法的主要思想是将数据点分配给最接近的聚类中心，并通过迭代优化聚类中心位置，使得聚类内部的数据点之间的距离最小化。算法流程如下：初始化K个聚类中心，可以是随机选择的数据点或者通过其他方法选择。分别计算每个数据点到K个聚类中心的距离，并将其分配给距离最近的聚类中心。更新每个聚类的中心位置为其内部所有数据点的平均值。重
Python的图形化界面编程 iteye_20668 Python python
2017.2.14好久没有写代码了，感觉过一个年弄的什么也没有干成，好像看了下c++,突然发现现在来看C++,要简单了好多，并且指针也没有那么难了，然后就是看了下机器学习，感觉有点小难，现在发现好多都涉及到高数，概率论和线性代数的知识，想想当初把这些学的是一塌糊涂。然后上次和胡杨大大聊天的时候，他说好多东西都是在实践中去学习的。好了，继续我的Python吧，Python的图形化界面编程。impor
新的机器学习特性包含Python 无聊的小明老师
Microsoftaa在其AzureML提供的机器学习功能中增加了几个新功能，包括更好地集成Python和自动自调优功能，以便更快地进行模型开发。Python是机器学习的主要语言，这得益于它对进入的低门槛以及广泛的机器学习库和支持工具。Azure提供的Python是新SDK这样可以让AzureML连接到开发人员现有的Python环境。此SDK附带了azureml-sdk可以使用Python的pip
分享一个基于微信小程序的智慧校园服务平台（源码、调试、LW、开题、PPT）计算机源码社微信小程序微信小程序毕业设计项目计算机毕设源码计算机毕设毕设选题课程设计源码毕业设计答辩
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|基
机器学习框架巅峰对决：TensorFlow vs. PyTorch vs. Scikit-Learn实战分析 @sinner 技术选型机器学习 tensorflow pytorch scikit-learn
1.引言1.1机器学习框架的重要性在机器学习的黄金时代，框架的选择对于开发高效、可扩展的模型至关重要。合适的框架可以极大地提高开发效率，简化模型的构建和训练过程，并支持大规模的模型部署。因此，了解和选择最合适的机器学习框架对于研究人员和工程师来说是一个关键的步骤。1.2三大框架概览：TensorFlow、PyTorch、Scikit-Learn目前，最流行的机器学习框架主要有TensorFlow、
图像预处理之图像去重江小皮不皮计算机视觉 opencv 人工智能图像去重直方图
图像预处理之图像去重图像去重介绍方法基于直方图进行图像比对基于哈希法基于ORG进行图像特征提取基于机器学习批量去重图像去重介绍图像去重通常指的是完全相同的图像，即内容完全相同，颜色、尺寸、方向等都相同。但是在实际应用中，也有相似图像去重的需求，即内容大致相同，颜色、尺寸、方向等可能有所不同。因此，图像去重指的可以是完全一样的图像，也可以是相似的图像。图像去重的方法有以下几种：方法哈希法：通过计算图
LLM系列 | 36：Google最新开源大模型：Gemma 2介绍及其微调(下篇) JasonLiu1919 开源
引言环境安装数据准备下载处理模型训练模型inference结果gemma-2-9bgemma-2-9b-it引言低头观落日，引手摘飞星。小伙伴们好，我是微信公众号《小窗幽记机器学习》的小编：卖黑神话的小女孩。本文紧接前文Google最新开源大语言模型：Gemma2介绍及其微调(上篇)，介绍如何用中文语料微调Gemma2模型。如想与小编进一步交流，欢迎在《小窗幽记机器学习》上获取小编微信号，或者直接
工信教考 | AI智能体应用工程师（模拟试题）人工智能-猫猫人工智能开源自然语言处理语言模型架构
关于AI智能体工程师的模拟试题，下面根据AI智能体工程师所需掌握的知识和技能，设计一些模拟题型的示例。这些题目旨在考察应试者在人工智能、机器学习、深度学习、算法设计、系统开发等方面的能力。一、选择题无监督学习常用于哪些任务？（单选）A.回归分析B.聚类分析C.分类预测D.序列预测答案：B解析：无监督学习常用于聚类、降维、异常检测等任务，如市场分割、数据可视化等。以下哪种激活函数常用于分类问题的输出
AI智能电销机器人的优势是什么，有什么特点？ VO_794632978 语音机器人 WX-794632978 人工智能机器人交互语音识别服务器
机器学习、大数据、深度学习、云计算等的发展和应用，机器人完成复杂专业任务的能力越来越强。智能化机器人时代的到来，进一步拓宽了服务机器人的应用场景和服务模式，人工智能机器人的问世，更使电销机器人进入到了电销行业。我们一起来看看AI智能电销机器人的优势是什么。电销机器人是一款智能电话机器人，用于电销行业超卓通电话的意向度筛选工作。“电销机器人”已经逐渐将电话营销人员从简单、重复、低价值劳动中彻底解放出
详解python中的pandas.read_csv()函数程序员洲洲 Python学习 python pandas readcsv csv
作者介绍：我是程序员洲洲，一个热爱写作的非著名程序员。CSDN全栈优质领域创作者、华为云博客社区云享专家、阿里云博客社区专家博主。同时欢迎大家关注其他专栏，我将分享Web前后端开发、人工智能、机器学习、深度学习从0到1系列文章。同时洲洲已经建立了程序员技术交流群，如果您感兴趣，可以私信我加入社群，可以直接vx联系（文末有名片）v：bdizztt随时欢迎您跟我沟通，一起交流，一起成长、进步！点此也可
mondb入手木zi_鸣 mongodb
windows 启动mongodb 编写bat文件， mongod --dbpath D:\software\MongoDBDATA mongod --help 查询各种配置配置在mongob 打开批处理，即可启动，27017原生端口，shell操作监控端口扩展28017，web端操作端口启动配置文件配置，数据更灵活
大型高并发高负载网站的系统架构 bijian1013 高并发负载均衡
扩展Web应用程序一.概念简单的来说，如果一个系统可扩展，那么你可以通过扩展来提供系统的性能。这代表着系统能够容纳更高的负载、更大的数据集，并且系统是可维护的。扩展和语言、某项具体的技术都是无关的。扩展可以分为两种： 1.
DISPLAY变量和xhost(原创) czmmiao display
DISPLAY 在Linux/Unix类操作系统上, DISPLAY用来设置将图形显示到何处. 直接登陆图形界面或者登陆命令行界面后使用startx启动图形, DISPLAY环境变量将自动设置为:0:0, 此时可以打开终端, 输出图形程序的名称(比如xclock)来启动程序, 图形将显示在本地窗口上, 在终端上输入printenv查看当前环境变量, 输出结果中有如下内容:DISPLAY=:0.0
获取B/S客户端IP 周凡杨 java 编程 jsp Web 浏览器
最近想写个B/S架构的聊天系统，因为以前做过C/S架构的QQ聊天系统，所以对于Socket通信编程只是一个巩固。对于C/S架构的聊天系统，由于存在客户端Java应用，所以直接在代码中获取客户端的IP，应用的方法为： String ip = InetAddress.getLocalHost().getHostAddress(); 然而对于WEB
浅谈类和对象朱辉辉33 编程
类是对一类事物的总称，对象是描述一个物体的特征，类是对象的抽象。简单来说，类是抽象的，不占用内存，对象是具体的，占用存储空间。类是由属性和方法构成的，基本格式是public class 类名{ //定义属性 private/public 数据类型属性名； //定义方法 publ
android activity与viewpager+fragment的生命周期问题肆无忌惮_ viewpager
有一个Activity里面是ViewPager，ViewPager里面放了两个Fragment。第一次进入这个Activity。开启了服务，并在onResume方法中绑定服务后，对Service进行了一定的初始化，其中调用了Fragment中的一个属性。 super.onResume(); bindService(intent, conn, BIND_AUTO_CREATE);
base64Encode对图片进行编码 843977358 base64 图片 encoder
/** * 对图片进行base64encoder编码 * * @author mrZhang * @param path * @return */ public static String encodeImage(String path) { BASE64Encoder encoder = null; byte[] b = null; I
Request Header简介 aigo servlet
当一个客户端(通常是浏览器)向Web服务器发送一个请求是，它要发送一个请求的命令行，一般是GET或POST命令，当发送POST命令时，它还必须向服务器发送一个叫“Content-Length”的请求头(Request Header) 用以指明请求数据的长度，除了Content-Length之外，它还可以向服务器发送其它一些Headers，如：
HttpClient4.3 创建SSL协议的HttpClient对象 alleni123 httpclient 爬虫 ssl
public class HttpClientUtils { public static CloseableHttpClient createSSLClientDefault(CookieStore cookies){ SSLContext sslContext=null; try { sslContext=new SSLContextBuilder().l
java取反 -右移-左移-无符号右移的探讨百合不是茶位运算符位移
取反：在二进制中第一位，1表示符数，0表示正数 byte a = -1; 原码：10000001 反码：11111110 补码：11111111 //异或: 00000000 byte b = -2; 原码：10000010 反码：11111101 补码：11111110 //异或: 00000001
java多线程join的作用与用法 bijian1013 java 多线程
对于JAVA的join，JDK 是这样说的：join public final void join （long millis ）throws InterruptedException Waits at most millis milliseconds for this thread to die. A timeout of 0 means t
Java发送http请求(get 与post方法请求) bijian1013 java spring
PostRequest.java package com.bijian.study; import java.io.BufferedReader; import java.io.DataOutputStream; import java.io.IOException; import java.io.InputStreamReader; import java.net.HttpURL
【Struts2二】struts.xml中package下的action配置项默认值 bit1129 struts.xml
在第一部份，定义了struts.xml文件，如下所示： <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache.org/dtds/struts
【Kafka十三】Kafka Simple Consumer bit1129 simple
代码中关于Host和Port是割裂开的，这会导致单机环境下的伪分布式Kafka集群环境下，这个例子没法运行。实际情况是需要将host和port绑定到一起， package kafka.examples.lowlevel; import kafka.api.FetchRequest; import kafka.api.FetchRequestBuilder; impo
nodejs学习api ronin47 nodejs api
NodeJS基础什么是NodeJS JS是脚本语言，脚本语言都需要一个解析器才能运行。对于写在HTML页面里的JS，浏览器充当了解析器的角色。而对于需要独立运行的JS，NodeJS就是一个解析器。每一种解析器都是一个运行环境，不但允许JS定义各种数据结构，进行各种计算，还允许JS使用运行环境提供的内置对象和方法做一些事情。例如运行在浏览器中的JS的用途是操作DOM，浏览器就提供了docum
java-64.寻找第N个丑数 bylijinnan java
public class UglyNumber { /** * 64.查找第N个丑数具体思路可参考 [url] http://zhedahht.blog.163.com/blog/static/2541117420094245366965/[/url] * 题目：我们把只包含因子 2、3和5的数称作丑数（Ugly Number）。例如6、8都是丑数，但14
二维数组（矩阵）对角线输出 bylijinnan 二维数组
/** 二维数组对角线输出两个方向例如对于数组： { 1, 2, 3, 4 }, { 5, 6, 7, 8 }, { 9, 10, 11, 12 }, { 13, 14, 15, 16 }, slash方向输出： 1 5 2 9 6 3 13 10 7 4 14 11 8 15 12 16 backslash输出： 4 3
[JWFD开源工作流设计]工作流跳跃模式开发关键点(今日更新) comsci 工作流
既然是做开源软件的,我们的宗旨就是给大家分享设计和代码,那么现在我就用很简单扼要的语言来透露这个跳跃模式的设计原理大家如果用过JWFD的ARC-自动运行控制器,或者看过代码,应该知道在ARC算法模块中有一个函数叫做SAN(),这个函数就是ARC的核心控制器,要实现跳跃模式,在SAN函数中一定要对LN链表数据结构进行操作,首先写一段代码,把
redis常见使用 cuityang redis 常见使用
redis 通常被认为是一个数据结构服务器，主要是因为其有着丰富的数据结构 strings、map、 list、sets、 sorted sets 引入jar包 jedis-2.1.0.jar (本文下方提供下载) package redistest; import redis.clients.jedis.Jedis; public class Listtest
配置多个redis dalan_123 redis
配置多个redis客户端 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&quo
attrib命令 dcj3sjt126com attr
attrib指令用于修改文件的属性.文件的常见属性有:只读.存档.隐藏和系统. 只读属性是指文件只可以做读的操作.不能对文件进行写的操作.就是文件的写保护. 存档属性是用来标记文件改动的.即在上一次备份后文件有所改动.一些备份软件在备份的时候会只去备份带有存档属性的文件.
Yii使用公共函数 dcj3sjt126com yii
在网站项目中，没必要把公用的函数写成一个工具类，有时候面向过程其实更方便。在入口文件index.php里添加 require_once('protected/function.php'); 即可对其引用，成为公用的函数集合。 function.php如下： <?php /** * This is the shortcut to D
linux 系统资源的查看（free、uname、uptime、netstat） eksliang netstat linux uname linux uptime linux free
linux 系统资源的查看转载请出自出处：http://eksliang.iteye.com/blog/2167081 http://eksliang.iteye.com 一、free查看内存的使用情况语法如下： free [-b][-k][-m][-g] [-t] 参数含义 -b:直接输入free时，显示的单位是kb我们可以使用b(bytes),m
JAVA的位操作符 greemranqq 位运算 JAVA位移 <<>>>
最近几种进制，加上各种位操作符，发现都比较模糊，不能完全掌握，这里就再熟悉熟悉。 1.按位操作符：按位操作符是用来操作基本数据类型中的单个bit,即二进制位，会对两个参数执行布尔代数运算，获得结果。与（&）运算： 1&1 = 1, 1&0 = 0, 0&0 &
Web前段学习网站 ihuning Web
Web前段学习网站菜鸟学习：http://www.w3cschool.cc/ JQuery中文网：http://www.jquerycn.cn/ 内存溢出：http://outofmemory.cn/#csdn.blog http://www.icoolxue.com/ http://www.jikexue
强强联合：FluxBB 作者加盟 Flarum justjavac r
原文：FluxBB Joins Forces With Flarum作者：Toby Zerner译文：强强联合：FluxBB 作者加盟 Flarum译者：justjavac FluxBB 是一个快速、轻量级论坛软件，它的开发者是一名德国的 PHP 天才 Franz Liedke。FluxBB 的下一个版本(2.0)将被完全重写，并已经开发了一段时间。FluxBB 看起来非常有前途的，
java统计在线人数（session存储信息的） macroli java Web
这篇日志是我写的第三次了前两次都发布失败！郁闷极了！由于在web开发中常常用到这一部分所以在此记录一下，呵呵，就到备忘录了！我对于登录信息时使用session存储的，所以我这里是通过实现HttpSessionAttributeListener这个接口完成的。 1、实现接口类，在web.xml文件中配置监听类，从而可以使该类完成其工作。 public class Ses
bootstrp carousel初体验快速构建图片播放 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
img{ border: 1px solid white; box-shadow: 2px 2px 12px #333; _width: expression(this.width > 600 ? "600px" : this.width + "px"); _height: expression(this.width &
SparkSQL读取HBase数据，通过自定义外部数据源 superlxw1234 spark sparksql sparksql读取hbase sparksql外部数据源
关键字：SparkSQL读取HBase、SparkSQL自定义外部数据源前面文章介绍了SparSQL通过Hive操作HBase表。 SparkSQL从1.2开始支持自定义外部数据源(External DataSource)，这样就可以通过API接口来实现自己的外部数据源。这里基于Spark1.4.0，简单介绍SparkSQL自定义外部数据源，访
Spring Boot 1.3.0.M1发布 wiselyman spring boot
Spring Boot 1.3.0.M1于6.12日发布，现在可以从Spring milestone repository下载。这个版本是基于Spring Framework 4.2.0.RC1,并在Spring Boot 1.2之上提供了大量的新特性improvements and new features。主要包含以下： 1.提供一个新的sprin

中国大学MOOC-人工智能实践：Tensorflow笔记-课程笔记 Chapter6

Chapter 6 全连接网络实践

关于上节课留下来的断点续训问题

6.1 输入手写数字图片输出识别结果

6.2 制作数据集

你可能感兴趣的:(机器学习)