chadqiu

tensorflow2.0学习笔记

1、Tensor 张量=多维数组

2、常量 tf.constant(12,(tf.float32))

3、常用的精度类型有 tf.int16、tf.int32、tf.int64、tf.float16、tf.float32、 tf.float64,bool 等

4、读取精度： a.dtype()

5、类型转换 ：tf.cast(a,tf.float32)

6、待优化张量(变量）：aa=tf.Variable(a,(name="aa")), name，trainable 等属性

7、创建全 0 或全 1 张量：tf.zeros([5]),tf.ones([])

8、通过 tf.zeros_like, tf.ones_like 可以方便地新建与某个张量 shape 一致，且内容为全 0 或

全 1 的张量。

9、通过 tf.fill(shape, value)可以创建全为自定义数值 value 的张量，形状由 shape 参数指

定。:b=tf.fill([2,3],-1)

10、创建已知分布的张量：b=tf.random.normal([2,3],(mean=1,stddev=2)) #正态

b=tf.random.uniform([2,3],maxval=100) #均匀

b=tf.range(10,delta=2) 0~10 步长2

11、切片：x[start: end: step],start默认0，可随意省略x[::],x[0,::]==x[0]，::可简写为:，[8:0:-1]

12、改变视图：x=tf.reshape(x,[2,4,4,3]) ， shape=(2, 4, 4, 3)

改变视图操作的默认前提是存储不需要改变，否则改变视图操作就是非法的

13、 x.ndim,x.shape # 获取张量的维度数和形状列表

14、插入删除维度tf.expand_dims(x, axis)可在指定的 axis 轴前可以插入一个新的维度， x = tf.squeeze(x, axis=0) # 删除图片数量维度，只能变维度为1的

15、 tf.tile(b, multiples=[2,1])即可在 axis=0 维度复制 1 次，在 axis=1 维度不复制标量

16、Broadcasting 称为广播机制(或自动扩展机制)，它是一种轻量级的张量复制手段，在逻辑上扩展张量数据的形状：直接将 shape 为[2,3]与[3]的矩阵相加也是合法，因为它自动调用tf.broadcast_to(x, new_shape)，将两者 shape 扩张为相同的[2,3]

17、数学运算：+,-,*,/,//,%,**(乘方、开方分数),也可平方 tf.square(x)开平tf.sqrt(x)

，e^x=tf.exp(x)，lnx=tf.math.log(x)，其他底用换底公式，矩阵相乘@或 tf.matmul(a, b)

18、拼接：tf.concat([a,b],axis=0)，非合并维度的长度必须一致

19、产生新维度：tf.stack([a,b],axis=0)，需要所有待合并的张量 shape 完全一致

20、分割： tf.split(x, num_or_size_splits=10, axis=0)

tf.split(x, num_or_size_splits=[4,2,2,2] ,axis=0)

21、均方差误差函数：loss=tf.keras.losses.mse(y,b)，

22、向量范数：L0 范数‖x‖0 定义为xi中非零元素的个数

L1 范数：对值之和 ‖x‖1 = ∑|xi |

L2 范数:平方和，再开根号: ‖x‖2 =√ ∑|xi |^2

∞ −范数: 绝对值的最大值: ‖x‖∞ = max(|xi|)

矩阵和张量的范数等价于将矩阵和张量打平成向量后计算。 tf.norm(x, ord)

ord 指定为 1、2 时计算 L1、L2 范数，指定为 np.inf 时计算∞−范数

23、最值、均值、和：tf.reduce_max、tf.reduce_min、tf.reduce_mean、tf.reduce_sum，

例：x = shape([4,10]) ，tf.reduce_max(x,axis=1) # 第二维度上的最大值

tf.argmax(x, axis)和 tf.argmin(x, axis)求在 axis 轴上，x 的最大值、最小值所在的索引号。

24、张量比较：

tf.equal(a, b)可以比较这 2 个张量是否相等，返回布尔类型的张量比较结果

tf.math.greater a > b

tf.math.less a < b

tf.math.greater_equal a ≥ b

tf.math.less_equal a ≤b

tf.math.not_equal a ≠b

tf.math.is_nan a = nan

25、填充: tf.pad(x, paddings),paddings=[[0,0],[2,1]]表示第一个维度不填充，第二个

维度左边(起始处)填充两个单元，右边(结束处)填充一个单元

26、数据限幅: tf.maximum(x, a)下限幅，即x∈ [a,+∞)；tf.minimum(x, a)上限幅

relu(x): tf.maximum(x,0.), tf.clip_by_value(2,7) 上下限幅为2-7

27、高级操作：tf.gather(x,[2,4],axis=2) # 收集第 3，5 科目的成绩

tf.gather_nd(x,[[1,1],[2,2],[3,3]]) #多维坐标采样多个点

tf.boolean_mask(x,mask=[True, False,False,True],axis=0)#掩码采样第1,4号

tf.where(cond, a, b)=cond==True? a:b tf.where(x>0)#所有正数的索引

tf.scatter_nd(indices, updates, shape)函数可以高效地刷新张量的部分数据

tf.meshgrid 函数可以方便地生成二维网格的采样点坐标，方便可视化等应用场合，z=sin(x^2+y^2)/(x^2+y^2)

27、经典数据集：Boston Housing，波士顿房价趋势数据集，用于回归模型训练与测试。

❑ CIFAR10/100，真实图片数据集，用于图片分类任务。

❑ MNIST/Fashion_MNIST，手写数字图片数据集，用于图片分类任务。

❑ IMDB，情感分类任务数据集，用于文本分类任务。

通过 datasets.xxx.load_data()函数即可实现经典数据集的自动加载

(x, y), (x_test, y_test) = datasets.mnist.load_data()

tf.data.Dataset.from_tensor_slices((x, y)) # 构建 Dataset 对象才好利用

28、随机打散：Dataset.shuffle(buffer_size)设置 Dataset 对象随机打散数据之间的顺序

buffer_size 参数指定缓冲池的大小，一般设置为一个较大的常数即可,

例：db=train_db.shuffle(10000)，db=db.step1().step2().step3.()遍历

29、批训练：为了利用显卡的并行计算能力，train_db = train_db.batch(128) # 设置批训练，batch size 为 128

30、预处理：从 keras.datasets 中加载的数据集的格式大部分情况都不能直接满足模型的输入要求，因此需要根据用户的逻辑自行实现预处理步骤。例如：

train_db = train_db.map(preprocess)# 预处理函数实现在 preprocess 中，传入函数名即可

def preprocess(x, y): # 自定义的预处理函数

# 调用此函数时会自动传入 x,y 对象，shape 为[b, 28, 28], [b]

# 标准化到 0~1

x = tf.cast(x, dtype=tf.float32) / 255.

x = tf.reshape(x, [-1, 28*28]) # 打平

y = tf.cast(y, dtype=tf.int32) # 转成整型张量

y = tf.one_hot(y, depth=10) # one-hot 编码

# 返回的 x,y 将替换传入的 x,y 参数，从而实现数据的预处理功能

return x,y

31、循环训练：for step, (x,y) in enumerate(train_db): # 迭代数据集对象，带 step 参数

或for x,y in train_db: # 迭代数据集对象，

每次返回的 x 和 y 对象即为批量样本和标签，通过多个 step 来完成整个训练集的一次迭代，叫做一个 Epoch。在实际训练时，通常需要对数据集迭代多个 Epoch 才能取得较好地训练效果。例：train_db = train_db.repeat(20) # 数据集迭代 20 遍才终止

或：for epoch in range(20): # 训练 Epoch 数

for step, (x,y) in enumerate(train_db): # 迭代 Step 数

# training...

with tf.GradientTape() as tape: # 梯度记录器， gradient()方法自动求解参数的梯度

32、网络层：σ(x@w+b)或 layers.Dense(units, activation) ，units输出数，输入数自动赋

例：from tensorflow.keras import layers # 导入层模块

fc = layers.Dense(512, activation=tf.nn.relu) # 创建全连接层，指定输出节点数和激活函数

h1 = fc(x)

fc.kernel # 获取 Dense 类的权值矩阵

fc.bias # 获取 Dense 类的偏置向量

fc.trainable_variables # 返回待优化参数列表（包含上两个），fc.non_trainable_variables

fc.variables # 返回所有参数列表

33、层方式实现：通过 Sequential 容器

from tensorflow.keras import layers,Sequential # 导入 Sequential 容器

model = Sequential([ # 通过 Sequential 容器封装为一个网络类

layers.Dense(256, activation=tf.nn.relu) , # 创建隐藏层 1

layers.Dense(128, activation=tf.nn.relu) , # 创建隐藏层 2

layers.Dense(64, activation=tf.nn.relu) , # 创建隐藏层 3

layers.Dense(10, activation=None) , # 创建输出层

])

out = model(x) # 前向计算得到输出

34、激活函数：Sigmoid 函数(Logistic)：Sigmoid(x)=1/(1+exp(-x)) ,tf.nn.sigmoid(x)

ReLU(REctified Linear Unit，修正线性单元), max(0,x),tf.nn.relu(x)

LeakyReLU:克服x<0时梯度弥散现象

p=alpha为用户自行设置的某较小数值的超参数，如 0.02 等，tf.nn.leaky_relu(x, alpha=0.1)

Tanh 函数能够将x“压缩”到(−1,1)

35、输出层设计：常见的几种输出类型包括：实数空间，[0,1],[-1,1]等

普通实数空间：输出层可不加激活函数，误差可采用均方差误差函数 MSE等

[0,1]区间：激活函数Sigmoid 等

[0,1] 区间且和为1：Softmax 函数不仅可以将输出值映射到[0,1]区间，还满足所有的输出值之和为 1 的特性，tf.nn.softmax(z)。Softmax 函数也可以作为网络层类使用，layers.Softmax(axis=-1)可添加 Softmax 层，其中 axis 指定需要进行计算的维度。

为解决数值溢出稳定性问题，可将 Softmax 与交叉熵损失函数同时实现，tf.keras.losses.categorical_crossentropy(y_true, y_pred, from_logits=False)，其中 y_true 代表了

One-hot 编码后的真实标签，y_pred 表示网络的预测值，当 from_logits 设置为 True 时，

y_pred 表示须为未经过 Softmax 函数的变量 z，一般都选True

例：loss = keras.losses.categorical_crossentropy(y_onehot,z,from_logits=True)

loss = tf.reduce_mean(loss) # 计算平均交叉熵损失

或：criteon = keras.losses.CategoricalCrossentropy(from_logits=True)

loss = criteon(y_onehot,z) # 计算损失

36、误差计算：均方差、交叉熵、KL 散度、Hinge Loss 函数等，均方差回归，交叉熵分类

均方差(Mean Squared Error，简称 MSE)

例：loss = keras.losses.MSE(y_onehot, o) # 计算均方差

loss = tf.reduce_mean(loss) # 计算 batch 均方差

或：criteon = keras.losses.MeanSquaredError()

loss = criteon(y_onehot,o) # 计算 batch 均方差

交叉熵：熵越大，代表不确定性越大也可用其他底数log计算

交叉熵

KL 散度，交叉熵可以很好地衡量 2 个分布之间的“距离”

p采用 One-hot 编码时：只与真实的类别上概率有关

37、模型装配、训练与测试：在训练网络时，一般的流程是通过前向计算获得网络的输出值，再通过损失函数计算网络误差，然后通过自动求导工具计算梯度并更新，同时间隔性地测试网络的性能。

37.1、模型装配： keras.layers.Layer 类，定义了网络层的一些常见功能，如添加权值、管理权值列表等，keras.Model，除了具有 Layer 类的功能，还添加了保存模型、加载模型、训练与测试模型等便捷功能。Sequential 也是 Model 的子类

# 创建 5 层的全连接网络

network = Sequential([layers.Dense(256, activation='relu'),

layers.Dense(128, activation='relu'),

layers.Dense(64, activation='relu'),

layers.Dense(32, activation='relu'),

layers.Dense(10)])

network.build(input_shape=(4, 28*28))

network.summary()

from tensorflow.keras import optimizers,losses # 导入优化器，损失函数模块

# 采用 Adam 优化器，学习率为 0.01;采用交叉熵损失函数，包含 Softmax

network.compile(optimizer=optimizers.Adam(lr=0.01),

loss=losses.CategoricalCrossentropy(from_logits=True),

metrics=['accuracy'] # 设置测量指标为准确率

)

37.2模型训练：fit()函数， train_db 为 tf.data.Dataset 对象

# 训练集train_db，验证集val_db,训练 5个epochs，每2个epoch 验证一次

# 返回训练轨迹信息保存在 history 对象中

history = network.fit(train_db, epochs=5, validation_data=val_db,validation_freq=2)

history.history # 打印训练记录，字典对象，包含了训练过程中的 loss、测量指标等

37.3模型测试：通过 Model.predict(x)方法即可完成模型的预测

x,y = next(iter(db_test)) # 加载一个 batch 的测试数据

print('predict x:', x.shape) # 打印当前 batch 的形状

out = network.predict(x) # 模型预测，预测结果保存在 out 中

print(out)

或：network.evaluate(db_test) # 只可模型测试，测试在 db_test 上的性能表现

38、模型保存与加载：

（1）张量方式：network.save_weights('weights.ckpt') # 保存模型的所有张量数据

network.load_weights('weights.ckpt') # 从参数文件中读取数据并写入当前网络

网络方式：network.save('model.h5') # 保存模型结构与模型参数到文件

network = keras.models.load_model('model.h5') # 从文件恢复网络结构与网络参数

SavedModel方式：将模型部署到移动端和网页端等其他平台时，有平台无关性

tf.saved_model.save(network, 'model-savedmodel') # 保存模型结构与模型参数到文件

network = tf.saved_model.load('model-savedmodel') # 从文件恢复网络结构与网络参数

# 准确率计量器

acc_meter = metrics.CategoricalAccuracy()

for x,y in ds_val: # 遍历测试集

pred = network(x) # 前向计算

acc_meter.update_state(y_true=y, y_pred=pred) # 更新准确率统计

print("Test Accuracy:%f" % acc_meter.result()) # 打印准确率

39、新建测量器：在 keras.metrics 模块中，提供了如平均值Mean 类，统

计准确率的 Accuracy 类，统计余弦相似度的 CosineSimilarity 类等。

loss_meter = metrics.Mean() # 新建平均测量器，适合 Loss 数据

# 记录采样的数据，通过 float()函数将张量转换为普通数值

loss_meter.update_state(float(loss)) #放置在每个 Batch 运算结束后

print(step, 'loss:', loss_meter.result()) # 打印统计期间的平均 loss

loss_meter.reset_states() # 打印完后清零测量器，由于测量器会统计所有历史记录数据

准确率实例：acc_meter = metrics.Accuracy() # 创建准确率测量器

# [b, 784] => [b, 10]，网络输出值

out = network(x)

# [b, 10] => [b]，经过 argmax 后计算预测值

pred = tf.argmax(out, axis=1)

pred = tf.cast(pred, dtype=tf.int32)

# 根据预测值与真实值写入测量器

acc_meter.update_state(y, pred)

# 读取统计结果

print(step, 'Evaluate Acc:', acc_meter.result().numpy())

acc_meter.reset_states() # 清零测量器

40、可视化：TensorBoard

# 创建监控类，监控数据将写入 log_dir 目录

summary_writer = tf.summary.create_file_writer(log_dir)

#监控误差数据和可视化图片数据

with summary_writer.as_default(): # 写入环境

tf.summary.scalar('test-acc', float(total_correct/total),step=step)# 写入测试准确率

# 可视化测试用的图片，设置最多可视化 9 张图片

tf.summary.image("val-onebyone-images:", val_images,max_outputs=9, step=step)

#查看张量数据的直方图分布，以及通过 tf.summary.text 打印文本信息

with summary_writer.as_default():

# 当前时间戳 step 上的数据为 loss，写入到 ID 位 train-loss 对象中

tf.summary.scalar('train-loss', float(loss), step=step)

# 可视化真实标签的直方图分布

tf.summary.histogram('y-hist',y, step=step)

# 查看文本信息

tf.summary.text('loss-text',str(float(loss)))

41、过拟合：41.1提前停止：数据集分为训练集、验证集和测试集，验证集连续n次下降

41.2模型设计：减少层数、阶数等减少容量

41.3正则化惩罚项、加权范数

41.4Dropout： tf.nn.dropout(x, rate)，model.add(layers.Dropout(rate=0.5))

41.5数据增强：缩放：x = tf.image.resize(x, [244, 244])

旋转：x = tf.image.rot90(x,k) #按逆时针方式旋转 k 个 90 度

翻转： x = tf.image.random_flip_left_right(x) # 随机水平翻转

x = tf.image.random_flip_up_down(x) # 随机竖直翻转

裁剪：x = tf.image.random_crop(x, [224,224,3]) #稍放大后裁剪

生成数据、添加高斯噪声、变换视角、随机擦除等

42、卷积大小关系：卷积核的大小k，步长s，上下填充数量pℎ相同，

输入X的高宽ℎ，向下取整。通过设置padding='SAME'、strides=1 可以直接得到输入、输出同大小的卷积层，当s> 时，padding='SAME'将使得输出高、宽将成1/s倍地减少

out = tf.nn.conv2d(x,w,strides=3,padding='SAME')

43、卷积层类： #创建了4个3×3大小的卷积核的卷积层，步长为1，padding方案为'SAME'

layer = layers.Conv2D(4,kernel_size=3,strides=1,padding='SAME')

#卷积核高宽、步长行列方向不等，kernel_size参数为tuple格式(kh,kw)，#strides参数为(Sh,Sw)

layer = layers.Conv2D(4,kernel_size=(3,4),strides=(2,1),padding='SAME')

例：layer = layers.Conv2D(4,kernel_size=3,strides=1,padding='SAME')

out = layer(x) # 前向计算

out.shape # 输出张量的 shape

layer.trainable_variables # 返回所有待优化张量列表

44、转置卷积运算：xx = tf.nn.conv2d_transpose(out, w, strides=2,padding='VALID',

output_shape=[1,5,5,1])

转置卷积矩阵角度：tf.nn.conv2d_transpose(out, w, strides=1, padding='VALID',

output_shape=[1,4,4,1])

在使用 tf.nn.conv2d_transpose 进行转置卷积运算时，需要额外手动设置输出的高宽。

tf.nn.conv2d_transpose 并不支持自定义 padding 设置，只能设置为 VALID 或者 SAME 。

当设置 padding=’VALID’时，输出大小表达为： o = (i−1)s +k

当设置 padding=’SAME’时，输出大小表达为：o =i*s

# 创建转置卷积类

layer = layers.Conv2DTranspose(1,kernel_size=3,strides=1,padding='VALID')

迁移学习模型性能

今日行情明日机会——20250321 人大博士的交易之路人工智能区块链数学建模数据挖掘分类涨停回马枪大数据
后续投资机会分析结合2025年3月21日盘面数据（涨停56家，跌停31家），市场呈现结构性分化行情，海洋经济成为绝对主线，机器人概念局部活跃，人工智能表现较弱。以下是具体方向与策略建议：1.海洋经济（核心主线，政策+事件驱动）核心逻辑：板块23家涨停，梯队完整（七板至一板），神开股份（七板）打开高度，叠加海洋资源开发、碳中和政策（如海上风电、深海装备）催化，资金深度介入。大连重工（三板，海洋工程装
人工智能革命：技术演进图谱与人类文明重构路径 A达峰绮人工智能重构经验分享图形绘制数据处理 AI
当GPT-4在2023年3月通过注册会计师考试时，其财务分析模块展现的推理能力已超越85%的人类考生。这个标志性事件背后，折射出人工智能正在突破认知型工作的最后防线。我们正在见证的，不仅是技术迭代，更是人类文明范式的根本性转变。一、算力奇点降临：AI基础设施的指数级进化量子计算与神经形态芯片的融合正在重塑算力边界。IBM最新数据显示，其量子体积（QuantumVolume）从2020年的64跃升至
比较分析：Windsurf、Cody、Cline、Roo Cline、Copilot 和通义灵码张3蜂开源编程语言与开发技术选型与架构设计 copilot c#AI编程
随着人工智能技术的快速发展，开发者工具变得越来越智能化，特别是在代码生成、辅助编程等领域，市面上涌现了多种AI驱动的工具。本文将从开源性、集成能力、功能覆盖范围、支持的编程语言、生态兼容性、成本、学习曲线、响应速度、离线支持以及与.NETCore的适配性等十个维度对以下几种产品进行比较：Windsurf、Cody、Cline、RooCline、Copilot和通义灵码。1.开源性Windsurf:
使用Aim追踪LangChain执行 bavDHAUO langchain python
在现代人工智能应用中，调试和可视化自动化工作流变得越来越重要，Aim正是为此而生。通过Aim，你可以轻松地追踪LangChain中语言模型(LLM)和工具的输入输出，以及代理的动作，从而在执行过程中快速定位和解决问题。此外，Aim还支持并排比较多个执行流程，使之成为调试中的得力助手。Aim是一个完全开源的项目，你可以在GitHub上找到更多关于Aim的信息。在本文中，我们将展示如何启用和配置Aim
利用Python和深度学习方法实现手写数字识别的高精度解决方案——从数据预处理到模型优化的全流程解析快撑死的鱼 Python算法精解 python 深度学习开发语言
利用Python和深度学习方法实现手写数字识别的高精度解决方案——从数据预处理到模型优化的全流程解析在人工智能的众多应用领域中，手写数字识别是一项经典且具有重要实际应用价值的任务。随着深度学习技术的飞速发展，通过构建和训练神经网络模型，手写数字识别的精度已经可以达到99%以上。本文将以Python为主要编程语言，结合深度学习的核心技术，详细解析手写数字识别的实现过程，并探讨如何进一步优化模型以提高
腾讯云大模型知识引擎与DeepSeek：打造懒人专属的谷歌浏览器翻译插件大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 腾讯云云计算
摘要：随着人工智能技术的飞速发展，越来越多的前沿技术和工具已走入日常生活。翻译工具作为跨语言沟通的桥梁，一直处于技术创新的风口浪尖。本文探讨了腾讯云大模型知识引擎与DeepSeek结合谷歌浏览器插件的可能性，旨在为用户提供一种便捷、高效的翻译体验。通过应用深度学习、自然语言处理和知识图谱技术，该插件不仅能实时翻译网页内容，还能根据上下文进行智能推荐，实现精准的语境转换。本文将详细阐述其设计思路、技
DeepSeek 模型未来怎么走？技术创新、行业落地全解析！网罗开发 AI 大模型人工智能人工智能职场和发展
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
分享12个国内AI对话聊天的免费网站（含DeepSeek大模型）码上飞扬人工智能语言模型 DeepSeek
在人工智能领域，基于对话的语言模型已成为当前研究的热点，其中以ChatGPT为代表的模型凭借其卓越的语言理解与交互能力备受瞩目。为帮助用户更好地选择和使用这类AI工具，本文将介绍12个国内可直接体验对话聊天功能的平台，为用户提供实用参考。1、腾讯元宝地址：https://hunyuan.tencent.com/bot/chat腾讯混元大模型是由腾讯全链路自研的通用大语言模型，拥有超千亿参数规模，预
《今日AI-人工智能-编程日报》-源自2025年3月21日小亦编辑部人工智能
一、AI编程领域最新动态AI编程工具崛起，程序员职业面临挑战Anthropic首席执行官DarioAmodei预言，未来一年内，90%的代码将由AI生成，传统程序员的工作可能被大幅替代。最新发布的AI编程模型（如Claude3.7、Sonnet3.7）在初级开发评估中表现优异，得分率超过60%，部分模型甚至在全球程序员排名中位列前0.1%。字节跳动的Trae海外版接入Claude3.7和GPT-4
《今日AI-人工智能-编程日报》-源自2025年3月19日小亦编辑部每日AI-人工智能-编程日报人工智能
1.豆包AI编程功能迎来三项重磅升级豆包平台今日宣布其AI编程功能迎来三项重要升级，包括：HTML实时预览：支持用户在编写HTML代码时实时查看网页效果，显著提升前端开发效率，尤其适用于小游戏和网页制作。Python代码直接运行与一键修复：用户可直接运行Python代码，并在出错时一键修复，极大降低了编程门槛，提升了开发效率。生成完整项目：新增生成完整项目的功能，帮助用户快速创建应用程序，缩短开发
普通人学习AI应该如何入手？2025年最新AI大模型学习路线+全套学习资料，适合新手小白！小城哇哇人工智能学习大数据语言模型 AI大模型 agi ai
引言随着人工智能（AI）技术的飞速发展，越来越多的人开始意识到掌握这项技能的重要性。然而，对于许多没有编程背景或数学基础的人来说，进入AI领域似乎是一个遥不可及的梦想。但实际上，通过合理的规划和适当的学习资源，任何人都可以逐步掌握AI的核心知识，并应用到实际工作中去。本文将为普通读者提供一份详细的2025年最新AI大模型学习路线图，并附带一套完整的自学资料，帮助您从零基础起步，顺利开启AI学习之旅
知识蒸馏：让大模型“瘦身“而不失智慧的魔术一休哥助手人工智能人工智能
引言：当AI模型需要"减肥"在人工智能领域，一个有趣的悖论正在上演：大模型的参数规模每年以10倍速度增长，而移动设备的算力却始终受限。GPT-4的1750亿参数需要价值500万美元的GPU集群运行，但现实中的智能设备可能只有指甲盖大小。这种矛盾催生了一项神奇的技术——知识蒸馏（KnowledgeDistillation），它就像给AI模型进行"脑外科手术"，将庞然大物的智慧浓缩到轻量模型中。第一章
TensorFlow深度学习实战项目：从入门到精通点我头像干啥 Ai 深度学习 tensorflow 人工智能
引言深度学习作为人工智能领域的一个重要分支，近年来取得了显著的进展。TensorFlow作为Google开源的深度学习框架，因其强大的功能和灵活的架构，成为了众多开发者和研究者的首选工具。本文将带领大家通过一个实战项目，深入理解TensorFlow的使用方法，并掌握深度学习的基本流程。1.TensorFlow简介1.1TensorFlow是什么？TensorFlow是一个开源的机器学习框架，由Go
使用大语言模型API在AI应用中的实现 qq_37836323 人工智能语言模型自然语言处理 python
随着人工智能技术的迅速发展，大语言模型（LLM）在自然语言处理（NLP）领域的应用越来越广泛。本文将介绍如何使用大语言模型API来实现一些基础的AI应用，并提供一个简单的demo代码，帮助大家更好地理解和使用这些技术。大语言模型API简介大语言模型（如GPT-4）能够理解和生成类似人类的文本。这些模型可以应用于各种任务，包括文本生成、语言翻译、情感分析、对话系统等。为了方便国内用户访问这些强大的模
【深度学习】 PyTorch一文详解 Nerous_ 深度学习深度学习 pytorch 人工智能机器学习 python
“PyTorchisadeeplearningframeworkthatprioritizessimplicityandflexibility,makingitthego-tochoiceforbothresearchersanddevelopers.”—Anonymous1.PyTorch简介1.1PyTorch的背景与发展PyTorch是由Facebook人工智能研究院（FAIR）开发的一个开
存算一体与存算分离：架构设计的深度解析与实现方案克里斯蒂亚诺罗纳尔多阿维罗大数据数据库
随着数据量的不断增大和对计算能力的需求日益提高，存算一体作为一种新型架构设计理念，在大数据处理、云计算和人工智能等领域正逐步引起广泛关注。在深入探讨存算一体之前，我们需要先了解存储和计算的基本概念，以及存算分离和存算一体之间的区别。什么是存算一体？存算一体，顾名思义，是将数据存储与计算资源紧密结合，形成一个统一的架构。在这种架构下，存储和计算不仅在物理层面上结合，更在架构设计上深度融合。具体来说，
自动语音识别（ASR）：技术、应用与未来 ajie1117 语音识别人工智能
自动语音识别（ASR）：技术、应用与未来1.ASR简介自动语音识别（ASR，AutomaticSpeechRecognition）是一种将语音转换为文本的技术。它利用人工智能（AI）、深度学习和自然语言处理（NLP）技术来识别和理解人类的语言，使计算机能够与人类进行更自然的交互。2.ASR的工作原理ASR的核心流程通常包括以下几个步骤：语音信号采集：通过麦克风或其他设备获取音频数据。预处理：去除噪
30秒生成电子合同：B2B系统+AI引擎缩短80%交易周期|数商云数商云网络 B2B系统数字化电商平台人工智能大数据云计算数据库运维 java spring
引言在数字经济时代，B2B（Business-to-Business）电子商务正在以前所未有的速度改变着企业的运营模式。随着交易量的不断攀升，传统的合同生成和审核流程逐渐成为制约交易效率的瓶颈。然而，随着人工智能（AI）技术的飞速发展，结合B2B系统的智能化升级，我们正见证一场合同生成效率的革命。本文将深入探讨“30秒生成电子合同：B2B系统+AI引擎缩短80%交易周期”这一创新模式，解析其背后的
【北京迅为】iTOP-RK3568开发板OpenHarmony系统南向驱动开发UART接口运作机制迅为电子 RK3568开发板 RK3568开发板 OpenHarmony
瑞芯微RK3568芯片是一款定位中高端的通用型SOC，采用22nm制程工艺，搭载一颗四核Cortex-A55处理器和MaliG522EE图形处理器。RK3568支持4K解码和1080P编码，支持SATA/PCIE/USB3.0外围接口。RK3568内置独立NPU，可用于轻量级人工智能应用。RK3568支持安卓11和linux系统，主要面向物联网网关、NVR存储、工控平板、工业检测、工控盒、卡拉OK
大学期间如何学习利用AI der丸子吱吱吱学习人工智能
一、引言人工智能（AI）是当今世界技术发展的重要方向，它已经渗透到医疗、金融、交通、娱乐等各个领域。随着AI技术的快速发展，它不仅改变了我们的生活，也带来了巨大的职业机会。然而，面对如此广阔的领域，作为大学生，如何在本科阶段有效地学习和利用AI，成了许多同学的困惑。本文将详细介绍大学生在本科阶段如何通过合理的学习路线、方法和工具，逐步掌握AI的核心技术，并为日后进入AI行业打下坚实的基础。通过这篇
全面掌握Python：从安装到基础再到进阶的系统学习之路（附代码，建议新手收藏） der丸子吱吱吱 python 学习开发语言新手入门代码
Python，作为一种现代化的高级编程语言，因其简洁易懂的语法和强大的功能，成为了数据科学、人工智能、Web开发等多个领域的首选语言。在这篇文章中，我们将从大学课本的结构来详细介绍Python，帮助大家从零基础开始，逐步深入掌握Python的各个方面。目录第一章：Python简介与安装1.1Python语言概述1.2安装Python1.3Python的开发环境1.4第一个Python程序第二章：基
yum install locate出现Error: Unable to find match: locate解决方案爱编程的喵喵 Linux解决方案 linux locate yum 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了yuminstalllocate出现
【人工智能机器学习基础篇】——深入详解无监督学习之降维：PCA与t-SNE的关键概念与核心原理猿享天开人工智能数学基础专讲人工智能机器学习无监督学习降维
深入详解无监督学习之降维：PCA与t-SNE的关键概念与核心原理在当今数据驱动的世界中，数据维度的增多带来了计算复杂性和存储挑战，同时也可能导致模型性能下降，这一现象被称为“维度诅咒”（CurseofDimensionality）。降维作为一种重要的特征提取和数据预处理技术，旨在通过减少数据的维度，保留其主要信息，从而简化数据处理过程，并提升模型的性能。本文将深入探讨两种广泛应用于无监督学习中的降
模型上下文协议 (MCP)是什么？Model Context Protocol 需要你了解一下同学小张学习 AIGC AI-native agi gpt 开源协议
大家好，我是同学小张，+v:jasper_8017一起交流，持续学习AI大模型应用实战案例，持续分享，欢迎大家点赞+关注，订阅我的大模型专栏，共同学习和进步。在人工智能领域，ModelContextProtocol（MCP）正逐渐成为连接AI模型与各类数据源及工具的重要标准。MCP究竟为何物？它又将如何改变AI应用的开发与使用？文章目录0.概念1.MCP的总体架构2.为何使用MCP？3.我的理解4
生成式对抗网络在人工智能艺术创作中的应用与创新研究辛迎蕌人工智能
摘要本文深入探究生成式对抗网络（GAN）在人工智能艺术创作领域的应用与创新。通过剖析GAN核心原理，阐述其在图像、音乐、文学等艺术创作中的实践，分析面临的挑战与创新方向，呈现GAN对艺术创作模式的变革，为理解人工智能与艺术融合发展提供全面视角。一、引言在人工智能与艺术深度融合的时代浪潮中，生成式对抗网络（GAN）作为一项突破性技术，为艺术创作带来了全新的可能性。它打破传统创作边界，以独特的对抗学习
知识图谱在人工智能语义理解与推理中的关键作用及发展研究 @王威& 人工智能
摘要本文聚焦知识图谱，深入剖析其在人工智能语义理解与推理中的核心作用。阐述知识图谱的构建原理、表示方法，分析其在自然语言处理、智能问答系统、推荐系统等多领域助力语义理解与推理的应用，探讨面临的挑战并展望未来发展方向，全面呈现知识图谱对人工智能发展的重要价值与深远影响。一、引言在人工智能追求更精准理解和处理人类语言与知识的进程中，知识图谱成为关键技术。它以结构化形式组织海量知识，揭示实体间复杂关系，
Flink启动任务 swg321321 flink 大数据
Flink以本地运行作为解读例如：第一章Python机器学习入门之pandas的使用提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录Flink前言StreamExecutionEnvironmentLocalExecutorMiniClusterStreamGraph二、使用步骤1.引入库2.读入数据总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发
计算机专业毕业设计题目推荐（新颖选题）本科计算机人工智能专业相关毕业设计选题大全✅ 会写代码的羊毕设选题课程设计人工智能毕业设计毕设题目毕业设计题目 ai AI编程
文章目录前言最新毕设选题（建议收藏起来）本科计算机人工智能专业相关的毕业设计选题毕设作品推荐前言2025全新毕业设计项目博主介绍：✌全网粉丝10W+,CSDN全栈领域优质创作者，博客之星、掘金/华为云/阿里云等平台优质作者。技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、大数据、机器学习等设计与开发。主要内容：免费功能
AI人工智能 Agent：在赋能传统行业中的应用 AI天才研究院计算 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AI人工智能Agent：在赋能传统行业中的应用1.背景介绍1.1人工智能的发展历程1.1.1人工智能的起源与发展1.1.2人工智能的三次浪潮1.1.3人工智能的现状与挑战1.2传统行业面临的困境1.2.1效率低下1.2.2成本高企1.2.3决策滞后1.3人工智能赋能传统行业的必要性1.3.1提高效率1.3.2降低成本1.3.3优化决策2.核心概念与联系2.1人工智能Agent的定义2.1.1Age
“四预”驱动数字孪生水利：让智慧治水守护山河安澜 GeoSaaS 实景三维智慧城市人工智能 gis 大数据安全
近年来，从黄河秋汛到海河特大洪水，从珠江流域性洪灾到长江罕见骤旱，极端天气频发让水安全问题备受关注。如何实现“治水于未发”？数字孪生水利以“预报、预警、预演、预案”（四预）为核心，正在掀起一场水利治理的智慧革命。一、数字孪生水利：从物理世界到虚拟镜像的跃迁数字孪生水利并非简单的“数字建模”，而是通过高精度传感器、大数据、人工智能等技术，在虚拟空间构建与物理流域完全映射的“数字分身”，实现水情、工情
辗转相处求最大公约数沐刃青蛟 C++漏洞
无言面对”江东父老“了，接触编程一年了，今天发现还不会辗转相除法求最大公约数。惭愧惭愧！为此，总结一下以方便日后忘了好查找。 1.输入要比较的两个数a,b 忽略：2.比较大小（因为后面要的是大的数对小的数做%操作） 3.辗转相除（用循环不停的取余，如a%b,直至b=0） 4.最后的a为两数的最大公约数 &
F5负载均衡会话保持技术及原理技术白皮书 bijian1013 F5 负载均衡
一.什么是会话保持？在大多数电子商务的应用系统或者需要进行用户身份认证的在线系统中，一个客户与服务器经常经过好几次的交互过程才能完成一笔交易或者是一个请求的完成。由于这几次交互过程是密切相关的，服务器在进行这些交互过程的某一个交互步骤时，往往需要了解上一次交互过程的处理结果，或者上几步的交互过程结果，服务器进行下
Object.equals方法：重载还是覆盖 Cwind java generics override overload
本文译自StackOverflow上对此问题的讨论。原问题链接在阅读Joshua Bloch的《Effective Java（第二版）》第8条“覆盖equals时请遵守通用约定”时对如下论述有疑问： “不要将equals声明中的Object对象替换为其他的类型。程序员编写出下面这样的equals方法并不鲜见，这会使程序员花上数个小时都搞不清它为什么不能正常工作：” pu
初始线程 15700786134
暑假学习的第一课是讲线程，任务是是界面上的一条线运动起来。既然是在界面上，那必定得先有一个界面，所以第一步就是，自己的类继承JAVA中的JFrame，在新建的类中写一个界面，代码如下： public class ShapeFr
Linux的tcpdump 被触发 tcpdump
用简单的话来定义tcpdump，就是：dump the traffic on a network，根据使用者的定义对网络上的数据包进行截获的包分析工具。 tcpdump可以将网络中传送的数据包的“头”完全截获下来提供分析。它支持针对网络层、协议、主机、网络或端口的过滤，并提供and、or、not等逻辑语句来帮助你去掉无用的信息。实用命令实例默认启动 tcpdump 普通情况下，直
安卓程序listview优化后还是卡顿肆无忌惮_ ListView
最近用eclipse开发一个安卓app，listview使用baseadapter，里面有一个ImageView和两个TextView。使用了Holder内部类进行优化了还是很卡顿。后来发现是图片资源的问题。把一张分辨率高的图片放在了drawable-mdpi文件夹下，当我在每个item中显示，他都要进行缩放，导致很卡顿。解决办法是把这个高分辨率图片放到drawable-xxhdpi下。 &nb
扩展easyUI tab控件，添加加载遮罩效果知了ing jquery
(function () { $.extend($.fn.tabs.methods, { //显示遮罩 loading: function (jq, msg) { return jq.each(function () { var panel = $(this).tabs(&
gradle上传jar到nexus 矮蛋蛋 gradle
原文地址： https://docs.gradle.org/current/userguide/maven_plugin.html configurations { deployerJars } dependencies { deployerJars "org.apache.maven.wagon
千万条数据外网导入数据库的解决方案。 alleni123 sql mysql
从某网上爬了数千万的数据，存在文本中。然后要导入mysql数据库。悲剧的是数据库和我存数据的服务器不在一个内网里面。。 ping了一下， 19ms的延迟。于是下面的代码是没用的。 ps = con.prepareStatement(sql); ps.setString(1, info.getYear())............; ps.exec
JAVA IO InputStreamReader和OutputStreamReader 百合不是茶 JAVA.io操作字符流
这是第三篇关于java.io的文章了，从开始对io的不了解-->熟悉--->模糊，是这几天来对文件操作中最大的感受，本来自己认为的熟悉了的，刚刚在回想起前面学的好像又不是很清晰了，模糊对我现在或许是最好的鼓励我会更加的去学加油！： JAVA的API提供了另外一种数据保存途径，使用字符流来保存的，字符流只能保存字符形式的流字节流和字符的难点：a,怎么将读到的数据
MO、MT解读 bijian1013 GSM
MO= Mobile originate，上行，即用户上发给SP的信息。MT= Mobile Terminate，下行，即SP端下发给用户的信息；上行:mo提交短信到短信中心下行:mt短信中心向特定的用户转发短信，你的短信是这样的，你所提交的短信，投递的地址是短信中心。短信中心收到你的短信后，存储转发，转发的时候就会根据你填写的接收方号码寻找路由，下发。在彩信领域是一样的道理。下行业务：由SP
五个JavaScript基础问题 bijian1013 JavaScript call apply this Hoisting
下面是五个关于前端相关的基础问题，但却很能体现JavaScript的基本功底。问题1：Scope作用范围考虑下面的代码： (function() { var a = b = 5; })(); console.log(b); 什么会被打印在控制台上？回答：上面的代码会打印 5。 &nbs
【Thrift二】Thrift Hello World bit1129 Hello world
本篇，不考虑细节问题和为什么，先照葫芦画瓢写一个Thrift版本的Hello World，了解Thrift RPC服务开发的基本流程 1. 在Intellij中创建一个Maven模块，加入对Thrift的依赖，同时还要加上slf4j依赖，如果不加slf4j依赖，在后面启动Thrift Server时会报错 <dependency>
【Avro一】Avro入门 bit1129 入门
本文的目的主要是总结下基于Avro Schema代码生成，然后进行序列化和反序列化开发的基本流程。需要指出的是，Avro并不要求一定得根据Schema文件生成代码，这对于动态类型语言很有用。 1. 添加Maven依赖 <?xml version="1.0" encoding="UTF-8"?> <proj
安装nginx+ngx_lua支持WAF防护功能 ronin47
需要的软件:LuaJIT-2.0.0.tar.gz nginx-1.4.4.tar.gz &nb
java-5.查找最小的K个元素-使用最大堆 bylijinnan java
import java.util.Arrays; import java.util.Random; public class MinKElement { /** * 5.最小的K个元素 * I would like to use MaxHeap. * using QuickSort is also OK */ public static void
TCP的TIME-WAIT bylijinnan socket
原文连接： http://vincent.bernat.im/en/blog/2014-tcp-time-wait-state-linux.html 以下为对原文的阅读笔记说明：主动关闭的一方称为local end，被动关闭的一方称为remote end 本地IP、本地端口、远端IP、远端端口这一“四元组”称为quadruplet，也称为socket 1、TIME_WA
jquery ajax 序列化表单 coder_xpf Jquery ajax 序列化
checkbox 如果不设定值，默认选中值为on；设定值之后，选中则为设定的值 <input type="checkbox" name="favor" id="favor" checked="checked"/> $("#favor&quo
Apache集群乱码和最高并发控制 cuisuqiang apache tomcat 并发集群乱码
都知道如果使用Http访问，那么在Connector中增加URIEncoding即可，其实使用AJP时也一样，增加useBodyEncodingForURI和URIEncoding即可。最大连接数也是一样的，增加maxThreads属性即可，如下，配置如下： <Connector maxThreads="300" port="8019" prot
websocket dalan_123 websocket
一、低延迟的客户端-服务器和服务器-客户端的连接很多时候所谓的http的请求、响应的模式，都是客户端加载一个网页，直到用户在进行下一次点击的时候，什么都不会发生。并且所有的http的通信都是客户端控制的，这时候就需要用户的互动或定期轮训的，以便从服务器端加载新的数据。通常采用的技术比如推送和comet（使用http长连接、无需安装浏览器安装插件的两种方式：基于ajax的长
菜鸟分析网络执法官 dcj3sjt126com 网络
最近在论坛上看到很多贴子在讨论网络执法官的问题。菜鸟我正好知道这回事情.人道"人之患好为人师" 手里忍不住,就写点东西吧. 我也很忙.又没有MM,又没有MONEY....晕倒有点跑题. OK,闲话少说,切如正题. 要了解网络执法官的原理. 就要先了解局域网的通信的原理. 前面我们看到了.在以太网上传输的都是具有以太网头的数据包.
Android相对布局属性全集 dcj3sjt126com android
RelativeLayout布局android:layout_marginTop="25dip" //顶部距离android:gravity="left" //空间布局位置android:layout_marginLeft="15dip //距离左边距 // 相对于给定ID控件android:layout_above 将该控件的底部置于给定ID的
Tomcat内存设置详解 eksliang jvm tomcat tomcat内存设置
Java内存溢出详解一、常见的Java内存溢出有以下三种： 1. java.lang.OutOfMemoryError: Java heap space ----JVM Heap（堆）溢出JVM在启动的时候会自动设置JVM Heap的值，其初始空间(即-Xms)是物理内存的1/64，最大空间(-Xmx)不可超过物理内存。可以利用JVM提
Java6 JVM参数选项 greatwqs java HotSpot jvm jvm参数 JVM Options
Java 6 JVM参数选项大全（中文版）作者：Ken Wu Email: [email protected] 转载本文档请注明原文链接 http://kenwublog.com/docs/java6-jvm-options-chinese-edition.htm！本文是基于最新的SUN官方文档Java SE 6 Hotspot VM Opt
weblogic创建JMC i5land weblogic jms
进入 weblogic控制太 1.创建持久化存储 --Services--Persistant Stores--new--Create FileStores--name随便起--target默认--Directory写入在本机建立的文件夹的路径--ok 2.创建JMS服务器 --Services--Messaging--JMS Servers--new--name随便起--Pers
基于 DHT 网络的磁力链接和BT种子的搜索引擎架构 justjavac DHT
上周开发了一个磁力链接和 BT 种子的搜索引擎 {Magnet & Torrent}，本文简单介绍一下主要的系统功能和用到的技术。系统包括几个独立的部分：使用 Python 的 Scrapy 框架开发的网络爬虫，用来爬取磁力链接和种子；使用 PHP CI 框架开发的简易网站；搜索引擎目前直接使用的 MySQL，将来可以考虑使
sql添加、删除表中的列 macroli sql
添加没有默认值：alter table Test add BazaarType char(1) 有默认值的添加列：alter table Test add BazaarType char(1) default(0) 删除没有默认值的列：alter table Test drop COLUMN BazaarType 删除有默认值的列：先删除约束（默认值）alter table Test DRO
PHP中二维数组的排序方法 abc123456789cba 排序二维数组 PHP
<?php/*** @package BugFree* @version $Id: FunctionsMain.inc.php,v 1.32 2005/09/24 11:38:37 wwccss Exp $*** Sort an two-dimension array by some level
hive优化之------控制hive任务中的map数和reduce数 superlxw1234 hive hive优化
一、控制hive任务中的map数: 1. 通常情况下，作业会通过input的目录产生一个或者多个map任务。主要的决定因素有： input的文件总个数，input的文件大小，集群设置的文件块大小(目前为128M, 可在hive中通过set dfs.block.size;命令查看到，该参数不能自定义修改)；2.
Spring Boot 1.2.4 发布 wiselyman spring boot
Spring Boot 1.2.4已于6.4日发布，repo.spring.io and Maven Central可以下载(推荐使用maven或者gradle构建下载)。这是一个维护版本，包含了一些修复small number of fixes,建议所有的用户升级。 Spring Boot 1.3的第一个里程碑版本将在几天后发布，包含许多

tensorflow2.0学习笔记

你可能感兴趣的:(人工智能,tensorflow)