AI人工智能和大模型(概念)之二

Pytorch的安装

通过Anaconda安装PyTorch更为便捷

张量:(1)Tensor可以是高维的(2)并非是PyTorch中才有的概念(3)PyTorch运算的基本单元(4)基础数据定义和运算(5)在PyTorch中支持GPU运算,自动求导等操作

机器学习两种典型的任务:(1)分类任务是对离散值进行预测(2)回归任务是对连续值进行预测

大模型中的相关概念

样本:一条数据;
特征:被观测对象的可测量特性,例如西瓜的颜色、瓜蒂、纹路、敲击声等;
特征向量:用一个 d 维向量表征一个样本的所有或部分特征;
标签(label)/真实值:样本特征对应的真实类型或者真实取值,即正确答案;
数据集(dataset):多条样本组成的集合;
训练集(train):用于训练模型的数据集合;
评估集(eval):用于在训练过程中周期性评估模型效果的数据集合;
测试集(test):用于在训练完成后评估最终模型效果的数据集合;

模型:可以从数据中学习到的,可以实现特定功能/映射的函数;
误差/损失:样本真实值与预测值之间的误差;
预测值:样本输入模型后输出的结果;
模型训练:使用训练数据集对模型参数进行迭代更新的过程;
模型收敛:任意输入样本对应的预测结果与真实标签之间的误差稳定;
模型评估:使用测试数据和评估指标对训练完成的模型的效果进行评估的过程;
模型推理/预测:使用训练好的模型对数据进行预测的过程;
模型部署:使用服务加载训练好的模型,对外提供推理服务;

Step:一次梯度更新的过程;
Epoch:模型完成一次完整训练集的训练;

梯度:梯度是一个向量(矢量),函数在一点处沿着该点的梯度方向变化最快,变化率最大。
换而言之,自变量沿着梯度方向变化,能够使因变量(函数值)变化最大。

你可能感兴趣的:(大模型,人工智能,语言模型)