西西弗Sisyphus

深度学习基础 - 线性回归

线性回归-理论篇

- "回归"一词是怎么来的
- 解决什么样的问题

flyfish

本文包括了实现原理、Python版本的实现和C++版本的实现

TensorFlow实现线性回归（包括三个例子）
PyTorch实现线性回归(推荐的版本包括模型训练、保存、推理使用等)
PyTorch版本的线性回归源码下载地址

知识脉络
梯度下降 ⇔ 梯度⇔ 方向导数⇔偏导数⇔三角函数⇔余弦定理⇔勾股定理

"回归"一词是怎么来的

本文中描述的高中教科书是人民教育出版社B版，高中教科书《数学选修 1-2》的第一章《“回归”一词的由来》22页

英国的统计学家弗朗西斯·高尔顿（Francis Galton,1822—1911）用统计方法研究两个变量之间关系。他研究父母身高与子女身高之间的关系，“回归”这个词由他引入的。

解决什么样的问题

假设你是一个老板，想到其他城市再开一家分店，你拥有一份城市人口数对应收益的数据，问当一个城市有8 百万人，那么这家分店收益是多少？
数据如下

人口（百万）	收益（亿元）
1	6
2	5
3	7
4	10

回归公式

斜率（图片来自wiki）

$\tan \theta = \frac { y _ { 2 } - y _ { 1 } } { x _ { 2 } - x _ { 1 } } = \frac { \Delta y } { \Delta x }$

字母变更下

$h_\theta(x)=\theta_0+\theta_1x$

h 表示 hypothesis(假设)，是一个函数，从x 到 y 的函数映射
m 表示样本数对应例子中的4个样本
x 代表特征，输入变量,自变量对应例子中的人口数
y 代表目标变量，输出变量,因变量对应例子中的收益
整个步骤

1 预测函数(Hypothesis)

$h_{\theta}(x)=\theta_{0}+\theta_{1}x$

2 参数(Parameters)

$\theta_{0},\theta_{1}$

3 代价函数 (Cost Function),有的地方称为损失函数(Loss Function) 或者误差函数(Error Function）

$J(\theta_{0},\theta_{1}) = \frac{1}{2m}\sum_{i=1}^{m} (h_\theta x^{(i)}-y^{(i)})^2$

4 目的(Goal)

$(\theta_{0},\theta_{1})=\min_{\theta_{0},\theta_{1}} J(\theta_{0},\theta_{1})$
只有一个特征，这样的问题叫作单变量线性回归问题或者一元线性回归问题
可视化理解 $\theta_0=0$ 的情况

#假设有三组数据，数据分别为(1，1)，(2，2)，(3，3)
x=np.array([1,2,3])
y=np.array([1,2,3])
#预测1
y1=0.5*x
y2=1*x
y3=-0.5*x
print( (1/(2*len(x)) )* sum(np.power(y1-y,2))) #0.58
print( (1/(2*len(x)) )* sum(np.power(y2-y,2))) #0
print( (1/(2*len(x)) )* sum(np.power(y3-y,2))) #5.25

#画图 看看是J(theta1)什么样子的
#a=np.linspace(-2,2,9)#[-2.  -1.5 -1.  -0.5  0.   0.5  1.   1.5  2. ]
theta1=np.linspace(-2,4,17)
j=np.array([])
for i in theta1:
    y_=i*x
    b= (1/(2*len(x)) )* sum(np.power(y_-y,2))
    j=np.append(j,b)
print(j) 

plt.xlabel('theta1')
plt.ylabel('J(theta1)')
plt.plot(theta1,j)

这个图像很像抛物线，高中《数学选修 2-1》59页抛物线

三维可视化

import numpy as np
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D

simple_count=30
x = np.arange(1,simple_count+1,1) 
y = 2*x+1 


k = np.arange(-20,simple_count-20,1)
b = np.arange(-20,simple_count-20,1)

theta_1,theta_0 = np.meshgrid(k, b)

J_theta = np.zeros([simple_count, simple_count])
 
for i in range(simple_count) :
    for j in range(simple_count) :
        J_theta[i][j]=((k[j]* x + b[i]-y)**2).sum()/simple_count
 


fig = plt.figure()
plt3d = Axes3D(fig)


plt.title("cost function three-dimensional visualization")
plt3d.set_xlabel("theta_1")
plt3d.set_ylabel("theta_0")
plt3d.set_zlabel("J_theta")
plt3d.plot_surface(theta_1, theta_0, J_theta, cmap=plt.cm.summer)

plt.show()

如果有多个特征，不仅仅是人口 $x_1$ ,还包括，等级 $x_2$ ，GDP $x_3$ 等，这样的问题叫作多变量线性回归问题或者多元线性回归问题
回归公式
$h_\theta(x)=\theta_0+\theta_1x_1+\theta_2x_2+\dots+\theta_nx_n=\theta^Tx$
公式的矩阵形式
$\theta^T x = \left[ \begin{matrix} \theta _ 1 \\\\ \theta _ 2 \\\\ ...\\\\ \theta _ n \\\\ \end{matrix} \right] \left[ \begin{matrix} x _ 1 & x _ 2 & ... & x _ n \end{matrix} \right] = \sum_{i=1}^n\theta _ i x _ i = h_\theta(x)$
上述公式中T的含义行变列，列变行。
${\begin{bmatrix}1,2\\3,4\\5,6\end{bmatrix}}^{\mathrm {T} }={\begin{bmatrix}1,3,5\\2,4,6\end{bmatrix}}$
代价函数（cost function）
$J(\theta)=\frac{1}{2m}\sum\limits_{i=1}^{m}(h_\theta(x^{(i)})-y^{(i)})^2,\quad {m 为样本数}$

矩阵形式
$J(\theta)=\frac{1}{2m}(X\theta-y)^T(X\theta-y)$
梯度下降

教科书的内容不好理解，从简单的入手，为了易于理解我从勾股定理和三角函数开始说

三角函数 $\sin \cos$
sin
$\sin A = \frac { \text { opposite(对边) } } { \text { hypotenuse(斜边) } }$
cos
$\cos A = \frac { \text { adjacent(邻边) } } { \text { hypotenuse(斜边) } }$
tan
$\tan A = \frac { \sin A } { \cos A }$

泰勒公式
《普林斯顿数学指南》第三卷中说泰勒并不是第一个发现这个定理的人，尽管这个定理以他这个名字命名，但他是第一个领会到它的意义和应用它的人。
泰勒公式的思想是局部逼近，用多项式来近似表示一个复杂函数，就像有句话说的“如果我看过你看过的世界，走过你走过的路，是不是就能更靠近你一点”

用切线近似的表示一个弧

近似公式

$\approx f \left( x _ { 0 } \right) + f ^ { \prime } \left( x _ { 0 } \right) \left( x - x _ { 0 } \right)$

$\approx f \left( x _ { 0 } \right) + f ^ { \prime } \left( x _ { 0 } \right) \left( x - x _ { 0 } \right) + a _ { 2 } \left( x - x _ { 0 } \right) ^ { 2 }$

n次多项式近似的表示f(x)
$\left( x - x _ { 0 } \right) + a _ { 2 } \left( x - x _ { 0 } \right) ^ { 2 } + \cdots + a _ { n } \left( x - x _ { 0 } \right) ^ { n }$

$\begin{aligned} P _ { n } ( x ) = & P \left( x _ { 0 } \right) + P ^ { \prime } \left( x _ { 0 } \right) \left( x - x _ { 0 } \right) + \frac { P ^ { \prime \prime } \left( x _ { 0 } \right) } { 2 ! } \left( x - x _ { 0 } \right) ^ { 2 } + \cdots + \frac { P ^ { ( n ) } \left( x _ { 0 } \right) } { n ! } \left( x - x _ { 0 } \right) ^ { n } \end{aligned}$

算法
$\theta_j ：= \theta_j-\alpha\frac{\partial}{\partial\theta_j}J(\theta) \quad {\alpha 是学习率}$

$\begin{aligned} & repeat\ until\ convergence \{ \\ & \theta _ { j } : = \theta _ { j } - \alpha \frac { \partial } { \partial \theta _ { j } } J \left( \theta _ { 0 } , \theta _ { 1 } \right) \\ &\}\\ \end{aligned}$

求代价函数的导数
$\frac { \partial } { \partial \theta _ { j } } J \left( \theta _ { 0 } \theta _ { 1 } \right) = \frac { \partial } { \partial \theta _ { j } } \frac { 1 } { 2 m } \sum _ { i = 1 } ^ { m } \left( h _ { \theta } \left( x ^ { ( i ) } \right) - y ^ { ( i ) } \right) ^ { 2 }$

j=0
$\frac { \partial } { \partial \theta _ { 0 } } J \left( \theta _ { 0 } \theta _ { 1 } \right) = \frac { 1 } { m } \sum _ { i = 1 } ^ { m } \left( h _ { \theta } \left( x ^ { ( i ) } \right) - y ^ { ( i ) } \right)$
j=1
$\frac { \partial } { \partial \theta _ { 1 } } J \left( \theta _ { 0 } \theta _ { 1 } \right) = \frac { 1 } { m } \sum _ { i = 1 } ^ { m } \left( \left( h _ { \theta } \left( x ^ { ( i ) } \right) - y ^ { ( i ) } \right) \cdot x ^ { ( i ) } \right)$

$\begin{aligned} repeat \ \{\\ &\theta _ { 0 } : = \theta _ { 0 } - \alpha \frac { 1 } { \mathrm { m } } \sum _ { \mathrm { i } = 1 } ^ { \mathrm { m } } \left( \mathrm { h } _ { \theta } \left( \mathrm { x } ^ { ( \mathrm { i } ) } \right) - \mathrm { y } ^ { ( \mathrm { i } ) } \right) \ \ \\ &\theta _ { 1 } : = \theta _ { 1 } - \alpha \frac { 1 } { \mathrm { m } } \sum _ { \mathrm { i } = 1 } ^ { \mathrm { m } } \left( \left( \mathrm { h } _ { \theta } \left( \mathrm { x } ^ { ( \mathrm { i } ) } \right) - \mathrm { y } ^ { ( \mathrm { i } ) } \cdot \mathrm { x } ^ { ( \mathrm { i } ) } \right)\right. &\ \\\} \end{aligned}$
代码

import matplotlib.pyplot as plt
import numpy as np
import matplotlib
zhfont = matplotlib.font_manager.FontProperties(fname='C:\Windows\Fonts\simsun.ttc')



#theta0需要和1相乘，所以加了一列1
def getDataSet():
    dataset_x = np.array([[1,1,1,1],[1,2,3,4]]).T
    y = np.array([[6],[5],[7],[10]])
    print(dataset_x)
    print(y)
    return dataset_x,y


def getCost(dataset_x, y ,theta):
    temp = np.power((dataset_x*theta.T) - y,2)
    return 1/(2*len(dataset_x)*sum(temp))


    '''
    theta: 需要更新的theta值
    alpha: 学习速率
    iters：迭代次数
    '''
def gradientDescent(dataset_x, y ,theta, alpha, iters):

    temp = np.mat(np.zeros(theta.shape))    
    cost = np.zeros(iters)
    parameters = int (theta.shape[1])     
 
    for  i in range(iters):               
        error = dataset_x*theta.T - y
        for j in range(parameters):      
            term = np.multiply(error,dataset_x[:,j])
            temp[0,j] = theta[0,j] - alpha / len(dataset_x) * sum(term)
        theta = temp
        cost[i] = getCost(dataset_x,y,theta)
    return  theta,cost
 
 
if __name__ == '__main__':
    dataset_x,y = getDataSet()
    alpha = 0.01   
    theta = np.mat(np.array([0,0]))  
    print(theta)
    dataset_x = np.mat(dataset_x)
    y = np.mat(y)
    print(dataset_x)
    print(y)
    iters = 100
    theta,cost = gradientDescent(dataset_x,y,theta,alpha,iters)
    x = np.linspace(dataset_x[:,1].min(),dataset_x[:,1].max(),100)
    h = theta[0,0] + (theta[0,1] * x)
    
    
    plt.scatter(np.array(dataset_x[:,1]),np.array(y[:,0]))
    plt.xlabel('人口数',fontproperties=zhfont)
    plt.ylabel('收益',fontproperties=zhfont)
    plt.plot(x,h)

L1-norm(LASSO回归)
$J(\theta) = \frac{1}{2}\sum^m_{i=1}(h_{\theta}(x^{i}) - y^{(i)})^2 + \lambda\sum^n_{j=1} |\theta_j| \ \ \ \lambda > 0$
L2-norm(Ridge回归,岭回归)
$J(\theta) = \frac{1}{2}\sum^m_{i=1}(h_{\theta}(x^{i}) - y^{(i)})^2 + \lambda\sum^n_{j=1} \theta_j^2 \ \ \ \lambda > 0$

同时引入L1-norm和L2-norm(弹性网络ElasitcNet)
$J(\theta) = \frac{1}{2}\sum^m_{i=1}(h_{\theta}(x^{i} - y^{(i)}))^2 + \lambda(p\sum^n_{j=1} \theta_j^2 +(1-p)\sum^n_{j=1} |\theta_j| )\ \ \ \lambda > 0 \&\& p \in [0,1]$

C++ 实现

#include 
#include 
#include 
#include 
#include 



class VectorAssist
{
public:

	static std::vector diff(std::vector* predictions, std::vector* y)
	{
		std::vector diff(predictions->size(), 0);;
		std::transform(predictions->begin(), predictions->end(), y->begin(), diff.begin(), std::minus());
		return diff;
	}

	static std::vector multiplication(std::vector* diff, std::vector* x)
	{
		std::vector differror(diff->size(), 0);;
		std::transform(diff->begin(), diff->end(), x->begin(), differror.begin(), std::multiplies());
		return differror;
	}

	static double sum(std::vector* error)
	{
		return std::accumulate(error->begin(), error->end(), 0.0);
	}

	static std::vector square(std::vector* error)
	{
		std::vector square_errors;

		std::for_each(error->begin(), error->end(), [&square_errors](double i) {
			square_errors.push_back(std::pow(static_cast(i), 2)); });
		return square_errors;
	}
};

class LinearRegression
{
public:
	std::vector* x_;
	std::vector* y_;
	int sample_count_;

	double *theta_;
public:
	LinearRegression(std::vector* x, std::vector* y)
	{
		this->x_ = x;
		this->y_ = y;
		sample_count_ = x->size();
	}

	//梯度下降
	double *gradient_descent(double alpha, int iters, double *J)
	{

		double *theta = new double[2];
		theta[0] = 1;
		theta[1] = 1;
		for (int i = 0; i < iters; i++)
		{
			std::vector predictions = calculate_predictions(x_, theta);
			std::vector diff = VectorAssist::diff(&predictions, y_);
			std::vector error_x1 = diff;
			std::vector error_x2 = VectorAssist::multiplication(&diff, x_);
			theta[0] = theta[0] - alpha * (1.0 / sample_count_) * VectorAssist::sum(&error_x1);
			theta[1] = theta[1] - alpha * (1.0 / sample_count_) * VectorAssist::sum(&error_x2);
			J[i] = compute_cost(x_, y_, theta);
		}
		return theta;
	}

	// 训练
	void train(double alpha, int iterations)
	{
		double *J = new double[iterations];
		this->theta_ = gradient_descent(alpha, iterations, J);
		std::cout << "Theta: " << theta_[0] << ", " << theta_[1] << std::endl;
	}

	//预测
	double predict(double x)
	{
		return h(x, theta_);
	}

	//代价函数 (Cost Function)
	double compute_cost(std::vector* x, std::vector* y, double theta[])
	{
		std::vector predictions = calculate_predictions(x, theta);
		std::vector diff = VectorAssist::diff(&predictions, y);
		std::vector  square_errors  = VectorAssist::square(&diff);
		return (1.0 / (2 * sample_count_)) * VectorAssist::sum(&square_errors );
	}

	//预测
	double h(double x, double theta[])
	{
		return theta[0] + theta[1] * x;
	}


	std::vector calculate_predictions(std::vector* x, double theta[])
	{
		std::vector predictions;
		for (int i = 0; i < sample_count_; i++)
		{
			predictions.push_back(h(x->at(i), theta));
		}
		return predictions;
	}
};


int main()
{
	std::cout << "Hello World!\n";
	double alpha = 0.01;
	int iterations = 20;
	double x_predict = 6;
	double y_predict;

	std::vector X;
	std::vector Y;
	for (int i = 0; i < 10; i++)
	{
		X.push_back(i);
		Y.push_back(i * 2 + 1);
	}

	LinearRegression lr(&X, &Y);
	lr.train(alpha, iterations);
	y_predict = lr.predict(x_predict);
	std::cout << y_predict << std::endl;

	system("pause");
}

深度学习基础与应用：从理论到实战创新工场
本文还有配套的精品资源，点击获取简介：深度学习是人工智能的核心分支，通过模拟人脑神经网络处理大量数据以执行复杂任务。Python因其简洁性和强大的库支持成为深度学习研究的首选语言。本文概述了深度学习基础概念、核心算法、Python框架，并假设了一个包含教程、示例代码、数据集、交互式学习环境、性能评估指标和进阶主题的“deep-learning-study-main”压缩包内容，旨在帮助学习者深入理
深度学习基础2 TY-2025 深度学习深度学习人工智能
5.张量索引操作（1）索引操作行列索引列表索引print(data[[0,2],[1,2]])#返回(0,1)，(2,2)两个位置的元素print(data[[[0],[1]],[1,2]])#返回0，1行的1，2列共4个元素范围索引print(data[:3,:2])#前3行前2列数据print(data[2:,:2])#第2行到最后的前2列数据布尔索引tensor([[0,7,6,5,9],[
阅读笔记(2) 单层网络:回归 a2507283885 笔记
阅读笔记(2)单层网络:回归该笔记是DataWhale组队学习计划（共度AI新圣经：深度学习基础与概念）的Task02以下内容为个人理解，可能存在不准确或疏漏之处，请以教材为主。1.从泛函视角来看线性回归还记得线性代数里学过的“基”这个概念吗？一组基向量是一组线性无关的向量，它们通过线性组合可以张成一个向量空间。也就是说，这个空间里的任意一个向量，都可以表示成这组基的线性组合。函数其实也可以看作是
基于通义大模型的智能客服系统构建实战：从模型微调到API部署大熊计算机开发实战语言模型人工智能
1引言本文将深入探讨基于通义大模型的智能客服系统构建全流程，从数据准备、模型微调、性能优化到API部署和系统集成。不同于理论概述，本文将通过实战案例、代码演示和性能数据对比，展示每个环节的技术细节与工程实践。文章面向具备Python和深度学习基础的开发者，重点解决以下核心问题：如何针对客服场景准备和优化训练数据？如何高效微调通义大模型以适配特定业务需求？如何解决大模型部署中的延迟和并发挑战？如何构
TensorFlow：深度学习基础设施的架构哲学与工程实践革新双囍菜菜 AI 深度学习 tensorflow 架构
TensorFlow：深度学习基础设施的架构哲学与工程实践革新文章目录TensorFlow：深度学习基础设施的架构哲学与工程实践革新一、计算范式革命：从静态图到动态执行的深度架构剖析1.1静态计算图的编译优化体系1.2动态图模式的实现原理1.3混合执行模式的编译原理二、张量计算引擎的深度架构解析2.1运行时核心组件2.2计算图优化技术2.3分布式训练架构三、可微分编程范式的实现奥秘3.1自动微分系
计算机视觉与深度学习实战：以Python为工具，基于深度学习的汽车目标检测好知识传播者 Python实例开发实战计算机视觉深度学习 python 基于深度学习的汽车目标检测
随着人工智能技术的飞速发展，计算机视觉与深度学习已经成为当今科技领域的热点。其中，汽车目标检测作为自动驾驶、智能交通等系统的核心技术，受到了广泛关注。本文将以Python为工具，探讨基于深度学习的汽车目标检测方法及其实战应用。一、计算机视觉与深度学习基础计算机视觉是研究如何让计算机从图像或视频中获取信息、理解内容并作出决策的科学。深度学习则是一种模拟人脑神经网络的机器学习技术，通过构建深层神经网络
程序员转向人工智能 CoderIsArt 机器学习与深度学习人工智能
以下是针对程序员转向人工智能（AI）领域的学习路线建议，分为基础、核心技术和进阶方向，结合你的编程背景进行优化：1.夯实基础数学基础（选择性补足，边学边用）线性代数：矩阵运算、特征值、张量（深度学习基础）概率与统计：贝叶斯定理、分布、假设检验微积分：梯度、导数（优化算法核心）优化算法：梯度下降、随机梯度下降（SGD）学习资源：3Blue1Brown（视频）、《程序员的数学》系列编程工具Python
深度学习基础知识总结
1.BatchNorm2d加速收敛：BatchNormalization可以使每层的输入保持较稳定的分布（接近标准正态分布），减少梯度更新时的震荡问题，从而加快模型训练速度。减轻过拟合：批归一化引入了轻微的正则化效果，因为它依赖于mini-batch中的统计信息，这种方式可以减少对单个样本的过度拟合。提高模型性能：在训练过程中，BatchNormalization通过动态调整激活值的分布，让模型更
大数据最新大模型学习路线与建议：掌握大模型学习路径大模型教程大数据学习人工智能大模型 AI大模型程序员 AI
1既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上大数据知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新第一章深度学习基础第二章智能对话系统基础第三章大模型基础第四章大模型应用实践第五章大模型实战项目第一章深度学习基础深度学习基础深度学习经典模型解
深度学习模型：技术演进、热点突破与未来图景 accurater c++算法笔记深度学习
第一章深度学习模型的技术演进1.1从感知机到深度神经网络里程碑突破：AlexNet在ImageNet竞赛中实现图像分类性能飞跃，首次验证深度卷积网络（CNN）的潜力。其采用ReLU激活函数、Dropout正则化等创新，奠定现代深度学习基础架构。梯度消失的破解：LSTM网络通过门控机制实现长时序依赖建模，为自然语言处理（NLP）开辟道路，后续双向LSTM、GRU等变体持续优化记忆能力。计算范式革新：
我们掌握的技能与进入企业的机会万能小贤哥人工智能算法深度学习
深度学习：从基础到实践一、引言深度学习是机器学习的一个分支，它通过构建多层神经网络来模拟人类大脑的信息处理方式，从而实现对复杂数据的自动特征提取和模式识别。近年来，深度学习在计算机视觉、自然语言处理、语音识别等领域取得了巨大的突破，引发了全球范围内的研究和应用热潮。本文将从深度学习的基本概念出发，逐步深入到实际应用，并结合代码示例展示如何实现一个简单的深度学习模型。二、深度学习基础（一）神经网络的
吴恩达深度学习课程实践项目集 Kiki-2189
本文还有配套的精品资源，点击获取简介：吴恩达深度学习编程作业包含了Coursera平台课程中的实践环节，为学员提供深度学习理论与编程技能的巩固。这些作业从基础神经网络到复杂架构，涵盖深度学习的各种关键概念和技术，使用TensorFlow进行模型构建和训练，适合作为入门深度学习的资源。1.深度学习基础与理论框架在当今的人工智能领域，深度学习以其强大的模式识别能力，已经成为了众多技术革新的核心。本章将
YOLOv7在自定义数据集上的Jupyter Notebook训练指南 t0_54program 大数据与人工智能 YOLO jupyter ide 个人开发
在当今的计算机视觉领域，目标检测是一项至关重要的任务，而YOLO（YouOnlyLookOnce）系列算法因其高效性和准确性备受关注。本文将详细介绍如何在JupyterNotebook环境中，利用YOLOv7模型对自定义数据集进行训练。前期准备环境与基础设置：开始之前，你需要具备一定的Python编程经验和深度学习基础知识，并且拥有一台性能足够强大的机器。若没有GPU，DigitalOceanGP
自然语言处理 (NLP) 学习路线我喝AD钙我的学习笔记自然语言处理学习人工智能
自然语言处理学习路线1.基础准备（可参考mooc学习）2.学习基础NLP技术（可参考mooc学习）3.经典机器学习算法在NLP中的应用（可参考吴恩达机器学习课程）4.深度学习基础（基础参考吴恩达、工具看TF、Keras官网手册）5.深度学习在NLP中的应用（arxiv论文原文和解析博客，实战参考gitee/github）6.现代NLP模型（arxiv论文原文和解析博客，实战参考gitee/gith
MONAI 高级开发者研究教程专栏：从精通到引领医学影像AI创新 LIUDAN'S WORLD MONAI 高级开发者研究教程专栏人工智能
专栏导语：本专栏旨在为已有深度学习基础并希望在医学影像AI领域进行深入研究的高级开发者提供一套系统性的MONAI学习与实践指南。我们将不仅仅停留在“如何使用”，更会深入探讨“为何如此设计”以及“如何扩展与创新”，助您充分利用MONAI的强大功能，引领前沿研究。第一章MONAI基石与医学影像AI生态MONAI的设计哲学与核心架构解析：不仅仅是介绍：深入探讨MONAI诞生的背景，解决了医学影像AI的哪
深度学习面试八股简略速览石去皿学习记录经验分享深度学习人工智能
在准备深度学习面试时，你可能会感到有些不知所措。毕竟，深度学习是一个庞大且不断发展的领域，涉及众多复杂的技术和概念。但别担心，本文将为你提供一份全面的指南，从基础理论到实际应用，帮助你在面试中脱颖而出。1.深度学习基础：理解核心概念1.1神经网络基础神经网络是深度学习的核心，它由许多简单的处理单元（神经元）组成，这些神经元通过权重连接在一起。每个神经元接收输入，通过一个激活函数进行处理，然后输出结
【第15章：量子深度学习与未来趋势—15.2 量子深度学习模型的基础理论与实现方法探索】再见孙悟空_ #【深度学习・探索智能核心奥秘】深度学习 DeepSeek 人工智能计算机视觉强化学习量子计算量子深度学习
还记得《三体》中智子锁死地球科技的绝望吗？今天AI领域正面临类似的困境——GPT-4训练需要消耗1.7万个NVIDIAA100GPU运行3个月，能耗相当于300个家庭一年的用电量。更可怕的是，图像识别任务的参数空间维度每增加1级，计算量就会爆炸式增长10^8倍。这时候量子计算犹如破壁者，带着量子并行计算和指数级存储空间这两把密钥，正在打开AI的降维打击时代。一、量子深度学习基础：从量子比特到量子神
【深度学习基础/面试高频问题】归一化-为何BN层能帮助模型优化无敌悦悦王面试准备基础理论深度学习人工智能计算机视觉图像处理
深度学习基础知识为何BN能够帮助训练优化1、发现问题2、BatchNorm的性能是否源于控制内部协变量偏移？3、为什么BatchNorm有效？1）BatchNorm的平滑效果2）优化景观的探索3）BatchNorm是平滑景观的最佳（唯一？）方法吗？4、理论分析5、相关工作6、结论参考文献：1、HowDoesBatchNormalizationHelpOptimization?HowDoesBatc
第21节：深度学习基础-激活函数比较（ReLU, Sigmoid, Tanh）点我头像干啥从零开始学习深度学习图像分类实战(pytorch)深度学习算法人工智能
1.引言在深度学习领域，激活函数是神经网络中至关重要的组成部分它决定了神经元是否应该被激活以及如何将输入信号转换为输出信号激活函数为神经网络引入了非线性因素，使其能够学习并执行复杂的任务没有激活函数，无论神经网络有多少层，都只能表示线性变换，极大地限制了网络的表达能力本文将深入探讨三种最常用的激活函数：ReLU（RectifiedLinearUnit）、Sigmoid和Tanh（双曲正切函数），从
AI Python 教程 Empty-Filled 人工智能 python 开发语言
AIPython教程为什么使用Python学习AI？AI之Python前提AIPython教程人工智能AI之Python-机器学习监督学习回归算法分类算法非监督学习聚类算法数据降维增强学习AI之Python-深度学习深度学习基础深度学习架构AI之Python-自然语言处理文本处理和表示文本处理文本表示词汇语义学AI之Python-计算机视觉图像处理和转换图像识别架构物体检测架构两步检测器单步检测器
第20节：深度学习基础-反向传播算法详解点我头像干啥从零开始学习深度学习图像分类实战(pytorch)深度学习神经网络人工智能机器学习
一、引言反向传播算法（Backpropagation，简称BP算法）是深度学习领域最为核心的算法之一，它为神经网络提供了一种高效计算梯度的方法，使得基于梯度的优化成为可能。自20世纪80年代被重新发现并广泛应用以来，反向传播算法已经成为训练多层神经网络的标准方法，推动了深度学习革命的发展。反向传播算法的本质是链式法则（ChainRule）在神经网络中的巧妙应用，它通过从输出层向输入层反向传播误差信
深度学习模型：从基础到前沿的技术解析与实践指南爱吃青菜的大力水手深度学习人工智能
深度学习模型全面解析文章框架，结合代码演示与图形展示，内容深入浅出：深度学习模型：从基础到前沿的技术解析与实践指南第一章深度学习基础与核心思想1.1深度学习的本质与优势表示学习理论：通过多层非线性变换自动提取数据特征，无需人工设计特征（如CNN对边缘→纹理→物体的逐层抽象）与传统机器学习的对比：以ImageNet分类为例，AlexNet将Top-5错误率从26.2%降至15.3%，证明了深度学习的
PyTorch深度学习基础/Logistic回归 Zeal Just Hurries 深度学习人工智能机器学习 pytorch 回归 python
一、PyTorch深度学习基础1、Tensor对象及其运算Tensor对象是一个多维的数据结构，用于存储数值型数据，通常用在深度学习中进行各种计算。Tensor对象可以简单理解为一个高维数组，它是矩阵概念的扩展。在深度学习领域，特别是在使用某些框架如PyTorch或TensorFlow时，Tensor扮演着核心角色。它们不仅拥有丰富的数学属性，还内置了一些专为深度学习设计的运算，这使得Tensor
探索人工智能在医疗诊断中的前沿应用：深度学习助力精准医疗 Thanks_ks IT 洞察集深度学习医疗诊断医学影像识别基因组学智能辅助诊断精准医疗个性化治疗
目录引言一、深度学习基础与医疗诊断的融合1.深度学习的自适应学习能力2.特征提取的自动化与高效性3.多模态数据的融合处理4.实时诊断与远程医疗的潜力5.个性化医疗的推动二、深度学习在医学影像识别中的应用1.肿瘤检测与分类2.眼科疾病筛查3.病变识别4.脑部疾病诊断5.骨折检测与评估6.多模态影像融合分析7.自动化报告生成三、深度学习在基因组学中的应用1.精准遗传病诊断2.疾病风险预测与预防3.精准
深度学习基础知识-全连接层 Jul.01 深度学习人工智能神经网络
全连接（FullyConnected，简称FC）层是深度学习神经网络中一种基本的层结构。它主要用于神经网络的最后几层，将高层特征映射到输出空间中。全连接层对数据的每个输入节点与每个输出节点进行连接，用于实现输入特征和输出结果之间的映射关系。以下是对全连接层的详细解释。1.全连接层的结构和原理在全连接层中，每一个输入节点与每一个输出节点之间都有一条连接线。假设输入层有n个神经元，输出层有m个神经元，
深度学习基础：从入门到理解核心概念巷955 深度学习人工智能
引言近年来，深度学习(DeepLearning)已成为人工智能领域最热门的研究方向之一。从AlphaGo战胜人类围棋冠军，到ChatGPT等大型语言模型的惊艳表现，深度学习技术正在深刻改变我们的生活和工作方式。本文将系统介绍深度学习的基础知识，帮助初学者建立对这一领域的全面认识。一、什么是深度学习？深度学习是机器学习的一个子领域，它通过模拟人脑神经元的工作方式，构建多层的神经网络模型，从数据中自动
深度学习基础原理知识整理 MayByte 深度学习深度学习人工智能
深度学习基础原理知识整理线性回归模型线性回归模型定义假设给定数据集(D={(x1,y1),(x2,y2),…,(xm,ym)})，其中xi=(xi1;xi2;…;xid)，xi∈Rx~i~\in\mathbb{R}xi∈R。线性回归就是试图学得一个线性模型，尽可能准确地预测实际输出值。通俗地讲，即求属性与结果之间的线性关系。线性回归模型的函数表达式为：f(x)=w1x1+w2x2+⋯+wnxn+b
人脸识别：基于深度学习的人脸识别_（2）.深度学习基础 zhubeibei168 检验检测&人脸识别深度学习人工智能开源计算机视觉人脸识别
深度学习基础引言深度学习是机器学习的一个分支，它通过构建多层神经网络来模拟人脑的结构和功能，从而实现对复杂数据模式的自动学习和识别。在计算机视觉领域，深度学习已经取得了显著的成果，尤其是在人脸识别方面。本节将介绍深度学习的基本概念、常用算法和框架，为后续的人脸识别技术打下坚实的基础。神经网络基础什么是神经网络神经网络是一种计算模型，它由大量的节点（或称为神经元）组成，这些节点通过连接形成一个网络。
数据处理专题（十二）程序员的世界你不懂数据分析百度经验分享
深度学习基础01目标了解深度学习的基本概念。‍02学习内容神经网络基础Keras基础实践：使用Keras构建一个简单的神经网络模型‍03代码示例1.导入必要的库importnumpyasnpimportpandasaspdimporttensorflowastffromtensorflow.keras.modelsimportSequentialfromtensorflow.keras.layer
【深度学习基础】Windows实时查看GPU显存占用、功耗、进程状态叫我东方小巴黎机器学习基础深度学习人工智能
1.nvitoppython环境下，例如anacondaprompt：condaenvlistactivatexxxpipinstallnvitopnvitop实时查看GPU显存占用、功耗、进程状态显示信息含义https://blog.csdn.net/Sep21m_wyy/article/details/141754651顶部信息栏当前时间：显示当前的系统时间（SatAug3116:33:032
Spring4.1新特性——Spring MVC增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
mysql 性能查询优化 annan211 java sql 优化 mysql 应用服务器
1 时间到底花在哪了？ mysql在执行查询的时候需要执行一系列的子任务，这些子任务包含了整个查询周期最重要的阶段，这其中包含了大量为了检索数据列到存储引擎的调用以及调用后的数据处理，包括排序、分组等。在完成这些任务的时候，查询需要在不同的地方花费时间，包括网络、cpu计算、生成统计信息和执行计划、锁等待等。尤其是向底层存储引擎检索数据的调用操作。这些调用需要在内存操
windows系统配置 cherishLC windows
删除Hiberfil.sys ：使用命令powercfg -h off 关闭休眠功能即可： http://jingyan.baidu.com/article/f3ad7d0fc0992e09c2345b51.html 类似的还有pagefile.sys msconfig 配置启动项 shutdown 定时关机 ipconfig 查看网络配置 ipconfig /flushdns
人体的排毒时间 Array_06 工作
======================== || 人体的排毒时间是什么时候？|| ======================== 转载于： http://zhidao.baidu.com/link?url=ibaGlicVslAQhVdWWVevU4TMjhiKaNBWCpZ1NS6igCQ78EkNJZFsEjCjl3T5EdXU9SaPg04bh8MbY1bR
ZooKeeper cugfy zookeeper
Zookeeper是一个高性能，分布式的，开源分布式应用协调服务。它提供了简单原始的功能，分布式应用可以基于它实现更高级的服务，比如同步，配置管理，集群管理，名空间。它被设计为易于编程，使用文件系统目录树作为数据模型。服务端跑在java上，提供java和C的客户端API。 Zookeeper是Google的Chubby一个开源的实现，是高有效和可靠的协同工作系统，Zookeeper能够用来lea
网络爬虫的乱码处理随意而生爬虫网络
下边简单总结下关于网络爬虫的乱码处理。注意，这里不仅是中文乱码，还包括一些如日文、韩文、俄文、藏文之类的乱码处理，因为他们的解决方式是一致的，故在此统一说明。网络爬虫，有两种选择，一是选择nutch、hetriex，二是自写爬虫，两者在处理乱码时，原理是一致的，但前者处理乱码时，要看懂源码后进行修改才可以，所以要废劲一些；而后者更自由方便，可以在编码处理
Xcode常用快捷键张亚雄 xcode
一、总结的常用命令：隐藏xcode command+h 退出xcode command+q 关闭窗口 command+w 关闭所有窗口 command+option+w 关闭当前
mongoDB索引操作 adminjun mongodb 索引
一、索引基础： MongoDB的索引几乎与传统的关系型数据库一模一样，这其中也包括一些基本的优化技巧。下面是创建索引的命令： > db.test.ensureIndex({"username":1}) 可以通过下面的名称查看索引是否已经成功建立： &nbs
成都软件园实习那些话 aijuans 成都软件园实习
无聊之中，翻了一下日志，发现上一篇经历是很久以前的事了，悔过~~ 　　断断续续离开了学校快一年了，习惯了那里一天天的幼稚、成长的环境，到这里有点与世隔绝的感觉。不过还好，那是刚到这里时的想法，现在感觉在这挺好，不管怎么样，最要感谢的还是老师能给这么好的一次催化成长的机会，在这里确实看到了好多好多能想到或想不到的东西。　　都说在外面和学校相比最明显的差距就是与人相处比较困难，因为在外面每个人都
Linux下FTP服务器安装及配置 ayaoxinchao linux FTP服务器 vsftp
检测是否安装了FTP [root@localhost ~]# rpm -q vsftpd 如果未安装：package vsftpd is not installed 安装了则显示：vsftpd-2.0.5-28.el5累死的版本信息安装FTP 运行yum install vsftpd命令，如[root@localhost ~]# yum install vsf
使用mongo-java-driver获取文档id和查找文档 BigBird2012 driver
注：本文所有代码都使用的mongo-java-driver实现。在MongoDB中，一个集合（collection）在概念上就类似我们SQL数据库中的表（Table），这个集合包含了一系列文档（document）。一个DBObject对象表示我们想添加到集合（collection）中的一个文档（document），MongoDB会自动为我们创建的每个文档添加一个id，这个id在
JSONObject以及json串 bijian1013 json JSONObject
一.JAR包简介要使程序可以运行必须引入JSON-lib包，JSON-lib包同时依赖于以下的JAR包： 1.commons-lang-2.0.jar 2.commons-beanutils-1.7.0.jar 3.commons-collections-3.1.jar &n
[Zookeeper学习笔记之三]Zookeeper实例创建和会话建立的异步特性 bit1129 zookeeper
为了说明问题，看个简单的代码， import org.apache.zookeeper.*; import java.io.IOException; import java.util.concurrent.CountDownLatch; import java.util.concurrent.ThreadLocal
【Scala十二】Scala核心六：Trait bit1129 scala
Traits are a fundamental unit of code reuse in Scala. A trait encapsulates method and field definitions, which can then be reused by mixing them into classes. Unlike class inheritance, in which each c
weblogic version 10.3破解 ronin47 weblogic
版本：WebLogic Server 10.3 说明：%DOMAIN_HOME%：指WebLogic Server 域(Domain）目录例如我的做测试的域的根目录 DOMAIN_HOME=D:/Weblogic/Middleware/user_projects/domains/base_domain 1.为了保证操作安全，备份%DOMAIN_HOME%/security/Defa
求第n个斐波那契数 BrokenDreams
今天看到群友发的一个问题：写一个小程序打印第n个斐波那契数。自己试了下，搞了好久。。。基础要加强了。 &nbs
读《研磨设计模式》-代码笔记-访问者模式-Visitor bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; interface IVisitor { //第二次分派，Visitor调用Element void visitConcret
MatConvNet的excise 3改为网络配置文件形式 cherishLC matlab
MatConvNet为vlFeat作者写的matlab下的卷积神经网络工具包，可以使用GPU。主页： http://www.vlfeat.org/matconvnet/ 教程： http://www.robots.ox.ac.uk/~vgg/practicals/cnn/index.html 注意：需要下载新版的MatConvNet替换掉教程中工具包中的matconvnet： http
ZK Timeout再讨论 chenchao051 zookeeper timeout hbase
http://crazyjvm.iteye.com/blog/1693757 文中提到相关超时问题，但是又出现了一个问题，我把min和max都设置成了180000，但是仍然出现了以下的异常信息： Client session timed out, have not heard from server in 154339ms for sessionid 0x13a3f7732340003
CASE WHEN 用法介绍 daizj sql group by case when
CASE WHEN 用法介绍 1. CASE WHEN 表达式有两种形式 --简单Case函数 CASE sex WHEN '1' THEN '男' WHEN '2' THEN '女' ELSE '其他' END --Case搜索函数 CASE WHEN sex = '1' THEN
PHP技巧汇总:提高PHP性能的53个技巧 dcj3sjt126com PHP
PHP技巧汇总:提高PHP性能的53个技巧　　用单引号代替双引号来包含字符串，这样做会更快一些。因为PHP会在双引号包围的字符串中搜寻变量，　　单引号则不会，注意：只有echo能这么做，它是一种可以把多个字符串当作参数的函数译注：　　PHP手册中说echo是语言结构，不是真正的函数，故把函数加上了双引号)。　　1、如果能将类的方法定义成static，就尽量定义成static，它的速度会提升将近4倍
Yii框架中CGridView的使用方法以及详细示例 dcj3sjt126com yii
CGridView显示一个数据项的列表中的一个表。表中的每一行代表一个数据项的数据,和一个列通常代表一个属性的物品(一些列可能对应于复杂的表达式的属性或静态文本)。　　CGridView既支持排序和分页的数据项。排序和分页可以在AJAX模式或正常的页面请求。使用CGridView的一个好处是,当用户浏览器禁用JavaScript,排序和分页自动退化普通页面请求和仍然正常运行。实例代码如下：
Maven项目打包成可执行Jar文件 dyy_gusi assembly
Maven项目打包成可执行Jar文件在使用Maven完成项目以后，如果是需要打包成可执行的Jar文件，我们通过eclipse的导出很麻烦，还得指定入口文件的位置，还得说明依赖的jar包，既然都使用Maven了，很重要的一个目的就是让这些繁琐的操作简单。我们可以通过插件完成这项工作，使用assembly插件。具体使用方式如下： 1、在项目中加入插件的依赖： <plugin>
php常见错误 geeksun PHP
1. kevent() reported that connect() failed (61: Connection refused) while connecting to upstream, client: 127.0.0.1, server: localhost, request: "GET / HTTP/1.1", upstream: "fastc
修改linux的用户名 hongtoushizi linux change password
Change Linux Username 更改Linux用户名，需要修改4个系统的文件： /etc/passwd /etc/shadow /etc/group /etc/gshadow 古老/传统的方法是使用vi去直接修改，但是这有安全隐患（具体可自己搜一下），所以后来改成使用这些命令去代替： vipw vipw -s vigr vigr -s 具体的操作顺
第五章常用Lua开发库1-redis、mysql、http客户端 jinnianshilongnian nginx lua
对于开发来说需要有好的生态开发库来辅助我们快速开发，而Lua中也有大多数我们需要的第三方开发库如Redis、Memcached、Mysql、Http客户端、JSON、模板引擎等。一些常见的Lua库可以在github上搜索，https://github.com/search?utf8=%E2%9C%93&q=lua+resty。 Redis客户端 lua-resty-r
zkClient 监控机制实现 liyonghui160com zkClient 监控机制实现
直接使用zk的api实现业务功能比较繁琐。因为要处理session loss，session expire等异常，在发生这些异常后进行重连。又因为ZK的watcher是一次性的，如果要基于wather实现发布/订阅模式，还要自己包装一下，将一次性订阅包装成持久订阅。另外如果要使用抽象级别更高的功能，比如分布式锁，leader选举
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句 pda158 mysql
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句：　　方法一：SELECT table_name, column_name from information_schema.columns WHERE column_name LIKE 'Name'; 　　方法二：SELECT column_name from information_schema.colum
程序员对英语的依赖 Smile.zeng 英语程序猿
1、程序员最基本的技能，至少要能写得出代码，当我们还在为建立类的时候思考用什么单词发牢骚的时候，英语与别人的差距就直接表现出来咯。 2、程序员最起码能认识开发工具里的英语单词，不然怎么知道使用这些开发工具。 3、进阶一点，就是能读懂别人的代码，有利于我们学习人家的思路和技术。 4、写的程序至少能有一定的可读性，至少要人别人能懂吧... 以上一些问题，充分说明了英语对程序猿的重要性。骚年
Oracle学习笔记(8) 使用PLSQL编写触发器 vipbooks oracle sql 编程活动 Access
时间过得真快啊，转眼就到了Oracle学习笔记的最后个章节了，通过前面七章的学习大家应该对Oracle编程有了一定了了解了吧，这东东如果一段时间不用很快就会忘记了，所以我会把自己学习过的东西做好详细的笔记，用到的时候可以随时查找，马上上手！希望这些笔记能对大家有些帮助！这是第八章的学习笔记，学习完第七章的子程序和包之后

深度学习基础 - 线性回归

线性回归-理论篇

"回归"一词是怎么来的

解决什么样的问题

你可能感兴趣的:(深度学习基础)