踏归1234

吴恩达机器学习[7]-Logistic回归算法-介绍与python实现

Logistic回归算法-介绍与python实现

分类
假设陈述
- 模型解释
决策边界
代价函数
简化代价函数与梯度下降
高级优化
多元分类：一对多
总结与代码实现
- Logistic回归与线性回归差异
- 数据特征值为类别的处理
- Logictic回归代码实现（Python）

分类

分类预测算法
y存在两个取值，即0、1。【y取值为0,1,2或更多时，为多分类问题。】

此时，简单的线性回归加上阈值划分，无法很合拟合点分布。

因此，引入logistic回归算法。‘回归’二字是历史原因导致，本算法属于分类算法。

假设陈述

y的取值为[0,1]。为此引入sigmoid函数g(z)，又称logistic函数。用该函数代入 $h_{\theta}(x)$ .用该函数拟合系列点。

模型解释

该模型可以理解为：在给定条件x的情况下，y=1的概率。其中概率参数为 $\theta$ 。代入肿瘤问题，即病人的特征为x的情况下，x代表肿瘤大小。

性质

决策边界

目标

了解决策边界（desicion boundary）定义
通过决策边界更好地理解logistic回归函数的假设函数在计算什么

根据sigmoid函数可看出，当 $\theta^{T}x$ 大于等于0时，预测y等于0。总之，我们预测y等于0或1，取决于 $\theta^{T}x$ 大于0还是小于0。

那么可以得出，假设函数如何做出预测。
假设有如下函数。那么 $3+x_{1}+x_{2}+x_{3}≥0$ 时，预测y为1，对应红x对应区域。相应地，可以得到预测y为0对应区域。两区域中间的线被称为决策边界（desicion boundary），直线上的点对应y为0.5。
需要注意的是，决策边界为假设函数的一个属性，它包括参数 $\theta_{0}、\theta_{1}、\theta_{2}$ 。决策边界，包括预测y=0、y=1对应与区域，决定于其参数，它不是数据集的属性。

进化到更高阶的假设函数，原理也是同前者。蓝线圆圈代表决策边界。

代价函数

目标

如何拟合logistics回归函数的模型参数 $\theta$ ，即定义用来拟合参数的代价函数（优化目标）

给定训练集，设置样本的第一个变量值 $x_{0}$ 为0，求 $\theta$

定义代价函数 $J(\theta)$ ，将求和函数内多项式定义为函数 $cost(h_\theta (x^{i} ,y^{i})$ 。求代价函数最小值，即求 $cost(h_\theta (x^{i} ,y^{i})$ 函数最小值。
但该函数为非凸函数（non-convex），存在很多局部最小值。使用梯度下降法不能保证获得全局局部最小值。

因此需要找到一个能使用梯度下降法的代价函数。因此找到如下代价函数。通过极大似然法求得。他是统计学中为不同函数快速寻找参数的方法，如何求？？？

函数性质

y为1， $h_\theta (x)$ 为1时，cost为0；但 $h_\theta (x)$ 趋向于0时，cost趋向于无限大。因此 $h_\theta (x)$ 为1时，y需要为1，不然得付出极大代价。
y为0， $h_\theta (x)$ 为0时，cost为0；但 $h_\theta (x)$ 趋向于1时，cost趋向于无限大。因此 $h_\theta (x)$ 为0时，y需要为0，不然得付出极大代价。

总之，因为逻辑回归代价函数使用均方误差时，代价函数为非凸函数。因此，构造一个新的代价函数。此时，代价函数为凸函数，且满足逻辑回归模型求解要求。

简化代价函数与梯度下降

目标

如何用更简单的方法写代价函数
如何利用梯度下降方法拟合logistic回归的参数
实现一个完整的logistic回归算法

定义新代价函数替代原本函数
$cost(h_\theta (x ,y)=-ylog(h_\theta (x)-(1-y)log(1-h_\theta (x))$

将上述函数代入 $J(\theta)$ 函数，所以最终目标即求的最小值 $\underset{\theta}{lim} J(\theta)$ 。

此函数为凸函数，因此可以使用梯度下降法。（ $g^{'} (x) = g (x) * (1 - g (x))$ ）

直接代入梯度下降的求导公式，得到公式如下。与多元线性回归参数计算公式类似，但性质完全不一样。因为假设函数 $h_\theta (x^{i})$ 不同。

高级优化

目标

优化logistic回归算法计算速度
logistic求参，即代价函数 $J(\theta)$ 求最小值，可用梯度下降

最小化代价函数方法包括梯度下降、BFGS等

多元分类：一对多

目标

如何将逻辑回归分类用在多元分类问题上。

多分类问题：y可以取1，2，3，4等离散值
下面以包括三个类别多元分类问题为例介绍，
将其划分为三个二分类问题，分别拟合三个分类器。对于每个分类器将小类当做正类别，因此x(1)实际是计算给定x和 $\theta$ 时y=1概率（三角形所在分类器）；x(2)……y=2。

总之，我们将多元分问题划分为多个二元分类问题，分别计算各分类器的 $h_{\theta}^{(i)}(x)$ ，值最大（也就是概率最大）即为最终被分的类别。

总结与代码实现

Logistic回归与线性回归差异

Logistic回归函数 分类函数，加一个sigmoid函数（神经网络中叫激活函数）；目标值为离散值，即类别；损失函数采用交叉熵损失函数
Linear回归函数 目标值为任意实数；损失函数采用均方误差

数据特征值为类别的处理

Logictic回归代码实现（Python）

"logistic regression"
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler#标准化
from sklearn.metrics import confusion_matrix,roc_curve,auc,classification_report #分类度量方法

class logisticRegressionGradientDescent:
    """
    逻辑回归，采用批量梯度下降，交叉熵损失函数
    """
    def __init__(self,dataset,attribute_list,aplha):
        """
        类初始化
        :param dataset:数据集
        :param attribute_list:特征列表
        :param aplha:学习率
        """
        self.alpha=aplha
        self.attr_list =attribute_list[:-1]#特征值
        self.target_lable=attribute_list[-1]#目标列名（取最后一列）
        #数据标准化
        self.X= StandardScaler().fit_transform(dataset.iloc[:,:-1])
        #对目标值进行编码
        self.y,self.class_lables = self.target_encode(dataset.iloc[:,-1])
        #划分数据集,分层抽样(stratify 按照列标y) random_state随机种子，防止每次运行结果重现
        self.x_train,self.x_test,self.y_train,self.y_test=\
            train_test_split(self.X,self.y,train_size=0.8,random_state=1,stratify=self.y)
        self.n,self.k=self.x_train.shape #训练数据样本量，特征变量个数
        self.cross_entropy_cost = []#每次训练交叉熵的平均值
        self.bdg_weight= dict()#每次训练权重更新

    @staticmethod
    def sigmoid(y_preval):
        '''
        激活函数
        :param y_preval: 样本值乘以权重系数后的值，数组
        :return:
        '''
        return 1/(1+np.exp(-y_preval))
    @staticmethod
    def target_encode(target):
        """
        静态方法，不用self,标记 @staticmethod
        二分类类别编码为0,1
        :param self:
        :param target: 类别列表
        :return:
        """
        class_lables=target.unique()# 获取不同类别值
        if len(class_lables)>2:
            print("此逻辑回归只是限于二分类，请选择多分类算法")
            exit(0)
        if(class_lables.max()==1 and class_lables.min()==0):
            return target.tolist(),class_lables
        else:
            #编码，采用列表推导式
            target_y = [0 if y == class_lables[0] else 1 for y in target]
            return target_y,class_lables

    def logistic_regression_model_train(self,max_lop,threshold):
        '''
        逻辑回归训练函数，采用批量梯度下降法，交叉熵损失函数
        :param max_lop: 最大训练次数
        :param threshold:退出训练阈值
        :return:
        '''
        np.random.seed(101)#设置随机种子，避免每次都一样
        weight =np.random.random(self.k)/100 #随机化权重 权重数同特征变量数  random模块的random函数
        weight_old =weight

        for j in range(self.k):
            self.bdg_weight[str(j)]=[]
        for loop in range(max_lop):
            self.alpha*=0.95#衰减指数慢慢减少
            y_hat = self.sigmoid(self.x_train.dot(weight.T))#激活函数·，预测属于某一类别的概率（0,1） 求x乘以权重 矩阵计算
            dw= ((y_hat-self.y_train)*self.x_train.T).mean(axis=1)#权值更新 对所有的列求均值 结果等同于(self.x_train.T*(y_hat-self.y_train)).mean(axis=1)
            weight=weight-self.alpha*dw #权值更新
            for j in range(self.k):
                self.bdg_weight[str(j)].append(weight[j])
            #交叉熵损失均值 1e-10是因为防止log后取值太小对结果产生影响
            ce_loss =-(np.array(self.y_train)*np.log(y_hat+1e-10)+
                       (1-np.array(self.y_train))*np.log(1-y_hat+1e-10)).mean()
            self.cross_entropy_cost.append(ce_loss)
            #退出条件，避免过拟合，提前停止训练
            if(len(self.cross_entropy_cost)>2):
                if np.abs(self.cross_entropy_cost[-1]-self.cross_entropy_cost[-2])>threshold:
                    break
                elif np.abs(weight-weight_old).all()<threshold:
                    break
                else:
                    weight_old=weight
        # #画图
        # plt.plot(self.cross_entropy_cost)
        # plt.show()
        return weight

    def plt_cost(self):
        """
        绘制交叉熵损失下降曲线
        :return:
        """
        plt.plot(self.cross_entropy_cost)
        plt.xlabel("Training times")
        plt.ylabel("Cross entropy cost")
        plt.title("Decline curve of loss function in Logistic regression")
        # plt.show()

    def plt_weight(self):
        """
        绘制权重更新曲线
        :return:
        """
        for k in range(self.k):
            plt.plot(self.bdg_weight[str(k)],label=self.attr_list[k])
        plt.legend()
        plt.xlabel("Training times")
        plt.ylabel("Weight")
        plt.title("Logistic regression weight coefficient update curve")

    def predict(self,weight):
        """
        测试样本预测类别，并根据概率进行类别编码
        :param weight:训练最终权重
        :return:
        """
        y_pred =[]#预测类别
        y_score =self.sigmoid(self.x_test.dot(weight.T))
        threshold =0.5 # 类别不平衡问题需要考虑阈值，待解决
        for y in y_score:
            if y<threshold:
                y_pred.append(0)
            elif y>= threshold:
                y_pred.append(1)
        cm= confusion_matrix(self.y_test,y_pred)
        acc= np.sum(np.diag(cm))/len(y_pred) #预测精度
        return y_pred,cm,acc,y_score

    def plt_confusion_matrix(self,cm,acc):
        """
        绘制混淆矩阵
        :param cm: 混淆矩阵
        :param acc: 预测精度
        :return:
        """
        cm =pd.DataFrame(cm,columns=self.class_lables,index=self.class_lables)
        sns.heatmap(cm,annot=True,cbar=False,fmt='d')#绘制热图
        plt.xlabel("Predict")
        plt.ylabel("True")
        plt.title("Confusion matrix and accuracy =%.2f%%" %(acc*100))#%%表示直接输出一个%

    def plt_roc_auc(self,y_score):
        """
        绘制ROC曲线，并计算AUC
        :param y_score: 预测样本预测评分
        :return:
        """
        false_positive_rate,true_positive_rate,_ =roc_curve(self.y_test,y_score)
        roc_auc=auc(false_positive_rate,true_positive_rate)
        plt.plot(false_positive_rate,true_positive_rate,"b",label="AUC=%.2f" % roc_auc)
        plt.legend(loc="lower right")
        plt.plot([0,1],[0,1],"r--")
        plt.xlabel("False_positive_rate")
        plt.ylabel("True_positive_rate")
        plt.title("Logistic Regression of Binary Classification ROC Curve and AUC")

if __name__=='__main__':
    url="../datasets/Mtrain_set.csv"#数据集路径
    data=pd.read_csv(url).dropna().iloc[:,1:]
    attribute_list =data.columns#列名列表  list列表，没有loc属性
    alpha =0.8
    #print(attribute_list)
    lrgd=logisticRegressionGradientDescent(data,attribute_list,alpha)
    weight=lrgd.logistic_regression_model_train(1000,1e-8)
    print("逻辑回归，采用批量梯度下降法训练，最终特征变量系数：")
    for i in range(lrgd.k):
        print(" %-10s %.15f" % (lrgd.attr_list[i],weight[i]))
    y_pred,cm,acc,y_score =lrgd.predict(weight)
    #绘图
    plt.figure(figsize=(12,10))
    plt.subplot(221)#表示将整个图像窗口分为2行2列, 当前位置为1.
    lrgd.plt_cost()
    plt.subplot(222)
    lrgd.plt_weight()
    plt.subplot(223)
    lrgd.plt_confusion_matrix(cm,acc)
    plt.subplot(224)
    lrgd.plt_roc_auc(y_score)
    plt.show()

    #还可以再打印出一个分类报告

运行结果

可视化，拟合效果不太好

参考资料
网易版吴恩达机器学习
吴恩达机器学习网易
2021机器学习（西瓜书+李航统计学习方法）实践部分 + Python

你可能感兴趣的:(机器学习,机器学习,逻辑回归)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
【中国国际航空-注册_登录安全分析报告】风控牛验证码接口安全评测系列安全行为验证极验网易易盾智能手机
前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机器学习能力提高的当下，连百度这样的大厂都遭受攻击导致点名批评，图形验证及交互验证方式的安全性到底如何？请看具体分析一、中国国际航空PC
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
七.正则化愿风去了
吴恩达机器学习之正则化（Regularization）http://www.cnblogs.com/jianxinzhou/p/4083921.html从数学公式上理解L1和L2https://blog.csdn.net/b876144622/article/details/81276818虽然在线性回归中加入基函数会使模型更加灵活，但是很容易引起数据的过拟合。例如将数据投影到30维的基函数上，模
机器学习-------数据标准化罔闻_spider 数据分析算法机器学习人工智能
什么是归一化，它与标准化的区别是什么？一作用在做训练时，需要先将特征值与标签标准化，可以防止梯度防炸和过拟合；将标签标准化后，网络预测出的数据是符合标准正态分布的—StandarScaler()，与真实值有很大差别。因为StandarScaler()对数据的处理是（真实值-平均值）/标准差。同时在做预测时需要将输出数据逆标准化提升模型精度：标准化/归一化使不同维度的特征在数值上更具比较性，提高分类
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性 aehrutktrjk 人工智能 easyui 前端 python
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性引言在机器学习和自然语言处理领域，选择合适的训练示例对模型性能至关重要。最大边际相关性(MaximalMarginalRelevance,MMR)是一种优秀的示例选择方法，它不仅考虑了示例与输入的相关性，还注重保持所选示例之间的多样性。本文将深入探讨如何使用MMR来选择示例，以提高AI模型的性能和泛化能力。什么是最大边际相关性(MM
LangChain集成指南:如何利用多样化的AI提供商 aehrutktrjk 人工智能 langchain python
LangChain集成指南:如何利用多样化的AI提供商引言在人工智能和机器学习领域,LangChain已成为一个强大而灵活的框架,允许开发者轻松集成各种AI服务提供商。本文将深入探讨LangChain的集成能力,介绍如何利用不同的AI提供商来增强你的应用程序,并提供实用的代码示例。LangChain集成概览LangChain支持多种AI提供商的集成,这些集成可以分为两类:独立包集成:这些提供商有独
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
【机器学习与R语言】1-机器学习简介苹果酱0567 面试题汇总与解析 java 中间件开发语言 spring boot 后端
1.基本概念机器学习：发明算法将数据转化为智能行为数据挖掘VS机器学习：前者侧重寻找有价值的信息，后者侧重执行已知的任务。后者是前者的先期准备过程：数据——>抽象化——>一般化。或者：收集数据——推理数据——归纳数据——发现规律抽象化：训练：用一个特定模型来拟合数据集的过程用方程来拟合观测的数据：观测现象——数据呈现——模型建立。通过不同的格式来把信息概念化一般化：一般化：将抽象化的知识转换成可用
Python前沿技术：机器学习与人工智能 4.0啊 Python 人工智能 python 机器学习
Python前沿技术：机器学习与人工智能一、引言随着科技的飞速发展，机器学习和人工智能（AI）已经成为了计算机科学领域的热门话题。Python作为一门易学易用且功能强大的编程语言，已经成为了这两个领域的首选语言之一。本文将深入探讨Python在机器学习和人工智能领域的应用，以及一些前沿技术和工具。二、Python机器学习基础2.1机器学习概述机器学习是人工智能（AI）的一个关键子集，它的核心在于让
chatgpt赋能python：如何在Python中计算平均值 tulingtest ChatGpt python chatgpt numpy 计算机
如何在Python中计算平均值计算平均值是数据分析、统计和机器学习等许多领域中的常见任务。Python作为一门功能强大且易于学习的编程语言，为计算平均值提供了多种方法。在本文中，我们将介绍如何在Python中计算平均值。什么是平均值简单来说，平均值是一组数字的总和除以数字的数量。例如，对于数字序列1，3，5，7，9，平均值是(1+3+5+7+9)/5=5。平均值在数据分析中非常有用，因为它可以提供
Python 初学者入门必知： Anaconda是什么？有什么作用？怎么使用？懒大王爱吃狼 Python基础 python 开发语言 python基础 python学习 anaconda anaconda安装 python教程
初学者在学习Python时，经常看到的一个名字是Anaconda。究竟什么是Anaconda，为什么它如此受欢迎？在这篇文章中，我们将探讨Anaconda，了解Anaconda的从安装到使用的。Anaconda是一个免费开源的Python和R编程发行版，包含上千个适用于数据科学和机器学习的包。同时，配备了Spyder和Jupyternotebook等工具，初学者可以使用它们来学习Python，使用
每天五分钟玩转深度学习PyTorch：模型参数优化器torch.optim 幻风_huanfeng 深度学习框架pytorch 深度学习 pytorch 人工智能神经网络机器学习优化算法
本文重点在机器学习或者深度学习中，我们需要通过修改参数使得损失函数最小化(或最大化)，优化算法就是一种调整模型参数更新的策略。在pytorch中定义了优化器optim，我们可以使用它调用封装好的优化算法，然后传递给它神经网络模型参数，就可以对模型进行优化。本文是学习第6步(优化器)，参考链接pytorch的学习路线随机梯度下降算法在深度学习和机器学习中，梯度下降算法是最常用的参数更新方法，它的公式
一切皆是映射：AI的去中心化：区块链技术的融合 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
一切皆是映射：AI的去中心化：区块链技术的融合作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：AI，区块链，去中心化，智能合约，共识机制，数据安全，隐私保护，分布式账本技术，机器学习，数据隐私1.背景介绍1.1问题的由来随着人工智能（AI）技术的快速发展，其在各个领域的应用越来越广泛，从自动驾驶、智能医疗到金融服务，AI正在改变着我们的生活。
第五届核磁机器学习班（训练营：2023.6.5~6.17）茗创科技
茗创科技专注于脑科学数据处理，涵盖（EEG/ERP,fMRI,结构像,DTI,ASL,FNIRS）等，欢迎留言讨论及转发推荐，也欢迎了解茗创科技的脑电课程，数据处理服务及脑科学工作站销售业务，可添加我们的工程师（微信号MCKJ-zhouyi或17373158786）咨询。★课程简介★基于血氧水平依赖的功能磁共振成像(fMRI)技术,利用其数据构建的功能性脑网络后,发现脑并不是一个单纯对外界刺激进行
矩阵求逆（JAVA）初等行变换 qiuwanchi 矩阵求逆（JAVA）
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(初等行变换) * @author 邱万迟 *
JDK timer antlove java jdk schedule code timer
1.java.util.Timer.schedule(TimerTask task, long delay)：多长时间（毫秒）后执行任务 2.java.util.Timer.schedule(TimerTask task, Date time)：设定某个时间执行任务 3.java.util.Timer.schedule(TimerTask task, long delay,longperiod
JVM调优总结 -Xms -Xmx -Xmn -Xss coder_xpf jvm 应用服务器
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx
JDBC连接数据库 Array_06 jdbc
package Util; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; public class JDBCUtil { //完
Unsupported major.minor version 51.0（jdk版本错误） oloz java
java.lang.UnsupportedClassVersionError: cn/support/cache/CacheType : Unsupported major.minor version 51.0 (unable to load class cn.support.cache.CacheType) at org.apache.catalina.loader.WebappClassL
用多个线程处理1个List集合 362217990 多线程 thread list 集合
昨天发了一个提问，启动5个线程将一个List中的内容，然后将5个线程的内容拼接起来，由于时间比较急迫，自己就写了一个Demo，希望对菜鸟有参考意义。。 import java.util.ArrayList; import java.util.List; import java.util.concurrent.CountDownLatch; public c
JSP简单访问数据库香水浓 sql mysql jsp
学习使用javaBean，代码很烂，仅为留个脚印 public class DBHelper { private String driverName; private String url; private String user; private String password; private Connection connection; privat
Flex4中使用组件添加柱状图、饼状图等图表 AdyZhang Flex
1.添加一个最简单的柱状图 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 <?xml version= "1.0"&n
Android 5.0 - ProgressBar 进度条无法展示到按钮的前面 aijuans android
在低于SDK < 21 的版本中，ProgressBar 可以展示到按钮前面，并且为之在按钮的中间，但是切换到android 5.0后进度条ProgressBar 展示顺序变化了，按钮再前面，ProgressBar 在后面了我的xml配置文件如下： [html] view plain copy <RelativeLa
查询汇总的sql baalwolf sql
select list.listname, list.createtime,listcount from dream_list as list , (select listid,count(listid) as listcount from dream_list_user group by listid order by count(
Linux du命令和df命令区别 BigBird2012 linux
1，两者区别 du，disk usage,是通过搜索文件来计算每个文件的大小然后累加，du能看到的文件只是一些当前存在的，没有被删除的。他计算的大小就是当前他认为存在的所有文件大小的累加和。
AngularJS中的$apply，用还是不用？ bijian1013 JavaScript AngularJS $apply
在AngularJS开发中，何时应该调用$scope.$apply()，何时不应该调用。下面我们透彻地解释这个问题。但是首先，让我们把$apply转换成一种简化的形式。 scope.$apply就像一个懒惰的工人。它需要按照命
[Zookeeper学习笔记十]Zookeeper源代码分析之ClientCnxn数据序列化和反序列化 bit1129 zookeeper
ClientCnxn是Zookeeper客户端和Zookeeper服务器端进行通信和事件通知处理的主要类，它内部包含两个类，1. SendThread 2. EventThread， SendThread负责客户端和服务器端的数据通信，也包括事件信息的传输，EventThread主要在客户端回调注册的Watchers进行通知处理 ClientCnxn构造方法 &
【Java命令一】jmap bit1129 Java命令
jmap命令的用法： [hadoop@hadoop sbin]$ jmap Usage: jmap [option] <pid> (to connect to running process) jmap [option] <executable <core> (to connect to a
Apache 服务器安全防护及实战 ronin47
此文转自IBM. Apache 服务简介 Web 服务器也称为 WWW 服务器或 HTTP 服务器 (HTTP Server)，它是 Internet 上最常见也是使用最频繁的服务器之一，Web 服务器能够为用户提供网页浏览、论坛访问等等服务。由于用户在通过 Web 浏览器访问信息资源的过程中，无须再关心一些技术性的细节，而且界面非常友好，因而 Web 在 Internet 上一推出就得到
unity 3d实例化位置出现布置？ brotherlamp unity教程 unity unity资料 unity视频 unity自学
问：unity 3d实例化位置出现布置？答：实例化的同时就可以指定被实例化的物体的位置,即 position Instantiate (original : Object, position : Vector3, rotation : Quaternion) : Object 这样你不需要再用Transform.Position了, 如果你省略了第二个参数(
《重构，改善现有代码的设计》第八章 Duplicate Observed Data bylijinnan java 重构
import java.awt.Color; import java.awt.Container; import java.awt.FlowLayout; import java.awt.Label; import java.awt.TextField; import java.awt.event.FocusAdapter; import java.awt.event.FocusE
struts2更改struts.xml配置目录 chiangfai struts.xml
struts2默认是读取classes目录下的配置文件，要更改配置文件目录，比如放在WEB-INF下，路径应该写成../struts.xml(非/WEB-INF/struts.xml) web.xml文件修改如下： <filter> <filter-name>struts2</filter-name> <filter-class&g
redis做缓存时的一点优化 chenchao051 redis hadoop pipeline
最近集群上有个job，其中需要短时间内频繁访问缓存，大概7亿多次。我这边的缓存是使用redis来做的，问题就来了。首先，redis中存的是普通kv，没有考虑使用hash等解结构，那么以为着这个job需要访问7亿多次redis，导致效率低，且出现很多redi
mysql导出数据不输出标题行 daizj mysql 数据导出去掉第一行去掉标题
当想使用数据库中的某些数据，想将其导入到文件中，而想去掉第一行的标题是可以加上-N参数如通过下面命令导出数据： mysql -uuserName -ppasswd -hhost -Pport -Ddatabase -e " select * from tableName" > exportResult.txt 结果为： studentid
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
先下载PHPEXCEL类文件，放在class目录下面，然后新建一个index.php文件，内容如下 <?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('
爱情格言 dcj3sjt126com 格言
1) I love you not because of who you are, but because of who I am when I am with you. 　　我爱你，不是因为你是一个怎样的人，而是因为我喜欢与你在一起时的感觉。 　　2) No man or woman is worth your tears, and the one who is, won‘t
转 Activity 详解——Activity文档翻译 e200702084 android UI sqlite 配置管理网络应用
activity 展现在用户面前的经常是全屏窗口，你也可以将 activity 作为浮动窗口来使用（使用设置了 windowIsFloating 的主题），或者嵌入到其他的 activity （使用 ActivityGroup ）中。当用户离开 activity 时你可以在 onPause() 进行相应的操作。更重要的是，用户做的任何改变都应该在该点上提交 ( 经常提交到 ContentPro
win7安装MongoDB服务 geeksun mongodb
1. 下载MongoDB的windows版本：mongodb-win32-x86_64-2008plus-ssl-3.0.4.zip，Linux版本也在这里下载，下载地址： http://www.mongodb.org/downloads 2. 解压MongoDB在D:\server\mongodb, 在D:\server\mongodb下创建d
Javascript魔法方法:__defineGetter__,__defineSetter__ hongtoushizi js
转载自： http://www.blackglory.me/javascript-magic-method-definegetter-definesetter/ 在javascript的类中,可以用defineGetter和defineSetter_控制成员变量的Get和Set行为例如,在一个图书类中,我们自动为Book加上书名符号: function Book(name){
错误的日期格式可能导致走nginx proxy cache时不能进行304响应 jinnianshilongnian cache
昨天在整合某些系统的nginx配置时，出现了当使用nginx cache时无法返回304响应的情况，出问题的响应头： Content-Type:text/html; charset=gb2312 Date:Mon, 05 Jan 2015 01:58:05 GMT Expires:Mon , 05 Jan 15 02:03:00 GMT Last-Modified:Mon, 05
数据源架构模式之行数据入口 home198979 PHP 架构行数据入口
注：看不懂的请勿踩，此文章非针对java，java爱好者可直接略过。一、概念行数据入口（Row Data Gateway）：充当数据源中单条记录入口的对象，每行一个实例。二、简单实现行数据入口为了方便理解，还是先简单实现： <?php /** * 行数据入口类 */ class OrderGateway { /*定义元数
Linux各个目录的作用及内容 pda158 linux 脚本
1）根目录“/” 　　根目录位于目录结构的最顶层，用斜线（/）表示，类似于 Windows 操作系统的“C:\“，包含Fedora操作系统中所有的目录和文件。　　2）/bin 　　/bin 　　目录又称为二进制目录，包含了那些供系统管理员和普通用户使用的重要 linux命令的二进制映像。该目录存放的内容包括各种可执行文件，还有某些可执行文件的符号连接。常用的命令有：cp、d
ubuntu12.04上编译openjdk7 ol_beta HotSpot jvm jdk OpenJDK
获取源码从openjdk代码仓库获取(比较慢) 安装mercurial Mercurial是一个版本管理工具。 sudo apt-get install mercurial 将以下内容添加到$HOME/.hgrc文件中，如果没有则自己创建一个： [extensions] forest=/home/lichengwu/hgforest-crew/forest.py fe
将数据库字段转换成设计文档所需的字段 vipbooks 设计模式工作正则表达式
哈哈，出差这么久终于回来了，回家的感觉真好！ PowerDesigner的物理数据库一出来，设计文档中要改的字段就多得不计其数，如果要把PowerDesigner中的字段一个个Copy到设计文档中，那将会是一件非常痛苦的事情。

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他