songsonglei4

线性回归、逻辑回归以及感知机的Python实现和比较分析

文章目录

线性回归
逻辑回归
感知机
比较分析
引用

线性回归

线性回归是回归问题中最基础的一个部分，它通过对一系列特征进行线性关系的操作来拟合一个能够刻画数据集的超平面。如图所示的例子，对于散落在坐标系里的每一个点，它的 $x$ 坐标可以看成是它的特征，而它的 $y$ 坐标则是对应的label值，我们需要对这一组数据进行很好的刻画，才能使得我们在拿到一组新数据时可以准确的预测它的值。在这里，我们采用的是线性回归的方式，即 $y=\theta x+b$ ,因此，二维里就是一条直线。

下面我们将线性回归归纳到一般的情况下，即 $h_\theta(x)=\theta_1x_1+\theta_2x_2+......+\theta_nx_n+b=\theta^Tx+b$ ,其中 $\theta=[\theta_1,\theta_2,......\theta_n]$ 是回归的系数， $b$ 是偏差值，一般保持不变。对于样本 $x^i$ ,它的特征为 $[x^i_1,x^i_2,......,x^i_n]$ ,对于这样的线性回归方程，采用的代价函数是平均误差平方和，公式如下，
$J(\theta) = \frac{1}{2m} \sum_{i=0}^m (h_\theta(x^i)-y^i)^2$
有了如上的代价函数，下一步需要做的就是最小化此平均误差平方和，在这里采用的是梯度下降，以下是对 $\theta$ 以及 $b$ 的分别求偏导，
$\frac {\partial J(\theta)}{\partial \theta} = \frac{1}{m} \sum_{i=0}^m x^i(h_\theta(x^i)-y^i)$
$\frac {\partial J(\theta)}{\partial b} = \frac{1}{m} \sum_{i=0}^m (h_\theta(x^i)-y^i)$
由于 $\frac{1}{m}$ 在数据集固定时是一个定值，因此在采用梯度下降算法进行求解最小值的时候将它视为常数，有如下的梯度下降计算方式，
$\theta = \theta - \alpha \frac {\partial J(\theta)}{\partial \theta}$
$\frac {\partial J(\theta)}{\partial b}$
这里的 $\alpha$ 为学习率也就是迭代的步长，通过每一步沿着代价函数的负梯度方向进行优化，最终可以得到一个最优的代价函数值，此时的 $\theta$ 以及 $b$ 就作为线性回归模型的回归系数以及偏差值。具体的python实现代码如下，

import numpy as np

class linear_model(object):
    def __init__(self,X,y):
        self.X = np.mat(X)
        self.y = np.mat(y)
        self.number = len(X)
        self.length = len(X[0])
        self.theta = np.ones((self.length,1))
        self.bias = 0.1
        self.train()

    def cost_function(self,X,y):
        result = np.dot(X,self.theta)
        minus_val = y - result
        cost = 0.5*sum(np.array(minus_val)**2)
        if np.isnan(cost):
            return np.inf
        return cost

    def gradientdescent(self,alpha):
        result = np.dot(self.X,self.theta) + self.bias
        #print(result)
        fro_part = result - self.y
        all_gradient = np.dot(self.X.transpose(),fro_part)
        #print(all_gradient)
        self.theta = self.theta - alpha*all_gradient
        self.bias = self.bias - alpha*fro_part


    def train(self,iterations=10000,alpha=0.01,method=0):
        for k in range(iterations):
            if method == 0:
                self.gradientdescent(alpha)

    def predict(self,X_test):
        #print(np.dot(X_test,self.theta))
        return np.dot(X_test,self.theta)

X = [[1.50] ,[2.00],[2.50],[3.00],[3.50],[4.00],[6.00]]
y = [[6.450],[7.450],[8.450],[9.450],[11.450],[15.450],[18.450]]
X_test = [[2.5],[6.0]]
y_test = [[8.450],[18.450]]
y = linear_model(X,y)
y_test1 = y.predict(X_test)
cost = y.cost_function(X_test,y_test)
print(y_test1)
print(cost)

逻辑回归

对于线性回归，我们一般用它来进行回归预测一定的值，不能够作为分类器来使用。但我们通过分析，可以知道线性回归产生的是一个超平面，如果这个超平面可以将不同的两类点分开，那么他就可以作为一个分类器。通过一定的变化，就可以将线性组合的模式应用于分类上，也即是逻辑回归。这里，引入一个sigmoid函数，它是一个0-1之间的S型曲线，在二分类中，可以用此来描述每个特征点属于类别1的概率。如图为sigmoid函数的示意图，

这个sigmoid函数定义为
$\frac{1} {1+e^{-x}}$
再由线性回归的 $h_\theta(x)=\theta_1x_1+\theta_2x_2+......+\theta_nx_n+b=\theta^Tx+b$ 带入到 $f (x)$ 得到新的 $h_\theta(x)$ 为 $\frac{1} {1+e^{-(\theta x + b)}}$ ，这就是它的预测模型，根据 $h_\theta(x)$ 可以计算出预测的概率值。
那么如何训练这个模型呢？由于我们把它看作是类别的概率，那么我们可以采用似然估计的方式，似然函数如下，
$\prod_{i=1}^N [\pi(x_i)]^{y_i}[1-\pi(x_i)]^{1-y_i}$
上述式子中的 $\pi(x_i)$ 表示的是在特征 $x_i$ 下类别为1的概率。接着取对数似然函数 $L(\theta)$ ，有
$\sum_{i=1}^N [y_ilog\pi(x_i) +(1-y_i)log(1-\pi(x_i))]$
那么我们需要最大化似然函数，也就是求 $L(\theta)$ 的极大值，即求 $-L(\theta)$ 的极小值，采用梯度下降的方法即可解决这样的问题。通过计算 $J(\theta,b)$ = $-L(\theta)$ 的偏导数如下，具体推导可参见此链接
$\frac {\partial J(\theta,b)}{\partial \theta} = \sum_{i=0}^N x^i(h_\theta(x^i)-y^i)$
$\frac {\partial J(\theta,b)}{\partial b} = \sum_{i=0}^N (h_\theta(x^i)-y^i)$
同样采用形如线性回归的梯度下降即可优化求得参数 $\theta$ 和b的值。
实现的代码如下，

import numpy as np
import matplotlib.pyplot as plt

class Logistic_reg(object):
    def __init__(self,X,y):
        self.X = X
        self.y = y
        self.b = 0.1
        self.length = len(X[0])
        self.num = len(X)
        self.theta = np.ones((self.length,1))

    def sigmoid(self,re):
        return 1.0 / (1.0 + np.exp(re))

    def cost_function(self):
        cost_sum = 0.0
        for i in range(self.num):
            cost_tem = self.y[i]*np.exp(self.sigmoid(np.dot(self.theta,np.array(self.X[i]))+self.b)) + \
                       (1 - self.y[i]) * np.exp(1 - self.sigmoid(np.dot(self.theta,np.array(self.X[i]))+self.b))
            cost_sum += cost_tem
        return -1 * cost_sum / self.num

    def gradientdescent(self,alpha):
        mat_X = np.mat(self.X)
        mat_y = np.mat(self.y)
        result = self.sigmoid(np.dot(mat_X, self.theta) + self.b)
        # print(result)
        fro_part = result - mat_y
        all_gradient = np.dot(mat_X.transpose(), fro_part)
        # print(all_gradient)
        self.theta = self.theta - alpha * all_gradient
        self.b = self.b - alpha * fro_part

    def stoc_grad_ascent_one(self,alpha): #随机梯度下降
        dataIndex = list(range(self.num))
        for i in range(self.num):
            randIndex = int(np.random.uniform(0, len(dataIndex)))
            h = self.sigmoid(np.dot(self.theta.transpose(),np.array(self.X[i]))+self.b)  # 数值计算
            error =  h - self.y[i]
            split_x = [[j] for j in self.X[i]]
            self.theta = self.theta - alpha * error * np.array(split_x)
            self.b = self.b - alpha * error
            del (dataIndex[randIndex])


    def train(self,iterations=100,alpha=0.1,method=1):
        for k in range(iterations):
            if method == 0:
                self.gradientdescent(alpha)
            if method == 1:
                self.stoc_grad_ascent_one(alpha)
        return self.theta,self.b


    def predict(self,X_test):
        val = self.sigmoid(np.dot(self.theta.transpose(),np.array(X_test)) + self.b)
        return 1 if val > 0.5 else 0


X = [[-0.017612,14.053064],[-1.395634,4.662541],[-0.752157,6.538620],[-1.322371,7.152853],[0.423363,11.054677],
     [0.406704,7.067335],[0.667394,12.741452],[-2.460150,6.866805],[0.569411,9.548755],[-0.026632,10.427743]]

y = [[0],[1],[0],[0],[0],[1],[0],[1],[0],[0]]

lr = Logistic_reg(X,y)
theat,b = lr.train()
print(theat)
print(b)

xcord1 = []
ycord1 = []
xcord2 = []
ycord2 = []
for i in range(len(y)):
    if y[i][0] == 1:
        xcord1.append(X[i][0])
        ycord1.append(X[i][1])
    else:
        xcord2.append(X[i][0])
        ycord2.append(X[i][1])
fig = plt.figure()
ax = fig.add_subplot(111)
ax.scatter(xcord1, ycord1,s=30, c='red', marker='s')
ax.scatter(xcord2, ycord2, s=30, c='green')
x = np.arange(-3, 3, 0.1)
b_mean = np.mean(b)
print(b_mean)
y = (-theat[0, 0] - theat[1, 0] * x) / b_mean #b[0, 0]  #matix
ax.plot(x, y)
plt.xlabel('X1')
plt.ylabel('X2')
plt.show()

感知机

感知机是根据输入实例的特征向量 x 对其进行二类分类的线性模型：
$h_\theta(x)=sign(\theta_1x_1+\theta_2x_2+......+\theta_nx_n+b)=sign(\theta^Tx+b)$
$s i g n (x)$ 函数标准如下,
$\begin{cases} 1, & \text{if x >=0} \\ -1, & \text{if x < 0} \end{cases}$
感知机模型对应于输入空间（特征空间）中的分离超平面 $\theta x+b=0$ 其中 $\theta$ 是超平面的法向量，b是超平面的截距。
可见感知机是一种线性分类模型，属于判别模型。
感知机学习的重要前提假设是训练数据集是线性可分的。
感知机学的策略是极小化损失函数。
损失函数的一个自然选择是误分类点的总数。但是，这样的损失函数不是参数 $\theta$ , b的连续可导的函数，不易于优化。所以通常是选择误分类点到超平面 S 的总距离：
$L(\theta,b)=-\sum_{x_i\in M}y_i(\theta x_i+b)$
学习的策略就是求得使 $L(\theta,b)$ 为最小值的 $\theta$ 和 b。其中 M 是误分类点的集合。
首先，任意选取一个超平面 $\theta_0$ , $b_0$ ,然后用梯度下降法不断地极小化目标函数。极小化的过程中不是一次使 M 中所有误分类点得梯度下降，而是一次随机选取一个误分类点，使其梯度下降。梯度计算如下。
$\frac {\partial L(\theta,b)}{\partial \theta} = - \sum_{x_i\in M} x_i y_i$
$\frac {\partial L(\theta,b)}{\partial b} = - \sum_{x_i\in M} y_i$
随机选取一个误分类点(xi,yi)，对 $\theta$ ,b进行更新：
$\theta \leftarrow \theta + \eta x_i y_i$
$\leftarrow b + \eta y_i$
其中 $\eta$ 为学习率。
实现的代码如下：

import numpy as np

class Perceptrom(object):
    def __init__(self,X,y):
        self.X = np.array(X)
        self.length = len(X[0])
        self.y = np.array(y)
        self.w = np.ones((self.length))
        self.b = 0

    def process(self,delta,iterations=100):
        for i in range(iterations):
            choice = -1
            for j in range(len(self.X)):
                if np.sign(np.dot(self.w,self.X[j])+self.b) != self.y[j]:
                    choice = j
                    break
            if choice == -1:
                break
            self.w = self.w + delta * self.y[choice] * self.X[choice]
            self.b = self.b + delta * self.y[choice]

    def predict(self,x_test):
        x_test = np.array(x_test)
        return np.sign(np.dot(self.w,x_test)+self.b)


x_train = [[0.5,0],[0,0.5],[1,0.5],[0.5,1]]
y_train = [-1,-1,1,1]
x_test = [1,1]
perceptron = Perceptrom(x_train,y_train)
perceptron.process(1,100)
y = perceptron.predict(x_test)
print(y)

比较分析

总体上来说，三种虽然是属于不同的任务，而且设计的思路也不太相同，但他们的最终求解形式却几乎相似，可能的原因是他们设计的基础都是基于线性的函数 $\theta x+b$ 。
对于PLA即感知机，它是对线性可分的数据集十分有效，但只能用于线性可分的数据集。
对于逻辑回归，相较于PLA，它不要求数据集线性可分，同时它十分容易优化，而且，解释性也比较强，工程上多使用。
对于线性回归，它十分简单，易于优化，解释性较好。

引用

【1】https://blog.csdn.net/wgdzz/article/details/46462813
【2】https://blog.csdn.net/liulina603/article/details/78676723
【3】https://www.cnblogs.com/GuoJiaSheng/p/3928160.html
【4】李航–统计学习方法

你可能感兴趣的:(线性回归,逻辑回归,感知机,机器学习)

Python 库的记录 weixin_40895135 python
GitHub-jobbole/awesome-python-cn:Python资源大全中文版，内容包括：Web框架、网络爬虫、网络内容提取、模板引擎、数据库、数据可视化、图片处理、文本处理、自然语言处理、机器学习、日志、代码分析等环境管理管理Python版本和环境的工具p–非常简单的交互式python版本管理工具。pyenv–简单的Python版本管理工具。Vex–可以在虚拟环境中执行命令。vir
科研绘图系列：R语言绘制线性回归连线图（line chart）生信学习者1 SCI科研绘图系列 r语言线性回归数据可视化
禁止商业或二改转载，仅供自学使用，侵权必究，如需截取部分内容请后台联系作者!文章目录介绍加载R包数据下载导入数据数据预处理画图保存图片系统信息参考介绍科研绘图系列：R语言绘制线性回归连线图（linechart）加载R包library(tidyverse)library(ggthemes)library(readxl)数据下载所需要的数据和代码通过以下链接下载：百度网盘链接:
启元世界（Inspir.ai）技术浅析（一）爱研究的小牛 AIGC—游戏制作人工智能机器学习 AIGC 深度学习
启元世界（Inspir.ai）作为全球领先的通用人工智能平台公司，自2017年成立以来，一直致力于通过人工智能技术提升产业效能和生活体验。公司汇聚了来自全球顶尖公司和高等学府的技术专家，专注于深度强化学习、推荐算法以及机器学习系统平台等前沿领域，并成功将人工智能技术应用于数字娱乐、智能决策和机器人等多个领域。一、核心技术启元世界在人工智能领域取得了多项突破性进展，其核心技术涵盖了以下几个方面：1.
ImportError: DLL load failed while importing _rust: 找不到指定的程序的解决方案爱编程的喵喵 Python基础课程 python ImportError DLL load failed _rust 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了ImportError:DLLloa
Rust中奖励函数的实现与应用 AI天才研究院计算 AI大模型企业级应用开发实战大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Rust中奖励函数的实现与应用作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：Rust,奖励函数,强化学习,机器学习,状态空间1.背景介绍1.1问题的由来在机器学习领域，特别是在强化学习（ReinforcementLearning,RL）中，奖励函数（RewardFunction）扮演着至关重要的角色。它定义了智能体（Agent）在执行任务时
理解随机森林算法菌菌的快乐生活算法随机森林机器学习
基本概念随机森林（RandomForest）是一种集成学习算法，它属于机器学习中的监督学习算法。简单来说，它就像是一群“专家”（决策树）在一起讨论并做出决策。想象你要判断一个水果是苹果还是橙子，你可以通过观察水果的颜色、形状、大小等特征。随机森林算法就是利用很多棵决策树来对这个水果进行判断。每一棵决策树就像一个小专家，它们根据自己对这些特征的判断来给出一个答案（是苹果还是橙子），最后综合这些小专家
AI常见的算法纠结哥_Shrek 人工智能算法
人工智能（AI）中常见的算法分为多个领域，如机器学习、深度学习、强化学习、自然语言处理和计算机视觉等。以下是一些常见的算法及其用途：1.机器学习(MachineLearning)监督学习(SupervisedLearning)线性回归(LinearRegression)：用于预测连续值，如房价预测。逻辑回归(LogisticRegression)：用于分类问题，如垃圾邮件检测。支持向量机(SVM)
【书生·浦语大模型实战营】学习笔记（五）：LMDeploy 量化部署 GoAI 深入浅出LLM 深入浅出AI 大模型 LLM 部署人工智能 LMDeploy
AI学习星球推荐：GoAI的学习社区知识星球是一个致力于提供《机器学习|深度学习|CV|NLP|大模型|多模态|AIGC》各个最新AI方向综述、论文等成体系的学习资料，配有全面而有深度的专栏内容，包括不限于前沿论文解读、资料共享、行业最新动态以、实践教程、求职相关（简历撰写技巧、面经资料与心得）多方面综合学习平台，强烈推荐AI小白及AI1；；爱好者学习，性价比非常高！加入星球➡️点击链接
PyTorch 框架实现线性回归：从数据预处理到模型训练全流程大模型铲屎官 PyTorch pytorch 线性回归人工智能深度学习 python
系列文章目录Pytorch基础篇01-PyTorch新手必看：张量是什么？5分钟教你快速创建张量！02-张量运算真简单！PyTorch数值计算操作完全指南03-Numpy还是PyTorch？张量与Numpy的神奇转换技巧04-揭秘数据处理神器：PyTorch张量拼接与拆分实用技巧05-深度学习从索引开始：PyTorch张量索引与切片最全解析06-张量形状任意改！PyTorchreshape、tra
python中cv是什么_python里面cv是什么意思 weixin_39639568 python中cv是什么
OpenCV(OpenSourceComputerVisionLibrary)开放源代码计算机视觉库，主要算法涉及图像处理、计算机视觉和机器学习相关方法。OpenCV其实就是一堆C和C++语言的源代码文件，这些源代码文件中实现了许多常用的计算机视觉算法。OpenCV由一系列C函数和C++类构成，它有C，C++，Python和java接口，当前SDK(SoftwareDevelopmentKit软件
论文AI率：检测原理是什么？该如何降低论文AI率？迪娜学姐人工智能
我是娜姐@迪娜学姐，一个SCI医学期刊编辑，探索用AI工具提效论文写作和发表。上一篇介绍了10个检测AI率的在线工具。本篇来说说AI率到底是如何检测出来的？该如何有效降低论文的AI率？和AI大模型一样，AI检测的核心也是机器学习模型，它们在包含人类创作和AI生成文本样本的大型数据集上进行训练，通过学习每种文本中存在的模式和特征，以此来区分人类创作的文本和AI生成文本。AI检测器查找的一些关键特征包
深入剖析ipywidgets-7.0.0b1：Python交互式前端库的新进展多行不易
本文还有配套的精品资源，点击获取简介：ipywidgets是一个用于创建交互式用户界面的Python库，广泛应用于数据可视化和科学计算。最新版本7.0.0b1带来了新特性、性能优化、API改进和兼容性增强。本详细解析包括ipywidgets的核心概述、主要功能、版本新特性以及其在教育、数据探索和应用原型开发等场景中的应用。1.ipywidgets核心概念介绍在当今数据科学和机器学习领域，交互式可视
机器学习Day01 酒脑猫机器学习人工智能
人工智能三大概念及其关系人工智能（AI）：使用计算机来模拟或者代替人类机器学习（ML）：机器自动学习，并不只由人定义规则编程深度学习（DL）：大脑仿生，模拟人大脑神经网络，设计一层层神经元模拟事物机器学习是实现人工智能的一种途径，深度学习是机器学习的一种更加深入的方法。机器学习学习方法基于规则的学习：程序员根据自己经验定义规则基于模型的学习：由于某些事物，问题无法可以定义明确的规则，如：图片，语音
机器学习Day1 一飞学编程机器学习机器学习人工智能
1.背景以周志华教授的《机器学习》为核心学习AI知识2.绪论中的重要概念整理机器学习的目的：利用经验（数据）来改善系统性能记录：(key1:value1,key2:value2…)数据集：记录的集合示例（样本）：对一个事件或对象的描述属性（特征）：key1,key2…属性值：value1,value2…属性空间（样本空间、输入空间）：key1,key2等组成的多维空间特征向量：形如（value1,
机器学习建模流程 day02 扫把星133 机器学习人工智能 python
机器学习建模流程通常可以分为以下几个主要步骤：问题定义与数据收集：确定问题的类型（分类、回归、聚类等可见上篇所讲内容）和目标。收集相关数据，可以是从数据库、API、文件或其他来源获取。注释：数据库是计算机里面的存储的数据的，当然可以对数据进行一些操作增删改查，通常用于存储大量结构化数据，并提供高效的数据操作和查询功能。API（ApplicationProgrammingInterface，应用程序
【DL】神经网络与机器学习基础知识介绍（一） MengWoods 深度学习机器学习神经网络人工智能
原博客：https://mengwoods.github.io/post/dl/009-dl-fundamental/文章目录基本通用概念梯度下降算法数据工程训练技术偏差与方差防止过拟合评估指标决策树基本通用概念机器学习的类型：监督学习（SupervisedLearning）：分类，回归无监督学习（UnsupervisedLearning）：聚类，降维强化学习（ReinforcementLearn
使用seaborn绘制相关性热力图 CodeWG python
使用seaborn绘制相关性热力图在数据分析和机器学习中，热力图是一种常见的可视化方法，用于显示不同变量之间的相关性。在Python中，我们可以使用seaborn库绘制相关性热力图。本文将介绍如何使用seaborn中的heatmap函数来绘制相关性热力图，并为读者提供示例代码。首先，我们需要导入必要的库：pandas、numpy和seaborn。我们还使用了matplotlib库以便于展示结果。i
一文搞懂python的face_recognition人脸识别库码上飞扬 python 开发语言人脸识别
随着人工智能和机器学习的快速发展，人脸识别技术在安全监控、身份验证、智能相册等领域的应用越来越广泛。Python作为一门简洁高效的编程语言，其丰富的库支持使得人脸识别的实现变得更加容易。本文将介绍如何使用Python的face_recognition库来实现基本的人脸识别功能。一、face_recognition库简介1.1什么是face_recognition库？face_recognition
智联未来——打造基于机器学习的MySQL智能运维助手，开启协作新时代墨夶数据库学习资料2 机器学习 mysql 运维
在当今快速发展的信息技术领域，数据库作为信息系统的核心组件，其稳定性和效率直接关系到业务的成功与否。面对日益增长的数据管理和处理需求，传统的运维方式已经难以满足现代企业对高效、稳定服务的要求。为此，越来越多的企业开始探索如何通过智能化手段提升数据库运维水平，特别是利用最新的AI技术和自动化工具来构建一个功能强大的智能运维助手。今天，我们将深入了解如何训练这样一个基于机器学习的MySQL智能运维助手
Python生态系统中拥有丰富的第三方库 ___Y1 python python
Python生态系统中拥有丰富的第三方库，这些库覆盖了几乎所有领域，包括科学计算、数据分析、机器学习、人工智能、Web开发等。这些库的存在极大地丰富了Python的功能，使其成为一门强大而灵活的编程语言。以下是一些常用的Python第三方库：1.**科学计算与数据处理：**-**NumPy：**提供高性能的多维数组对象，以及相关工具，用于处理这些数组。-**Pandas：**提供数据结构和数据分析
【人工智能】Python常用库-TensorFlow常用方法教程 IT古董人工智能机器学习 Python 人工智能 python tensorflow 机器学习
TensorFlow是一个广泛应用的开源深度学习框架，支持多种机器学习任务，如深度学习、神经网络、强化学习等。以下是TensorFlow的详细教程，涵盖基础使用方法和示例代码。1.安装与导入安装TensorFlow：pipinstalltensorflow导入TensorFlow：importtensorflowastfimportnumpyasnp验证安装：print(tf.__version_
【小白学AI系列】NLP 核心知识点（六）Softmax函数介绍 Blankspace空白人工智能自然语言处理 transformer
Softmax函数Softmax函数是一种常用的数学函数，广泛应用于机器学习中的分类问题，尤其是在神经网络的输出层。它的主要作用是将一个实数向量“压缩”成一个概率分布，使得所有输出的值在0到1之间，并且总和为1。换句话说，Softmax将模型的原始输出（logits）转化为概率，帮助我们做分类决策。定义与公式假设我们有一个向量z=[z1,z2,…,zn]\mathbf{z}=[z_1,z_2,\d
为AI聊天工具添加一个知识系统之76 详细设计之17 正则表达式之4 正则表达式模板一水鉴天人工智能机器学习算法
Q712、三“化”（使用三种不同的定义方法：规定定义法-线性回归/内涵定义法--一阶迭代/外延定义法--单调递归）整体形成一个双人零和的局面Method()规定式。给出问题“law是什么”的三种答案：1)符合（事实符合公式）内涵和外延的逆关系,2）遵循(逻辑符号)拓扑特征不变性，3)基于(信念坚持)时间不可逆公理根据你所描述的框架，三“化”（规定定义法-线性回归、内涵定义法-一阶迭代、外延定义法-
机器学习：利用sklearn实现心脏病预测薄化克Oswald
机器学习：利用sklearn实现心脏病预测机器学习sklearn实现心脏病预测项目地址:https://gitcode.com/Resource-Bundle-Collection/171ff欢迎使用本资源仓库，本项目专注于利用Python的sklearn库进行心脏病预测的机器学习实践。通过详尽的步骤和示例代码，本项目为你展示了如何应用不同的机器学习算法来分析心脏病数据集，并预测患者是否有可能患有
可解释性：走向透明与可信的人工智能一位小说男主人工智能入门深度学习机器学习人工智能神经网络
随着深度学习和机器学习技术的迅速发展，越来越多的行业和领域开始应用这些技术。然而，这些技术的“黑盒”特性也带来了不容忽视的挑战。在许多任务中，尽管这些模型表现出色，取得了相当高的精度，但其决策过程不透明，这对于依赖于机器决策的应用（如金融、医疗、法律等）来说，可能是无法接受的。因此，如何提高模型的可解释性、实现透明和可信的人工智能，成为了当下人工智能领域的重要课题。❤️本文将深入探讨机器学习中的可
Tensorflow入门——训练结果的保存与加载 weixin_34087301 人工智能 python 数据库
2019独角兽企业重金招聘Python工程师标准>>>训练完成以后我们就可以直接使用训练好的模板进行预测了但是每次在预测之前都要进行训练，不是一个常规操作，毕竟有些复杂的模型需要训练好几天甚至更久所以将训练好的模型进行保存，当有需要的时候重新加载这个模型进行预测或者继续训练，这才是一个常规操作我们依然使用最简单的例子进行说明，这里沿用Tensorflow入门——实现最简单的线性回归模型的预测这个例
爬虫实战--- （6）链家房源数据爬取与分析可视化 rain雨雨编程爬虫实战系列 python 爬虫数据分析
文章持续跟新，可以微信搜一搜公众号[rain雨雨编程]，第一时间阅读，涉及数据分析，机器学习，Java编程，爬虫，实战项目等。目录前言1.爬取目标2.所涉及知识点3.步骤分析（穿插代码讲解）步骤一：发送请求步骤二：获取数据步骤三：解析数据步骤四：保存数据4.爬取结果5.完整代码6数据可视化前言今天我将为大家分享一个非常实用的Python项目——链家房源数据的爬取与分析可视化。在这篇文章中，我们将分
使用scikit-learn实现线性回归对自定义数据集进行拟合 Luzem0319 scikit-learn 线性回归 python
1.引入必要的库首先，需要引入必要的库。scikit-learn提供了强大的机器学习工具，pandas和numpy则用于数据处理，matplotlib用于结果的可视化。importpandasaspdimportnumpyasnpfromsklearn.model_selectionimporttrain_test_splitfromsklearn.linear_modelimportLinear
使用PyTorch实现逻辑回归：从训练到模型保存与加载 Luzem0319 pytorch 逻辑回归人工智能
1.引入必要的库首先，需要引入必要的库。PyTorch用于构建和训练模型，pandas和numpy用于数据处理，matplotlib用于结果的可视化。importtorchimporttorch.nnasnnimporttorch.optimasoptimfromtorch.utils.dataimportDataLoader,TensorDatasetimportpandasaspdimport
数据挖掘的常用算法北柠陌寒0207 笔记
在大数据时代,数据挖掘是最关键的工作。大数据的挖掘是从海量、不完全的、有噪声的、模糊的、随机的大型数据库中发现隐含在其中有价值的、潜在有用的信息和知识的过程,也是一种决策支持过程。其主要基于人工智能,机器学习,模式学习,统计学等。通过对大数据高度自动化地分析,做出归纳性的推理,从中挖掘出潜在的模式,可以帮助企业、商家、用户调整市场政策、减少风险、理性面对市场,并做出正确的决策。目前,在很多领域尤其
面向对象面向过程 3213213333332132 java
面向对象：把要完成的一件事，通过对象间的协作实现。面向过程：把要完成的一件事，通过循序依次调用各个模块实现。我把大象装进冰箱这件事为例，用面向对象和面向过程实现，都是用java代码完成。 1、面向对象 package bigDemo.ObjectOriented; /** * 大象类 * * @Description * @author FuJian
Java Hotspot: Remove the Permanent Generation bookjovi HotSpot
openjdk上关于hotspot将移除永久带的描述非常详细，http://openjdk.java.net/jeps/122 JEP 122: Remove the Permanent Generation Author Jon Masamitsu Organization Oracle Created 2010/8/15 Updated 2011/
正则表达式向前查找向后查找,环绕或零宽断言 dcj3sjt126com 正则表达式
向前查找和向后查找 1. 向前查找：根据要匹配的字符序列后面存在一个特定的字符序列(肯定式向前查找)或不存在一个特定的序列(否定式向前查找)来决定是否匹配。.NET将向前查找称之为零宽度向前查找断言。对于向前查找，出现在指定项之后的字符序列不会被正则表达式引擎返回。 2. 向后查找：一个要匹配的字符序列前面有或者没有指定的
BaseDao 171815164 seda
import java.sql.Connection; import java.sql.DriverManager; import java.sql.SQLException; import java.sql.PreparedStatement; import java.sql.ResultSet; public class BaseDao { public Conn
Ant标签详解--Java命令 g21121 Java命令
这一篇主要介绍与java相关标签的使用终于开始重头戏了，Java部分是我们关注的重点也是项目中用处最多的部分。 1
[简单]代码片段_电梯数字排列 53873039oycg 代码
今天看电梯数字排列是9 18 26这样呈倒N排列的,写了个类似的打印例子，如下: import java.util.Arrays; public class 电梯数字排列_S3_Test { public static void main(S
Hessian原理云端月影 hessian原理
Hessian 原理分析一．远程通讯协议的基本原理网络通信需要做的就是将流从一台计算机传输到另外一台计算机，基于传输协议和网络 IO 来实现，其中传输协议比较出名的有 http 、 tcp 、 udp 等等， http 、 tcp 、 udp 都是在基于 Socket 概念上为某类应用场景而扩展出的传输协
区分Activity的四种加载模式----以及Intent的setFlags aijuans android
在多Activity开发中，有可能是自己应用之间的Activity跳转，或者夹带其他应用的可复用Activity。可能会希望跳转到原来某个Activity实例，而不是产生大量重复的Activity。这需要为Activity配置特定的加载模式，而不是使用默认的加载模式。加载模式分类及在哪里配置 Activity有四种加载模式： standard singleTop
hibernate几个核心API及其查询分析 antonyup_2006 html .net Hibernate xml 配置管理
(一) org.hibernate.cfg.Configuration类读取配置文件并创建唯一的SessionFactory对象.(一般,程序初始化hibernate时创建.) Configuration co
PL/SQL的流程控制百合不是茶 oracle PL/SQL编程循环控制
PL/SQL也是一门高级语言,所以流程控制是必须要有的,oracle数据库的pl/sql比sqlserver数据库要难,很多pl/sql中有的sqlserver里面没有流程控制; 分支语句 if 条件 then 结果 else 结果 end if ; 条件语句 case when 条件 then 结果; 循环语句 loop
强大的Mockito测试框架 bijian1013 mockito 单元测试
一.自动生成Mock类在需要Mock的属性上标记@Mock注解，然后@RunWith中配置Mockito的TestRunner或者在setUp()方法中显示调用MockitoAnnotations.initMocks(this);生成Mock类即可。二.自动注入Mock类到被测试类 &nbs
精通Oracle10编程SQL(11)开发子程序 bijian1013 oracle 数据库 plsql
/* *开发子程序 */ --子程序目是指被命名的PL/SQL块，这种块可以带有参数，可以在不同应用程序中多次调用 --PL/SQL有两种类型的子程序：过程和函数 --开发过程 --建立过程：不带任何参数 CREATE OR REPLACE PROCEDURE out_time IS BEGIN DBMS_OUTPUT.put_line(systimestamp); E
【EhCache一】EhCache版Hello World bit1129 Hello world
本篇是EhCache系列的第一篇，总体介绍使用EhCache缓存进行CRUD的API的基本使用，更细节的内容包括EhCache源代码和设计、实现原理在接下来的文章中进行介绍环境准备 1.新建Maven项目 2.添加EhCache的Maven依赖 <dependency> <groupId>ne
学习EJB3基础知识笔记白糖_ bean Hibernate jboss webservice ejb
最近项目进入系统测试阶段，全赖袁大虾领导有力，保持一周零bug记录，这也让自己腾出不少时间补充知识。花了两天时间把“传智播客EJB3.0”看完了，EJB基本的知识也有些了解，在这记录下EJB的部分知识，以供自己以后复习使用。 EJB是sun的服务器端组件模型，最大的用处是部署分布式应用程序。EJB (Enterprise JavaBean)是J2EE的一部分，定义了一个用于开发基
angular.bootstrap boyitech AngularJS AngularJS API angular中文api
angular.bootstrap 描述：手动初始化angular。这个函数会自动检测创建的module有没有被加载多次，如果有则会在浏览器的控制台打出警告日志，并且不会再次加载。这样可以避免在程序运行过程中许多奇怪的问题发生。使用方法： angular .
java-谷歌面试题-给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数 bylijinnan java
public class SearchInShiftedArray { /** * 题目：给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数。 * 请在这个特殊数组中找出给定的整数。 * 解答： * 其实就是“旋转数组”。旋转数组的最小元素见http://bylijinnan.iteye.com/bl
天使还是魔鬼？都是我们制造 ducklsl 生活教育情感
----------------------------剧透请原谅，有兴趣的朋友可以自己看看电影，互相讨论哦！！！从厦门回来的动车上，无意中瞟到了书中推荐的几部关于儿童的电影。当然，这几部电影可能会另大家失望，并不是类似小鬼当家的电影，而是关于“坏小孩”的电影！自己挑了两部先看了看，但是发现看完之后，心里久久不能平
[机器智能与生物]研究生物智能的问题 comsci 生物
我想,人的神经网络和苍蝇的神经网络,并没有本质的区别...就是大规模拓扑系统和中小规模拓扑分析的区别.... 但是,如果去研究活体人类的神经网络和脑系统,可能会受到一些法律和道德方面的限制,而且研究结果也不一定可靠,那么希望从事生物神经网络研究的朋友,不如把
获取Android Device的信息 dai_lm android
String phoneInfo = "PRODUCT: " + android.os.Build.PRODUCT; phoneInfo += ", CPU_ABI: " + android.os.Build.CPU_ABI; phoneInfo += ", TAGS: " + android.os.Build.TAGS; ph
最佳字符串匹配算法（Damerau-Levenshtein距离算法）的Java实现 datamachine java 算法字符串匹配
原文：http://www.javacodegeeks.com/2013/11/java-implementation-of-optimal-string-alignment.html------------------------------------------------------------------------------------------------------------
小学5年级英语单词背诵第一课 dcj3sjt126com english word
long 长的 show 给...看，出示 mouth 口，嘴 write 写 use 用，使用 take 拿，带来 hand 手 clever 聪明的 often 经常 wash 洗 slow 慢的 house 房子 water 水 clean 清洁的 supper 晚餐 out 在外 face 脸，
macvim的使用实战 dcj3sjt126com mac vim
macvim用的是mac里面的vim, 只不过是一个GUI的APP, 相当于一个壳 1. 下载macvim https://code.google.com/p/macvim/ 2. 了解macvim :h vim的使用帮助信息 :h macvim
java二分法查找蕃薯耀 java二分法查找二分法 java二分法
java二分法查找 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 11:40:03 星期二 http:/
Spring Cache注解+Memcached hanqunfeng spring memcached
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>com.google.code.simple-spring-memcached</groupId> <artifactId>simple-s
apache commons io包快速入门 jackyrong apache commons
原文参考 http://www.javacodegeeks.com/2014/10/apache-commons-io-tutorial.html Apache Commons IO 包绝对是好东西，地址在http://commons.apache.org/proper/commons-io/，下面用例子分别介绍： 1）工具类 2
如何学习编程 lampcy java 编程 C++c
首先,我想说一下学习思想.学编程其实跟网络游戏有着类似的效果.开始的时候,你会对那些代码,函数等产生很大的兴趣,尤其是刚接触编程的人,刚学习第一种语言的人.可是,当你一步步深入的时候,你会发现你没有了以前那种斗志.就好象你在玩韩国泡菜网游似的,玩到一定程度,每天就是练级练级,完全是一个想冲到高级别的意志力在支持着你.而学编程就更难了,学了两个月后,总是觉得你好象全都学会了,却又什么都做不了,又没有
架构师之spring-----spring3.0新特性的bean加载控制@DependsOn和@Lazy nannan408 Spring3
1.前言。如题。 2.描述。 @DependsOn用于强制初始化其他Bean。可以修饰Bean类或方法，使用该Annotation时可以指定一个字符串数组作为参数，每个数组元素对应于一个强制初始化的Bean。 @DependsOn({"steelAxe","abc"}) @Comp
Spring4+quartz2的配置和代码方式调度 Everyday都不同代码配置 spring4 quartz2.x 定时任务
前言：这些天简直被quartz虐哭。。因为quartz 2.x版本相比quartz1.x版本的API改动太多，所以，只好自己去查阅底层API…… quartz定时任务必须搞清楚几个概念： JobDetail——处理类 Trigger——触发器，指定触发时间，必须要有JobDetail属性，即触发对象 Scheduler——调度器，组织处理类和触发器，配置方式一般只需指定触发
Hibernate入门 tntxia Hibernate
前言使用面向对象的语言和关系型的数据库，开发起来很繁琐，费时。由于现在流行的数据库都不面向对象。Hibernate 是一个Java的ORM（Object/Relational Mapping）解决方案。 Hibernte不仅关心把Java对象对应到数据库的表中，而且提供了请求和检索的方法。简化了手工进行JDBC操作的流程。如
Math类 xiaoxing598 Math
一、Java中的数字（Math）类是final类，不可继承。 1、常数 PI：double圆周率 E：double自然对数 2、截取（注意方法的返回类型） double ceil(double d) 返回不小于d的最小整数 double floor(double d) 返回不大于d的整最大数 int round(float f) 返回四舍五入后的整数 long round

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他