茶树菇变身ing

Logistic Regression 逻辑回归数学原理、python代码实现、实际应用

说在前面

第一次写博客，主要目的是再梳理一下学到东西的逻辑，如果可以帮助到其他在学习的人就更好啦。本篇主要参考的：《机器学习》西瓜书、博主文章：文章链接、以及知乎、百度等大神们的解惑文章
第一次写文章，会继续优化，有错误的地方请读者评论直接指出~~

线性回归模型的参数求解

线性模型（linear model），对应的是线性回归问题
线性模型公式：
【问题简化】先假设只有一个特征x 线性模型为：y=θx+b
我们的目的是：找到参数θ和b，使得线性模型的泛化性能最好，回归问题中我们用均方误差来度量模型的泛化性能

泛化性能：指模型在需要预测数据时的表现情况
怎么量化模型的泛化性能呢？用性能度量：
在回归任务种最常用的是 均方误差：均方误差是指预测值和实际值差值的平方和的均值

【问题转化为】求解θ和b，使得模型的均方误差最小

求均方误差最小时的参数值

令实际值为y（i），令根据模型的预测值为f（i），一共有m个i，E可以直接表示均值的意思
均方误差公式：

对于上面的均方误差公式来说，其实是关于参数θ和b的函数，也叫这个模型的损失函数，顾名思义：不同的θ和b 决定了模型在预测时的损失大小
求损失函数的极小值点，那分别对θ 和 b求一阶导数，并让一阶导数为0，得到的值就是损失函数的极小值点

一些名词解释：
最小二乘法：让均方误差最小的方法
最小二乘参数估计：让均方误差最小去求得参数θ和b的方法

一元线性函数拓展为多元线性函数

【问题拓展】更一般的线性模型是多元线性模型，即有很多个特征x，问题拓展为求解多元线性回归模型
同一元线性模型一样，用的都是最小二乘参数估计法
单个x转化为X矩阵：

把参数b吸收到X矩阵里：归一化，让每个x除以b。归一化后的模型为Y=ΘX
同一元线性模型一样，写出模型的均方误差，求均方误差最小的时候的参数值

多元线性模型的损失函数：
对损失函数求导后（公式里的x是矩阵x）：
让损失函数的一阶导数为0，求得Θ的值
在现实情况下，会有特征很多，甚至多于样例数的情况，这个时候会得到多个参数值，都可以让均方误差最小（这里涉及到矩阵的求解，暂时不展开解释）
这个时候选择哪个参数值，由学习算法的归纳偏好决定，常用的做法是引入正则化项

【归纳偏好】：在选择模型的时候有一定的和任务相关的主观判断，成为归纳偏好
【正则化项】

正则化可以理解为规则化

目的是防止过拟合

正则化项有个正则化系数，系数越大，限制就越强，越使得误差函数更平滑

线性函数可以变形为复杂函数

【问题拓展】其实线性函数可以有很多种变形，所以一些复杂的模型函数都可以简化为线性函数模型做解答
可以有一个新的函数G，
，但是这个函数G 是需要可以被求导的（即需要是连续的函数），因为需要用最小二乘法求权重值（这个过程是需要求导的）

将回归模型拓展解决分类问题

在分类问题中，我们先看最简单的二分类问题
借用上一节得到的回归模型通用函数，借用回归模型解决二分类问题
那要找到合适的函数G
对于二分类来说， y 值只有两个选择 0 1 ，那么最理想的函数其实是 “单位跃阶”函数，但是单位跃阶函数不是连续函数（不能求导），所以要找一个代替的函数，最像的就是对数几率函数了，也就是logistic function

单位跃阶函数：
x<0时，y=0
x=0时，y=0.5
x>0时 y=1

logistic Function 逻辑回归函数

是一种连续型的概率分布
分布函数公式：其中
,其中 ,μ是数学期望，也是分布的中心；γ表示散布程度，均方差
当μ=0，γ=1的时候，是标准的Logistict 分布，分布图如下，以（0，0.5）为轴对称点，当x>0时，y>0.5，当x<0时，y<0.5

直接让线性函数代替 t
在进行一番等式变换后（结合对数的转换）后公式变成
y可以认为是分类到正例的概率，1-y 就是分类到反例的发生概率，
反映了x作为正例的相对可能性，称为几率
几率取了对数，成为对数几率

【问题转化完成】所以目前分类的学习模型函数，从单位跃阶函数转化为了对数几率线性回归模型 Logistic regression

Logistic Regression 模型的优点：

直接对分类可能性做建模，不需要假设数据分布，避免了假设分布不准带来的其他问题

不仅可以分出类别，还可以得到近似的概率

对数函数是任意阶可导的凸函数，又许多数值优化算法可直接用于求取最优解

Logistic Regression 对数几率线性回归模型（即逻辑回归模型）参数估计

怎么求得概率函数里的参数值呢？这时候可以用到极大似然法，让每个样本属于真是标记的概率越大越好

统计界有两个学派提供了不同的参数估计方法

频率主义学派
认为参数是客观存在的固定值
可以通过优化似然函数等准则来做参数估计

贝叶斯学派
认为参数是随机变量，也有自己的分布
需要假定参数服从一个先验分布，然后基于观察到的数据来计算参数的后验分布

极大似然法

我们这里用频率学派的参数估计方法：极大似然法

极大似然估计（Maximum Likelihood Estimation MLE）：

极大似然估计是什么：
是一种估计类条件概率的常用策略，现实假定具有某种确定的概率分布形式，然后再基于样本对概率分布的参数做估计。

什么样的模型可以用极大似然法？
求解的模型需要是有参数位置的概率分布模型
有一些该模型生成的样本点

极大似然法的数据部分：似然函数
把所有样本点都带入概率模型，然后再把它们相乘就得到了似然函数
当似然函数最大的时候，就是这个参数最接近实际模型的时候

似然函数的变形：对数似然函数
实际做计算的时候，很可能因为相乘的数据太多，导致下溢（计算机程序崩溃），做个简化：两边求对数后，就变成了所有特征带入模型后相加，似然函数被简化为：对数似然函数

对数似然函数公式：

P（yi）是把每个x值带入概率公式后求出来的结果概率
在二分类的问题中，结果只会有两个选项 0 或者1 ，因此P（yi）可以写成
yi*P（结果为1）+(1-yi)*P（结果为0）
解释：当yi=0 的时候 P（yi）=P（0）当yi=1 的时候 P（yi）=P（1）
把P（yi）带入似然函数公式，就得到了逻辑回归模型的对数似然函数

【问题转换】求对数似然函数最大的时候，概率函数公式里的特征向量值为多少（就是未知的Θ和b）

梯度法求极大似然函数时的参数值

怎么求得呢？
可以用经典的数值优化算法：例如梯度法（极大似然函数法里应该用梯度上升法）或者牛顿法

因为这里是求极大似然，因此需要用梯度上升法，
θ是权重值，α是步长，由于目标函数是θ的一次函数，求完一次导数后只剩下X矩阵了，error是用θ做预测模型得到的预测值和实际值y的差值

梯度上升法的公式： θ=θ+αX的转置error

梯度法说明：
– 是一种常用的一阶优化方法（只使用目标函数的一阶导数，不利用高阶导数），利用目标函数的二阶导数，就是牛顿法，牛顿法计算复杂度高
– 梯度法是用概率函数在某个点的导数来确认迭代方向
– 每一次迭代都有一个步长，步子跨的太大容易错过极点，步子跨的过小需要学习的时间就太长
梯度迭代的计算公式

θ是迭代的点，长得像a的东西就是步长，后面的是对概率函数的一阶导数
– 梯度上升法就是每次都加上迭代的步长，用来求概率函数的最大值，也就是求对数极大似然函数的最大值，梯度下降法是每次都减掉迭代的步长，是求误差最小化的算法

python代码实现逻辑回归模型

#!/usr/bin/python
# -*- coding:utf8 -*-
from numpy import *
import xlrd
#读取数据，并生成X和y的矩阵
def read_data():
    global datax
    global datay
    datax = []
    datay = []

    file = xlrd.open_workbook(r'C:\Users\little redred\Desktop\Download for work\repay_data.xlsx')
    sheet = file.sheet_by_index(0)

    for i in range(sheet.nrows):
        if i == 0:
            continue
        else:
            line = []
            for j in range(sheet.ncols):
                cell = sheet.cell(i, j).value
                line.append(cell)
            x=line[:8]
            x.append(1)
            #把θx+b 简化成一个  X 矩阵
            datax.append(x)
            datay.append(line[8])
    return datax , datay

# 定义sigmoid函数,也就是logistic 函数
def sigmoid(x):
    return 1 / (1 + exp(-x))

# 梯度上升法更新最优拟合函数
 @datax
 @datay
def gradAscent(m, n):
    # 把特征列表转换为Numpy矩阵
    dataxMetric = mat(datax)
    datayMetric = mat(datay).transpose()
    # 学习步长
    alpha = 0.001
    # 最大迭代次数
    maxCycles = 20000
    # 特征数据集的 行数和列数
    m, n = shape(dataxMetric)
    # 初始化每一个特征的权重都是1
    weights = ones((n, 1))

    # 循环迭代：
    for i in range(maxCycles):
        # 将特征矩阵和初始化的权重矩阵都计算一次，求sigmoid函数的值
        #这一步就是将线性方程转化为logistic 函数（也就是sigmoid函数）
        #dataxMetric * weights 就是 θ*X
        h = sigmoid(dataxMetric * weights)
        # 求预测值和实际值之间的差
        error = (datayMetric - h)
        # 更新权重系数，θ*x 对θ求一次导数，就是X 本身，X 是m*n
        weights = weights + alpha * dataxMetric.transpose() * error
    return weights

# 梯度上升算法在每次更新回归系数的时候需要遍历整个数据集，成本较高，优化一下，每次只用一个样本点来更新回归系数，成为  随机梯度上升法

def stocGradAscent(x, y):
    m, n = shape(x)
    alpha = 0.001
    weights = ones(n)
    x = array(x)
    for i in range(m):
        h = sigmoid(sum(x[i] * weights))
        error = y[i] - h
        weights = weights + alpha * error * x[i]
    print(type(x[i]))
    return weights

 但是每次只用一个点的数值 学习的话，可能得到的不是最优解
#因此再优化一下，随机选择

def new_stocGradAscent(x, y, number_iter=1000):
    m, n = shape(x)
    alpha = 0.01
    weights = ones(n)
    x = array(x)

    for j in range(number_iter):
        dataindex = list(range(m))
        for i in range(m):
            # 每次迭代调整下alpha，随着i j 的逐步增大，最开始alpha的步子还比较大，随着迭代的进行，alpha的步子越来越小
            alpha = 4 / (1 + i + j) + 0.01
            # 随机选取特征数据来更新参数
            # 随机生成一个 0 和 特征长度中间的一个数值
            randIndex = int(random.uniform(0, len(x)))
            # 用随机选中的数据点更新
            h = sigmoid(sum(x[randIndex] * weights))
            error = y[randIndex] - h
            weights = weights + alpha * error * x[randIndex]
            # 每次迭代都减掉用过的特征数据
            x = np.delete(x, randIndex, axis=0)
        return weights
        
# 用x 和 权重值 计算 sigmoid 值，如果大于0.5 返回1 其他返回0
def classifyVector(inX, weights):
    p = sigmoid(sum(inX * weights))
    if p > 0.5:
        return 1
    else:
        return 0

#得到训练出来的权重在测试集上的 泛化误差，这里用的是  错误率
def Test(x_test,y_test,trainWeights):
    num = 0
    error_count = 0

    for i in range(len(x_test)):
        num += 1
        if int(classifyVector(x_test[i], trainWeights)) != int(y_test[i]):
            error_count += 1
    erroRate = (float(error_count) / num)
    return erroRate

sklearn 包中的逻辑回归方法应用

from sklearn import metrics
from sklearn.metrics import accuracy_score
from sklearn.model_selection import train_test_split
#StandardScaler 用来做数据标准化：就是让数据都集中在0 附近，标准差为1，新得到的数据集方差为1，均值为0
from sklearn.preprocessing import StandardScaler
import numpy as np
from sklearn.linear_model import LogisticRegression
from sklearn import model_selection

datax,datay=read_data()
#把样本数据集X 标准化
standard_datax=StandardScaler().fit_transform(datax)
#数据分层采样,random_state 是随机数种子，种子不同每次的采样也不同，shuffle 洗牌模式，True 每次抽样都会打乱顺序
x_train, x_test, y_train, y_test = train_test_split(standard_datax, datay, test_size=0.4, random_state=20, shuffle=True)
#用Logistic Regression 模型训练数据
model=LogisticRegression().fit(x_train,y_train)
#model.coef_   就是模型里的theta值  model.intercept_ 就是b 的值
# print(model.coef_)
# print(model.intercept_)
#得到模型预测结果
y_pre=model.predict(x_test)
#求出模型的准确率,0.993
acc=accuracy_score(y_test,y_pre)
#再用全部的数据学习一个模型
model_al=LogisticRegression().fit(standard_datax,datay)

#用交叉验证法获取模型的预测分数
scores=model_selection.cross_val_score(model_al,standard_datax,datay,cv=5)
print(scores)
print(scores.mean())

【本篇只涉及一个模型，还未涉及到多个学习模型的对比，以下只是一些可以对比的 性能度量实现，可供参考】
#绘制PR曲线,这个函数的返回值依次为：查准率  查全率 ，用于计算查准率和查全率的阈值，可以包住另一个PR曲线的模型更好
# pr_line=sklearn.metrics.precision_recall_curve(y_test,y_pre)
# PR 曲线还是会有一些局限，例如如果两个模型的PR曲线相交了呢？哪个更好呢，其实更常用的是F1 度量， 计算F1 度量,0.498
#F1 度量是 查全率 和 查准率一样重要的情况，如果给它们加上不同的权重，就是Fβ
f1=metrics.f1_score(y_test,y_pre,average="macro")
fb=metrics.fbeta_score(y_test,y_pre,beta=0.8)

Python 中的列表（List）和元组（Tuple） shangjg3 Python python 开发语言
1.定义与语法差异1.列表的定义列表使用方括号`[]`定义，元素之间用逗号分隔。列表的元素可以是不同数据类型，甚至嵌套其他列表或元组。my_list=[1,"hello",True,[2,3]]2.元组的定义元组使用圆括号`()`定义，同样支持混合数据类型。需要注意的是，定义单元素元组时必须在元素后加逗号，以区别于数学表达式中的括号。my_tuple=(1,"world",False,(4,5))
[源码和文档分享]基于C++实现的教职工信息管理系统 ggdd5151
一、实验内容教职工信息管理系统用于管理教职工信息，能够根据工号、姓名、科室精确查询职工信息；能分系部进行职称统计，计算各职称的人数；根据职工的职称排序输出；根据工号修改或删除职工信息。二、运行环境软件环境操作系统：windows8.1开发环境：visualstudio2015硬件环境处理器：Intel(R)Core(TM)[email protected]内存：4.00GB系统类
SpringCloud负载均衡原理
SpringCloud负载均衡原理org.springframework.cloud.loadbalancer.core.RoundRobinLoadBalancerprivateResponsegetInstanceResponse(Listinstances){if(instances.isEmpty()){if(log.isWarnEnabled()){log.warn("Noservers
Python 列表
列表是由一系列按特定顺序排列的元素组成。在python中用方括号（[]）来表示列表并用逗号来分隔其中的元素。例如：bicycles=['trek','cannondale','redline']。访问列表元素时，只需将该元素的索引值或位置告诉Python即可。（索引值由0开始）>>>names=['zhao','qian','sun','li']>>>print(names[0])zhao创建的大
《都市不俗人》：之460 各有各法，各马各扎，实践才能出真知；各师各教，各施各技，实际方能得正果古韵撷趣
上篇说到，曾明来到来凤村山庄建设工地，和承建者曹思汉在工棚里，又做了一次深入的沟通，双方均表现了十足的诚意，和对未来合作的信心。曹思汉听完曾明的简单畅述后，很高兴地说：曾先生，感谢你和赵先生的认可。能认识你们，能承建刘（长河）夏（天青）二老设计的建筑，我曹思汉和我曹家村这般兄弟，何其幸运啊！曾明谦虚地说：我和我兄弟算不的什么，但二老退休后，心有所属，早就不问“世事”，一心只设计自己心仪的建筑，这都
假期的变化杨小芹
假期，实在是一个很美好的字眼。上班之初，看到假期二字，脑海中不禁浮现出：蔚蓝的天空，金黄的沙滩上，插着一把太阳伞，游人躺在沙滩椅上，吹着海风，喝着饮料，好不惬意。这是我想象中的假期，我的假期生活与之相差十万八千里，丝毫不影响我对假期的热爱。放假，我基本上啥也不干，帮二姐姐（二姐家种大棚，一年到头没有闲着的时候）带带孩子，给二姐家帮忙，是假期的主旋律。后来自己有了孩子，就陪着自己的孩子玩耍。基本上不
列表简单数据类型天池小晨 python
整型浮点型布尔型容器数据类型列表元组字典集合字符串1.列表的定义列表是有序集合，没有固定大小，能够保存任意数量任意类型的Python对象，语法为[元素1,元素2,...,元素n]。关键点是「中括号[]」和「逗号,」中括号把所有元素绑在一起逗号将每个元素一一分开2.列表的创建创建一个普通列表【例子】1x=['Monday','Tuesday','Wednesday','Thursday','Frid
为什么中药能治病？核心原理是什么？ 4bf825984a00
一、为什么中药能治病？中医用来治病的药物是中药，而中药大多取自于天然的植物、动物、矿物，其中尤以植物为多，所以在古代，中药也被称为“本草”。相传，中药的发现和运用，都来自起源于神农氏，自古民间有“神农尝百草”的传说。为什么草根树皮能够治疗人的疾病，中药能治病到底是什么原因呢？人得天地之全性，草木得天地之偏性。中医认为，人和万物都得天地一气而生，但人得天地之全性，草木得天地之偏性，人得病就是人体气机
Linux设备驱动之SPI驱动关于电机的一切 linux 驱动开发 arm开发
Linux下SPI驱动分成两部分：主机驱动和设备驱动。主机驱动：主机侧SPI控制器使用structspi_master描述，该结构体中包含了SPI控制器的序号（很多SoC中存在多个SPI控制器），片选数量，SPI信息传输的速率，配置SPI模式的函数指针（4种模式），实现数据传输的函数指针。structspi_master{structdevicedev;structlist_headlist;s1
从比特币到DeFi：区块链如何重塑未来社会 L星际节点指挥官区块链开发 dapp 公链开发区块链分布式账本零知识证明智能合约 web3 共识算法
引言：数字时代的信任之问在信息爆炸的数字时代，信任成为稀缺资源。从网络诈骗到数据泄露，从虚假新闻到平台垄断，传统中心化系统的脆弱性暴露无遗。当人们为支付安全焦虑、为隐私泄露愤怒、为信息真实性迷茫时，一种名为“区块链”的技术悄然崛起。它以去中心化的结构、不可篡改的账本和智能合约的自动执行，重新定义了信任的规则。区块链不仅是技术革命，更是对人类社会协作模式的深度重构。一、区块链的创世密码1.应运而生的
Python-难点-获取项目根目录
1需求2接口3示例4参考资料在Python中，“设置根目录”通常指指定项目的基准路径，以便统一管理文件路径。以下是几种常见方法，结合不同场景和兼容性需求：一、基于路径拼接（最常用）通过手动拼接路径来定义根目录，适用于结构固定的项目。importos#方法1：根据当前文件位置向上递归定义（推荐）defset_project_root():current_file=os.path.abspath(__
JSON和JSONL、python操作 weixin_668 json python
JSONJSON（JavaScriptObjectNotation）是一种轻量级的数据交换格式，基于文本、易于读写，并支持多种数据结构。以下是常见的JSON格式及示例：1.简单对象（键值对）{"name":"Alice","age":25,"isStudent":true}2.嵌套对象{"person":{"name":"Bob","address":{"city":"NewYork","zipc
2023-03-21 我_4b6f
保定影像之街道（一一四三）2019年1月25日，星期五。农历戊戌年乙丑月壬戌日（狗年）十二月（腊月）二十。河北省保定市：阳光大街。保定市，古称清苑、上谷、保州、保府。因城池似靴，又称靴城。保定与北京相伴而生，保定之名取自“保卫大都、安定天下”之意。阳光大街，南北街道。原名韩村路，因韩村而得名。2003年5月21日，国务院办公厅批准修订后的《保定市城市总体规划(2001至2020年)》，规范道路命名
python 抓取小红书小五咔咔咔 python 开发语言
python相关学习资料：https://edu.51cto.com/video/3832.htmlhttps://edu.51cto.com/video/4102.htmlhttps://edu.51cto.com/video/1158.htmlPython抓取小红书数据的科普文章小红书是一个流行的社交电商平台，用户可以分享购物心得、生活点滴等。本文将介绍如何使用Python语言抓取小红书的数据
https交互原理黑塞123 Modern c++https 网络协议
Https交互时序图：HTTPS通信中结合RSA和AES加密的流程，本质是利用RSA的安全特性交换AES密钥，再用高效的AES加密实际数据传输。HTTPS交互核心流程（TLS/SSL握手）1.建立TCP连接客户端通过TCP三次握手连接服务器的443端口。2.TLS/SSL握手（密钥协商阶段）ClientHello客户端发送支持的功能列表：TLS版本、支持的加密套件（如TLS_RSA_WITH_AE
利用 Python 爬取小红书热门笔记并进行标签关键词分析程序员威哥最新爬虫实战项目 python 笔记开发语言
一、背景与目标小红书（RED）作为中国最活跃的内容社区之一，拥有大量关于美妆、穿搭、美食、旅游等领域的用户生成内容（UGC）。对于产品、品牌方或研究人员来说，提取热门笔记的标签关键词，可以有效捕捉用户关注点、消费趋势及内容热词。本项目目标：使用Python爬取小红书某个话题下的热门笔记；分析每篇笔记中的标题、正文、标签等字段；利用NLP技术提取高频关键词；对关键词进行可视化与聚类分析。二、技术难点
《论语》为政篇之2.3[刑与德]14 蜻蜓之旅
【原文】子曰：“道之以政，齐之以刑，民免而无耻。道之以德，齐之以礼，有耻且格。”【白话】孔子说：“以政令来教导，以刑罚来管束，百姓免于罪过但是不知道羞耻。以德行来教化，以礼制来约束，百姓知道羞耻，还能走上正途。”对百姓进行教育和规范。第一是德与礼，第二是政与刑。德与礼“道之以德”，用德行来引导，百姓看到上位者有德行，自然就跟着走。古代讲德，代表为政者照顾百姓，百姓都喜欢政治领袖有德行。因为这对百姓
重生之将门毒后｜谢景行 89b491201ff0
高山仰止，景行行止。谢景行之于沈妙，到底是怎么样的存在呢？救赎？我觉得有些像。两世情缘，谢景行一直都是运筹帷幄的，唯独看不透沈妙，可谢景行最让我心动之处，也就在于他明知沈妙不一般，却从不深究，给她足够的自由空间，放任他的沈娇娇做自己想做的事，而谢景行则为她铺路，在背后收拾摊子，从不邀功。颠个皇权罢了，你想要，都归你。谢景行有些霸道，却丝毫不油腻，在沈妙面前永远是个少年，意气风发，带着些挑衅意味。十
python JSON Lines (JSONL)的保存和读取；jsonl的数据保存和读取，大模型prompt文件保存常用格式医学小达人常用算法 NLP prompt JSON Lines JSONL jsonl jsonl文件保存读取
1.JSONLines(JSONL)文件保存将一个包含多个字典的列表保存为JSONLines(JSONL)格式的文件，每个字典对应一个JSONL文件中的一行。以下是如何实现这一操作的Python代码importjson#定义包含字典的列表data=[{"id":1,"name":"Alice","age":30,"email":"[email protected]"},{"id":2,"name"
四十行Python代码，带你爬取热门音乐评论，制作评论词云图！
请求页面数据driver.get(‘https://music.163.com/#/song?id=569213220’)#selenium无法直接获取到嵌套页面里面的数据switch_to.frame()切换到嵌套网页driver.switch_to.frame(0)让浏览器加载的时候,等待渲染页面driver.implicitly_wait(10)driver.page_source获取请求页
Python 处理图像并生成 JSONL 元数据文件 - 固定text版本
Python处理图像并生成JSONL元数据文件-固定text版本flyfishJSONL（JSONLines）简介JSONL（JSONLines，也称为newline-delimitedJSON）是一种轻量级的数据序列化格式，由一系列独立的JSON对象组成，每行一个有效的JSON对象，行与行之间通过换行符（\n）分隔。JSONL是传统JSON的“轻量化”变体，通过“每行一个JSON对象”的设计，解
postgresql之语法解析浅析 happytree001 pg postgresql
一、pg语法简介1.1语法文件结构语法.y文件和词法.l文件结构差不多，也是通过%%分成了三个部分:声明部分、语法规则部分、C代码部分。src/backend/parser/gram.y####声明部分%{C代码头文件，变量声明等（此范围内的内容原样输出到文件中）#include"postgres.h"...%}#变量声明%union{core_YYSTYPEcore_yystype;/*thes
2023-05-06 仁德上人
心中没有我我我，换来的就是清净自在安详文/仁德上人真正明心见性的菩萨，在平常生活之中会落实做到，没有事情，不会随便的找事；事情真的要来了，也不会怕事。找事与怕事都是自己心中的我我我在作怪，心中没有了我我我，没有事正好享受安详清净自在，如果该来的事情，就让事情来吧，正好利用事情来磨练自己，考验自己的内心是不是还把事情当事情，是不是为了虚幻的事再产生自我的爱憎取舍之妄心。自心不动我我我的妄心，没有谁能
Oracle 19C 后台主要进程的功能解析 zone-- 数据库 oracle dba
在Oracle数据库的运行机制中，后台进程是支撑数据库各项功能的“隐形引擎”。这些进程在实例启动时自动创建，负责完成数据读写、故障恢复、资源管理等核心任务。本文基于Oracle19c官方文档，对数据库常见后台进程进行系统梳理，帮助数据库管理员理解进程工作原理，为性能调优和故障诊断提供基础。后台进程的基础特性Oracle后台进程是指在V$PROCESS视图中存在且PNAME列非空的进程，它们独立于用
RxJava 全解析：从原理到 Android 实战 Monkey-旭 java rxjava 响应式编程 android
在Android开发中，异步任务处理是绕不开的核心场景——网络请求、数据库操作、文件读写等都需要在后台执行，而结果需回调到主线程更新UI。传统的“Handler+Thread”或AsyncTask不仅代码冗余，还容易陷入“回调地狱”（嵌套回调导致代码可读性差）。RxJava作为一款基于响应式编程思想的异步框架，通过“链式调用”和“操作符”完美解决了这些问题，成为Android开发者的必备工具。本文
JAVA 使用Apache POI合并Word文档并保留批注的实现
一、需求背景在实际工作中，我们经常需要将多个Word文档合并成一个文件。但当文档中包含批注（Comments）时，传统的复制粘贴会导致批注丢失或引用错乱。本文将介绍如何通过Java和ApachePOI库实现保留批注及引用关系的文档合并功能。二、技术选型核心依赖：org.apache.poipoi-ooxml5.3.0org.apache.poipoi-ooxml-full5.3.0三、实现原理详解
jxORM--编程指南 jxandrew jxWebUI 数据库 python jxWebUI jxORM ORM
jxORM是jxWebUI配套的数据库操作库，可以简化python程序员操作数据库。声明数据类定义数据类之前，先导入ORM修饰符：fromjxORMimportORM,DBDataType,ColType然后就可以用ORM修饰符来修饰一个类，从而定义一个数据类：@ORMclassUser:ID:DBDataType.Long=ColType.PrimaryKeyCreateTime:DBDataT
深度学习系列-----＞环境搭建（Ubuntu）二师兄用飘柔深度学习历程深度学习 ubuntu 人工智能 pytorch python
1、前言电脑基础系统硬件情况：系统：ubuntu18.04、显卡：GTX1050Ti；后续的环境搭建都在此基础上进行。此次学习选择Pytorch作为深度学习的框架，选择的原因主要由于PyTorch在研究领域特别受欢迎，较多的论文框架也是基于其开发。2、anaconda+python3安装测试在学习深度学习的过程中会涉及到使用不同版本python包的问题，而anaconda可以便捷获取包且对包能够进
Python中的enumerate()函数冉成未来 Service python 开发语言
文章目录基本用法参数说明特点实际应用与zip()的比较注意事项enumerate()是Python内置的一个非常有用的函数，它用于在遍历可迭代对象（如列表、元组、字符串等）时，同时获取元素的索引和值。基本用法fruits=['apple','banana','cherry']forindex,fruitinenumerate(fruits):print(index,fruit)输出：0apple1
远程连接之ssh的使用（日志监控）小朱撕码迹 ssh远程连接 linux ubuntu windows
ssh的简介ssh服务【SecureShell】：SSH为建立在应用层基础上的安全协议。SSH是较可靠，专为远程登录提供服务。解决的问题：对服务器的远程控制，远程操作。ssh服务是安全的、加密、基于S/C（服务端/客户端）的远程连接服务【运行的sshd进程会监听22号端口，提供远程登录的服务，服务的内容：远程操作服务器】OpenSSH是使用SSH协议远程登录的首选连接工具。它对所有流量进行加密，以
ASM系列六利用TreeApi 添加和移除类成员 lijingyao8206 jvm 动态代理 ASM 字节码技术 TreeAPI
同生成的做法一样，添加和移除类成员只要去修改fields和methods中的元素即可。这里我们拿一个简单的类做例子，下面这个Task类，我们来移除isNeedRemove方法，并且添加一个int 类型的addedField属性。 package asm.core; /** * Created by yunshen.ljy on 2015/6/
Springmvc-权限设计 bee1314 spring Web jsp
万丈高楼平地起。权限管理对于管理系统而言已经是标配中的标配了吧，对于我等俗人更是不能免俗。同时就目前的项目状况而言，我们还不需要那么高大上的开源的解决方案，如Spring Security，Shiro。小伙伴一致决定我们还是从基本的功能迭代起来吧。目标： 1.实现权限的管理（CRUD） 2.实现部门管理（CRUD) 3.实现人员的管理（CRUD） 4.实现部门和权限
算法竞赛入门经典（第二版）第2章习题 CrazyMizzz c 算法
2.4.1 输出技巧 #include <stdio.h> int main() { int i, n; scanf("%d", &n); for (i = 1; i <= n; i++) printf("%d\n", i); return 0; } 习题2-2 水仙花数(daffodil
struts2中jsp自动跳转到Action 麦田的设计者 jsp webxml struts2 自动跳转
1、在struts2的开发中，经常需要用户点击网页后就直接跳转到一个Action，执行Action里面的方法，利用mvc分层思想执行相应操作在界面上得到动态数据。毕竟用户不可能在地址栏里输入一个Action（不是专业人士） 2、＜jsp:forward page="xxx.action" /＞，这个标签可以实现跳转，page的路径是相对地址,不同与jsp和j
php 操作webservice实例 IT独行者 PHP webservice
首先大家要简单了解了何谓webservice，接下来就做两个非常简单的例子，webservice还是逃不开server端与client端。我测试的环境为：apache2.2.11 php5.2.10做这个测试之前，要确认你的php配置文件中已经将soap扩展打开，即extension=php_soap.dll; OK 现在我们来体验webservice //server端 serve
Windows下使用Vagrant安装linux系统 _wy_ windows vagrant
准备工作：下载安装 VirtualBox ：https://www.virtualbox.org/ 下载安装 Vagrant ：http://www.vagrantup.com/ 下载需要使用的 box ：官方提供的范例：http://files.vagrantup.com/precise32.box 还可以在 http://www.vagrantbox.es/
更改linux的文件拥有者及用户组(chown和chgrp) 无量 c linux chgrp chown
本文（转） http://blog.163.com/yanenshun@126/blog/static/128388169201203011157308/ http://ydlmlh.iteye.com/blog/1435157 一、基本使用：使用chown命令可以修改文件或目录所属的用户：命令
linux下抓包工具矮蛋蛋 linux
原文地址： http://blog.chinaunix.net/uid-23670869-id-2610683.html tcpdump -nn -vv -X udp port 8888 上面命令是抓取udp包、端口为8888 netstat -tln 命令是用来查看linux的端口使用情况 13 . 列出所有的网络连接 lsof -i 14. 列出所有tcp 网络连接信息 l
我觉得mybatis是垃圾！：“每一个用mybatis的男纸，你伤不起” alafqq mybatis
最近看了每一个用mybatis的男纸，你伤不起原文地址：http://www.iteye.com/topic/1073938 发表一下个人看法。欢迎大神拍砖；个人一直使用的是Ibatis框架，公司对其进行过小小的改良；最近换了公司，要使用新的框架。听说mybatis不错；就对其进行了部分的研究；发现多了一个mapper层；个人感觉就是个dao；
解决java数据交换之谜百合不是茶数据交换
交换两个数字的方法有以下三种，其中第一种最常用 /* 输出最小的一个数 */ public class jiaohuan1 { public static void main(String[] args) { int a =4; int b = 3; if(a<b){ // 第一种交换方式 int tmep =
渐变显示 bijian1013 JavaScript
<style type="text/css"> #wxf { FILTER: progid:DXImageTransform.Microsoft.Gradient(GradientType=0, StartColorStr=#ffffff, EndColorStr=#97FF98); height: 25px; } </style>
探索JUnit4扩展：断言语法assertThat bijian1013 java 单元测试 assertThat
一.概述 JUnit 设计的目的就是有效地抓住编程人员写代码的意图，然后快速检查他们的代码是否与他们的意图相匹配。 JUnit 发展至今，版本不停的翻新，但是所有版本都一致致力于解决一个问题，那就是如何发现编程人员的代码意图，并且如何使得编程人员更加容易地表达他们的代码意图。JUnit 4.4 也是为了如何能够
【Gson三】Gson解析{"data":{"IM":["MSN","QQ","Gtalk"]}} bit1129 gson
如何把如下简单的JSON字符串反序列化为Java的POJO对象? {"data":{"IM":["MSN","QQ","Gtalk"]}} 下面的POJO类Model无法完成正确的解析： import com.google.gson.Gson;
【Kafka九】Kafka High Level API vs. Low Level API bit1129 kafka
1. Kafka提供了两种Consumer API High Level Consumer API Low Level Consumer API(Kafka诡异的称之为Simple Consumer API，实际上非常复杂) 在选用哪种Consumer API时，首先要弄清楚这两种API的工作原理，能做什么不能做什么，能做的话怎么做的以及用的时候，有哪些可能的问题
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-归并排序 bylijinnan java
import java.util.Arrays; public class MergeSort { public static void main(String[] args) { int[] a={20,1,3,8,5,9,4,25}; mergeSort(a,0,a.length-1); System.out.println(Arrays.to
Netty源码学习-CompositeChannelBuffer bylijinnan java netty
CompositeChannelBuffer体现了Netty的“Transparent Zero Copy” 查看API（ http://docs.jboss.org/netty/3.2/api/org/jboss/netty/buffer/package-summary.html#package_description）可以看到，所谓“Transparent Zero Copy”是通
Android中给Activity添加返回键 hotsunshine Activity
// this need android:minSdkVersion="11" getActionBar().setDisplayHomeAsUpEnabled(true); @Override public boolean onOptionsItemSelected(MenuItem item) {
静态页面传参 ctrain 静态
$(document).ready(function () { var request = { QueryString : function (val) { var uri = window.location.search; var re = new RegExp("" + val + "=([^&?]*)", &
Windows中查找某个目录下的所有文件中包含某个字符串的命令 daizj windows 查找某个目录下的所有文件包含某个字符串
findstr可以完成这个工作。 [html] view plain copy >findstr /s /i "string" *.* 上面的命令表示，当前目录以及当前目录的所有子目录下的所有文件中查找"string&qu
改善程序代码质量的一些技巧 dcj3sjt126com 编程 PHP 重构
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短尽管很多人都遵
SharedPreferences对数据的存储 dcj3sjt126com
SharedPreferences简介： &nbs
linux复习笔记之bash shell (2) bash基础 eksliang bash bash shell
转载请出自出处： http://eksliang.iteye.com/blog/2104329 1.影响显示结果的语系变量（locale） 1.1locale这个命令就是查看当前系统支持多少种语系，命令使用如下： [root@localhost shell]# locale LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8"
Android零碎知识总结 gqdy365 android
1、CopyOnWriteArrayList add(E) 和remove(int index)都是对新的数组进行修改和新增。所以在多线程操作时不会出现java.util.ConcurrentModificationException错误。所以最后得出结论：CopyOnWriteArrayList适合使用在读操作远远大于写操作的场景里，比如缓存。发生修改时候做copy，新老版本分离，保证读的高
HoverTree.Model.ArticleSelect类的作用 hvt Web .net C#hovertree asp.net
ArticleSelect类在命名空间HoverTree.Model中可以认为是文章查询条件类，用于存放查询文章时的条件，例如HvtId就是文章的id。HvtIsShow就是文章的显示属性，当为-1是，该条件不产生作用，当为0时，查询不公开显示的文章，当为1时查询公开显示的文章。HvtIsHome则为是否在首页显示。HoverTree系统源码完全开放，开发环境为Visual Studio 2013
PHP 判断是否使用代理 PHP Proxy Detector 天梯梦 proxy
1. php 类 I found this class looking for something else actually but I remembered I needed some while ago something similar and I never found one. I'm sure it will help a lot of developers who try to
apache的math库中的回归——regression（翻译） lvdccyb Math apache
这个Math库，虽然不向weka那样专业的ML库，但是用户友好，易用。多元线性回归，协方差和相关性（皮尔逊和斯皮尔曼），分布测试（假设检验，t，卡方，G），统计。数学库中还包含，Cholesky，LU，SVD，QR，特征根分解，真不错。基本覆盖了：线代，统计，矩阵，最优化理论曲线拟合常微分方程遗传算法（GA），还有3维的运算。。。
基础数据结构和算法十三：Undirected Graphs (2) sunwinner Algorithm
Design pattern for graph processing. Since we consider a large number of graph-processing algorithms, our initial design goal is to decouple our implementations from the graph representation
云计算平台最重要的五项技术 sumapp 云计算云平台智城云
云计算平台最重要的五项技术 1、云服务器云服务器提供简单高效，处理能力可弹性伸缩的计算服务，支持国内领先的云计算技术和大规模分布存储技术，使您的系统更稳定、数据更安全、传输更快速、部署更灵活。特性机型丰富通过高性能服务器虚拟化为云服务器，提供丰富配置类型虚拟机，极大简化数据存储、数据库搭建、web服务器搭建等工作；仅需要几分钟，根据CP
《京东技术解密》有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的12月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 12月试读活动回顾： http://webmaster.iteye.com/blog/2164754 本次技术图书试读活动获奖名单及相应作品如下：一等奖（两名） Microhardest：http://microhardest.ite