起名好烦

Neural network and deep learning阅读笔记（4）神经网络学习方式

完整的手写字符识别代码在最下。

Weight initialization

在第一章创建神经网络的时候，曾经对weight和biases进行过初始化，当时是使用了两个独立高斯随机变量（均值为0，标准差为1），这一节看看有没有更好的初始化方法。假设我们现在有一个神经网络有1000个输入神经元，输入层到第一层隐藏层的权重是高斯分布的，忽略其他的神经元，只考虑输入层到第一个神经元的权重：

假设我们的输入x一半为1，一半为0，考虑z= $\Sigma$ _jw_jx_j+b，z是501项之和：500个输入为1的神经元的权重和一项偏置项。所以z的分布为均值为0，标准差为 $\sqrt{501}$ $\approx$ 22.4：

从图中看出z绝对值可能远远大于1，所以sigmoid函数会非常接近1或者0，神经元达到饱和，出现了learning slowdown的问题。由于正态分布太散了，我们尝试把它“挤压”一下，神经元输入权重标准差改为1/ $\sqrt{n}$ ，n就是这个神经元的输入权重个数，也可以用n_in表示。bias与之前一样。

嘿嘿嘿发出目的得逞的笑声~这个时候标准差只有大概1.22，就不容易饱和啦。

继续之前的神经网络，Network[784, 30, 10]【应该都熟悉了吧】，SGD(training_data, 30, 10, 0.1, lmbda = 5.0)，学习率从0.5缓慢的降到0.1。可以看到正确率快了很多：

Handwriting recognition revisited

把之前的所有想法（阅读笔记(3)和(4)中的想法）用代码实现一下~在network2.py中

class Network(object):
	def __init__(self, sizes, cost=CrossEntropyCost):
		self.num_layers = len(sizes)
		self.sizes = sizes
		self.default_weight_initializer()
		self.cost=cost

后两行是新加的，首先解释一下default_weight_initializer()

def default_weight_initializer(self):
	self.biases = [np.random.randn(y, 1) for y in self.sizes[1:]]
	self.weights = [np.random.randn(y, x)/np.sqrt(x) for x, y in zip(self.sizes[:-1], self.sizes[1:])]

注意到在bias的时候，我们并没有对第一层神经元初始化任何bias，因为第一层是输入层，所以不会用到bias。除了这个方法，我们还有一个large_weight_initializer方法，使用了第一章的方法：weights&bias分布为N(0,1)

def large_weight_initializer(self):
	self.biases = [np.random.randn(y, 1) for y in self.sizes[1:]]
	self.weights = [np.random.randn(y, x) for x, y in zip(self.sizes[:-1], self.sizes[1:])]

第二个在Network中的改变是，我们初始化了cost，首先看一下交叉熵损失的定义：

class CrossEntropyCost(object):
	@staticmethod
	def fn(a, y):
		return np.sum(np.nan_to_num(-y*np.log(a)-(1-y)*np.log(1-a)))
	
	@staticmethod
	def delta(z, a, y):
		return (a-y)

作者选择将交叉熵损失定义成一个类而不是一个函数，是因为损失函数除了衡量实际输出和理想输出之间的差距（CrossEntropyCost.fn），在第二章中后向传播算法还需要我们计算输出误差 $\delta$ ^L，不同的损失函数计算出来是不一样的，对于交叉熵损失函数，之前说过误差为：

这是CrossEntropyCost.delta的作用。对比一下quadratic cost function：

class QuadraticCost(object):
	@staticmethod
	def fn(a, y):
		return 0.5*np.linalg.norm(a-y)*np.linalg.norm(a-y)
	
	@staticmethod
	def delta(z, a, y):
	return (a-y) * sigmoid_prime(z)

除了这些，还有一个很重要的变化就是加了L2正则化，主要就是将正则系数lmbda(SGD方法中)传递到其他的方法中，还有在updata_mini_batch中的两句话：

self.weights = [(1-eta*(lmbda/n))*w-(eta/len(mini_batch))*nm for w, nw in zip(self.weights, nabla_w)]
self.biases = [b-(eta/len(mini_batch))*nb for b, nb in zip(self.biases, nabla_b)]

还有一个变化是在随机梯度下降方法中加了许多optional flags，为了监控损失和正确率。比如：

net.SGD(training_data, 30, 10, 0.5, lmbda = 5.0, 
	evaluation_data=validation_data, 
	monitor_evaluation_accuracy=True, 
	monitor_evaluation_cost=True, 
	monitor_training_accuracy=True,
	monitor_training_cost=True)

这里就设置validation_data为evaluation_data，有四个flag来监控损失和正确率。

How to choose hyper-parameters

这一节作者讲了如何选择参数，比如学习率、正则化系数等。在完全对问题没有了解的情况下，我们可能选择学习率为10，正则化系数为1000【这都随意
首先我们可以把问题分解，只关注训练集和验证集中的“0”和“1”，只分辨这两个数字，这样一下子就把问题缩小了五倍；还可以训练一个[784, 10]的网络，会比[784, 30, 10]快很多；还可以提高监控的频率，以前是一个周期（50000张）监控一次，现在改成1000张图片监控一次；或者只使用100张验证图片【本来 $\lambda$ 是1000，但是我们训练样本少了，所以为了保证weight decay， $\lambda$ 改为20.0】：

net = network2.Network([784, 10])
net.SGD(training_data[:1000], 30, 10, 10.0, lmbda = 20.0, evaluation_data=validation_data[:100], monitor_evaluation_accuracy=True)

根据monitor返回的正确率去不断的人为调整这两个参数，正确率高且不断上升，说明调整的方向是正确的，反之则不正确，先确定学习率再确定正则化系数。调整好之后再增加网络复杂性，比如不断增加隐藏层神经元数目。
但是很有可能，不管怎么调整参数，结果都并没有变好，尤其是当网络变复杂之后，不可能再一点一点人为调整。
作者主要针对三个参数介绍设定方法：学习率 $\eta$ 、正则化系数 $\lambda$ 、mini-batch数目。

Learning rate

对于同样的神经网络【之前的30周期、mini-batch数目10、 $\lambda$ =5.0、训练样本为50000】，我们分别设定学习率为0.025、0.25、2.5：

2.5的时候是因为步子太大，错过了最低点，0.25的时候在20个epoch之后饱和了，0.025的时候一直在下降，但是速度较慢。所以更好的方法是前20个epoch选择0.25，之后选择0.025。不过我们先关注如何选择一个单独的好学习率。

这个方法是，首先随机选取一个 $\eta$ ，比如0.01，这个 $\eta$ 可以使cost在刚开始几个epoch立即开始下降，而不是上升或者振动，然后我们尝试0.1，1.0，10.0……等等，直到找到一个 $\eta$ 使cost在刚开始几个epoch振动或者上升。如果刚开始的0.01时损失就开始震动或者上升，那我们就尝试0.001，0.0001……直到找到一个 $\eta$ 使cost在刚开始几个epoch就下降。由此我们找到了一个 $\eta$ 的threshold value。

显然， $\eta$ 的真实值不能大于这个threshold value。在低于门槛值的情况下，某个 $\eta$ 很好的运行了一段时间，我们可以将其换成更小的值，类似除以2。比如我们选取到的threshold value是0.5，并且0.5运行了超过30个epoch，我们可以使用0.25。

不过用损失来选取参数会导致过拟合问题，之前说过这个问题，我们之后的参数就用validation accuracy来选取。

The regularization parameter $\lambda$

刚开始令 $\lambda$ 为0，选择合适的 $\eta$ ，然后设 $\lambda$ 初值为1.0，然后以10倍增加或减少。等选择了合适的 $\lambda$ ，再反过来重新考虑合适的 $\eta$ 。

mini-batch size

复习一下，mini-batch的主要想法是由于计算所有的训练样本的梯度太复杂，我们选取一小部分样本计算梯度，来代替总梯度。如果样本选少了，很可能代替的不是那么准确，但是作者说问题不大，因为我们的mini-batch可以变，这样子误差就会被平均。
我们可以使用矩阵同时计算mini-batch中所有样本，而不是一遍遍循环计算（书中上一章提过，我没记笔记，即用一个矩阵而不是用很多个向量来代表输入）。我们可以用这个方法去计算有一百个训练样本的mini-batch，可能只需要循环计算50个样本的时间就能完成。比如有100个样本的时候，循环计算的权重变化：

而使用矩阵时的权重变化：

第二种是一种训练方法，叫online learning，指的是每来一个训练样本，就计算一次损失来更新权重，能够根据线上反馈数据，实时进行模型调整。所以这样子就远远比来一百个样本然后统一计算损失再取平均快得多，我们的权重更新频率大大提高。假设我们变化学习率，比如以100倍的速度增加，那我们的权重更新就变成：

所以，mini-batch越大速度就会越快【其实我这里有点没看懂，是因为权重更新变快所以速度快了吗？截图放下面，有时间复习一下：

mini-batch数量要是少了，就没有充分运用用矩阵计算的快捷简便，要是多了，就没有办法很快的更新权重。mini-batch size是相对独立的一个参数，并不需要跟其他参数一起考虑最优化。正确的做法是，其他的参数用一些合适（并不一定非要最优化）的值，然后试验一系列mini-batch size，然后改变学习率 $\eta$ 。观察验证集正确率和时间（不是epoch），选择学习最快的mini-batch size。然后用这个mini-batch size去选择其他的参数的最优值。

全部代码我自己实现了一下，附在下面供参考

'''network2.py
An improved version of network.py, implementing the stochastic 
gradient descent learning algorithm for a feedforward neural 
network. Improvements include the addition of the cross-entropy 
cost function, regularization, and better initialization of 
network weights. Note that I have focused on making the code 
simple, easily readable, and easily modifiable. It is not 
optimized, and omits many desirable features.
'''

#### Libraries
# Standard library
import json
import random
import sys

# Third-party libraries
import numpy as np

#### Define the quadratic and cross-entropy cost functions

class QuadraticCost(object):

    @staticmethod
    def fn(a, y):
        return 0.5*np.linalg.norm(a-y)**2

    @staticmethod
    def delta(z, a, y):
        return (a-y)*sigmoid_prime(z)

class CrossEntropyCost(object):

    @staticmethod
    def fn(a, y):
        return np.sum(np.nan_to_num(-y*np.log(a)-(1-y)*np.log(1-a)))

    @staticmethod
    def delta(z, a, y):
        return (a-y)

#### Main network class

class Network(object):
    def __init__(self, sizes, cost=CrossEntropyCost):
        self.num_layers = len(sizes)
        self.sizes = sizes
        self.default_weight_initializer()
        self.cost=cost

    def default_weight_initializer(self):
        self.biases = [np.random.randn(y, 1) for y in self.sizes[1:]]
        self.weights = [np.random.randn(y, x)/np.sqrt(x) for x, y in zip(self.sizes[:-1], self.sizes[1:])]

    def large_weight_initializer(self):
        self.biases = [np.random.randn(y, 1) for y in self.sizes[1:]]
        self.weights = [np.random.randn(y, x) for x, y in zip(self.sizes[:-1], self.sizes[1:])]

    def feedforward(self, a):
        for b, w in zip(self.biases, self.weights):
            a = sigmoid(np.dot(w, a)+b)
        return a

    def SGD(self, training_data, epochs, mini_batch_sizes, eta,
            lmbda=0.0,
            evaluation_data=None,
            monitor_evaluation_cost=False,
            monitor_evaluation_accuracy=False,
            monitor_training_cost=False,
            monitor_training_accuracy=False):
        if evaluation_data:
            n_data = len(evaluation_data)
        n = len(training_data)
        evaluation_cost, evaluation_accuracy = [], []
        training_cost, training_accuracy = [], []
        for j in range(epochs):
            random.shuffle(training_data)
            mini_batches = [
                training_data[k:k+mini_batch_size]
                for k in range(0, n, mini_batch_size)]
            for mini_batch in mini_batches:
                self.update_mini_batch(mini_batch, eta, lmbda, len(training_data))
            print('Epoch %s training complete' % j)
            if monitor_training_cost:
                cost = self.total_cost(training_data, lmbda)
                training_cost.append(cost)
                print("Cost on training data: {}".format(cost))
            if monitor_training_accuracy:
                accuracy = self.accuracy(training_data, convert=True)
                training_accuracy.append(accuracy)
                print("Accuracy on training data: {}/{}".format(accuracy, n))
            if monitor_evaluation_cost:
                cost = self.total_cost(evaluation_data, lmbda, convert=True)
                evaluation_cost.append(cost)
                print("Cost on evaluation data: {}".format(cost))
            if monitor_evaluation_accuracy:
                accuracy = self.accuracy(evaluation_data)
                evaluation_accuracy.append(accuracy)
                print("Accuracy on evaluation data: {}/{}".format(self.accuracy(evaluation_data), n_data))
            print()
        return evaluation_cost, evaluation_accuracy, training_cost, training_accuracy

    def update_mini_batch(self, mini_batch, eta, lmbda, n):
        nabla_b = [np.zeros(b.shape) for b in self.biases]
        nabla_w = [np.zeros(w.shape) for w in self.weights]
        for x, y in mini_batch:
            delta_nabla_b, delta_nabla_w = self.backprop(x, y)
            nabla_b = [nb+dnb for nb, dnb in zip(nabla_b, delta_nabla_b)]
            nabla_w = [nw+dnw for nw, dnw in zip(nabla_w, delta_nabla_w)]
        self.weights = [(1-eta*(lmbda/n))*w-(eta/len(mini_batch))*nw for w, nw in zip(self.weights, nabla_w)]
        self.biases = [b-(eta/len(mini_batch))*nb for b, nb in zip(self.biases, nabla_b)]

    def backprop(self, x, y):
        nabla_b = [np.zeros(b.shape) for b in self.biases]
        nabla_w = [np.zeros(w.shape) for w in self.weights]
        # feedforward
        activation = x
        activations = [x]
        zs = []  # list to store all the z vectors
        for b, w in zip(self.biases, self.weights):
            z = np.dot(w, activation)+b
            zs.append(z)
            activation = sigmoid(z)
            activations.append(activation)
        # backward pass
        delta = (self.cost).delta(zs[-1], activations[-1], y)
        nabla_b[-1] = delta
        nabla_w[-1] = np.dot(delta, activations[-2].transpose())
        for l in range(2, self.num_layers):
            z = zs[-1]
            sp = sigmoid_prime(z)
            delta = np.dot(self.weights[-l+1].transpose(), delta)*sp
            nabla_b[-1] = delta
            nabla_w[-1] = np.dot(delta, activations[-l+1].transpose())
        return (nabla_b, nabla_w)

    def accuracy(self, data, convert=False):
        '''The flag "convert" should be set to False if the data 
        set is validation or test data (the usual case), and to 
        True if the data set is the training data. The need for 
        this flag arises due to differences in the way the results 
        "y" are represented in the different data sets.'''
        if convert:
            results = [(np.argmax(self.feedforward(x)), np.argmax(y)) for (x, y) in data]
        else:
            results = [(np.argmax(self.feedforward(x)), y) for (x, y) in data]
        return sum(int(x == y) for (x, y) in results)

    def total_cost(self, data, lmbda, convert=False):
        cost = 0.0
        for x, y in data:
            a = self.feedforward(x)
            if convert:
                y = vectorized_result(y)
                cost += self.cost.fn(a, y)/len(data)
            cost += 0.5*(lmbda/len(data))*sum(np.linalg.norm(w)**2 for w in self.weights)
            return cost

    def save(self, filename):
        data = {"sizes": self.sizes,
                "weights": [w.tolist() for w in self.weights],
                "biases": [b.tolist() for b in self.biases],
                "cost": str(self.cost.__name__)}
        f = open(filename, "w")
        json.dump(data, f)
        f.close()


#### Loading a Network
def load(filename):
    f = open(filename, "r")
    data = json.load(f)
    f.close()
    cost = getattr(sys.modules[__name__], data["cost"])
    net = Network(data["sizes"], cost=cost)
    net.weights = [np.array(w) for w in data["weights"]]
    net.biases = [np.array(b) for b in data["biases"]]
    return net

#### Miscellaneous functions
def vectorized_result(j):
    e = np.zeros((10, 1))
    e[j] = 1.0
    return e

def sigmoid(z):
    return 1.0/(1.0+np.exp(-z))

def sigmoid_prime(z):
    return sigmoid(z)*(1-sigmoid(z))

论文阅读：Deep Bilateral Learning for Real-Time Image Enhancement-google-hdrnet-slicing SetMaker 论文阅读
项目地址:https://gitcode.com/google/hdrnethdrnet作为超分领域的经典文章，由google提出主要用来用轻量化的方法来实现高分辨率的图像生成，hdrnet结合cnn可以让更高分辨率的图像部署在板端。如图所示，原始图像比如4k图像，首先分为两个主要模块：grid和guide。grid就是对应图上面的那一条特征提取网络，具体来说，原始图像经过下采样之后，默认256分
2017-SIGGRAPH-Google,MIT-(HDRNet)Deep Bilateral Learning for Real-Time Image Enhancements WX Chen HDR技术深度学习神经网络机器学习
双边网格本质上是一个可以保存边缘信息的3维的数据结构。对于一张2维图片,在2维空间中增加了一维代表像素的强度slice操作(上采样)BilateralGuidedUpsampling这篇文章用双边网格实现图像的操作算子的加速。算法的核心思想是将一幅高分辨率的图像通过下采样转换成一个双边网格,在双边网格中每个格子就是一个图像的仿射变换算子,它的原理是在空间与值域相近的区域内,相似输入图像的亮度经算子
AWS GCR EKS Resource：构建高效弹性云原生应用的利器杨女嫚
AWSGCREKSResource：构建高效弹性云原生应用的利器eks-workshop-greater-chinaAWSWorkshopforLearningEKSforGreaterChina项目地址:https://gitcode.com/gh_mirrors/ek/eks-workshop-greater-china在云计算的浪潮中，AWS（AmazonWebServices）一直处于创新
AI行业高压与人才健康：纪念Felix Hill，并探讨AI代码生成工具的价值前端
今天，我们怀着沉痛的心情悼念GoogleDeepMind研究科学家FelixHill，这位杰出的AI学者在41岁的年纪离开了我们。他的离世引发了我们对AI行业高压环境与人才健康问题的深刻反思。Felix生前曾公开表达AI行业前所未有的压力，这促使我们思考如何利用技术，例如AI代码生成器，来改善开发者的工作环境，提升效率，守护人才健康。FelixHill在自然语言处理和人工智能领域取得了令人瞩目的成
DeepSeek新模型霸榜，代码能力与OpenAI o1相当且确认开源，网友：今年编程只剩Tab键量子位
原创关注前沿科技量子位DeepSeek版o1，有消息了。还未正式发布，已在代码基准测试LiveCodeBench霸榜前三，表现与OpenAIo1的中档推理设置相当。注意了，这不是在DeepSeek官方App已经能试玩的DeepSeek-R1-Lite-Preview（轻量预览版）。而是摘掉了轻量版的帽子，称为DeepSeek-R1-Preview（预览版），意味着替换了规模更大的基础模型。Live
deepin 中 find 命令查找技巧 deepin
find命令是deepin系统中一个非常强大的文件查找工具，它可以帮助用户快速定位文件和目录。全面掌握这个命令可以使很多操作达到事半功倍的效果。本文将详细介绍find命令的各种查找技巧，包括基本用法、高级技巧和实际应用场景。基本用法1.1命令格式find命令的基本格式如下：find[路径][表达式]•路径：指定要搜索的目录路径。可以是一个或多个路径。•表达式：指定查找文件的条件和操作。表达式是fi
deepin桌面卡死问题应对策略 deepin
摘要：deepin操作系统，作为一款基于Linux的国产操作系统，以其美观的界面和稳定的性能受到用户的喜爱。然而，用户在使用过程中可能会遇到桌面卡死的问题。本文将提供一些常见的桌面卡死情况及其解决方案，帮助用户快速恢复系统的正常运行。引言deepin操作系统在提供高效能的同时，也可能会遇到桌面卡死的问题。这种情况可能是由于桌面环境、Xorg服务或者特定进程的异常造成的。本文将针对这些情况提供详细的
在 deepin 中使用原生 Wine 安装与运行 Windows 软件指南 deepin
一、前言deepin作为一款广受好评的国产Linux发行版，凭借其出色的性能和易用性，吸引了众多用户。然而，在使用deepin时，我们可能会遇到一些仅支持Windows平台的软件。借助Wine这一兼容层，我们可以在deepin中顺利安装和运行这些Windows软件。本文将详细阐述在deepin中利用原生Wine安装与运行Windows软件的全过程，以32位7-Zip的安装程序为例，助你轻松掌握相关
deepin下载mysql教程 deepinmysql
官方下载Mysql8.2支持here解压到需要的文件夹去(建议放到/opt/mysql/mysql8)建立mysql的用户与组（groupaddmysql&&useradd-r-gmysqlmysql）创建软链接到系统中,后继服务与配置中会使用到cd/usr/local&&sudoln-s/opt/mysql/mysql8mysql8cd/usr/bin&&sudoln-s/opt/mysql/m
deepin 中 apt 与 dpkg 安装包管理工具的区别 deepin
在Linux系统中，尤其是基于Debian的发行版如Ubuntu和deepin，apt和dpkg是两种常用的包管理工具。它们在功能和使用场景上有一些显著的区别。本文将详细介绍这两种工具的主要区别以及它们的常用命令。主要区别1.1dpkg•功能：dpkg侧重于本地软件包的管理。它主要用于安装、删除和查询本地的.deb文件。•依赖管理：dpkg不会自动处理依赖关系。如果安装的包有依赖，需要手动安装这些
deepin-如何在 ArchLinux 发行版上安装 DDE 桌面环境 deepin
ArchLinux是一个独立开发的x86-64通用GNU/Linux发行版，其用途广泛，足以适应任何角色。开发侧重于简单、极简主义和代码优雅。Arch是作为一个最小的基础系统安装的，由用户配置，通过仅安装其独特目的所需或所需的东西来组装他们自己的理想环境。官方没有提供GUI配置实用程序，大多数系统配置是通过编辑简单的文本文件从shell执行的。Arch努力保持领先，通常提供大多数软件的最新稳定版本
deepin操作系统壁纸管理操作及命令行指南 deepin
摘要：壁纸作为操作系统可视化的重要组成部分，不仅美化了桌面环境，也体现了用户的个性化需求。deepin操作系统提供了丰富的壁纸管理功能，包括为每个显示器设置壁纸、自定义壁纸、管理壁纸库等。本文将详细介绍如何通过命令行对Deepin的壁纸进行管理，包括设置壁纸、获取壁纸列表、删除壁纸以及获取当前壁纸路径等操作。引言deepin操作系统允许用户通过多种方式管理壁纸，包括图形界面和命令行。命令行操作为用
deepin系统升级后网络模块丢失问题的解决方案 deepin
摘要：在deepin操作系统的升级过程中，用户可能会遇到网络模块丢失的问题，这通常与升级命令处理推荐依赖的方式有关。本文将探讨这一问题的成因，并提供推荐的升级方法和解决方案，以确保系统升级的完整性和功能的完整性。引言deepin操作系统在升级过程中，如果使用不当的命令，可能会导致部分功能模块丢失，如网络模块。这可能会影响用户的正常使用。本文将提供解决方案，帮助用户恢复丢失的网络模块。问题分析2.1
deepin操作系统任务栏网络图标异常问题解决指南 deepin
摘要：在使用deepin操作系统时，用户可能会遇到任务栏网络图标显示异常的情况，即使网络连接正常，图标也可能错误地提示无法访问互联网。本文将探讨这一问题的成因，并提供一系列解决方案，以帮助用户解决任务栏网络图标状态异常的问题。引言deepin操作系统的任务栏网络图标有时会出现状态异常，这可能是由于网络检测机制的误判或配置文件的错误。本文将提供详细的解决方案，以确保网络图标能够准确反映网络连接状态。
deepin操作系统登录问题全面分析与解决方案 deepin
摘要：deepin操作系统，作为一款基于Linux的国产操作系统，以其美观的界面和稳定的性能受到用户的喜爱。然而，用户在使用过程中可能会遇到无法登录的问题。本文将对deepin无法登录的问题进行详细分析，并提供相应的解决方案。引言deepin操作系统在升级或使用过程中可能会出现无法登录的情况，这可能是由于系统升级、配置文件错误或软件冲突等原因造成的。本文旨在帮助用户解决这些问题，确保系统的正常使用
deepin桌面卡死问题处理指南 deepin
摘要：deepin操作系统以其优雅的界面和流畅的用户体验受到用户的青睐。然而，用户有时可能会遇到桌面卡死的问题，这可能由多种原因引起。本文将提供一些常见的桌面卡死情况及其解决方案，帮助用户快速恢复系统的正常运行。引言deepin操作系统在提供高效能的同时，也可能会遇到桌面卡死的问题。这种情况可能是由于桌面环境、Xorg服务或者特定进程的异常造成的。本文将针对这些情况提供详细的解决方案。桌面卡死常见
如何在 deepin文件夹中搜索包含特定内容、关键字的 Word 文档 deepin
在deepin系统中，搜索包含特定内容或关键字的Word文档是一项常见需求。以下是一个详细的步骤指南，帮助你在文件夹中高效地完成这项任务。一、安装依赖工具要搜索Word文档，首先需要安装一些必要的工具。这些工具包括catdoc、docx2txt、iconv和grep。它们分别用于处理不同格式的Word文档、字符编码转换和文本搜索。在终端执行以下命令安装这些工具：sudoaptinstallcatd
用deepin-wine6安装/运行exe程序的方法 deepin
一、建立deepin-wine6-stable环境对于新装的系统，首先需要安装一款应用商店里使用deepin-wine6-stable运行的wine应用，例如wine版微信或wine版QQ，并运行一下。这样，系统会自动建立deepin-wine6-stable环境，为后续安装其他exe程序奠定基础.二、安装exe程序以32位7-Zip的安装程序7z2107.exe（版本21.7.0.0）为例，该e
deepin 系统网络信息查看指南 deepin
deepin系统网络信息查看指南在Linux操作系统，如deepin和Ubuntu中，我们可以通过多种shell命令来查看网络信息和网络状态。本文将介绍这些命令，帮助您更好地理解和监控您的网络环境。1.ifconfig命令ifconfig是查看所有网卡信息的命令，但已被弃用，推荐使用ip命令。ifconfig2.ip命令ip命令用于查看所有网卡的信息。#查看所有接口信息：ipaddrshow#查看
什么是多模态机器学习：跨感知融合的智能前沿非凡暖阳人工智能神经网络
在人工智能的广阔天地里，多模态机器学习（MultimodalMachineLearning）作为一项前沿技术，正逐步解锁人机交互和信息理解的新境界。它超越了单一感官输入的限制，通过整合视觉、听觉、文本等多种数据类型，构建了一个更加丰富、立体的认知模型，为机器赋予了接近人类的综合感知与理解能力。本文将深入探讨多模态机器学习的定义、核心原理、关键技术、面临的挑战以及未来的应用前景，旨在为读者勾勒出这一
Python|基于DeepSeek大模型，实现文本内容仿写（8）写python的鑫哥 AI大模型实战应用人工智能 python 大模型 DeepSeek Kimi 文本仿写
前言本文是该专栏的第8篇，后面会持续分享AI大模型干货知识，记得关注。我们在处理文本数据项目的时候，有时可能会遇到这样的需求。比如说，指定某些文本模板样例，需要仿写或者生成该“模板”样例数据。再或者说，通过给予某些指定类型的关键词，生成关键词相关领域的文本素材或内容。如果单单投入人力去完成，这肯定是没问题，但耗费的更多是人力成本。而现阶段，对于这种需求，大大可以选择大模型去完成。而本文，笔者将基于
像素空间文生图之Imagen原理详解 funNLPer AI算法 Imagen stable diffusion AIGC
论文：PhotorealisticText-to-ImageDiffusionModelswithDeepLanguageUnderstanding项目地址：https://imagen.research.google/代码（非官方）：https://github.com/deep-floyd/IF模型权重：https://huggingface.co/DeepFloyd/IF-I-XL-v1.0
::v-deep的理解记得早睡~ vue.js 前端 javascript
vue样式穿透在刚开始使用element-ui组件库时，想要修改其内部的样式，但总是不生效，通过查询资料，了解到了深度作用选择器。如果希望scoped样式中的一个选择器能够作用得“更深”，例如影响子组件，可以使用>>>操作符：.a>>>.b{width:100%;height:100%;background:red;}但是像scss等预处理器却无法解析>>>，所以我们使用下面的方式：.a{/dee
蓝桥杯真题 - 公因数匹配 - 题解 ExRoc 蓝桥杯算法 c++
题目链接：https://www.lanqiao.cn/problems/3525/learning/个人评价：难度2星（满星：5）前置知识：调和级数整体思路题目描述不严谨，没说在无解的情况下要输出什么（比如nnn个111），所以我们先假设数据保证有解；从222到10610^6106枚举xxx作为约数，对于约数xxx去扫所有xxx的倍数，总共需要扫n2+n3+n4+⋯+nn≈nln⁡n\frac{
蓝桥杯真题 - 子树的大小 - 题解 ExRoc 蓝桥杯算法 c++
题目链接：https://www.lanqiao.cn/problems/3526/learning/个人评价：难度2星（满星：5）前置知识：无整体思路整体将节点编号−1-1−1，通过找规律可以发现，节点iii下一层最左边的节点编号是im+1im+1im+1，最右边的节点编号是im+mim+mim+m；用l,rl,rl,r分别标记当前层子树的最小节点编号与最大节点编号，每次让最左边的节点往下一层的
C#遇见TensorFlow.NET：开启机器学习的全新时代墨夶 C#学习资料1 机器学习 c#tensorflow
在当今快速发展的科技世界里，机器学习（MachineLearning,ML）已经成为推动创新的重要力量。从个性化推荐系统到自动驾驶汽车，ML的应用无处不在。对于那些习惯于使用C#进行开发的程序员来说，将机器学习集成到他们的项目中似乎是一项具有挑战性的任务。但随着TensorFlow.NET的出现，这一切变得不再困难。今天，我们将一起探索如何利用这一强大的工具，在熟悉的.NET环境中轻松构建、训练和
【JVM】—G1 GC日志详解一棵___大树 JVM jvm
G1GC日志详解⭐⭐⭐⭐⭐⭐Github主页https://github.com/A-BigTree笔记链接https://github.com/A-BigTree/Code_Learning⭐⭐⭐⭐⭐⭐如果可以，麻烦各位看官顺手点个star~文章目录G1GC日志详解1G1GC周期2G1日志开启与设置3YoungGC日志4MixedGC5FullGC关于G1回收器的前置知识点：【JVM】—深入理解
NLP 中文拼写检测纠正论文-04-Learning from the Dictionary 后端java
拼写纠正系列NLP中文拼写检测实现思路NLP中文拼写检测纠正算法整理NLP英文拼写算法，如果提升100W倍的性能？NLP中文拼写检测纠正Paperjava实现中英文拼写检查和错误纠正？可我只会写CRUD啊！一个提升英文单词拼写检测性能1000倍的算法？单词拼写纠正-03-leetcodeedit-distance72.力扣编辑距离NLP开源项目nlp-hanzi-similar汉字相似度word-
【已解决】ImportError: libnvinfer.so.8: cannot open shared object file: No such file or directory 小小小小祥 python
问题描述：按照tensorrt官方安装文档：https://docs.nvidia.com/deeplearning/tensorrt/install-guide/index.html#installing-tar安装完成后，使用python测试导入tensorrtimporttensorrt上述代码报错：Traceback(mostrecentcalllast):File“main.py”,li
ASPICE 4.0引领自动驾驶未来：机器学习模型的特点与实践亚远景aspice 机器学习自动驾驶人工智能
ASPICE4.0-ML机器学习模型是针对汽车行业，特别是在汽车软件开发中，针对机器学习（MachineLearning,ML）应用的特定标准和过程。ASPICE（AutomotiveSPICE）是一种基于软件控制的系统开发过程的国际标准，旨在提升软件开发过程的质量、效率和可靠性。ASPICE4.0中的ML模型部分则进一步细化了机器学习在汽车软件开发中的具体要求和流程。以下是对ASPICE4.0-
桌面上有多个球在同时运动，怎么实现球之间不交叉，即碰撞？换个号韩国红果果 html 小球碰撞
稍微想了一下，然后解决了很多bug，最后终于把它实现了。其实原理很简单。在每改变一个小球的x y坐标后，遍历整个在dom树中的其他小球，看一下它们与当前小球的距离是否小于球半径的两倍？若小于说明下一次绘制该小球（设为a）前要把他的方向变为原来相反方向（与a要碰撞的小球设为b），即假如当前小球的距离小于球半径的两倍的话，马上改变当前小球方向。那么下一次绘制也是先绘制b，再绘制a，由于a的方向已经改变
《高性能HTML5》读后整理的Web性能优化内容白糖_ html5
读后感先说说《高性能HTML5》这本书的读后感吧，个人觉得这本书前两章跟书的标题完全搭不上关系，或者说只能算是讲解了“高性能”这三个字，HTML5完全不见踪影。个人觉得作者应该首先把HTML5的大菜拿出来讲一讲，再去分析性能优化的内容，这样才会有吸引力。因为只是在线试读，没有机会看后面的内容，所以不胡乱评价了。
[JShop]Spring MVC的RequestContextHolder使用误区 dinguangx jeeshop 商城系统 jshop 电商系统
在spring mvc中，为了随时都能取到当前请求的request对象，可以通过RequestContextHolder的静态方法getRequestAttributes()获取Request相关的变量，如request, response等。在jshop中，对RequestContextHolder的
算法之时间复杂度周凡杨 java 算法时间复杂度效率
在计算机科学中，算法的时间复杂度是一个函数，它定量描述了该算法的运行时间。这是一个关于代表算法输入值的字符串的长度的函数。时间复杂度常用大O符号表述，不包括这个函数的低阶项和首项系数。使用这种方式时，时间复杂度可被称为是渐近的，它考察当输入值大小趋近无穷时的情况。这样用大写O()来体现算法时间复杂度的记法，
Java事务处理 g21121 java
一、什么是Java事务通常的观念认为，事务仅与数据库相关。事务必须服从ISO/IEC所制定的ACID原则。ACID是原子性（atomicity）、一致性（consistency）、隔离性（isolation）和持久性（durability）的缩写。事务的原子性表示事务执行过程中的任何失败都将导致事务所做的任何修改失效。一致性表示当事务执行失败时，所有被该事务影响的数据都应该恢复到事务执行前的状
Linux awk命令详解 510888780 linux
一. AWK 说明 awk是一种编程语言，用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入、一个或多个文件，或其它命令的输出。它支持用户自定义函数和动态正则表达式等先进功能，是linux/unix下的一个强大编程工具。它在命令行中使用，但更多是作为脚本来使用。 awk的处理文本和数据的方式：它逐行扫描文件，从第一行到
android permission 布衣凌宇 Permission
<uses-permission android:name="android.permission.ACCESS_CHECKIN_PROPERTIES" ></uses-permission>允许读写访问"properties"表在checkin数据库中，改值可以修改上传 <uses-permission android:na
Oracle和谷歌Java Android官司将推迟 aijuans java oracle
北京时间 10 月 7 日，据国外媒体报道，Oracle 和谷歌之间一场等待已久的官司可能会推迟至 10 月 17 日以后进行，这场官司的内容是 Android 操作系统所谓的 Java 专利权之争。本案法官 William Alsup 称根据专利权专家 Florian Mueller 的预测，谷歌 Oracle 案很可能会被推迟。　　该案中的第二波辩护被安排在 10 月 17 日出庭，从目前看来
linux shell 常用命令 antlove linux shell command
grep [options] [regex] [files] /var/root # grep -n "o" * hello.c:1:/* This C source can be compiled with:
Java解析XML配置数据库连接(DOM技术连接 SAX技术连接) 百合不是茶 sax技术 Java解析xml文档 dom技术 XML配置数据库连接
XML配置数据库文件的连接其实是个很简单的问题,为什么到现在才写出来主要是昨天在网上看了别人写的,然后一直陷入其中,最后发现不能自拔所以今天决定自己完成 ,,,,现将代码与思路贴出来供大家一起学习 XML配置数据库的连接主要技术点的博客; JDBC编程 : JDBC连接数据库 DOM解析XML: DOM解析XML文件 SA
underscore.js 学习（二） bijian1013 JavaScript underscore
Array Functions 所有数组函数对参数对象一样适用。1.first _.first(array, [n]) 别名: head, take 返回array的第一个元素，设置了参数n，就
plSql介绍 bijian1013 oracle 数据库 plsql
/* * PL/SQL 程序设计学习笔记 * 学习plSql介绍.pdf * 时间：2010-10-05 */ --创建DEPT表 create table DEPT ( DEPTNO NUMBER(10), DNAME NVARCHAR2(255), LOC NVARCHAR2(255) ) delete dept; select
【Nginx一】Nginx安装与总体介绍 bit1129 nginx
启动、停止、重新加载Nginx nginx 启动Nginx服务器，不需要任何参数u nginx -s stop 快速(强制)关系Nginx服务器 nginx -s quit 优雅的关闭Nginx服务器 nginx -s reload 重新加载Nginx服务器的配置文件 nginx -s reopen 重新打开Nginx日志文件
spring mvc开发中浏览器兼容的奇怪问题 bitray jquery Ajax springMVC 浏览器上传文件
最近个人开发一个小的OA项目,属于复习阶段.使用的技术主要是spring mvc作为前端框架,mybatis作为数据库持久化技术.前台使用jquery和一些jquery的插件. 在开发到中间阶段时候发现自己好像忽略了一个小问题,整个项目一直在firefox下测试,没有在IE下测试,不确定是否会出现兼容问题.由于jquer
Lua的io库函数列表 ronin47 lua io
1、io表调用方式：使用io表，io.open将返回指定文件的描述，并且所有的操作将围绕这个文件描述　　io表同样提供三种预定义的文件描述io.stdin,io.stdout,io.stderr 　　2、文件句柄直接调用方式,即使用file:XXX()函数方式进行操作,其中file为io.open()返回的文件句柄　　多数I/O函数调用失败时返回nil加错误信息,有些函数成功时返回nil
java-26-左旋转字符串 bylijinnan java
public class LeftRotateString { /** * Q 26 左旋转字符串 * 题目：定义字符串的左旋转操作：把字符串前面的若干个字符移动到字符串的尾部。 * 如把字符串abcdef左旋转2位得到字符串cdefab。 * 请实现字符串左旋转的函数。要求时间对长度为n的字符串操作的复杂度为O(n)，辅助内存为O(1)。 */ pu
《vi中的替换艺术》-linux命令五分钟系列之十一 cfyme linux命令
vi方面的内容不知道分类到哪里好，就放到《Linux命令五分钟系列》里吧！今天编程，关于栈的一个小例子，其间我需要把”S.”替换为”S->”(替换不包括双引号)。其实这个不难，不过我觉得应该总结一下vi里的替换技术了，以备以后查阅。 1 所有替换方案都要在冒号“:”状态下书写。 2 如果想将abc替换为xyz，那么就这样 :s/abc/xyz/ 不过要特别
[轨道与计算]新的并行计算架构 comsci 并行计算
我在进行流程引擎循环反馈试验的过程中，发现一个有趣的事情。。。如果我们在流程图的每个节点中嵌入一个双向循环代码段，而整个流程中又充满着很多并行路由，每个并行路由中又包含着一些并行节点，那么当整个流程图开始循环反馈过程的时候，这个流程图的运行过程是否变成一个并行计算的架构呢？
重复执行某段代码 dai_lm android
用handler就可以了 private Handler handler = new Handler(); private Runnable runnable = new Runnable() { public void run() { update(); handler.postDelayed(this, 5000); } }; 开始计时 h
Java实现堆栈（list实现） datageek 数据结构——堆栈
public interface IStack<T> { //元素出栈，并返回出栈元素 public T pop(); //元素入栈 public void push(T element); //获取栈顶元素 public T peek(); //判断栈是否为空 public boolean isEmpty
四大备份MySql数据库方法及可能遇到的问题 dcj3sjt126com DB backup
一：通过备份王等软件进行备份前台进不去？用备份王等软件进行备份是大多老站长的选择，这种方法方便快捷，只要上传备份软件到空间一步步操作就可以，但是许多刚接触备份王软件的客用户来说还原后会出现一个问题：因为新老空间数据库用户名和密码不统一，网站文件打包过来后因没有修改连接文件，还原数据库是好了，可是前台会提示数据库连接错误，网站从而出现打不开的情况。解决方法：学会修改网站配置文件，大多是由co
github做webhooks：[1]钩子触发是否成功测试 dcj3sjt126com github git webhook
转自: http://jingyan.baidu.com/article/5d6edee228c88899ebdeec47.html github和svn一样有钩子的功能，而且更加强大。例如我做的是最常见的push操作触发的钩子操作，则每次更新之后的钩子操作记录都会在github的控制板可以看到！工具/原料 github 方法/步骤
">的作用" target="_blank">JSP中的作用蕃薯耀
JSP中<base href="<%=basePath%>">的作用 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
linux下SAMBA服务安装与配置 hanqunfeng linux
局域网使用的文件共享服务。一.安装包： rpm -qa | grep samba samba-3.6.9-151.el6.x86_64 samba-common-3.6.9-151.el6.x86_64 samba-winbind-3.6.9-151.el6.x86_64 samba-client-3.6.9-151.el6.x86_64 samba-winbind-clients
guava cache IXHONG cache
缓存，在我们日常开发中是必不可少的一种解决性能问题的方法。简单的说，cache 就是为了提升系统性能而开辟的一块内存空间。　　缓存的主要作用是暂时在内存中保存业务系统的数据处理结果，并且等待下次访问使用。在日常开发的很多场合，由于受限于硬盘IO的性能或者我们自身业务系统的数据处理和获取可能非常费时，当我们发现我们的系统这个数据请求量很大的时候，频繁的IO和频繁的逻辑处理会导致硬盘和CPU资源的
Query的开始--全局变量,noconflict和兼容各种js的初始化方法 kvhur JavaScript jquery css
这个是整个jQuery代码的开始，里面包含了对不同环境的js进行的处理，例如普通环境，Nodejs，和requiredJs的处理方法。还有jQuery生成$, jQuery全局变量的代码和noConflict代码详解完整资源： http://www.gbtags.com/gb/share/5640.htm jQuery 源码： (
美国人的福利和中国人的储蓄 nannan408
今天看了篇文章，震动很大，说的是美国的福利。美国医院的无偿入院真的是个好措施。小小的改善，对于社会是大大的信心。小孩，税费等，政府不收反补，真的体现了人文主义。美国这么高的社会保障会不会使人变懒？答案是否定的。正因为政府解决了后顾之忧，人们才得以倾尽精力去做一些有创造力，更造福社会的事情，这竟成了美国社会思想、人
N阶行列式计算(JAVA) qiuwanchi N阶行列式计算
package gaodai; import java.util.List; /** * N阶行列式计算 * @author 邱万迟 * */ public class DeterminantCalculation { public DeterminantCalculation(List<List<Double>> determina
C语言算法之打渔晒网问题 qiufeihu c 算法
如果一个渔夫从2011年1月1日开始每三天打一次渔，两天晒一次网，编程实现当输入2011年1月1日以后任意一天，输出该渔夫是在打渔还是在晒网。代码如下： #include <stdio.h> int leap(int a) /*自定义函数leap()用来指定输入的年份是否为闰年*/ { if((a%4 == 0 && a%100 != 0
XML中DOCTYPE字段的解析 wyzuomumu xml
DTD声明始终以!DOCTYPE开头,空一格后跟着文档根元素的名称,如果是内部DTD,则再空一格出现[],在中括号中是文档类型定义的内容. 而对于外部DTD,则又分为私有DTD与公共DTD,私有DTD使用SYSTEM表示,接着是外部DTD的URL. 而公共DTD则使用PUBLIC,接着是DTD公共名称,接着是DTD的URL. 私有DTD <!DOCTYPErootSYST