weixin_39195527

大话 - 自编码(Autoencoder)和变分自编码(Variational Autoencoder)

因为最近在研究自编码和变分自编码的区别，以及应用方向，现在总结内容和大家分享一下。

自编码 (Autoencoder)

自编码（Autoencoder）在降维算法普遍被认可的一种算法，算法的主要出发点：如果有个网络，你将数据输入（N维），可以是图片或者其他特征，然后网络吐出了相同的数据，那么我们是否可以认为网络的某些隐层特点（输出, M维）可以代表你的输入数据特点？—- 因为基于这个隐层输出，网络又重新输出了原始数据。

基于这个想法，普遍的网络设置，都是将隐层设置成一个低维（M << N）, 然后将损失函数 (Loss function)设置成原始输入和输出的diff。

这里将用mnist手写数字图片数据作为一个代码样例说明, 这里我们简单将代码逻辑分几个部分进行串行讲解：

网络结构
前向数据流 (forward)
损失函数 (loss function) & 优化器 (optimizer)
训练 & 梯度下降

数据简单介绍 28 * 28维图片，图片pixel值[0, 1]，图片内容1 - 9, 知道了输入纬度，咱们直接来设置网络结构 (比如我们想将 28 * 28 降维到 64维)

网络结构

class AutoEncoder(nn.Module):
    """
    """
    def __init__(self, latent_num=16):
        """
        TODO: doconvolution
        """
        super(AutoEncoder, self).__init__()

        self.fc1 = nn.Linear(IMG_SIZE, 256)
        self.fc1.weight.data.normal_(0.0, 0.05)

        self.fc2 = nn.Linear(256, 64)
        self.fc2.weight.data.normal_(0.0, 0.05)

        self.fc3 = nn.Linear(64, 256)
        self.fc3.weight.data.normal_(0.0, 0.05)

        self.fc4 = nn.Linear(256, IMG_SIZE)
        self.fc4.weight.data.normal_(0.0, 0.05)

前向数据流 (forward)

有了网络结构，我们还需要将网络数据流串联起来，这个过程普遍成为forward,

    def forward(self, x):
        h1 = F.relu(self.fc1(x))  # IMG_SIZE -> 518
        h2 = F.relu(self.fc2(h1)) # 518 -> 256
        h3 = F.relu(self.fc3(h2)) # 256 -> 128
        h4 = F.relu(self.fc4(h3)) # 128 -> 256
        output = h4
        # output = F.sigmoid(h6)
        return output

损失函数 (Loss Function) & 优化器 (optimizer)

有了输入和输出，我们需要定量的衡量模型对数据的刻画好坏，这时候我们需要定义一个损失函数来描述模型是否能很好的刻画数据。

为了让模型能向我们想要的特性发展，我们需要一个优化器（他会根据输出和输出差了多少，对模型进行调整，并定义了调整幅度和步伐）

def loss_function(output, x):
        """
        """
        mse = encoder_loss(output, x)
        return mse

optimizer = optim.Adam(model.parameters(), lr=1e-3)

训练 & 梯度下降

接下来就是数据训练，通过观察损失函数来判断模型是否收敛

for epoch in range(num_epochs):
    train_loss = 0
    for batch_idx, data in enumerate(dataloader):
        img = data.view(data.size(0), -1)
        img = Variable(img.float())
        # free zero grad
        optimizer.zero_grad()
        output = model(img)
        # backward
        loss = loss_function(output, img)
        loss.backward()
        train_loss += loss.data[0]
        optimizer.step()
        if batch_idx % 100 == 0:
            print('Train Epoch: {} [{}/{} ({:.0f}%)]\tLoss: {:.6f}'.format(
                epoch,
                batch_idx * len(img),
                len(dataloader.dataset), 100. * batch_idx / len(dataloader),
                loss.data[0] / len(img)))
    print('====> Epoch: {} Average loss: {:.4f}'.format(
        epoch, train_loss / len(dataloader.dataset)))

训练后，模型输出结果:

变分自编码 (Variational Autoencoder) - 这个名字中文翻译的真是烂

这部分才是我主要想讲的，上面提到自编码，那么变分自编码是为了解决什么问题呢？ ——- 其主要思想还是希望学习隐层变量，并将其用来表示原始数据，但是它加另一个条件, 即隐层变量能学习原始数据的分布, 并反过来生产一些和原始数据相似的数据（这有啥用？—-可用于图片修复，让图片按训练集的数据分布变化）。

变分自编码 (Variational Autoencoder) 希望通过网络学习，学习隐层变量基于输入变量x的分布p(z|x) (这个貌似和标准的自编码器没啥区别？)。但是变分自编码多了一点变化，为了让隐层抓住输入数据特性, 而不是简单的输出数据=输入数据，他在隐层中假如随机噪声（单位高斯噪声）（这个过程也叫reparametrize），以确保隐层能较好抽象输入数据特点。

代码部分

网络配置

class VAE(nn.Module):
    """
    """
    def __init__(self, latent_num=2):
        """
        TODO: doconvolution
        """
        super(VAE, self).__init__()

        self.fc1 = nn.Linear(IMG_SIZE, 256)
        self.fc21 = nn.Linear(256,  16)
        self.fc22 = nn.Linear(256, 16)
        self.fc3 = nn.Linear(16, 256)
        self.fc4 = nn.Linear(256, 784)

前向数据流 (forward)

    def encoder(self, x):
        h1 = F.relu(self.fc1(x))
        mu, std = self.fc21(h1), self.fc22(h1)
        return mu, std
    def decoder(self, x):
        h2 = F.relu(self.fc3(x))
        return self.fc4(h2)

    def forward(self, x):
        mu, var = self.encoder(x)
        z = self.reparametrize(mu, var)
        return self.decoder(z), mu, var

损失函数（Loss Function）

现在输出层和输入层存在这一定的局部差异，这是由于我们在隐层中加入了噪声带来的，但是我们如果想让隐层变量p(z|x)在不同类型输入上具有区分度，我们需要对隐层变量z做一些限制。

为了引出这个限制，我们先来看一下，我们对于这个隐层变量需要它具有哪些属性，

这里原文用 Kullback-Leibler divergence (KL divergence) 来刻画两个分布之间的差异。
原文中将隐层参量拆分成一个均值变量和一个方差变量来刻画某一纬度的输入变化, 并将均值和方差和标准高斯函数对比。对于限定分布差异上，损失函数就是

def loss_function(output, x, mu, var):
        """
        """
        mse = encoder_loss(output, x)
        #   0.5 * sum(1 + log(sigma^2) - mu^2 - sigma^2)
        latent_loss = mu.pow(2).add_(var.pow(2)).mul(-1.).add_(torch.log(var.pow(2))).add_(1).mul_(0.5)
        KLD = torch.sum(latent_loss)
        return mse - KLD

训练 & 梯度下降

for epoch in range(num_epochs):
    train_loss = 0
    for batch_idx, data in enumerate(dataloader):
        img = data.view(data.size(0), -1)
        img = Variable(img.float())
        # free zero grad
        optimizer.zero_grad()
        output, mu, var = model(img)
        # backward
        loss = loss_function(output, img, mu, var)
        loss.backward()
        train_loss += loss.data[0]
        optimizer.step()
        if batch_idx % 100 == 0:
            print('Train Epoch: {} [{}/{} ({:.0f}%)]\tLoss: {:.6f}'.format(
                epoch,
                batch_idx * len(img),
                len(dataloader.dataset), 100. * batch_idx / len(dataloader),
                loss.data[0] / len(img)))

训练后，网络输出层图片样例：

文章中完整代码在这: https://github.com/jnuthong/pytorch_example

你可能感兴趣的:(大话 - 自编码(Autoencoder)和变分自编码(Variational Autoencoder))

内网环境部署Deepseek+Dify，构建企业私有化AI应用我是鲁阿姨
0.简介#公司为生产安全和保密，内部的服务器不可连接外部网络，为了可以在内网环境下部署，采用的方案为ollama(Docker)+Dify(DockerCompose)，方便内网环境下迁移和备份，下文将介绍部署的全部过程。1.镜像拉取#镜像拉取为准备工作，因服务器在内网环境，需要先在可以连接外网的电脑上拉取相关镜像或文件。由于公司笔记本的Windows系统屏蔽了MicrosoftStore，导致D
从实验到文化 - “混沌日”与持续混沌 weixin_42587823 混沌数据库混沌
从实验到文化-“混沌日”与持续混沌第一部分：锻炼团队的“免疫系统”-混沌日(GameDay)什么是“混沌日”？混沌日是一场有计划、有组织的演习活动。在活动中，团队成员们齐聚一堂（无论是线上还是线下），在一个受控的环境中（理想情况是生产环境，但从预生产环境开始是更安全的选择），主动触发一次模拟的真实故障场景。它就像一次针对技术团队和系统的消防演习。它的价值何在？混沌实验不仅仅测试机器，它同样也测试人
SpringBoot3+JPA+MySQL实现多数据源的读写分离(基于EntityManagerFactory) 没刮胡子 java 软件开发技术实战专栏 SpringBoot3 JPA MySQL 多数据源读写分离
1、简介在SpringBoot中配置多个数据源并实现自动切换EntityManager，这里我编写了一个RoutingEntityManagerFactory和AOP（面向切面编程）的方式来实现。这里我配置了两个数据源：primary和secondary，其中primary主数据源用来写入数据，secondary从数据源用来读取数据。注意1：使用Springboot3的读写分离，首先要保证主库和从
微服务世界的“导航仪”！Spring Cloud五大注册中心选型指南，从此不再迷路！码农技术栈微服务微服务 spring cloud 架构 spring boot java 后端
引言：为什么微服务需要“导航仪”？想象一下，你走进一座巨大的迷宫（微服务集群），里面有成百上千个房间（服务实例），每个房间都在动态变化位置（服务扩缩容）。注册中心就像迷宫里的导航仪，实时记录所有房间的位置，告诉你怎么最快找到目标。没有它？你可能会永远迷失在“服务调用”的迷宫里！注册中心的核心作用服务注册：服务启动时，主动上报自己的地址和状态。服务发现：调用方通过注册中心查询目标服务的位置。健康监测
Vue侧边索引跳转
Vue侧边索引跳转效果如图所示：首先要去除不存在的几个首字母（我刚开始没有去除，于是前面是还很正常的跳转，后面就会有偏差，这图看上去点击的和跳转的有偏差，实际上是没有的哈）需要跳转的列表要先排好序要明白侧边的索引和列表的index是一一对应的，所以index是关键获取到索引的index，找到列表对应的index，将列表index的offsetTop赋值给document.documentEleme
scanpy保存图片的常用方法汇总 Bio Coder 空间转录组 &单细胞 scanpy 保存图片汇总
在使用Scanpy（一个用于单细胞RNA测序数据分析的Python库）时，保存图片（如可视化结果）是常见的操作。Scanpy的绘图功能主要基于Matplotlib和Seaborn，保存图片的方法也与这些库的保存机制一致。以下是Scanpy保存图片的详细方法及注意事项：1.基本保存图片的方法Scanpy的绘图函数（如sc.pl.umap、sc.pl.tsne、sc.pl.pca等）通常会返回Matp
服务注册和发现组件的详细对比与选型建议（详细版）古龙飞扬 spring cloud spring 后端
服务注册和发现组件Eureka、Consul、ZooKeeper、Etcd和Nacos的区别与选型建议在微服务架构中，服务注册与发现是一个核心组件，它解决了服务实例的动态管理和自动发现的问题。目前，市场上存在多种服务注册与发现组件，其中Eureka、Consul、ZooKeeper、Etcd和Nacos较为常见。作为资深的软件架构师，本文将详细分析这些组件的区别，并提供选型建议。一、EurekaE
clickhouse分布式表插入数据不用带ON CLUSTER 时时刻刻看着自己的心 clickhouse 分布式
向分布式表插入数据时，通常不需要使用ONCLUSTER，因为分布式表的写入操作会自动将数据分发到底层表（bm_online_user_count_part）的对应节点。但对于DDL（数据定义语句，例如ALTERTABLE）操作，在分布式环境中修改底层表时，建议使用ONCLUSTER，以确保所有相关节点上的表结构和数据同步。区分DDL和DMLDML（数据操作语句，例如INSERT）向分布式表插入数据
AI时代产品经理高薪密码！0经验转岗，月入27K的秘诀都在这！
“211计算机本硕，有2段学校项目经验，校招面了大厂AI产品经理岗，群面和专业面的时候挂了，怎么快速突击，提升AI产品专业能力呢？”“7年UI，被裁跳槽准备找产品工作了，上一家基本是半设计半产品，怎么包装过往经验，实现转岗？”“3年开发，每天写代码有点厌倦，想转产品经理，从0-1设计一款产品更有成就感，怎么快速上手产品工作？”这是上半年来咨询的几类同学的烦恼，近期求职市场些微回暖，产品经理岗位需求
【二分答案】-----【扑克牌】 float_com 二分答案算法二分答案贪心
扑克牌题目链接题目描述你有nnn种普通牌，第iii种牌的数量为cic_ici。另外你还有mmm张特殊的Joker牌。你可以使用以下两种方式来组成一套合法的牌组：不使用Joker，选择nnn种普通牌各一张；使用一张Joker，选择其余n−1n-1n−1种普通牌各一张（Joker可替代任意一种牌）。例如，当n=3n=3n=3时，一共有以下四种组合方式：{1,2,3}\{1,2,3\}{1,2,3}{J
k8s深度讲解----宏观架构与集群之脑 - API Server 和 etcd weixin_42587823 云原生 kubernetes 架构 etcd
宏观架构与集群之脑-APIServer和etcd宏观架构：数据中心的操作系统在开始之前，让我们先建立一个高层视角。你可以将Kubernetes想象成一个管理整个数据中心的分布式操作系统。在这个操作系统中：控制平面(ControlPlane)就是它的“内核”，负责管理和决策。工作节点(WorkerNodes)就是它的“CPU和内存”，是真正运行应用程序的地方。我们常用的kubectl就是与这个“内核
docker 无法拉取镜像解决方法 Sandman6z docker 容器运维
目录我在omv中通过后台页面拉取alist镜像总是失败，原因千奇百怪今天再战终于解决首先，到dockerhub找镜像和wiki进入docker账号设置找到里面提示了登录操作和密码命令行中执行后会提示成功之后按需配置代理，同时检查自己的配置检查Docker代理配置查看当前Docker环境配置systemctlshowdocker--propertyEnvironment2.查看代理配置文件cat/e
C++系列（十）：面向对象编程终极指南！从封装到多态，彻底掌握类与对象的核心奥秘傅里叶的耶 C++语言系列（教程 +实战）c++类和对象
引言面向对象编程（OOP）是现代软件开发的核心范式，C++通过封装、继承和多态三大特性提供了强大的面向对象能力。这些特性使代码更易维护、扩展和复用，是构建复杂系统的基石。本章将深入探讨C++类和对象的方方面面，从基础封装到高级多态应用，帮助您掌握面向对象编程的精髓。最后，如果大家喜欢我的创作风格，请大家多多关注up主，你们的支持就是我创作最大的动力！如果各位观众老爷觉得我哪些地方需要改进，请一定在
MCP Streamable HTTP 样例（qbit） pythonagent
前言模型上下文协议（ModelContextProtocol，MCP），是由Anthropic推出的开源协议，旨在实现大语言模型与外部数据源和工具的集成，用来在大模型和数据源之间建立安全双向的连接。本文代码技术栈Python3.11.8FastMCP2.10.3MCP的传输机制StandardInput/Output(stdio)StreamableHTTPServer-SentEvents(SS
Spring框架中的Component与Bean注解
SpringBoot中的@Bean与@Component![](https://pic4.zhimg.com/v2-f957e9ec5412c87a66ccb021410eaae9_14...)Spring的@Component和@Bean注解的关键区别在于：@Bean注解可用于暴露您自己编写的JavaBeans，而@Component注解可用于暴露源代码由他人维护的JavaBeans。Sprin
2025 轻松部署 ERPNext linux
在数字化转型浪潮不断推进的2025年，企业对高效、灵活的企业资源计划（ERP）系统需求日益增长。作为一款开源且功能全面的ERP系统，ERPNext以其模块化、易用性和强大的自定义能力，受到越来越多中小企业的青睐。然而，部署ERPNext仍然是许多企业信息化过程中的一大挑战。本文将介绍如何借助云平台实现快速、轻松、安全地部署ERPNext系统。什么是ERPNext？ERPNext是一个开源的ERP系
C++ 工厂模式与抽象工厂：创建对象的灵活设计海派程序猿 c++java jvm
C++工厂模式与抽象工厂：让对象“流水线”更优雅想象一下，你是一家玩具工厂的老板，主要生产两种玩具：小汽车和积木。最初，你的生产流程很简单，需要什么就直接用new创建什么：//生产小汽车Car*myCar=newCar();//生产积木Block*myBlock=newBlock();简单粗暴，效率很高，就像直接从仓库里抓取零件组装一样。但问题也随之而来：耦合度高：生产代码直接依赖于具体的Car和
掌握变量命名与Python继承机制
掌握变量命名与Python继承机制背景简介在编程中，变量命名和继承是基础且重要的概念。良好的命名习惯可以提升代码的可读性，而继承则是一种代码复用的重要机制。本文将结合具体的书籍章节内容，深入解析变量命名规则和Python继承机制。变量命名规则变量命名是编程中最基础的部分，而正确的命名习惯能够帮助其他开发者（或未来的自己）更好地理解代码。根据书籍提供的内容，我们应当遵守以下规则：变量名只包含数字、下
uiautomatorviewer工具在Android 9.0上的应用及优势小馬锅
本文还有配套的精品资源，点击获取简介：uiautomatorviewer是AndroidSDK中的自动化测试和UI分析工具，特别适用于Android9.0版本。它支持扫描和分析应用UI控件，获取关键UI元素信息以编写自动化测试脚本。工具采用XPath定位技术，对于复杂布局中的UI元素精确定位尤为有效。同时，uiautomatorviewer与Appium自动化测试框架在功能上具有重叠，但各有优势。
从实践到自动化：现代运维管理的转型与挑战运维
从实践到自动化：现代运维管理的转型与挑战在信息化快速发展的今天，企业IT系统的稳定性、可用性和安全性已成为衡量公司竞争力的重要因素之一。运维（IT运维）管理作为确保企业IT系统健康、稳定运行的关键职能，一直是企业技术团队关注的重点。然而，随着业务的复杂化、用户需求的变化以及技术的不断创新，传统的运维方式已逐渐无法满足企业对于高效、高可用、高安全的需求。如何提升运维效率、减少人为错误、提高运维系统的
华为电脑和手机一碰传_华为手机怎么一碰传连接电脑传输照片和文件 weixin_39630762 华为电脑和手机一碰传
现在咱们的手机随便拍一拍就有几百张照片，如何快速传至电脑，有一种黑科技，让互传文件不是事儿，相信不少的小人类也是为这些烦恼过，以往的传送方式都是是用数据线什么的，感觉比较繁琐，现在不用了，轻轻一“碰”就可以轻松搞定了，只要你的手机升级MagicUI3.0(也就是EMUI110.0)的系统，轻轻一“碰就可以开启智慧生活！一碰就能连接电脑的神技看这里1：在电脑上，打开WLAN和蓝牙，同时打开电脑管家，
华为手机手机与计算机传输,如何将华为手机的视频传到华为的电脑上？手机与电脑数据互传操作步骤... 人人保华为手机手机与计算机传输
手机与电脑数据互传操作bai步骤如下：1、手机du通过原装USB数据线与电脑相连，待zhi电脑自行dao安装驱动，并确认驱动安装成功，如下图所示：注：如驱动未安装成功，可通过安装HiSuite软件进行辅助驱动安装或者通过选择端口模式中的帮助进行电脑驱动安装。(1)在手机端弹出的对话框选择“是，访问数据”(2)在手机下拉菜单中USB连接方式中选择设备文件管理(MTP)注：关于设备文件管理(MTP)和
DMA技术与音频数据的存储和播放曹小满2579 Android基础音视频 Android
基本概念采样率：每秒采集的采样点次数。如480000HZ，就是我们常见的48KHZ采样点(Sample)：每一个采样点代表一个时间点的声音幅度值。对于立体声，每个采样点包含了两个声道(左声道，右声道)的数据。帧：一帧就是一个时刻采集的数据，如果音频是立体声则会产生2个采样点，如果是更复杂的比如5.1，则会产生更多的采样点。例如PCM数据是48KHZ，16bit的，立体声，则一秒的PCM数据有48K
Readr 项目安装与配置指南芮奕滢Kirby
Readr项目安装与配置指南readr项目地址:https://gitcode.com/gh_mirrors/rea/readr1.项目基础介绍readr是一个R语言的开源项目，由HadleyWickham创建和维护。该项目的主要目的是提供一种快速且友好的方式来读取分隔文件（如CSV和TSV）中的矩形数据。readr能够解析多种数据类型，并在解析过程中提供详细的错误报告，以便用户能够快速识别和解决
Android10 SystemUI系列需求定制（二）隐藏状态栏通知图标，锁屏通知，可定制包名，渠道等 Erorrs Android10 及Android10以下 ROM定制 android ROM定制
一、前言SystemUI所包含的界面和模块比较多，这一节主要分享一下状态栏通知图标和通知栏的定制需求：隐藏状态栏通知图标，锁屏通知，可定制包名，渠道等来熟悉一下Systemui。二、准备工作按照惯例先找到核心类。这里提前说一下，这个需求的修改方法更多，笔者这里也只是提供一个思路。不过由于笔者最看是是做SystemUI的自认为修改需求和解决问题要找到本质。下面说一下设计到的核心类frameworks
如何将照片从 iPhone 传输到华为的 5 种方法 Coolmuster iPhone 华为手机 iOS iphone 华为 ios
随着技术的快速发展，华为作为5G智能手机的领军企业之一，吸引了大量iPhone用户转用华为手机。但是，如何将iPhone上的照片传输到华为，对许多人来说一直是个难题。尽管iPhone和华为运行着完全不同的操作系统，但我们还是找到了一些简单有效的方法来实现照片的传输。第1部分.如何使用计算机将照片从iPhone传输到华为1.1如何通过CoolmusterMobileTransfer将照片从iPhon
Vue3 面试不再慌：这 8 个问题答得好，基本稳了！掘金安东尼 vue.js 前端 javascript
面试Vue3岗位，真的只是复习CompositionAPI、生命周期和响应式吗？你以为自己准备得差不多了，但一上来，面试官问的是：“Vue3中的响应式是怎么实现的？和Vue2有什么本质不同？”——你还在“setup里写逻辑就完事了”的认知，可能就被这一问击穿了。作为Vue开发者，这些年我面过别人，也被别人面过。今天就来整理一份Vue3面试高频问题+高质量回答，不止是应试，更是一次知识体系的整理升级
ASMR助眠软件：开启宁静夜晚，拥抱甜美梦境东风西巷智能手机软件需求 android
在快节奏的现代生活中，睡眠问题已成为许多人面临的难题。无论是工作压力、生活琐事还是电子设备的干扰，都可能让我们难以入睡。为了帮助那些受困于失眠和睡眠障碍的用户，ASMR助眠软件应运而生。它通过多种舒缓的声音和精心设计的音频内容，为用户提供了一个放松身心、安然入睡的环境，成为改善睡眠质量的贴心伴侣。软件特色多样化的音乐库ASMR助眠软件内含多种类型的声音素材，涵盖白噪音、自然音效及轻音乐等，满足不同
识花APP：一键识别，开启植物探索之旅
在大自然的怀抱中，我们常常会被各种各样的花草所吸引，却不知道它们的名字和习性。识花APP正是这样一款能够帮助我们快速识别植物、了解植物知识的神奇工具。由上海原来信息科技有限公司研发的这款植物识别软件，以其强大的功能、简单的操作和丰富的植物数据库，成为了植物爱好者和自然探索者的得力助手。软件优势·拍照识花：1秒就能知道植物的名字和故事·分享美图：一键生成有诗词花语的植物美图·花语壁纸：精美壁纸天天上
检索增强生成(RAG)技术演进：从论文到工业级应用 AGI大模型与大数据研究院 AI大模型应用开发实战 ai
检索增强生成(RAG)技术演进：从论文到工业级应用关键词：RAG、检索增强生成、大语言模型、知识检索、工业应用、技术演进、AI系统架构摘要：本文深入探讨检索增强生成(RAG)技术从学术研究到工业应用的完整演进历程。我们将从基础概念出发，逐步解析RAG的核心原理、架构设计、实现细节和优化策略，并通过实际案例展示如何构建高效可靠的工业级RAG系统。文章还将分析当前技术挑战和未来发展方向，为读者提供全面
Java常用排序算法/程序员必须掌握的8大排序算法 cugfy java
分类： 1）插入排序（直接插入排序、希尔排序） 2）交换排序（冒泡排序、快速排序） 3）选择排序（直接选择排序、堆排序） 4）归并排序 5）分配排序（基数排序）所需辅助空间最多：归并排序所需辅助空间最少：堆排序平均速度最快：快速排序不稳定：快速排序，希尔排序，堆排序。先来看看8种排序之间的关系： 1.直接插入排序（1
【Spark102】Spark存储模块BlockManager剖析 bit1129 manager
Spark围绕着BlockManager构建了存储模块，包括RDD，Shuffle，Broadcast的存储都使用了BlockManager。而BlockManager在实现上是一个针对每个应用的Master/Executor结构，即Driver上BlockManager充当了Master角色，而各个Slave上(具体到应用范围，就是Executor)的BlockManager充当了Slave角色
linux 查看端口被占用情况详解 daizj linux 端口占用 netstat lsof
经常在启动一个程序会碰到端口被占用，这里讲一下怎么查看端口是否被占用，及哪个程序占用，怎么Kill掉已占用端口的程序 1、lsof -i:port port为端口号 [root@slave /data/spark-1.4.0-bin-cdh4]# lsof -i:8080 COMMAND PID USER FD TY
Hosts文件使用周凡杨 hosts locahost
一切都要从localhost说起，经常在tomcat容器起动后，访问页面时输入http://localhost:8088/index.jsp，大家都知道localhost代表本机地址，如果本机IP是10.10.134.21，那就相当于http://10.10.134.21:8088/index.jsp，有时候也会看到http: 127.0.0.1:
java excel工具 g21121 Java excel
直接上代码，一看就懂，利用的是jxl： import java.io.File; import java.io.IOException; import jxl.Cell; import jxl.Sheet; import jxl.Workbook; import jxl.read.biff.BiffException; import jxl.write.Label; import
web报表工具finereport常用函数的用法总结（数组函数）老A不折腾 finereport web报表函数总结
ADD2ARRAY ADDARRAY(array,insertArray, start):在数组第start个位置插入insertArray中的所有元素，再返回该数组。示例： ADDARRAY([3,4, 1, 5, 7], [23, 43, 22], 3)返回[3, 4, 23, 43, 22, 1, 5, 7]. ADDARRAY([3,4, 1, 5, 7], "测试&q
游戏服务器网络带宽负载计算墙头上一根草服务器
家庭所安装的4M，8M宽带。其中M是指，Mbits/S 其中要提前说明的是： 8bits = 1Byte 即8位等于1字节。我们硬盘大小50G。意思是50*1024M字节，约为 50000多字节。但是网宽是以“位”为单位的，所以，8Mbits就是1M字节。是容积体积的单位。 8Mbits/s后面的S是秒。8Mbits/s意思是每秒8M位，即每秒1M字节。我是在计算我们网络流量时想到的
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans Spring 3 系列
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
高性能mysql 之选择存储引擎(一) annan211 mysql InnoDB MySQL引擎存储引擎
1 没有特殊情况，应尽可能使用InnoDB存储引擎。原因：InnoDB 和 MYIsAM 是mysql 最常用、使用最普遍的存储引擎。其中InnoDB是最重要、最广泛的存储引擎。她被设计用来处理大量的短期事务。短期事务大部分情况下是正常提交的，很少有回滚的情况。InnoDB的性能和自动崩溃恢复特性使得她在非事务型存储的需求中也非常流行，除非有非常
UDP网络编程百合不是茶 UDP编程局域网组播
UDP是基于无连接的,不可靠的传输与TCP/IP相反 UDP实现私聊,发送方式客户端,接受方式服务器 package netUDP_sc; import java.net.DatagramPacket; import java.net.DatagramSocket; import java.net.Ine
JQuery对象的val()方法执行结果分析 bijian1013 JavaScript js jquery
JavaScript中，如果id对应的标签不存在（同理JAVA中，如果对象不存在），则调用它的方法会报错或抛异常。在实际开发中，发现JQuery在id对应的标签不存在时，调其val()方法不会报错，结果是undefined。
http请求测试实例（采用json-lib解析） bijian1013 json http
由于fastjson只支持JDK1.5版本，因些对于JDK1.4的项目，可以采用json-lib来解析JSON数据。如下是http请求的另外一种写法，仅供参考。 package com; import java.util.HashMap; import java.util.Map; import
【RPC框架Hessian四】Hessian与Spring集成 bit1129 hessian
在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中介绍了基于Hessian的RPC服务的实现步骤，在那里使用Hessian提供的API完成基于Hessian的RPC服务开发和客户端调用，本文使用Spring对Hessian的集成来实现Hessian的RPC调用。定义模型、接口和服务器端代码 |---Model &nb
【Mahout三】基于Mahout CBayes算法的20newsgroup流程分析 bit1129 Mahout
1.Mahout环境搭建 1.下载Mahout http://mirror.bit.edu.cn/apache/mahout/0.10.0/mahout-distribution-0.10.0.tar.gz 2.解压Mahout 3. 配置环境变量 vim /etc/profile export HADOOP_HOME=/home
nginx负载tomcat遇非80时的转发问题 ronin47
　　nginx负载后端容器是tomcat（其它容器如WAS,JBOSS暂没发现这个问题）非８０端口，遇到跳转异常问题。解决的思路是：$host:port 详细如下：　　该问题是最先发现的，由于之前对nginx不是特别的熟悉所以该问题是个入门级别的： ? 1 2 3 4 5
java-17-在一个字符串中找到第一个只出现一次的字符 bylijinnan java
public class FirstShowOnlyOnceElement { /**Q17.在一个字符串中找到第一个只出现一次的字符。如输入abaccdeff，则输出b * 1.int[] count:count[i]表示i对应字符出现的次数 * 2.将26个英文字母映射：a-z <--> 0-25 * 3.假设全部字母都是小写 */ pu
mongoDB 复制集开窍的石头 mongodb
mongo的复制集就像mysql的主从数据库，当你往其中的主复制集(primary)写数据的时候，副复制集(secondary)会自动同步主复制集(Primary)的数据,当主复制集挂掉以后其中的一个副复制集会自动成为主复制集。提供服务器的可用性。和防止当机问题 mo
[宇宙与天文]宇宙时代的经济学 comsci 经济
宇宙尺度的交通工具一般都体型巨大，造价高昂。。。。。在宇宙中进行航行，近程采用反作用力类型的发动机，需要消耗少量矿石燃料，中远程航行要采用量子或者聚变反应堆发动机，进行超空间跳跃，要消耗大量高纯度水晶体能源以目前地球上国家的经济发展水平来讲，
Git忽略文件 Cwind git
有很多文件不必使用git管理。例如Eclipse或其他IDE生成的项目文件，编译生成的各种目标或临时文件等。使用git status时，会在Untracked files里面看到这些文件列表，在一次需要添加的文件比较多时（使用git add . / git add -u），会把这些所有的未跟踪文件添加进索引。 ==== ==== ==== 一些牢骚
MySQL连接数据库的必须配置 dashuaifu mysql 连接数据库配置
MySQL连接数据库的必须配置 1.driverClass：com.mysql.jdbc.Driver 2.jdbcUrl：jdbc:mysql://localhost:3306/dbname 3.user：username 4.password：password 其中1是驱动名；2是url，这里的‘dbna
一生要养成的60个习惯 dcj3sjt126com 习惯
一生要养成的60个习惯第1篇让你更受大家欢迎的习惯 1 守时，不准时赴约,让别人等,会失去很多机会。如何做到： ①该起床时就起床， ②养成任何事情都提前15分钟的习惯。 ③带本可以随时阅读的书，如果早了就拿出来读读。 ④有条理，生活没条理最容易耽误时间。 ⑤提前计划：将重要和不重要的事情岔开。 ⑥今天就准备好明天要穿的衣服。 ⑦按时睡觉，这会让按时起床更容易。 2 注重
[介绍]Yii 是什么 dcj3sjt126com PHP yii2
Yii 是一个高性能，基于组件的 PHP 框架，用于快速开发现代 Web 应用程序。名字 Yii （读作易）在中文里有“极致简单与不断演变”两重含义，也可看作 Yes It Is! 的缩写。 Yii 最适合做什么？ Yii 是一个通用的 Web 编程框架，即可以用于开发各种用 PHP 构建的 Web 应用。因为基于组件的框架结构和设计精巧的缓存支持，它特别适合开发大型应
Linux SSH常用总结 eksliang linux ssh SSHD
转载请出自出处：http://eksliang.iteye.com/blog/2186931 一、连接到远程主机格式： ssh name@remoteserver 例如： ssh [email protected] 二、连接到远程主机指定的端口格式： ssh name@remoteserver -p 22 例如： ssh i
快速上传头像到服务端工具类FaceUtil gundumw100 android
快速迭代用 import java.io.DataOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOExceptio
jQuery入门之怎么使用 ini JavaScript html jquery Web css
jQuery的强大我何问起（个人主页：hovertree.com）就不用多说了，那么怎么使用jQuery呢？首先，下载jquery。下载地址：http://hovertree.com/hvtart/bjae/b8627323101a4994.htm，一个是压缩版本，一个是未压缩版本，如果在开发测试阶段，可以使用未压缩版本，实际应用一般使用压缩版本(min)。然后就在页面上引用。
带filter的hbase查询优化 kane_xie 查询优化 hbase RandomRowFilter
问题描述 hbase scan数据缓慢，server端出现LeaseException。hbase写入缓慢。问题原因直接原因是： hbase client端每次和regionserver交互的时候，都会在服务器端生成一个Lease,Lease的有效期由参数hbase.regionserver.lease.period确定。如果hbase scan需
java设计模式-单例模式 men4661273 java 单例枚举反射 IOC
单例模式1，饿汉模式 //饿汉式单例类.在类初始化时，已经自行实例化 public class Singleton1 { //私有的默认构造函数 private Singleton1() {} //已经自行实例化 private static final Singleton1 singl
mongodb 查询某一天所有信息的3种方法，根据日期查询 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
// mongodb的查询真让人难以琢磨，就查询单天信息，都需要花费一番功夫才行。 // 第一种方式： coll.aggregate([ {$project:{sendDate: {$substr: ['$sendTime', 0, 10]}, sendTime: 1, content:1}}, {$match:{sendDate: '2015-
二维数组转换成JSON tangqi609567707 java 二维数组 json
原文出处：http://blog.csdn.net/springsen/article/details/7833596 public class Demo { public static void main(String[] args) { String[][] blogL
erlang supervisor wudixiaotie erlang
定义supervisor时，如果是监控celuesimple_one_for_one则删除children的时候就用supervisor:terminate_child (SupModuleName, ChildPid)，如果shutdown策略选择的是brutal_kill，那么supervisor会调用exit(ChildPid, kill)，这样的话如果Child的behavior是gen_

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他