xiuxiu__xiu

pytorch框架下的代码转换到jittor框架的过程中遇到的问题

最近正在尝试将pytorch框架下一个风格化网络（MCCNET)的代码转换到jittor框架下。在转换的过程中，大部分torch库中的函数都能在jittor库中找到作用相同的同名函数；小部分没能找到同名函数的也可以通过jittor库中的其他函数做到同样的效果。下面也主要是讲一下如何完成这几个空缺同名函数的实现方式，以及发现的一些因为jittor框架自身的特点带来的问题。我会在目录中将pytorch的函数名打出来，同时标注完成的操作，大家可以根据自己遇到的问题在目录中查询。
MCCNET是中科院自动化所模式识别实验室多媒体计算团队2020年发表于人工智能国际顶级会议AAAI 2021的论文Arbitrary Video Style Transfer via Multi-Channel Correlation中提出的“基于多通道相关性的任意连续视频风格化网络（MCCNet）”，该网络用于完成视频的风格化迁移，风格化效果好且不会产生闪烁问题。
MCCNET代码也可在GitHub中找到。本文就是实现了该代码的jittor迁移。https://github.com/diyiiyiii/MCCNet
转换后的Jittor也可在Jittor分钟中找到:https://github.com/diyiiyiii/MCCNet/tree/Jittor

1. 关于jittor
- 1.1 安装jittor
- 1.2 torch->jittor转换脚本
2. 代码转换
- 2.1 基础操作
- - 2.1.1 torch.Tensor(data) 将numpy数组转换为jt数据类型Var
  - 2.1.2 np.empty(shape) 创建空Var
  - 2.1.3 np.random.permutation(n) 生成1-n的乱序列表
  - 2.1.4 np.mm() 矩阵乘法
  - 2.1.5 np.var() 求方差
- 2.2 Train阶段问题
- - 2.2.1 dataset和dataloader 加载图片集
  - 2.2.2 load() 加载网络参数
  - 2.2.3 pytorch训练好的模型参数加载到jittor的模型中
  - 2.2.4 children() 获取网络中的各层
  - 2.2.5 MaxPool2d
  - 2.2.6 backward 反向传播
  - 2.2.7 requires_grad 设置参数学习模式
  - 2.2.8 GPU模式
- 3. Test阶段问题
- 4. 总结

1. 关于jittor

1.1 安装jittor

因为我是在远程服务器上进行的安装，并且就是Ubuntu操作系统，所以直接pip安装就可以了，非常方便。

python3.7 -m pip install jittor

如果是要在windows系统下安装就需要使用docker安装了。
docker安装教程

1.2 torch->jittor转换脚本

jittor官网提供了一个简单的Pytorch模型代码转Jittor模型的脚本

但就像官方自己说的，脚本只能用于模型代码的转换，而且得是class+module声明的，sequential声明的模型转换过程中会被直接删去…对于模型之外的代码，转换过程中也是大部分保留，少部分删去。所以这个转换脚本最好还是当做一个对照作用吧，不能直接拿来用。

2. 代码转换

2.1 基础操作

2.1.1 torch.Tensor(data) 将numpy数组转换为jt数据类型Var

使用jittor.array(data) /jittor.float(data)/jittor.float32(data)
数据类型最好为float32，因为矩阵乘法暂时不支持32和64位混用。(array()默认保持类型不变，剩余两个默认转化为float32类型)

import jittor as jt
import numpy as np

data = np.random.randn(1,2,3).astype("float32")
>>[[[ 0.692951   0.3800234 -0.0999987]
  [-2.727701  -2.4574485  1.1308112]]]
  
output = jt.array(data)
>>jt.Var([[[ 0.692951   0.3800234 -0.0999987]
  [-2.727701  -2.4574485  1.1308112]]], dtype=float32)

访问Var中的数据使用Var.data就可以了。

output.data
>>[[[ 0.692951   0.3800234 -0.0999987]
  [-2.727701  -2.4574485  1.1308112]]]

2.1.2 np.empty(shape) 创建空Var

使用jittor.random(shape,dtype,uniform)或jittor.empty(shape)

jt.random((2,2,4))
>>jt.Var([[[0.6693543  0.83819515 0.5461786  0.6237627 ]
  [0.58049047 0.3033327  0.11268225 0.85048825]]

 [[0.1557529  0.7390003  0.3779687  0.52000093]
  [0.6558841  0.4438333  0.5063377  0.01796175]]], dtype=float32)

这样模型中声明的数据，默认是可以训练的参数。
或使用np.random创建一个array，再转换成Var类型，像2.1.1中举例那样。

2.1.3 np.random.permutation(n) 生成1-n的乱序列表

使用get_random_list(n)

from jittor.dataset.utils import get_random_list
get_random_list(4)
>>[2, 0, 1, 3]

里面就是封装了一个np.random.permutation(n)

2.1.4 np.mm() 矩阵乘法

jittor没有自带的mm函数，只有bmm函数，所以想要实现矩阵相乘就只能自己写一个函数了。但是jittor官网有直接给出矩阵乘法实现的函数，可以直接拿来用。

def matmul(a, b):
    (n, m), k = a.shape, b.shape[-1]
    a = a.broadcast([n,m,k], dims=[2])
    b = b.broadcast([n,m,k], dims=[0])
    return (a*b).sum(dim=1)

2.1.5 np.var() 求方差

jittor同样没有var()函数，但是有std()函数，如果要通过方差计算标准差的化可以直接使用std(data)函数。但是std函数是没有dim参数的，只会求出data中所有数据的var。如果想要指定维度算方差的话，还是需要自己写一个函数。

#dim=2的情况
def calc_mean_std(feat, eps=1e-5):
   N, C, H, W = feat.size()
   assert (len(feat.size()) == 4)
   dims = list(range(2,feat.ndim))
   X = ( H * W ) / (H * W - 1 )  #用于将方差转换为样本方差
   mean = jt.mean(feat, dims=dims)
   xmean = mean * X
   x2mean = jt.mean(feat * feat, dims=dims) * X
   xvar = (x2mean - xmean * xmean).maximum(0.0)
   return mean.view(N, C, 1, 1), jt.sqrt(xvar+eps).view(N, C, 1, 1)

2.2 Train阶段问题

2.2.1 dataset和dataloader 加载图片集

jittor中没有单独的dataset和dataloader函数，但有集两个操作于一体的Dataset类以及它的子类ImageFolder.

class jittor.dataset.Dataset(batch_size=16, shuffle=False, drop_last=False, num_workers=0, buffer_size=536870912, stop_grad=True, keep_numpy_array=False)
class jittor.dataset.ImageFolder(root, transform=None)

对于训练集读取操作可以用一句语句实现：

#torch代码
#class FlatFolderDataset(data.Dataset):
#      ... ...
content_dataset = FlatFolderDataset(content_dir, content_transform)
content_loader = data.DataLoader(
    content_dataset, batch_size=args.batch_size,
    sampler=InfiniteSamplerWrapper(content_dataset),
    num_workers=args.n_threads)

#jitter代码
content_dataset_loader = ImageFolder(args.content_dir, content_transform).set_attrs(batch_size = args.batch_size, num_workers = args.n_threads)
#通过设置属性的方式达到输入参数的效果

ImageFolder的缺陷是没有sampler选项。如果想实现torch中的sampler效果，就需要自己定义一个loader类，重写它的__iter__参数。关于__iter__的重写可以参考官方文档，里面对于各种情况下的sampler都有讲解。
下面是MCCNET中的sampler在__iter__中实现的例子，实现了单卡单线程当训练集大小小于iter次数时，对训练集进行重复随机取index。sampler.py代码

torch的sampler定义
#import numpy as np
#from torch.utils import data
def InfiniteSampler(n):
    # i = 0
    i = n - 1
    order = np.random.permutation(n)
    while True:
        yield order[i]
        i += 1
        if i >= n:
            np.random.seed()
            order = np.random.permutation(n)
            i = 0

class InfiniteSamplerWrapper(data.sampler.Sampler):
    def __init__(self, data_source):
        self.num_samples = len(data_source)

    def __iter__(self):
        return iter(InfiniteSampler(self.num_samples))

    def __len__(self):
        return 2 ** 31

jittor代码
class FlatFolderDataset(Dataset):
    def __iter__(self):
        i = self.len - 1
        batch_size = args.batch_size
        index_list = get_random_list(self.len)
        batch_data = []
        while True:
            for x in range(batch_size):
                y = i
                if i >= self.len:
                    y = i - self.len
                batch_data.append(self[index_list[y]])
                i += 1

            if (i >= self.len):
                index_list = get_random_list(self.len)
                i = 0

            batch_data = self.collate_batch(batch_data)
            batch_data = self.to_jittor(batch_data)
            yield jt.float(batch_data)
            batch_data = []

但由于单卡单线程较慢，所以改成了多线程的方式，具体代码可以在GitHub中看到。

2.2.2 load() 加载网络参数

jittor中是有同名参数的。

def load(path):
    if path.endswith(".pth"):
        try:
            dirty_fix_pytorch_runtime_error()
            import torch
        except:
            raise RuntimeError("pytorch need to be installed when load pth format.")
        model_dict = torch.load(path, map_location=torch.device('cpu'))
    else:
        model_dict = safeunpickle(path)
    return model_dict

可以看到load()函数会判断读入的参数文件后缀是否为".pth"（即torhc的参数文件)。如果是，则调用torch自带的load()函数，并加上了参数"map_location=torch.device(‘cpu’)"，而这个参数会导致这句语句中断
但是不知道为什么每次调用都跑不动，于是就单拎出来测试了一下jittor包装的load函数。

model_dict = torch.load(path, map_location=torch.device('cpu'))

发现还是跑不动，但把map_location参数去掉就好了。
在调用.pth文件时，推荐直接使用torch的load函数。
顺便说一下，Jittor中的参数文件后缀为.pkl

2.2.3 pytorch训练好的模型参数加载到jittor的模型中

只需导入torch自带的模型，再将它的参数赋值给jittor的模型

import torch 
import torchvision.models as tcmodels 
import jittor.models as jtmodels

pytorch_model =tcmodels.__dict__['vgg19']()
jittor_model = jtmodels.__dict__['vgg19']() 
 # Set eval to avoid dropout layer 
 pytorch_model.eval() 
 jittor_model.eval() 
 # Jittor loads pytorch parameters to ensure forward alignment 
 jittor_model.load_parameters(pytorch_model.state_dict())

如果是本地的pth文件，直接使用load_state_dict（）加载就可以。

vgg.load_state_dict(torch.load(vgg_path))

2.2.4 children() 获取网络中的各层

有时候我们并不想要输入通过整个网络后的结果，而是在通过某个特定层之后的结果，就需要将model中的层单独取出来，然后再输入数据、运算。
当你使用jittor自带的模型时，要注意通过children()取出来的结果，可能并不是想你想象得那样。

import jittor.models as jtmodels
vgg = jtmodels.vgg19()
enc_layers = list(vgg.children())
print(enc_layers)
>>[Sequential(
    0: Conv(3, 64, (3, 3), (1, 1), (1, 1), (1, 1), 1, float32[64,], None, Kw=None, fan=None, i=None, bound=None)
    1: relu()
    2: Conv(64, 64, (3, 3), (1, 1), (1, 1), (1, 1), 1, float32[64,], None, Kw=None, fan=None, i=None, bound=None)
    3: relu()
    4: Pool(2, 2, padding=0, dilation=None, return_indices=None, ceil_mode=False, count_include_pad=False, op=maximum)
    5: Conv(64, 128, (3, 3), (1, 1), (1, 1), (1, 1), 1, float32[128,], None, Kw=None, fan=None, i=None, bound=None)
    6: relu()
    7: Conv(128, 128, (3, 3), (1, 1), (1, 1), (1, 1), 1, float32[128,], None, Kw=None, fan=None, i=None, bound=None)
    8: relu()
    9: Pool(2, 2, padding=0, dilation=None, return_indices=None, ceil_mode=False, count_include_pad=False, op=maximum)
    10: Conv(128, 256, (3, 3), (1, 1), (1, 1), (1, 1), 1, float32[256,], None, Kw=None, fan=None, i=None, bound=None)
    11: relu()
    12: Conv(256, 256, (3, 3), (1, 1), (1, 1), (1, 1), 1, float32[256,], None, Kw=None, fan=None, i=None, bound=None)
    13: relu()
    14: Conv(256, 256, (3, 3), (1, 1), (1, 1), (1, 1), 1, float32[256,], None, Kw=None, fan=None, i=None, bound=None)
    15: relu()
    16: Conv(256, 256, (3, 3), (1, 1), (1, 1), (1, 1), 1, float32[256,], None, Kw=None, fan=None, i=None, bound=None)
    17: relu()
    18: Pool(2, 2, padding=0, dilation=None, return_indices=None, ceil_mode=False, count_include_pad=False, op=maximum)
    19: Conv(256, 512, (3, 3), (1, 1), (1, 1), (1, 1), 1, float32[512,], None, Kw=None, fan=None, i=None, bound=None)
    20: relu()
    21: Conv(512, 512, (3, 3), (1, 1), (1, 1), (1, 1), 1, float32[512,], None, Kw=None, fan=None, i=None, bound=None)
    22: relu()
    23: Conv(512, 512, (3, 3), (1, 1), (1, 1), (1, 1), 1, float32[512,], None, Kw=None, fan=None, i=None, bound=None)
    24: relu()
    25: Conv(512, 512, (3, 3), (1, 1), (1, 1), (1, 1), 1, float32[512,], None, Kw=None, fan=None, i=None, bound=None)
    26: relu()
    27: Pool(2, 2, padding=0, dilation=None, return_indices=None, ceil_mode=False, count_include_pad=False, op=maximum)
    28: Conv(512, 512, (3, 3), (1, 1), (1, 1), (1, 1), 1, float32[512,], None, Kw=None, fan=None, i=None, bound=None)
    29: relu()
    30: Conv(512, 512, (3, 3), (1, 1), (1, 1), (1, 1), 1, float32[512,], None, Kw=None, fan=None, i=None, bound=None)
    31: relu()
    32: Conv(512, 512, (3, 3), (1, 1), (1, 1), (1, 1), 1, float32[512,], None, Kw=None, fan=None, i=None, bound=None)
    33: relu()
    34: Conv(512, 512, (3, 3), (1, 1), (1, 1), (1, 1), 1, float32[512,], None, Kw=None, fan=None, i=None, bound=None)
    35: relu()
    36: Pool(2, 2, padding=0, dilation=None, return_indices=None, ceil_mode=False, count_include_pad=False, op=maximum)
), AdaptiveAvgPool2d((7, 7)), Sequential(
    0: Linear(25088, 4096, float32[4096,], None)
    1: relu()
    2: Dropout(0.5, is_train=False)
    3: Linear(4096, 4096, float32[4096,], None)
    4: relu()
    5: Dropout(0.5, is_train=False)
    6: Linear(4096, 1000, float32[1000,], None)
)]

可以发现他的结果实际上是两个Sequential加一个单独的AdaptiveAvgPool2d，并不是所有的层单独排列在列表中。
当你使用以下代码：

enc_1 = nn.Sequential(*enc_layers[:4])  # input -> relu1_1
enc_2 = nn.Sequential(*enc_layers[4:11])  # relu1_1 -> relu2_1
enc_3 = nn.Sequential(*enc_layers[11:18])  # relu2_1 -> relu3_1
output1 = enc_1(input_feat)
output2 = enc_2(output1)
output3 = enc_3(output2)

想象中的outpu1应该是input通过relu1_1之后的feat，output2应该是通过relu2_1之后的结果，但实际上output1是input通过整个vgg的output，因为在第一步取enc_layers[:4]时就将两个sequential和一个layer全取出来了，即取了整个网络，之后的enc_2和enc_3都为none。
针对这个问题秩只需做一点小小的改进，将enc_layers赋值为enc_layers[0]即可。

enc_layers = list(enc_layers[0].children())

2.2.5 MaxPool2d

jittor库中是没有MaxPool2d的，但有Pool类

class jittor.nn.Pool(kernel_size, stride=None, padding=0, dilation=None, return_indices=None, ceil_mode=False, count_include_pad=True, op='maximum')

用Pool替换MaxPool2d就可以了。要注意的是Pool的kernal_size,stride和padding参数虽然可以像(2,2)的元组，但是进入底层的运算会报类型错误。
所以还是要将(2,2)和(0,0)写成2和0。

2.2.6 backward 反向传播

jittor中的正向传播函数为execute，相当于torch中的forward函数。
同时jittor没有backward函数，而是融合到了step函数中。

torch代码
    optimizer.zero_grad()
    loss.sum().backward()
    optimizer.step()

jittor代码
    #optimizer.zero_grad()也封装到了step函数中
    optimizer.step(loss.sum())

2.2.7 requires_grad 设置参数学习模式

通过设置模型参数的requires_grad = False确实是会生效的。但当你查看输入通过模型后获得的结果的requires_grad属性时，就会发现它又被改回了True。
解决办法是使用with no_grads()语句。

with jt.no_grad():
	style_feats = self.encode_with_intermeidate(style)

style_feats中的requires_grad属性就会被设置为False。

2.2.8 GPU模式

jt.flags.use_cuda属性可以设置运行在GPU模式还是CPU模式。

jt.flags.use_cuda = 0 # jt.flags.use_cuda 表示是否使用 gpu 训练。
# 如果 jt.flags.use_cuda=1，表示使用GPU训练 如果 jt.flags.use_cuda = 0 表示使用 CPU

要在每个py开头都加上这句语句，不然就会导致一些奇怪的bug。在文件开头声明后，就不需要再代码中再加入如to(device)的声明。jittor使用同一内存管理。

个人的理解是大概不用像torch那样分为CPU Tensor和CPU Tensor，即不用考虑数据在CPU和GPU之间切换，也不用像torch那样设置to(device)。

3. Test阶段问题

基本上所有问题都在train代码中出现过，所以没有什么太大的问题。但是还是要手动转换的，官网的辅助转换工具不能转换除模型以外的代码

4. 总结

以上就是将MCCNET从torch框架转换到jittor框架的过程中遇到的问题。有兴趣的朋友也可以自己尝试一下转换，如果遇到新的问题的话可以交流一下！
MCCNET代码：https://github.com/diyiiyiii/MCCNet

初识Python~python基础语法 Cccc吃吃吃 python 开发语言
文章目录前言一、Python基础二、使用步骤（具体实例）1.进行简单的数学运算补充三、基本概念四、举一反三前言初识python。本章内容包含了python基础语法-常量和表达式一、Python基础可以将python作为一个计算器来使用。利用单词print，此单词意思是打印，属于python里的一个内建函数。使用print可以将一些数据打印到我们的控制台里。例如：print（）括号里填写我们要打印的
基于pytorch的神经病网络搭建学习停走的风 pytorch学习学习 pytorch 人工智能
1.pycharm中code方法的使用1.1父类重写技巧操作：在需要重写的方法上右键，选择code-->Generate>OverrideMethods。作用：自动生成重写父类或接口的方法2.简单神经网络importtorchfromtorchimportnnclassyu(nn.Module):def__init__(self,*args,**kwargs)->None:super().__in
论文摘要生成器：用TextRank算法实现文献关键信息提取 Atlas Shepherd python 算法自然语言处理 python 信息可视化
我们基于python代码，使用PyQt5创建图形用户界面（GUI），同时支持中英文两种语言的文本论文文献关键信息提取。PyQt5：用于创建GUI应用程序。jieba：中文分词库，用于中文文本的处理。re：正则表达式模块，用于文本清理和句子分割。numpy：提供数值计算能力，如数组操作、矩阵运算等，主要用于TextRank算法的实现。importsysimportreimportjiebaimpor
将Labelme标注的数据做成COCO格式的数据集（实例分割的数据集）一直开心深度学习计算机视觉
这里说明一下：Labelme标注数据时候是用的多边形框，关于标注，可以看前面的博客文章下面制作的COCO数据集是用于实例分割的数据集。COCO格式数据集的制作1、labelme标注的数据转coco数据集AnacondaPrompt里F:\rockdata下的目录运行指令：这里需要注意是在activatelabelme后，pythonlabelme2coco.pyNoObejectNoObeject
K8S Calico网络插件 u012804784 android 网络 flask python 计算机
优质资源分享学习路线指引（点击解锁）知识定位人群定位Python实战微信订餐小程序进阶级本课程是pythonflask+微信小程序的完美结合，从项目搭建到腾讯云部署上线，打造一个全栈订餐系统。Python量化交易实战入门级手把手带你打造一个易扩展、更安全、效率更高的量化交易系统目录0.前言1.Calico概述1.1.Calico组件1.2.Calico网络实现1.3.了解Calico对CIDR子网
机器狗监控系统软件工程师面试题道亦无名机器人面试机器狗
大部分企业会使用的面试题一、基础知识编程语言方面请简述C++中多态的实现方式，在机器狗监控系统中，哪里可能会用到多态来提高代码的扩展性？例如不同型号机器狗的运动控制模块。Python作为脚本语言在系统开发中有诸多应用，说说Python的GIL（全局解释锁）对多线程性能的影响，以及在实时数据采集与处理场景下如何规避。数据结构与算法若要实现机器狗的路径规划，你会选择哪种数据结构来存储地图信息，比如栅格
python-uiautomator2 安装教程水w Android python 开发语言测试工具自动化 UI自动化测试工具推荐 UI自动化测试 uiautomator2
目录一、简介二、支持平台及语言三、工作原理四、安装一、简介uiautomator2是一个python库，用于Android的UI自动化测试，其底层基于Googleuiautomator，Google提供的uiautomator库可以获取屏幕上任意一个APP的任意一个控件属性，并对其进行任意操作。GitHub地址：GitHub-openatx/uiautomator2:AndroidUiautoma
C语言指针 812503533 c语言开发语言
指针是C语言的核心概念之一，C语言是面向过程的语言，允许直接操作内存。指针使得程序能够非常灵活地控制内存、访问和修改数据。这种能力对于低级编程至关重要，尤其在操作系统开发、嵌入式编程、性能优化等领域中，直接操作内存可以带来极大的优势。是C语言与其他许多高级编程语言（例如Python、Java、JavaScript等）之间的一个重要区别之一1.指针的基本概念指针本质上是一个变量，它保存了另一个变量的
Python连接Sql server数据库 Python老炮儿数据库 python
defparse_subjectname(sid):"""根据传入的sid，连接到SQLServer数据库，并获取对应的subjectname。参数:sid:int-要查询的subject的sid返回:subject_name:str或None-查询到的subjectname，如果没有找到则返回None"""#固定的数据库连接信息server='***'database='***'username
顺序结构双语言征服：C++与Python秒杀洛谷三大经典入门题三流搬砖艺术家算法算法 c++数据结构
目录顺序结构核心思想题目一：P1001A+BProblem题目描述解题思路代码实现题目二：P1425小鱼的游泳时间题目描述解题思路代码实现题目三：P1421小玉买文具题目描述解题思路代码实现顺序结构四步心法常见问题与避坑指南实战扩展（LeetCode真题）顺序结构核心思想输入→处理→输出本文精选洛谷顺序结构题单中三大经典问题，通过C++与Python双语言对比实现，彻底掌握基础编程技巧！题目一：P
如何增强机器学习基础，提升大模型面试通过概率 weixin_40941102 机器学习面试人工智能
我的好朋友没有通过面试所以我给我的好朋友准备了这一篇学习路线随着大模型（如Transformer、GPT-4、LLaMA等）在自然语言处理（NLP）、计算机视觉（CV）和多模态任务中的广泛应用，AI行业的招聘竞争愈发激烈。面试官不仅要求候选人熟练使用深度学习框架（如PyTorch、TensorFlow），还希望他们具备扎实的机器学习理论基础、算法实现能力和实际问题解决经验。本文将从机器学习基础入手
使用python进行单因素方差分析（ANOVA）和事后多重比较(LSD) thinkwindows 数据分析 python 算法 excel
#idea来源#在使用spss帮朋友做单因素分析时，发现个别数据需要调整到符合显著性的要求，在spss中修改数据，再在spss中操作步骤太麻烦，于是有了这个想法。程序思路1、将数据放到excel里，确定两列数据，Group（分组数据）和B（对应数据列）2、程序读取excel数据3、整理数据格式，将数据分组，将数据从宽格式转换为长格式，以便于进行ANOVA分析。4、执行单因素方差分析（ANOVA），
linux-Openmanus本地部署-AI-Agent初探世转神风- manus manus
文章目录简介官网指导widows安装linux安装安装依赖项报错配置快速入门别急效果展示简介上来先不说其它的，先给你们稳定军心……要尝试的兄弟，放心尝试，占用空间并不大，部署下来，不超过10G。官网指导网址官网指导，比较全面。我只挑重点。widows安装在B站上，有人用过，我就不细讲了。condacreate-nopen_manuspython=3.12condaactivateopen_manu
从原理和公式出发：python实现One_Way_ANOVA ＾哪来的＆永远～ python 算法概率论
文章目录目的：python实现onewayANOVA单因素方差分析1.代码流程2.python代码实现0主要的函数1加载数据2查看数据统计结果3数据处理及可视化4方差分析4.1模型拟合4.2单因素方差分析5PostHoct-test组间比较分析6根据定义自行分解计算对比调用函数的结果7获取F分布对应的P值3.方差分析公式及原理参考目的：python实现onewayANOVA单因素方差分析方差分析(
2025年北京市海淀区信息奥赛真题解析（小学组）热爱编程的通信人 c++白名单信息学奥赛
欢迎大家订阅我的专栏：算法题解：C++与Python实现！本专栏旨在帮助大家从基础到进阶，逐步提升编程能力，助力信息学竞赛备战！专栏特色1.经典算法练习：根据信息学竞赛大纲，精心挑选经典算法题目，提供清晰的代码实现与详细指导，帮助您夯实算法基础。2.系统化学习路径：按照算法类别和难度分级，从基础到进阶，循序渐进，帮助您全面提升编程能力与算法思维。适合人群：准备参加蓝桥杯、GESP、CSP-J、CS
python anova_使用Python进行双向ANOVA的三种方法 cumei1658 python 机器学习深度学习人工智能数据分析
pythonanovaInanearlierpostIshowedfourdifferenttechniquesthatenablestwo-wayanalysisofvariance(ANOVA)usingPython.Inthispostwearegoingtolearnhowtodotwo-wayANOVAforindependentmeasuresusingPython.在较早的文章中，我
pythonSTL---sys MzKyle python库服务器运维 python
sys是Python标准库中的一个内置模块，它提供了许多与Python解释器和系统环境进行交互的功能。1.导入sys模块在使用sys库的功能之前，需要先导入它：importsys2.命令行参数(sys.argv)sys.argv是一个包含命令行参数的列表。其中，sys.argv[0]是脚本的名称，后续的元素是传递给脚本的参数。importsys#打印脚本名称print(f"脚本名称:{sys.ar
ANOVA：在Python中构建和理解ANOVA（方差分析） python收藏家 python 数据科学 python
ANOVA（方差分析）是一种统计技术，用于确定三个或更多独立（不相关）组的平均值之间是否存在任何统计学显著差异。它有助于检验关于组间均值差异的假设，在比较多个组时特别有用。在Python中，可以使用scipy.stats模块中的f_oneway函数来执行单因素方差分析（one-wayANOVA），或者使用statsmodels库中的ANOVA类来进行更复杂的方差分析。重要概念总体均值（Popula
【实践】Python爬取豆瓣电影排行榜页面数据大数据张老师 Python程序设计 python 开发语言
在本节中，我们将使用requests库爬取豆瓣电影排行榜页面数据。通过一步步实操，学习如何使用requests库发送HTTP请求、获取网页HTML数据，并为后续的网页解析做好准备。1.目标：获取豆瓣电影排行榜的网页数据豆瓣电影提供了电影排行榜页面，网址如下：https://movie.douban.com/top250在本节中，我们的目标是：访问豆瓣电影排行榜页面。获取该页面的HTML数据。解析并
Python----计算机视觉处理（opencv：像素，RGB颜色，图像的存储，opencv安装，代码展示）蹦蹦跳跳真可爱589 Python opencv 图像处理计算机视觉 python opencv 人工智能
一、计算机眼中的图像像素像素是图像的基本单元，每个像素存储着图像的颜色、亮度和其他特征。一系列像素组合到一起就形成了完整的图像，在计算机中，图像以像素的形式存在并采用二进制格式进行存储。根据图像的颜色不同，每个像素可以用不同的二进制数表示。日常生活中常见的图像是RGB三原色图。RGB图上的每个点都是由红（R）、绿（G）、蓝（B）三个颜色按照一定比例混合而成的，几乎所有颜色都可以通过这三种颜色按照不
【python】修改 python pip install 镜像源非晓为骁 python python pip 开发语言
要在使用python-mpipinstall-rrequirements.txt时添加腾讯的镜像源，可以通过-i或--index-url参数指定镜像源地址。腾讯云的PyPI镜像源地址是：https://mirrors.cloud.tencent.com/pypi/simple具体命令将腾讯云的镜像源添加到命令中，如下所示：python-mpipinstall-rrequirements.txt-i
CentOS7 部署flask和paddleX M1412 系统运维 centos paddlepaddle flask
CentOS7部署flask和paddleX1、官网下载anaconda，部署python环境#权限chmod+xAnaconda3-2020.11-Linux-x86_64.sh#安装anacondabashAnaconda3-2020.11-Linux-x86_64.sh#生效启动condasource~/.bashrc#创建虚拟环境condacreate-nweb_devpython=3.7
centos7正式服务器部署uwsgi+nginx+django项目-亲身研究[斜眼笑] pyswt Django centos python nginx centos
服务器是centos7的，首先从安装python3开始安装依赖包yuminstallzlib-develbzip2-developenssl-develncurses-develsqlite-develreadline-develtk-develgcc*make-y然后安装python3wgethttps://www.python.org/ftp/python/3.5.2/Python-3.5.2
Centos部署Django 一万句的秘密 python 数据库开发 django 分布式 centos
1.安装miniconda(python3.7环境)wgethttps://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.shshMiniconda3-latest-Linux-x86_64.sh刷新环境变量（第3步）出现（base）即可2.给miniconda添加镜像源condaconfig--addchannelshttp
Python——程序设计方法上课不要睡觉了 Python知识体系 python 算法 c++
Python——程序设计方法程序是完成一定功能的指令的集合,用于解决特定的计算问题。按照软件工程的思想,程序设计可以分为分析、设计、实现、测试、运行等阶段。结构化程序设计是一种典型的程序设计方法,是程序设计的基础思想,它是把一个复杂程序逐级分解成若干个相互独立的程序,然后再对每个程序进行设计与实现。程序在具体实现上遵循了一定的模式,典型的程序设计模式是IPO模式,也就是程序由输入(Input)、处
python中lambda函数如何使用用完记得换回去 python 开发语言
在Python中，lambda函数是一种匿名函数，即没有名字的函数。lambda函数可以接受任意数量的参数，但只能有一个表达式，这个表达式的值会被自动返回。lambda函数通常用于需要简单函数对象的场合，比如排序、映射等。以下是lambda函数的基本语法：lambdaarguments:expression以下是一些lambda函数的使用示例：1.简单的lambda函数add=lambdax,y:
Python数据可视化自动化工具：让数据跃然纸上 Echo_Wish Python 算法 Python 笔记从零开始学Python人工智能信息可视化 python 自动化
友友们好！我是Echo_Wish，我的的新专栏《Python进阶》以及《Python！实战！》正式启动啦！这是专为那些渴望提升Python技能的朋友们量身打造的专栏，无论你是已经有一定基础的开发者，还是希望深入挖掘Python潜力的爱好者，这里都将是你不可错过的宝藏。在这个专栏中，你将会找到：●深入解析：每一篇文章都将深入剖析Python的高级概念和应用，包括但不限于数据分析、机器学习、Web开发
已解决FileNotFoundError: [Errno 2] No such file or directory: ‘xxx‘ 高质量海王哦 python python
在Python编程中，FileNotFoundError是一个常见的异常，通常意味着程序尝试访问一个不存在的文件或目录。这个错误可能会影响程序的正常运行，并让开发者困惑，尤其是当路径看似正确时。本文将深入探讨FileNotFoundError的成因，提供具体的代码示例，并详细阐述几种有效的解决方法，以帮助读者迅速定位和解决此问题。已成功解决FileNotFoundError:[Errno2]Nos
python能否控制plc_小说python操作PLC 狮子坤 python能否控制plc
PLC(ProgrammableLogicController)可编程逻辑控制器，可以理解为一个微型计算机，广泛应用于工业控制中，如楼宇智控、精密机床、汽车电子等等。随着物联网的兴起，越来越多的传统工业设备需要和外界通信，但很多情况下，类似PLC这种微控制器，由于自身硬件的因素，无法直接与外界互联互通，通过PC这种上位机作为一个中介桥梁，为PLC与外界沟通打开了一扇门。Python作为当前最火的语
Python - sys 库的详细介绍 wanglaqqqq #文件与系统操作 python 开发语言
Python的sys模块是一个与Python解释器交互的核心标准库，提供了对解释器参数、运行环境、系统资源的访问和控制。以下是sys模块的核心内容及常用函数详解：一、sys模块的核心功能类别功能描述命令行参数获取脚本启动时的命令行参数（sys.argv）。程序退出控制脚本退出状态（sys.exit()）。模块与路径管理管理模块导入路径（sys.path）和已加载模块（sys.modules）。系统
对股票分析时要注意哪些主要因素？会飞的奇葩猪股票分析云掌股吧
　　众所周知，对散户投资者来说，股票技术分析是应战股市的核心武器，想学好股票的技术分析一定要知道哪些是重点学习的，其实非常简单，我们只要记住三个要素：成交量、价格趋势、振荡指标。一、成交量　　大盘的成交量状态。成交量大说明市场的获利机会较多，成交量小说明市场的获利机会较少。当沪市的成交量超过150亿时是强市市场状态，运用技术找综合买点较准；
【Scala十八】视图界定与上下文界定 bit1129 scala
Context Bound，上下文界定，是Scala为隐式参数引入的一种语法糖，使得隐式转换的编码更加简洁。隐式参数首先引入一个泛型函数max，用于取a和b的最大值 def max[T](a: T, b: T) = { if (a > b) a else b } 因为T是未知类型，只有运行时才会代入真正的类型，因此调用a >
C语言的分支——Object-C程序设计阅读有感 darkblue086 apple c 框架 cocoa
自从1972年贝尔实验室Dennis Ritchie开发了C语言，C语言已经有了很多版本和实现，从Borland到microsoft还是GNU、Apple都提供了不同时代的多种选择，我们知道C语言是基于Thompson开发的B语言的，Object-C是以SmallTalk-80为基础的。和C++不同的是，Object C并不是C的超集，因为有很多特性与C是不同的。 Object-C程序设计这本书
去除浏览器对表单值的记忆周凡杨 html 记忆 autocomplete form 浏览
&n
java的树形通讯录 g21121 java
最近用到企业通讯录，虽然以前也开发过，但是用的是jsf，拼成的树形，及其笨重和难维护。后来就想到直接生成json格式字符串，页面上也好展现。 // 首先取出每个部门的联系人 for (int i = 0; i < depList.size(); i++) { List<Contacts> list = getContactList(depList.get(i
Nginx安装部署 510888780 nginx linux
Nginx ("engine x") 是一个高性能的 HTTP 和反向代理服务器，也是一个 IMAP/POP3/SMTP 代理服务器。 Nginx 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的，第一个公开版本0.1.0发布于2004年10月4日。其将源代码以类BSD许可证的形式发布，因它的稳定性、丰富的功能集、示例配置文件和低系统资源
java servelet异步处理请求墙头上一根草ｊａｖａ异步返回ｓｅｒｖｌｅｔ
servlet3.0以后支持异步处理请求，具体是使用AsyncContext ，包装httpservletRequest以及httpservletResponse具有异步的功能， final AsyncContext ac = request.startAsync(request, response); ac.s
我的spring学习笔记8-Spring中Bean的实例化 aijuans Spring 3
在Spring中要实例化一个Bean有几种方法： 1、最常用的（普通方法） <bean id="myBean" class="www.6e6.org.MyBean" /> 使用这样方法，按Spring就会使用Bean的默认构造方法，也就是把没有参数的构造方法来建立Bean实例。（有构造方法的下个文细说） 2、还
为Mysql创建最优的索引 annan211 mysql 索引
索引对于良好的性能非常关键，尤其是当数据规模越来越大的时候，索引的对性能的影响越发重要。索引经常会被误解甚至忽略，而且经常被糟糕的设计。索引优化应该是对查询性能优化最有效的手段了，索引能够轻易将查询性能提高几个数量级，最优的索引会比较好的索引性能要好2个数量级。 1 索引的类型 (1) B-Tree 不出意外，这里提到的索引都是指 B-
日期函数百合不是茶 oracle sql 日期函数查询
ORACLE日期时间函数大全 TO_DATE格式(以时间:2007-11-02 13:45:25为例) Year: yy two digits 两位年显示值:07 yyy three digits 三位年显示值:007
线程优先级 bijian1013 java thread 多线程 java多线程
多线程运行时需要定义线程运行的先后顺序。线程优先级是用数字表示，数字越大线程优先级越高，取值在1到10，默认优先级为5。实例： package com.bijian.study; /** * 因为在代码段当中把线程B的优先级设置高于线程A,所以运行结果先执行线程B的run()方法后再执行线程A的run()方法 * 但在实际中，JAVA的优先级不准，强烈不建议用此方法来控制执
适配器模式和代理模式的区别 bijian1013 java 设计模式
一.简介适配器模式：适配器模式（英语：adapter pattern）有时候也称包装样式或者包装。将一个类的接口转接成用户所期待的。一个适配使得因接口不兼容而不能在一起工作的类工作在一起，做法是将类别自己的接口包裹在一个已存在的类中。 &nbs
【持久化框架MyBatis3三】MyBatis3 SQL映射配置文件 bit1129 Mybatis3
SQL映射配置文件一方面类似于Hibernate的映射配置文件，通过定义实体与关系表的列之间的对应关系。另一方面使用<select>,<insert>,<delete>，<update>元素定义增删改查的SQL语句，这些元素包含三方面内容 1. 要执行的SQL语句 2. SQL语句的入参，比如查询条件 3. SQL语句的返回结果
oracle大数据表复制备份个人经验 bitcarter oracle 大表备份大表数据复制
前提：数据库仓库A（就拿oracle11g为例）中有两个用户user1和user2,现在有user1中有表ldm_table1,且表ldm_table1有数据5千万以上，ldm_table1中的数据是从其他库B（数据源）中抽取过来的，前期业务理解不够或者需求有变，数据有变动需要重新从B中抽取数据到A库表ldm_table1中。
HTTP加速器varnish安装小记 ronin47 http varnish 加速
上午共享的那个varnish安装手册，个人看了下，有点不知所云，好吧~看来还是先安装玩玩！苦逼公司服务器没法连外网，不能用什么wget或yum命令直接下载安装，每每看到别人博客贴出的在线安装代码时，总有一股羡慕嫉妒“恨”冒了出来。。。好吧，既然没法上外网，那只能麻烦点通过下载源码来编译安装了！ Varnish 3.0.4下载地址： http://repo.varnish-cache.org/
java-73-输入一个字符串，输出该字符串中对称的子字符串的最大长度 bylijinnan java
public class LongestSymmtricalLength { /* * Q75题目：输入一个字符串，输出该字符串中对称的子字符串的最大长度。 * 比如输入字符串“google”，由于该字符串里最长的对称子字符串是“goog”，因此输出4。 */ public static void main(String[] args) { Str
学习编程的一点感想 Cb123456 编程感想 Gis
写点感想，总结一些，也顺便激励一些自己.现在就是复习阶段，也做做项目. 本专业是GIS专业，当初觉得本专业太水，靠这个会活不下去的，所以就报了培训班。学习的时候，进入状态很慢，而且当初进去的时候，已经上到Java高级阶段了，所以.....，呵呵，之后有点感觉了，不过，还是不好好写代码，还眼高手低的，有
[能源与安全]美国与中国 comsci 能源
现在有一个局面：地球上的石油只剩下N桶，这些油只够让中国和美国这两个国家中的一个顺利过渡到宇宙时代，但是如果这两个国家为争夺这些石油而发生战争，其结果是两个国家都无法平稳过渡到宇宙时代。。。。而且在战争中，剩下的石油也会被快速消耗在战争中，结果是两败俱伤。。。在这个大
SEMI-JOIN执行计划突然变成HASH JOIN了的原因分析 cwqcwqmax9 oracle
甲说： A B两个表总数据量都很大，在百万以上。 idx1 idx2字段表示是索引字段 A B 两表上都有 col1字段表示普通字段 select xxx from A where A.idx1 between mmm and nnn and exists (select 1 from B where B.idx2 =
SpringMVC-ajax返回值乱码解决方案 dashuaifu Ajax springMVC response 中文乱码
SpringMVC-ajax返回值乱码解决方案一：（自己总结，测试过可行） ajax返回如果含有中文汉字，则使用：（如下例：） @RequestMapping(value="/xxx.do") public @ResponseBody void getPunishReasonB
Linux系统中查看日志的常用命令 dcj3sjt126com OS
因为在日常的工作中，出问题的时候查看日志是每个管理员的习惯，作为初学者，为了以后的需要，我今天将下面这些查看命令共享给各位 cat tail -f 日志文件说明 /var/log/message 系统启动后的信息和错误日志，是Red Hat Linux中最常用的日志之一 /var/log/secure 与安全相关的日志信息 /var/log/maillog 与邮件相关的日志信
[应用结构]应用 dcj3sjt126com PHP yii2
应用主体应用主体是管理 Yii 应用系统整体结构和生命周期的对象。每个Yii应用系统只能包含一个应用主体，应用主体在入口脚本中创建并能通过表达式 \Yii::$app 全局范围内访问。补充: 当我们说"一个应用"，它可能是一个应用主体对象，也可能是一个应用系统，是根据上下文来决定[译：中文为避免歧义，Application翻译为应
assertThat用法 eksliang JUnit assertThat
junit4.0 assertThat用法一般匹配符1、assertThat( testedNumber, allOf( greaterThan(8), lessThan(16) ) ); 注释： allOf匹配符表明如果接下来的所有条件必须都成立测试才通过，相当于“与”（&&） 2、assertThat( testedNumber, anyOf( g
android点滴2 gundumw100 应用服务器 android 网络应用 OS HTC
如何让Drawable绕着中心旋转？ Animation a = new RotateAnimation(0.0f, 360.0f, Animation.RELATIVE_TO_SELF, 0.5f, Animation.RELATIVE_TO_SELF,0.5f); a.setRepeatCount(-1); a.setDuration(1000); 如何控制Andro
超简洁的CSS下拉菜单 ini html Web 工作 html5 css
效果体验：http://hovertree.com/texiao/css/3.htmHTML文件： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>简洁的HTML+CSS下拉菜单-HoverTree</title>
kafka consumer防止数据丢失 kane_xie kafka offset commit
kafka最初是被LinkedIn设计用来处理log的分布式消息系统，因此它的着眼点不在数据的安全性（log偶尔丢几条无所谓），换句话说kafka并不能完全保证数据不丢失。尽管kafka官网声称能够保证at-least-once，但如果consumer进程数小于partition_num，这个结论不一定成立。考虑这样一个case，partiton_num=2
@Repository、@Service、@Controller 和 @Component mhtbbx DAO spring bean prototype
@Repository、@Service、@Controller 和 @Component 将类标识为Bean Spring 自 2.0 版本开始，陆续引入了一些注解用于简化 Spring 的开发。@Repository注解便属于最先引入的一批，它用于将数据访问层 (DAO 层 ) 的类标识为 Spring Bean。具体只需将该注解标注在 DAO类上即可。同时，为了让 Spring 能够扫描类
java 多线程高并发读写控制误区 qifeifei java thread
先看一下下面的错误代码，对写加了synchronized控制，保证了写的安全，但是问题在哪里呢？ public class testTh7 { private String data; public String read(){ System.out.println(Thread.currentThread().getName() + "read data "
mongodb replica set(副本集)设置步骤 tcrct java mongodb
网上已经有一大堆的设置步骤的了，根据我遇到的问题，整理一下，如下：首先先去下载一个mongodb最新版，目前最新版应该是2.6 cd /usr/local/bin wget http://fastdl.mongodb.org/linux/mongodb-linux-x86_64-2.6.0.tgz tar -zxvf mongodb-linux-x86_64-2.6.0.t
rust学习笔记 wudixiaotie 学习笔记
1.rust里绑定变量是let，默认绑定了的变量是不可更改的，所以如果想让变量可变就要加上mut。 let x = 1; let mut y = 2; 2.match 相当于erlang中的case，但是case的每一项后都是分号，但是rust的match却是逗号。 3.match 的每一项最后都要加逗号，但是最后一项不加也不会报错，所有结尾加逗号的用法都是类似。 4.每个语句结尾都要加分