Sjmanman

关于DEMoS论文复现中的一些问题_使用newbing得到的解决方案。

首先挂一个论文链接：https://doi.org/10.1093/bioinformatics/btac456

代码链接: https://github. com/Docurdt/DEMoS.git

摘要：

动机:癌症基因组图谱(TCGA)倡议提出的基于综合多组学资料的胃癌(腺癌)分子分型为四种主要亚型，代表了患者分层的有效策略。然而，这种方法需要使用多种技术平台，并且执行起来相当昂贵和耗时。一种利用组织病理学图像数据推断分子亚型的计算方法可能是一种实用的、成本和时间效率高的辅助工具，用于预后和临床管理目的。

结果:在这里，我们提出了一种深度学习集成方法(称为DEMoS)，能够直接从组织病理学图像中预测四种公认的胃癌分子亚型。DEMoS分别使用独立的测试数据集，在受体-工作特征曲线(AUROC)下实现了0.785、0.668、0.762和0.811的瓷砖水平面积，用于预测这四种亚型的胃癌[即(i) eb病毒感染(EBV)， (ii)微卫星不稳定(MSI)， (iii)基因组稳定(GS)和(iv)染色体不稳定肿瘤(CIN)]。在患者层面，AUROC值分别为0.897、0.764、0.890和0.898。因此，DEMoS很好地预测了这四种子类型。基准测试实验进一步表明，DEMoS能够提高基于图像的子类型的分类性能，并防止模型过拟合。本研究强调了仅利用组织病理学图像特征，使用基于深度学习集成的方法快速可靠地诊断胃癌亚型(腺癌)的可行性。

可用性和实现:本研究中使用的所有幻灯片图像均来自TCGA数据库。

这项研究建立在我们之前发布的HEAL框架之上，相关文档和教程可在http://heal.erc.monash.edu.au上找到。

文章模型架构：

简单说一下流程：首先拿到svs格式的全切片，用openslide包进行裁剪成patch，然后使用拉普拉斯方差计算模糊度，模糊度小于一个值的patch视为较模糊，丢弃。剩下的可用patch用macenko方法使用一个标准的图片，分离和转换染色成分对所有patch进行染色标准化，使用LuminosityStandardizer类中的standardize方法进行亮度标准化。将数据集在病人级别上分离出独立测试集后，使用十字交叉方法将剩下的数据分为十份。然后训练十个EfficientNet-b1。标签文件csv中有每个patch的路径加图像名称加扩展名，与标签（需要用代码生成）。

以下是遇到和学习到的问题：

一.一些包的认识作用和使用方法

1.spams包：SPAMS是一个开源的优化工具箱，主要用于解决各种稀疏估计问题。它包含了多个子工具箱，可以在MATLAB和Python中使用。

这个包应该是openslide包中用到的，因为我没在代码中看到这个import，但确实报错了。

2.tqdm包

3.tensorboard包：目前没用到这个，应该是tensorflow框架中用到的可视化工具。

4.torch.optim

5.from PIL import lmage

6.scikit-image包

7.报错

这个其实可以用，只是会报warning，把warning在代码中注释掉就可以了。

8.torch.utils.data Dataset DataLoader

9.from torchvision import models, transforms

10.序列化与反序列化

代码：用来将一些参数写入配置文件中，或者将参数从配置文件中提取出来。

def save_variable(var, filename):   #序列化
    pickle_f = open(filename, 'wb')
    pickle.dump(var, pickle_f)
    pickle_f.close()
    return filename


def load_variable(filename):    #反序列化
    pickle_f = open(filename, 'rb')
    var = pickle.load(pickle_f)
    pickle_f.close()
    return var


save_variable({'Mode': False, 'Classes': ['1','2','3'], 'Class_number': 3}, "parameter.conf")
#其中的内容是字典，存在parameter.conf配置文件中



conf_dict = load_variable("E:/classify/DEMoS-main/HEAL/new_breastcaner/parameter.conf")  ##反序列化，用来从文件中读取保存的变量
_work_mode = conf_dict["Mode"]   #从conf_dict字典中获取"Mode"键对应的值，赋值给_work_mode变量
_class_cate = conf_dict["Classes"]
_class_number = conf_dict["Class_number"]

11.多线程至异步调用，使用到multiprocessing包

12.EfficientNet-b1模型需要进行如下操作：from efficientnet_pytorch import EfficientNet

该包需要安装pip install efficientnet_pytorch

13.BCEloss和CrossEntropyLoss的区别

因此模型若能够实现二分类和多分类，代码如下：

    if _model_name == "ResNet50":
        model = models.resnet50(pretrained=True)   #加载预训练的ResNet50模型
        num_ftrs = model.fc.in_features   #获取模型最后一层全连接层的输入特征数
        ##如果_mode为真，则将输出层替换为一个线性层和一个Sigmoid层，并使用二值交叉熵作为损失函数
        if _mode:
            model.fc = nn.Sequential(nn.Linear(num_ftrs, _class_num), nn.Sigmoid())
            criterion = nn.BCELoss()
        ##如果_mode为假，则将输出层替换为一个线性层，并使用交叉熵作为损失函数
        else:
            model.fc = nn.Linear(num_ftrs, _class_num)
            criterion = nn.CrossEntropyLoss()
        model = torch.nn.DataParallel(model)  #将模型封装为一个数据并行模块
        return model, criterion   #返回模型和损失函数
    elif _model_name == "ResNet18":
        model = models.resnet18(pretrained=False)   #不预训练
        num_ftrs = model.fc.in_features
        if _mode:
            model.fc = nn.Sequential(nn.Linear(num_ftrs, _class_num), nn.Sigmoid())
            criterion = nn.BCELoss()
        else:
            model.fc = nn.Linear(num_ftrs, _class_num)
            criterion = nn.CrossEntropyLoss()
        model = torch.nn.DataParallel(model)
        return model, criterion
    elif _model_name == "Vgg16":
        model = models.vgg16(pretrained=False)   #创建一个没有预训练权重的Vgg16模型
        num_ftrs = model.classifier[6].in_features  #获取模型分类器中最后一层的输入特征数
        #第七个子模块是最后一个线性层，它的输入特征数就是我们要替换的新线性层的输入特征数。
        features = list(model.classifier.children())[:-1] #remove the last layer， 移除最后一层，得到一个特征提取器的列表
        #model.classifier.children()是一个迭代器，它可以遍历模型分类器中的所有子模块。list()函数可以将迭代器转换为一个列表。[:-1]表示切片操作，它可以获取列表中除了最后一个元素以外的所有元素。
        if _mode:
            features.extend([nn.Sequential(nn.Linear(num_ftrs, _class_num), nn.Sigmoid())])  #在特征提取器的列表后面添加一个线性层和一个Sigmoid激活函数，输出类别数为_class_num
            model.classifier = nn.Sequential(*features)  #将特征提取器的列表转换为一个序列模块，并赋值给模型的分类器属性
            criterion = nn.BCELoss()
        else:
            features.extend([nn.Linear(num_ftrs, _class_num)])
            model.classifier = nn.Sequential(*features)
            criterion = nn.CrossEntropyLoss()
        model = torch.nn.DataParallel(model)
        return model, criterion

14.Ir_scheduler.ReduceLROnPlateau是PyTorch中的一个学习率调整方法。它可以监控指标，当指标不再变化时则调整学习率

15.用re模块中的sub方法，替换路径中的某些单词，输出目标路径

16.os.walk()方法遍历目标路径下的所有文件夹与文件

    for _root, _dir, _imgs in os.walk(_image_path):
        _imgs = [f for f in _imgs if not f[0] == '.']   #用列表推导式，过滤掉_imgs列表中以"."开头的隐藏文件，并重新赋值给_imgs变量
        _dir[:] = [d for d in _dir if not d[0] == '.']  #使用列表推导式，过滤掉_dir列表中以"."开头的隐藏目录，并重新赋值给_dir变量。注意这里使用了切片赋值的语法，保持了_dir变量在内存中的地址不变。
        for idx in range(len(_imgs)):   #遍历_imgs列表中的每个元素。即对每个图像
            _img = _imgs[idx]  #_img是一个字符串，表示图像文件的名称。
            _img_path = os.path.join(_root, _img)   #使用os模块中的path.join方法，将_root和_img两个字符串拼接起来，并赋值给_img_path变量。这个字符串表示图像文件的完整路径。
            pool.apply_async(blur_color_processing, (_root, _img_path, _img))   #异步执行blur_color_processing

17.保存训练好的模型

18.python中_gray.point函数在 Python 中，gray.point() 函数可以用于转换图像的像素值（例如图像对比度调整）

bw = _gray.point(lambda x: 0 if x < 220 else 1, 'F')  ## 对灰度图像进行二值化处理，将灰度值小于220的像素点设为0，其余设为1。也就是说背景为1.

19.元组和列表

二.关于TCGA中数据集的下载方式和查看方式

1.下载方法，我是用的是GDC Data Transfer Tool，在TCGA网站上下载这个应用，在Cart中下载所需要的数据的manifest.txt文件，将这个文件拖进GDC Data Transfer Tool中，即可实现下载。

得到svs格式的全切片。

2.查看SVS格式的全切片，我用的是ImageScope

3.安装openslide包，处理svs全切片，切成小的patch。

（1）安装

安装方法：从官网下载二进制预编译

网址：OpenSlide on Windowshttps://openslide.org/docs/windows/

我放在了E:\classify\DEMoS-main\envs\Lib\site-packages文件夹下。然后执行pip install openslide-python.

然后报错：

这个错误是因为Python找不到OpenSlide DLL。这个DLL是Openslide的动态链接库，它包含Openslide的函数和变量。这个错误通常是由于没有正确安装Openslide或没有正确设置环境变量导致的。如果您使用的是Windows操作系统，您可以尝试将Openslide的bin目录添加到PATH环境变量中。如果您使用的是Mac OS X或Linux操作系统，您可以尝试使用以下命令安装Openslide：brew install openslide。如果您已经安装了Openslide并且仍然遇到这个错误，请确保您已经正确设置了PYTHONPATH环境变量

按照上述方法添加path环境变量：

E:\classify\DEMoS-main\envs\Lib\site-packages\openslide-win64-20221217\bin

E:\classify\DEMoS-main\envs\Lib\site-packages\openslide-win64-20221217\lib

结果还是报错：

就将site-packages\openslide-win64-20221217\openslide-win64-20221217\bin中的内容全部复制到DEMoS-main\envs文件夹下。就好了。

（2）openslide简单的介绍

其中的DeepZoomGenerator对象可以实现切片操作。

全切片有多个图层，获取当前主程序设置的我们需要的放大倍率的那一个图层，然后去切割patch：

 _factors = self._slide.level_downsamples   #第i层图像相对于第 0 层图像的下采样因子
    #_factors：此属性由 OpenSlide Python 定义为幻灯片图像每个级别的下采样因子元组。
    #self._slide.level_downsamples中获取一个字典，这个字典的键为图像文件的级别，值为一个浮点数
    # 下采样因子是级别 0 图像中对应于当前级别中单个像素的像素数。例如，（1.0、4.0、16.0） 表示级别 0 没有缩减采样，级别 1 具有 4 倍缩减采样，级别 2 具有 16 倍缩减采样。
    #level_downsamples 每一个级别K的对应的下采样因子，下采样因子应该对应一个倍率



_objective = float(self._slide.properties[openslide.PROPERTY_NAME_OBJECTIVE_POWER]) 
print("The slide's OBJECTIVE_POWER is", _objective)
#self._slide.properties[openslide.PROPERTY_NAME_OBJECTIVE_POWER]这个变量是一个字典。在这个字典中，键为openslide.PROPERTY_NAME_OBJECTIVE_POWER，值为一个字符串，表示镜头的倍率。
            # 如果这个属性不存在，则返回None。
            #这个代码的意思是获取一个图像文件的镜头倍率，并将这个镜头倍率赋值给变量_objective
            #这个字符串常量的值是一个固定的字符串，用于表示镜头的倍率。这个常量通常用于从OpenSlide库中读取图像文件的元数据信息。例如，如果你想要获取一个图像文件的镜头倍率，你可以使用这个常量来获取这个信息。
            #在数字病理学图像中，目标功率是指显微镜物镜的放大倍数，通常以数字形式表示。例如，20x物镜的目标功率为20。


_available = tuple(_objective / x for x in _factors)  ## 计算可用的放大倍数，_objective除以每个层级的下采样因子。为（20，5，20/8）元组取整
        #print(_factors)下采样因子
        #print(_available) 可用放大倍数
        #tuple()是Python内置函数之一，用于将一个可迭代对象转换为元组。例如，将列表转换为元组。
        #用于计算图像的缩放比例，在主程序代码中缩放比例必须设为可用的缩放比例的其中之一。


print("The deepzoom level count is",self._dz.level_count) #deepzoom产生的level数量
for level in range(self._dz.level_count-1, -1, -1):  
            #从self._dz.level_count-1开始，每次减1，直到0为止
            #对幻灯片的每一层级
            #level_count——幻灯片中的级别数。级别从0（最高分辨率）到level_count - 1（最低分辨率）编号
            #DeepZoom level是指图像的缩放级别，每个缩放级别都是由上一个缩放级别的图像分辨率降低一半得到的，因此，每个缩放级别都是上一个缩放级别的四倍.DeepZoom level越高，图像分辨率越低，但是可以显示更大的图像区域。
            _thisMag = int(_available[0] / pow(2, self._dz.level_count - (level + 1)))  
            #20/1，20/2，20/4，20/8然后取整
            if self._t_mag != _thisMag:   #当前放大倍数是否等于图片计算出来的可用放大倍数。
                continue
            print("current Mag is", _thisMag)
            print("current deepzoom level is ",level)
            tile_dir = os.path.join("%s_files" % self._basename, str(_thisMag))
            if not os.path.exists(tile_dir):
                os.makedirs(tile_dir)
            cols, rows = self._dz.level_tiles[level]  #获取当前层级的图像块的列数和行数，并分别赋值给cols和rows
            #行数和列数包含空白小tile
            #dz.level_tiles一个元组，其中包含某分辨率级别的每个维度中的图块数。例如，如果最高分辨率级别中有100个水平瓦片和50个垂直瓦片，则输出将是(100, 50)。
            for row in range(rows):
                for col in range(cols):
                    tile_name = os.path.join(tile_dir, '%d_%d.%s' % (col, row, self._format))
                    if not os.path.exists(tile_name):
                        self._queue.put((self._associated, level, (col, row), tile_name))
                        #如果tile_name不存在，则将(self._associated, level, (col, row), tile_name)这个元组放入队列中。其中self._associated表示当前处理的区域是否与上一次处理的区域相同
                        #这句代码传递进去class TileWorker(Process):去掉那些
                        #将元组(associated, level, (col, row), tile_name)放入队列中。这个队列是一个线程安全的队列，用于在多线程环境下传递数据
                    self._tile_done()   #调用self._tile_done()方法，表示完成了一个图像块的处理
            print("The tile with over 50% white space has been automatically removed by OpenSlide")

接下来是一些问答newbing的知识内容：

（3）openslide自动切割的优点：

4.我想直接切割我的数据集，但不是svs格式，就是jpg，有一个图片保存的质量问题，会有模糊的情况出现 。cv2.imwrite()可以指定图片质量。

5.GPU内存不足，清空也没用，只能减小batchsize从64到16。

另注：d2l包不要随意安装，因为安装它会更改numpy，matplotlib，pytorch等版本，导致与项目代码本身不兼容，此时需要卸载d2l和上述这些包，重新pip才可以！！！！！！！！！！！！！！！！！！！！！！

写太多了，自己都不爱看了。哈哈哈

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
为什么会出现“与此站点的连接不安全”警告？
当浏览器弹出“与此站点的连接不安全”的红色警告时，不仅会让访客感到不安，还可能直接导致用户流失、品牌信誉受损，甚至引发数据泄露风险。作为网站运营者，如何快速解决这一问题？一、为什么会出现“与此站点的连接不安全”警告？浏览器提示“不安全连接”，本质上是检测到当前网站与用户之间的数据传输未经过加密保护。以下是触发警告的常见原因：1.未安装SSL证书SSL（SecureSocketsLayer）证书是网
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
JSON 与 AJAX Auscy json ajax 前端
一、JSON（JavaScriptObjectNotation）1.数据类型与语法细节支持的数据类型：基本类型：字符串（需用双引号）、数字、布尔值（true/false）、null。复杂类型：数组（[]）、对象（{}）。严格语法规范：键名必须用双引号包裹（如"name":"张三"）。数组元素用逗号分隔，最后一个元素后不能有多余逗号。数字不能以0开头（如012会被解析为12），不支持八进制/十六进制
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element(
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！intmain(){vectormyvec{3,
Guava LoadingCache sqyaa. java并发编程 Java知识 jvm 缓存 guava
LoadingCache是GoogleGuava库提供的一个高级缓存实现，它通过自动加载机制简化了缓存使用模式。核心特性自动加载机制当缓存未命中时，自动调用指定的CacheLoader加载数据线程安全：并发请求下，相同key只会加载一次灵活的过期策略支持基于写入时间(expireAfterWrite)和访问时间(expireAfterAccess)的过期可设置最大缓存大小，基于LRU策略淘汰丰富的
JavaScript 树形菜单总结 Auscy microsoft
树形菜单是前端开发中常见的交互组件，用于展示具有层级关系的数据（如文件目录、分类列表、组织架构等）。以下从核心概念、实现方式、常见功能及优化方向等方面进行总结。一、核心概念层级结构：数据以父子嵌套形式存在，如{id:1,children:[{id:2}]}。节点：树形结构的基本单元，包含自身信息及子节点（若有）。展开/折叠：子节点的显示与隐藏切换，是树形菜单的核心交互。递归渲染：因数据层级不固定，
python_虚拟环境阿_焦 python
第一、配置虚拟环境：virtualenv（1）pipvirtualenv>安装虚拟环境包（2）pipinstallvirtualenvwrapper-win>安装虚拟环境依赖包（3）c盘创建虚拟目录>C:\virtualenv>配置环境变量【了解一下】：（1）如何使用virtualenv创建虚拟环境a、cd到C:\virtualenv目录下：b、mkvirtualenvname>创建虚拟环境nam
高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
Android 开源组件和第三方库汇总 gyyzzr Android Android 开源框架
转载1、github排名https://github.com/trending,github搜索：https://github.com/search2、https://github.com/wasabeef/awesome-android-ui目录UIUI卫星菜单节选器下拉刷新模糊效果HUD与Toast进度条UI其它动画网络相关响应式编程地图数据库图像浏览及处理视频音频处理测试及调试动态更新热更新
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
Python爱心光波
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
Android ViewBinding 使用与封装教程积跬步DEV Android 开发实战大全 android
AndroidViewBinding使用与封装教程：一、ViewBinding是什么？核心功能：为每个XML布局文件自动生成一个绑定类（如ActivityMainBinding），直接暴露所有带ID的视图引用。优点：避免繁琐的findViewById()，类型安全且编译时检查。对比DataBinding：ViewBinding仅处理视图引用，无数据绑定功能。DataBinding支持双向数据绑定，
基于链家网的二手房数据采集清洗与可视化分析 Mint_Datazzh 项目 selenium 网络爬虫
个人学习内容笔记，仅供参考。项目链接：https://gitee.com/rongwu651/lianjia原文链接：基于链家网的二手房数据采集清洗与可视化分析–笔墨云烟研究内容该课题的主要目的是通过将二手房网站上的存量与已销售房源，构建一个二手房市场行情情况与房源特点的可视化平台。该平台通过HTML架构和Echarts完成可视化的搭建。因此，该课题的主要研究内容就是如何利用相关技术设计并实现这样
分布式学习笔记_04_复制模型 NzuCRAS 分布式学习笔记架构后端
常见复制模型使用复制的目的在分布式系统中，数据通常需要被分布在多台机器上，主要为了达到：拓展性：数据量因读写负载巨大，一台机器无法承载，数据分散在多台机器上仍然可以有效地进行负载均衡，达到灵活的横向拓展高容错&高可用：在分布式系统中单机故障是常态，在单机故障的情况下希望整体系统仍然能够正常工作，这时候就需要数据在多台机器上做冗余，在遇到单机故障时能够让其他机器接管统一的用户体验：如果系统客户端分布
Python之七彩花朵代码实现 PlutoZuo Python python 开发语言
Python之七彩花朵代码实现文章目录Python之七彩花朵代码实现下面是一个简单的使用Python的七彩花朵。这个示例只是一个简单的版本，没有很多高级功能，但它可以作为一个起点，你可以在此基础上添加更多功能。importturtleastuimportrandomasraimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
《分片终章的哈希裂痕：藏在数据拼接里的隐形逻辑》前端
在大文件分片传输里，有一个令人费解的现象：当所有分片的校验都显示正常，拼接后的整体文件却与源文件的哈希值不符，而问题往往精准地指向最后一片。这并非偶然的技术故障，而是数据传输链条中多重隐形逻辑交织的必然结果，如同钟表的齿轮在最后一圈突然出现难以察觉的错位。文件被切割成固定大小的分片时，最后一片往往是规则的例外。它如同拼图中形状特异的收尾piece，尺寸可能小于其他分片，却承担着衔接整体的关键作用。
（Python基础篇）了解和使用分支结构 EternityArt 基础篇 python
目录一、引言二、Python分支结构的类型与语法（一）if语句（单分支）（二）if-else语句（双分支）（三）if-elif-else语句（多分支）三、分支结构的应用场景（一）提示用户输入用户名，然后再提示输入密码，如果用户名是“admin”并且密码是“88888”则提示正确，否则，如果用户名不是admin还提示用户用户名不存在,（二）提示用户输入用户名，然后再提示输入密码，如果用户名是“adm
（Python基础篇）循环结构 EternityArt 基础篇 python
一、什么是Python循环结构？循环结构是编程中重复执行代码块的机制。在Python中，循环允许你：1.迭代处理数据：遍历列表、字典、文件内容等。2.自动化重复任务：如批量处理数据、生成序列等。3.控制执行流程：根据条件决定是否继续或终止循环。二、为什么需要循环结构？假设你需要打印1到100的所有偶数：没有循环：需手动编写100行print()语句。print(0)print(2)print(4)
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
Python七彩花朵 Want595 python 开发语言
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Cesium加载各类数据总结 zhu_zhu_xia cesium JavaScript javascript
接触到的加载数据类型：源地图、shp、Geojson、png、wms、地形底图一.Cesium加载各类底图#此类加载的本质在于newCesium.ImageryProvider()Apidefination：“Providesimagerytobedisplayedonthesurfaceofanellipsoid.Thistypedescribesaninterfaceandisnotinten
vue keep-alive标签的运用
keep-alive，想必大家都不会很陌生，在一些选项卡中会使用到。其实，它的作用大概就是把组件的数据给缓存起来。比如果我有一个选项卡，标签一，标签二，标签三。现在，我需要实现，当我在标签一的表单中输入内容后，点击标签二，再回到标签一，表单的内容依然存在。如果按以往的做法，不使用keep-alive，那是不能实现的。然而，我们只需要在选项卡的内容最外层包一个keep-alive标签即可。但这儿有一
Redis Sentinel（哨兵）和 Redis Cluster（集群） G丶AEOM 八股普通学习区 Redis redis 数据库缓存
哨兵机制和集群有什么区别Redis集群主要有两种，一种是RedisSentinel哨兵集群，一种是RedisCluster。主从集群，包括一个Master和多个Slave节点，Master负责数据的读写，Slave负责数据的读取，Master上收到的数据变更会同步到Slave节点上实现数据同步，但不提供容错和恢复，在Master宕机时不会选出新的Master，导致后续客户端所有写请求直接失败。所以
CentOS7环境卸载MySQL5.7 Hadoop_Liang mysql 数据库 mysql
备份重要数据切记，卸载之前先备份mysql重要的数据。备份一个数据库例如：备份名为mydatabase的数据库到backup.sql的文件中mysqldump-uroot-ppassword123mydatabase>backup.sql备份所有数据库mysqldump-uroot-ppassword123--all-databases>all_databases_backup.sql注意：-p后
php SPOF 贵哥的编程之路(热爱分享为后来者) PHP语言经典程序100题 php 开发语言
1.什么是单点故障（SPOF）？单点故障指的是系统中某个组件一旦失效，整个系统或服务就会不可用。常见的单点有：数据库、缓存、Web服务器、负载均衡、网络设备等。2.常见单点故障场景只有一台数据库服务器，宕机后所有业务不可用只有一台Redis缓存，挂掉后缓存全部失效只有一台Web服务器，挂掉后网站无法访问只有一个负载均衡节点，挂掉后流量无法分发只有一条网络链路，断开后所有服务失联3.消除单点故障的主
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p

关于DEMoS论文复现中的一些问题_使用newbing得到的解决方案。

你可能感兴趣的:(个人可见,医学图像分类论文学习,深度学习,pytorch,python,医学数据)