一个两个四个三

python文件IO一--路径操作，文件读取、拷贝、修改，csv、ini文件处理

一、冯诺依曼体系架构

输入设备 --> 存储器 --> 输出设备；存储器 <–> cpu（运算器、控制器）
运算器：完成各种算数运算、逻辑运算、数据传输等数据加工处理
控制器：控制程序的执行。控制总线，把数据（脉冲信号）加载到运算器，经运算器输出到内存，然后由内存到IO设备（硬盘）内存：高速访问的晶片
存储器：用于记忆程序和数据，即内存
输入设备：将数据或程序输入到计算机中，鼠标、键盘
输出设备：将数据或程序的处理结构展示给用户，例如显示器、打印机

windows encoding=‘cp936’
linux encoding=‘utf-8’

一般来说，IO操作，默认是文件IO，如果是网络IO，都直接说网络IO

二、文件打开读取操作

1、打开文件：

打开文件常用的操作就是读和写，访问模式有文本模式和二进制模式。文本是TextIO，字节是BufferIO

字符流、字节流。f.read(1), f.read(1)

打开文件：open(file, mode=‘r’, buffering=None, encoding=None, errors=None, newline=None, closefd=True)，打开一个文件，返回一个文件对象(流对象)和文件描述符。打开失败返回异常

mode: r、w、x、a、b、t、+

        r -- 只读打开，w、x、a -- 只写打开。
        w：文件存在清空原内容、不存在创建新文件。 
        x：创建新文件，文件存在报错。 
        a：追加内容，文件不存在报错。
        + ：为r、w、x、a提供缺失的读写功能，但获取的文件对象依然按r、w、x、a自己的特征。例如r+，如果文件不存在将报错。
        t ：字符模式读写，字符流，将文件按某种字符编码理解。open默认rt。编码模式encoding：windows下缺省GBK(0xB0A1),linux下缺省utf8
        b ：二进制模式读写，字节流，将文件按字节理解，与字符编码无关了。类型为bytes。

2、文件指针操作：
文件指针，指向当前字节位置。mode=r,指针起始在0，mode=a，指针起始在EOF。
f.tell():返回当前指针位置
f.seek(offset, whence):移动文件指针位置。
offset：偏移多少个字节。
whence：从什么位置开始。缺省值0：表示从头开始。1：表示从当前位置开始。2：表示从EOF开始。
文本模式下，支持从开头向后偏移的方式，whence=0。因为偏移量offset是字节数，文本模式一个中文字包含多少个节数不确定，负向偏移
或其他方式很容易就乱码报错。
二进制模式下，支持任意起点的偏移，向后seek支持超界，向前不能超界，否则抛异常。

3、指定缓存区：
缓冲区buffering。是一个内存空间，一般来说一个FIFO队列，直到缓冲区满了或达到阈值，数据才会flush到磁盘。

        buffering=-1:默认缓存模式。
        buffering=0:关闭缓存，文本模式不支持
        buffering=1:文本模式，按行缓冲，遇到换行符flush；二进制就是1个字节
        buffering>1:文本模式，是io.DEFAULT_BUFFER_SIZE；二进制就是字节数。
        f.flush():将缓存数据写入磁盘
        f.close()前会调用flush()

一般来说：

1、文本模式，都用默认缓冲区大小。且不支持关闭缓冲
2、二进制模式，是一个个字节的操作，可以指定buffer的大小
3、编程中，明确知道要写磁盘了，都会手动调用一次flush，而不是等到自动flush或close的时候。

4、读写文件：
f.read(size=-1):默认读取所有文件
size：读取多少个字节或字符
f.readline():行读取
f.readlines():读取所有行的列表，每一行是列表中一个元素。
f.write(s):把字符串s或字节写入文件

5、上下文管理：
lsof 列出打开的文件
ulimit -a 查看所有限制
with open(file) as f:
上下文管理的语句块并不会开启新的作用域。
OI被打开的时候，会获得一个文件描述符。计算机资源是有限的，所以操作系统都会做限制，保护计算机资源不要被完全耗尽。

6、stringIO和BytesIO
stringI0:
io模块中的类。可以在内存中，开辟一个文本模式的buffer，可以像文件一样操作它。当调用close方法的时候，这个buffer被释放。
stringI0().getvalue()：无视指针，输出全部内容

一般来说，内存足够的情况下，一般的优化思路就是少落地，减少磁盘IO的过程，可以大大提高程序的运行效率。磁盘操作比内存操作要慢得多

单机stringI0，多机redis

BytesIO:
在内存中开辟一个二进制的buffer。操作与stringIO一样。
file-like:
类文件对象，可以像文件对象一样操作。socket对象、输入输出对象（stdin、stdout）都是类文件对象

三：python的系统操作–代替shell

一、目录及路径操作

3.4版本之前：os.path

os.path.split
os.path.splitext
os.listdir()
os.path.splitdrive(path): 将路径分割为尾部和驱动器。驱动器是安装点或空字符串，其余路径组件是尾部。在不使用驱动器规范的系统上，驱动器将始终为空字符串。示例：UNIX

3.4开始：pathlib.Path()类：

    初始化：p = path('a', 'b', 'c/d')当前目录下的a/b/c/d
          p = Path('/etc')根下的etc目录
          p = Path()当前目录
    操作符/： Path对象/Path对象
            Path对象/字符串 或 字符串/Path
    分解parts：可以返回路径中的每一个部分
    joinpath(＊other)：连接多个字符串到Path对象中

获取路径：str(Path()), bytes(Path()))

父目录，parent：目录的逻辑父目录父目最序列，parents：索引0是最近一层父目录

二、文件权限、创建、拷贝、删除操作：
元数据信息：os.stat（path， follow＿symlinks＝True）,follow_symlinks-True: 返回文件本身信息，如果是状僵楼。

创建文件、目最相关：

        pathlib.Path().touch
        pathlib.Path().mkdir
        pathlib.Path（）.iterdir（） 迭代当前目录
        pathlib.Path（）.rmdir（） 删除空目录
        pathlib.Path（）.exist（） 路径是否存在
        pathlib.Path().is_dir()
        pathlib.Path(). is_file()
        pathlib.Path(). resolve()
        pathlib.Path().absolute()

改变属主、属组：

        os.chmod()
        os.chown(path, uid, gid)

拷贝文件： shutil模块

        shutil.copyfileobj（src， dst）：仅复制文件内容，元数据、权限丢失。dst要求可写。src／dst为打开的文件对象
        shutil.copyfile（src， dst）：复制文件内容，元数据、权限丢失。src／dst为文件路径字符串 -- 本质上是调用copyfileobj
        shutil.copymode（src， dst）：仅仅复制权限
        shutil.copystat（src，dts） ：复制权限和其他元数据信息
        shutil.copy（scr，dts）：复制文件内容、权限和部分元数据信息，但是不包括创建时间ctime和修改时间mtime
            --本质上是调用 copyfile和copymode
        shutil．copy2（src，dts）：比copy多了复制全部原数据信息，但需要平台支持
            --本质上是调用 copyfile和copystat
        shutil．copytree（src， dts， symlinks＝False， ignore＝None， copy＿function＝copy2）：递归复制目录，默认使用copy2
        注意：递归复制，symlinks＝False，因为复制目录，如果追踪软连接，会破坏目录结构，出问题。复制单个文件symlinks=True
            src必须是目录且存在，dts必须不存在
            ignore＝func：提供一个callable（src， names） -＞ignored＿names。
        shutil.rmtree（path， ignore＿error＿False）：递归删除	等同于rm -rfo
            不是原子操作，10个文件删了5个后，失败，删除的5个不会恢复
        shutil．move（src， dts， copy＿function＝copy2）：递归的移动文件、目录到目标，返回目标
            实质是使用os.rename方法
        shutil还支持打包功能。可以生产tar包并压缩。支持格式；zip／gz／bz／xz

＊＊文件类型：

结构化：数据库–结构化存储，有很强模式定义数据每一行每一列是干什么的
半结构化：json｜xmal，按一定规格
非结构化：视频、图片、音频。二进制数据

四、csv文件：半结构化数据

csv文件是一个按行分隔符和列分割符划分成的行和列的文本文件。不需要指定字符编码每一行成为一条记录record

表头：非必要，与字段列对齐就行
列分割：csv文件，按逗号分割值 Comma-Separated values
行分割：lrln. 最后一行可以没有换行符

特殊符号处理：

字段可以用双引号括起来，也可以不用。
如果字段中有特殊符号，如双引号、逗号、换行符、空格，则整个字段必须使用双引号括起来。
如果字段的值中有双引号，使用两个双引号表示一个转义

优点：
1、可以exce1直接打开，另存为excel,则可直接用excel公式。相比直接编辑excel,轻量化得多
2、高低版本excel切换，有兼容性问题，csv文件则可以避免这种问题用着数据交换工具。
3、甚至可以当数据库得表来处理。

python csv类：
csv.writer(fileobj).writerow()
csv.reader(iterable)

五、ini文件处理：

作为配置文件，ini文件格式很流行。中括号里面的部分成为section，每一个section内都是key＝value形成得键值对，key称为option选项
可见：不同section下可以有相同的option

ini文件解析：configparser模块的ConfigParser类

cfg = ConfigParser()
cfg.read（filename）：读取之后就常驻内存的，因为系统运行起来后，很多ini配置参数值都是常驻内存的，这里的设计考虑了ini文件的应用场景
cfg.sections（）：返回section列表
cfg.add＿section（section＿name）：增加一个section，存在抛错
cfg.has_section(section_name)
cfg.options（section）：返回section的所有option
cfg.has_option(section, option)
cfg.get（section， option）：从指定的section选项上去值，如果没有找到，则去DEFAULT section找。没有返回默认值
cfg.getint()
cfg.getfloat()
cfg.getboolean()
cfg.items（section）：返回指定section的键值对组成的二元组。没有section返回所有section名字及其
cfg.set(section, opt, value): section存在，则写入键值对，要求opt、value必须是字符串cfg.remove(section)
cfg.remove(section)
cfg.remove_option(section, option)
cfg.write(fileobj): 将当前cfg中的所有内容写如fileobj中。

六、练习笔记：

#!/usr/bin/env python3
# coding=utf-8
"""
@author: feng.luo
@time: 2022/3/20
@File: file_IO_1.py
"""
import configparser
import os.path
import pathlib
import re
import csv


def copy_file():
    with open('test.txt', encoding='utf8') as f1:
        with open('test1.txt', 'w', encoding='utf8') as f2:
            f2.write(f1.read())


def find_top_word():
    dic = dict()
    with open('test.txt', encoding='utf8') as f:
        for word in f:
            words = re.split('[^a-z]', word.strip().lower())
            for s in words:
                if not s.strip().isalpha():
                    continue
                dic[s.strip()] = dic.get(s.strip(), 0) + 1
    res = sorted(dic.items(), key=lambda x: x[1], reverse=True)
    print(res[:10])


# # 一、os.path路径操作：
def test_os_path():
    p = 'D:\\repository\\notes_scripts\\python_learn_note\\file_io\\file_IO_1.py'
    print(os.path.basename(p))
    print(os.path.relpath(p))
    print(os.path.abspath(p))
    print(os.path.split(p))
    print(os.path.splitdrive(p))
    print(os.path.dirname(p))
    print(os.path.curdir)
    print(os.path.exists(p))
    print(os.path.join('abc', 'python.py'))


# # 二、pathlib.Path
def test_pathlib():

    # 1.初始化
    p1 = pathlib.Path()  # 当前目录
    p2 = pathlib.Path('a', 'b', 'c/d')   # 当前目录下的a/b/c/d
    p3 = pathlib.Path('/etc')  # 根下的etc目录
    print(p1, p2, p3)

    # 2.操作符/
    # Path对象/Path对象；Path对象/字符串；字符串/Path对象
    p4 = p1/'a'
    p5 = 'b'/p1
    p6 = p3/p2
    print(p4, p5, p6)
    # 3.分解parts:可以返回路径中的每一个部分
    print(p6.parts)
    # 4.joinpath，连接多个字符串到Path对象中
    print(p6.joinpath('a', 'abc', 'fusion', pathlib.Path('http')))
    # 获取路径 str(Path对象) 或bytes(Path对象)
    print(type(p6), type(str(p6)))

    # # 5.父目录：parent；
    # # 父目录序列：parents，索引0是最近的父目录
    p = pathlib.Path('abc/etc/sys/config/network/eth0')
    print(type(p.parent), p.parent)
    print(list(p.parents))

    # # 6.目录操作
    # name，目录的最后一部分，文件全名
    print(p.name, type(p.name))
    # suffix，后缀，文件的最后一个扩展名
    p = pathlib.Path('/home/admin/test.tar.gz')
    print(p.suffix)
    # stem，目录的最后一部分，没有后缀。及文件名
    print(p.stem)
    print(p.stem + p.suffix == p.name)
    # suffixes 返回多个扩展名
    print(p.suffixes)
    # with_suffix(suffix) 补充扩展名到路径尾部，返回新的路径，扩展名存在则不进行任何操作
    print(p.with_suffix('.zip'), p.with_suffix('.gz'), p.with_suffix('.asc'))
    # with_name(name) 替换目录最后一部分，返回一个新的路径
    print(p.with_name('ll.log'))

    # #7. 获取与判断操作
    p = pathlib.Path()
    qq = pathlib.Path('D:\\repository\\notes_scripts\\python_learn_note\\file_io\\腾讯QQ.lnk')
    print('---' * 5)
    print(p.cwd())  # 返回当前目录
    print(p.home())  # 返回家目录
    print(qq.resolve())  # 返回当前Path的绝对路径，如果当前Path是软链接，则软链接被解析，返回真实路径
    print(qq.absolute())  # 返回绝对路径
    print(p.is_dir())
    print(p.is_file())
    print(p.is_absolute())
    print(p.is_symlink())
    print(p.exists())

    # # 8、创建文件与目录
    print(list(pathlib.Path().iterdir()))  # 跌带当前目录
    pathlib.Path('test.log').touch()  # 创建一个新文件
    pathlib.Path('test/').mkdir(exist_ok=True)  # 创建一个目录
    # pathlib.Path('test/').mkdir(mode=0o777, parents=False, exist_ok=False)
    # parents,是否创建父目录，parents=True等同于mkdir -p；False时，父母了不存在将抛FileNotFoundError错
    # exist_ok=True时，文件存储不抛出错

    # # 9.通配符glob(pattern) 通配给定的模式
    print('---' * 5)
    p = pathlib.Path()
    print(list(p.glob('test*')))  # 返回当前目录下所有以test开头的文件
    print(list(p.glob('**/*.py')))  # 递归当前目录下的所有目录及文件，返回所有py文件
    print(list(p.rglob('*.py')))  # 同上

    # # 10.匹配match(pattern) 模式匹配，成功返回True
    print(pathlib.Path('a/b.py').match('*.py'))
    print(pathlib.Path('a/b/c/d.py').match('a/*/*.py'))
    print(pathlib.Path('a/b/c/d.py').match('a/**/*.py'))
    print(pathlib.Path('a/b/c/d.py').match('**/*.py'))

    # # 11. 文件操作
    # open，打开文件，操作与内建函数open一致
    p = pathlib.Path('test.log')
    with p.open(mode='w', encoding='utf8') as f:
        f.write('abc')
    # 读写文件
    p.write_text('abc')
    p.write_bytes(b'abc')  # 这里的write_bytes每次都是重新创建，慎用
    p.read_text()


# 三、csv
dst = """num,name,age,comm
1,luof,20,
2,jerry,33,male
3,tom,30,
4,Lily,3,"""
def test_csv():
    with open('test.csv', mode='w', encoding='utf8') as f:
        for line in dst.splitlines():
            f.write(line + '\n')
        csv.writer(f).writerow([2, 'll', 23])
        csv.writer(f).writerows([(6, 'hh', 5), (7, 'cle', 56, 'female')])
    with open('test.csv', encoding='utf8') as f:
        print(next(csv.reader(f)))
        print(next(csv.reader(f)))


# 四、ini
def test_ini():
    cfg = configparser.ConfigParser()
    cfg.read('test.ini')
    print(cfg.sections())
    for section in cfg.sections():
        for opt in cfg.options(section):
            print(section, opt)
        for k, v in cfg.items(section):
            print(k, v)
    print(cfg.items('mysql'))
    print(cfg.options('mysql'))
    for k, v in cfg.items():
        print(k, v)
    # cfg.set('test_section', 'opt', 'True')
    cfg.add_section('test_section')
    cfg.set('test_section', 'opt', 'True')
    print(cfg.get('test_section', 'opt'))
    print(cfg.getboolean('test_section', 'opt'))
    with open('test_ini', mode='w') as f:
        cfg.write(f)


if __name__ == '__main__':
    copy_file()
    find_top_word()
    print(os.path.abspath(__file__))
    test_pathlib()
    print(os.listdir())
    test_csv()
    test_ini()

深度学习之目标检测的常用标注工具铭瑾熙人工智能机器学习深度学习深度学习目标检测目标跟踪
1LabelImgLabelImg是一款开源的图像标注工具，标签可用于分类和目标检测，它是用Python编写的，并使用Qt作为其图形界面，简单好用。注释以PASCALVOC格式保存为XML文件，这是ImageNet使用的格式。此外，它还支持COCO数据集格式。2labelmelabelme是一款开源的图像/视频标注工具，标签可用于目标检测、分割和分类。灵感是来自于MIT开源的一款标注工具Label
34、深度学习-自学之路-深入理解-NLP自然语言处理-RNN一个简单的程序，可以从程序中理解RNN的基本思想。小宇爱深度学习-自学之路深度学习自然语言处理 rnn
importsys,random,mathfromcollectionsimportCounterimportnumpyasnpf=open('tasks_1-20_v1/en/qa1_single-supporting-fact_train.txt','r')raw=f.readlines()f.close()tokens=list()forlineinraw[0:1000]:tokens.ap
ug12在win8计算机名错,我电脑是win8.1的装ug8.0 装ug为什么会提示错误?? zc791022 ug12在win8计算机名错
可以安装，64位的可能要通用许可证才能安装。安装NX8.0.0.25之前，最好卸载掉“大于4.0”的许可服务(因为你只要装了8.0的许可服务，7.0/6.0/5.0都可以启动的)，安装后打不开NX8.0的，重启电脑试试！1.用记事本方式打开安装文件夹下的“crack\UGSLicensing\NX8.0.lic”(把里面SERVERthis_hostID=20110555528000里面的this
DeepSeek-R1 技术全景解析：从原理到实践的“炼金术配方” ——附多阶段训练流程图与核心误区澄清... 雪停时偶遇一叶春流程图
合集-人工智能(5)1.如何改进AI模型在特定环境中的知识检索2024-09-242.深度学习与统计学中的时间序列预测2024-10-033.《使用coze搭建一个会搜索、写ppt、思维导图的Agent》2024-10-294.深入浅出：Agent如何调用工具——从OpenAIFunctionCall到CrewAI框架01-145.DeepSeek-R1技术全景解析：从原理到实践的“炼金术配方”—
计算机程序制作的小作品,义乌市中小学生电脑作品制作比赛201203 东南前哨计算机程序制作的小作品
《义乌市中小学生电脑作品制作比赛201203》由会员分享，可在线阅读，更多相关《义乌市中小学生电脑作品制作比赛201203(4页珍藏版)》请在人人文库网上搜索。1、浙江省义乌市教育研修院关于举办2012年义乌市中小学生电脑作品制作比赛暨首届青少年网络道德建设专题创作活动的通知各中小学：为进一步推进和加强中小学信息技术教育，普及信息技术知识，培养学生创新精神和实践能力，提高信息技术水平，根据上级文件
Python 舆论风向分析爬虫：全流程数据获取、清洗与情感剖析西攻城狮北 python 爬虫开发语言实战案例
引言在当今信息爆炸的时代，互联网上充斥着海量的用户言论和观点。了解舆论风向对于企业、政府机构以及研究者等具有重要的意义，可以帮助他们及时把握公众情绪、调整策略与决策。Python作为一种强大的编程语言，在数据爬取与分析方面具有得天独厚的优势，能够助力我们高效地实现舆情监测与深入剖析。一、环境搭建与目标确定1.环境搭建为了顺利完成爬虫与数据分析任务，首先需要确保你的开发环境已经安装了以下Python
最新版AndroidStudio踩坑(新建项目无法正常运行) 沙漠蓝色披头 android studio
2023.7.20日雨今天花了六个小时才搞定新版AS创建app应用并可以运行，所以记录一下as版本是：AndroidStudioFlamingo|2022.2.1Patch2新建一个app应用，结果gradle一直下载不下来，提示connectrefuse，如果你配置了代理，建议设置为无代理同时要记得把.gradle/gradle.properties里面相关的代理设置给清除了，如果设置了代理的话
Flutter一直停在 flutter pub get 的解决方法沙漠蓝色披头 Flutter移动开发
设置用户变量FLUTTER_STORAGE_BASE_URL：https://storage.flutter-io.cnPUB_HOSTED_URL：https://pub.flutter-io.cn重启androidstudio亲测有效
【vue】Mammoth.js的使用：将.docx转换成HTML 暴富暴富暴富啦啦啦 1024程序员节
mammoth.convertToHtml(input,options）：把源文档转换为HTML文档mammoth.convertToMarkdown(input,options)：把源文档转换为Markdown文档。mammoth.extractRawText(input)：提取文档的原始文本。这将忽略文档中的所有格式。每个段落后跟两个换行符。npminstallelement-uimammot
麒麟v10安装mysql5.7（ARM架构） qqxinxi arm开发
下载路径：华为云镜像麒麟v10是潮流时代的新时髦的linux操作系统，但随着ARM架构流行，出现了一些卡点，不以为然，没当回事的大吃一惊。经常卡住。例如:在安装mysql5.7（ARM架构）最简单：使用rpmmysql-5.7.27.1.el7.aarch64.rpm文件比较小下载完之后rpm-ivhmysql-5.7.27.1.el7.aarch64.rpm比较简单常用的方法，再不能连接互联网时
PyCharm 集成 DeepSeek：本地运行 or API 直连？打造你的 AI 编程神器！ AI云极【AI智能系列】pycharm 人工智能 ide deepseek
在AI赋能编程的时代，如何让AI辅助写代码，提升开发效率？DeepSeek作为一款开源、强大、免费的AI编程助手，结合PyCharm，能够大幅提升Python编程体验。今天，我们就来详细讲解如何在PyCharm中接入DeepSeek，无论你想使用本地部署的DeepSeek，还是官方API版本，都能轻松实现！为什么选择DeepSeek+PyCharm？DeepSeekR1采用6710亿参数的MoE（
Python3.5源码分析-sys模块及site模块导入小屋子大侠 python Python分析 python源码
Python3源码分析本文环境python3.5.2。参考书籍>python官网Python3的sys模块初始化根据分析完成builtins初始化后，继续分析sys模块的初始化，继续分析_Py_InitializeEx_Private函数的执行，void_Py_InitializeEx_Private(intinstall_sigs,intinstall_importlib){...sysmod=
java竞赛优化输入输出效率 px不是xp 蓝桥准备 java 开发语言
在编程竞赛中，输入输出效率至关重要。Java的`Scanner`和`System.out.println`虽然简单，但在处理大规模数据时会严重拖慢速度。以下是**竞赛专用输入输出模板**及其原理详解，助你轻松应对高频I/O场景。---###⚡竞赛级输入输出模板（Java）importjava.io.*;importjava.util.*;publicclassMain{ publicstatic
十大排序算法 myprogramc 排序算法算法数据结构
排序算法插入排序冒泡排序选择排序希尔排序计数排序快速排序1经典Lomuto分区法2经典Lomuto分区法3随机快排堆排序归并排序桶排序基数排序插入排序从i=1开始，判断nums[i-1]和nums[i]的大小，一直到nums[i]插入到自己的位置。模拟抓扑克牌的过程：将元素插入到已排序的部分，使其有序voidinsertionSort(vector&nums){for(inti=1;i=0&&nu
【CUDA】Pytorch_Extensions joker D888 深度学习 pytorch python cuda c++深度学习
【CUDA】Pytorch_Extensions为什么要开发CUDA扩展？当我们在PyTorch中实现自定义算子时，通常有两种选择：使用纯Python实现（简单但效率低）使用C++/CUDA扩展（高效但需要编译）对于计算密集型的操作（如神经网络中的自定义激活函数），使用CUDA扩展可以获得接近硬件极限的性能。本文将以实现一个多项式激活函数x²+x+1为例，展示完整的开发流程。完整CUDA扩展代码解
Labelbox：引领AI与人类协作的未来魏兴雄Milburn
Labelbox：引领AI与人类协作的未来labelbox-pythonLabelboxPythonClient项目地址:https://gitcode.com/gh_mirrors/la/labelbox-python项目介绍Labelbox是一款专为企业和学术研究社区设计的开源工具，旨在简化数据标注、生成高质量的人类反馈数据、评估和提升模型性能，并通过无缝结合AI与人类工作流程来自动化任务。无
基于python使用scanpy分析单细胞转录组数据探序基因单细胞分析 python 开发语言
探序基因肿瘤研究院整理相关后缀的格式介绍：.h5ad：是一种用于存储单细胞数据的文件格式，可以通过anndata库在Python中处理.loom：高效的数据存储格式（.loom文件），使得用户可以轻松地存储、查询和分析大规模的单细胞数据集。Loompy的设计目标是提供一个快速、灵活且易于使用的工具，以支持生物信息学家和研究人员在单细胞水平上进行数据分析。python的单细胞转录组数据结构说明：da
GATK3.5GATK4.0与java版本的关系探序基因 java
探序基因肿瘤研究院整理操作系统centosstream9yum安装java后，输入java-version可看到：openjdkversion"11.0.20.1"2023-08-24LTSOpenJDKRuntimeEnvironment(Red_Hat-11.0.20.1.1-2)(build11.0.20.1+1-LTS)OpenJDK64-BitServerVM(Red_Hat-11.0.
单细胞轨迹分析-monocle包的使用探序基因 r语言
探序基因肿瘤研究院整理安装：monocle源码下载：https://www.bioconductor.org/packages/release/bioc/html/monocle.htmlR版本，4.2.0BiocManager::install("monocle")不过在安装过程中还是报错了：Warning:无法在https://bioconductor.org/packages/3.15/bi
Java 运行时常量池笔记（详细版小猫猫猫◍˃ᵕ˂◍ java 笔记 python
Java运行时常量池笔记（详细版）Java的运行时常量池（RuntimeConstantPool）是JVM方法区的一部分，用于存储编译期生成的字面量和符号引用。它是Java类文件常量池的运行时表示，具有动态性和共享性。运行时常量池的核心概念1.什么是运行时常量池？运行时常量池是JVM方法区的一部分，存储类文件中常量池的内容。它包含：字面量：如字符串、整数、浮点数等。符号引用：如类名、方法名、字段名
本地搭建小型 DeepSeek 并进行微调非著名架构师大模型知识文档智能硬件人工智能大数据大模型 deepseek
本文将指导您在本地搭建一个小型的DeepSeek模型，并进行微调，以处理您的特定数据。1.环境准备Python3.7或更高版本PyTorch1.8或更高版本CUDA(可选，用于GPU加速)Git2.克隆DeepSeek仓库bash复制gitclonehttps://github.com/deepseek-ai/deepseek.gitcddeepseek3.安装依赖bash复制pipinstall
在线预览 Word 文档你不讲 wood word 开发语言前端 vue.js javascript node.js docx-preview
引言随着互联网技术的发展，Web应用越来越复杂，用户对在线办公的需求也日益增加。在许多业务场景中，能够直接在浏览器中预览Word文档是一个非常实用的功能。这不仅可以提高用户体验，还能减少用户操作步骤，提升效率。实现原理1.后端服务假设后端服务已经提供了两个API接口：getFilesList:获取文件列表。previewFile:获取指定文件的内容。constexpress=require('ex
sql server查询IO消耗大的排查sql诊断语句 S3软件工具补丁 sql 数据库服务器
原文链接：sqlserver查询IO消耗大的排查sql诊断语句-S3软件[code]selecttop50(total_logical_reads/execution_count)asavg_logical_reads,(total_logical_writes/execution_count)asavg_logical_writes,(tota...https://blog.s3.sh.cn/t
前端导出word文件—包含canvas(echarts图表) Liuer_Qin js canvas echarts echarts 前端 javascript
一、使用的插件html-docx-js二、整体思路因为canvas是运行在内存中的，所以不能简单的通过dom获取canvas图片，需要手动的先将canvas转为image。三、实现先克隆要下载的DOM的副本。因为canvas是运行在内存中的，所以也不能通过cloneNode方法克隆下来（克隆下来是空的）。我们这里将原DOM中的canvas转成图片，然后插入到副本的对应位置，这样操作不会影响原DOM
语聊房软件开发流程与基础功能 ALLSectorSorft java html5 javascript
开发一款语聊房软件需要系统的规划和多领域技术整合。以下是关键流程、基础功能及示例代码：---一、开发流程1.需求分析-明确目标用户（社交/游戏/教育）-竞品分析（Clubhouse/Discord/狼人杀）-核心功能优先级排序2.技术选型-实时语音：声网Agora（推荐）/腾讯云TRTC/WebRTC-即时通讯：Socket.io/Sendbird/Firebase-后端框架：Node.js/Sp
Vue.js 基础与实战指南：从入门到跑路王嘉俊705 前端 javascript visual studio code html 前端 vue.js
一、Vue的两种使用方式扩展核心包开发直接通过引入Vue.js，适用于简单页面或局部功能增强。优点：轻量，无需构建工具。缺点：难以管理复杂项目，缺少工程化支持。工程化开发使用VueCLI、Vite等工具创建项目，结合Webpack/Vite构建。支持单文件组件（.vue文件），结构清晰（`,,）。插件生态丰富（如VueRouter、Vuex、Pinia）。二、Vue实例的深入理解核心配置项 new
MVCC（多版本并发控制）机制讲解十五001 基础 oracle 数据库 mysql
MVCC（Multi-VersionConcurrencyControl，多版本并发控制）这是一个在数据库管理系统中非常重要的技术，尤其是在处理并发事务时。别担心，我会用简单易懂的方式来讲解，让你轻松掌握它的原理和作用。1.什么是MVCC？定义MVCC是一种数据库技术，用于通过保留数据的多个版本来提高并发性能，同时避免事务之间的冲突。简单来说，它允许数据库在读取和写入操作时，同时存在多个版本的数据
使用Python和OpenCV实现图像像素压缩与解压东方佑量子变法 python opencv 开发语言
在本文中，我们将探讨如何使用Python和OpenCV库来实现一种简单的图像像素压缩算法。我们将详细讨论代码的工作原理，并提供一个具体的示例来演示该过程。1.引言随着数字媒体的普及，图像处理成为了一个重要的领域。无论是为了减少存储空间还是加快网络传输速度，图像压缩技术都扮演着至关重要的角色。这里，我们提出了一种基于像素重复模式的简单压缩算法，它适用于具有大量连续相同像素值的图像。2.技术栈介绍2.
【Python系列】Python 解释器的站点配置 Kwan的解忧杂货铺@新空间代码工作室 s1 Python python 开发语言
欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kwan的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越剑指大厂系列:全面总结java核心技术点,如集合,jvm,并发编程redis,kafka,Spring,微服务,Netty等常用开发工具系列:罗列常用的开发工具,如IDEA,M
青龙面板京东cookies工具 zhiyi_1 学习人工智能
新增了一些功能，主要是有些老版本的适配，解决原先的bug更新方式，替换文件，config文件可以不替换，则保留配置使用方式：1.运行JD_Get.exe2.登录京东3.点击获取获取到cookie会在右侧显示4.点击发送到青龙面板（如果配置了青龙参数）下载地址：夸克网盘分享
设计模式介绍 tntxia 设计模式
设计模式来源于土木工程师克里斯托弗亚历山大（http://en.wikipedia.org/wiki/Christopher_Alexander）的早期作品。他经常发表一些作品，内容是总结他在解决设计问题方面的经验，以及这些知识与城市和建筑模式之间有何关联。有一天，亚历山大突然发现，重复使用这些模式可以让某些设计构造取得我们期望的最佳效果。亚历山大与萨拉-石川佳纯和穆雷西乐弗斯坦合作
android高级组件使用(一) 百合不是茶 android RatingBar Spinner
1、自动完成文本框（AutoCompleteTextView） AutoCompleteTextView从EditText派生出来，实际上也是一个文本编辑框，但它比普通编辑框多一个功能：当用户输入一个字符后，自动完成文本框会显示一个下拉菜单，供用户从中选择，当用户选择某个菜单项之后，AutoCompleteTextView按用户选择自动填写该文本框。使用AutoCompleteTex
[网络与通讯]路由器市场大有潜力可挖掘 comsci 网络
如果国内的电子厂商和计算机设备厂商觉得手机市场已经有点饱和了,那么可以考虑一下交换机和路由器市场的进入问题..... 这方面的技术和知识,目前处在一个开放型的状态,有利于各类小型电子企业进入 &nbs
自写简单Redis内存统计shell 商人shang Linux shell 统计Redis内存
#!/bin/bash address="192.168.150.128:6666,192.168.150.128:6666" hosts=(${address//,/ }) sfile="staticts.log" for hostitem in ${hosts[@]} do ipport=(${hostitem
单例模式(饿汉 vs懒汉) oloz 单例模式
package 单例模式; /* * 应用场景:保证在整个应用之中某个对象的实例只有一个 * 单例模式种的《懒汉模式》 * */ public class Singleton { //01 将构造方法私有化，外界就无法用new Singleton()的方式获得实例 private Singleton(){}; //02 申明类得唯一实例 priva
springMvc json支持杨白白 json springmvc
1.Spring mvc处理json需要使用jackson的类库，因此需要先引入jackson包 2在spring mvc中解析输入为json格式的数据:使用@RequestBody来设置输入 @RequestMapping("helloJson") public @ResponseBody JsonTest helloJson() {
android播放，掃描添加本地音頻文件小桔子
最近幾乎沒有什麽事情，繼續鼓搗我的小東西。想在項目中加入一個簡易的音樂播放器功能，就像華為p6桌面上那麼大小的音樂播放器。用過天天動聽或者QQ音樂播放器的人都知道，可已通過本地掃描添加歌曲。不知道他們是怎麼實現的，我覺得應該掃描設備上的所有文件，過濾出音頻文件，每個文件實例化為一個實體，記錄文件名、路徑、歌手、類型、大小等信息。具體算法思想，
oracle常用命令 aichenglong oracle dba 常用命令
1 创建临时表空间 create temporary tablespace user_temp tempfile 'D:\oracle\oradata\Oracle9i\user_temp.dbf' size 50m autoextend on next 50m maxsize 20480m extent management local
25个Eclipse插件 AILIKES eclipse插件
提高代码质量的插件1. FindBugsFindBugs可以帮你找到Java代码中的bug，它使用Lesser GNU Public License的自由软件许可。2. CheckstyleCheckstyle插件可以集成到Eclipse IDE中去，能确保Java代码遵循标准代码样式。3. ECLemmaECLemma是一款拥有Eclipse Public License许可的免费工具，它提供了
Spring MVC拦截器+注解方式实现防止表单重复提交 baalwolf spring mvc
原理：在新建页面中Session保存token随机码，当保存时验证，通过后删除，当再次点击保存时由于服务器端的Session中已经不存在了，所有无法验证通过。 1.新建注解： ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
《Javascript高级程序设计(第3版)》闭包理解 bijian1013 JavaScript
“闭包是指有权访问另一个函数作用域中的变量的函数。”--《Javascript高级程序设计(第3版)》看以下代码： <script type="text/javascript"> function outer() { var i = 10; return f
AngularJS Module类的方法 bijian1013 JavaScript AngularJS Module
AngularJS中的Module类负责定义应用如何启动，它还可以通过声明的方式定义应用中的各个片段。我们来看看它是如何实现这些功能的。一.Main方法在哪里如果你是从Java或者Python编程语言转过来的，那么你可能很想知道AngularJS里面的main方法在哪里？这个把所
[Maven学习笔记七]Maven插件和目标 bit1129 maven插件
插件(plugin)和目标(goal) Maven，就其本质而言，是一个插件执行框架，Maven的每个目标的执行逻辑都是由插件来完成的，一个插件可以有1个或者几个目标，比如maven-compiler-plugin插件包含compile和testCompile，即maven-compiler-plugin提供了源代码编译和测试源代码编译的两个目标使用插件和目标使得我们可以干预
【Hadoop八】Yarn的资源调度策略 bit1129 hadoop
1. Hadoop的三种调度策略 Hadoop提供了3中作业调用的策略， FIFO Scheduler Fair Scheduler Capacity Scheduler 以上三种调度算法，在Hadoop MR1中就引入了，在Yarn中对它们进行了改进和完善.Fair和Capacity Scheduler用于多用户共享的资源调度 2. 多用户资源共享的调度
Nginx使用Linux内存加速静态文件访问 ronin47
Nginx是一个非常出色的静态资源web服务器。如果你嫌它还不够快，可以把放在磁盘中的文件，映射到内存中，减少高并发下的磁盘IO。先做几个假设。nginx.conf中所配置站点的路径是/home/wwwroot/res，站点所对应文件原始存储路径：/opt/web/res shell脚本非常简单，思路就是拷贝资源文件到内存中，然后在把网站的静态文件链接指向到内存中即可。具体如下：
关于Unity3D中的Shader的知识 brotherlamp unity unity资料 unity教程 unity视频 unity自学
首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，然后我们来看下Unity3D自带的60多个S
CopyOnWriteArrayList vs ArrayList bylijinnan java
package com.ljn.base; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import java.util.concurrent.CopyOnWriteArrayList; /** * 总述： * 1.ArrayListi不是线程安全的，CopyO
内存中栈和堆的区别 chicony 内存
1、内存分配方面：堆：一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式是类似于链表。可能用到的关键字如下：new、malloc、delete、free等等。栈：由编译器(Compiler)自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中
回答一位网友对Scala的提问 chenchao051 scala map
本来准备在私信里直接回复了，但是发现不太方便，就简要回答在这里。问题写道对于scala的简洁十分佩服，但又觉得比较晦涩，例如一例，Map("a" -> List(11,111)).flatMap(_._2)，可否说下最后那个函数做了什么，真正在开发的时候也会如此简洁？谢谢先回答一点，在实际使用中，Scala毫无疑问就是这么简单。
mysql 取每组前几条记录 daizj mysql 分组最大值最小值每组三条记录
一、对分组的记录取前N条记录：例如：取每组的前3条最大的记录 1.用子查询： SELECT * FROM tableName a WHERE 3> (SELECT COUNT(*) FROM tableName b WHERE b.id=a.id AND b.cnt>a. cnt) ORDER BY a.id,a.account DE
HTTP深入浅出 http请求 dcj3sjt126com http
HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP，使HTTP客户（如Web浏览器）能够从HTTP服务器(Web服务器)请求信息和服务，HTTP目前协议的版本是1.1.HTTP是一种无状态的协议，无状态是指Web浏览器和Web服务器之间不需要建立持久的连接，这意味着当一个客户端向服务器端发出请求，然后We
判断MySQL记录是否存在方法比较 dcj3sjt126com mysql
把数据写入到数据库的时，常常会碰到先要检测要插入的记录是否存在，然后决定是否要写入。　　我这里总结了判断记录是否存在的常用方法：　　sql语句： select count ( * ) from tablename; 　　然后读取count(*)的值判断记录是否存在。对于这种方法性能上有些浪费，我们只是想判断记录记录是否存在，没有必要全部都查出来。
对HTML XML的一点认识 e200702084 html xml
感谢http://www.w3school.com.cn提供的资料 HTML 文档中的每个成分都是一个节点。节点根据 DOM，HTML 文档中的每个成分都是一个节点。 DOM 是这样规定的：整个文档是一个文档节点每个 HTML 标签是一个元素节点包含在 HTML 元素中的文本是文本节点每一个 HTML 属性是一个属性节点注释属于注释节点 Node 层次
jquery分页插件 genaiwei jquery Web 前端分页插件
//jquery页码控件// 创建一个闭包 (function($) { // 插件的定义 $.fn.pageTool = function(options) { var totalPa
Mybatis与Ibatis对照入门于学习 Josh_Persistence mybatis ibatis 区别联系
一、为什么使用IBatis/Mybatis 对于从事 Java EE 的开发人员来说，iBatis 是一个再熟悉不过的持久层框架了，在 Hibernate、JPA 这样的一站式对象 / 关系映射（O/R Mapping）解决方案盛行之前，iBaits 基本是持久层框架的不二选择。即使在持久层框架层出不穷的今天，iBatis 凭借着易学易用、
C中怎样合理决定使用那种整数类型？秋风扫落叶 c 数据类型
如果需要大数值(大于32767或小于32767), 使用long 型。否则, 如果空间很重要 (如有大数组或很多结构), 使用 short 型。除此之外, 就使用 int 型。如果严格定义的溢出特征很重要而负值无关紧要, 或者你希望在操作二进制位和字节时避免符号扩展的问题, 请使用对应的无符号类型。但是, 要注意在表达式中混用有符号和无符号值的情况。 &nbs
maven问题 zhb8015 maven问题
问题1： Eclipse 中新建maven项目无法添加src/main/java 问题 eclipse创建maevn web项目，在选择maven_archetype_web原型后，默认只有src/main/resources这个Source Floder。按照maven目录结构，添加src/main/ja
(二)androidpn-server tomcat版源码解析之--push消息处理 spjich java androdipn 推送
在 (一)androidpn-server tomcat版源码解析之--项目启动这篇中，已经描述了整个推送服务器的启动过程，并且把握到了消息的入口即XmppIoHandler这个类，今天我将继续往下分析下面的核心代码，主要分为3大块，链接创建，消息的发送，链接关闭。先贴一段XmppIoHandler的部分代码 /** * Invoked from an I/O proc
用js中的formData类型解决ajax提交表单时文件不能被serialize方法序列化的问题中华好儿孙 JavaScript Ajax Web 上传文件 FormData
var formData = new FormData($("#inputFileForm")[0]); $.ajax({ type:'post', url:webRoot+"/electronicContractUrl/webapp/uploadfile", data:formData, async: false, ca
mybatis常用jdbcType数据类型 ysj5125094 mybatis mapper jdbcType
MyBatis 通过包含的jdbcType 类型 BIT FLOAT CHAR