临风而眠

[开源项目推荐]privateGPT使用体验和修改

文章目录

一.跑通简述
二.解读ingest.py
- 1.导入库和读取环境变量
- 2.文档加载
- 3.文档处理（调用文件加载函数和文本分割函数）
三.injest.py效果演示
- 1.main函数解读
- 2.测试
四.修改代码，使之适配多知识库需求
- 1.修改配置文件：constants.py
- 2.设置.env文件
- 3.知识库选择函数
- 4.修改main函数
- 5.效果演示

一.跑通简述

链接如下：https://github.com/imartinez/privateGPT/tree/main
一开始是看到了gpt4all这个开源模型（苦于没有算力，据说这个能在低配置电脑上跑，就去看了），然后发现privateGPT这个开源项目，然后试了，果真能跑起来
跟着项目中的readme来做即可

在CLI中输入问题，会显示答案和答案来源
其中遇到的一些问题
- 要把gpt4all下载下来，放到models路径下（也可以自己指定，和.env文件里面写的MODEL_PATH一致即可)
在使用ingest.py将本地知识库导入向量数据库的时候
使用了langchain的HuggingFaceEmbeddings，也是可以在.env文件指定embedding模型，如果没有提前预下载好的话，那么会在运行程序的时候自动下载

如果遇到和我一样下载失败的情况
可以参考这篇博客，或者使用如下指令

$baseUri = "https://huggingface.co/sentence-transformers/all-MiniLM-L6-v2/resolve/main/"
$outDir = "/data/pretrained_model/all-MiniLM-L6-v2/"
$files = @("pytorch_model.bin", "data_config.json", "config_sentence_transformers.json", "modules.json", "sentence_bert_config.json", "special_tokens_map.json", "tokenizer.json", "tokenizer_config.json", "train_script.py", "vocab.txt")

foreach ($file in $files) {
    $url = $baseUri + $file
    $outFile = $outDir + $file
    Invoke-WebRequest -Uri $url -OutFile $outFile
    Write-Host "Downloaded $file"
}

然后就会下载到命令里面指定的路径了

二.解读ingest.py

1.导入库和读取环境变量

import os
import glob
from typing import List
from dotenv import load_dotenv
from multiprocessing import Pool
from tqdm import tqdm

from langchain.document_loaders import (
    CSVLoader,
    EverNoteLoader,
    PyMuPDFLoader,
    TextLoader,
    UnstructuredEmailLoader,
    UnstructuredEPubLoader,
    UnstructuredHTMLLoader,
    UnstructuredMarkdownLoader,
    UnstructuredODTLoader,
    UnstructuredPowerPointLoader,
    UnstructuredWordDocumentLoader,
)

from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.vectorstores import Chroma
from langchain.embeddings import HuggingFaceEmbeddings
from langchain.docstore.document import Document
from constants import CHROMA_SETTINGS


load_dotenv()


# Load environment variables
persist_directory = os.environ.get('PERSIST_DIRECTORY')
source_directory = os.environ.get('SOURCE_DIRECTORY', 'source_documents')
embeddings_model_name = os.environ.get('EMBEDDINGS_MODEL_NAME')
chunk_size = 500
chunk_overlap = 50

其中load_dotenv()挺常用的，用于从.env文件中读取环境变量
tqdm用于后面load文件的时候能看到进度条
chunk_size和chunk_overlap

这有个关于这两个参数的解读博客写的挺好
- chunk_size：这个参数表示文本分割的滑窗长度。它决定了每个分割后的文本块的大小。较大的 chunk_size 值会导致更大的文本块，而较小的值会导致更小的文本块。通常，较大的文本块可以提供更多的上下文信息，但也会增加模型的计算成本和内存需求。
- chunk_overlap：这个参数表示重叠滑窗的长度。它决定了每个分割后的文本块之间的重叠部分。重叠滑窗可以提供文本块之间的上下文关联，使得模型能够更好地理解整个文本。较大的 chunk_overlap 值会导致更多的上下文关联，但也会增加计算成本。
  
  (现在langchain官网支持对文档进行问答了）
persist_directory: 从环境中获取持久化目录的路径。
source_directory: 从环境中获取源文件目录的路径，如果没有设置则默认为 source_documents。

2.文档加载

langchain有超级强大且全面的各类文档加载器：https://python.langchain.com/docs/integrations/document_loaders
发现一篇很不错的博客：https://blog.csdn.net/weixin_42608414/article/details/131760937

这篇博客也很清楚地介绍了chunk_size和chunk_overlap，这篇博客介绍了使用LangChain框架进行文档加载和切割的方法。还介绍了CharacterTextSplitter和RecursiveCharacterTextSplitter的区别

其中那个MyElmLoader就是继承了Langchain的邮件加载器，改了一些东西
单个文档加载函数：load_single_document
- 参数：这个函数接受一个file_path参数，它是要加载文档的文件路径。
- 功能：
  - 从文件路径中获取文件扩展名。
  - 检查该扩展名是否存在于之前定义的LOADER_MAPPING字典中。
    - 如果存在，使用相应的加载器和参数从文件路径加载文档。
    - 如果不支持文件扩展名，抛出一个ValueError。
- 返回值：返回一个文档列表
文档加载函数：load_documents
- 参数：
  - source_dir：来源目录的路径，其中包含要加载的所有文档。
  - ignored_files：一个默认为空的文件路径列表，指定哪些文件应该被忽略。
- 功能：
  - 为所有在LOADER_MAPPING中定义的文件扩展名获取文件路径。
  - 使用glob模块的glob.glob函数，为每个扩展名获取文件路径，并将结果存储在all_files列表中。
  - 过滤掉ignored_files中的文件路径，得到filtered_files。
  - 使用多进程并行加载每个文件，使用系统的CPU核数作为进程数。为了提高效率，文件是无序加载的。
  - 使用pool.imap_unordered并行地调用load_single_document函数加载每个文件。
  - 使用tqdm显示加载进度。
  - 将从每个文件加载的所有文档扩展到结果列表中。
- 返回值：这个函数返回所有加载的文档的列表。

glob.glob 用于查找匹配特定模式的文件路径。在这个函数中，我们使用 ** 来匹配任意深度的子目录，* 来匹配任意字符，ext 来匹配特定的文件扩展名。os.path.join 函数用于将目录路径和文件名组合成完整的文件路径。recursive=True 参数用于递归地查找子目录中的文件。最终，glob.glob 返回一个包含所有匹配文件路径的列表。
extend 是 Python 中的一个列表方法，用于将一个列表中的所有元素添加到另一个列表中。在这个函数中，all_files 是一个空列表，glob.glob 返回一个包含所有匹配文件路径的列表，extend 方法将这个列表中的所有元素添加到 all_files 列表中。这样，all_files 列表就包含了所有匹配文件的路径。
Pool 是 Python 中的一个类，它提供了一种简单的方式来并行处理大量的任务。它可以创建多个进程来执行函数，并将结果收集到一个列表中。在这个函数中， Pool 类用于异步地加载文档，以加快加载速度。processes 参数用于指定要创建的进程数，这里使用 os.cpu_count() 函数来获取系统上的 CPU 数量。imap_unordered 方法用于异步地加载每个文档，load_single_document 函数被应用于 filtered_files 列表中的每个文件路径。imap_unordered 方法返回一个迭代器，它可以用于获取每个文档的结果。
imap_unordered 是 multiprocessing.Pool 类中的一个方法，用于异步地将一个可迭代对象中的元素应用于一个函数。它返回一个迭代器，可以用于获取函数的结果。与 imap 方法不同，imap_unordered 方法不保证返回结果的顺序与输入顺序相同。这个函数中，imap_unordered 方法用于异步地加载每个文档，以加快加载速度。load_single_document 函数被应用于 filtered_files 列表中的每个文件路径。imap_unordered 方法返回一个迭代器，它可以用于获取每个文档的结果。

3.文档处理（调用文件加载函数和文本分割函数）

process_documents函数加载并处理文档，返回分割后的文本块。而does_vectorstore_exist函数则检查指定的目录中是否存在有效的向量存储。

处理文档的函数: process_documents

功能：这个函数的主要任务是从指定的source_directory加载文档，然后将这些文档分割成较小的文本块。
- 参数：
  - ignored_files：默认为空的文件路径列表，这些文件在加载时会被忽略。
- 步骤：
  1. 输出一个信息，提示从source_directory开始加载文档。
  2. 调用load_documents函数来从source_directory加载文档，并同时考虑需要忽略的文件。
  3. 如果没有加载到任何新文档，它将输出提示信息并终止程序。
  4. 输出已加载的新文档的数量。
  5. 创建一个RecursiveCharacterTextSplitter对象，该对象负责将文档分割成较小的文本块。这里使用了之前定义的chunk_size和chunk_overlap作为参数。
  6. 使用text_splitter的split_documents方法将所有文档分割成文本块。
  7. 输出文本块的数量以及每个块的最大标记数量。
- 返回值：函数返回分割后的文本块。
检查向量存储是否存在的函数: does_vectorstore_exist

功能：这个函数检查指定目录下是否存在一个有效的向量存储。

参数：
- persist_directory：一个字符串，表示向量存储可能存在的目录路径。
步骤：
1. 检查persist_directory下是否存在名为index的子目录。
2. 检查是否存在文件chroma-collections.parquet和chroma-embeddings.parquet。
3. 获取index目录下所有的.bin和.pkl文件。
4. 如果这些文件的数量超过3个，那么假定该向量存储是有效的。
返回值：如果向量存储存在并且被认为是有效的，则返回True。否则，返回False。

三.injest.py效果演示

1.main函数解读

def main():
    # Create embeddings
    # 创建嵌入
    embeddings = HuggingFaceEmbeddings(model_name=embeddings_model_name)
    # 如果vectorstore存在
    if does_vectorstore_exist(persist_directory):
        # Update and store locally vectorstore
        print(f"Appending to existing vectorstore at {persist_directory}")
        
        db = Chroma(persist_directory=persist_directory, embedding_function=embeddings, client_settings=CHROMA_SETTINGS)
        collection = db.get() # get是获取vectorstore
        texts = process_documents([metadata['source'] for metadata in collection['metadatas']])
        print(f"Creating embeddings. May take some minutes...")
        db.add_documents(texts)
    else:
        # 创建并存储本地vectorstore
        print("Creating new vectorstore")
        texts = process_documents()
        print(f"Creating embeddings. May take some minutes...")
        db = Chroma.from_documents(texts, embeddings, persist_directory=persist_directory, client_settings=CHROMA_SETTINGS)
    db.persist()
    db = None

    print(f"Ingestion complete! You can now query your documents")

创建嵌入：
使用HuggingFaceEmbeddings类创建一个嵌入对象，其中的模型名称由embeddings_model_name提供。
检查向量存储是否存在：
使用does_vectorstore_exist函数检查在persist_directory中是否已存在向量存储。
- 如果向量存储存在：输出信息，表示将文档添加到现有的向量存储。
  - 创建一个Chroma对象，用于处理向量存储，这需要向量存储的路径、嵌入函数以及客户端设置。
    
    其中的chroma的配置写在constants.py里面
  - 获取向量存储中的当前文档集合。
    调用process_documents函数处理那些之前尚未被加入到向量存储中的新文档。
    输出信息，告知用户正在创建嵌入，这可能需要一些时间。
    使用db.add_documents将处理后的文本块添加到向量存储。
- 如果向量存储不存在：
  - 输出信息，表示正在创建新的向量存储。
    调用process_documents函数处理所有的文档。
  - 输出信息，告知用户正在创建嵌入。
    使用Chroma.from_documents从处理后的文本块创建新的向量存储。
持久化向量存储：

调用db.persist方法将向量存储的更改保存到磁盘。

2.测试

四.修改代码，使之适配多知识库需求

目标是可以设置不同的知识库

比如：我的本地知识库集合是一个大文件夹source，里面有小文件a,b,c分别存着不同类型的本地知识文件，然后我想运行ingest.py的时候，选择不同的路径，然后处理对应的本地知识文件，存到对应的VectorStore_of_source里面，里面分别对应a,b,c的向量数据库

1.修改配置文件：constants.py

首先，我们需要一个constants.py文件来存储基本的配置设置。


import os
from dotenv import load_dotenv
from chromadb.config import Settings

load_dotenv()

# 分别对应我上面说的VectorStore_of_source和source
BASE_VECTORSTORE_DIRECTORY = os.environ.get('VECTORSTORE_BASE')
BASE_SOURCE_DIRECTORY = os.environ.get('SOURCE_BASE')

# 分别对应我刚刚说的两个路径下的a,b,c
PERSIST_SUBDIRECTORIES = os.environ.get('PERSIST_DIRECTORIES').split(',')
SOURCE_SUBDIRECTORIES = os.environ.get('SOURCE_DIRECTORIES').split(',')

# 路径合并
PERSIST_DIRECTORIES = [os.path.join(BASE_VECTORSTORE_DIRECTORY, sub_dir) for sub_dir in PERSIST_SUBDIRECTORIES]
SOURCE_DIRECTORIES = [os.path.join(BASE_SOURCE_DIRECTORY, sub_dir) for sub_dir in SOURCE_SUBDIRECTORIES]

# 每个路径都有自己的Chroma设置
CHROMA_SETTINGS_LIST = [
    Settings(
        chroma_db_impl='duckdb+parquet',
        persist_directory=dir_path,
        anonymized_telemetry=False
    )
    for dir_path in PERSIST_DIRECTORIES
]

2.设置.env文件

创建一个名为.env的文件，并定义以下变量：

还是对应我刚刚说的那几个，知识源的Base(大目录)，具体的小目录a,b,c(SOURCE_DIRECTORIES)
向量数据库的Base和下面的a,b,c（PERSIST_DIRECTORIES)

3.知识库选择函数

首先，我们创建一个函数来供用户选择知识库：python

def choose_directory():
    directories = ["a", "b", "c", "d"]
    
    print("Choose a persist directory:")
    for idx, d in enumerate(directories, 1):
        print(f"{idx}. {d}")

    choice = int(input("Enter the number: ")) - 1
    chosen_directory = directories[choice]
    
    persist_directory = os.path.join(PERSIST_DIRECTORY_BASE, chosen_directory)
    source_directory = os.path.join('source_base_directory', chosen_directory)  # Replace 'source_base_directory' with your actual path
    
    return persist_directory, source_directory, CHROMA_SETTINGS

可以调用上面的choose_directory函数来获取chosen_persist_directory和chosen_source_directory。这些值随后在main函数中使用。

4.修改main函数

现在，可以在main函数中调用choose_directory来选择存储和源目录，并基于选择的目录对文档进行处理。

def main():
    chosen_persist_directory, chosen_source_directory, chosen_chroma_settings = choose_directory()

然后把原先的该替换的都用chosen后的变量替换掉

def main():
    chosen_persist_directory, chosen_source_directory, chosen_chroma_settings = choose_directory()

    # Create embeddings
    embeddings = HuggingFaceEmbeddings(model_name=embeddings_model_name)

    if does_vectorstore_exist(chosen_persist_directory):
        # Update and store locally vectorstore
        print(f"Appending to existing vectorstore at {chosen_persist_directory}")

        db = Chroma(persist_directory=chosen_persist_directory, embedding_function=embeddings, client_settings=chosen_chroma_settings)
        collection = db.get()
        texts = process_documents(chosen_source_directory, [metadata['source'] for metadata in collection['metadatas']])
        print(f"Creating embeddings. May take some minutes...")
        db.add_documents(texts)
    else:
        # Create and store locally vectorstore
        print("Creating new vectorstore")
        texts = process_documents(chosen_source_directory)
        print(f"Creating embeddings. May take some minutes...")
        db = Chroma.from_documents(texts, embeddings, persist_directory=chosen_persist_directory, client_settings=chosen_chroma_settings)

    db.persist()
    db = None

    print(f"Ingestion complete!")

5.效果演示

从阅读空间到知识孵化器，AI时代智慧图书馆何为？技能咖生成式人工智能认证 GAI认证人工智能
在人工智能（AI）浪潮席卷全球的当下，图书馆作为知识传播与文化传承的重要场所，正面临着前所未有的变革。从传统的阅读空间到如今的知识孵化器，智慧图书馆在AI时代肩负着新的使命与挑战。本文将探讨智慧图书馆在AI时代的发展方向，并引入生成式人工智能认证（GAI）认证，为图书馆从业者的技能提升提供新思路。AI时代智慧图书馆的新角色知识资源整合与挖掘者在AI时代，信息爆炸式增长，图书馆不再仅仅是纸质书籍的收
蓝桥杯备赛（7）：ST表神里流~霜灭蓝桥备赛蓝桥杯贪心算法 c++c语言数据结构动态规划
RMQ问题RMQ问题是针对于数组，每次给一个区间[l,r]，要求返回区间内的最大值或最小值（的下标），也就是说，RMQ问题就是求区间最值的问题。对于RMQ问题，容易想到一种O(n)的方法，就是用i直接遍历[l,r]区间，不断比较a[i]与max的大小关系，然后不断更新max，最后得出的就是最大值。但是，我们可以利用倍增和动态规划的思想，利用“ST表”这个数据结构来帮助解决。ST表ST表是一种可以“
Goroutine 与 Channel 九班长 Golang 算法数据库网络 golang Goroutine Channel
Goroutine和Channel是Go语言并发编程的核心概念。理解它们的原理和使用方法，对于编写高效、安全的并发程序至关重要。以下是对Goroutine和Channel的深入解析，包括它们的原理、使用场景、常见问题及最佳实践。1.Goroutine1.1什么是Goroutine？Goroutine是Go语言中的轻量级线程，由Go运行时（runtime）管理。与操作系统线程相比，Goroutine
3.22刷题山遥路源算法刷题 c++
B3763[语言月赛202305]团体程序设计天梯赛-洛谷#includeusingnamespacestd;intmain(){intx,jichu=0,jinjie=0,dingbu=0;for(inti=0;i>x;jichu+=x;}if(jichu>=80){for(inti=0;i>x;jinjie+=x;}if(jinjie>=40){for(inti=0;i>x;dingbu+=x
（一）stm32F411RE点亮板上LED——基于HAL库（微控第一周MCU验收） yxt230791 stm32 嵌入式硬件单片机
近期有点懒，还是先直接上链接通过网盘分享的文件：led.rar链接:https://pan.baidu.com/s/1GUI7wd9dtNwqPhpS9GfLag提取码:XDer--来自百度网盘超级会员v2的分享
FFmpeg 命令行全解析：高效音视频处理从入门到精通码流怪侠 ffmpeg 音视频 ffplay ffprobe 实时音视频视频编解码直播转码
FFmpegFFmpeg是一款开源的多媒体处理工具集，支持音视频编解码、格式转换、流媒体处理等全链路操作。核心功能与工具:多媒体全链路支持支持1000+音视频编解码格式（如H.264、HEVC、AV1）和协议（RTMP、RTSP、HLS），覆盖录制、转码、流化等全流程。提供三大核心工具：ffmpeg：转码与流处理（如ffmpeg-iinput.mp4output.avi）。ffplay：媒体播放（
常见的数据库操作语言DDL、DML、DQL和DCL 失败尽是常态Z MySQL基础学习数据库 sql mysql
DDL、DML、DQL和DCL是常见的数据库操作语言，分别代表数据定义语言、数据操纵语言、数据查询语言和数据控制语言。1、数据定义语言（DDL）用于在数据库中创建、修改或删除表、视图、索引、序列等对象。常见的DDL命令有CREATE、ALTER和DROP等。2、数据操纵语言（DML）用于在数据库中对表进行插入、更新、删除等操作。常见的DML命令有INSERT、UPDATE和DELETE等。3、数据
Python中的机制：全局解释锁和回收机制林十一npc Python语言 python 开发语言
Python中的机制：全局解释锁和回收机制一、全局解释锁GIL1.基础原理全局解释锁：是CPython中引入的一种机制，确保同一时刻保持一个线程执行Python的字节码。锁的粒度：GIL是全局唯一的锁，线程在执行Pyhton代码前必须要获取GIL,执行完毕后进行释放。线程切换：CPython解释器通过固定间隔（如python字节码指令或遇到I/O操作），释放GIL,触发线程切换。底层实现GIL的实
单例模式中的饿汉和懒汉模式筑梦小子单例模式 java c++
目录一.什么是单例模式一.饿汉模式1.饿汉模式的概念2.饿汉模式代码2.多线程是否线程安全二.懒汉模式1.懒汉模式的概念2.单线程情况下的懒汉模式2.多线程情况下的懒汉模式（1）导致懒汉模式在多线程情况下的不安全原因（2）解决方法代码示例版本1版本2版本2的解释说明一.什么是单例模式保证某个类在程序中只存在一份实例，而不会创建多个实例，这样就会提高效率。在单利模式中一般只提供一个getInstan
一篇文章，彻底理解数据库操作语言：DDL、DML、DCL、TCL Java布道者 oracle 数据库 sql
最近与开发和运维讨论数据库账号及赋权问题时，发现大家对DDL和DML两个概念并不了解。于是写一篇文章，系统的整理一下在数据库领域中的DDL、DML、DQL、DCL的使用及区别。通常，数据库SQL语言共分为四大类：数据定义语言DDL，数据操作语言DML，数据查询语言DQL，数据控制语言DCL。再加上事务控制语言TCL，一个共5个。下面，我们就详细了解一下它们。数据定义语言DDLDDL（DataDef
大模型的应用与微调：如何调用 LLM？从 OpenAI API 到本地部署晴天彩虹雨 AI 大模型 ai 语言模型 gpt 人工智能
本篇文章将详细介绍如何调用大语言模型（LLM），涵盖OpenAIAPI、DeepSeek、Manus、通义千问等模型的调用方式，并探讨如何在本地部署LLM进行推理。1.调用OpenAIAPI（GPT系列）OpenAI提供了RESTfulAPI供开发者调用GPT系列模型。示例：使用Python调用OpenAIAPIimportopenaiopenai.api_key="your_api_key"re
MySQL中处理JSON数据小村学长毕业设计 mysql json 数据库
MySQL中处理JSON数据已成为大数据分析领域的一个新方向，这一功能自MySQL5.7版本引入以来，为数据库管理系统在处理非结构化数据方面提供了强大的支持。以下是对MySQL中处理JSON数据的详细探讨，包括其引入的背景、特性、函数与操作符、性能优化以及在大数据分析中的应用等方面。一、JSON数据类型引入的背景随着大数据技术的迅猛发展和普及，数据量的爆炸性增长对数据处理能力提出了前所未有的挑战。
SpringCloud-使用FFmpeg对视频压缩处理 rgrgrwfe 面试学习路线阿里巴巴 spring cloud ffmpeg spring
在现代的视频处理系统中，压缩视频以减小存储空间、加快传输速度是一项非常重要的任务。FFmpeg作为一个强大的开源工具，广泛应用于音视频的处理，包括视频的压缩和格式转换等。本文将通过Java代码示例，向您展示如何使用FFmpeg进行视频压缩，并介绍相关参数的设置。一、FFmpeg简介FFmpeg是一个可以用来录制、转换和流传输音视频的开源工具。它支持几乎所有的音视频格式，并提供了非常强大的编码、解码
idear 出现unable to save setting:failed to save settings.please restart intellij idea异常不开心就吐槽 intellij-idea
1.idea出现一下异常unabletosavesetting:failedtosavesettings.pleaserestartintellijidea2.解决办法先关闭IDEA，然后找到C:\Users\wuxin.IntelliJIdea2019.3\system\caches（管理员目录中的位置），删除caches目录中所有的文件（不要删除caches目录），再启动IDEA就可以了。3.
Oracle不支持的字符集 (在类路径中添加 orai18n.jar): ZHS16GBK 不开心就吐槽 oracle jar java
1.报错内容出现java.sql.SQLException:不支持的字符集(在类路径中添加orai18n.jar):ZHS16GBKExceptioninthread"main"java.sql.SQLException:不支持的字符集(在类路径中添加orai18n.jar):ZHS16GBKatoracle.sql.CharacterSetUnknown.failCharsetUnknown(C
跨平台RTSP高性能实时播放器实现思路江同学_ 音视频实时音视频
跨平台RTSP高性能实时播放器实现思路目标：局域网100ms以内超低延迟一、引言现有播放器（如VLC）在RTSP实时播放场景中面临高延迟（通常数秒）和资源占用大的问题。本文提出一种跨平台解决方案，通过网络层改造、FFmpeg硬解码优化、OpenGL跨平台渲染等技术，实现100ms以内延迟，并支持H.264/H.265编码，适用于医疗、安防等对实时性要求苛刻的场景。二、网络层优化：TCP/UDP双模
U盘插上却没权限？一招教你秒解信创系统读写难题！鹏大圣运维 linux 统信 UOS linux 网络 facl Linux 统信UOS 麒麟KOS 国产操作系统
原文链接：U盘插上却没权限？一招教你秒解信创系统读写难题！Hello，大家好啊！今天给大家带来一篇信创终端操作系统插入U盘显示没有权限无法进行读写操作的处理方法的文章。在日常使用中，很多朋友在信创环境（如统信UOS、银河麒麟等）下插入U盘时，会出现“没有权限”“无法访问”等问题，导致无法读写U盘内容，影响办公效率。本文将分享一种适用于因facl（文件访问控制列表）配置导致权限受限的解决方案，帮助大
Chapter 27: Expression Templates_《C++ Templates》notes 郭涤生 c/c++c++开发语言笔记
ExpressionTemplatesKeyConcepts:Part1:CoreConcepts&CodeImplementationPart2:AdvancedConcepts&ExtensionsPart3:OptimizationAnalysisMultipleChoiceQuestions(HardDifficulty)DetailedDesignQuestionsAnswers&Exp
内部类（四大类型） *+ java 开发语言
内部类分为四种一.实例内部类classOutclass{publicintdate1=1;publicstaticintdate2=2;privateintdate3=3;classInnerClass{publicintdate4=4;publicstaticfinalintdate5=5;privateintdate6=6;publicvoidtest(){System.out.println
基于人工智能的扫阅卷和数据分析服务需求文档 YiWait 人工智能人工智能数据分析数据挖掘
基于人工智能的扫阅卷和数据分析服务需求文档一、项目背景在教育领域，传统的人工阅卷方式效率低下、主观性强且易出错，难以满足大规模考试及频繁测评的需求。随着人工智能技术的飞速发展，基于人工智能的扫阅卷和数据分析服务应运而生。该服务利用先进的图像识别、自然语言处理等技术，实现试卷扫描、自动阅卷、成绩统计以及深度数据分析，为教育机构、学校提供高效、准确、全面的测评解决方案，助力教学质量提升和教育决策优化。
Java实现生日悖论的算法，计算至少有两个人生日相同的概率 YiWait java 算法
importjava.util.Random;publicclassBirthdayParadox{publicstaticvoidmain(String[]args){intn=23;//邀请的人数inttrials=1000000;//实验次数intcount=0;//至少有两个人生日相同的实验次数Randomrand=newRandom();for(inti=0;i
JVM 类加载详解飞滕人生TYF java jvm java 类加载
JVM类加载详解JVM类加载（JavaClassLoading）是Java虚拟机(JVM)执行Java程序的重要机制之一，用于将.class文件动态加载到内存中并进行验证、解析和初始化，最终生成可以直接使用的类对象。1.类加载的基本概念1.1什么是类加载？类加载是将.class文件加载到JVM并转化为内存中可以运行的类的过程。目标：生成一个内存中的Class对象，供程序使用。触发点：当程序首次访问
SQLServer : DDL,DML,DQL,DCL的区别 SJ15630070060 Sql Server sqlserver 数据库
01、DDL（DataDefinitionLanguages）语句：即数据库定义语句，用来创建数据库中的表、索引、视图、存储过程、触发器等对象。SQLServerDLL语法是指SQLServer数据库定义域发的语法规则集合，主要包括创建、修改和删除数据库对象的语句。常用的语句关键字有：【createtable创建表】、【altertable修改表】、【droptable删除表】、【truncate
PakePlus：Vue 和 React 跨平台桌面应用程序的新纪元大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 前端 react.js javascript 架构 vue.js
摘要随着Vue和React等JavaScript框架的兴起，构建Web应用程序变得越来越高效和模块化。然而，将这些应用程序部署到桌面环境中一直是一个具有挑战性的问题，通常需要专门的工具和复杂的配置。PakePlus作为一个变革性的解决方案，弥合了Web开发和桌面应用程序部署之间的鸿沟。本文探讨了PakePlus如何简化将Vue和React项目打包为跨平台桌面应用程序的过程，推动了现代软件开发的边界
数据库开发必备：深入理解DDL、DML、DQL和DCL 平凡程序猿~ 数据库数据库开发 oracle 数据库
文章目录一、数据库操作分类概述1.DDL（数据定义语言）2.DML（数据操作语言）3.DQL（数据查询语言）4.DCL（数据控制语言）二、DDL：数据定义语言1.DDL-数据库操作2.DDL-表操作三、DML：数据操作语言1.DML-添加数据2.DML-修改数据3.DML-删除数据四、DQL：数据查询语言1.DQL-基本查询2.DQL-条件查询3.DQL-聚合函数4.DQL-分组查询5.DQL-排
微信小程序和uni-app的区别 cccv工程师微信小程序 uni-app notepad++
开发语言和框架：Uni-app：Uni-app使用Vue.js框架进行开发，利用Vue的语法和生命周期函数，开发者可以使用熟悉的前端技术栈。微信小程序：微信小程序使用自己的框架，基于WXML（类似于HTML）和WXSS（样式语言）进行开发，需要学习微信小程序独有的语法和组件。平台支持：Uni-app：Uni-app是一个跨平台开发框架，可以将一套代码编译成多个平台的应用，包括微信小程序、H5、Ap
吊打面试官之 HTTP 协议的前世今生 ~Maple~ 计算机网络 http 网络协议网络
1、HTTP的基本概念HTTP是超文本传输协议（HyperTextTransferProtocol），下面具体解释一下：协议：HTTP是一个用在计算机世界里的协议，它使用计算机能够理解的语言确立了一种计算机之间交流通信的方式（两个及以上的参与者），以及相关的各种控制和错误处理方式（行为约定和规范）。传输：HTTP是一个双向协议，比如A浏览器访问B服务器，使用HTTP协议来通信，数据就在A和B之间传
AI程序员大逃杀：从“码农”到“魔法师”的奇幻漂流 ——揭秘人工智能如何重塑程序员工作流 lifire_H 人工智能
当程序员遇上AI，是“饭碗不保”还是“原地飞升”？这场代码界的工业革命，正在让每个程序员经历从“流水线工人”到“科技魔法师”的奇幻蜕变。一、效率革命：当键盘遇上“读心术”1.需求分析：从“鸡同鸭讲”到“灵魂共鸣”还记得那些年被客户需求文档支配的恐惧吗？甲方爸爸一句“我想要五彩斑斓的黑”，就能让产品经理和程序员集体崩溃。现在，AI就像个自带翻译机的“需求捕手”——把客户支离破碎的诉求往WPSAI里一
啸叫抑制（AFS）从算法仿真到工程源码实现-第一节-效果演示 aflyingwolf_pomelo 语音信号处理算法人工智能
一、概述啸叫抑制算法也叫声反馈抑制，本专题我们讨论啸叫抑制算法的平台搭建，算法仿真和设备端的工程落地实现。完整记录一个扩声系统的搭建。更多资料和代码可以进入https://t.zsxq.com/qgmoN，同时欢迎大家提出宝贵的建议，以共同探讨学习。二、啸叫抑制算法视频演示啸叫抑制算法演示视频三、语谱图3.1产生啸叫效果3.2去啸叫后的效果四、总结这一节我们主要记录了啸叫抑制（去啸叫）算法的效果演
前端高级 CSS 用法实战指南 Real Man★ 前端 css
前端高级CSS用法实战指南CSS的高级用法能显著提升开发效率、优化页面性能并实现复杂的视觉效果。以下是现代CSS的核心高级技巧和实战案例，涵盖布局、动画、优化等方向：一、现代布局系统CSSGrid复杂布局场景：实现不规则网格（如杂志排版、仪表盘）。示例：定义网格模板与区域命名：css.container{display:grid;grid-template-columns:200px1fr300p
log4j对象改变日志级别 3213213333332132 java log4j level log4j对象名称日志级别
log4j对象改变日志级别可批量的改变所有级别，或是根据条件改变日志级别。 log4j配置文件： log4j.rootLogger=ERROR,FILE,CONSOLE,EXECPTION #log4j.appender.FILE=org.apache.log4j.RollingFileAppender log4j.appender.FILE=org.apache.l
elk+redis 搭建nginx日志分析平台 ronin47 elasticsearch kibana logstash
elk+redis 搭建nginx日志分析平台 logstash,elasticsearch,kibana 怎么进行nginx的日志分析呢？首先，架构方面，nginx是有日志文件的，它的每个请求的状态等都有日志文件进行记录。其次，需要有个队列，redis的l
Yii2设置时区 dcj3sjt126com PHP timezone yii2
时区这东西，在开发的时候，你说重要吧，也还好，毕竟没它也能正常运行，你说不重要吧，那就纠结了。特别是linux系统，都TMD差上几小时，你能不痛苦吗？win还好一点。有一些常规方法，是大家目前都在采用的1、php.ini中的设置，这个就不谈了，2、程序中公用文件里设置，date_default_timezone_set一下时区3、或者。。。自己写时间处理函数，在遇到时间的时候，用这个函数处理（比较
js实现前台动态添加文本框，后台获取文本框内容 171815164 文本框
<%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://w
持续集成工具 g21121 持续集成
持续集成是什么？我们为什么需要持续集成？持续集成带来的好处是什么？什么样的项目需要持续集成？... 持续集成(Continuous integration ,简称CI)，所谓集成可以理解为将互相依赖的工程或模块合并成一个能单独运行
数据结构哈希表(hash)总结永夜-极光数据结构
1.什么是hash 来源于百度百科: Hash，一般翻译做“散列”，也有直接音译为“哈希”的，就是把任意长度的输入，通过散列算法，变换成固定长度的输出，该输出就是散列值。这种转换是一种压缩映射，也就是，散列值的空间通常远小于输入的空间，不同的输入可能会散列成相同的输出，所以不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。
乱七八糟程序员是怎么炼成的
eclipse中的jvm字节码查看插件地址： http://andrei.gmxhome.de/eclipse/ 安装该地址的outline 插件后重启，打开window下的view下的bytecode视图 http://andrei.gmxhome.de/eclipse/ jvm博客： http://yunshen0909.iteye.com/blog/2
职场人伤害了“上司” 怎样弥补 aijuans 职场
由于工作中的失误，或者平时不注意自己的言行“伤害”、“得罪”了自己的上司，怎么办呢？　　在职业生涯中这种问题尽量不要发生。下面提供了一些解决问题的建议：　　一、利用一些轻松的场合表示对他的尊重　　即使是开明的上司也很注重自己的权威，都希望得到下属的尊重，所以当你与上司冲突后，最好让不愉快成为过去，你不妨在一些轻松的场合，比如会餐、联谊活动等，向上司问个好，敬下酒，表示你对对方的尊重，
深入浅出url编码 antonyup_2006 应用服务器浏览器 servlet weblogic IE
出处：http://blog.csdn.net/yzhz 杨争 http://blog.csdn.net/yzhz/archive/2007/07/03/1676796.aspx 一、问题：编码问题是JAVA初学者在web开发过程中经常会遇到问题，网上也有大量相关的
建表后创建表的约束关系和增加表的字段百合不是茶标的约束关系增加表的字段
下面所有的操作都是在表建立后操作的,主要目的就是熟悉sql的约束,约束语句的万能公式 1,增加字段(student表中增加姓名字段) alter table 增加字段的表名 add 增加的字段名增加字段的数据类型 alter table student add name varchar2(10); &nb
Uploadify 3.2 参数属性、事件、方法函数详解 bijian1013 JavaScript uploadify
一.属性属性名称默认值说明 auto true 设置为true当选择文件后就直接上传了，为false需要点击上传按钮才上传。 buttonClass ” 按钮样式 buttonCursor ‘hand’ 鼠标指针悬停在按钮上的样子 buttonImage null 浏览按钮的图片的路
精通Oracle10编程SQL(16)使用LOB对象 bijian1013 oracle 数据库 plsql
/* *使用LOB对象 */ --LOB(Large Object)是专门用于处理大对象的一种数据类型，其所存放的数据长度可以达到4G字节 --CLOB/NCLOB用于存储大批量字符数据，BLOB用于存储大批量二进制数据，而BFILE则存储着指向OS文件的指针 /* *综合实例 */ --建立表空间 --#指定区尺寸为128k,如不指定，区尺寸默认为64k CR
【Resin一】Resin服务器部署web应用 bit1129 resin
工作中，在Resin服务器上部署web应用，通常有如下三种方式：配置多个web-app 配置多个http id 为每个应用配置一个propeties、xml以及sh脚本文件配置多个web-app 在resin.xml中,可以为一个host配置多个web-app <cluster id="app&q
red5简介及基础知识白糖_ 基础
简介 Red5的主要功能和Macromedia公司的FMS类似，提供基于Flash的流媒体服务的一款基于Java的开源流媒体服务器。它由Java语言编写，使用RTMP作为流媒体传输协议，这与FMS完全兼容。它具有流化FLV、MP3文件，实时录制客户端流为FLV文件，共享对象，实时视频播放、Remoting等功能。用Red5替换FMS后,客户端不用更改可正
angular.fromJson boyitech AngularJS AngularJS 官方API AngularJS API
angular.fromJson 描述: 把Json字符串转为对象使用方法: angular.fromJson(json); 参数详解: Param Type Details json string JSON 字符串返回值: 对象, 数组, 字符串或者是一个数字示例: <!DOCTYPE HTML> <h
java-颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I bylijinnan java
public class ReverseWords { /** * 题目：颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I.词以空格分隔。 * 要求： * 1.实现速度最快,移动最少 * 2.不能使用String的方法如split,indexOf等等。 * 解答：两次翻转。 */ publ
web实时通讯 Chen.H Web 浏览器 socket 脚本
关于web实时通讯，做一些监控软件。由web服务器组件从消息服务器订阅实时数据，并建立消息服务器到所述web服务器之间的连接，web浏览器利用从所述web服务器下载到web页面的客户端代理与web服务器组件之间的socket连接，建立web浏览器与web服务器之间的持久连接；利用所述客户端代理与web浏览器页面之间的信息交互实现页面本地更新，建立一条从消息服务器到web浏览器页面之间的消息通路
[基因与生物]远古生物的基因可以嫁接到现代生物基因组中吗? comsci 生物
大家仅仅把我说的事情当作一个IT行业的笑话来听吧..没有其它更多的意思如果我们把大自然看成是一位伟大的程序员,专门为地球上的生态系统编制基因代码,并创造出各种不同的生物来,那么6500万年前的程序员开发的代码,是否兼容现代派的程序员的代码和架构呢?
oracle 外部表 daizj oracle 外部表 external tables
oracle外部表是只允许只读访问，不能进行DML操作，不能创建索引，可以对外部表进行的查询，连接，排序，创建视图和创建同义词操作。 you can select, join, or sort external table data. You can also create views and synonyms for external tables. Ho
aop相关的概念及配置 daysinsun AOP
切面(Aspect): 通常在目标方法执行前后需要执行的方法（如事务、日志、权限），这些方法我们封装到一个类里面，这个类就叫切面。连接点（joinpoint） spring里面的连接点指需要切入的方法，通常这个joinpoint可以作为一个参数传入到切面的方法里面（非常有用的一个东西）。通知（Advice）通知就是切面里面方法的具体实现，分为前置、后置、最终、异常环
初一上学期难记忆单词背诵第二课 dcj3sjt126com english word
middle 中间的，中级的 well 喔，那么；好吧 phone 电话，电话机 policeman 警察 ask 问 take 拿到；带到 address 地址 glad 高兴的，乐意的 why 为什么 China 中国 family 家庭 grandmother (外)祖母 grandfather (外)祖父 wife 妻子 husband 丈夫 da
Linux日志分析常用命令 dcj3sjt126com linux log
1.查看文件内容 cat -n 显示行号 2.分页显示 more Enter 显示下一行空格显示下一页 F 显示下一屏 B 显示上一屏 less /get 查询"get"字符串并高亮显示 3.显示文件尾 tail -f 不退出持续显示 -n 显示文件最后n行 4.显示头文件 head -n 显示文件开始n行 5.内容排序 sort -n 按照
JSONP 原理分析 fantasy2005 JavaScript jsonp jsonp 跨域
转自 http://www.nowamagic.net/librarys/veda/detail/224 JavaScript是一种在Web开发中经常使用的前端动态脚本技术。在JavaScript中，有一个很重要的安全性限制，被称为“Same-Origin Policy”（同源策略）。这一策略对于JavaScript代码能够访问的页面内容做了很重要的限制，即JavaScript只能访问与包含它的
使用connect by进行级联查询 234390216 oracle 查询父子 Connect by 级联
使用connect by进行级联查询 connect by可以用于级联查询，常用于对具有树状结构的记录查询某一节点的所有子孙节点或所有祖辈节点。来看一个示例，现假设我们拥有一个菜单表t_menu，其中只有三个字段：
一个不错的能将HTML表格导出为excel,pdf等的jquery插件 jackyrong jquery插件
发现一个老外写的不错的jquery插件，可以实现将HTML 表格导出为excel,pdf等格式，地址在： https://github.com/kayalshri/ 下面看个例子，实现导出表格到excel,pdf <html> <head> <title>Export html table to excel an
UI设计中我们为什么需要设计动效 lampcy UI UI设计
关于Unity3D中的Shader的知识首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，
如何禁止页面缓存 nannan408 html jsp cache
禁止页面使用缓存~ ------------------------------------------------ jsp:页面no cache： response.setHeader("Pragma","No-cache"); response.setHeader("Cache-Control","no-cach
以代码的方式管理quartz定时任务的暂停、重启、删除、添加等 Everyday都不同定时任务管理 spring-quartz
【前言】在项目的管理功能中，对定时任务的管理有时会很常见。因为我们不能指望只在配置文件中配置好定时任务就行了，因为如果要控制定时任务的 “暂停” 呢？暂停之后又要在某个时间点 “重启” 该定时任务呢？或者说直接 “删除” 该定时任务呢？要改变某定时任务的触发时间呢？ “添加” 一个定时任务对于系统的使用者而言，是不太现实的，因为一个定时任务的处理逻辑他是不
EXT实例 tntxia ext
（1）增加一个按钮 JSP: <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); Stri
数学学习在计算机研究领域的作用和重要性 xjnine Math
最近一直有师弟师妹和朋友问我数学和研究的关系，研一要去学什么数学课。毕竟在清华，衡量一个研究生最重要的指标之一就是paper,而没有数学，是肯定上不了世界顶级的期刊和会议的，这在计算机学界尤其重要！你会发现，不论哪个领域有价值的东西，都一定离不开数学！在这样一个信息时代，当google已经让世界没有秘密的时候，一种卓越的数学思维，绝对可以成为你的核心竞争力. 无奈本人实在见地