devxzh

基于PyQt5实现的PDF小工具

基于PyQt5实现的PDF工具箱

完整项目详见PDFTools
功能：批量添加目录，图像增强，PDF拆分，PDF合并
文章目录
- 前言
- 1. 使用模块
- 2. 编辑环境搭建
- 3.工具箱功能概述
- 4.步骤解析
- 5.项目组成
- 6.主要代码展示，完整项目详见[PDFTools](https://github.com/devxzh/PDFTools)
- 7.ToDo List
- 8.结语
- 9.参考

前言

PDF 是一种便携，易查找的电子书，在学习工作中我们可能需要翻阅大量的参考书籍，实体书往往贵且笨重，如果需要经常翻阅，那么可以购置纸质书。但是大多数时候我们可能只是需要查阅书中的某一部分，如此电子书便具有不可比拟的优势，互联网上有者大量的电子书籍，且多数以pdf格式流传，其中一部分为文字版，一部分为扫描版。这些文件一般为自制的盗版书籍，往往缺少目录，或者扫描不清晰。以致索引困难，观感极差。

市面上也有很多pdf编辑器，如Adobe Acrobat PDF,PDF Element,福昕PDF编辑器等，但他们大多价格昂贵，且没有批量添加目录的功能，虽有OCR增强的功能，但是比较耗时，且在年迈的PC上容易卡死。此工具没有使用OCR，仅对扫描页面的图片逐一增强来改善PDF清晰度。

1. 使用模块

pyqt5，pymupdf，python3.7 ，qt designer ，QCandyUi(可选)
指定下载源。可后加-i https://pypi.tuna.tsinghua.edu.cn/simple，如

pip3 install pymupdf -i https://pypi.tuna.tsinghua.edu.cn/simple
pip3 install pyqt5,pyqt5-tools

在终端输入 designer 可启动 QT Designer
注意：如果在电脑上已经安装过Ananconda，则pyqt版本过高可能会导致Spyder无法打开，此时请使用如下命令，更换版本，(不要频繁的使用conda update)

pip3 uninstall pyqt5
pip3 install pyqt5==5.12.0

版本号如果有误，终端会列出可安装的版本，选择其一输入即可

2. 编辑环境搭建

IDE：PyCharm Edu ，Spyder ，VS Code + Python 插件
上述工具择其一即可，其中PyCharm 配置后可一体化开发配置教程-博客园，配置教程-知乎
我没有配置，逐一进行

用途	工具/方法
绘制用户界面 (UI)	QT Designer
UI转Python代码	pyuic5
编写Python 代码	PyCharm / VS Code
执行代码	python3.7 (PyCharm / VS Code)
打包为可执行文件 (可选)	pyinstaller

3.工具箱功能概述

1.主界面 (使用QCandyUi美化后的截图)

2.添加目录 (详见生成的 demo.txt)

3.文本增强

4.拆分文档

5.合并文档

4.步骤解析

使用QT Designer 绘制界面(如上图) ，选择 QDialog without Button，拖拽控件，绘制后保存为.ui文件，我分别保存为PDFTools.ui add_UI.ui enhance_UI.ui merge_UI.ui split_UI.ui，绘制界面比较简单，但是控件命名应当添加适当的前缀或后缀加以区分。
使用pyuic5命令将ui文件转换为python代码，切换到项目文件夹，输入
```
pyuic5 PDFTools.ui -o PDFTools.py
```
依次对界面代码进行转换，生成后的py文件无需手动更改，当再次生成时会完全覆盖。
编写调用窗口和信号处理代码。pyqt延续了qt的设计思想，只要处理好信号与槽(可理解为触发事件与处理方法关联)，那么编写项目也会得心应手。在编写过程中可查看qt类手册，pyqt中的方法大多与QT C++同名，但是少了丑陋的指针 ->，使代码不那么扎眼。具体见代码解析
推荐使用ipython对方法/类进行测试
启动
```
> python main.py
```

如果需要可进行打包

pyinstaller --onefile --windowed --icon=PDF.ico main.py

5.项目组成

代码组成

--------窗口信号处理----------
main.py
callAdd.py
callEnhance.py
callSplit.py
callMerge.py
--------窗口界面布局----------
PDFTools.py
add_UI.py
enhance_UI.py
split_UI.py
merge_UI.py
--------PDF处理函数----------
addFunctins.py
enhanceFunctions.py
splitFunctions.py

用到的QT控件信号，通过 connect 可关联方法

控件	信号
pushButton	clicked
spinBox	valueChanged /editintFinished
Slider	sliderMoved / valueChanged
radioButton	toggled
lineEdit	textChanged
checkBox	stateChanged
comboBox	currentIndexChanged

用到的QT控件方法，大多数控件都有setText() 和text() 方法，不一一列举

控件	方法
textEdit	setText() /text()
lineEdit	setText() / text()
checkBox	isChecked()
tableWidget	setItem()
spinBox	setReadOnly()
lineEdit	setReadOnly

pymupdf中的方法

名称	描述
open	打开文件(pdf，图片)
save	保存
setToC	设置目录
getPixmap	获取本页的图片
insertPDF	插入PDF
close	关闭
pageCount	获取页码（属性）

os ，PIL 中的方法

方法	描述
open	打开txt
write	写入txt
close	关闭文本
strip	删除指定符号
split	根据指定符号分割字符串
len	计算长度，数量
range	连续的数
replace	替换指定字符串
os.getcwd()	获取当前文件路径
os.path.exists()	是否存在文件夹
os.makedirs()	创建文件夹
os.remove()	删除文件
Image.open	打开图片
ImageEnhance.Contrast	增强方法

6.主要代码展示，完整项目详见PDFTools

main.py展示了创建类，关联信号与槽，创建窗口的一般途径

import ctypes
import sys

from PyQt5.QtWidgets import QApplication, QDialog

from callAdd import AddForm
from callEnhance import EnhanceForm
from callMerge import MergeForm
from callSplit import SplitForm
from PDFTools import Ui_Dialog  # or import *

class MyForm(QDialog):
    def __init__(self):
        super().__init__()
        self.ui=Ui_Dialog()
        self.ui.setupUi(self)
        self.ui.pushButton_add.clicked.connect(self.add_Window)
        self.ui.pushButton_enhance.clicked.connect(self.enhance_Window)
        self.ui.pushButton_split.clicked.connect(self.split_Window)
        self.ui.pushButton_merge.clicked.connect(self.merge_Window)
        self.show()
    
    def add_Window(self):
        self.w1=AddForm()
        self.w1.show()
        #self.hide()
        
    def enhance_Window(self):
        self.w2=EnhanceForm()
        self.w2.show()
       
    def split_Window(self):
        self.w3=SplitForm()
        self.w3.show()
        
    def merge_Window(self):
        self.w4=MergeForm()
        self.w4.show()
      
        
if __name__=="__main__":
    app=QApplication(sys.argv)

    #set taskbar icon
    myappid = 'mycompany.myproduct.subproduct.version' # arbitrary string
    ctypes.windll.shell32.SetCurrentProcessExplicitAppUserModelID(myappid)

    w=MyForm()
    w.show()
    sys.exit(app.exec_())

主要功能代码部分

callAdd.py 工程中的四个callxxx.py均独立启动使用

# 添加目录事件主要逻辑
def start(self):
    if self.ui.lineEdit_PDF.text() != "" and self.ui.lineEdit_TXT.text() != "":
        self.ui.textEdit_progress.setText("可以")
        self.pdf=add2pdf(self.doc, self.txt, self.offsetNum)
        if self.pdf != None:
            newname=self.ui.lineEdit_PDF.text().replace(".pdf","-new.pdf")
            self.pdf.save(newname)
            self.ui.textEdit_progress.setText("目录添加成功")
            else:
                self.ui.textEdit_progress.setText("缺少文件")

addFunctions.py

def add2pdf(pdffile, txtfile, offset):
    """
    添加目录到PDF,其中文件应为打开状态
    :param: pdffile , textfile , offset
    :return:pdffile
    """
    lines = txtfile.readlines()
    toc = []
    for line in lines:
        if line[0] == '#' or len(line.split()) == 0:
            continue
        level = get_level(line)
        title = get_title(line)
        page = get_page(line)
        toc.append([level, title, page])
    pdffile.setToC(toc)
    return pdffile

callEnhance.py

#增强pdf 事件逻辑代码
def w2_start(self):
        oldFileName = self.ui.lineEdit_w2_openPDF.text()
        newFileName = oldFileName.replace(".pdf", "[enhanced].pdf")

        if oldFileName != '':
            doc = fitz.open(oldFileName)
            enhanceDoc = fitz.open()
            num = doc.pageCount
            baseBar = 1.0 / num * 100

            for i in range(num):
                imgpdf = getEnhancedPdf(doc[i], i, self.saveFlag,
                [self.colorValue, self.contrastValue, self.sharpnessValue,
                                         self.brightnessValue], 2)

                enhanceDoc.insertPDF(imgpdf)
                self.ui.label_w2_tips.setText("正在处理第 %d 页" % i)
                self.ui.progressBar_w2.setValue(i * baseBar)

            enhanceDoc.save(newFileName)
            doc.close()
            enhanceDoc.close()

            self.ui.progressBar_w2.setValue(100)
            self.ui.label_w2_tips.setText("处理完毕")

enhanceFunctions.py

"""
===============================================================================
    ImageEnhance.Color(image)      色彩平衡。 0-黑白,1-原图(可为小数,可 > 1)
    ImageEnhance.Contrast(image)   对比度。   0-灰色图像,1-原图
    ImageEnhance.Brightness(image) 亮度。     0.0-黑色图像,1-原图
    ImageEnhacne.Sharpness(image)  锐化。0.0是模糊图像,1.0是原始图像,2.0是锐化图像
===============================================================================
    上述类的增强方法都为 enhance(factor), 显示用show(),见下例子
===============================================================================
    from PIL import Image,ImageEnhance

    img=Image.open("name.png")
    # 下面的 Contrast 可换为 Color, Brightness, Sharpness 之一, 其他不变
    enhanceImg=ImageEnhance.Contrast(img)
    newImage=enhanceImg.enhance(2)
    newImage.show()
    newImage.save("new.png")
===============================================================================
"""

import fitz
import os
from PIL import Image, ImageEnhance

# 设置缩放及旋转角度
def setZoom(zoom_xy):  # 设置为 2
    rotate = int(0)  # 设置图片的旋转角度
    zoom_x = zoom_xy  # 设置图片相对于PDF文件在X轴上的缩放比例
    zoom_y = zoom_xy  # 设置图片相对于PDF文件在Y轴上的缩放比例
    trans = fitz.Matrix(zoom_x, zoom_y).preRotate(rotate)
    return trans


def getEnhancedPdf(docPage, index, saveFlag=False, factor=[1.0, 1.0, 1.0, 1.0], zoom_xy=2):
    """
    获取图像，并增加对比度
    :param : docPage: doc[i]
    :param :factor : color, contrast, sharpness, brightness
    :param :zoom_xy : enlargement factor
    :return : a page of enhanced pdf 
    """
    pix = docPage.getPixmap(matrix=setZoom(zoom_xy), alpha=False)
    img = Image.frombytes("RGB", [pix.width, pix.height], pix.samples)

    enhanceTemp1 = ImageEnhance.Color(img)
    pilImg1 = enhanceTemp1.enhance(factor[0])  # PIL img

    enhanceTemp2 = ImageEnhance.Contrast(pilImg1)
    pilImg2 = enhanceTemp2.enhance(factor[1])  # PIL img

    enhanceTemp3 = ImageEnhance.Sharpness(pilImg2)
    pilImg3 = enhanceTemp3.enhance(factor[2])  # PIL img

    enhanceTemp4 = ImageEnhance.Brightness(pilImg3)
    pilImg4 = enhanceTemp4.enhance(factor[3])  # PIL img

    # pilImg.show()
    folder = os.getcwd() + '/split'  # 创建文件夹
    if not os.path.exists(folder):
        os.makedirs(folder)
    imgName = folder + "/splitImage(" + "%04d" % index + ").png"
    pilImg4.save(imgName)
    fitImg = fitz.open(imgName)
    if saveFlag == False:
        os.remove(imgName)
    pdfBytes = fitImg.convertToPDF()
    imgpdf = fitz.open("pdf", pdfBytes)
    return imgpdf

callSplit.py

def w3_startSplit(self):
    if self.splitMode==0 or self.pathStr=='':
    self.tipStr="未添加pdf文件 或 未设置拆分模式 ! "
    elif self.splitMode==1:
    self.tipStr=split_pdf_same_page(self.pathStr,self.pageSame)
    elif self.splitMode==2:
    self.tipStr=split_pdf_custom_page(self.pathStr,self.pageStr)
    else:
    pass
    self.ui.label_w3_tip.setText(self.tipStr)

splitFunctions.py

# -*- coding: utf-8 -*-
"""
Created on Fri Jul 19 09:18:18 2020
@author: cherish
"""

import fitz

def split_pdf_same_page(pathStr, page):
    """
    将pdf 拆分为 多个pdf文件，每page页为一部分
    :param: pathStr :pdf路径的字符串, page : int 分割区间
    :return: true
    """
    doc = fitz.open(pathStr)
    # doc1 = fitz.open() # 空 pdf 文件
    docPage = doc.pageCount
    if page > docPage or page ==0 :
        return "错误 : 页码超出范围，或 分割区间为0 !"

    num = docPage//page  # 可以拆成 page 页的部分
    for i in range(num):  # 0 到 num-1
        doc1 = fitz.open()  # 空 pdf 文件
        doc1.insertPDF(doc, from_page=page*i, to_page=page*(i+1)-1, start_at=-1)
        partName = '[part'+str(i)+'].pdf'
        newName = pathStr.replace(".pdf", partName)
        doc1.save(newName)
        doc1.close()

    surplus = docPage % page  # 最后少于 page 的部分
    if surplus != 0:
        doc1 = fitz.open()  # 空 pdf 文件
        doc1.insertPDF(doc, from_page=page*num, to_page=docPage-1, start_at=-1)
        partName = '[part'+str(num)+'].pdf'
        newName = pathStr.replace(".pdf", partName)
        doc1.save(newName)
        doc1.close()
    return "拆分成功"


def split_pdf_custom_page(pathStr, pageStr):
    """
    将pdf拆分为自定义页码的多个pdf文件
    :param: str ,pdf路径的字符串, pageStr: 自定义页码的字符串
    :return: Error page string / True
    """
    doc = fitz.open(pathStr)
    docPage = doc.pageCount
    pageStr = pageStr.replace('，', ',')  # 如果是中文逗号
    pageList = pageStr.split(",")

    for page in pageList:
        pse = page.split('-')  # page start and end
        ps = int(pse[0])
        pe = int(pse[0]) if len(pse) == 1 else int(pse[1])
        if ps > pe or pe > docPage:
            return "请检查>  "+ page + " 是否有误 !"  # error: page part

        doc1 = fitz.open()  # 创建 空pdf文件
        doc1.insertPDF(doc, from_page=ps-1, to_page=pe-1, start_at=-1)
        partName = '[page'+str(ps)+'-' + str(pe)+'].pdf'
        newName = pathStr.replace(".pdf", partName)
        doc1.save(newName)
        doc1.close()
    return "拆分成功"

merge_UI.py 设置表格列宽，使用pyuic后会覆盖

self.tableWidget_w4_fileList.setColumnWidth(0, 450)
self.tableWidget_w4_fileList.setColumnWidth(1, 70)

callMerge.py

def w4_start(self):
    if self.rowCount != 0:
    doc = fitz.open(self.ui.tableWidget_w4_fileList.item(0, 0).text())
    basebar = int(1.0 / self.rowCount * 100)

    for i in range(1, self.rowCount):
    doc1 = fitz.open(self.ui.tableWidget_w4_fileList.item(i, 0).text())
    doc.insertPDF(doc1)
    self.ui.progressBar_w4_bar.setValue(i * basebar)
    self.ui.progressBar_w4_bar.setValue(100)
    doc.save("merge.pdf")
    doc.close()

demo.txt 该文件是存放目录的文件，要求和格式见下，在打开添加目录窗口的同时会自动生成该文件

# =========================================================================
# 
# 建议在如下网站搜集目录：
#           1.京东图书 https://book.jd.com/
#           2.豆瓣读书 https://book.douban.com/
#           3.当当图书 http://book.dangdang.com/
#           4.文泉书局 https://wqbook.wqxuetang.com/
# 
# =========================================================================
# 标准格式1 如下:(空行不影响)
# 特征 ：两部分构成： 标题 + 空格 + 页码
# 标题中含 '第' 和 '章' 的会识别为一级标题，其他为二级标题
# =========================================================================

第1章概述     1
什么是OpenCV        1
OpenCV怎么用        2
什么是计算机视觉     3
OpenCV的起源        6
OpenCV的结构    7
使用IPP来加速OpenCV     8
谁拥有OpenCV    9
下载和安装OpenCV    9

# ==========================================================================
# 标准格式2 如下 
# 特征 ：章序/节序 + 空格 + 标题 + 空格 + 页码 （空格用于区分各元素）
# 无 章节序 的 默认识别为 二级标题 ，若想设置为一级标题，请在前加 '@ '，
# 一般 需要区分的是 前言 目录 附录 参考文献 这些 
# 节序中有一个点 表二级标题(如 6.1 )，两个点 表三级标题(如 1.2.3)，以此类推
# ==========================================================================

第6章 支持向量机 121
6.1 间隔与支持向量 121
6.2 对偶问题 123
6.3 核函数 126
6.4 软间隔与正则化 129
6.5 支持向量回归 133
6.6 核方法 137
6.7 阅读材料 139
习题 141
休息一会儿 145
@ 参考文献 520

# ==========================================================================

7.ToDo List

- [ ] 自定义样式表
- [ ] 自动爬取目录
- [ ] img2pdf

8.结语

第一次使用pyqt5写一个完整的项目，用时大概六天。前期绘制界面一天。后期逐一完善各个功能四天，写文档，改bug一天。最大的感受就是Python语法友好，轮子很全。本次项目也是熟悉pyqt的过程。写完本应用基本掌握了常用的控件，信号，槽。整体而言，使用pyqt5编写一些小工具还是很方便的。至于执行效率，一般的小项目基本体现不出来。

PyQt5优点：相较于QT Creator，python代码比较优雅；相较于 C# Winform/WPF ，python拥有较多的库。可用样式表setStyleSheet美化控件

缺点：QT Designer 可设置参数偏少，需要使用代码设置，控件不够美观，打包文件偏大。

9.参考

pymupdf
qt class
Qt5 Python GUI Programming Cookbook 2018

10月|愿你的青春不负梦想-读书笔记-01 Tracy的小书斋
本书的作者是俞敏洪，大家都很熟悉他了吧。俞敏洪老师是我行业的领头羊吧，也是我事业上的偶像。本日摘录他书中第一章中的金句：『一个人如果什么目标都没有，就会浑浑噩噩，感觉生命中缺少能量。能给我们能量的，是对未来的期待。第一件事，我始终为了进步而努力。与其追寻全世界的骏马，不如种植丰美的草原，到时骏马自然会来。第二件事，我始终有阶段性的目标。什么东西能给我能量？答案是对未来的期待。』读到这里的时候，我便
《投行人生》读书笔记小蘑菇的树洞
《投行人生》----作者詹姆斯-A-朗德摩根斯坦利副主席40年的职业洞见-很短小精悍的篇幅，比较适合初入职场的新人。第一部分成功的职业生涯需要规划1.情商归为适应能力分享与协作同理心适应能力，更多的是自我意识，你有能力识别自己的情并分辨这些情绪如何影响你的思想和行为。2.对于初入职场的人的建议，细节，截止日期和数据很重要截止日期，一种有效的方法是请老板为你所有的任务进行优先级排序。和老板喝咖啡的好
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
git常用命令笔记咩酱-小羊 git 笔记
###用习惯了idea总是不记得git的一些常见命令，需要用到的时候总是担心旁边站了人~~~记个笔记@_@，告诉自己看笔记不丢人初始化初始化一个新的Git仓库gitinit配置配置用户信息gitconfig--globaluser.name"YourName"gitconfig--globaluser.email"[email protected]"基本操作克隆远程仓库gitclone查看
509. 斐波那契数(每日一题) lzyprime
lzyprime博客(github)创建时间：2021.01.04qq及邮箱：2383518170leetcode笔记题目描述斐波那契数，通常用F(n)表示，形成的序列称为斐波那契数列。该数列由0和1开始，后面的每一项数字都是前面两项数字的和。也就是：F(0)=0，F(1)=1F(n)=F(n-1)+F(n-2)，其中n>1给你n，请计算F(n)。示例1：输入：2输出：1解释：F(2)=F(1)+
拥有断舍离的心态，过精简生活--《断舍离》读书笔记爱吃丸子的小樱桃
不知不觉间房间里的东西越来越多，虽然摆放整齐，但也时常会觉得空间逼仄，令人心生烦闷。抱着断舍离的态度，我开始阅读《断舍离》这本书，希望从书中能找到一些有效的方法，帮助我实现空间、物品上的断舍离。《断舍离》是日本作家山下英子通过自己的经历、思考和实践总结而成的，整体内涵也从刚开始的私人生活哲学的“断舍离”升华成了“人生实践哲学”，接着又成为每个人都能实行的“改变人生的断舍离”，从“哲学”逐渐升华成“
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
高端密码学院笔记285 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（598）期《幸福》之回归内在深层生命原动力基础篇——揭秘“激励”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:成功=艰苦劳动+正确方法+少说空话。贪图省力的船夫，目标永远下游。智者的梦再美，也不如愚人实干的脚印。幸福早课堂2020.10.16星期五一笔记:1，重视和珍惜的前提是知道它的价值非常重要，当你珍惜了，你就真正定下来，真正的学到身上。2，大家需要
Day17笔记-高阶函数 ~在杰难逃~ Python 笔记 python 开发语言 pycharm 数据分析
高阶函数【重点掌握】函数的本质：函数是一个变量，函数名是一个变量名，一个函数可以作为另一个函数的参数或返回值使用如果A函数作为B函数的参数，B函数调用完成之后，会得到一个结果，则B函数被称为高阶函数常用的高阶函数：map(),reduce(),filter(),sorted()1.map()map(func,iterable)，返回值是一个iterator【容器，迭代器】func:函数iterab
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
数据仓库——维度表一致性墨染丶eye 背诵数据仓库
数据仓库基础笔记思维导图已经整理完毕，完整连接为：数据仓库基础知识笔记思维导图维度一致性问题从逻辑层面来看，当一系列星型模型共享一组公共维度时，所涉及的维度称为一致性维度。当维度表存在不一致时，短期的成功难以弥补长期的错误。维度时确保不同过程中信息集成起来实现横向钻取货活动的关键。造成横向钻取失败的原因维度结构的差别，因为维度的差别，分析工作涉及的领域从简单到复杂，但是都是通过复杂的报表来弥补设计
【Git】常见命令(仅笔记) 好想有猫猫 Git Linux学习笔记 git 笔记 elasticsearch linux c++
文章目录创建/初始化本地仓库添加本地仓库配置项提交文件查看仓库状态回退仓库查看日志分支删除文件暂存工作区代码远程仓库使用`.gitigore`文件让git不追踪一些文件标签创建/初始化本地仓库gitinit添加本地仓库配置项gitconfig-l#以列表形式显示配置项gitconfiguser.name"ljh"#配置user.namegitconfiguser.email"[email protected]
为什么你总是对下属不满意? ZhaoWu1050
【ZhaoWu的听课笔记】大多数公司，都存在两种问题。我创业四年，更是体会深切。这两种问题就是：老板经常不满意下属的表现；下属总是不知道老板想要什么；虽然这两种问题普遍存在，其实解决方法并不复杂。这节课，我们再聊聊第一个问题：为什么老板经常不满意下属表现?其实，这背后也是一条管理常识。管理学家德鲁克先生早就说过：管理者的任务，不是去改变人。*来自《卓有成效的管理者》只是大多数老板和我一样，都是一边
母亲节如何做小红书营销美橙传媒
小红书的一举一动引起了外界的高度关注。通过爆款笔记和流行话题，我们可以看到“干货”类型的内容在小红书中偏向实用的生活经验共享和生活指南非常受欢迎。根据运营社的分析，这种现象是由小红书用户心智和内容社区背后机制共同决定的。首先，小红书将使用“强搜索”逻辑为用户提供特定的“搜索场景”。在“我必须这样生活”中，大量使用了满足小红书站用户喜好和需求的内容。内容社区自制的高质量内容也吸引了寻找营销新途径的品
读书笔记|《遇见孩子，遇见更好的自己》5 抹茶社长
为人父母意味着放弃自己的过去，不要对以往没有实现的心愿耿耿于怀，只有这样，孩子们才能做回自己。985909803.jpg孩子在与父母保持亲密的同时更需要独立，唯有这样，孩子才会成为孩子，父母才会成其为父母。有耐心的人生往往更幸福，给孩子留点余地。认识到养儿育女是对耐心的考验。为失败做好心理准备，教会孩子控制情绪。了解自己的底线，说到底线，有一点很重要，父母之所以发脾气，真正的原因往往在于他们自己，
基于Python给出的PDF文档转Markdown文档的方法程序媛了了 python pdf 开发语言
注：网上有很多将Markdown文档转为PDF文档的方法，但是却很少有将PDF文档转为Markdown文档的方法。就算有，比如某些网站声称可以将PDF文档转为Markdown文档，尝试过，不太符合自己的要求，而且无法保证文档没有泄露风险。于是本人为了解决这个问题，借助GPT（能使用GPT镜像或者有条件直接使用GPT的，反正能调用GPT接口就行）生成Python代码来完成这个功能。笔记、代码难免存在
语文主题教学学习笔记之87 东哥杂谈
“语文主题教学”学习笔记之八十七（0125）今天继续学习小学语文主题教学的实践样态。板块三：教学中体现“书艺”味道。作为四大名著之一的《水浒传》，堪称我国文学宝库之经典。对从《水浒传》中摘选的单元，教师就要了解其原生态，即评书体特点。这也要求教师要了解一些常用的评书行话术语，然后在教学时适时地加入一些，让学生体味其文本中原有的特色。学生也要尽可能地通过朗读的方式，而不单是分析讲解的方式进行学习。细
Armv8.3 体系结构扩展--原文版代码改变世界ctw ARM-TEE-Android armv8 嵌入式 arm架构安全架构芯片 Trustzone Secureboot
快速链接:.ARMv8/ARMv9架构入门到精通-[目录]付费专栏-付费课程【购买须知】:个人博客笔记导读目录(全部)TheArmv8.3architectureextensionTheArmv8.3architectureextensionisanextensiontoArmv8.2.Itaddsmandatoryandoptionalarchitecturalfeatures.Somefeat
springboot+vue项目实战一-创建SpringBoot简单项目苹果酱0567 面试题汇总与解析 spring boot 后端 java 中间件开发语言
这段时间抽空给女朋友搭建一个个人博客，想着记录一下建站的过程，就当做笔记吧。虽然复制zjblog只要一个小时就可以搞定一个网站，或者用cms系统，三四个小时就可以做出一个前后台都有的网站，而且想做成啥样也都行。但是就是要从新做，自己做的意义不一样，更何况，俺就是专门干这个的，嘿嘿嘿要做一个网站，而且从零开始，首先呢就是技术选型了，经过一番思量决定选择-SpringBoot做后端，前端使用Vue做一
阅读《认知觉醒》读书笔记就看看书
本周阅读了周岭的《认知觉醒开启自我改变的原动力》，启发较多，故做读书笔记一则，留待学习。全书共八章，讲述了大脑、潜意识、元认知、专注力、学习力、行动力、情绪力及成本最低的成长之道。具体描述了大脑、焦虑、耐心、模糊、感性、元认知、自控力、专注力、情绪专注、学习专注、匹配、深度、关联、体系、打卡、反馈、休息、清晰、傻瓜、行动、心智宽带、单一视角、游戏心态、早起、冥想、阅读、写作、运动等相关知识点。大脑
阅读笔记：阅读方法中的逻辑和转念施吉涛
聊聊一些阅读的方法论吧，别人家的读书方法刚开始想写，然后就不知道写什么了，因为作者写的非常的“精致”我有一种乡巴佬进城的感觉，看到精美的摆盘，精致的食材不知道该如何下口也就是《阅读的方法》，我们姑且来试一下强劲的大脑篇，第一节：逻辑通俗的来讲，也就是表达的排列和顺序，再进一步就是因果关系和关联实际上书已经看了大概一遍，但直到打算写一下笔记的时候，才发现作者讲的推理更多的是阅读的对象中呈现出的逻辑也
《转介绍方法论》学习笔记小可乐的妈妈
一、高效转介绍的流程：价值观---执行----方案一）转介绍发生的背景：1、对象：谁向谁转介绍？全员营销，人人参与。①员工的激励政策、客户的转介绍诱因制作客户画像：a信任；支付能力；意愿度；便利度（根据家长具备四个特征的个数分为四类）B性格分类C职业分类D年龄性别②执行：套路，策略，方法，流程2、诱因：为什么要转介绍？认同信任；多方共赢；传递美好；零风险承诺打动人心，超越期待。选择做教育，就是选择
JAVA学习笔记之23种设计模式学习 victorfreedom Java技术设计模式 android java 常用设计模式
博主最近买了《设计模式》这本书来学习，无奈这本书是以C++语言为基础进行说明，整个学习流程下来效率不是很高，虽然有的设计模式通俗易懂，但感觉还是没有充分的掌握了所有的设计模式。于是博主百度了一番，发现有大神写过了这方面的问题，于是博主迅速拿来学习。一、设计模式的分类总体来说设计模式分为三大类：创建型模式，共五种：工厂方法模式、抽象工厂模式、单例模式、建造者模式、原型模式。结构型模式，共七种：适配器
解决Obsidian写笔记中的＜img＞标签无法显示图片的问题全能全知者笔记
Obsidian中写md笔记如果使用标签会显示不出图案，后来才知道因为Obsidian的问题导致只能用绝对路径定位。所以我本人写了一个py插件，将md笔记里的img标签批量替换成Obsidian能够读取的形式。安装FixObsImgDpy:pipinstallFixObsImgDpy安装完成后在需要修复的md文件的父目录下运行命令:FixObsImgDpy就会自动修复父目录以下的全部md文件仓库
2021年周总结 03 Ruby之家
这周的生活过得也是比较快，因为暂时住的离公司有点距离，所以通勤时间相对较长一点，而在地铁上的一个半小时如何充分利用起来，则是我最近一直在思考的问题，2021年想让自己的生活都运行在计划中。(有时候自己想干一件事情就总是给自己找很多借口，想着以后怎么怎么样？然而哪有那么多的以后，能够方便当下的工作生活就立马执行就OK，这仅仅只是我此时想到背的很重的老人机笔记本电脑，也算是陪伴我快8年的—当时买的时候
2021-12-11 人生导演
今天读到佛学书籍的一段话：初学者很难直接体验到无我，但可以经常提醒自己：一切事物都是无我的。不断强化这个观念，也会相当有帮助。比如生病了我们一般会说：“我不舒服！我很痛！我很惨！”这时候如果我们提醒自己：没有我，只是这个肉体的某些部分、某些功能出了问题，不舒服、疼痛也只是一时的感受，而感受随时在变化。仅仅是知道没有一个实存的我在生病、在受苦。然后把“一切事物都是无我的”这句话，记到笔记上，并且朗读
新能源汽车 BMS 学习笔记篇—BMS 基本定义及分类 WPG大大通其他笔记汽车 BMS 经验分享新能源电池
一、BMS定义1、概念：BMS（BatteryManagementSystem）即电池管理系统，其管理对象是二次电池（充电电池或蓄电池），其主要目的是电池的利用率，防止电池出现过度充电和过度放电，可应用于电动汽车、电瓶车、机器人、无人机等图片来源：腾讯网https://new.qq.com《标准普尔警告，电动汽车电池生产面临供应链和地缘政治风险》2、四大功能①感知和测量：检测电池的电压、电流、温度
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
LeetCode github集合，附CMU大神整理笔记 Wesley@ LeetCode github
GithubLeetCode集合本人所有做过的题目都写在一个java项目中，同步到github中了，算是见证自己的进步。github目前同步的题目是2020-09-17日之后写的题。之前写过的题会陆续跟新到github中。目前大概400个题目Github项目链接：https://github.com/sunliancheng/leetcode_github附上一份优秀的教材整合：这是卡内基梅隆(C
web前段跨域nginx代理配置刘正强 nginx cms Web
nginx代理配置可参考server部分 server { listen 80; server_name localhost;
spring学习笔记 caoyong spring
一、概述 a>、核心技术 : IOC与AOP b>、开发为什么需要面向接口而不是实现接口降低一个组件与整个系统的藕合程度，当该组件不满足系统需求时，可以很容易的将该组件从系统中替换掉，而不会对整个系统产生大的影响 c>、面向接口编口编程的难点在于如何对接口进行初始化,(使用工厂设计模式)
Eclipse打开workspace提示工作空间不可用 0624chenhong eclipse
做项目的时候，难免会用到整个团队的代码，或者上一任同事创建的workspace， 1.电脑切换账号后，Eclipse打开时，会提示Eclipse对应的目录锁定，无法访问，根据提示，找到对应目录，G:\eclipse\configuration\org.eclipse.osgi\.manager，其中文件.fileTableLock提示被锁定。解决办法，删掉.fileTableLock文件，重
Javascript 面向对面写法的必要性？一炮送你回车库 JavaScript
现在Javascript面向对象的方式来写页面很流行，什么纯javascript的mvc框架都出来了：ember 这是javascript层的mvc框架哦,不是j2ee的mvc框架我想说的是，javascript本来就不是一门面向对象的语言，用它写出来的面向对象的程序，本身就有些别扭，很多人提到js的面向对象首先提的是：复用性。那么我请问你写的js里有多少是可以复用的，用fu
js array对象的迭代方法换个号韩国红果果 array
1.forEach 该方法接受一个函数作为参数，对数组中的每个元素使用该函数 return 语句失效 function square(num) { print(num, num * num); } var nums = [1,2,3,4,5,6,7,8,9,10]; nums.forEach(square); 2.every 该方法接受一个返回值为布尔类型
对Hibernate缓存机制的理解归来朝歌 session 一级缓存对象持久化
在hibernate中session一级缓存机制中，有这么一种情况：问题描述：我需要new一个对象，对它的几个字段赋值，但是有一些属性并没有进行赋值，然后调用 session.save()方法，在提交事务后，会出现这样的情况： 1：在数据库中有默认属性的字段的值为空 2：既然是持久化对象，为什么在最后对象拿不到默认属性的值？通过调试后解决方案如下：对于问题一，如你在数据库里设置了
WebService调用错误合集 darkranger webservice
Java.Lang.NoClassDefFoundError: Org/Apache/Commons/Discovery/Tools/DiscoverSingleton 调用接口出错，一个简单的WebService import org.apache.axis.client.Call;import org.apache.axis.client.Service; 首先必不可
JSP和Servlet的中文乱码处理 aijuans Java Web
JSP和Servlet的中文乱码处理前几天学习了JSP和Servlet中有关中文乱码的一些问题，写成了博客，今天进行更新一下。应该是可以解决日常的乱码问题了。现在作以下总结希望对需要的人有所帮助。我也是刚学，所以有不足之处希望谅解。一、表单提交时出现乱码：在进行表单提交的时候，经常提交一些中文，自然就避免不了出现中文乱码的情况，对于表单来说有两种提交方式：get和post提交方式。所以
面试经典六问 atongyeye 工作面试
题记：因为我不善沟通，所以在面试中经常碰壁，看了网上太多面试宝典，基本上不太靠谱。只好自己总结，并试着根据最近工作情况完成个人答案。以备不时之需。以下是人事了解应聘者情况的最典型的六个问题： 1 简单自我介绍关于这个问题，主要为了弄清两件事，一是了解应聘者的背景，二是应聘者将这些背景信息组织成合适语言的能力。我的回答：(针对技术面试回答，如果是人事面试，可以就掌
contentResolver.query()参数详解百合不是茶 android query()详解
收藏csdn的博客,介绍的比较详细,新手值得一看 1.获取联系人姓名一个简单的例子，这个函数获取设备上所有的联系人ID和联系人NAME。 [java] view plain copy public void fetchAllContacts() {
ora-00054:resource busy and acquire with nowait specified解决方法 bijian1013 oracle 数据库 kill nowait
当某个数据库用户在数据库中插入、更新、删除一个表的数据，或者增加一个表的主键时或者表的索引时，常常会出现ora-00054:resource busy and acquire with nowait specified这样的错误。主要是因为有事务正在执行（或者事务已经被锁），所有导致执行不成功。 1.下面的语句
web 开发乱码征客丶 spring Web
以下前端都是 utf-8 字符集编码一、后台接收 1.1、 get 请求乱码 get 请求中，请求参数在请求头中；乱码解决方法： a、通过在web 服务器中配置编码格式：tomcat 中，在 Connector 中添加URIEncoding="UTF-8"； 1.2、post 请求乱码 post 请求中，请求参数分两部份， 1.2.1、url？参数，
【Spark十六】： Spark SQL第二部分数据源和注册表的几种方式 bit1129 spark
Spark SQL数据源和表的Schema case class apply schema parquet json JSON数据源准备源数据 {"name":"Jack", "age": 12, "addr":{"city":"beijing&
JVM学习之:调优总结 -Xms -Xmx -Xmn -Xss BlueSkator -Xss -Xmn -Xms -Xmx
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx355
jqGrid 各种参数详解(转帖) BreakingBad jqGrid
jqGrid 各种参数详解分类：源代码分享个人随笔请勿参考解决开发问题 2012-05-09 20:29 84282人阅读评论(22) 收藏举报 jquery 服务器 parameters function ajax string
读《研磨设计模式》-代码笔记-代理模式-Proxy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.lang.reflect.InvocationHandler; import java.lang.reflect.Method; import java.lang.reflect.Proxy; /* * 下面
应用升级iOS8中遇到的一些问题 chenhbc ios8 升级iOS8
1、很奇怪的问题，登录界面，有一个判断，如果不存在某个值，则跳转到设置界面，ios8之前的系统都可以正常跳转，iOS8中代码已经执行到下一个界面了，但界面并没有跳转过去，而且这个值如果设置过的话，也是可以正常跳转过去的，这个问题纠结了两天多，之前的判断我是在 -(void)viewWillAppear:(BOOL)animated 中写的，最终的解决办法是把判断写在 -(void
工作流与自组织的关系？ comsci 设计模式工作
目前的工作流系统中的节点及其相互之间的连接是事先根据管理的实际需要而绘制好的，这种固定的模式在实际的运用中会受到很多限制，特别是节点之间的依存关系是固定的，节点的处理不考虑到流程整体的运行情况，细节和整体间的关系是脱节的，那么我们提出一个新的观点，一个流程是否可以通过节点的自组织运动来自动生成呢？这种流程有什么实际意义呢？这里有篇论文，摘要是：“针对网格中的服务
Oracle11.2新特性之INSERT提示IGNORE_ROW_ON_DUPKEY_INDEX daizj oracle
insert提示IGNORE_ROW_ON_DUPKEY_INDEX 转自：http://space.itpub.net/18922393/viewspace-752123 在 insert into tablea ...select * from tableb中，如果存在唯一约束，会导致整个insert操作失败。使用IGNORE_ROW_ON_DUPKEY_INDEX提示，会忽略唯一
二叉树:堆 dieslrae 二叉树
这里说的堆其实是一个完全二叉树,每个节点都不小于自己的子节点,不要跟jvm的堆搞混了.由于是完全二叉树,可以用数组来构建.用数组构建树的规则很简单: 一个节点的父节点下标为: (当前下标 - 1)/2 一个节点的左节点下标为: 当前下标 * 2 + 1 &
C语言学习八结构体 dcj3sjt126com c
为什么需要结构体，看代码 # include <stdio.h> struct Student //定义一个学生类型，里面有age, score, sex, 然后可以定义这个类型的变量 { int age; float score; char sex; } int main(void) { struct Student st = {80, 66.6,
centos安装golang dcj3sjt126com centos
#在国内镜像下载二进制包 wget -c http://www.golangtc.com/static/go/go1.4.1.linux-amd64.tar.gz tar -C /usr/local -xzf go1.4.1.linux-amd64.tar.gz #把golang的bin目录加入全局环境变量 cat >>/etc/profile<
10.性能优化-监控-MySQL慢查询 frank1234 性能优化 MySQL慢查询
1.记录慢查询配置 show variables where variable_name like 'slow%' ; --查看默认日志路径查询结果：--不用的机器可能不同 slow_query_log_file=/var/lib/mysql/centos-slow.log 修改mysqld配置文件：/usr /my.cnf[一般在/etc/my.cnf，本机在/user/my.cn
Java父类取得子类类名 happyqing java this 父类子类类名
在继承关系中，不管父类还是子类，这些类里面的this都代表了最终new出来的那个类的实例对象，所以在父类中你可以用this获取到子类的信息！ package com.urthinker.module.test; import org.junit.Test; abstract class BaseDao<T> { public void
Spring3.2新注解@ControllerAdvice jinnianshilongnian @Controller
@ControllerAdvice，是spring3.2提供的新注解，从名字上可以看出大体意思是控制器增强。让我们先看看@ControllerAdvice的实现： @Target(ElementType.TYPE) @Retention(RetentionPolicy.RUNTIME) @Documented @Component public @interface Co
Java spring mvc多数据源配置 liuxihope spring
转自：http://www.itpub.net/thread-1906608-1-1.html 1、首先配置两个数据库 <bean id="dataSourceA" class="org.apache.commons.dbcp.BasicDataSource" destroy-method="close&quo
第12章 Ajax（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BW / Universe Mappings blueoxygen BO
BW Element OLAP Universe Element Cube Dimension Class Charateristic A class with dimension and detail objects (Detail objects for key and desription) Hi
Java开发熟手该当心的11个错误 tomcat_oracle java 多线程工作单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
推行国产操作系统的优劣 yananay windows linux 国产操作系统
最近刮起了一股风，就是去“国外货”。从应用程序开始，到基础的系统，数据库，现在已经刮到操作系统了。原因就是“棱镜计划”，使我们终于认识到了国外货的危害，开始重视起了信息安全。操作系统是计算机的灵魂。既然是灵魂，为了信息安全，那我们就自然要使用和推行国货。可是，一味地推行，是否就一定正确呢？先说说信息安全。其实从很早以来大家就在讨论信息安全。很多年以前，就据传某世界级的网络设备制造商生产的交