如何使用python对图片进行批量压缩详解

前言

最近在研究怎么对图片资源进行无损压缩，网上也找了一些资料。总而言之，收获不少，所以想对最近的学习做个总结。

无损压缩其实是相对而言的，目的是为了减小图片资源的内存大小但又不影响图片的显示质量。下面我将介绍两种批量压缩图片的方法，方法一是使用python和Pillow模块对图片进行压缩，这个方法对jpeg格式的图片有非常高的压缩效率，但该方法不太适合对png图片进行压缩。另一个方式是使用Python和Selenium模块操纵Squoosh批量压缩图片。

使用Python和Pillow模块压缩图片

Pillow是Python上一个功能非常强大的图形处理库，若本地还没安装，可以通过指令：pip install Pillow安装。使用Pillow进行压缩的策略大致总结为三个：1、优化flag，2、渐进式JPEG，3、JPEG动态质量。

我们先用Python写一个简单的保存图片的例子：

from PIL import Image
from io import StringIO
import dynamic_quality

im = Image.open("photo.jpg")
print(im.format,im.size,im.mode)

new_photo = im.copy()
new_photo.thumbnail(im.size,resample=Image.ANTIALIAS)
save_args = {'format':im.format}
if im.format=='JPEG':
    save_args['quality'].value=85

new_photo.save("copy_photo.jpg",**save_args)

1、优化flag

开启optimize设置，这是以CPU耗时为代价节省额外的文件大小，由于本质没变，对图片质量没有丝毫影响。

...
if im.format=='JPEG':
    save_args['quality'].value=85
    save_args['optimize']=True
...

2、渐进式JPEG

当我们将一张图片保存为 JPEG 时，你可以从下面的选项中选择不同的类型：

标准型： JPEG 图片自上而下载入。
渐进式： JPEG 图片从模糊到清晰载入。

渐进式的选项可以在 Pillow 中轻松的启用 (progressive=True)。渐进式文件的被打包时会有一个小幅的压缩。

...
if im.format=='JPEG':
    save_args['quality'].value=85
    save_args['optimize']=True
    save_args['progressive=True']=True
...

3、JPEG动态质量

最广为人知的减小 JPEG 文件大小的方法就是设置 quality。很多应用保存 JPEG 时都会设置一个特定的质量数值。

质量其实是个很抽象的概念。实际上，一张 JPEG 图片的每个颜色通道都有不同的质量。质量等级从 0 到 100 在不同的颜色通道上都对应不同的量化表，同时也决定了有多少信息会丢失。

在信号域量化是 JPEG 编码中失去信息的第一个步骤。

我们可以动态地为每一张图片设置最优的质量等级，在质量和文件大小之间找到一个平衡点。我们有以下两种方法可以做到这点：

Bottom-up： 这些算法是在 8x8 像素块级别上处理图片来生成调优量化表的。它们会同时计算理论质量丢失量和和人眼视觉信息丢失量。

Top-down： 这些算法是将一整张图片和它原版进行对比，然后检测出丢失了多少信息。通过不断地用不同的质量参数生成候选图片，然后选择丢失量最小的那一张。

我们选择第二种方法：使用二分法在不同的质量等级下生成候选图片，然后使用 pyssim 计算它的结构相似矩阵 (SSIM) 来评估每张候选图片损失的质量，直到这个值达到非静态可配置的阈值为止。这个方法让我们可以有选择地降低文件大小（和文件质量），但是只适用于那些即使降低质量用户也察觉不到的图片。

下面是计算动态质量的代码dynamic_quality.py：

import PIL.Image
from math import log
from SSIM_PIL import compare_ssim


def get_ssim_at_quality(photo, quality):
    """Return the ssim for this JPEG image saved at the specified quality"""
    ssim_photo = "tmp.jpg"
    # optimize is omitted here as it doesn't affect
    # quality but requires additional memory and cpu
    photo.save(ssim_photo, format="JPEG", quality=quality, progressive=True)
    ssim_score = compare_ssim(photo, PIL.Image.open(ssim_photo))
    return ssim_score


def _ssim_iteration_count(lo, hi):
    """Return the depth of the binary search tree for this range"""
    if lo >= hi:
        return 0
    else:
        return int(log(hi - lo, 2)) + 1


def jpeg_dynamic_quality(original_photo):
    """Return an integer representing the quality that this JPEG image should be
    saved at to attain the quality threshold specified for this photo class.

    Args:
        original_photo - a prepared PIL JPEG image (only JPEG is supported)
    """
    ssim_goal = 0.95
    hi = 85
    lo = 80

    # working on a smaller size image doesn't give worse results but is faster
    # changing this value requires updating the calculated thresholds
    photo = original_photo.resize((400, 400))

    # if not _should_use_dynamic_quality():
    #     default_ssim = get_ssim_at_quality(photo, hi)
    #     return hi, default_ssim

    # 95 is the highest useful value for JPEG. Higher values cause different behavior
    # Used to establish the image's intrinsic ssim without encoder artifacts
    normalized_ssim = get_ssim_at_quality(photo, 95)
    selected_quality = selected_ssim = None

    # loop bisection. ssim function increases monotonically so this will converge
    for i in range(_ssim_iteration_count(lo, hi)):
        curr_quality = (lo + hi) // 2
        curr_ssim = get_ssim_at_quality(photo, curr_quality)
        ssim_ratio = curr_ssim / normalized_ssim

        if ssim_ratio >= ssim_goal:
            # continue to check whether a lower quality level also exceeds the goal
            selected_quality = curr_quality
            selected_ssim = curr_ssim
            hi = curr_quality
        else:
            lo = curr_quality

    if selected_quality:
        return selected_quality, selected_ssim
    else:
        default_ssim = get_ssim_at_quality(photo, hi)
        return hi, default_ssim

然后在下面的代码中引用计算动态质量的方法：

...
if im.format=='JPEG':
    save_args['quality'],value=dynamic_quality.jpeg_dynamic_quality(im)
    save_args['optimize']=True
    save_args['progressive']=True
...

使用Python和Selenium模块操纵Squoosh批量压缩图片

Squoosh 是谷歌发布的一款开源的图片在线压缩服务（伪），虽然需要用浏览器打开，但其实是一个整合了许多命令行工具的前端界面，调用的是本地的计算资源，所以只要打开过Squoosh一次，之后都会秒开，并且离线使用。不过最大的缺点就是不可以批量处理，如果我们要处理大量的图片资源，一张张地进行压缩处理将会消耗大量的人力成本和时间成本，这明显是不能接受的。我们要解决的问题就是写一个脚本来模拟浏览器的操作，使我们的双手得到解放。

Python 调用 Selenium

这是 Squoosh 的主界面，Select an Image 其实是一个输入框，那我们直接用 Selenium 把本地图片的路径输入进去就行了：

输入图片路径之后就会默认压缩成 75% 质量的 MozJPEG，我觉得无论是压缩比和质量都很不错，所以就没有改，等待页面加载完成之后就直接下载：

我们可以认为出现 "..% smaller" 就算是压缩完成，这时候直接点击右边的下载按钮即可。

代码：

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.support.ui import Select
import os
import re
driver = webdriver.Chrome('C:/Users/admin/AppData/Local/Google/Chrome/Application/chromedriver.exe')
# 列出目录下所有的图片，存在 images 这个列表中
images = os.listdir('C:/Users/admin/Pictures/Saved Pictures')
# 处理所有图片
for i in range(len(images)):
    # 构建图片路径
    path = 'C:/Users/admin/Pictures/Saved Pictures/' + images[i]
    # 尝试处理所有图片
    try:
        # 打开 Squoosh
        driver.get('https://squoosh.app')
        # 找到输入框
        input_box = driver.find_element_by_xpath('.//input[@class="_2zg9i"]')
        # 输入图片路径
        input_box.send_keys(path)
        #设置图片格式
        select1 = Select(driver.find_elements_by_css_selector('select')[-1])
        if re.match('.*.png',images[i]):
            select1.select_by_value("png")
        if re.match('.*.jpg',images[i]):
            select1.select_by_value("mozjpeg")

        # 等待出现 'smaller'字样，10秒不出现则视为处理失败
        locator = (By.XPATH, './/span[@class="_1eNmr _1U8bE"][last()]')
        WebDriverWait(driver, 25).until(EC.text_to_be_present_in_element(locator, 'smaller'))

        # 找到下载按钮
        button = driver.find_elements_by_xpath('.//a[@title="Download"]')[-1]
        # 点击下载按钮
        button.click()
    # 输出处理失败的图片路径
    except:
        print('*'*30)
        print('Error: '+ path +' failed!')
        print('*'*30)
        continue

总结

到此这篇关于如何使用python对图片进行批量压缩的文章就介绍到这了,更多相关python图片批量压缩内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

B端模块（1）：用户管理模块的定义、功能、页面和设计原则。
B端管理系统都是各个模块的有机结合，保证系统的正常运转，这点和人体系统一样，比如消化、呼吸、循环系统等等。从本期开始，贝格前端工场将详细B端各个模块，一共分为20期，本期是第一期，欢迎老铁们持续关注。B端的用户管理指的是针对企业或者组织内部的业务用户进行管理和控制的一种系统功能。在B端（BusinesstoBusiness）场景中，企业通常需要对其内部员工、合作伙伴、供应商等业务用户进行管理，以确
钉钉企业应用开发系列：前端实现钉钉扫码登录功能脑袋大大的钉钉生态创业者专栏钉钉前端第三方登录
本文将围绕“钉钉扫码登录”这一功能点展开讲解，并结合前端技术栈（HTML+JavaScript+Vue3）进行实现。我们将通过调用钉钉开放平台提供的JSAPI来实现扫码登录的功能，并展示完整的代码示例。一、前置准备1.注册钉钉开发者账号并创建企业应用访问钉钉开放平台。创建一个企业内部应用或第三方企业应用。获取corpId和redirect_uri等信息，用于后续配置。2.获取扫码登录权限确保你的应
京东携手HarmonyOS SDK首发家电AR高精摆放功能
在电商行业的演进中，商品的呈现方式不断升级：从文字、图片到视频，再到如今逐渐兴起的3D与AR技术。作为XR应用探索的先行者，京东正站在这场体验革新的最前沿，不断突破商品展示的边界，致力于通过创新技术让消费者的选购过程更加直观、真实和高效。“3D技术能够提供更逼真的视觉呈现、更沉浸的交互体验，让消费者"所见即所得”，帮助品牌更好实现与用户的深入连接，“3D信息流"将成为下一代内容形态的重要载体。”-
Seaborn高阶玩法全解析：从复杂图表到多图布局的可视化实战指南
数据可视化就像给数据“画肖像”——初级阶段是勾勒轮廓，高级阶段则是赋予灵魂。在Python可视化生态中，Seaborn凭借“一行代码出美图”的优雅，成为数据分析的“画笔利器”。但你是否遇到过这样的场景：想同时展示数据分布与统计量，却被基础图表限制；想批量绘制分面图，手动拼接效率低下；想让图表更具设计感，却对颜色搭配和注解技巧一知半解？本文将带你解锁Seaborn的高阶玩法，从复杂图表绘制到多图布局
使用 p6spy，拦截到持久层执行的sql及参数 Peter-OK 一些问题 p6spy sql
声明：文章内容是自己使用后整理，大部分工具代码出自大牛，但因无法确认出处，故仅在此处由衷的对无私分享源代码的作者表示感谢与致敬！本人在拦截到sql的基础上加了分析功能和异常告警功能1、导入p6spy的jar包，如果是maven项目引入pomp6spyp6spy3.9.12、修改datasource数据源的driverClassName驱动和url地址为com.p6spy.engine.spy.P6
uniapp [安卓苹果App端] - 实现获取请求手机位置权限+开启定位获取经纬度/省市区地址等，检测权限手机定位是否开启并引导用户同意授权，uniApp app端调用本机开启本机定位权限及IP属地前端开发大师鸭 +Uniapp 开发问题汇总 uni-app 手机定位权限手机位置权限 uniapp安卓苹果系统权限用户拒绝定位权限后怎么办开启位置并获取IP定位数据经纬度及省市区县详细地址数据
前言网上的教程乱七八糟且兼容性太差，本文提供优质示例。在uni-appApp端（安卓APP|苹果APP）开发中，详解在app平台端实现获取手机位置权限及开启定位功能（原生实现不依赖第三方插件和地图），有权限则开启位置定位获取用户经纬度+IP属地+省市区县详细地址数据等操作，反之无权限则提示开启位置权限与引导用户授权操作，uniAppapp端实现判断是否拥有定位权限及提示引导用户授权同意，完美兼容安
Vue侧边索引跳转
Vue侧边索引跳转效果如图所示：首先要去除不存在的几个首字母（我刚开始没有去除，于是前面是还很正常的跳转，后面就会有偏差，这图看上去点击的和跳转的有偏差，实际上是没有的哈）需要跳转的列表要先排好序要明白侧边的索引和列表的index是一一对应的，所以index是关键获取到索引的index，找到列表对应的index，将列表index的offsetTop赋值给document.documentEleme
scanpy保存图片的常用方法汇总 Bio Coder 空间转录组 &单细胞 scanpy 保存图片汇总
在使用Scanpy（一个用于单细胞RNA测序数据分析的Python库）时，保存图片（如可视化结果）是常见的操作。Scanpy的绘图功能主要基于Matplotlib和Seaborn，保存图片的方法也与这些库的保存机制一致。以下是Scanpy保存图片的详细方法及注意事项：1.基本保存图片的方法Scanpy的绘图函数（如sc.pl.umap、sc.pl.tsne、sc.pl.pca等）通常会返回Matp
MCP Streamable HTTP 样例（qbit） pythonagent
前言模型上下文协议（ModelContextProtocol，MCP），是由Anthropic推出的开源协议，旨在实现大语言模型与外部数据源和工具的集成，用来在大模型和数据源之间建立安全双向的连接。本文代码技术栈Python3.11.8FastMCP2.10.3MCP的传输机制StandardInput/Output(stdio)StreamableHTTPServer-SentEvents(SS
2025 轻松部署 ERPNext linux
在数字化转型浪潮不断推进的2025年，企业对高效、灵活的企业资源计划（ERP）系统需求日益增长。作为一款开源且功能全面的ERP系统，ERPNext以其模块化、易用性和强大的自定义能力，受到越来越多中小企业的青睐。然而，部署ERPNext仍然是许多企业信息化过程中的一大挑战。本文将介绍如何借助云平台实现快速、轻松、安全地部署ERPNext系统。什么是ERPNext？ERPNext是一个开源的ERP系
掌握变量命名与Python继承机制
掌握变量命名与Python继承机制背景简介在编程中，变量命名和继承是基础且重要的概念。良好的命名习惯可以提升代码的可读性，而继承则是一种代码复用的重要机制。本文将结合具体的书籍章节内容，深入解析变量命名规则和Python继承机制。变量命名规则变量命名是编程中最基础的部分，而正确的命名习惯能够帮助其他开发者（或未来的自己）更好地理解代码。根据书籍提供的内容，我们应当遵守以下规则：变量名只包含数字、下
华为手机手机与计算机传输,如何将华为手机的视频传到华为的电脑上？手机与电脑数据互传操作步骤... 人人保华为手机手机与计算机传输
手机与电脑数据互传操作bai步骤如下：1、手机du通过原装USB数据线与电脑相连，待zhi电脑自行dao安装驱动，并确认驱动安装成功，如下图所示：注：如驱动未安装成功，可通过安装HiSuite软件进行辅助驱动安装或者通过选择端口模式中的帮助进行电脑驱动安装。(1)在手机端弹出的对话框选择“是，访问数据”(2)在手机下拉菜单中USB连接方式中选择设备文件管理(MTP)注：关于设备文件管理(MTP)和
从零开始：构建支持上下文窗口的AI原生应用实战指南 AI天才研究院 AI人工智能与大数据 AI-native ai
从零开始：构建支持上下文窗口的AI原生应用实战指南关键词：大语言模型（LLM）、上下文窗口、AI原生应用、token管理、对话状态保持、向量检索、记忆压缩摘要：本文从AI原生应用的核心需求出发，系统讲解支持上下文窗口的应用构建全流程。通过解析上下文窗口的技术本质、关键挑战及解决方案，结合Python代码实战和真实场景案例，帮助开发者掌握从需求分析到落地部署的完整方法。内容涵盖上下文窗口管理策略、t
稀缺工具，效率拉满！
在办公场景中，图像和文档是最常接触的两类文件类型。日常工作中经常需要对多个文件进行批量处理，如图片转文档、PDF文件空白页删除、PDF转双层、图片校正等操作。这些重复性操作如果逐个处理不但效率极低下，还可能出现错误，而利用批量操作工具。可以快速完成大量文件的批量操作；分享一款高效的文档、图片批量操作工具：图档批处理助手v1.2.1；图档批处理助手是一款专注于高效处理文档与图像批任务的轻量级工具，软
RK35xx cpu无法调频的可能原因
RK35xxcpu无法调频的可能原因1、开发环境2、问题描述3、问题解析3.1收集log信息3.2分析问题4、验证5、结论1、开发环境芯片型号：rk3568kernel版本：linux4.192、问题描述用户想动态调控CPU的频率，正常来说，在系统目录/sys/devices/system/cpu/cpu0/cpufreq/下是可以进行动态调频的;不正常的情况下就是没有/sys/devices/s
量子计算的数学地基：解码希尔伯特空间的魔法牧之112 量子计算
在科技圈，“量子计算”早已不是陌生的名词。从谷歌的“量子霸权”实验到IBM的量子云服务，从药物研发的分子模拟到密码学的革命性突破，量子计算正以颠覆式的姿态重塑着人类对计算的认知。但在这些令人惊叹的应用背后，藏着一个关键的数学基石——希尔伯特空间（HilbertSpace）。它像一片隐形的“量子舞台”，支撑着量子比特的叠加、纠缠与计算，是理解量子计算本质绕不开的概念。一、从“普通空间”到“量子空间”
新时代的开始，华为开源仓颉编程语言！
7月30日，华为即将开源自研的仓颉编程语言。仓颉这个名字很有意思。传说中的仓颉创造了汉字，开启了中华文明的文字时代。华为用这个名字，体现了对中华文化的致敬。从2020年开始研发，到去年首次亮相，再到现在的全面开源，华为用了5年时间。说起仓颉诞生的背景，不得不提到2019年后美国对华为的技术封锁。当时，华为在芯片、操作系统、软件生态等多个领域都面临"卡脖子"的困境。在这种情况下，华为选择了一条更艰难
C++树状数组详解浩瀚星辰2024 java 算法数据结构
C++树状数组深度解析第1章引言：为什么需要树状数组1.1动态序列处理的挑战在现代计算机科学中，我们经常需要处理动态变化的序列数据，这类数据具有以下特点：实时更新：数据点会随时间不断变化频繁查询：需要快速获取特定区间的统计信息大规模数据：通常涉及数百万甚至数十亿个数据点考虑一个实时股票分析系统：需要监控数千只股票的价格变化，并实时计算：某只股票在特定时间段内的平均价格多只股票之间的价格相关性价格波
西门子PLC 1500联合Factory io进行液位控制PID仿真
西门子PLC1500联合Factoryio进行液位控制PID仿真项目调试视频地址：点击查看考虑到大家都是学习用到的，我把仿真的所有资源还是打包上传到了网盘，链接放到了文章的最后，大家自行下载吧！希望我的作品能起到抛砖引玉的效果，期待大家更好的作品！内容总览1.项目构思2.电气图纸设计3.仿真环境硬件组态（FactoryIo）4.PLC程序组态(TIAV15.1)5.触摸屏程序组态(TP1200)6
题解：P13017 [GESP202506 七级] 线图 YLCHUP 刷题之路算法图论深度优先数学建模 c++数据结构笔记
首先明白定义：线图L(G)L(G)L(G)的顶点对应原图GGG的边，当且仅当原图中的两条边有公共顶点时，对应的线图顶点之间有一条边。不难想到，对于原图中的每个顶点vvv，其度数d(v)d(v)d(v)对应的边集可以形成(d(v)2)\binom{d(v)}{2}(2d(v))对相邻边。每对相邻边在线图中会产生一条边。用公式表示就是这样的（设G=(V,E)G=(V,E)G=(V,E)）：∣EL(G)
如何将照片从 iPhone 传输到华为的 5 种方法 Coolmuster iPhone 华为手机 iOS iphone 华为 ios
随着技术的快速发展，华为作为5G智能手机的领军企业之一，吸引了大量iPhone用户转用华为手机。但是，如何将iPhone上的照片传输到华为，对许多人来说一直是个难题。尽管iPhone和华为运行着完全不同的操作系统，但我们还是找到了一些简单有效的方法来实现照片的传输。第1部分.如何使用计算机将照片从iPhone传输到华为1.1如何通过CoolmusterMobileTransfer将照片从iPhon
最近AI领域大火的MCP到底是什么？
文章目录AI领域的MCP（ModelContextProtocol）入门详解1.MCP是什么？2.为什么需要MCP？3.MCP的架构与运作方式4.MCP的核心优势5.实际应用场景6.MCP与相关技术的区别7.MCP开发实战：如何编写一个MCPServer？核心步骤小白也能用的工具8.MCP与区块链的深度融合为什么需要区块链？具体结合方式9.MCP的潜在挑战技术难点现实问题10.未来展望与学习路径M
深入剖析开源AI阅读器项目Saga Reader基于大模型的文本转换与富文本渲染优化方案魑魅丶小鬼人工智能
引言AI阅读器作为一种新型的内容消费工具，正在改变人们获取和处理信息的方式。本文将介绍SagaReader项目中如何利用大型语言模型(LLM)进行网页内容抓取、智能优化和富文本渲染，特别是如何通过精心设计的提示词(prompt)引导LLM生成样式丰富的HTML内容，提升用户阅读体验。关于SagaReader基于Tauri开发的著名开源AI驱动的智库式阅读器（前端部分使用Web框架），能根据用户指定
python进程线程协程区别_Python：线程、进程与协程(1)——概念 weixin_39989159 python进程线程协程区别
最近的业余时间主要放在了学习Python线程、进程和协程里，第一次用python的多线程和多进程是在两个月前，当时只是简单的看了几篇博文然后就跟着用，没有仔细去研究，第一次用的感觉它们其实挺简单的，最近这段时间通过看书，看Python中文官方文档等等相关资料，发现并没有想想中的那么简单，很多知识点需要仔细去理解，Python线程、进程和协程应该是Python的高级用法。Python的高级用法有很多
一周掌握Flutter开发--7、包管理心上之秋 flutter 前端
TableofContents7.包管理核心工具7.1`pubspec.yaml`：依赖管理文件常用包7.2`cached_network_image`(图片缓存)7.3`flutter_bloc`(状态管理)7.4`get`(路由+状态管理)总结7.包管理包管理是Flutter开发中的重要环节，通过合理使用第三方包可以显著提高开发效率。Flutter使用pubspec.yaml文件来管理依赖，开
全栈运维的“诅咒”与“荣光”：为什么“万金油”工程师是项目成功的隐藏MVP？云原生水神职业发展系统运维运维
大家好，今天，我们来聊一个特殊且至关重要的群体：运维工程师。特别是那些在项目制中，以一己之力扛起一个或多个产品生死的“全能战士”。你是否就是其中一员？你的技能树上点亮了：操作系统、网络协议、mysql与Redis中间件、Docker与K8s容器化、Ansible与Terraform自动化、Go/Python工具开发、Prometheus监控体系、opentelemetry可视化，甚至要负责信息安全
Nginx中如何配置WebSocket代理？ m0_74824025 面试学习路线阿里巴巴 nginx websocket 运维
Nginx可以配置为WebSocket代理，将WebSocket连接从客户端转发到后端服务器。以下是如何在Nginx中配置WebSocket代理的详细步骤和示例配置。1.安装Nginx确保你已经安装了Nginx。如果没有安装，可以使用以下命令进行安装：sudoapt-getupdatesudoapt-getinstallnginx2.配置WebSocket代理编辑Nginx配置文件，通常位于/et
springboot通过aop实现全局日志(是否自定义注解都可以) 甜无能 springboot java #aop spring boot java aop 全局日志自定义注解
内容参考自以下两个链接1、springboot中使用AOP切面完成全局日志_aop全局日志_邹飞鸣的博客-CSDN博客使用AOP记录日志_aop日志_trusause的博客-CSDN博客第一个链接思路很清晰,讲的也很详细,第二个链接讲了自定义注解为了便于自己理解做了以下整理目录1.aspectj基本概念2.添加aop依赖3.进行切面处理(1)切面类(2)自定义注解(3)controller和ser
Char Studio 使用入门：高效构建企业级对话系统的实战指南 charles666666 人工智能产品经理语言模型自然语言处理架构
数字化浪潮推动下，企业与用户的交互模式正经历深刻变革，对话系统作为核心交互手段，其重要性日益凸显。然而，众多企业在构建对话系统时，却深陷诸多困境，难以自拔。一、开篇痛点场景：企业对话系统开发的典型困境企业在自行开发对话系统时，往往面临预算超支、周期漫长以及维护成本居高不下等问题。开发团队需要投入大量时间和精力进行底层技术架构的搭建，例如自然语言处理算法的研究、对话逻辑的设计等，这不仅消耗了大量的人
Nginx代理websocket连接为什么要做囚徒 nginx nginx websocket 运维
文章目录Nginx代理websocket连接1.引言2.为什么需要Nginx代理WebSocket3.Nginx代理WebSocket的实现步骤步骤1：确保Nginx支持WebSocket步骤2：修改Nginx配置文件步骤3：重启Nginx服务步骤4：验证配置Nginx代理websocket连接1.引言WebSocket是一种在单个TCP连接上进行全双工通讯的协议，它在Web应用程序中提供了实时通
关于旗正规则引擎下载页面需要弹窗保存到本地目录的问题何必如此 jsp 超链接文件下载窗口
生成下载页面是需要选择“录入提交页面”，生成之后默认的下载页面<a>标签超链接为：<a href="<%=root_stimage%>stimage/image.jsp?filename=<%=strfile234%>&attachname=<%=java.net.URLEncoder.encode(file234filesourc
【Spark九十八】Standalone Cluster Mode下的资源调度源代码分析 bit1129 cluster
在分析源代码之前，首先对Standalone Cluster Mode的资源调度有一个基本的认识：首先，运行一个Application需要Driver进程和一组Executor进程。在Standalone Cluster Mode下，Driver和Executor都是在Master的监护下给Worker发消息创建(Driver进程和Executor进程都需要分配内存和CPU，这就需要Maste
linux上独立安装部署spark daizj linux 安装 spark 1.4 部署
下面讲一下linux上安装spark，以 Standalone Mode 安装 1）首先安装JDK 下载JDK：jdk-7u79-linux-x64.tar.gz ，版本是1.7以上都行，解压 tar -zxvf jdk-7u79-linux-x64.tar.gz 然后配置 ~/.bashrc&nb
Java 字节码之解析一周凡杨 java 字节码 javap
一： Java 字节代码的组织形式类文件 { OxCAFEBABE ，小版本号，大版本号，常量池大小，常量池数组，访问控制标记，当前类信息，父类信息，实现的接口个数，实现的接口信息数组，域个数，域信息数组，方法个数，方法信息数组，属性个数，属性信息数组 } &nbs
java各种小工具代码 g21121 java
1.数组转换成List import java.util.Arrays; Arrays.asList(Object[] obj); 2.判断一个String型是否有值 import org.springframework.util.StringUtils; if (StringUtils.hasText(str)) 3.判断一个List是否有值 import org.spring
加快FineReport报表设计的几个心得体会老A不折腾 finereport
一、从远程服务器大批量取数进行表样设计时，最好按“列顺序”取一个“空的SQL语句”，这样可提高设计速度。否则每次设计时模板均要从远程读取数据，速度相当慢！！二、找一个富文本编辑软件（如NOTEPAD+）编辑SQL语句，这样会很好地检查语法。有时候带参数较多检查语法复杂时，结合FineReport中生成的日志，再找一个第三方数据库访问软件（如PL/SQL）进行数据检索，可以很快定位语法错误。
mysql linux启动与停止墙头上一根草
如何启动/停止/重启MySQL一、启动方式1、使用 service 启动：service mysqld start2、使用 mysqld 脚本启动：/etc/inint.d/mysqld start3、使用 safe_mysqld 启动：safe_mysqld&二、停止1、使用 service 启动：service mysqld stop2、使用 mysqld 脚本启动：/etc/inin
Spring中事务管理浅谈 aijuans spring 事务管理
Spring中事务管理浅谈 By Tony Jiang@2012-1-20 Spring中对事务的声明式管理拿一个XML举例 [html] view plain copy print ? <?xml version="1.0" encoding="UTF-8"?>&nb
php中隐形字符65279（utf-8的BOM头）问题 alxw4616
php中隐形字符65279（utf-8的BOM头）问题今天遇到一个问题. php输出JSON 前端在解析时发生问题:parsererror. 调试: 1.仔细对比字符串发现字符串拼写正确.怀疑是非打印字符的问题. 2.逐一将字符串还原为unicode编码. 发现在字符串头的位置出现了一个 65279的非打印字符.
调用对象是否需要传递对象(初学者一定要注意这个问题) 百合不是茶对象的传递与调用技巧
类和对象的简单的复习,在做项目的过程中有时候不知道怎样来调用类创建的对象,简单的几个类可以看清楚,一般在项目中创建十几个类往往就不知道怎么来看为了以后能够看清楚,现在来回顾一下类和对象的创建,对象的调用和传递(前面写过一篇) 类和对象的基础概念: JAVA中万事万物都是类类有字段(属性),方法,嵌套类和嵌套接
JDK1.5 AtomicLong实例 bijian1013 java thread java多线程 AtomicLong
JDK1.5 AtomicLong实例类 AtomicLong 可以用原子方式更新的 long 值。有关原子变量属性的描述，请参阅 java.util.concurrent.atomic 包规范。AtomicLong 可用在应用程序中（如以原子方式增加的序列号），并且不能用于替换 Long。但是，此类确实扩展了 Number，允许那些处理基于数字类的工具和实用工具进行统一访问。
自定义的RPC的Java实现 bijian1013 java rpc
网上看到纯java实现的RPC，很不错。 RPC的全名Remote Process Call，即远程过程调用。使用RPC，可以像使用本地的程序一样使用远程服务器上的程序。下面是一个简单的RPC 调用实例，从中可以看到RPC如何
【RPC框架Hessian一】Hessian RPC Hello World bit1129 Hello world
什么是Hessian The Hessian binary web service protocol makes web services usable without requiring a large framework, and without learning yet another alphabet soup of protocols. Because it is a binary p
【Spark九十五】Spark Shell操作Spark SQL bit1129 shell
在Spark Shell上，通过创建HiveContext可以直接进行Hive操作 1. 操作Hive中已存在的表 [hadoop@hadoop bin]$ ./spark-shell Spark assembly has been built with Hive, including Datanucleus jars on classpath Welcom
F5　往header加入客户端的ip ronin47
when HTTP_RESPONSE {if {[HTTP::is_redirect]}{ HTTP::header replace Location [string map {:port/ /} [HTTP::header value Location]]HTTP::header replace Lo
java-61-在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差. 求所有数对之差的最大值。例如在数组{2, 4, 1, 16, 7, 5, bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/2541117420116135376632/ 写了个java版的 public class GreatestLeftRightDiff { /** * Q61.在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差。 * 求所有数对之差的最大值。例如在数组
mongoDB 索引开窍的石头 mongoDB索引
在这一节中我们讲讲在mongo中如何创建索引得到当前查询的索引信息 db.user.find(_id:12).explain(); cursor: basicCoursor 指的是没有索引 &
[硬件和系统]迎峰度夏 comsci 系统
从这几天的气温来看，今年夏天的高温天气可能会维持在一个比较长的时间内所以，从现在开始准备渡过炎热的夏天。。。。每间房屋要有一个落地电风扇，一个空调(空调的功率和房间的面积有密切的关系) 坐的，躺的地方要有凉垫，床上要有凉席电脑的机箱
基于ThinkPHP开发的公司官网 cuiyadll 行业系统
后端基于ThinkPHP，前端基于jQuery和BootstrapCo.MZ 企业系统轻量级企业网站管理系统运行环境:PHP5.3+, MySQL5.0 系统预览系统下载：http://www.tecmz.com 预览地址：http://co.tecmz.com 各种设备自适应响应式的网站设计能够对用户产生友好度，并且对于
Transaction and redelivery in JMS (JMS的事务和失败消息重发机制) darrenzhu jms 事务承认 MQ acknowledge
JMS Message Delivery Reliability and Acknowledgement Patterns http://wso2.com/library/articles/2013/01/jms-message-delivery-reliability-acknowledgement-patterns/ Transaction and redelivery in
Centos添加硬盘完全教程 dcj3sjt126com linux centos hardware
Linux的硬盘识别: sda 表示第1块SCSI硬盘 hda 表示第1块IDE硬盘 scd0 表示第1个USB光驱一般使用“fdisk -l”命
yii2 restful web服务路由 dcj3sjt126com PHP yii2
路由随着资源和控制器类准备，您可以使用URL如 http://localhost/index.php?r=user/create访问资源，类似于你可以用正常的Web应用程序做法。在实践中，你通常要用美观的URL并采取有优势的HTTP动词。例如，请求POST /users意味着访问user/create动作。这可以很容易地通过配置urlManager应用程序组件来完成如下所示
MongoDB查询(4)——游标和分页[八] eksliang mongodb MongoDB游标 MongoDB深分页
转载请出自出处：http://eksliang.iteye.com/blog/2177567 一、游标数据库使用游标返回find的执行结果。客户端对游标的实现通常能够对最终结果进行有效控制，从shell中定义一个游标非常简单，就是将查询结果分配给一个变量（用var声明的变量就是局部变量），便创建了一个游标，如下所示： > var
Activity的四种启动模式和onNewIntent() gundumw100 android
Android中Activity启动模式详解　　在Android中每个界面都是一个Activity，切换界面操作其实是多个不同Activity之间的实例化操作。在Android中Activity的启动模式决定了Activity的启动运行方式。　　Android总Activity的启动模式分为四种： Activity启动模式设置： <acti
攻城狮送女友的CSS3生日蛋糕 ini html Web html5 css css3
在线预览：http://keleyi.com/keleyi/phtml/html5/29.htm 代码如下： <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>攻城狮送女友的CSS3生日蛋糕-柯乐义<
读源码学Servlet（1）GenericServlet 源码分析 jzinfo tomcat Web servlet 网络应用网络协议
Servlet API的核心就是javax.servlet.Servlet接口，所有的Servlet 类（抽象的或者自己写的）都必须实现这个接口。在Servlet接口中定义了5个方法，其中有3个方法是由Servlet 容器在Servlet的生命周期的不同阶段来调用的特定方法。先看javax.servlet.servlet接口源码： package
JAVA进阶：VO(DTO)与PO(DAO)之间的转换 snoopy7713 java VO Hibernate po
PO即 Persistence Object　　VO即 Value Object 　VO和PO的主要区别在于：　　VO是独立的Java Object。　　PO是由Hibernate纳入其实体容器（Entity Map）的对象，它代表了与数据库中某条记录对应的Hibernate实体，PO的变化在事务提交时将反应到实际数据库中。　实际上，这个VO被用作Data Transfer
mongodb group by date 聚合查询日期统计每天数据（信息量） qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 1 */ { "_id" : ObjectId("557ac1e2153c43c320393d9d"), "msgType" : "text", "sendTime" : ISODate("2015-06-12T11:26:26.000Z")
java之18天常用的类(一) Luob. Math Date System Runtime Rundom
System类 import java.util.Properties; /** * System: * out:标准输出,默认是控制台 * in:标准输入,默认是键盘 * * 描述系统的一些信息 * 获取系统的属性信息:Properties getProperties(); * * * */ public class Sy
maven wuai maven
1、安装maven：解压缩、添加M2_HOME、添加环境变量path 2、创建maven_home文件夹，创建项目mvn_ch01,在其下面建立src、pom.xml，在src下面简历main、test、main下面建立java文件夹 3、编写类，在java文件夹下面依照类的包逐层创建文件夹，将此类放入最后一级文件夹 4、进入mvn_ch01 4.1、mvn compile ,执行后会在

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他