pfm685757

有关 Python 2 和 Sublime Text 中文 Unicode 编码问题的分析与理解

这是一个创建于 127 天前的主题，其中的信息可能已经有所发展或是发生改变。

TL;DR

问题背景：

相信很多用 Sublime Text 来写 Python 2 的同学都遇到过以下这个问题（例如这位同学 /t/100435 和这位同学 /t/163012 ）：
在 Sublime Text 里用 Cmd (Ctrl) + B 运行代码 print u'中文'，想要打印出 unicode 类型的字符串时，会出现以下报错：

UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordinal not in range(128)

传说中的 Python 2 编码坑（笑）

而同样的 print u'中文' 代码在 Mac 的终端里却能正常打印出 “中文” 结果，没有任何报错。

虽然在网上能查到多种解决方法，但一直以来知其然而不知其所以然，不了解为什么那些方法能解决问题的真正原因，也不知道为什么同样的代码在终端里就可以运行而在 Sublime Text 里就不行了？

因此我研究学习了下这个问题相关的一些 Python 2 编码问题，在这里分享下我的理解。

以下属于新手向，参考了网上多篇文章，如有错误，望指正。

先说下我的环境：

Mac OS X
Python 2.7
Sublime Text 3

分析：

Python 在向控制台 (console) print 的时候，因为控制台只能看得懂由 bytes（字节序列）组成的字符串，而 Python 中 "unicode" 对象存储的是 code points（码点），因此 Python 需要将输出中的 "unicode" 对象用编码转换为储存 bytes（字节序列）的 "str" 对象后，才能进行输出。

而在报错里看到 UnicodeEncodeError，那就说明 Python 在将 unicode 转换为 str 时使用了错误的编码。而为什么是 'ascii' 编码呢？那是因为 Python 2 的默认编码就是 ASCII，可以通过以下命令来查看 Python 的默认编码：

>>> import sys
>>> print sys.getdefaultencoding()
ascii

所以此时在 Sublime Text 里运行 print u'中文'，实际上等于是运行了：

print u'中文'.encode('ascii')

ASCII 编码无法对 unicode 的中文进行编码，因此就报错了。

那为什么同样的代码 print u'中文' 在 Mac 的终端里却能正常输出中文，难道是因为终端下的 Python 2 的默认编码不是 ASCII？非也，在终端下运行 sys.getdefaultencoding() 结果一样是 ascii。那同样是ascii 为什么会有不同的结果？难倒这里 Python 用了另外一个编码来转换？

是的，其实 Python 在 print unicode 时真正涉及到的是另一组编码：stdin/stdout/stderr 的编码，也就是标准输入、标准输出和标准错误输出的编码。可以通过以下命令来查看，这里是在我的终端下运行的结果：

>>> import sys
>>> print sys.stdin.encoding
UTF-8
>>> print sys.stdout.encoding
UTF-8
>>> print sys.stderr.encoding
UTF-8

在正常情况下，Python 2 在 print unicode 时用来转换的编码并不是 Python 的默认编码 sys.getdefaultencoding()，而是 sys.stdout.encoding 所设的编码。

因为在我的终端下 Python 的 sys.stdout.encoding 编码是 UTF-8，所以在终端里运行 print u'中文'时，实际上是等于运行了：

print u'中文'.encode('UTF-8')

编码正确，运行正常，因此没有报错。

在类 UNIX 系统下，Python 应该是通过环境变量 LC_CTYPE 来判断 stdin/stdout/stderr 的编码的。因此一般只要将 shell 的 LANG 环境变量设置对为 **_**.UTF-8 后，应该就能在终端里直接 print 出 unicode 类型的字符串了，而不需要在 print 时手动加上 .encode('utf-8') 进行编码了。

但在 Sublime Text 里事情就没那么美好了。在 Sublime Text 里运行查看 stdout 编码的命令，发现：

import sys
print sys.stdout.encoding
-----------------------------"""
None
[Finished in 0.1s]

结果甚至不是 'ascii' 而是 None。可能是因为 Sublime Text 的 Build System 是用 subprocess.Popen 来运行 Python 的，导致 Python 无法判断出正确的 stdin/stdout/stderr 编码，于是都变成 None 了。

这种情况也发生在输出的目标是管道的情况下：

$ python -c 'import sys; print sys.stdout.encoding' | tee /tmp/foo.txt
None

那么在这种 sys.stdout.encoding 为 None 情况下的 print unicode 怎么办呢？答案就是 Python 只能很无奈地使用 sys.getdefaultencoding() 的默认编码 ascii 来对 unicode 进行转换了。这样就出现了本文开头所说的那个 UnicodeEncodeError 问题。

总结一下 Python 2 向控制台 `print` 输出时的流程：

Python 启动时，当它发现当前的输出是连接到控制台的时候，它会根据一些环境变量，例如环境变量LC_CTYPE，来设法判断出 sys.stdin/stdout/stderr.encoding 编码值。
当 Python 无法判断出所需的编码时，它会将 sys.stdin/stdout/stderr.encoding 的值设置为 None。
print 时判断字符串是否是 unicode 类型。
如果是的话，并且 sys.stdout.encoding 不为 None 时，就使用 sys.stdout.encoding 编码对 unicode 编码成 str 后输出。

如果 sys.stdout.encoding 为 None 的话，就使用 sys.getdefaultencoding() 默认编码来对 unicode 进行转换成 str 后输出。

if sys.stdout.encoding:
    print unicode.encode(sys.stdout.encoding)
else:
    print unicode.encode(sys.getdefaultencoding())

以上参考： https://wiki.python.org/moin/PrintFails

解决方法：

解决方法 1：

先说最不正确的解决方法：在文件头部加上

import sys
reload(sys)
sys.setdefaultencoding('utf-8')

这种方法通过 dirty hack 的方式在 Python 刚启动时更改了 Python 的默认编码为 utf-8。此后：

>>> print sys.getdefaultencoding()
utf-8

但就本文所讨论的问题来说，这个方法并不是真正地直接解决了问题。就如上述所说，Python 只是在 sys.stdout.encoding 为 None 时才会使用默认编码来转换需要 print 的 unicode 字符串。那万一在 sys.stdout.encoding 存在，但为 ascii 的情况下呢？这样即使更改了 Python 的默认编码，同样还是会出现 UnicodeEncodeError 报错。所以对本问题来说，这个方法治标不治本。

除此之外，很多人都用这个方法来解决 Python 2 下遇到的其它各种各样的编码问题，在 v2ex 的各种 Python 编码问题讨论帖中也常常能见到有人推荐用这个方法来解决问题的。
但实际上很多大牛都不推荐用这个方法来解决 Python 2 的编码问题，这里引用下 StackOverflow 相关回答里的一句话：

the use of sys.setdefaultencoding() has always been discouraged

为什么这个方法不被推荐呢？我们来看下 Python 文档里对这个 function 是怎么说的：

This function is only intended to be used by the site module implementation and, where needed, by sitecustomize. Once used by the site module, it is removed from the sys module’s namespace.

可以看到这个方法原本就不是用户向的方法，并没有打算让用户用这个方法来更改 Python 2 的默认编码。

那为什么不建议我们更改 Python 的默认编码呢？
这里引用 Python 核心开发者、Python Unicode 支持的设计者和实现者： Marc-André Lemburg，他在一个邮件列表上的回复：

The only supported default encodings in Python are:

Python 2.x: ASCII

Python 3.x: UTF-8

If you change these, you are on your own and strange things will
start to happen. The default encoding does not only affect
the translation between Python and the outside world, but also
all internal conversions between 8-bit strings and Unicode.

Hacks like what's happening in the pango module (setting the
default encoding to 'utf-8' by reloading the site module in
order to get the sys.setdefaultencoding() API back) are just
downright wrong and will cause serious problems since Unicode
objects cache their default encoded representation.

Please don't enable the use of a locale based default encoding.

If all you want to achieve is getting the encodings of
stdout and stdin correctly setup for pipes, you should
instead change the .encoding attribute of those (only).

--

Marc-Andre Lemburg

eGenix.com

从此可见，Python 2 唯一支持的内部编码只有 ASCII，更改其默认编码为其它编码可能会导致各种各样奇怪的问题。在这里他也说了使用 sys.setdefaultencoding() 的方法是彻彻底底的错误，正确的方法应该是更改 stdout 和 stdin 的编码。

所以这个方法是最不正确的填坑方法，请大家慎用。

解决方法 2：

然后说说应当是姿势最正确的、也是大家都懂的方法：

在 print 的时候显式地用正确的编码来对 unicode 类型的字符串进行 encode('正确的编码'） 为 str 后，再进行输出。
而在 print 的时候，这个正确的编码一般就是 sys.stdout.encoding 的值。但也正如上述所说，这个值并不是一直是可靠的，因此需要根据所使用的平台和控制台环境来判断出这个正确的编码。

而在 Mac 下这个正确的编码一般都是 utf-8，因此若不考虑跨环境的话，可以无脑地一直用 encode('utf-8') 和 decode('utf-8') 来进行输入输出转换。

在我的经验中，这个策略也是解决 Python 2 其它 unicode 相关编码问题的最佳方法。在 PyCon 2012 的一个演讲中（关于 Python Unicode 问题很好的一个演讲，这里有演讲稿的中文翻译版），对这个方法有一个很形象的比喻：

因为在程序中进进出出的只有存储 bytes（字节序列）的 str。因此最好的策略是将输入的 bytes 马上解码成 unicode，而在程序内部中均使用 unicode，而当在进行输出的时候，尽早将之编码成 bytes。

也就是要形成一个 Unicode 三明治（如图）， bytes 在外， Unicode 在内。在边界的地方尽早进行 decode和 encode。不要在内部混用 str 和 unicode，尽可能地让程序处理的字符串都为 Unicode。

解决方法 3：

虽然解决方法 2 是最正确的方式，但是有时候在 Sublime Text 里调试些小脚本，实在是懒得再在每个 print 语句后面写一个尾巴 .encode('utf-8')。那么有没有办法能让 Sublime Text 像在终端里一样直接就能print u'中文' 呢？也就是说能不能解决 sys.stdin/stdout/stderr.encoding 为 None 的情况呢？

答案肯定是有的，一种方法是用类似更改默认编码的方法一样，用 dirty hack 的方式在 Python 代码中去显式地更改 sys.stdin/stdout/stderr.encoding 的值。一样是不推荐，我也没尝试过，在这里就不详说了。

另一种方法则是通过设置 PYTHONIOENCODING 环境变量来强制要求 Python 设置 stdin/stdout/stderr 的编码值为我们想要的，这是一个相对比较干净的解决方法。见文档：

PYTHONIOENCODING

Overrides the encoding used for stdin/stdout/stderr, in the syntax encodingname:errorhandler. The :errorhandler part is optional and has the same meaning as in str.encode().

New in version 2.6.

在 Mac 下对全局 GUI 程序设置环境变量的方法是：使用 launchctl setenv <<key> <value>, ...> 命令对所有 launchd 启动的未来子进程设置环境变量。

在这里顺便科普下，为什么对所有 launchd 启动的未来子进程设置环境变量可以使得对 Mac 下所有 GUI 程序生效。这是因为 launchd 是 OS X 系统启动后运行的第一个非内核进程。我们可以在 activity monitor（活动监视器）里看到，它的 pid 是很帅气的 1。而之后所有的进程都将是它的子进程。
另外还可以通过 launchd 在 Mac 下实现类 crontab 的功能。

launchctl setenv 命令设置的全局环境变量会在电脑重启后失效，因此就需要通过上面说的 launchd 的开机启动任务的功能来在重启后再设置一遍环境变量，其配置方法可以参考这里。也因为这个原因，我并没有使用这个方法来设置 PYTHONIOENCODING 环境变量。

而 Sublime Text 提供了一个设置 Build System 环境变量的方法，这个方法各平台的 Sublime Text 都适用。

设置 Sublime Text 的 Python Build System 环境变量的步骤如下：

将 Sublime Text 默认的 Python Build System 的配置文件 Python.sublime-build（找到这个文件的最好方法是安装插件 PackageResourceViewer）复制一份到 Sublime Text 的 /Packages/User 文件夹下（在 Mac 和 Sublime Text 3 下这个路径是 ~/Library/Application Support/Sublime Text 3/Packages/User）。
打开编辑新复制来的 Python.sublime-build 文件，如下加上一行设置 PYTHONIOENCODING 环境变量为 UTF-8 编码的内容，并保存：

{
    "shell_cmd": "python -u \"$file\"",
    "file_regex": "^[ ]*File \"(...*?)\", line ([0-9]*)",
+   "env": {"PYTHONIOENCODING": "utf8"},
    "selector": "source.python"
}

这样一来终于在这么长的文章后能在 Sublime Text 里直接运行 print u'中文'，而不用再出现万恶的 UnicodeEncodeError 了。

既然都研究到这了，不妨我们试试把 PYTHONIOENCODING 设置成其它编码看看会出现什么情况，例如设置成简体中文 Windows 的默认编码 cp936："env": {"PYTHONIOENCODING": "cp936"}

import sys
print sys.stdout.encoding
print u'你好'
----------------------------------"""
cp936
[Decode error - output not utf-8]
[Finished in 0.1s]

[Decode error - output not utf-8]，这就是 Sublime Text 在 Windows 下可能会出现的问题（例如这两位同学 /t/45391 /t/88428 ）。这是因为 Sublime Text 的 Build System 默认是用 utf-8 编码去解读运行的输出的，而我们指定了让 Python 用 cp936 编码来生成 str 字符串进行输出，那么就会出现 Sublime Text 无法识别输出的情况了。
同样在对终端 export PYTHONIOENCODING=cp936 后，在终端下 print u'你好' 输出的就会是 ��这样的乱码。

解决办法之一就是同样在 Python.sublime-build 文件里设置 "env": {"PYTHONIOENCODING": "utf8"} 来使得输出统一为 utf-8。

或者是更改 Sublime Text 的 Build System 所接受的输出编码，将其改为一致的 cp936 编码，同样也是更改 Python.sublime-build 文件，加入一行：

{
    "shell_cmd": "python -u \"$file\"",
    "file_regex": "^[ ]*File \"(...*?)\", line ([0-9]*)",
+   "encoding": "cp936",
    "selector": "source.python"
}

那我们再试试把这两个设置同时都加到 Python.sublime-build 文件里，也就是让 Python 输出 utf8 编码的字符串，而让 Sublime Text 用 cp936 编码来解读，看看会发生什么情况？

{
    "shell_cmd": "python -u \"$file\"",
    "file_regex": "^[ ]*File \"(...*?)\", line ([0-9]*)",
+   "env": {"PYTHONIOENCODING": "utf8"},
+   "encoding": "cp936",
    "selector": "source.python"
}

print u'你好'
----------------------"""
浣犲ソ
[Finished in 0.1s]

笑，居然不是 [Decode error - output not cp936]，而是这么喜感的 “浣犲ソ”！

这是因为 “你好” 的 utf-8 编码刚好和 “浣犲ソ” 的 cp936 编码重合了，都是 '\xe6\xb5\xa3\xe7\x8a\xb2\xe3\x82\xbd'，所以使用 cp936 编码去解读的 Sublime Text 就认为这段字符串就是 “浣犲ソ” 而显示了出来。

>>> print repr('浣犲ソ')  # cp936 编码
'\xe6\xb5\xa3\xe7\x8a\xb2\xe3\x82\xbd'
>>> print repr(u'你好'.encode('utf-8'))  # utf-8 编码
'\xe6\xb5\xa3\xe7\x8a\xb2\xe3\x82\xbd'

附带解决的问题：IDLE 的交互模式里无法输入中文

我偶尔会用 Python 2 自带的 IDLE 快速测试一两行代码，但在我的 Mac 下的 IDLE 交互模式里输入中文会出现报错：

>>> '中文'
Unsupported characters in input

这个问题在 v2ex 上同样有同学问过： /t/44975 ，而他是在 Windows 下出现的，所以这个问题可能是普遍的。我原本以为这个问题同样是因为上述的 stdin/stdout/stderr 的编码问题而造成，就想顺便解决掉。然而即使设置全局环境变量 PYTHONIOENCODING 为 utf-8 后仍旧不管用，IDLE 里输入中文还是会报错，sys.stdin.encoding 编码还依旧是 us-ascii。

后来搜索后发现，貌似这个问题是由 IDLE 输入输出的内部实现机制导致的，可能跟 stdin/stdout/stderr 没有关系。根据这里所说，IDLE 的交互模式下会根据机子的本地语言环境设置来判断编码，再用其对输入进行转换后再执行，而在我的 Mac 下这个编码是 ascii，所以导致了 Unsupported characters in input。

而我搜到了一个可行的解决方法，其通过在 IDLE 的 IO 相关源码（lib/python2.7/idlelib/IOBinding.py）中插入一行代码强行覆盖变量 encoding 的值为 'utf-8' 来解决这个问题。

不过后来经过我测试后发现，在 Mac 下其实更为简单的一个解决方法是，设置 IDLE 的环境变量 LANG 为"en_US.UTF-8"。同样我不想通过 launchctl 设置全局环境变量来解决，而我采用的解决方法是：

打开编辑 IDLE.app/Contents/MacOS/IDLE 文件。
在大概第 24 行的地方插入一行设置环境变量 LANG 的语句：

+   os.environ["LANG"] = "en_US.UTF-8"  # 第 24 行
    os.environ["PYTHONEXECUTABLE"] = executable
    os.environ["DYLD_LIBRARY_PATH"] = libdir

保存文件，重新打开 IDLE 就可以在其交互模式里输入中文了。

编码

Python

unicode

12 回复 | 直到 2015-01-20 23:16:32 +08:00

bitwing 127 天前 ♥ 1

写的好认真...... 中文乱码还真不是 Python2 独有的，在 Win 下最开始接触 jsp 遇到过，写的 Swing 组件包含的中文字符在 Linux 下也是乱码，编译时指定编码为 UTF-8，源文件保存为 UTF-8 无 BOM 格式总算跳过坑了，时间隔得有点久，就记起了这一点。果然是一次编写，处处调试......

est 127 天前

这个问题解决办法很简单：不要用windows + cmd 了

hahastudio 127 天前 ♥ 1

很棒，谁用 Python 再有编码问题就推荐看这篇文章

zealic 127 天前 ♥ 1

写的不错，虽然只有 PYTHONIOENCODING 这个干货，但是来龙去脉讲的很清楚。
可以作为参考文献了。

geeklian 127 天前 via iPhone

写得很棒。
一次又一次跪倒在py2的命令行输出面前

后来懒得折腾，干脆把print全改write了，趁机改py3

laoyuan 127 天前

加精加精

lizheming 127 天前

....一般写着 TL; DR 的不应该是长话短说来一句总结的么....为什么有这么长 OwQ

Sylv 127 天前

@ lizheming 其实我这是 "Too long; Don't read, unless you know what I'm talking about." 的缩写。笑。

imn1 127 天前 ♥ 1

输出对我来说不是问题，个人比较熟悉中日韩及unicode编码，但不熟悉py源码
LZ 写的解决方法我都试过（mac除外），不过能力不足以研究py和st源码，所以写不出这样的好文
反正我习惯全部采用utf8，win下连cmd的默认编码也改成cp65001（相当于utf8）了

现在最头痛是 linux 下用 sublime text 3 编辑输入看不到韩文，汉字和日语都解决了，韩语内的汉字也能显示，就是朝鲜字符在输入过程看不到，但能回车输入（纯粹靠盲打了），google至今无解决方案（估计换成系统韩语默认可能行吧）。这个问题同样出现在gvim，vim因为是使用终端，反而没问题，不过其他编辑器如 geany / leafpad 就没问题……

Sylv 127 天前

@ imn1 我也没能力研究 Python 和 Sublime 的源码，只是总结了下网上的多篇文章，翻了翻文档，加上自己的试验，尝试把这个问题理顺了一遍。

imn1 127 天前

@ Sylv
当初选 py2 / py3 时，因为不做项目，不考虑什么模块兼容问题，但需要 py 处理大量中日韩文本 / 数据，结果试了 N 多 py2 语句都没弄懂它的编码机制，本以为是bytes为主（类似php），试了也不是，然后 py3 试了不到五个语句全部满足我的需求，就不再纠结，直奔 py3

chengzhoukun 125 天前

Windows 下CMD和powershell的编码是'cp936'，坑爹

你可能感兴趣的:(有关 Python 2 和 Sublime Text 中文 Unicode 编码问题的分析与理解)

洛谷P4317 花神的数论题题解 cwplh 题解算法图论
题目传送门本体接主要是对小粉兔大佬的题解的进一步解释。题目中让我们求∏i=1Nsum⁡(i)\prod_{i=1}^N\operatorname{sum}(i)∏i=1Nsum(i)，很明显不能直接暴力枚举求解，因此我们稍微归个类：把sum⁡(i)\operatorname{sum}(i)sum(i)值相同的iii放在一起，假设sum⁡(i)\operatorname{sum}(i)sum(i)值
删除南方CASS10.1批量分幅图框模板里的文字（如批注：）（是CAD插件程序，插件后缀.lsp）发光小阳南方CASS 批量分幅图框模板 CAD插件.lsp
复制下列代码到记事本中，另存并改文件后缀名为.lsp即可在CASS当插件使用(defunc:BatchDelComments(/*error*acadAppdocsfolderfilesfilefullpathdocmspentcount)(vl-load-com);;错误处理函数(defun*error*(msg)(if(anddoc(not(vlax-object-released-pdoc)
基于Simulink的蚁群算法路径规划仿真建模示例 amy_mhd 算法数据库前端 simulink matlab
目录手把手教你学Simulink——基于Simulink的蚁群算法路径规划仿真建模示例一、背景介绍路径规划的重要性蚁群算法的基本原理二、所需工具和环境三、步骤详解步骤1：创建Simulink模型步骤2：定义环境和目标创建环境模型步骤3：集成蚁群算法编写适应度函数实现蚁群算法使用MATLABFunction块步骤4：可视化结果添加XYGraph步骤5：运行仿真并评估性能步骤6：分析结果四、总结手把手
flink读取kafka的数据处理完毕写入redis JinVijay flink kafka redis flink
/**从Kafka读取数据处理完毕写入Redis*/publicclassKafkaToRedis{publicstaticvoidmain(String[]args)throwsException{StreamExecutionEnvironmentenv=StreamExecutionEnvironment.getExecutionEnvironment();//开启checkpointing
浅谈边缘计算与 CDN 融合发展趋势
目录前言一、边缘计算与CDN技术概述1、边缘计算：靠近数据源的高效处理2、CDN：内容分发的加速引擎二、边缘计算与CDN融合的优势1、更低的延迟与更快的响应速度2、减轻云数据中心负载3、提高数据安全性4、优化资源分配三、融合面临的挑战1、节点部署与维护难题2、数据同步与一致性问题3、跨域互操作与标准化缺失四、融合发展趋势1、深度融合与协同优化2、智能化与自动化管理3、安全和隐私保护强化4、跨领域应
【Python训练营打卡】day33 @浙大疏锦行 2301_77865880 MyPython训练营打卡 python
DAY33简单的神经网络知识点回顾：1.PyTorch和cuda的安装2.查看显卡信息的命令行命令（cmd中使用）3.cuda的检查4.简单神经网络的流程a.数据预处理（归一化、转换成张量）b.模型的定义i.继承nn.Module类ii.定义每一个层iii.定义前向传播流程c.定义损失函数和优化器d.定义训练流程e.可视化loss过程预处理补充：注意事项：1.分类任务中，若标签是整数（如0/1/2
python打卡day41@浙大疏锦行风逸hhh python打卡60天行动 python 深度学习计算机视觉
知识回顾1.数据增强2.卷积神经网络定义的写法3.batch归一化：调整一个批次的分布，常用与图像数据4.特征图：只有卷积操作输出的才叫特征图5.调度器：直接修改基础学习率卷积操作常见流程如下：1.输入→卷积层→Batch归一化层（可选）→池化层→激活函数→下一层2.Flatten->Dense(withDropout，可选)->Dense(Output)作业：尝试手动修改下不同的调度器和CNN的
python打卡day52@浙大疏锦行风逸hhh python打卡60天行动 python 深度学习机器学习
知识点回顾：随机种子内参的初始化神经网络调参指南参数的分类调参的顺序各部分参数的调整心得神经网络调参核心实践一、全局随机种子设置（修改src/models/train.py）defset_seed(seed=42):torch.manual_seed(seed)torch.cuda.manual_seed_all(seed)np.random.seed(seed)random.seed(seed)
二维码在视频内容分发中的技术实现与优化策略菜包eo 酷播云视频安全 polyv 音视频网络人工智能
引言：视频传播的技术挑战与二维码解决方案在数字化内容爆炸的时代，视频作为信息传递效率最高的媒介形式，其分发方式一直面临着格式兼容性、存储成本和用户体验的多重挑战。传统视频分享依赖于平台审核和链接传播，不仅受限于第三方规则，还存在加载缓慢、操作复杂等问题。二维码技术作为连接物理世界与数字内容的桥梁，为视频分发提供了全新的技术路径。本文将深入探讨二维码与视频技术的融合应用，从编码原理、性能优化到安全策
如何让视频在特定的网站上播放/禁止播放？（常见的视频防盗链技术之一）菜包eo 教育视频 polyv 视频安全音视频 python java 同态加密
一、需求背景在各行各业中，不论是教育、贸易还是医疗领域，视频内容都存在被盗用的风险。为加强视频安全性，我们可以采取特殊设置措施，例如限制视频仅在高安全性网站播放，或屏蔽高风险网站。那么，具体有哪些方法可以有效保护视频安全呢？二、需求解决通过OVP防盗链技术实现指定网站播放，俗称域名黑白名单。设置网站A白名单，则只允许视频在A网站下播放；设置网站B黑名单，则禁止视频在B网站下播放，可有效防止用户原创
数学视频动画引擎Python库 -- Manim Voiceover 快速入门 Quickstart
文中内容仅限技术学习与代码实践参考，市场存在不确定性，技术分析需谨慎验证，不构成任何投资建议。ManimVoiceover是一个为Manim打造的专注于语音旁白的插件：直接在Python中添加语音旁白：无需使用视频编辑器，即可为Manim视频添加语音旁白。在渲染期间录制旁白：通过简单的命令行界面（参见RecorderService），可使用麦克风在渲染过程中录制语音旁白。使用AI生成旁白：利用多种
Qt Creator自定义控件开发流程君鼎 C++qt c++
QtCreator自定义控件开发流程在Qt5.9Creator中开发自定义控件的完整流程如下，分为设计、实现、集成和测试四个阶段：1.创建自定义控件类(1)新建类文件右键项目→添加新文件→C++Class基类选择QWidget或现有控件（如QPushButton）命名类名（如CustomSlider），勾选“IncludeQWidget”生成头文件（customslider.h）和源文件（cust
深入解析Spring AOP原理：动态代理与实战避坑指南今天你慧了码码码码码码码码码码 Java EE spring java 后端
深入解析SpringAOP原理：动态代理与实战避坑指南你是否曾在Spring中配置了切面却未生效？是否在面试中被问及JDK与CGLib代理的区别时语焉不详？本文将彻底拆解AOP核心机制，助你掌握代理背后的技术本质，解决实际开发中的代理失效难题。一、痛点直击：为什么你的切面不生效？//场景：一个简单的日志切面配置@Aspect@ComponentpublicclassLoggingAspect{@B
3、深入解析物联网传感器与网络技术的应用与发展轮胎技术Tyretek 探索物联网前沿：传感器网络与系统的创新之路物联网传感器无线通信技术
深入解析物联网传感器与网络技术的应用与发展1.引言物联网（IoT）作为现代信息技术的重要组成部分，已经深入到我们生活的方方面面。无论是智能家居、智能城市，还是工业互联网，物联网技术都在发挥着不可替代的作用。本文将重点探讨物联网传感器与网络技术的应用和发展，特别是如何通过先进的传感器和网络技术提升系统的智能化水平。我们将逐步深入了解这些技术的工作原理、应用场景及其优化策略。2.物联网传感器的基本概念
财务资金域——资金管理系统设计庄小焱财务域系统架构设计财务资金域资金管理系统
摘要本文介绍了企业资金管理系统的设计。资金管理是企业财务管理的核心，贯穿于企业生产经营全过程，对企业的资金筹集、流动和分配进行有效管理，以提高资金效率、控制风险、降低成本，帮助企业实现价值最大化。随着企业全球化发展，资金管理面临更严峻挑战。文章详细阐述了资金管理系统的业务背景、业务流程、系统设计、外部对接及相关问题解决方案，旨在构建高效、安全、稳定的资金管理系统，以应对复杂多变的外部环境，满足企业
掌握Three.js材质：从基础到自定义着色器 AWS云计算 Three.js 材质着色器 ShaderMaterial
背景简介在Three.js中，材质是定义对象表面如何与光线交互并呈现给观察者的属性集。选择合适的材质对于创建真实感强的三维场景至关重要。本篇博客将探讨Three.js中不同类型的材质，以及如何利用它们来提升我们的三维模型质感。MeshLambertMaterial和MeshPhongMaterialMeshLambertMaterial是Three.js中用于创建具有柔和阴影的表面的一种材质。通过
python自动打卡程序_用python写的考勤自动打卡程序杨不圆 python自动打卡程序
fromseleniumimportwebdriverimportwebbrowserimporttime,datetimeimportrandomimportconfigparser#自动获取次日，如果有需要可以用这段#defgetday(msg,default=1):#r=input(msg)#ifr=='':#returndefault#returnr#在指定位置读取文件cf=configp
Nuxt.js 数据获取全面指南：从基础到高级实践 vvilkin的学习备忘 Nuxt javascript 开发语言 ecmascript
在现代Web应用开发中，高效、可靠的数据获取是构建优秀用户体验的关键。Nuxt.js作为一个基于Vue.js的元框架，为开发者提供了一套完整的数据获取解决方案，既支持客户端渲染(CSR)，也支持服务器端渲染(SSR)和静态站点生成(SSG)。本文将深入探讨Nuxt.js的各种数据获取方法，分析它们的适用场景，并通过实际示例展示如何在实际项目中应用这些技术。一、Nuxt.js数据获取概述1.1为什么
html预览 webshell,RTLO技术与HTML文件是否可以变为WEBSHELL
一、浅谈RTLO技术我在FreeBuf上到了[APT攻击]趋势科技捕获一次APT攻击活动这篇文章，然后就自己去探探究竟，文章地址在下面RLO控制符是Unicode控制符的一种，使得字符显示从右至左的顺序，攻击者可以利用RTLO技术来达到欺骗目标，从而使得可执行文件的运行。首先Windows系统在解析文件名时，当遇到unicode控制符时，会改变文件名的显示方式，利用这一特性，可以将exe、scr、
Unity HDRP + Azure IoT 的 Python 后端实现与集成方案小赖同学啊 test Technology Precious python unity azure
UnityHDRP+AzureIoT的Python后端实现与集成方案虽然UnityHDRP本身使用C#开发，但我们可以构建Python后端服务支持物联网系统，并与Unity引擎深度集成。以下是完整的实现方案：系统架构MQTT/HTTP控制命令物联网设备AzureIoTHubPython后端服务UnityHDRP引擎AzureDigitalTwinsWeb仪表盘混合现实设备一、Python后端服务实
day40python打卡 qq_58459892 py打开学习人工智能机器学习深度学习
知识点回顾：彩色和灰度图片测试和训练的规范写法：封装在函数中展平操作：除第一个维度batchsize外全部展平dropout操作：训练阶段随机丢弃神经元，测试阶段eval模式关闭dropout作业：仔细学习下测试和训练代码的逻辑，这是基础，这个代码框架后续会一直沿用，后续的重点慢慢就是转向模型定义阶段了。昨天我们介绍了图像数据的格式以及模型定义的过程，发现和之前结构化数据的略有不同，主要差异体现在
【产品经理】程序员别唬我系列之：反向代理码上通天地产品经理产品经理
看见代理二字就冲进来的网监大人，请不要激动，这篇文章说的并不是用来爬墙的代理技术，而且针对Web服务器的一种代理技术～通常我们所说的代理，都是指的客户端向外界发起请求时，并不是直接与目标服务器连接，而是经过一个代理服务器，将所有请求交给代理服务器，由它去负责连接外界的目标服务器，同时从服务器返回的数据，也经过代理服务器，返回到客户端。在外界看来，所有请求都是来自这台代理服务器，这样就成功的将客户端
Redis入门（九）清心歌 #Redis 数据库 redis
Redis地理空间（GEO）简介从版本3.2开始，Redis引入了地理空间支持，允许用户在Redis中存储地理位置信息，并执行一些与地理位置相关的操作。原理将球体转换为平面，区块转换为一点基本命令1.GEOADD-将一个或多个地理位置元素添加到指定的键中。每个位置由经度、纬度和成员名称组成。用途：将一个或多个地理位置元素添加到指定的键中。语法：GEOADDkeylongitudelatitudem
MySQL 中，insert语句中的value与values的区别清心歌 #MySQL 数据库 mysql 数据库 java spring
向表中所有的列插入数据（插入多行数据）：insertinto表名values（列值1，列值2，列值3...列值n），（列值a，列值b，列值c...列值n），...........（列值A，列值B，列值C...列值N）向表中指定的列插入数据（插入单行数据）：insertinto表名（列名1，列名2，列名3...列名n）value（列值1，列值2，列值3...列值n）注意：表名()中列名必须跟valu
基于ZYNQ7000的AD9226采集卡实现（1、采集数据到PL）
目标AD9226为12位，65MHz采样率ADC。基于ZYNQ7010平台，PL端采集AD数据，通过内部AXI总线，将数据搬运到PS的DDR。可以将如上目标分解为3个小目标实现PL采集AD9226模块，采集后的数据为AXIS接口。实现PL侧DMA可搬运AXIS数据到PS的DDR，可配置地址，帧长度，帧数量等。实现PS侧DMA驱动本章节实现第一个小目标：硬件：主控板采集模块模块引脚功能：D0-D11
浅谈企业 SQL 注入漏洞的危害与防御阿贾克斯的黎明网络安全 sql 数据库 web安全
目录浅谈企业SQL注入漏洞的危害与防御一、SQL注入漏洞的现状二、SQL注入带来的风险三、SQL注入漏洞的分类（一）按利用方式分类（二）输出编码（三）使用预编译语句（四）日志监控（五）使用WAF（WebApplicationFirewall）（五）使用WAF（WebApplicationFirewall）（六）代码扫描和培训七、如何第一时间发现正在被SQL注入攻击（一）日志监控（二）蜜罐数据（三）
Java对象哈希值深度解析小W求学之旅 java 哈希算法 spring
在Java开发中，对象的哈希值（hashCode()）是一个看似基础却暗藏玄机的概念。它不仅影响着HashMap、HashSet等集合框架的性能，还涉及到JVM内存模型和对象相等性判断的核心逻辑。本文将从JVM底层实现、哈希冲突处理、性能优化等多个维度，一起深入理解Java对象哈希值的工作原理。一、JVM如何生成默认哈希值？Java中所有类都继承自Object类，其hashCode()方法是一个本
Spring 大文件传输老中断？手把手教你解决问题！小W求学之旅 spring java 后端断点续传大文件上传
最近在项目里搞大文件传输功能，频繁遇到传输中断的糟心事，反复踩坑调试后终于摸索出一套解决方案！这里简单记录分享一下，附上手写代码和时序图。开发文件上传下载功能时，传输大文件就像开盲盒——要么传着传着突然中断，要么直接弹出文件大小超限的报错。其实这些问题都有迹可循，下面就结合具体场景拆解解决方案。一、传输中断的“元凶”大盘点服务器设置太“小气”：Spring默认限制请求体大小，Tomcat等容器还会
深入理解Java锁原理（一）：偏向锁的设计原理与性能优化小W求学之旅锁 java 偏向锁 spring
如果大家对偏向锁有一定了解，可以直接往后看：深入理解Java锁原理（二）：轻量级锁的设计原理到实战优化一、引言在Java多线程编程中，锁是实现线程安全的重要工具。然而，传统的锁机制（如重量级锁）存在较大的性能开销，尤其是在无竞争的场景下。为了优化这种情况，Java6引入了偏向锁（BiasedLocking），它通过预测锁的使用模式，将无竞争场景下的锁获取和释放成本降为零。本文将深入探讨偏向锁的设计
MySQL Buffer Pool 深度解析：从架构设计到性能优化（附详细结构图解）小W求学之旅 mysql 性能优化数据库 spring java BufferPool
在MySQL数据库的世界里，有一个决定性能上限的"神秘仓库"——BufferPool。它就像超市的货架，把最常用的商品（数据）放在最方便拿取的地方，避免每次都要去仓库（磁盘）取货。今天我们就来深入了解BufferPool内部结构，以及它如何在高并发场景下高效工作。一、BufferPool：数据库的"高速缓存"1.1为什么需要BufferPool？想象一下：磁盘读写速度约为100次/秒，而内存读写速
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul