简说Python

愉快地迁移到Python3

“简说Python”，选择“置顶/星标公众号”

福利干货，第一时间送达！

原文链接:https://github.com/arogozhnikov/python3_with_pleasure

作者:arogozhnikov

译者：陈祥安

阅读本文大约26分钟，理论实战学习，老表建议你先收藏，有时间反复看，反复记，反复练。

引言

如今 Python 成为机器学习和大量使用数据操作的科学领域的主流语言; 它拥有各种深度学习框架和完善的数据处理和可视化工具。但是，Python 生态系统在 Python2 和 Python3 中共存，而Python2 仍在数据科学家中使用。到2019年底，也将停止支持 Python2。至于numpy，2018年9月之后任何新功能版本都将只支持Python3。同样的还包括pandas, matplotlib, ipython, jupyter notebook and jupyter lab。所以迁移到python3刻不容缓，当然不止是这些，还有些新特性让我们跟随后面到文章一一进行了解。

使用pathlib处理更好的路径

pathlib 是 Python3 中的一个默认模块，可以帮助你避免使用大量的 os.path.join。

from pathlib import Path

dataset = 'wiki_images'
datasets_root = Path('/path/to/datasets/')
#Navigating inside a directory tree,use:/
train_path = datasets_root / dataset / 'train'
test_path = datasets_root / dataset / 'test'

for image_path in train_path.iterdir():
    with image_path.open() as f: # note, open is a method of Path object
        # do something with an image

不要用字符串链接的形式拼接路径，根据操作系统的不同会出现错误，我们可以使用/结合 pathlib来拼接路径，非常的安全、方便和高可读性。

pathlib 还有很多属性，具体的可以参考pathlib的官方文档，下面列举几个：

from pathlib import Path

a = Path("/data")
b = "test"
c = a / b
print(c)
print(c.exists())  # 路径是否存在
print(c.is_dir())  # 判断是否为文件夹
print(c.parts)  # 分离路径
print(c.with_name('sibling.png'))  # 只修改拓展名, 不会修改源文件
print(c.with_suffix('.jpg'))  # 只修改拓展名, 不会修改源文件
c.chmod(777)  # 修改目录权限
c.rmdir()  # 删除目录

类型提示现在是语言的一部分

一个在 Pycharm 使用Typing的例子:

引入类型提示是为了帮助解决程序日益复杂的问题，IDE可以识别参数的类型进而给用户提示。
关于Tying的具体用法，可以看我之前写的:

运行时类型提示类型检查

除了之前文章提到 mypy 模块继续类型检查以外，还可以使用 enforce 模块进行检查，通过 pip 安装即可，使用示例如下:

import enforce

@enforce.runtime_validation
def foo(text: str) -> None:
    print(text)

foo('Hi')  # ok
foo(5)  # fails

输出

Hi
Traceback (most recent call last):
  File "/Users/chennan/pythonproject/dataanalysis/e.py", line 10, in 
    foo(5)  # fails
  File "/Users/chennan/Desktop/2019/env/lib/python3.6/site-packages/enforce/decorators.py", line 104, in universal
    _args, _kwargs, _ = enforcer.validate_inputs(parameters)
  File "/Users/chennan/Desktop/2019/env/lib/python3.6/site-packages/enforce/enforcers.py", line 86, in validate_inputs
    raise RuntimeTypeError(exception_text)
enforce.exceptions.RuntimeTypeError: 
  The following runtime type errors were encountered:
       Argument 'text' was not of type . Actual type was int.

使用@表示矩阵的乘法

下面我们实现一个最简单的ML模型——l2正则化线性回归(又称岭回归)

# l2-regularized linear regression: || AX - y ||^2 + alpha * ||x||^2 -> min

# Python 2
X = np.linalg.inv(np.dot(A.T, A) + alpha * np.eye(A.shape[1])).dot(A.T.dot(y))
# Python 3
X = np.linalg.inv(A.T @ A + alpha * np.eye(A.shape[1])) @ (A.T @ y)

使用@符号，整个代码变得更可读和方便移植到其他科学计算相关的库，如numpy, cupy, pytorch, tensorflow等。

**通配符的使用

在 Python2 中，递归查找文件不是件容易的事情，即使是使用glob库，但是从 Python3.5 开始，可以通过**通配符简单的实现。

import glob

# Python 2
found_images = (
    glob.glob('/path/*.jpg')
  + glob.glob('/path/*/*.jpg')
  + glob.glob('/path/*/*/*.jpg')
  + glob.glob('/path/*/*/*/*.jpg')
  + glob.glob('/path/*/*/*/*/*.jpg'))

# Python 3
found_images = glob.glob('/path/**/*.jpg', recursive=True)

更好的路径写法是上面提到的 pathlib ，我们可以把代码进一步改写成如下形式。

# Python 3
import pathlib
import glob
found_images = pathlib.Path('/path/').glob('**/*.jpg')

Print函数

虽然 Python3 的 print 加了一对括号，但是这并不影响它的优点。

使用文件描述符的形式将文件写入

print >>sys.stderr, "critical error"      # Python 2
print("critical error", file=sys.stderr)  # Python 3

不使用 str.join 拼接字符串

# Python 3
print(*array, sep='\t')
print(batch, epoch, loss, accuracy, time, sep='\t')

重新定义 print 方法的行为

既然 Python3 中的 print 是一个函数，我们就可以对其进行改写。

# Python 3
_print = print # store the original print function
def print(*args, **kargs):
    pass  # do something useful, e.g. store output to some file

注意：在 Jupyter 中，最好将每个输出记录到一个单独的文件中(跟踪断开连接后发生的情况)，这样就可以覆盖 print 了。

@contextlib.contextmanager
def replace_print():
    import builtins
    _print = print # saving old print function
    # or use some other function here
    builtins.print = lambda *args, **kwargs: _print('new printing', *args, **kwargs)
    yield
    builtins.print = _print

with replace_print():

虽然上面这段代码也能达到重写 print 函数的目的，但是不推荐使用。

print 可以参与列表理解和其他语言构造

# Python 3
result = process(x) if is_valid(x) else print('invalid item: ', x)

数字文字中的下划线(千位分隔符)

在 PEP-515 中引入了在数字中加入下划线。在 Python3 中，下划线可用于整数，浮点和复数，这个下划线起到一个分组的作用

# grouping decimal numbers by thousands
one_million = 1_000_000

# grouping hexadecimal addresses by words
addr = 0xCAFE_F00D

# grouping bits into nibbles in a binary literal
flags = 0b_0011_1111_0100_1110

# same, for string conversions
flags = int('0b_1111_0000', 2)

也就是说10000,你可以写成10_000这种形式。

简单可看的字符串格式化f-string

Python2提供的字符串格式化系统还是不够好，太冗长麻烦，通常我们会写这样一段代码来输出日志信息：

# Python 2
print '{batch:3} {epoch:3} / {total_epochs:3}  accuracy: {acc_mean:0.4f}±{acc_std:0.4f} time: {avg_time:3.2f}'.format(
    batch=batch, epoch=epoch, total_epochs=total_epochs,
    acc_mean=numpy.mean(accuracies), acc_std=numpy.std(accuracies),
    avg_time=time / len(data_batch)
)

# Python 2 (too error-prone during fast modifications, please avoid):
print '{:3} {:3} / {:3}  accuracy: {:0.4f}±{:0.4f} time: {:3.2f}'.format(
    batch, epoch, total_epochs, numpy.mean(accuracies), numpy.std(accuracies),
    time / len(data_batch)
)

输出结果为

120  12 / 300  accuracy: 0.8180±0.4649 time: 56.60

在 Python3.6 中引入了 f-string (格式化字符串)

print(f'{batch:3} {epoch:3} / {total_epochs:3}  accuracy: {numpy.mean(accuracies):0.4f}±{numpy.std(accuracies):0.4f} time: {time / len(data_batch):3.2f}')

关于 f-string 的用法可以看我在b站的视频[https://www.bilibili.com/video/av31608754]

'/'和'//'在数学运算中有着明显的区别

对于数据科学来说，这无疑是一个方便的改变

data = pandas.read_csv('timing.csv')
velocity = data['distance'] / data['time']

Python2 中的结果取决于“时间”和“距离”(例如，以米和秒为单位)是否存储为整数。在python3中，这两种情况下的结果都是正确的，因为除法的结果是浮点数。

n_gifts = money // gift_price  # correct for int and float arguments

nutshell

>>> from operator import truediv, floordiv
>>> truediv.__doc__, floordiv.__doc__
('truediv(a, b) -- Same as a / b.', 'floordiv(a, b) -- Same as a // b.')
>>> (3 / 2), (3 // 2), (3.0 // 2.0)
(1.5, 1, 1.0)

值得注意的是，这种规则既适用于内置类型，也适用于数据包提供的自定义类型（例如 numpy 或pandas）。

严格的顺序

下面的这些比较方式在 Python3 中都属于合法的。

3 < '3'
2 < None
(3, 4) < (3, None)
(4, 5) < [4, 5]

对于下面这种不管是2还是3都是不合法的

(4, 5) == [4, 5]

如果对不同的类型进行排序

sorted([2, '1', 3])

虽然上面的写法在 Python2 中会得到结果 [2, 3, '1']，但是在 Python3 中上面的写法是不被允许的。

检查对象为 None 的合理方案

if a is not None:
  pass

if a: # WRONG check for None
  pass

NLP Unicode问题

s = '您好'
print(len(s))
print(s[:2])

输出内容

Python 2: 6\n��
Python 3: 2\n您好.

还有下面的运算

x = u'со'
x += 'co' # ok
x += 'со' # fail

Python2 失败了，Python3 正常工作(因为我在字符串中使用了俄文字母)。

一些其他操作

'a' < type < u'a'  # Python 2: True
'a' < u'a'         # Python 2: False

再比如

from collections import Counter
Counter('Möbelstück')

在 Python2 中

 Counter({'\xc3': 2, 'b': 1, 'e': 1, 'c': 1, 'k': 1, 'M': 1, 'l': 1, 's': 1, 't': 1, '\xb6': 1, '\xbc': 1})

在 Python3 中

 Counter({'M': 1, 'ö': 1, 'b': 1, 'e': 1, 'l': 1, 's': 1, 't': 1, 'ü': 1, 'c': 1, 'k': 1})

虽然可以在 Python2 中正确地处理这些结果，但是在 Python3 中看起来结果更加友好。

保留了字典和**kwargs的顺序

在CPython3.6+ 中，默认情况下，dict 的行为类似于 OrderedDict ，都会自动排序（这在Python3.7+ 中得到保证）。同时在字典生成式（以及其他操作，例如在 json 序列化/反序列化期间）都保留了顺序。

import json
x = {str(i):i for i in range(5)}
json.loads(json.dumps(x))
# Python 2
{u'1': 1, u'0': 0, u'3': 3, u'2': 2, u'4': 4}
# Python 3
{'0': 0, '1': 1, '2': 2, '3': 3, '4': 4}

这同样适用于**kwargs(在Python 3.6+中)，它们的顺序与参数中出现的顺序相同。当涉及到数据管道时，顺序是至关重要的，以前我们必须以一种繁琐的方式编写它

from torch import nn

# Python 2
model = nn.Sequential(OrderedDict([
          ('conv1', nn.Conv2d(1,20,5)),
          ('relu1', nn.ReLU()),
          ('conv2', nn.Conv2d(20,64,5)),
          ('relu2', nn.ReLU())
        ]))

而在 Python3.6 以后你可以这么操作

# Python 3.6+, how it *can* be done, not supported right now in pytorch
model = nn.Sequential(
    conv1=nn.Conv2d(1,20,5),
    relu1=nn.ReLU(),
    conv2=nn.Conv2d(20,64,5),
    relu2=nn.ReLU())
)

可迭代对象拆包

类似于元组和列表的拆包，具体看下面的代码例子。

# handy when amount of additional stored info may vary between experiments, but the same code can be used in all cases
model_paramteres, optimizer_parameters, *other_params = load(checkpoint_name)

# picking two last values from a sequence
*prev, next_to_last, last = values_history

# This also works with any iterables, so if you have a function that yields e.g. qualities,
# below is a simple way to take only last two values from a list
*prev, next_to_last, last = iter_train(args)

提供了更高性能的pickle

Python2

import cPickle as pickle
import numpy
print len(pickle.dumps(numpy.random.normal(size=[1000, 1000])))
# result: 23691675

Python3

import pickle
import numpy
len(pickle.dumps(numpy.random.normal(size=[1000, 1000])))
# result: 8000162

空间少了三倍。而且要快得多。实际上，使用 protocol=2 参数可以实现类似的压缩(但不是速度)，但是开发人员通常忽略这个选项(或者根本不知道)。

更安全的列表推导

labels = 
predictions = [model.predict(data) for data, labels in dataset]

# labels are overwritten in Python 2
# labels are not affected by comprehension in Python 3

更简易的super()

在python2中 super 相关的代码是经常容易写错的。

# Python 2
class MySubClass(MySuperClass):
    def __init__(self, name, **options):
        super(MySubClass, self).__init__(name='subclass', **options)

# Python 3
class MySubClass(MySuperClass):
    def __init__(self, name, **options):
        super().__init__(name='subclass', **options)

这一点Python3得到了很大的优化，新的 super() 可以不再传递参数。

IDE能够给出更好的提示

使用Java、c#等语言进行编程最有趣的地方是IDE可以提供很好的建议，因为在执行程序之前，每个标识符的类型都是已知的。

这是一个带有变量注释的 PyCharm 提示示例。即使在使用的函数没有注释的情况下(例如，由于向后兼容性)，也可以使用这种方法。

Multiple unpacking

如何合并两个字典

x = dict(a=1, b=2)
y = dict(b=3, d=4)
# Python 3.5+
z = {**x, **y}
# z = {'a': 1, 'b': 3, 'd': 4}, note that value for `b` is taken from the latter dict.

我在b站同样发布了相关的视频[https://www.bilibili.com/video/av50376841]

[*a, *b, *c] # list, concatenating
(*a, *b, *c) # tuple, concatenating
{*a, *b, *c} # set, union

函数还支持*arg和**kwarg的多重解包

# Python 3.5+
do_something(**{**default_settings, **custom_settings})

# Also possible, this code also checks there is no intersection between keys of dictionaries
do_something(**first_args, **second_args)

Data classes

Python 3.7引入了Dataclass类，它适合存储数据对象。数据对象是什么？下面列出这种对象类型的几项特征，虽然不全面：

它们存储数据并表示某种数据类型，例如：数字。对于熟悉ORM的朋友来说），数据模型实例就是一个数据对象。它代表了一种特定的实体。它所具有的属性定义或表示了该实体。
它们可以与同一类型的其他对象进行比较。例如：大于、小于或等于。

@dataclass
class Person:
    name: str
    age: int

@dataclass
class Coder(Person):
    preferred_language: str = 'Python 3'

dataclass装饰器实现了几个魔法函数方法的功能（__init__，__repr__，__le__,__eq__）

数据类可以是可变的，也可以是不可变的
支持字段的默认值
可被其他类继承
数据类可以定义新的方法并覆盖现有的方法
初始化后处理(例如验证一致性)

自定义对模块属性的访问

在Python中，可以用getattr和dir控制任何对象的属性访问和提示。因为python3.7，你也可以对模块这样做。

# nprandom.py
import numpy
__random_state = numpy.random.RandomState()

def __getattr__(name):
    return getattr(__random_state, name)

def __dir__():
    return dir(__random_state)

def seed(seed):
    __random_state = numpy.random.RandomState(seed=seed)

也可以这样混合不同对象/子模块的功能。与pytorch和cupy中的技巧相比。

使用它来延迟加载子模块。例如，导入tensorflow时会导入所有子模块(和依赖项)。需要大约150兆内存。
在应用编程接口中使用此选项进行折旧
在子模块之间引入运行时路由

内置的断点

在python3.7中可以直接使用breakpoint给代码打断点

# Python 3.7+, not all IDEs support this at the moment
foo()
breakpoint()
bar()

在python3.7以前我们可以通过import pdb的pdb.set_trace()实现相同的功能。

Math模块中的常数

# Python 3
math.inf # Infinite float
math.nan # not a number

max_quality = -math.inf  # no more magic initial values!

for model in trained_models:
    max_quality = max(max_quality, compute_quality(model, data))

整数类型只有int

Python 2提供了两种基本的整数类型，一种是int（64位有符号整数）一种是long，使用起来非常容易混乱，而在python3中只提供了int类型这一种。

isinstance(x, numbers.Integral) # Python 2, the canonical way
isinstance(x, (long, int))      # Python 2
isinstance(x, int)              # Python 3, easier to remember

在python3中同样的也可以应用于其他整数类型，如numpy.int32、numpy.int64，但其他类型不适用。

结论

虽然Python 2和Python 3共存了近10年，但是我们应该转向Python 3。

我是老表，踏实的人更容易过好生活，本文完。

推荐阅读：

数据分析从零开始实战

仔细阅读下面四篇文章，快速掌握Python基础知识要点。

完整Python基础知识

我是老表，支持我请转发分享本文。

/你学Python的态度/

留言主题：我爱Python+本周复盘，表明你的学习态度。

（不少于30字）

你可能感兴趣的:(愉快地迁移到Python3)

2020-12-16 长寿富贵
9：56不知今天哪位亲来说说话呀？成萌：尽尽皆是道。道道皆相同。不解呀？成萌：郁郁不得志，混混过日子。哦……说谁的呀？成萌：说自己呀……还能说谁呢？那如何办呢？成萌：回头……如何回头？成萌：回见心源。如何回见心源？成萌：不追不随诸相迁，如如不动在心田。啊？成萌：慢慢守心吧。
钟表可以回到起点却已不是昨天凉小夏
人生的路很长，但是我们只能前进不能后退就像钟表，可以回到起点，却已时过境迁，永远也找不到那个过去的昨天。因我们总是会对过去有着很多留恋不舍和怀念，会时常回头看看走过的脚印，时常想起过去的美好时光，时常想到那些悲伤和不如意。今天的到来时钟不可阻止，历史的记录，原人生最宝贵的不是金钱，不是地位，而是时间。拥有时间就等于拥有一切，因为拥有时间，我们不怕囊中羞涩，因为拥有时间我们不惮创业无门，因为拥有时间
tiff批量转png 诺有缸的高飞鸟 opencv 图像处理 python opencv 图像处理
目录写在前面代码完写在前面1、本文内容tiff批量转png2、平台/环境opencv,python3、转载请注明出处：https://blog.csdn.net/qq_41102371/article/details/132975023代码importnumpyasnpimportcv2importosdeffindAllFile(base):file_list=[]forroot,ds,fsin
Python3.7出现“ModuleNotFoundError: No module named ‘Tkinter‘”错误的解决方法可爱的小红猪 python
Python3.7出现“ModuleNotFoundError:Nomodulenamed‘Tkinter’”错误的解决方法在网上看到很多针对这个问题的解决方法都是重新安装或配置Tkinter库，但Tkinter是python内置的标准GUI库，安装Python时就已经内置在了库中，不需要另外下载。针对于Tkinter，你的代码很可能是这样的：importTkinter或者是这样fromTkint
Ubuntu18.04 Docker部署Kinship(Django)项目过程 Dante617
1Docker的安装https://blog.csdn.net/weixin_41735055/article/details/1003551792下载镜像dockerpullprogramize/python3.6.8-dlib下载的镜像里包含python3.6.8和dlib19.17.03启动镜像dockerrun-it--namekinship-p7777:80-p3307:3306-p55
广东麻将开发红匣子实力推荐
在中国，麻将作为一种深受人们喜爱的传统娱乐活动，已经有着数百年的历史。随着互联网和移动设备的普及，麻将游戏也从实体桌面转移到了数字平台，其中广东麻将因其独特的地方特色和玩法而备受青睐。本文将介绍广东麻将的开发过程，包括其设计理念、技术实现以及用户体验优化等方面。一、设计理念：广东麻将开发的核心理念是保留传统麻将的精髓，同时融入现代科技元素，使游戏既具有亲切感又不失趣味性。开发者通常会深入研究广东地
ubuntu22.04环境中安装pylint 歪歪的酒壶 python linux 开发语言
ubuntu22.04环境中安装pylintsudoapt-getinstallpython3-pipsudoaptitudeinstallpython3-pipsudopipinstallpylintsudoapt-getinstallpython3-pip在安装pylint的时候，需要使用pip命令，在ubuntu22.04环境中命令如下：$sudoapt-getinstallpython3-
使用selenium调用firefox提示Profile Missing的问题解决歪歪的酒壶 selenium 测试工具 python
在Ubuntu22.04环境中，使用python3运行selenium提示ProfileMissing，具体信息为：YourFirefoxprofilecannotbeloaded.Itmaybemissingorinaccessible在这个问题的环境中firefox浏览器工作正常。排查中，手动在命令行执行firefox可以打开浏览器，但是出现如下提示Gtk-Message:15:32:09.9
去公园 8b78bb8a54f2
昨天天气很好，爸爸带我去了公园,公园里面很好玩，那里有青青的河水,也有小鱼，小鱼在河水里面欢快地游来游去，他们可开心了。还有红红的花朵，绿绿的草，我和弟弟在公园里面跑啊，跳啊，可开心了！图片发自App
尔勋禄攸双髻山府正堂
《曹全碑》全碑释文：碑阳君讳全，字景完，敦煌效谷人也，盖周胄，武秉乾机，翦伐殷商，既尔勋，禄攸同，封弟叔振铎于曹国，因氏焉，秦汉之际，曹参夹辅王室，世宗廓土斥竟，子孙迁于雍州之郊，分止右扶风，或在安定，或处武都，或居陇西，或家敦煌，枝分叶布，所在为雄，君高祖父敏，举孝廉，武威长史，巴郡朐忍令，张掖居延都尉，曾祖父述，孝廉，谒者，金城长史，夏阳令，蜀郡西部都尉，祖父凤，孝廉，张掖属国都尉丞，右扶风隃
Windows安装ciphey编码工具，附一道ciscn编码题例 im-Miclelson CTF工具网络安全
TA是什么一款智能化的编码分析解码工具，对于CTF中复杂性编码类题目可以快速攻破。编码自动分析解码的神器。如何安装Windows环境Python3.864位（最新的版本不兼容，32位的也不行）PIP直接安装pipinstallciphey-ihttps://pypi.mirrors.ustc.edu.cn/simple/安装后若是出现报错请根据错误代码行数找到对应文件，r修改成rb即可。使用标准语
飞机，你好！------2020年12月25日，panda出生的第627天小妖怪潘达
今天的婚礼，热热闹闹，很多粑粑的本科同学，可是时过境迁，大家都有了自己的朋友圈。我们临时决定今天下午就回家，本来计划是去周边玩两天，可是今天胖哒不太好，有点拉肚子，加上在这边的住宿环境不是很安静，外面轰隆的过路车，特别吵，别说胖哒，麻麻都没法好好睡觉，可能是因为熟悉了，胖哒不再拒绝坐粑粑同学的车，回程的高铁也稍微好了一丢丢，徐州站停留时间较长，我们下车出去透气，胖哒突然说"飞机，你好”，粑粑麻麻哭
Python程序打包指南：手把手教你一步步完成 Python_P叔 python 数据库开发语言
最近感兴趣想将开发的项目转成Package，研究了一下相关文章，并且自己跑通了，走了一下弯路，这里记录一下如何打包一个简单的Python项目，展示如何添加必要的文件和结构来创建包，如何构建包，以及如何将其上传到Python包索引（PyPI）。首先要确保安装最新版本：#Unix/macOSpython3-mpipinstall--upgradepip#windowspy-mpipinstall--u
十五年前写的《致母亲》慧有福报
最近翻出一些，学生时代写的东西。《致母亲》成笔于2004年8月。假如它有生命，距今已经15年了。那时候，独自一个人远到成都去上大学。有段时间，非常不适应，就像小孩子一样想妈妈。站在少年，回忆童年，回忆青春期的母亲印象。时值母亲节，已时过境迁，我却只能望天遥祝。拿出当年稚嫩的文字，再看一看。---------------------------分割线-------------------------
2020-03-07 雨墨的天空
那年秋天，夕阳的余晖跨过矮墙，硬闯了进来，想责怪它的霸道，王权，可我不够理由只能默默地接受它强装温柔的抚摸……我独自享受着幕浴在廊檐下温书。一阵杂乱的步伐打乱了这份貌似的和谐宁静，夕阳偷偷的跑了，也许是怕被发现它私闯民宅，目无王法吧！框……门被无情地推开，威严的父亲抱着一个比我大点的孩子急冲冲地向我嚷道：小慧，快去喊你妈回来。呃！我不敢多想，丢下书飞快地跑了出去，父亲很严厉，就像童话故事的国王，独
python抓取网页内容401应该用哪个库_python3使用requests模块爬取页面内容入门坂田月半
python的爬虫相关模块有很多，除了requests模块，再如urllib和pycurl以及tornado等。相比而言，requests模块是相对简单易上手的。通过文本，大家可以迅速学会使用python的requests模块爬取页码内容。1.Requests唯一的一个非转基因的PythonHTTP库，人类可以安全享用。官网：http://cn.python-requests.org/zh_CN/
死亡意味着什么张野臻
死亡意味着什么？再也不会有，一杯奶茶带来的心动，一个微笑产生的甜蜜，一次加班引起的焦躁，一个失误带来的崩溃，一次争吵引发的失眠。我们无法将死亡封死在门外，我们也同样不会将生命封死在门内。依然要，自自然然地心动，痛痛快快地受伤，毫不抵御地忧愁，再毫不回头地往前跑。恐惧是真实的，希望也是真实的。
1.《我们》：初中第一天 Joker张远鹏
“滴～哒～”闹钟滴滴哒哒地叫着，正巧也把雷范从睡梦中拉了出来。雷范迷迷糊糊地在床上爬了起来，伸了伸懒腰，又用右手揉了揉眼睛。但是睡意并没有左右他的习惯，雷范还是很自然地叠好了被子。紧接着冲进厕所，很快地洗漱完，背起书包，走向家门口。雷范又穿起新买的耐克牌运动鞋，和爷爷走进空无一人的楼道。便到楼下的早点铺端了碗面，坐到爷爷的摩托上去新的学校—幸安中学。因为学校离雷范的家没多远，没过一会就到了，雷范就
创造价值很难？你只要帮别人节省时间！破晓文库联盟
创造价值很难？你只要帮别人节省时间！我做教培行业的任课老师，已经有3年经验。我前一年都是在打磨自己的教学能力和演讲水平，脑袋里想的都是怎么让学生更容易理解这个知识点，更快地用习题巩固它。我用几个小时或者几节课帮学生节省了一周甚至一个月甚至半学期落下的知识点，我创造了价值，是因为我有总结归纳启发的能力。我用几节课帮家长节省了每天晚上每个周末对孩子的疯狂唠叨。你怎么还不去写作业？你作业写完了吗？为什么
ODOO不同版本与平台选择 chouchengyin2080 c#操作系统运维
1.10.0vs11.0vs8.0截至2017年底，最新的ODOO发布版为ODOO11.0，但功能上有一定精简（去除财务模块，去除工作流支持），技术上变动较大（代码逐步迁移至Python3，前端框架改写得抽象）。所以如果是从生产使用的角度来讲，ODOO10.0是当前最好选择，因为其更稳定，第三方模块也更多更全面。而如果是ODOO技术爱好从业者，则逐步迁移至ODOO11.0也有必要，因为其底层技术架
一个人的认知里，藏着他读过的每一本书罗雁儿
读洞见文章，摘抄如下：任正非曾说：“我的工作就是读书，无论去哪儿出差，我都会带上一本书，别人飞机上睡一觉的工夫，300页的书我就翻完了。”在华为，任正非要求高管们有“宽文化背景”。简而言之，就是军事、哲学、政治等各种领域的知识都要有所涉猎。在任正非看来，那些看似跟工作无关的书籍知识，完全可以迁移到生活工作上。30多年来，他一直倡导这个理念并躬身实践着。他从李冰父子治水的故事中得到启示，写了一篇《深
C语言：冒泡排序的注意事项及具体实现 z_鑫 c语言算法数据结构开发语言
一、注意事项1、函数声明为：voidbubble_sort(void*base,size_tnum,size_twidth,int(*cmp)(constvoid*e1,constvoid*e2));2、base指向所要排序的数组3、num为数组的元素个数4、width为一个元素占多少个字节的空间5、cmp为函数指针，指向用来进行比较的函数6、每趟排序都会把当前未排序部分的最大值移到正确的位置二、
日艺 | 18.11.12 《圣三位一体》 Artademie艺术派
《圣三位一体》，1428年，马萨乔，湿壁画，佛罗伦萨新圣母大教堂马萨乔（TommasodiSerGiovannidiSimone,Masaccio）文艺复兴时期最重要的人文主义画家之一，他是艺术史上第一位使用透视法的艺术家。在古希腊时期，就有艺术家在陶罐上使用“短缩法”绘制物体，这种方法让希腊人得以通过缩短所画对象的尺寸，而将三维空间转移到平面上。然而却始终是通过对自然细致入微的观察而得到的经验主
华为开源镜像站体验：美好终将不期而遇 cuishuogai2817 操作系统 java python
电脑因为前段时间有问题，昨天刚刚重装好系统，之前一大堆运行环境全部要重新弄……T_T今天碰上华为开源镜像站体验，那就测试和体验一把吧！先说说测试环境：网络：广东电信20M企业光纤系统：Windows764-bit&CentOS7.6(VMWare)华为开源镜像站地址：http://t.cn/EcBQJO4测试一：python3.6.6(win)首先是windows下的python3.6.6打开说明
python工程打包成whl文件机灵巢穴_WitNest python python 开发语言
资料：PackagingPythonProjects—PythonPackagingUserGuide6.Modules—Python3.11.4documentation步骤1.安装打包工具python3-mpipinstallsetuptoolswheeltwine2.更新pip工具python3-mpipinstall--upgradepip3.创建工程结构python_test_packa
利用Python3爬取下载bookset网站的kindle电子书 nobodyyang
突然间发现这个网站，可以下载很多kindle电子书。观摩了下，和前段时间刚写的爬取头条有点类似。该网站链接首页：https://bookset.me/，这次爬取排行榜链接：https://bookset.me/?rating=douban，打开观察发现排行榜其实真正分页规则是https://bookset.me/page/num?rating=douban，其中num代表页数。具体代码如下
python离线安装一个第三方库 Lhj0616 python相关 python 第三方库
文章目录实例步骤下载`xlwt`库将文件转移到目标机器在目标机器上安装`xlwt`验证安装总结步骤可能的问题解决方法检查库的兼容性使用`pip`下载适配特定Python版本的库创建虚拟环境创建虚拟环境（Python3.6）创建虚拟环境（Python3.11）检查和验证库的安装下载多个版本的`.whl`文件总结更新：下载的第三方库有依赖库解决方案实例想离线安装一个第三方库xlwt，python版本分
只因钟爱稻田华华0241b51def6e
与稻田结缘已有十一年了。稻田有我最美的回忆。在几个关节点上，我把天平的重心移向了稻田，她也给了我足够的回馈，让我魂牵梦萦。在择校之间十一年前，我怀着一腔热血到长沙应聘。第一站，我选择了雨花区，那是因为它开辟了面向全省招收名优特教师的绿色通道。看到招聘条件，我爽快地报了名，并愿意接受了试教的条件。那个时候的稻田中学校长是现在的区教育局张新卫局长，我们在区政府旁边的鸿达酒店从晚上七点一直聊到十一点多，
鱼儿婠执
图片发自App一周过去了，我们终于得以相安无恙。初来乍到之时，定是嫌弃被这小小的鱼缸困囿，它们接二连三地往外跳，急欲认知外面的世界。殊不知唯有安于现状，才是最稳妥的境地。竭尽全力跳出去、轻而易举地被放回来，几次尝试未果，它们不得不重新审视周遭的“家园”。在绿叶与巨石的装点下，一切看起来也挺有乐趣，算得上是“青山绿水”。我想，在它们眼中我许是个叫不出种类的庞然大物。不看它们时，它们畅快地穿梭于曲曲绕
win10配置python_Win 10安装Python及环境变量配置 weixin_39663933 win10配置python
一、Windows系统很多童鞋问之前的教程怎么没有介绍安装python3.5的，现予以补充更新一下。（一）安装python3.51、下载进入Python官网www.python.org，在“Downloads”下拉菜单中的右半部分直接点击python3.5.2版本即可下载，它会自动下载32位的。如果需要64位，点击左半部分“Windows”，选择第二项“LatestPython3Release-P
解线性方程组 qiuwanchi
package gaodai.matrix; import java.util.ArrayList; import java.util.List; import java.util.Scanner; public class Test { public static void main(String[] args) { Scanner scanner = new Sc
在mysql内部存储代码 annan211 性能 mysql 存储过程触发器
在mysql内部存储代码在mysql内部存储代码，既有优点也有缺点，而且有人倡导有人反对。先看优点： 1 她在服务器内部执行，离数据最近，另外在服务器上执行还可以节省带宽和网络延迟。 2 这是一种代码重用。可以方便的统一业务规则，保证某些行为的一致性，所以也可以提供一定的安全性。 3 可以简化代码的维护和版本更新。 4 可以帮助提升安全，比如提供更细
Android使用Asynchronous Http Client完成登录保存cookie的问题 hotsunshine android
Asynchronous Http Client是android中非常好的异步请求工具除了异步之外还有很多封装比如json的处理，cookie的处理引用 Persistent Cookie Storage with PersistentCookieStore This library also includes a PersistentCookieStore whi
java面试题 Array_06 java 面试
java面试题第一，谈谈final, finally, finalize的区别。 final-修饰符（关键字）如果一个类被声明为final，意味着它不能再派生出新的子类，不能作为父类被继承。因此一个类不能既被声明为 abstract的，又被声明为final的。将变量或方法声明为final，可以保证它们在使用中不被改变。被声明为final的变量必须在声明时给定初值，而在以后的引用中只能
网站加速 oloz 网站加速
前序:本人菜鸟，此文研究总结来源于互联网上的资料，大牛请勿喷！本人虚心学习，多指教. 1、减小网页体积的大小，尽量采用div+css模式，尽量避免复杂的页面结构，能简约就简约。 2、采用Gzip对网页进行压缩； GZIP最早由Jean-loup Gailly和Mark Adler创建，用于UNⅨ系统的文件压缩。我们在Linux中经常会用到后缀为.gz
正确书写单例模式随意而生 java 设计模式单例
　　单例模式算是设计模式中最容易理解，也是最容易手写代码的模式了吧。但是其中的坑却不少，所以也常作为面试题来考。本文主要对几种单例写法的整理，并分析其优缺点。很多都是一些老生常谈的问题，但如果你不知道如何创建一个线程安全的单例，不知道什么是双检锁，那这篇文章可能会帮助到你。　　懒汉式，线程不安全　　当被问到要实现一个单例模式时，很多人的第一反应是写出如下的代码，包括教科书上也是这样
单例模式香水浓 java
懒汉调用getInstance方法时实例化 public class Singleton { private static Singleton instance; private Singleton() {} public static synchronized Singleton getInstance() { if(null == ins
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" AdyZhang apache http server
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" 每次到这一步都很小心防它的端口冲突问题，结果，特意留出来的80端口就是不能用，烦。解决方法确保几处： 1、停止IIS启动 2、把端口80改成其它（譬如90，800，，，什么数字都好） 3、防火墙(关掉试试) 在运行处输入 cmd 回车，转到apa
如何在android 文件选择器中选择多个图片或者视频？ aijuans android
我的android app有这样的需求，在进行照片和视频上传的时候，需要一次性的从照片/视频库选择多条进行上传但是android原生态的sdk中，只能一个一个的进行选择和上传。我想知道是否有其他的android上传库可以解决这个问题，提供一个多选的功能，可以使checkbox之类的，一次选择多个处理方法官方的图片选择器(但是不支持所有版本的androi，只支持API Level
mysql中查询生日提醒的日期相关的sql baalwolf mysql
SELECT sysid,user_name,birthday,listid,userhead_50,CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')),CURDATE(), dayofyear( CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')))-dayofyear(
MongoDB索引文件破坏后导致查询错误的问题 BigBird2012 mongodb
问题描述： MongoDB在非正常情况下关闭时，可能会导致索引文件破坏，造成数据在更新时没有反映到索引上。解决方案：使用脚本，重建MongoDB所有表的索引。 var names = db.getCollectionNames(); for( var i in names ){ var name = names[i]; print(name);
Javascript Promise bijian1013 JavaScript Promise
Parse JavaScript SDK现在提供了支持大多数异步方法的兼容jquery的Promises模式，那么这意味着什么呢，读完下文你就了解了。一.认识Promises “Promises”代表着在javascript程序里下一个伟大的范式，但是理解他们为什么如此伟大不是件简
[Zookeeper学习笔记九]Zookeeper源代码分析之Zookeeper构造过程 bit1129 zookeeper
Zookeeper重载了几个构造函数，其中构造者可以提供参数最多，可定制性最多的构造函数是 public ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, long sessionId, byte[] sessionPasswd, boolea
【Java命令三】jstack bit1129 jstack
jstack是用于获得当前运行的Java程序所有的线程的运行情况(thread dump），不同于jmap用于获得memory dump [hadoop@hadoop sbin]$ jstack Usage: jstack [-l] <pid> (to connect to running process) jstack -F
jboss 5.1启停脚本　动静分离部署 ronin47
以前启动jboss，往各种xml配置文件，现只要运行一句脚本即可。start nohup sh /**/run.sh -c servicename -b ip -g clustername -u broatcast jboss.messaging.ServerPeerID=int -Djboss.service.binding.set=p
UI之如何打磨设计能力? brotherlamp UI ui教程 ui自学 ui资料 ui视频
在越来越拥挤的初创企业世界里，视觉设计的重要性往往可以与杀手级用户体验比肩。在许多情况下，尤其对于 Web 初创企业而言，这两者都是不可或缺的。前不久我们在《右脑革命：别学编程了，学艺术吧》中也曾发出过重视设计的呼吁。如何才能提高初创企业的设计能力呢?以下是 9 位创始人的体会。 1.找到自己的方式如果你是设计师，要想提高技能可以去设计博客和展示好设计的网站如D-lists或
三色旗算法 bylijinnan java 算法
import java.util.Arrays; /** 问题：假设有一条绳子，上面有红、白、蓝三种颜色的旗子，起初绳子上的旗子颜色并没有顺序，您希望将之分类，并排列为蓝、白、红的顺序，要如何移动次数才会最少，注意您只能在绳子上进行这个动作，而且一次只能调换两个旗子。网上的解法大多类似：在一条绳子上移动，在程式中也就意味只能使用一个阵列，而不使用其它的阵列来
警告:No configuration found for the specified action: \'s chiangfai configuration
1.index.jsp页面form标签未指定namespace属性。  <%@taglib prefix="s" uri="/struts-tags"%> ... <s:form action="submit" method="post"&g
redis -- hash_max_zipmap_entries设置过大有问题 chenchao051 redis hash
使用redis时为了使用hash追求更高的内存使用率，我们一般都用hash结构，并且有时候会把hash_max_zipmap_entries这个值设置的很大，很多资料也推荐设置到1000，默认设置为了512，但是这里有个坑 #define ZIPMAP_BIGLEN 254 #define ZIPMAP_END 255 /* Return th
select into outfile access deny问题 daizj mysql txt 导出数据到文件
本文转自：http://hatemysql.com/2010/06/29/select-into-outfile-access-deny%E9%97%AE%E9%A2%98/ 为应用建立了rnd的帐号，专门为他们查询线上数据库用的，当然，只有他们上了生产网络以后才能连上数据库，安全方面我们还是很注意的，呵呵。授权的语句如下： grant select on armory.* to rn
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
<?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('This example should only be run from a Web Brows
美国电影超短200句 dcj3sjt126com 电影
1. I see．我明白了。2. I quit! 我不干了!3. Let go! 放手!4. Me too．我也是。5. My god! 天哪!6. No way! 不行!7. Come on．来吧(赶快)8. Hold on．等一等。9. I agree。我同意。10. Not bad．还不错。11. Not yet．还没。12. See you．再见。13. Shut up!
Java访问远程服务 dyy_gusi httpclient webservice get post
随着webService的崛起，我们开始中会越来越多的使用到访问远程webService服务。当然对于不同的webService框架一般都有自己的client包供使用，但是如果使用webService框架自己的client包，那么必然需要在自己的代码中引入它的包，如果同时调运了多个不同框架的webService，那么就需要同时引入多个不同的clien
Maven的settings.xml配置 geeksun settings.xml
settings.xml是Maven的配置文件，下面解释一下其中的配置含义： settings.xml存在于两个地方： 1.安装的地方：$M2_HOME/conf/settings.xml 2.用户的目录：${user.home}/.m2/settings.xml 前者又被叫做全局配置，后者被称为用户配置。如果两者都存在，它们的内容将被合并，并且用户范围的settings.xml优先。
ubuntu的init与系统服务设置 hongtoushizi ubuntu
转载自： http://iysm.net/?p=178 init Init是位于/sbin/init的一个程序，它是在linux下，在系统启动过程中，初始化所有的设备驱动程序和数据结构等之后，由内核启动的一个用户级程序，并由此init程序进而完成系统的启动过程。 ubuntu与传统的linux略有不同，使用upstart完成系统的启动，但表面上仍维持init程序的形式。运行
跟我学Nginx+Lua开发目录贴 jinnianshilongnian nginx lua
使用Nginx+Lua开发近一年的时间，学习和实践了一些Nginx+Lua开发的架构，为了让更多人使用Nginx+Lua架构开发，利用春节期间总结了一份基本的学习教程，希望对大家有用。也欢迎谈探讨学习一些经验。目录第一章安装Nginx+Lua开发环境第二章 Nginx+Lua开发入门第三章 Redis/SSDB+Twemproxy安装与使用第四章 L
php位运算符注意事项 home198979 位运算 PHP &
$a = $b = $c = 0; $a & $b = 1; $b | $c = 1 问a,b,c最终为多少? 当看到这题时，我犯了一个低级错误，误以为位运算符会改变变量的值。所以得出结果是1 1 0 但是位运算符是不会改变变量的值的，例如： $a=1;$b=2; $a&$b; 这样a,b的值不会有任何改变
Linux shell数组建立和使用技巧 pda158 linux
1.数组定义　　[chengmo@centos5 ~]$ a=(1 2 3 4 5) 　　[chengmo@centos5 ~]$ echo $a 　　1 　　一对括号表示是数组，数组元素用“空格”符号分割开。　　 2.数组读取与赋值　　得到长度：　　[chengmo@centos5 ~]$ echo ${#a[@]} 　　5 　　用${#数组名[@或
hotspot源码(JDK7) ol_beta java HotSpot jvm
源码结构图，方便理解： ├─agent Serviceab
Oracle基本事务和ForAll执行批量DML练习 vipbooks oracle sql
基本事务的使用：从账户一的余额中转100到账户二的余额中去，如果账户二不存在或账户一中的余额不足100则整笔交易回滚 select * from account; -- 创建一张账户表 create table account( -- 账户ID id number(3) not null, -- 账户名称 nam