eilot_c

python手册

最近在学习查找资料的过程之中，看到了大佬的博客，觉得写得很好，也是我现在所欠缺的，所以下面先对大佬的博客进行复现。以供自己日后复习，查找，完善成自己的东西。

字符串固定字数，不足的空格补齐

str.ljust(10) # 左对齐 字符串长10位
rjust，ljust和center三个方法来给字符串补全空格
rjust，向右对其，在左边补空格
ljust，向左对其，在右边补空格
center，让字符串居中，在左右补空格

排序

sorted: 返回一个新的 list
list.sort(): 改变 list 自身的值
reverse 参数: 默认为 False, 升序, True 时变为降序

列表

循环删除列表元素

常见错误: 直接删除, 或者正序删除

正确做法:
1.使用 pop, 倒序删除

1
2

for i in range(len(list)):
   	list.pop()

2.使用切片, 遍历拷贝列表, 操作原始列表, 用 remove 删除, remove 会操作首个遇到的匹配元素, 相等元素删除, 删除哪个都一样

for x in enumerate(a[::]):
   	a.remove(x)

for x in enumerate(a[::-1]):
  		 a.remove(x)

遍历列表:

zz_list = ['a', 'b', 'c', 'd']

for index in list:
    print(index)
    # 0
    # 1
    # 2
    # 3
for index in range(len(list)):
    print(index)
    # 0
    # 1
    # 2
    # 3
for index, val in enumerate(list):
    print(index, val)
    # 0 a
    # 1 b
    # 2 c
    # 3 d
# 设置遍历的开始序号, val的输出不变
for i, val in enumerate(list, 2):
    print(index, val)
    # 2 a
    # 3 b
    # 4 c
    # 5 d

append() 方法

追加单个元素

extend() 方法

extend()函数用于在列表末尾一次性追加另一个序列中的多个值(用新列表扩展原来的列表).
该方法没有返回值, 会直接在已经存在的列表中添加新的列表内容, extend和+=的作用差不多

a= [[1,2,3],[4,5,6]]
b= [['a','b','c'],['d','e','f']]
a.extend(b)
print(a)
# [[1, 2, 3], [4, 5, 6], ['a', 'b', 'c'], ['d', 'e', 'f']]

序列切片(双冒号)

Python序列切片地址可以写为 [开始(包含) : 结束(不包含) : 步长]. 当开始省略的时候, 默认从第0项开始, 当结尾省略的时候, 默认到数组最后, 当步长省略的时候, 默认为1. 步长可以为负数, 代表从右向左取数.

a = range(10) # a = [0, 1, 2, 3, 4, 5, 6, 7, 8 ,9]
a[0:9:1] # [0, 1, 2, 3, 4, 5, 6, 7, 8] 包含开始下标, 不包含结束下标
a[1::2] # [1, 3, 5, 7, 9]
a[::3] # [0, 3, 6, 9]
a[::-1] # [9, 8, 7, 6, 5, 4, 3, 2, 1, 0]
a[::-2] # [9, 7, 5, 3, 1]

update() 方法

`1`	`dict.update(dict2)`

将 dict2 中的键值更新到 dict 中, 对于存在的则覆盖原值, 对于不存在的则添加新的键值.

实例

#!/usr/bin/python

dict = {'Name': 'Zara', 'Age': 7}
dict2 = {'Sex': 'female' }

dict.update(dict2)
print "Value : %s" %  dict

以上实例输出结果为：

`1`	`Value : {'Age': 7, 'Name': 'Zara', 'Sex': 'female'}`

字典

遍历字典:

`1`	`zz_dict = {'x': 1, 'y':2, 'z':3}`

遍历keys:

# 输出均为: x y z
for key in zz_dict:
    print(key)

for key in zz_dict.iterkeys():
    print(key)

for key in zz_dict.keys():
    print(key)

遍历values:

# 输出均为 1 2 3
for value in zz_dict.itervalues():
    print(value)

for value in zz_dict.values():
    print(value)

遍历keys和values

# 输出为: x corresponds to 1 (其余两个也一样)
for key, value in zz_dict.iteritems():  # python3 没有iteritems
    print(key, "corresponds to", value)

for key, value in zz_dict.items():
    print(key, "corresponds to", value)

字符串

判断字符串是否为字母或者数字

str.isalnum() 字母或数字
str.isalpha() 字母
str.isdigit() 数字
str.isspace() 空白符, \t, \n, \r

isdigit() 和 isnumeric() 的区别

num = "1"  #unicode
num.isdigit()   # True
num.isdecimal() # True
num.isnumeric() # True

num = "1" # 全角
num.isdigit()   # True
num.isdecimal() # True
num.isnumeric() # True

num = b"1" # byte
num.isdigit()   # True
num.isdecimal() # AttributeError 'bytes' object has no attribute 'isdecimal'
num.isnumeric() # AttributeError 'bytes' object has no attribute 'isnumeric'

num = "IV" # 罗马数字
num.isdigit()   # True
num.isdecimal() # False
num.isnumeric() # True

num = "四" # 汉字
num.isdigit()   # False
num.isdecimal() # False
num.isnumeric() # True

isdigit()
True: Unicode数字，byte数字（单字节），全角数字（双字节），罗马数字
False: 汉字数字
Error: 无

isdecimal()
True: Unicode数字，，全角数字（双字节）
False: 罗马数字，汉字数字
Error: byte数字（单字节）

isnumeric()
True: Unicode数字，全角数字（双字节），罗马数字，汉字数字
False: 无
Error: byte数字（单字节）

str.rstrip()

参数:
chars: 指定删除的字符(默认为空格或换行符)

返回值:
返回删除指定字符后的新字符串

备注:
删除字符串末尾的指定字符(默认为空格或换行符)

`1`	`str.rstrip([chars])`

str.strip()

参数
chars — 移除字符串头尾指定的字符序列。
返回值
返回移除字符串头尾指定的字符生成的新字符串。
备注:

`1`	`str.strip([chars])`

str.split()

参数

str — 分隔符，默认为所有的空字符，包括空格、换行(\n)、制表符(\t)等。
num — 分割次数。默认为 -1, 即分隔所有。
返回值

返回分割后的字符串列表。

`1`	`str.split(str="", num=string.count(str)).`

文件

reduce() 函数

reduce() 函数会对参数序列中元素进行累积。
函数将一个数据集合（链表，元组等）中的所有数据进行下列操作：用传给 reduce 中的函数 function（有两个参数）先对集合中的第 1、2 个元素进行操作，得到的结果再与第三个数据用 function 函数运算，最后得到一个结果。
reduce() 函数语法：

`1`	`reduce(function, iterable[, initializer])`

参数

function — 函数，有两个参数
iterable — 可迭代对象
initializer — 可选，初始参数
返回值

返回函数计算结果
实例

>>>def add(x, y) :            # 两数相加
...     return x + y
... 
>>> reduce(add, [1,2,3,4,5])   # 计算列表和：1+2+3+4+5
15
>>> reduce(lambda x, y: x+y, [1,2,3,4,5])  # 使用 lambda 匿名函数
15

zip() 函数

zip() 函数用于将可迭代的对象作为参数, 将对象中对应的元素打包成一个个元组 ,然后返回有这些元组组成的对象. ( 相比于python2中返回列表的方式, 这样做的好处是节约了不少的内存 )
可以用list()转换或者dict()转换将对象转换成相应的数据类型
如果各个迭代器的元素个数不一致, 则返回列表长度与最短的对象相同, 多出来的部分会被舍弃, 利用*号操作符, 可以将元组解压成列表.

a = [1,2,3]
b = [4,5,6]
c = ['a','b','c','d','e','f']

zip_ab = zip(a,b)
print(zip_ab) # 
print(dict(zip_ab)) # {1: 4, 2: 5, 3: 6}
# !!!注意, 一旦将zip_ab转换成dict以后, zip_ab内部就为空了!! 例如, 再次调用上面的语句:
print(dict(zip_ab)) # {}
# 但是zip_ab对象本身不会消失, 地址仍然不变
print(zip_ab) # 

zip_abc = zip(a,b,c) # 注意, 三个元素的zip是不能转换成dict类型的
print(zip_abc) # 
print(list(zip_abc)) # [(1, 4, 'a'), (2, 5, 'b'), (3, 6, 'c')]

zip_abc = zip(a,b,c)
z_a, z_b, z_c = zip(*zip_abc) # 利用zip(*)可以将zip对象重新解压, 返回类型是元组
print(z_a) # (1,2,3)
print(z_b) # (4,5,6)
print(z_c) # ('a','b','c')

getattr() 函数

getattr()函数用于返回一个对象的属性值, 语法如下

`1`	`getattr(object, name[, default])`

参数：

object: 对象
name: 字符串, 对象属性

default: 默认返回值, 如果不提供该参数, 在没有对应属性时, 将触发Attributerror
实例

>>>class A(object):
...     bar = 1
... 
>>> a = A()
>>> getattr(a, 'bar')        # 获取属性 bar 值
1
>>> getattr(a, 'bar2')       # 属性 bar2 不存在，触发异常
Traceback (most recent call last):
  File "", line 1, in 
AttributeError: 'A' object has no attribute 'bar2'
>>> getattr(a, 'bar2', 3)    # 属性 bar2 不存在，但设置了默认值
3
>>>

dir() 函数

可以查看某个类的所有方法和属性

`1`	`members = [attr for attr in dir(classA)]`

_var: 在一个模块中以单下划线开头的变量和函数会被默认当做内部函数, 在使用from a_module import * 导入时, 这部分变量和函数不会被导入. 不过如果使用import a_module导入模块时, 仍然可以用a_module._var的形式访问该变量或函数
var_: 有时候, 一个变量的最适合的名称已经被另一个关键字所占用. 在这种情况下, 可以在名称的末尾附加一个下划线来解决冲突.
__var: 双下划线前缀会导致Python解释器重写属性名称, 以避免子类中的命名冲突. 举例来说, 如果在class Test中有一个成员__x, 那么当利用内置函数dir(Test)来查看类的属性时, 会发现__x被解释器重命名为_Test__x. 双下划线的名称修饰同样也适用于方法名称.
__var__: 双下划线开头和结尾的是一些 Python 的特殊对象, 如类成员的 __init__, __del__, __name__, __call__ 等. Python 官方推荐永远不要讲这样的命名方式应用于自己的变量或函数. 有一种说法是说双下划线建议为类的私有成员, 但是 PEP8 当前的官方版本中并没有明说.
_: 有时候我们会用一个独立的下划线作为一个名字, 这通常是用来指示某个变量时临时的或者无关紧要的.
类的特殊方法
call()
在 Python 中, 函数实际上也是一个对象:
1 2 3
f = abs print(f.__name__) # 'abs' print(f(-123)) # 123

从上面可以看出, 函数是一个对象, 当它赋给另一个变量时, 该变量也是一个函数对象, 可以起到与原函数相同的效果. 在 Python 中, 一个类实例也可以变成一个可调用对象, 只需要实现一个特殊方法 __call__() 即可. 下面我们举例把 Person 类变成一个可调用对象:

class Person(object):

    def __init__(self, name, gender):
        self.name = name
        self.gender = gender

    def __call__(self, friend):
        print("name:", self.name)
        print("friend:", friend)

接下来我们就可以将 Person 类的实例对象当做一个函数来使用, 如下所示:

p = Person('Bob', 'male')
p('Tim')
# name: Bob
# friend: Tim

getitem()

凡是在类中定义了 __getitem__() 方法, 那么它的实例对象就是可以通过 [] 操作符来访问指定的成员或进行特定的行为, 大多数情况下会将该方法实现成通过索引来方法元素的形式.

class DataBase(object):

    def __init__(self):
        super(DataBase, self).__init__()
        self.vals = [1,2,3,4,5]
    def __getitem__(self, key):
        return self.vals[key]

setitem()

使得可以通过 A[3] = 4, B[“a”] = 5 等方式来对类中的元素进行赋值

file()

查看模块的路径

len()

使得类对象可以使用 Python 的内建方法 len(), 返回你自定义的数值.

class DictDemo:
    def __init__(self,key,value):
        self.dict = {}
        self.dict[key] = value
    def __getitem__(self,key):
        return self.dict[key]
    def __setitem__(self,key,value):
        self.dict[key] = value
    def __len__(self):
        return len(self.dict)
dictDemo = DictDemo('key0','value0')
print(dictDemo['key0']) #value0
dictDemo['key1'] = 'value1'
print(dictDemo['key1']) #value1
print(len(dictDemo)) #2

repr()

class Test(object):
    def __init__(self, value='hello, world!'):
        self.data = value

>>> t = Test()
>>> t
<__main__.Test at 0x7fa91c307190>
>>> print t
<__main__.Test object at 0x7fa91c307190>

# 看到了么？上面打印类对象并不是很友好，显示的是对象的内存地址
# 下面我们重构下该类的__repr__以及__str__，看看它们俩有啥区别

# 重构__repr__
class TestRepr(Test):
    def __repr__(self):
        return 'TestRepr(%s)' % self.data

>>> tr = TestRepr()
>>> tr
TestRepr(hello, world!)
>>> print tr
TestRepr(hello, world!)

# 重构__repr__方法后，不管直接输出对象还是通过print打印的信息都按我们__repr__方法中定义的格式进行显示了

# 重构__str__
calss TestStr(Test):
    def __str__(self):
        return '[Value: %s]' % self.data

>>> ts = TestStr()
>>> ts
<__main__.TestStr at 0x7fa91c314e50>
>>> print ts
[Value: hello, world!]

# 你会发现，直接输出对象ts时并没有按我们__str__方法中定义的格式进行输出，而用print输出的信息却改变了

str()

参见 repr() 代码示例

星号 *

*: 乘法
**: 乘幂

用于函数参数

单星号: 将所有参数以元组(tuple) 的形式导入

def foo(param1, *param2):
    print(param1)
    print(param2)
foo(1,2,3,4,5)
# 1
# (2,3,4,5)

双星号: 将所有参数以字典的形式导入

def bar(param1, **param2):
    print(param1)
    print(param2)
bar(1, a=2, b=3)
# 1
# {'a': 2, 'b': 3}

当然这两个用法可以同时出现在一个函数中:

def fun(a, b=10, *args, **kwargs):
    print(a)
    print(b)
    print(args)
    print(kwargs)
fun(1,2,3,4,e=5,f=6)
# 1
# 2
# (3,4)
# {'e': 5, 'f': 6}

globals() 函数

该函数会以字典类型返回当前位置的全部全局变量

stripe()

readlines()

lambda 函数

3.6新功能 f string

包的导入机制

模块和包的定义

模块(module): 用来从逻辑上组织 Python 代码(变量, 函数, 类), 通常是一个.py文件.
包(package): 定义了一个由模块和子包组成的 Python 应用程序执行环境, 本质上就是一个有层次的文件目录结果(必须带有一个__init__.py文件)

import 的搜索路径

在当前目录下搜索
在环境变量PYTHONPATH中指定的路径列表中搜索
在 Python 安装路径的lib库中搜索
Python 所有加载的模型信息都存放在sys.modules结构中, 当import一个模块时, 会按如下步骤来进行:
如果import A, 检查sys.modules中是否已经有A, 如果有则不加载, 如果没有则为A创建module对象, 并加载A;

如果是from A import B, 先为A创建module对象, 再解析A(此时会加载并执行A中的所有代码), 从中寻找B并填充到A的__dict__中.
在导入模块的时候, 模块所在文件夹会自动生成一个__pycache__/module_name.cpython-35.pyc的文件.

import module_name的本质是将module_name.py中的全部代码加载到内存中, 并将其赋值给与模块同名的变量, 这个变量的类型是class.
from module_name import name的本质是将指定的变量或者方法导入到当前的文件中
import package_name的本质是执行该包下的__init__.py文件, 在执行文件后, 会在package_name目录下生成一个__pycache__/__init__cpython-35.pyc文件.
from package_name import *的本质是导入__init__.py文件中的__all__列表(eg. __all__ = ['L2Norm', 'MultiBoxLoss']).

相对导入和绝对导入

绝对导入:

1
2

import A.B
from A import B

相对导入:

1
2

from . import B # . 代表当前路径
from ..A import B # .. 代表上层路径, ... 代表上上层路径.

在没有明确指定包结构的情况下, Python 是根据__name__来决定一个模块在包中的结构的, 如果是__main__, 则它本身就是顶层模块, 没有包结构, 如果是A.B.C结构, 则A是顶层模块. Python 的导入方式的不同具有不同的规则:

1.如果是绝对导入, 一个模块只能导入自身的子模块或者和它的顶层模块同级别的模块及其子模块.
2.如果是相对导入, 一个模块必须有包结构且只能导入它的顶层模块内部的模块.

如果一个模块被直接运行, 则它自己为顶层模块, 不存在层次结构, 所以也找不到上层(..)的相对路径
Python2.x 默认为相对路径导入, 而 Python3.x 默认为绝对路径导入, 这样可以避免导入的子包覆盖掉标准库模块. 通常, 在 Python2.x 中, 我们利用下面的语句来使其导入规则遵循 Python3.x

`1`	`from __future__ import absolute_import`

absolute_import的意思并不是将所有的导入都视为绝对导入, 而是指禁用隐式相对导入(implicit relative import), 关于隐式的显示的具体区别, 可以看下面的例子, 假设有如下的包结构:

thing
└── __init__.py
├── books
│ ├── __init__.py
│ ├── adventure.py
│ ├── history.py
│ ├── horror.py
│ └── lovestory.py
├── furniture
│ ├── __init__.py
│ ├── armchair.py
│ ├── bench.py
│ ├── screen.py
│ └── stool.py

那么如果想在stool.py中导入bench模块, 则有如下几种方式:

1
2
3

import bench # 隐式相对导入
from . import bench # 显式相对导入
from furniture import bench # 绝对导入

隐式相对导入没有告诉解释器相对于谁进行导入, 默认相对于当前模块; 而显式相对导入则明确告诉了解释器相对于谁来导入. 以上导入方式的第三种是官方推荐的, 第一种是官方强烈不推荐的, Python3 中第一种导入方式只能用于导入sys.path中的模块.
**注意, 还有相对导入的模块不能被直接运行, 会提示如下错误:

Traceback (most recent call last):
  File "test.py", line 8, in 
    from .ssd import SSD
ModuleNotFoundError: No module named '__main__.ssd'; '__main__' is not a package

另外存在一种情况就是: 假如有两个模块a.py和b.py放在同一个目录下, 则可以直接在a.py中使用import b来导入模块b. 这是为什么呢? 我们上面说了在 Python3.x 中不能使用这种隐式相对导入, 但是这里却可以成功导入, 这是因为此时我们是直接运行a.py, 所以a.py和b.py的目录没有被当做一个包来处理, 因此不涉及相对导入和绝对导入的概念. 因此相对导入和绝对导入仅仅是针对于包而言的.

综合距离

存在目录结构如下所示:

dirRoot
└── __init__.py
├── file1.py
├── file2.py
├── dirA
│ ├── __init__.py
│ ├── a1.py
│ └── a2.py
├── dirB
│ ├── __init__.py
│ ├── b1.py
│ └── b2.py

直接运行a1.py, 并希望导入a2模块:

# a1.py
import a2 # 正确, 此时并未将 dirA 当做包来处理, a1.py 和 a2.py 相当于两个独立的模块
from a2 import func_a2 # 正确
from .a2 import func_a2 # 错误, 当进行相对导入时, 不能直接运行

直接运行file1.py, 并希望导入a1模块, 同时a1模块中需要导入a2模块:

# file1.py
from dirA import a1
a1.func_a1() # a1.py 中的函数
a1.func_a2() # a1.py 中导入了 a2.py 的函数, 可以直接使用

# a1.py
import a2 # 错误, 此时由于 dirA 中有 __init__.py 文件, 因此会将 dirA 当做包来处理,
# 由于 Python3.x 不允许使用隐式的相对导入, 因此该语句非法
from a2 import func_a2 # 错误, 原因同上
from .a2 import func_a2 # 正确, 当进行相对导入时, 需要使用显式的相对导入

直接运行file1.py, 并希望导入a1模块, 同时a1模块中需要导入dirB/b1模块(跨文件夹导入):

# file1.py
from dirA import a1
a1.func_a1() # a1.py 中的函数
a1.func_a2() # a2.py 中的函数
a1.func_b1() # b1.py 中的函数

# a1.py
from .a2 import func_a2 # 推荐使用绝对导入 from dirA.a1 import func_a2
from dirB import b1 # 由于运行的是 file1.py 文件, 因此顶层目录是 dirRoot
from dirB.b1 import func_b1 # 所以可以直接使用 dirB 包

直接运行a1.py, 并希望跨目录的导入dirB/b1模块. 由于这种跨目录的导入超越了顶层路径的限制, 因此必须使用sys.path.append()方法来额外添加搜索路径, 否则无法正常导

# a1.py
import sys
sys.path.append("../") # 将 dirA 的上一次目录添加到搜索路径中
from dirB import b1 # 正确, 注意必须先添加 path, 然后再导入
from dirB.b1 import func_b1 # 正确
from .a2 import func_a2 # 这里是错误的, 当直接执行 a1.py 时, a1.py 中不能包含显式相对导入

获取 python 版本:

`1`	`print(sys.version_info)`

获取包的安装位置

`1`	`print(cv2)`

解析 xml 文件

导入:

import sys
if sys.version_info[0] == 2:
    import xml.etree.cElementTree as ET
else:
    import xml.etree.ElementTree as ET

解析:

xmlfile = ET.parse(xmlfile_path)
root = xmlfile.getroot() # 获取根节点
root.tag # 标签
root.attrib # 属性字典

for child in root: # 迭代访问子节点
    print(child.tag, child.attrib)

# 可以通过索引访问嵌套节点的内容
root[0][1].text

Element.findall() #
Element.find() #

python 中 == 和 is 的区别

== 只用于判断值是否相等
is 用于判断两个对象是否为同一个实例
小整数对象池: Python 为了优化速度，使用了小整数对象池，避免为整数频繁申请和销毁内存空间。而Python 对小整数的定义是 [-5, 257)，只有数字在-5到256之间它们的id才会相等，超过了这个范围就不行了，同样的道理，字符串对象也有一个类似的缓冲池，超过区间范围内自然不会相等了

队列 queue

在 Python3 中, 原来的Queue模块被重命名为queue, 该模块包含以下三类数据结构:

queue.Queue(maxsize=0): FIFO queue, 先进先出队列, 代表普通队列
queue.LifoQueue(maxsize=0): LIFO queue, 后进先出队列, 类似栈的作用
queue.PriorityQueue(maxsize=0): 优先级队列, 类似堆的作用. 默认为小顶堆, 常用形式为元组:(priority_number, data)
上面的 maxsize 表明了队列中最大可以容纳的元素数量, 如果超过, 则无法插入. 当 maxsize <= 0 时, 代表元素数量无限制.
公有方法(以上三个通用):
qsize(): 返回 approximate size, qsize() > 0 不保证get()一定 work, 同理, qsize() < maxsize 不保证put()一定 work.
empty(): 如果队列为空, 返回 True. 和qsize()一样, 不提供保证性.
full(): 如果队列满, 返回 True. 不提供保证性
put(item[, block[, timeout]])
put_nowait(item): 等价于put(item, False)
get([block[, timeout]])
get_nowait(): 等价于get(False)
task_done():
join():
堆 heapq
heapq 模块只有最小堆的功能, 要实现最大堆, 需要在入堆和出堆的时候取反, 并且 heapq 模块只能作用于数值型类型.
最大堆: _heapify_max(), _heappop_max()

给定一组数据, 创建堆, 两种方式(二者等价):

import heapq
data = [1,3,6,2,8,5]
heap = []
for d in data:
    heapq.heappush(heap, n) # 方法一 逐个构建

heapq.heapify(data) # 方法二 原地构建, 效率更高

小顶堆:

heap = [1,3,6,2,8,5]
heapq.heapify(heap)
heapq.heappop(heap) # 返回并删除堆顶
heapq.heapreplace(heap, 10) # 删除堆顶并添加新值
heapq.heappushpop(heap, 10) # 先将新值加入堆中, 然后立刻弹出堆顶
print(heap[0]) # 查看堆顶

大顶堆:

# 方法一: 取负值
heap = [-1,-3,-6,-2,-8,-5]

# 方法二: 内置方法
heap = [1,3,6,2,8,5]
heapq._heapify_max(heap) # max_heap
print(heap[0]) # 查看堆顶, 8
heapq._heappop_max(heap) # po from maxheap
print(heap[0]) # 6
heapq._heapreplace_max(heap, 10)
print(heap[0]) # 10
# heapq._heappushpop_max(heap, 10) # 注意, 没有 _heappushpop_max 函数

Python 刷题常用

队列:

import Queue
base_queue = Queue.Queue() # 基本队列, 先进先出
base_queue.put(x)
base_queue.get()

lifo_queue = Queue.LifoQueue() # 先进后出, 类似栈
lifo_queue.put(x)
lifo_queue.get()

prio_queue = Queue.PriorityQueue() # 优先队列, 与C++中priority_queue类似, 可实现堆的功能
prio_queue.put(x)
prio_queue.get()

numpy 中vstack, hstack, concatenate 和 stack 之间的区别和联系

concatenate

`1`	`numpy.concatenate((a1, a2, ...), axis=0, out=None)`

concatenate 的作用就是将多个数组序列按照axis指定的维度连接起来, 这些数组序列 a1, a2, … 必须保证除了 axis 指定维度之外的其他维度具有相同的 shape.

注意: 这里的维度指的是a1, a2的维度, 而不是(a1, a2)的维度

从维度角度来更好理解 concatenate 的作用
concatenate 执行后的 shape 特定是: axis 指定的维度是多个数组序列对应维度的数值和, 而其他维度保持不变. 也就是说不会增加新的维度, 这是 concatenate 与 stack 之间的一个重要的区别.

如下所示:

import numpy as np
a1 = np.array([[1, 1], [2, 2], [3, 3]]) # shape = 3x2
a2 = np.array([[1, 1], [2, 2]]) # shape = 2 x 2
print(a1.shape, a2.shape)
concat1 = np.concatenate((a1, a2), axis=0)
print(concat1.shape) # shape 为 [5, 2], 在 0 维度上为 3+2, 其他维度保持不变
print(concat1) # a1, a2 维度 0 不同, 一个为 3, 一个为 2, 其他维度相同, 均为 2
#[[1 1]
# [2 2]
# [3 3]
# [1 1]
# [2 2]]
#print(np.concatenate((a1, a2), axis=1)) # 由于维度 0 二者不同, 无法保持不变, 因此报错

a1 = np.array([[1, 2, 3]]) # shape = 1x3
a2 = np.array([[1, 2]]) # shape = 1x2
print(a1.shape, a2.shape)
concat2 = np.concatenate((a1, a2), axis=1)
print(concat2.shape) # shape 为 [1, 5]在 1 维度上为 3 + 2, 0 维度上保持 1 不变
print(concat2)
# [[1 2 3 1 2]]
# print(np.concatenate((a1, a2), axis=0)) # 维度 1 不同, 报错

有时候, concatenate的第一个参数只会传送一个一个数组序列, 这时候, 等价于将这个数组序列的第一维的元素看做是多个数组序列作为concatenate的参数进行传递. 如下所示:

a = [[1, 2, 3], [1, 2, 3]]
print(np.concatenate(a, axis=0)) # 该行与下一行等价
print(np.concatenate((a[0], a[1]), axis=0))

a = [[1, 2, 3], [1, 2]]
print(np.concatenate(a, axis=0)) # 可以看出, 虽然 a 的第一维度为 2, 第二维度为 3 和 2

# 但是, 我们要将其拆分, 拆分后, a[0], a[1] 的第一维度3和2, 其他维度相同, 因此可以在第一维度上进行连接
print(np.concatenate((a[0], a[1]), axis=0))

stack

1
2

numpy.stack(arrays, axis=0, out=None)
numpy.stack((a1, a2, ...), axis=0, out=None)

stack 的作用就是将多个数组序列按照axis指定的维度堆叠起来, 这些数组序列 a1, a2, … 必须保证所有维度都相同, 注意这里与 concatenate 的区别.

要更好的理解stack, 可以借助维度的概念进行理解, 对于 shape 相同的 k 个数组序列来说, stack 的作用相当于新插入一个维度, 维度的大小为 k, 插入的位置为axis指定的位置. 如下所示:

a1 = [[1, 1], [2, 2], [3, 3]] # shape = 3x2
a2 = [[4, 4], [5, 5], [6, 6]] # shape = 3x2
a3 = [[7, 7], [8, 8], [9, 9]] # shape = 3x2
a4 = [[0, 0], [0, 0], [0, 0]] # shape = 3x2
stack1 = np.stack((a1, a2, a3, a4), axis=0) # 新插入维度大小为 4, 位置为第 0 维
print(stack1.shape) # shape 为 (4, 3, 2)
print('###\n', stack1) # 先将 shape 画好, 然后进行填充, 在第 0 维上进行堆叠, 因此 stack1[*][*] = a1[0], a1[1], ..., a4[2]

stack2 = np.stack((a1, a2, a3, a4), axis=1) # 新插入维度大小为 4, 位置为第 1 维
print(stack2.shape) # shape 为 (3, 4, 2)
print('###\n', stack2) # 在第 1 维上进行堆叠, 因此 stack2[*][*] = a1[0], a2[0], a3[0], a1[1], ...

stack3 = np.stack((a1, a2, a3, a4), axis=2) # 新插入维度大小为 4, 位置为第 2 维
print(stack3.shape) # shape 为 (3, 2, 4)
print('###\n', stack3) # 在第 2 维上进行堆叠, 因此 stack2[*][*] = [1 4 7 0], [1 4 7 0], [2 5 8 0], ...

hstack 和 vstack

hstack 和 vstack 虽然名字中都带有 stack, 但是实际上, 它们和np.stack的关系并不大, 一个明显的区别就是np.stack要求进行堆叠的多个数组序列需要保证 shape 完全相同, 并且堆叠后会新增加一个由axis指定的维度. 实际上, hstack 和 vstack 可以看做是特殊的 concatenate, 它们在某些情况下可以用 concatenate 来代替

既然 hstack 和 vstack 是特殊的 concatenate, 也就是说, 它们所接受的多个数组序列在axis指定的维度上可以不同, 而在其他维度上必须相同.

vstack: 在垂直方向上将多个数组序列进行堆叠, 相当于在axis=0维度上执行concatenate
hstack: 在水平方向上将多个数组序列进行堆叠, 相当于在axis=1维度上执行concatenate

a = [[1, 1], [2, 2], [3, 3]] # shape = 3x2
b = [[4, 4], [5, 5], [6, 6]] # shape = 3x2
c = [[7, 7], [8, 8], [9, 9]] # shape = 3x2
d = [[0, 0], [0, 0], [0, 0]] # shape = 3x2

v = np.vstack((a, b, c, d))
print(v.shape) # (12, 2)
print(v)

x = np.concatenate((a, b, c, d), axis = 0) # 等价于 vstack
print(x.shape) # 12, 2
print(x)

h = np.hstack((a, b, c, d))
print(h.shape) # (3, 8)
print(h)

x = np.concatenate((a, b, c, d), axis = 1) # 等价于 hstack
print(x.shape) # 3, 8
print(x)

需要特别注意, 当多个数组序列是一维数组时, 应该先将一维数组转换成二维数组, 然后才能与相应的 concatenate 进行等价. 这是因为, 在数组序列是一维数组时, concatenate 是无法使用axis=1的, 因此此时的 hstack 相当于是在axis=0上进行 concatenate, 而 vstack 则需要先将数组的 shape 从 (N,) 转换成 (1, N) 后才相当于是在axis=1上进行 concatenate

a = np.array([1, 2, 3, 4, 5]) # 当面对的是一维数组时,
b = np.array([6, 7, 8, 9, 10])

h = np.hstack((a, b))
print(h.shape)
print(h)
con = np.concatenate((a, b), axis=0) # 当 a, b 是一维数组时, hstack 相当于在 axis=0 上进行连接
print(con.shape)
print(con)

v = np.vstack((a, b))
print(v.shape)
print(v)
con = np.concatenate(([a], [b]), axis=0) # 当 a, b 是一维数组时, vstack 相当于将 a, b 先转换成二维 (1, N), 然后在 axis=0 上进行连接
print(con.shape)
print(con)

set 去重

对于二维列表, 由于 list 的元素也是 list, 在内存中存储的是首元素地址, 无法直接使用 set, 因此需要先将内部的元素全部全换成 tuple 后, 才能使用 list 去重. 如下所示

a = list()
a.append([1,2,3])
a.append([1,2,3])
a.append([1,2,3])
a.append([4, 5, 6])
# b = set(a) # 报错
b = set(map(tuple, a))
print(b) # {(4, 5, 6), (1, 2, 3)}

os.sep用法

ython是跨平台的。在Windows上，文件的路径分隔符是’\’，在Linux上是’/‘。

为了让代码在不同的平台上都能运行，那么路径应该写’\’还是’/‘呢？

使用os.sep的话，就不用考虑这个了，os.sep根据你所处的平台，自动采用相应的分隔符号。

举例

Linux下一个路径，/usr/share/python,那么上面的os.sep就是‘/’
windows下一个路径，C：\Users\Public\Desktop,那么上面的os.sep就是‘\’.

`1`	`data_dir = os.sep.join(['hello', 'world'])`

Python3 元组

Python元组包含了以下内置函数

len(tuple) 计算元组元素个数。

>>> tuple1 = ('Google', 'Runoob', 'Taobao')
>>> len(tuple1)
3
>>>

max(tuple) 返回元组中元素最大值。

>>> tuple2 = ('5', '4', '8')
>>> max(tuple2)
'8'
>>>

min(tuple) 返回元组中元素最小值。

>>> tuple2 = ('5', '4', '8')
>>> min(tuple2)
'4'
>>>

tuple(seq) 将列表转换为元组。

>>> list1= ['Google', 'Taobao', 'Runoob', 'Baidu']
>>> tuple1=tuple(list1)
>>> tuple1
('Google', 'Taobao', 'Runoob', 'Baidu')

序列化Python对象

你需要将一个Python对象序列化为一个字节流，以便将它保存到一个文件、存储到数据库或者通过网络传输它。
对于序列化最普遍的做法就是使用 pickle 模块。为了将一个对象保存到一个文件中，可以这样做

pickle 对于大型的数据结构比如使用 array 或 numpy 模块创建的二进制数组效率并不是一个高效的编码方式。如果你需要移动大量的数组数据，你最好是先在一个文件中将其保存为数组数据块或使用更高级的标准编码方式如HDF5 (需要第三方库的支持)。

In [1]: import pickle                                                           

In [2]: obj = 123,"abcdef", ["ac", 123], {"key": "value", "key1": "value1"}     

In [3]: print(obj)                                                              
(123, 'abcdef', ['ac', 123], {'key': 'value', 'key1': 'value1'})

In [4]: # 序列化到文件                                                          

In [5]: with open(r'./a.pickle','wb') as f: 
   ...:     pickle.dump(obj,f) 
   ...:                                                                         

In [6]: with open(r'./a.pickle','rb') as f: 
   ...:     aa= pickle.load(f) 
   ...: print(aa) 
   ...:  
   ...:                                                                         
(123, 'abcdef', ['ac', 123], {'key': 'value', 'key1': 'value1'})

参考链接：
https://hellozhaozheng.github.io
https://www.runoob.com/python/python-tutorial.html

你可能感兴趣的:(python手册)

使用python计算等比数列求和的方法 HAMYHF windows
在python中，计算Sum=m+mm+mmm+mmmm+.....+mmmmm.....,输入两个数m,n。m的位数累加到n的值，列出算式并计算出结果：#为了打印出算式，并计算出结果，将m,mm这些放入到列表中#定义列表中的m初始值为0,用Ele来代表m,mm....Ele=0#定义总和为0Sum=0#定义一个空列表List=[]#输入两个值n=int(input("inputadigit：")
Python+Playwright常用元素定位方法 HAMYHF python 功能测试
CSSselector选择器在CSS中，定位元素主要通过选择器完成，以下是几种常见的CSS选择器定位方法：标签选择器(element):直接使用HTML元素名称来定位，例如p会选择所有段落元素。属性选择器(attribute):选择所有具有指定属性的元素，无论该属性的值是什么。例如，[title]会选择所有包含title属性的元素。选择具有指定属性，并且该属性值完全等于给定值的元素。例如，[typ
Python中的 redis keyspace 通知_python 操作redis psubscribe(‘__keyspace@0__ ‘) 2301_82243733 程序员 python 学习面试
最后Python崛起并且风靡，因为优点多、应用领域广、被大牛们认可。学习Python门槛很低，但它的晋级路线很多，通过它你能进入机器学习、数据挖掘、大数据，CS等更加高级的领域。Python可以做网络应用，可以做科学计算，数据分析，可以做网络爬虫，可以做机器学习、自然语言处理、可以写游戏、可以做桌面应用…Python可以做的很多，你需要学好基础，再选择明确的方向。这里给大家分享一份全套的Pytho
Python数据分析与可视化程序媛小果 python python 数据分析开发语言
Python数据分析与可视化在数据驱动的商业世界中，数据分析和可视化成为了理解复杂数据集、做出明智决策的关键工具。Python，作为一种功能强大且易于学习的编程语言，提供了丰富的库和框架，使得数据分析和可视化变得简单高效。本文将探讨Python在数据分析和可视化中的应用，包括数据预处理、分析、以及如何通过可视化工具将数据洞察转化为可操作的策略。1.数据分析的重要性数据分析是提取数据中有用信息的过程
【Python 学习 / 7】模块与文件操作卜及中 Python基础 python 学习数据库
文章目录前言一、导入模块1.导入整个模块2.导入模块中的特定函数3.给模块或函数起别名二、常用模块1.`math`模块2.`random`模块3.`os`模块4.`sys`模块三、文件处理1.打开文件2.读取文件3.写入文件4.关闭文件5.使用`with`语句管理文件四、日期时间1.`datetime`模块获取当前日期和时间创建日期和时间对象格式化日期和时间解析字符串为日期对象2.`time`模块
经销商管理系统架构设计方案（附 Java版本和Python版本源代码详解） AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战 AI大模型应用入门实战与进阶计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
经销商管理系统架构设计方案（Java实现源代码详解）关键词：经销商管理系统，Java，SpringBoot，MyBatis，MySQL，架构设计，源代码1.背景介绍随着市场竞争的日益激烈，企业对经销商的管理越来越重视。传统的经销商管理方式效率低下，信息滞后，难以适应现代企业的发展需求。为了提高经销商管理效率，降低运营成本，越来越多的企业开始采用信息化的手段来管理经销商，而经销商管理系统应运而生。经
Python:数据从Excel表格链接到Word文档更新Excel即可自动更新Word 一个花生米生花 python excel word
要使用Python来创建或更新一个Word文档，并将数据从Excel表格链接到Word文档中，你可以使用python-docx库来操作Word文档和openpyxl或pandas库来读取Excel文件。不过，需要注意的是，python-docx库并不支持将外部文件链接到Word文档的功能。你可以在Word文档中插入Excel数据的快照，但它们不会自动更新。如果你想要在Word文档中插入Excel数
使用Odoo Shell卸载模块 odoo中国 odoo odoo 开源软件 erp
使用OdooShell卸载模块我们在Odoo使用过程中，因为模块安装错误或者前端错误等导致odoo无法通过界面登录，这时候你可以使用OdooShell来卸载模块。OdooShell是一个交互式Pythonshell，允许你直接与Odoo数据库和模型进行交互。以下是使用OdooShell卸载模块的详细步骤：步骤1：启动OdooShell要启动OdooShell，你需要在终端中运行以下命令。确保你已经
NumPy的基本使用 Mo思编程学习 numpy python 开发语言 pip
在Python的数据科学与数值计算领域，NumPy无疑是一颗耀眼的明星。作为Python中用于科学计算的基础库，NumPy提供了高效的多维数组对象以及处理这些数组的各种工具。本文将带您深入了解NumPy的基本使用，感受它的强大魅力。一、安装与导入在使用NumPy之前，首先要确保它已经安装在您的Python环境中。如果您使用的是Anaconda发行版，NumPy通常已经预装。若未安装，可以使用如下命
FOKS-TROT: 一个高效、易用的全功能开源知识图谱生成工具柳旖岭
FOKS-TROT:一个高效、易用的全功能开源知识图谱生成工具项目简介FOKS-TROT是一个基于Python的全功能开源知识图谱生成工具，旨在帮助研究人员和开发者快速构建具有丰富信息的知识图谱。该项目由hkx3upper在GitCode上开发并维护。通过FOKS-TROT，您可以轻松地将各种数据源（如文本文件、数据库、API）转换为结构化的知识图谱，并对其进行可视化分析和机器学习任务。此外，该工
python实现word文档合并 v2.0 task138 python自动化 python 自动化运维开发
目录前言要求运行效果脚本下载链接前言之前发表了一个小工具，python用于合并word文档以完成特定的工作任务，现在领导给出了新需求，适当的调整了一下word文档的合并情况。同时，各位同事反馈说，环境部署太难了，脚本的使用成本比较高，难度大，所以我这次把脚本打包成一个EXE可执行文件，直接双击即可使用。要求由于脚本的具体逻辑发生了变化，因此，exe文件的同级目录下，一定要存在一个txt文件，否则无
2025年三个月自学手册网络安全（黑客技术）网安kk web安全安全网络网络安全人工智能
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包什么是网络安全网络安全可以基于攻击和防御视角来分类，我们经常听到的“红队”、“渗透测试”等就是研究攻击技术，而“蓝队”、“安全运营”、“安全运维”则研究防御技术。如何成为一名黑客很多朋友在学习安全方面都会半路转行，因为不知如何去学，在这里，我将这个整份答案分为黑客（网络安全）入门必备、黑客（网络安全）职业指南、黑客（网络安全）学习导航
2025年全国CTF夺旗赛-从零基础入门到竞赛，看这一篇就稳了！白帽安全-黑客4148 安全 web安全网络网络安全 CTF
目录一、CTF简介二、CTF竞赛模式三、CTF各大题型简介四、CTF学习路线4.1、初期1、html+css+js（2-3天）2、apache+php（4-5天）3、mysql（2-3天）4、python(2-3天)5、burpsuite（1-2天）4.2、中期1、SQL注入（7-8天）2、文件上传（7-8天）3、其他漏洞（14-15天）4.3、后期五、CTF学习资源5.1、CTF赛题复现平台5.
2025年全国CTF夺旗赛-从零基础入门到竞赛，看这一篇就稳了！白帽安全-黑客4148 网络安全 web安全 linux 密码学 CTF
目录一、CTF简介二、CTF竞赛模式三、CTF各大题型简介四、CTF学习路线4.1、初期1、html+css+js（2-3天）2、apache+php（4-5天）3、mysql（2-3天）4、python(2-3天)5、burpsuite（1-2天）4.2、中期1、SQL注入（7-8天）2、文件上传（7-8天）3、其他漏洞（14-15天）4.3、后期五、CTF学习资源5.1、CTF赛题复现平台5.
基于python深度学习遥感影像地物分类与目标识别、分割实践技术应用 xiao5kou4chang6kai4 深度学习遥感勘测 python 深度学习分类
专题一：深度学习发展与机器学习深度学习的历史发展过程机器学习，深度学习等任务的基本处理流程梯度下降算法讲解不同初始化，学习率对梯度下降算法的实例分析从机器学习到深度学习算法专题二深度卷积网络、卷积神经网络、卷积运算的基本原理池化操作，全连接层，以及分类器的作用BP反向传播算法的理解一个简单CNN模型代码理解特征图，卷积核可视化分析专题三TensorFlow与keras介绍与入门TensorFlow
python 快速实现链接转 word 文档嘿嘿潶黑黑 python word
python快速实现链接转word文档演示代码展示最后演示代码展示fromnewspaperimportArticlefromdocximportDocumentfromdocx.sharedimportPt,RGBColorfromdocx.enum.styleimportWD_STYLE_TYPEfromdocx.oxml.nsimportqn#tkinterGUIimporttkintera
Python入门笔记「已注销」计算机
文章目录第0周课程导学第1周Python基本语法元素保留字数据类型语句与函数输入函数第2周Python基本图形绘制turtle库绝对坐标海龟坐标turtle角度坐标体系RGB色彩体系画笔控制函数运动控制函数方向控制函数循环语句第3周基本数据类型整型浮点数科学计数法复数类型数值运算操作符二元操作符有对应的增强赋值操作符数值运算函数字符串类型的表示字符串切片字符串类型及操作字符串类型格式化time库时
pythonxml模块高级用法_Python minidom模块用法示例【DOM写入和解析XML】 Lucy-露西娅 pythonxml模块高级用法
本文实例讲述了Pythonminidom模块用法。分享给大家供大家参考，具体如下：一、DOM写XML文件#-*-coding:utf-8-*-#!python3#导入minidomfromxml.domimportminidom#1.创建DOM树对象dom=minidom.Document()#2.创建根节点。每次都要用DOM对象来创建任何节点。root_node=dom.createElemen
React 渲染 Flash 接口数据 ox0080 #北漂+滴滴出行 VIP 激励 Web react.js 前端前端框架
1.后端Python代码使用Flask创建多个接口，每个接口返回不同的数据，并使用自定义装饰器来绑定路由。代码：#app.pyfromflaskimportFlask,jsonifyapp=Flask(__name__)defapi_route(route,methods=['GET']):"""自定义装饰器，用于将函数与HTTP路由绑定"""defdecorator(func):app.rout
LQB---基础练习---十六进制转八进制「已注销」 #LQB LQB
试题基础练习十六进制转八进制资源限制内存限制：512.0MBC/C++时间限制：1.0sJava时间限制：3.0sPython时间限制：5.0s问题描述给定n个十六进制正整数，输出它们对应的八进制数。输入格式输入的第一行为一个正整数n（1<=n<=10）。接下来n行，每行一个由09、大写字母AF组成的字符串，表示要转换的十六进制正整数，每个十六进制数长度不超过100000。输出格式输出n行，每行为
【2025年】全国CTF夺旗赛-从零基础入门到竞赛，看这一篇就稳了！网安詹姆斯 web安全 CTF 网络安全大赛 python linux
【2025年】全国CTF夺旗赛-从零基础入门到竞赛，看这一篇就稳了！基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包目录一、CTF简介二、CTF竞赛模式三、CTF各大题型简介四、CTF学习路线4.1、初期1、html+css+js（2-3天）2、apache+php（4-5天）3、mysql（2-3天）4、python(2-3天)5、burpsuite（1-2天）4.2、中期1、S
机器学习·文本数据读写处理 AAA顶置摸鱼 python 深度学习机器学习人工智能数据处理
前言在自然语言处理的第一步，需要面对的是各种各样以不同形式表现的文本数据，比如，txt、Excel中的表格数据，还有无法直接打开的pkl文件等。针对这些不同类型的数据，可以基于Python中的基本功能函数或者调用某些库进行读写以及作一些基本的处理。一、文本数据读写方法1.读写TXT文件读取方法：read()：读取整个文件，返回字符串。readline()：逐行读取，返回字符串。readlines(
LQB（4）-python-DFS搜索 AAA顶置摸鱼蓝桥杯python组深度优先算法 python 蓝桥杯
前言DFS即深度优先搜索（Depth-FirstSearch），是一种用于遍历或搜索树或图的算法，有三种核心的应用场景（基础遍历、回溯、剪枝）。一、DFS-基础遍历1.核心原理深度优先搜索（DFS）是一种遍历或搜索树/图的算法，优先沿着一条路径尽可能深入，直到无法继续再回溯。实现方式：递归：隐式利用系统调用栈。栈模拟：显式使用栈数据结构。2.代码实现(1)递归实现（树结构）classTreeNod
Python中LLM的知识图谱构建：动态更新与推理二进制独立开发 GenAI与Python 非纯粹GenAI python 知识图谱开发语言自然语言处理人工智能分布式机器学习
文章目录引言1.知识图谱的基本概念1.1知识图谱的定义1.2知识图谱的构建流程2.利用LLM进行知识抽取2.1实体识别2.2关系抽取2.3属性抽取3.知识融合3.1实体对齐3.2冲突消解4.知识存储5.知识推理5.1规则推理5.2基于LLM的推理6.动态更新6.1增量更新6.2实时更新7.结论引言随着人工智能技术的飞速发展，知识图谱（KnowledgeGraph,KG）作为一种结构化的知识表示方法
Python's SQLAlchemy and Object-Relational Mapping zhanglizhuo Python
Acommontaskwhenprogramminganywebserviceistheconstructionofasoliddatabasebackend.Inthepast,programmerswouldwriterawSQLstatements,passthemtothedatabaseengineandparsethereturnedresultsasanormalarrayofrec
Jira，一个强大灵活的项目和任务管理工具 Python 库图灵学者 python精华 jira python 开发语言
目录01初识Jira为什么选择Jira？02安装与配置安装jira库配置Jira访问获取APItoken：配置Python环境：03基本操作创建项目创建任务查询任务更新任务删除任务04高级操作处理子任务搜索任务添加附件评论任务05实战案例自动化创建与分配任务自动生成项目报告06结语01初识JiraJira是Atlassian公司开发的一款项目和任务管理工具。它广泛应用于软件开发、IT支持、营销等各
使用LlamaIndex查询 MongoDB 数据库，并获取 OSS (对象存储服务) 上的 PDF 文件，最终用Langchain搭建应用朴拙Python交易猿数据库 mongodb pdf
使用LlamaIndex查询MongoDB数据库，并获取OSS(对象存储服务)上的PDF文件，然后利用Langchain搭建应用，涉及多个步骤。下面我们将详细介绍如何将这些步骤结合起来，构建一个系统：1.环境准备首先，确保你已经安装了以下Python库：pipinstallllama_indexpymongolangchainopenaiboto3pdfplumberpymongo：MongoDB
python 连接 jira 我就是我是好孩子啊 python jira 开发语言
Python连接到Jira实例、登录、查询、修改和创建bug首先，你需要安装jiraPython库pip3installjira连接到Jira并登录fromjiraimportJIRAfromjira.exceptionsimportJIRAError#Jira服务器地址，用户名和密码jira_server='https://your-jira-server.com'jira_user='your
python调用接口返回401,带有Python的Jira API在有效凭据上返回错误401 weixin_39743369 python调用接口返回401
IamtryingtousetheJirapythonlibrarytodosomequitebasicthings.Evenbeforedoinganything,theconstructorfails.address='https://myaddress.atlassian.net'options={'server':address}un='[email protected]'#un='my'#alsod
python邮件发送哪个好_(原创)python发送邮件加勒比考斯 python邮件发送哪个好
这段时间一直在学习flask框架，看到flask扩展中有一个mail插件，所以今天就给大家演示如果发邮件。首先我注册了一个163邮箱，需要开启smtp功能,(网易的电子邮件服务器)。注册好163邮箱，然后开启smtp功能，如下图所示:开启的过程中需要绑定手机。我最终实现的样子是这样的:使用flask搭建了一个web服务器，然后做了一个网页，将收件人，主题，正文填好之后，点击发送，上面会显示发送结果
关于旗正规则引擎中的MD5加密问题何必如此 jsp MD5 规则加密
一般情况下，为了防止个人隐私的泄露，我们都会对用户登录密码进行加密，使数据库相应字段保存的是加密后的字符串，而非原始密码。在旗正规则引擎中，通过外部调用，可以实现MD5的加密，具体步骤如下： 1.在对象库中选择外部调用，选择“com.flagleader.util.MD5”，在子选项中选择“com.flagleader.util.MD5.getMD5ofStr({arg1})”； 2.在规
【Spark101】Scala Promise/Future在Spark中的应用 bit1129 Promise
Promise和Future是Scala用于异步调用并实现结果汇集的并发原语，Scala的Future同JUC里面的Future接口含义相同，Promise理解起来就有些绕。等有时间了再仔细的研究下Promise和Future的语义以及应用场景，具体参见Scala在线文档：http://docs.scala-lang.org/sips/completed/futures-promises.html
spark sql 访问hive数据的配置详解 daizj spark sql hive thriftserver
spark sql 能够通过thriftserver 访问hive数据，默认spark编译的版本是不支持访问hive，因为hive依赖比较多，因此打的包中不包含hive和thriftserver,因此需要自己下载源码进行编译，将hive，thriftserver打包进去才能够访问，详细配置步骤如下： 1、下载源码 2、下载Maven,并配置此配置简单，就略过
HTTP 协议通信周凡杨 java httpclient http 通信
一：简介 HTTPCLIENT，通过JAVA基于HTTP协议进行点与点间的通信！二：代码举例测试类： import java
java unix时间戳转换 g21121 java
把java时间戳转换成unix时间戳： Timestamp appointTime=Timestamp.valueOf(new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date())) SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd hh:m
web报表工具FineReport常用函数的用法总结（报表函数）老A不折腾 web报表 finereport 总结
说明：本次总结中，凡是以tableName或viewName作为参数因子的。函数在调用的时候均按照先从私有数据源中查找，然后再从公有数据源中查找的顺序。 CLASS CLASS(object):返回object对象的所属的类。 CNMONEY CNMONEY(number,unit)返回人民币大写。 number:需要转换的数值型的数。 unit:单位，
java jni调用c++ 代码报错墙头上一根草 java C++jni
# # A fatal error has been detected by the Java Runtime Environment: # # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x00000000777c3290, pid=5632, tid=6656 # # JRE version: Java(TM) SE Ru
Spring中事件处理de小技巧 aijuans spring Spring 教程 Spring 实例 Spring 入门 Spring3
Spring 中提供一些Aware相关de接口，BeanFactoryAware、 ApplicationContextAware、ResourceLoaderAware、ServletContextAware等等，其中最常用到de匙ApplicationContextAware.实现ApplicationContextAwaredeBean，在Bean被初始后，将会被注入 Applicati
linux shell ls脚本样例 annan211 linux linux ls源码 linux 源码
#! /bin/sh - #查找输入文件的路径 #在查找路径下寻找一个或多个原始文件或文件模式 # 查找路径由特定的环境变量所定义 #标准输出所产生的结果通常是查找路径下找到的每个文件的第一个实体的完整路径 # 或是filename :not found 的标准错误输出。 #如果文件没有找到则退出码为0 #否则即为找不到的文件个数 #语法 pathfind [--
List,Set,Map遍历方式 (收集的资源,值得看一下) 百合不是茶 list set Map遍历方式
List特点：元素有放入顺序，元素可重复 Map特点：元素按键值对存储，无放入顺序 Set特点：元素无放入顺序，元素不可重复（注意：元素虽然无放入顺序，但是元素在set中的位置是有该元素的HashCode决定的，其位置其实是固定的） List接口有三个实现类：LinkedList，ArrayList，Vector LinkedList：底层基于链表实现，链表内存是散乱的，每一个元素存储本身
解决SimpleDateFormat的线程不安全问题的方法 bijian1013 java thread 线程安全
在Java项目中，我们通常会自己写一个DateUtil类，处理日期和字符串的转换，如下所示： public class DateUtil01 { private SimpleDateFormat dateformat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); public void format(Date d
http请求测试实例（采用fastjson解析） bijian1013 http 测试
在实际开发中，我们经常会去做http请求的开发，下面则是如何请求的单元测试小实例，仅供参考。 import java.util.HashMap; import java.util.Map; import org.apache.commons.httpclient.HttpClient; import
【RPC框架Hessian三】Hessian 异常处理 bit1129 hessian
RPC异常处理概述 RPC异常处理指是，当客户端调用远端的服务，如果服务执行过程中发生异常，这个异常能否序列到客户端？如果服务在执行过程中可能发生异常，那么在服务接口的声明中，就该声明该接口可能抛出的异常。在Hessian中，服务器端发生异常，可以将异常信息从服务器端序列化到客户端，因为Exception本身是实现了Serializable的
【日志分析】日志分析工具 bit1129 日志分析
1. 网站日志实时分析工具 GoAccess http://www.vpsee.com/2014/02/a-real-time-web-log-analyzer-goaccess/ 2. 通过日志监控并收集 Java 应用程序性能数据(Perf4J) http://www.ibm.com/developerworks/cn/java/j-lo-logforperf/ 3.log.io 和
nginx优化加强战斗力及遇到的坑解决 ronin47 nginx 优化
　　　先说遇到个坑，第一个是负载问题，这个问题与架构有关，由于我设计架构多了两层，结果导致会话负载只转向一个。解决这样的问题思路有两个：一是改变负载策略，二是更改架构设计。　　　由于采用动静分离部署，而nginx又设计了静态，结果客户端去读nginx静态，访问量上来，页面加载很慢。解决：二者留其一。最好是保留apache服务器。　　　来以下优化：　　　
java-50-输入两棵二叉树A和B，判断树B是不是A的子结构 bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/25411174201011445550396/ import ljn.help.*; public class HasSubtree { /**Q50. * 输入两棵二叉树A和B，判断树B是不是A的子结构。例如，下图中的两棵树A和B，由于A中有一部分子树的结构和B是一
mongoDB 备份与恢复开窍的石头 mongDB备份与恢复
Mongodb导出与导入 1: 导入/导出可以操作的是本地的mongodb服务器,也可以是远程的. 所以,都有如下通用选项: -h host 主机 --port port 端口 -u username 用户名 -p passwd 密码 2: mongoexport 导出json格式的文件
[网络与通讯]椭圆轨道计算的一些问题 comsci 网络
如果按照中国古代农历的历法，现在应该是某个季节的开始，但是由于农历历法是3000年前的天文观测数据，如果按照现在的天文学记录来进行修正的话，这个季节已经过去一段时间了。。。。。也就是说，还要再等3000年。才有机会了，太阳系的行星的椭圆轨道受到外来天体的干扰，轨道次序发生了变
软件专利如何申请 cuiyadll 软件专利申请
软件技术可以申请软件著作权以保护软件源代码，也可以申请发明专利以保护软件流程中的步骤执行方式。专利保护的是软件解决问题的思想，而软件著作权保护的是软件代码（即软件思想的表达形式）。例如，离线传送文件，那发明专利保护是如何实现离线传送文件。基于相同的软件思想，但实现离线传送的程序代码有千千万万种，每种代码都可以享有各自的软件著作权。申请一个软件发明专利的代理费大概需要5000-8000申请发明专利可
Android学习笔记 darrenzhu android
1.启动一个AVD 2.命令行运行adb shell可连接到AVD,这也就是命令行客户端 3.如何启动一个程序 am start -n package name/.activityName am start -n com.example.helloworld/.MainActivity 启动Android设置工具的命令如下所示： # am start -
apache虚拟机配置，本地多域名访问本地网站 dcj3sjt126com apache
现在假定你有两个目录，一个存在于 /htdocs/a，另一个存在于 /htdocs/b 。现在你想要在本地测试的时候访问 www.freeman.com 对应的目录是 /xampp/htdocs/freeman ,访问 www.duchengjiu.com 对应的目录是 /htdocs/duchengjiu。 1、首先修改C盘WINDOWS\system32\drivers\etc目录下的
yii2 restful web服务[速率限制] dcj3sjt126com PHP yii2
速率限制为防止滥用，你应该考虑增加速率限制到您的API。例如，您可以限制每个用户的API的使用是在10分钟内最多100次的API调用。如果一个用户同一个时间段内太多的请求被接收，将返回响应状态代码 429 (这意味着过多的请求)。要启用速率限制, [[yii\web\User::identityClass|user identity class]] 应该实现 [[yii\filter
Hadoop2.5.2安装——单机模式 eksliang hadoop hadoop单机部署
转载请出自出处：http://eksliang.iteye.com/blog/2185414 一、概述 Hadoop有三种模式单机模式、伪分布模式和完全分布模式，这里先简单介绍单机模式，默认情况下，Hadoop被配置成一个非分布式模式，独立运行JAVA进程，适合开始做调试工作。二、下载地址 Hadoop 网址http:
LoadMoreListView+SwipeRefreshLayout（分页下拉）基本结构 gundumw100 android
一切为了快速迭代 import java.util.ArrayList; import org.json.JSONObject; import android.animation.ObjectAnimator; import android.os.Bundle; import android.support.v4.widget.SwipeRefreshLayo
三道简单的前端HTML/CSS题目 ini html Web 前端 css 题目
使用CSS为多个网页进行相同风格的布局和外观设置时，为了方便对这些网页进行修改，最好使用（）。http://hovertree.com/shortanswer/bjae/7bd72acca3206862.htm 在HTML中加入<table style=”color:red; font-size:10pt”>，此为（）。http://hovertree.com/s
overrided方法编译错误 kane_xie override
问题描述：在实现类中的某一或某几个Override方法发生编译错误如下： Name clash: The method put(String) of type XXXServiceImpl has the same erasure as put(String) of type XXXService but does not override it 当去掉@Over
Java中使用代理IP获取网址内容（防IP被封，做数据爬虫） mcj8089 免费代理IP 代理IP 数据爬虫 JAVA设置代理IP 爬虫封IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ Java语言有两种方式使用代理IP访问网址并获取内容，方式一，设置System系统属性 // 设置代理IP System.getProper
Nodejs Express 报错之 listen EADDRINUSE qiaolevip 每天进步一点点学习永无止境 nodejs 纵观千象
当你启动 nodejs服务报错： >node app Express server listening on port 80 events.js:85 throw er; // Unhandled 'error' event ^ Error: listen EADDRINUSE at exports._errnoException (
C++中三种new的用法 _荆棘鸟_ C++new
转载自：http://news.ccidnet.com/art/32855/20100713/2114025_1.html 作者: mt 其一是new operator，也叫new表达式；其二是operator new，也叫new操作符。这两个英文名称起的也太绝了，很容易搞混，那就记中文名称吧。new表达式比较常见，也最常用，例如： string* ps = new string("
Ruby深入研究笔记1 wudixiaotie Ruby
module是可以定义private方法的 module MTest def aaa puts "aaa" private_method end private def private_method puts "this is private_method" end end