Chasing__Dreams

python--基础知识点--multiprocessing

手册：multiprocessing — 基于进程的并行
Python multiprocessing模块中常用函数和类的统计

一. 进程通信

(对于进程间通信此处理解不清，可能有误)
进程间通信方式：

消息机制：Pipe、Queue
共享内存：Value、Array
共享文件：mmap模块
同步原语：Lock、RLock、Event、Semaphore、Condition。

消息机制 (Pipe、Queue)

效率高
帮我们处理好锁问题。

共享文件

1.效率低（共享数据基于文件，而文件是硬盘上的数据）
2.需要自己加锁处理

同步原语（进程锁，信号量，事件）
这些有锁的功能的东西（能够阻塞）是全局的，加锁可以保证多个进程修改同一块数据时，同一时间只能有一个任务可以进行修改，即串行的修改，没错，速度是慢了，但牺牲了速度却保证了数据安全。

多进程应该尽可能避免在进程间传递大量数据，越少越好。

二. Lock、RLock、Event、Semaphore、Condition、Pipe、Queue、JoinableQueue

multiprocess.Value()
multiprocess.Array()
multiprocessing.Pipe()
multiprocessing.Queue()
multiprocessing.JoinableQueue()
multiprocessing.Lock()
multiprocessing.RLock()
multiprocessing.Event()
multiprocessing.Semaphore()
multiprocessing.BoundedSemaphore()
multiprocessing.Condition()

multiprocessing的Lock、RLock、Event、Semaphore、BoundedSemaphore、Condition接口与threading接口相同。
threading中的Lock、RLock、Event、Semaphore、BoundedSemaphore、Condition详解

multiprocessing.Queue()的接口与用于多线程的queue.Queue()类似。queue.Queue()比 multiprocessing.Queue()多两个方法task_done和join。multiprocessing.JoinableQueue()接口与queue.Queue()接口相同。
queue模块详解

使用场景：Pipe、Queue只适用于多个进程都是源于同一个父进程的情况。如果多个进程不是源于同一个父进程，只能用共享内存，信号量等方式，但是这些方式对于复杂的数据结构，例如Queue，dict，list等，使用起来比较麻烦，不够灵活，这种情况使用Manager。

使用方法：

(multiprocessing的Value、Array、Lock、RLock、Event、Semaphore、BoundedSemaphore、Condition) + (multiprocessing.Process())
(multiprocessing的Value、Array、Lock、RLock、Event、Semaphore、BoundedSemaphore、Condition) +(concurrent.futures.ProcessPoolExecutor()）

1. Lock

1.1 Lock示例

import multiprocessing


def sub(a, lock):
    print(f"sub_start；{a.value}")
    # lock.acquire() # 对于该程序来说在此处获取锁效率更高，避免多次进程间通信
    for i in range(100000):
        lock.acquire()
        b = a.value
        b -= 1
        a.value = b
        lock.release()
    # lock.release()
    print(f"sub_end；{a.value}")


def add(a, lock):
    print(f"add_start；{a.value}")
    for i in range(100000):
        lock.acquire()
        b = a.value
        b += 1
        a.value = b
        lock.release()
    print(f"add_end；{a.value}")


if __name__ == '__main__':
    a = multiprocessing.Value("i", 0)  # a 属于共享内存中的变量
    lock = multiprocessing.Lock()  # lock也属于共享内存中的变量
    tasks = [multiprocessing.Process(target=add, args=(a, lock), name="add"), multiprocessing.Process(target=sub, args=(a, lock), name="sub")]
    [task.start() for task in tasks]
    [task.join() for task in tasks]
    print(a.value)


"""
运行结果：
add_start；0
sub_start；5011
add_end；3511
sub_end；0
0

Process finished with exit code 0
"""

`1.2 补充：multiprocessing.Value()`

1.2.1 Value的构造函数：

Value的初始化非常简单，直接类似Value(‘d’, 0.0)即可，具体构造方法为：

multiprocessing.Value(typecode_or_type, *args[, lock])。

该方法返回从共享内存中分配的一个ctypes 对象,其中typecode_or_type定义了返回的类型。它要么是一个ctypes类型，要么是一个代表ctypes类型的code。比如c_bool和’b’是同样的，因为’b’是c_bool的code。

ctypes是Python的一个外部函数库，它提供了和C语言兼任的数据类型，可以调用DLLs或者共享库的函数，能被用作在python中包裹这些库。

*args是传递给ctypes的构造参数

1.2.2 Value的使用

对于共享整数或者单个字符，初始化比较简单，参照下图映射关系即可。

注意，如果我们使用的code在上表不存在，则会抛出：

size = ctypes.sizeof(type_)
TypeError: this type has no size

如果共享的是字符串，则在上表是找不到映射关系的，就是没有code可用。所以我们需要使用原始的ctype类型

ctype类型可从下表查阅

1.2.3 示例

from multiprocessing import Value
from ctypes import *


a = Value("i", 2)
print(a.value)
print(a)
a = Value(c_int, 2)
print(a.value)
print(a)
a = Value("f", 3.14)
print(a.value)
print(a)
a = Value(c_float, 3.14)
print(a.value)
print(a)
a = Value('c', b'a')
print(a.value.decode("ascii"))
print(a)
a = Value(c_char, b'a')
print(a.value.decode("ascii"))
print(a)
a = Value(c_char_p, bytes("中国", "utf-8"))
print(a.value.decode("utf-8"))
print(a)


"""
运行结果：
2

2

3.140000104904175

3.140000104904175

a

a

中国


Process finished with exit code 0
"""

参考博客

2. RLock

import multiprocessing


def fibonacci(num, total, lock):
    if num == 2 or num == 1:
        return 1
    else:
        lock.acquire()
        print("lock已为total上锁")
        total.value = fibonacci(num - 1, total, lock) + fibonacci(num - 2, total, lock)
        lock.release()
        print("lock已为total释放锁")
        return total.value


if __name__ == '__main__':
    total = multiprocessing.Value("i", 0)
    lock = multiprocessing.RLock()
    task = multiprocessing.Process(target=fibonacci, args=(6, total, lock))
    task.start()
    task.join()
    print(total.value)


"""
运行结果：
lock已为total上锁
lock已为total上锁
lock已为total上锁
lock已为total上锁
lock已为total释放锁
lock已为total释放锁
lock已为total上锁
lock已为total释放锁
lock已为total释放锁
lock已为total上锁
lock已为total上锁
lock已为total释放锁
lock已为total释放锁
lock已为total释放锁
8

Process finished with exit code 0
"""

3. Event

import multiprocessing
import time


def test0(event):
    event.clear()
    print(f"{multiprocessing.current_process().name}_start========")
    time.sleep(1)
    print(f"{multiprocessing.current_process().name}_end========")
    event.set()


def test1(event):
    event.wait()
    print(f"{multiprocessing.current_process().name}_end========")


if __name__ == '__main__':
    event = multiprocessing.Event()
    task0 = multiprocessing.Process(target=test0, args=(event,), name="Pro_test0")
    task1 = multiprocessing.Process(target=test1, args=(event,), name="Pro_test0")

    task0.start()
    task1.start()

    task0.join()
    task1.join()


"""
运行结果：
Pro_test0_start========
Pro_test0_end========
Pro_test0_end========

Process finished with exit code 0
"""

4. Semaphore

import multiprocessing
import time
import random


def db_connect(num, semaphore):
    print(f"thread =={num}== is preparing to connect to db.")
    semaphore.acquire()
    time.sleep(int(random.random()*10)/10)  # 模拟连接db的过程
    print(f"connection =={num}== already complete.")
    semaphore.release()


if __name__ == '__main__':
    semaphore = multiprocessing.Semaphore(value=2)
    tasks = [multiprocessing.Process(target=db_connect, args=(num, semaphore)) for num in range(7)]
    [task.start() for task in tasks]
    [task.join() for task in tasks]
    semaphore.release()  # Semaphore对象释放多次不会抛出异常


"""
运行结果：
thread ==0== is preparing to connect to db.
thread ==1== is preparing to connect to db.
connection ==0== already complete.
thread ==2== is preparing to connect to db.
connection ==1== already complete.
connection ==2== already complete.
thread ==4== is preparing to connect to db.
thread ==3== is preparing to connect to db.
connection ==3== already complete.
thread ==5== is preparing to connect to db.
thread ==6== is preparing to connect to db.
connection ==4== already complete.
connection ==6== already complete.
connection ==5== already complete.

Process finished with exit code 0
"""

5. Condition

import multiprocessing
import time


def task_1(condition_obj):
    proc_name = multiprocessing.current_process().name
    print('开始 %s' % proc_name)
    with condition_obj:
        print('%s运行结束，开始运行task_2' % proc_name)
        condition_obj.notify_all()


def task_2(condition_obj):
    proc_name = multiprocessing.current_process().name
    print('开始 %s' % proc_name)
    with condition_obj:
        condition_obj.wait()
        print('task_2 %s 运行结束' % proc_name)


if __name__ == '__main__':
    condition_obj = multiprocessing.Condition()

    s1 = multiprocessing.Process(name='s1', target=task_1, args=(condition_obj,))

    s2_clients = [multiprocessing.Process(name='task_2[{}]'.format(i), target=task_2, args=(condition_obj,),) for i in range(1, 3)]

    for c in s2_clients:
        c.start()
        time.sleep(1)
    s1.start()

    s1.join()
    for c in s2_clients:
        c.join()


"""
运行结果：
开始 task_2[1]
开始 task_2[2]
开始 s1
s1运行结束，开始运行task_2
task_2 task_2[2] 运行结束
task_2 task_2[1] 运行结束

Process finished with exit code 0
"""

6. 消息机制Pipe

Pipe()函数返回两个对象 conn1 和 conn2 ，这两个对象表示管道的两端。

Pipe()函数有一个可选参数 duplex，参数 duplex 的默认值为 True，表示该管道是双向的，即两个对象都可以发送和接收消息。如果把参数 duplex 设置为 False ，表示该管道是单向的，即 conn1 只能用于接收消息，conn2 只能用于发送消息。

# 双向管道
import multiprocessing


def test0(conn):
    conn.send("test1,我是test0")
    print(conn.recv())


def test1(conn):
    print(conn.recv())
    conn.send("test0,你好")


if __name__ == '__main__':
    conn0, conn1 = multiprocessing.Pipe(duplex=True)
    task0 = multiprocessing.Process(target=test0, args=(conn0,))
    task1 = multiprocessing.Process(target=test1, args=(conn1,))

    task0.start()
    task1.start()

    task0.join()
    task1.join()


"""
运行结果：
test1,我是test0
test0,你好

Process finished with exit code 0
"""

# 单向管道
import multiprocessing


def test0(conn):
    # conn.send("test1,我是test0")
    print(conn.recv())


def test1(conn):
    # print(conn.recv())
    conn.send("test0,你好")


if __name__ == '__main__':
    conn0, conn1 = multiprocessing.Pipe(duplex=False)  # conn0接收消息，conn1发送消息
    task0 = multiprocessing.Process(target=test0, args=(conn0,))
    task1 = multiprocessing.Process(target=test1, args=(conn1,))

    task0.start()
    task1.start()

    task0.join()
    task1.join()


"""
运行结果：
test0,你好

Process finished with exit code 0

"""

7. 消息机制Queue

原型：Queue([maxsize])

参数介绍

maxsize是队列中允许最大项数，省略则无大小限制。

当一个队列为空的时候如果再用get取则会堵塞，所以取队列的时候一般是用到get_nowait()方法，这种方法在向一个空队列取值的时候会抛一个Empty异常，所以更常用的方法是先判断一个队列是否为空，如果不为空则取值。

队列Queue的实例对象queue中常用的方法

queue.qsize()返回队列的大小
queue.empty()如果队列为空，返回True,反之False
queue.full()如果队列满了，返回True,反之False
queue.get([block[, timeout]]) 获取队列，timeout等待时间
queue.get_nowait()相当Queue.get(False) ，非阻塞 Queue.put(item) 写入队列，timeout等待时间
queue.put_nowait(item) 相当Queue.put(item, False)

import multiprocessing
import time


def test0(queue, num):
    for i in range(num*3):
        queue.put(f"{num}: {i}")


def test1(queue):
    flag = 0
    while True:
        if not queue.empty():
            print(queue.get())
            flag = 0
        else:
            time.sleep(0.1)
            flag += 1
            if flag == 2:
                break


if __name__ == '__main__':
    queue = multiprocessing.Queue()
    task0 = [multiprocessing.Process(target=test0, args=(queue, num)) for num in range(1, 3)]
    task1 = multiprocessing.Process(target=test1, args=(queue,))

    [task.start() for task in task0]
    task1.start()

    [task.join() for task in task0]
    task1.join()


"""
运行结果：
1: 0
1: 1
1: 2
1: 3
1: 4
2: 0
2: 1
2: 2
2: 3
2: 4
2: 5
2: 6
2: 7
2: 8
2: 9

Process finished with exit code 0
"""

8. 消息机制JoinableQueue

原型：JoinableQueue([maxsize])

这就像是一个Queue对象，但队列允许项目的使用者通知生成者项目已经被成功处理。通知进程是使用共享的信号和条件变量来实现的。

参数介绍

maxsize是队列中允许最大项数，省略则无大小限制。

JoinableQueue的实例queue队列中常用的方法:

queue.qsize() 返回队列的大小
queue.empty() 如果队列为空，返回True,反之False
queue.full() 如果队列满了，返回True,反之False
queue.get([block[, timeout]]) 获取队列，timeout等待时间
queue.get_nowait() 相当Queue.get(False) ，非阻塞 Queue.put(item) 写入队列，timeout等待时间
queue.put_nowait(item) 相当Queue.put(item, False)
JoinableQueue的实例queue除了与Queue对象相同的方法之外还具有：
- queue.task_done()：使用者使用此方法发出信号，表示queue.get()的返回项目已经被处理。如果调用此方法的次数大于从队列中删除项目的数量，将引发ValueError异常
- queue.join():生产者调用此方法进行阻塞，直到队列中所有的项目均被处理。阻塞将持续到队列中的每个项目均调用queue.task_done（）方法为止

import multiprocessing
import time


def test0(queue, num):
    for i in range(num*3):
        queue.put(f"{num}: {i}")


def test1(queue):
    flag = 0
    while True:
        if not queue.empty():
            print(queue.get())
            queue.task_done()
            flag = 0
        else:
            time.sleep(0.1)
            flag += 1
            if flag == 2:
                break


if __name__ == '__main__':
    queue = multiprocessing.JoinableQueue(maxsize=1)
    task0 = [multiprocessing.Process(target=test0, args=(queue, num)) for num in range(1, 3)]
    task1 = multiprocessing.Process(target=test1, args=(queue,))

    [task.start() for task in task0]
    task1.start()

    # [task.join() for task in task0]
    # task1.join()
    queue.join()


"""
运行结果：
1: 0
1: 1
2: 0
1: 2
2: 1
2: 2
2: 3
2: 4
2: 5

Process finished with exit code 0
"""

三. Pool、Manager

1. 进程池Pool

Pool类可以提供指定数量的进程供用户调用，当有新的请求提交到Pool中时，如果池还没有满，就会创建一个新的进程来执行请求。如果池满，请求就会告知先等待，直到池中有进程结束，才会创建新的进程来执行这些请求

下面介绍一下multiprocessing 模块下的Pool类下的几个方法：

apply(func[, args=()[, kwds={}]])

该函数用于传递不定参数，主进程会被阻塞直到函数执行结束

apply_async(func[, args=()[, kwds={}[, callback=None]]])

与apply用法一致，但它是非阻塞的且支持结果返回后进行回调

map(func, iterable[, chunksize=None])

Pool类中的map方法，与内置的map函数用法行为基本一致，它会使进程阻塞直到结果返回
注意：虽然第二个参数是一个迭代器，但在实际使用中，必须在整个队列都就绪后，程序才会运行子进程

map_async(func, iterable[, chunksize[, callback]])

与map用法一致，但是它是非阻塞的

close()

关闭进程池（pool），使其不再接受新的任务

terminal()

结束工作进程，不再处理未处理的任务

join()

主进程阻塞等待子进程的退出， join方法要在close或terminate之后使用

2. 服务器进程管理器对象moprocessing.Manager()

2.1 概念

Manager() 返回的管理器对象控制一个服务器进程，该进程保存Python对象并允许其他进程使用代理操作它们。
服务器进程管理器比使用共享内存对象更灵活，因为它支持Python支持的所有数据类型。
单个管理器可以通过网络由不同计算机上的进程共享。但是，它们比使用共享内存慢。
源于不同父进程的子进程之间可以通过Manager()对象通信。

原理：先启动一个ManagerServer进程，这个进程是阻塞的，它监听一个socket，然后其他进程（ManagerClient）通过socket来连接到ManagerServer，实现通信。

2.2 Manager() 返回的管理器支持类型

Manager().dict()
Manager().Array()
Manager().Namespace()
Manager().Value()
Manager().list()
Manager().Queue()
Manager().Lock()
Manager().RLock()
Manager().Event()
Manager().Semaphore()
Manager().BoundedSemaphore()
Manager().Condition()

Manager()的Lock、RLock、Event、Semaphore、BoundedSemaphore、Condition接口与threading接口相同。
threading中的Lock、RLock、Event、Semaphore、BoundedSemaphore、Condition详解

Manager()的Queue、Value、Array的接口与multiprocess的Queue、Value、Array相同。

因此此处只谈接口list、dict、Namespace接口。

使用场景：

源于不同父进程的子进程之间可以通过Manager()对象通信。
不同主机间的进程通信。
同一父进程创建的子进程间通信，不建议使用，效率较低。

使用方法：

Manager() + Pool()
Manager() + multiprocessing.Process()，Manager() + concurrent.futures.ProcessPoolExecutor()，不建议使用，因Manager()底层走的是socket，效率较低。

2.3 示例

2.3.1 list、dict

# list
import multiprocessing


def add(temp_list, lock):
    print(f"++++add_{multiprocessing.current_process().ident}_start:{temp_list[0]}++++")
    for i in range(10000):
        lock.acquire()
        temp_list[0] += 1
        lock.release()
    print(f"++++add_{multiprocessing.current_process().ident}_end:{temp_list[0]}++++")


def sub(temp_list, lock):
    print(f"++++sub_{multiprocessing.current_process().ident}_start:{temp_list[0]}++++")
    for i in range(10000):
        lock.acquire()
        temp_list[0] -= 1
        lock.release()
    print(f"++++sub_{multiprocessing.current_process().ident}_end:{temp_list[0]}++++")


if __name__ == '__main__':
    manager = multiprocessing.Manager()
    temp_list = manager.list([0])
    lock = manager.Lock()

    pool = multiprocessing.Pool(2)
    for num in range(2):
        pool.apply_async(add, args=(temp_list, lock))

    for num in range(2):
        pool.apply_async(sub, args=(temp_list, lock))

    pool.close()
    pool.join()
    print(temp_list)


"""
运行结果：
++++add_14680_start:0++++
++++add_9740_start:20++++
++++add_14680_end:19983++++
++++sub_14680_start:19991++++
++++add_9740_end:19992++++
++++sub_9740_start:19982++++
++++sub_14680_end:15++++
++++sub_9740_end:0++++
[0]

Process finished with exit code 0
"""

# dict
import multiprocessing


def add(temp_dict, lock):
    print(f"++++add_{multiprocessing.current_process().ident}_start:{temp_dict['test']}++++")
    for i in range(10000):
        lock.acquire()
        temp_dict['test'] += 1
        lock.release()
    print(f"++++add_{multiprocessing.current_process().ident}_end:{temp_dict['test']}++++")


def sub(temp_dict, lock):
    print(f"++++sub_{multiprocessing.current_process().ident}_start:{temp_dict['test']}++++")
    for i in range(10000):
        lock.acquire()
        temp_dict['test'] -= 1
        lock.release()
    print(f"++++sub_{multiprocessing.current_process().ident}_end:{temp_dict['test']}++++")


if __name__ == '__main__':
    manager = multiprocessing.Manager()
    temp_dict = manager.dict({'test': 0})
    lock = manager.Lock()

    pool = multiprocessing.Pool(2)
    for num in range(2):
        pool.apply_async(add, args=(temp_dict, lock))

    for num in range(2):
        pool.apply_async(sub, args=(temp_dict, lock))

    pool.close()
    pool.join()
    print(temp_dict['test'])


"""
运行结果:
++++add_11360_start:0++++
++++add_476_start:17++++
++++add_476_end:19990++++
++++sub_476_start:19998++++
++++add_11360_end:19999++++
++++sub_11360_start:19991++++
++++sub_476_end:13++++
++++sub_11360_end:0++++
0

Process finished with exit code 0
"""

补充list、dict
Manager处理list、dict等可变数据类型时，需要注意一个陷阱，即Manager对象无法监测到它引用的可变对象值的修改，需要通过触发__setitem__方法来让它获得通知。

而触发__setitem__方法比较直接的办法就是增加一个中间变量，如同在C语言中交换两个变量的值一样：
int a=1;int b=2;int tmp=a;a=b;b=tmp;

示例：

# Manager对象无法监测到它引用的可变对象值的修改
import multiprocessing


def test(idx, test_dict, lock):
    lock.acquire()
    test_dict['test'][idx] = idx
    lock.release()


if __name__ == '__main__':
    manager = multiprocessing.Manager()
    temp_dict = manager.dict()
    lock = manager.Lock()
    temp_dict['test'] = {}

    pool = multiprocessing.Pool(4)
    for i in range(10):
        pool.apply_async(test, args=(i, temp_dict, lock))

    pool.close()
    pool.join()
    print(temp_dict)


"""
运行结果：
{'test': {}}

Process finished with exit code 0
"""

# 通过触发__setitem__方法来让Manager对象获得通知
import multiprocessing


def test(idx, test_dict, lock):
    lock.acquire()
    row = test_dict['test']
    row[idx] = idx
    test_dict['test'] =row
    lock.release()


if __name__ == '__main__':
    manager = multiprocessing.Manager()
    temp_dict = manager.dict()
    lock = manager.Lock()
    temp_dict['test'] = {}

    pool = multiprocessing.Pool(4)
    for i in range(10):
        pool.apply_async(test, args=(i, temp_dict, lock))

    pool.close()
    pool.join()
    print(temp_dict)


"""
运行结果：
{'test': {0: 0, 1: 1, 2: 2, 3: 3, 4: 4, 6: 6, 7: 7, 5: 5, 8: 8, 9: 9}}

Process finished with exit code 0
"""

2.3.2 Namespace
Namespace对象没有公共的方法，但是有可写的属性。Namespace支持python中所有的基本数据类型，但与dict、list相同Manager对象无法监测到它引用的可变对象值的修改，需要通过触发__setitem__方法来让它获得通知。

当使用manager返回的namespace的proxy的时候，_属性值属于proxy，跟原来的namespace没有关系。

import multiprocessing


def f(ns):
    ns.x *= 10
    ns.y *= 10
    # ns.l[0] *= 10  # Manager对象无法监测到它引用的可变对象值的修改，需要通过触发__setitem__方法来让它获得通知。
    l = ns.l
    l[0] *= 10
    ns.l = l
    if 'testkey' in ns.d:
        v = ns.d['testkey'] * 10
        ns.d = {'testkey':  v}


if __name__ == '__main__':
    manager = multiprocessing.Manager()
    ns = manager.Namespace()
    ns.x = 1
    ns.y = 2
    ns._z = 5  # this is an attribute of the proxy
    ns.d = {'testkey': 3}
    ns.l = [4]
    print('before', ns)
    p = multiprocessing.Process(target=f, args=(ns,))
    p.start()
    p.join()
    print('after', ns)



"""
运行结果：
before Namespace(d={'testkey': 3}, l=[4], x=1, y=2)
after Namespace(d={'testkey': 30}, l=[40], x=10, y=20)

Process finished with exit code 0
"""

[参考博客]
Python进程池multiprocessing.Pool的用法
python 多进程共享全局变量之Manager()详解
python 关于multiprocessing中在Namespace的实例下保存dict/list的疑问

你可能感兴趣的:(python,#,基础知识点)

Python csv库 xiaoming0018 python python 开发语言
CSV文件又称为逗号分隔值文件，是一种通用的、相对简单的文件格式，用以存储表格数据，包括数字或者字符。CSV是电子表格和数据库中最常见的输入、输出文件格式，可参考《CSV介绍》。通过爬虫将数据抓取的下来，然后把数据保存在文件，或者数据库中，这个过程称为数据的持久化存储。本节介绍Python内置模块CSV的读写操作。CSV库Python中集成了专用于处理csv文件的库，名为：csv。csv库中有4个
Python 爬虫：一文掌握 SVG 映射反爬虫数据知道 2025年爬虫和逆向教程 python 爬虫 microsoft 爬虫逆向数据采集
更多内容请见：爬虫和逆向教程-专栏介绍和目录文章目录1.SVG概述1.1SVG的优点1.1映射反爬虫的原理2.SVG映射反爬虫的示例3.应对SVG映射反爬虫的方法3.1解析SVG图像3.2处理自定义字体3.3使用OCR技术3.4动态生成SVG的处理4.实战案例4.1使用SVG映射显示价格4.2解析SVG文件并提取其中的内容和属性4.3模拟交互行为4.4使用无头浏览器4.5某网站使用SVG实现动态验
Python处理CSV文件的12个高效技巧宇宙大豹发 python 开发语言
今天，我们的Python之旅，目标是那片由逗号分隔的宝藏——CSV文件。别看它简单，掌握这些技巧，你的数据处理能力将直线上升，轻松驾驭千行万列的数据海洋。让我们一起，用Python的魔力，让CSV舞动起来吧！1.初次见面，你好，CSV！安装pandas，是这场冒险的起点。它，是Python数据分析的瑞士军刀。pipinstallpandas导入我们的英雄——pandas，并亲切地叫它pd。impo
Python初学者第一天小熊h python初学者 python编译 python语言 python python基础 python初学者
目录一、问答题（1）什么是硬件？什么是软件？（2）比特是什么？字节是什么？（3）内存和存储设备最主要的区别是什么？（4）解释语言和编译语言之间的区别是什么？（5）操作系统的主要任务是什么？（6）可以使用两种模式运行Python。解释这两种模式。（7）找出下面代码中的错误（8）列举代码当中四种异常错误，说明错误原因（9）下面哪些标识符是有效的？哪些是Python关键字？（10）如何使用Python编
Python 潮流周刊#93：为什么“if not list”比len()快2倍？（摘要） python
本周刊由Python猫出品，精心筛选国内外的250+信息源，为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景：帮助所有读者精进Python技术，并增长职业和副业的收入。分享了12篇文章，12个开源项目以下是本期摘要：文章&教程①为什么Python中'ifnotlist'比len()快2倍？②掌握Python单体代码库③Python3.14尾调用解释器的性能④Py
Java：AI 浪潮中的隐形支柱 —— 探秘 Java 在人工智能领域的独特地位琢磨先生David 人工智能
引言在人工智能技术席卷全球的今天，当人们谈论AI开发时，Python、R语言、C++等工具总是最先被提及。然而在这个充满创新的领域，有一个"老兵"正悄然发挥着不可替代的作用——自1995年诞生至今的Java语言，凭借其独特的工程化基因，正在构建起AI世界的底层基础设施。本文将揭示Java如何在大数据、机器学习、企业级AI系统等领域持续创造价值。一、Java的AI基因解码跨平台优势的现代意义"一次编
python笔记1 lu_32 python
1.计算面积与周长：r=8s=r*rprint("面积是")print(s)z=r+r+r+rprint("周长是")print(z)#面积是#64#周长是#322.输入圆的半径，计算出圆的面积和周长：r=input("请输入半径：")r=float(r)s=3.14*r*rprint("圆的面积：",s)r=input("请输入圆的半径")r=int(r)s=3.14*r*rprint("圆的半
String类型为什么不可变 27xixi java高频 java
在大多数编程语言（如Java、Python、C#等）中，String类型被设计为不可变（Immutable），这意味着一旦一个字符串对象被创建，它的值就不能被修改。以下是这一设计的原因及具体表现：一、不可变性的表现直接修改字符串会创建新对象Stringstr="Hello";str=str+"World";//实际是创建了一个新字符串对象，而非修改原对象原字符串“Hello”未被修改，而是生成了新
Flet 项目常见问题解决方案龙香令Beatrice
Flet项目常见问题解决方案fletFletenablesdeveloperstoeasilybuildrealtimeweb,mobileanddesktopappsinPython.Nofrontendexperiencerequired.项目地址:https://gitcode.com/gh_mirrors/fl/flet1.项目基础介绍和主要编程语言Flet是一个开源框架，允许开发者在Py
Flet 框架教程樊贝路Strawberry
Flet框架教程fletFletenablesdeveloperstoeasilybuildrealtimeweb,mobileanddesktopappsinPython.Nofrontendexperiencerequired.项目地址:https://gitcode.com/gh_mirrors/fl/flet1.项目介绍Flet是一个框架，它允许开发者使用Python轻松构建实时的Web、
Python字符串 DDD小小小宇宙 python 开发语言
字符串1.程序中需要加上双引号或者双引号来表示字符串2.字符串可以存放任意数量的字符，无法修改的数据容器字符串运算：加法：多个字符串按照次序合并为一个字符串在实际使用的时候，数字和字符串的加法通常需要将数字的类型转换成str乘法：1个字符串乘以n，可以得到n个复制的字符串例子：输入一个字符，使用该字符打印一个3层的金字塔x=input(':')print(""+x)print(""+x+x+x)p
Python入门指南：从简介到安装小团团0 开发语言 python
Python简介Python是一种高级编程语言，由荷兰程序员GuidovanRossum于1989年圣诞节期间开始设计，并于1991年发布了第一个公开发行版。Python的命名源于英国喜剧团体MontyPython，Guido以此表达对该喜剧团体的喜爱。Python的特点主要体现在以下几个方面：解释型语言：Python是一种解释型语言，这意味着在开发过程中无需编译，可以直接运行源代码。交互式语言：
Python扑克牌小游戏 Small踢倒coffee_氕氘氚笔记经验分享
1.游戏规则概述玩家人数：3人牌数：一副扑克牌，共54张（包括大小王）发牌：每人17张牌，剩余3张作为底牌出牌规则：玩家依次出牌，必须出比上家更大的牌型，或者选择不出胜利条件：先出完手中牌的玩家获胜2.游戏框架设计2.1牌型定义classCard:def__init__(self,suit,rank):self.suit=suit#花色：♠,♥,♣,♦self.rank=rank#牌面：3,4,5
探索Pydoll：基于Python的无驱动浏览器自动化新星几道之旅人工智能智能体及数字员工 python 自动化人工智能
在当今Web自动化与数据抓取领域，基于Chromium的工具层出不穷，但大多数方案依赖WebDriver或额外的浏览器插件。Pydoll作为一款新兴的Python库，以无驱动架构和原生异步支持迅速成为开发者关注的焦点。本文将从技术原理、核心功能、应用场景及实战案例多角度解析这一工具。一、Pydoll项目概览Pydoll由开发者thalissonvs等团队维护，旨在通过Python实现对Chromi
python opencv轮廓检测_python opencv中的不规则形状检测和测量 weixin_39584529 python opencv轮廓检测
正如我在评论中提到的那样,对于这个问题,分水岭似乎是一个很好的方法.但是当你回答时,定义标记的前景和背景是困难的部分！我的想法是使用形态梯度沿着冰晶获得良好的边缘并从那里开始工作;形态梯度似乎很有效.importnumpyasnpimportcv2img=cv2.imread('image.png')blur=cv2.GaussianBlur(img,(7,7),2)h,w=img.shape[:
【DuodooTEKr】基于Python+OCR+DeepSeek的英国购物小票识别系统开发实战邹工拆解甲方需求风吟九宵 Odoo18开源 Duodoo开源人工智能物联网制造开源 python
作者：Odoo技术开发/资深信息化负责人日期：2025年3月11日本方案从甲方信息化负责人视角，分析梳理现状，并给出代码开发案例。一、行业现状与痛点分析1.英国零售业数字化现状根据英国零售协会（BRC）2023年度报告显示：英国年均纸质小票签发量达78亿张87%的企业仍采用人工录入方式处理小票数据零售业每年因小票管理产生的直接成本超12亿英镑2.传统小票管理痛点数据孤岛问题：门店POS系统、财务系
用Python打造AI玩家：挑战2048，谁与争锋穿梭的编织者人工智能 python
文章目录一、创作背景二、效果图三、准备工作1.安装Chrome和ChromeDriver2.安装Python库四、代码说明‌1.init_driver函数‌2.play_2048函数‌五、完整代码六、改进版本七、主要模块八、核心算法分析1.棋盘状态获取2.位置权重系统3.连续性评估4.单调性评估5.移动模拟系统九、评估系统1.评估标准2.决策机制十、性能优化1.延迟控制2.错误处理十一、完整代码编
Python爬虫相关内容猫猫头有亿点炸 python 爬虫开发语言
一、打开源代码的方式鉴于时间过很久后我们可能会忘记的源代码位置所以写下以下文章便于实时查看:一般有两种方法打开源代码:第一是f12第二右键查看网页源代码二、特殊情况第三种情况当你用爬虫爬取内容的时候可能用xpath还是匹配不到任何结果因为页面可能会自动刷新所以使用xpath的时候匹配不到任何内容查找源代码的示例图片三、解决办法这个时候你可以先->f12(笔记本电脑fn+f12)再->ctrl+sh
CESM1.2.1移植使用说明 ༊.枕星＇听光.ঌ 人工智能 linux
文章目录概述环境配置cesm1_2_1配置部分环境软件压缩包改变CLM陆面模式结果文件的输出变量、特征值及频率小结概述记录用户如何在Linux系统上移植CESM1.2.1模型，并且使用CLM4.5模式创建并单点模拟算例I_2000_CLM45。环境配置1.更新系统软件源2.更新系统安装软件安装git、make、python等。3.安装MPI(openmpi4.1.5)//下载并解压进入文件夹wge
vs2019 Qt C++中调用python代码路奇怪 Visual Studio qt c++
目录1.添加依赖库，.lib，include2.修改python.h文件3.环境搭建好了下面是测试代码部分4.如果按照面上走可能会出现的问题：5.Qt+vs+python6.说一下这里调py的主要步骤借鉴几位大佬（吐槽一下各种坑啊）混合编程之——C++调用python2.7&python3.5-CSDN博客c++调用python(复杂版)_c++调用python复杂库-CSDN博客环境配置：1.添
python 基于混合式推荐算法的学术论文投稿系统 mosquito_lover1 python 知识图谱
基于混合式推荐算法的学术论文投稿系统是一个结合多种推荐技术（如基于内容的推荐、协同过滤、知识图谱等）来为研究者推荐合适期刊或会议投稿的系统。以下是实现该系统的关键步骤和Python代码示例。系统设计思路1.数据收集与预处理：-收集论文数据（标题、摘要、关键词、作者信息等）。-收集期刊/会议数据（领域、主题、影响因子、投稿要求等）。-对文本数据进行预处理（分词、去停用词、向量化等）。2.推荐算法设计
python hack库_这里有123个黑客必备的Python工具！ weixin_39637571 python hack库
123个Python渗透测试工具，当然不仅于渗透~如果你想参与漏洞研究、逆向工程和渗透，我建议你时候用Python语言。Python已经有很多完善可用的库，我将在这里把他们列出来。这个清单里的工具大部分都是Python写成的，一部分是现有C库的Python绑定，这些库在Python中都可以简单使用。一些强力工具(pentestframeworks、bluetoothsmashers、webappl
如何用爬虫根据关键词获取商品列表：一份简单易懂的代码示例 API小爬虫爬虫
在当今数字化时代，网络爬虫已经成为数据收集和分析的强大工具。无论是市场调研、价格监控还是产品分析，爬虫都能帮助我们快速获取大量有价值的信息。今天，我们就来探讨如何通过编写一个简单的爬虫程序，根据关键词获取商品列表。以下是一个基于Python语言的代码示例，适合初学者学习和实践。一、准备工作在开始编写爬虫之前，我们需要准备以下工具和库：Python环境：确保你的电脑上安装了Python。推荐使用Py
【Python】构建Web应用的首选：Flask框架基础与实战萧鼎 python基础到进阶教程 python 前端 flask
构建Web应用的首选：Flask框架基础与实战在Python的Web开发生态中，Flask框架以其轻量、灵活和易用的特性成为构建Web应用的首选之一。无论是快速搭建一个小型应用原型，还是构建复杂的后端服务，Flask都提供了便捷的接口和丰富的扩展支持。本博客将介绍Flask的基础知识和核心概念，并通过一个简单的实例展示如何用Flask构建Web应用。一、Flask框架简介Flask是由ArminR
CIR-DFENet：结合跨模态图像表示和双流特征增强网络进行活动识别是Dream呀神经网络计算机视觉人工智能神经网络深度学习
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学业升学和求职工作的先行者！【优惠信息】•新专栏订阅前200名享9.9元优惠•订阅量破200
fastapi和php,Sanic vs Fastapi 性能对比扫盲君 fastapi和php
Sanic，Fastapi都是优秀的pythonweb异步框架，找了半天没找到靠谱的性能对比测试，只能自己做一个。测试内容：纯get请求、异步ORM读测试工具：WRK测试代码：由于两者代码非常相似，本文就直接放上fastapi的代码demo了。1、纯get请求压测：1.1：代码代码demo1.2:结果1.2.1SanicRunning30stest@http://0.0.0.0:7006/4thr
基于异构特征融合与轻量级集成学习的软件漏洞挖掘方案设计与Python实现 rockmelodies 信息安全网络安全机器学习集成学习 python 机器学习人工智能
标题：基于异构特征融合与轻量级集成学习的软件漏洞挖掘方案设计与Python实现一、方案设计原理异构特征工程静态特征：基于AST的代码属性图（CPG）解析（使用Joern+NetworkX）动态特征：内存访问模式分析（通过QEMU模拟执行）上下文特征：CWE漏洞模式匹配（集成Semgrep规则引擎）轻量级模型架构
用Python打造智能家居安防系统，让科技守护你的家 Echo_Wish Python 笔记 Python 算法 python 智能家居科技
友友们好！我是Echo_Wish，我的的新专栏《Python进阶》以及《Python！实战！》正式启动啦！这是专为那些渴望提升Python技能的朋友们量身打造的专栏，无论你是已经有一定基础的开发者，还是希望深入挖掘Python潜力的爱好者，这里都将是你不可错过的宝藏。在这个专栏中，你将会找到：●深入解析：每一篇文章都将深入剖析Python的高级概念和应用，包括但不限于数据分析、机器学习、Web开发
Python 爬虫实战：游戏论坛评论数据抓取与游戏热度分析西攻城狮北 python 开发语言爬虫
一、引言随着电子游戏产业的飞速发展，游戏论坛成为了玩家交流心得、分享体验的重要平台。通过分析游戏论坛的评论数据，我们可以了解不同游戏的热度、玩家的评价以及游戏的受欢迎程度。本文将详细介绍如何使用Python爬虫技术抓取游戏论坛的评论数据，并进行游戏热度分析。二、项目背景与目标2.1项目背景游戏论坛如Steam社区、贴吧、NGA等，拥有大量的用户和丰富的评论数据。这些数据反映了玩家对不同游戏的评价和
《Operating System Concepts》阅读笔记：p309-p330 操作系统
《OperatingSystemConcepts》学习第29天，p309-p330总结，总计22页。一、技术总结1.Python中的并发编程(1)semaphoreclassthreading.Semaphore(value=1)。(2)conditionvariableclassthreading.Condition(lock=None)书上使用的是Java,因本人在开发工作中使用的是Pytho
解读Servlet原理篇二---GenericServlet与HttpServlet 周凡杨 java HttpServlet 源理 GenericService 源码
在上一篇《解读Servlet原理篇一》中提到，要实现javax.servlet.Servlet接口（即写自己的Servlet应用），你可以写一个继承自javax.servlet.GenericServletr的generic Servlet ，也可以写一个继承自java.servlet.http.HttpServlet的HTTP Servlet（这就是为什么我们自定义的Servlet通常是exte
MySQL性能优化 bijian1013 数据库 mysql
性能优化是通过某些有效的方法来提高MySQL的运行速度，减少占用的磁盘空间。性能优化包含很多方面，例如优化查询速度，优化更新速度和优化MySQL服务器等。本文介绍方法的主要有： a.优化查询 b.优化数据库结构
ThreadPool定时重试 dai_lm java ThreadPool thread timer timertask
项目需要当某事件触发时，执行http请求任务，失败时需要有重试机制，并根据失败次数的增加，重试间隔也相应增加，任务可能并发。由于是耗时任务，首先考虑的就是用线程来实现，并且为了节约资源，因而选择线程池。为了解决不定间隔的重试，选择Timer和TimerTask来完成 package threadpool; public class ThreadPoolTest {
Oracle 查看数据库的连接情况周凡杨 sql oracle 连接
首先要说的是，不同版本数据库提供的系统表会有不同，你可以根据数据字典查看该版本数据库所提供的表。 select * from dict where table_name like '%SESSION%'; 就可以查出一些表，然后根据这些表就可以获得会话信息 select sid,serial#,status,username,schemaname,osuser,terminal,ma
类的继承朱辉辉33 java
类的继承可以提高代码的重用行，减少冗余代码；还能提高代码的扩展性。Java继承的关键字是extends 格式:public class 类名（子类）extends 类名（父类）{ } 子类可以继承到父类所有的属性和普通方法，但不能继承构造方法。且子类可以直接使用父类的public和 protected属性，但要使用private属性仍需通过调用。子类的方法可以重写，但必须和父类的返回值类
android 悬浮窗特效肆无忌惮_ android
最近在开发项目的时候需要做一个悬浮层的动画，类似于支付宝掉钱动画。但是区别在于，需求是浮出一个窗口，之后边缩放边位移至屏幕右下角标签处。效果图如下：一开始考虑用自定义View来做。后来发现开线程让其移动很卡，ListView+动画也没法精确定位到目标点。后来想利用Dialog的dismiss动画来完成。自定义一个Dialog后，在styl
hadoop伪分布式搭建林鹤霄 hadoop
要修改4个文件 1: vim hadoop-env.sh 第九行 2: vim core-site.xml <configuration> &n
gdb调试命令 aigo gdb
原文：http://blog.csdn.net/hanchaoman/article/details/5517362 一、GDB常用命令简介 r run 运行.程序还没有运行前使用 c cuntinue
Socket编程的HelloWorld实例 alleni123 socket
public class Client { public static void main(String[] args) { Client c=new Client(); c.receiveMessage(); } public void receiveMessage(){ Socket s=null; BufferedRea
线程同步和异步百合不是茶线程同步异步
多线程和同步 : 如进程、线程同步，可理解为进程或线程A和B一块配合，A执行到一定程度时要依靠B的某个结果，于是停下来，示意B运行；B依言执行，再将结果给A；A再继续操作。所谓同步，就是在发出一个功能调用时，在没有得到结果之前，该调用就不返回，同时其它线程也不能调用这个方法多线程和异步:多线程可以做不同的事情,涉及到线程通知 &
JSP中文乱码分析 bijian1013 java jsp 中文乱码
在JSP的开发过程中，经常出现中文乱码的问题。首先了解一下Java中文问题的由来： Java的内核和class文件是基于unicode的，这使Java程序具有良好的跨平台性，但也带来了一些中文乱码问题的麻烦。原因主要有两方面，
js实现页面跳转重定向的几种方式 bijian1013 JavaScript 重定向
js实现页面跳转重定向有如下几种方式：一.window.location.href <script language="javascript"type="text/javascript"> window.location.href="http://www.baidu.c
【Struts2三】Struts2 Action转发类型 bit1129 struts2
在【Struts2一】 Struts Hello World http://bit1129.iteye.com/blog/2109365中配置了一个简单的Action，配置如下 <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configurat
【HBase十一】Java API操作HBase bit1129 hbase
Admin类的主要方法注释： 1. 创建表 /** * Creates a new table. Synchronous operation. * * @param desc table descriptor for table * @throws IllegalArgumentException if the table name is res
nginx gzip ronin47 nginx gzip
Nginx GZip 压缩 Nginx GZip 模块文档详见：http://wiki.nginx.org/HttpGzipModule 常用配置片段如下： gzip on; gzip_comp_level 2; # 压缩比例，比例越大，压缩时间越长。默认是1 gzip_types text/css text/javascript; # 哪些文件可以被压缩 gzip_disable &q
java-7.微软亚院之编程判断俩个链表是否相交给出俩个单向链表的头指针，比如 h1 ， h2 ，判断这俩个链表是否相交 bylijinnan java
public class LinkListTest { /** * we deal with two main missions: * * A. * 1.we create two joined-List(both have no loop) * 2.whether list1 and list2 join * 3.print the join
Spring源码学习-JdbcTemplate batchUpdate批量操作 bylijinnan java spring
Spring JdbcTemplate的batch操作最后还是利用了JDBC提供的方法，Spring只是做了一下改造和封装 JDBC的batch操作： String sql = "INSERT INTO CUSTOMER " + "(CUST_ID, NAME, AGE) VALUES (?, ?, ?)";
[JWFD开源工作流]大规模拓扑矩阵存储结构最新进展 comsci 工作流
生成和创建类已经完成,构造一个100万个元素的矩阵模型,存储空间只有11M大,请大家参考我在博客园上面的文档"构造下一代工作流存储结构的尝试",更加相信的设计和代码将陆续推出......... 竞争对手的能力也很强.......,我相信..你们一定能够先于我们推出大规模拓扑扫描和分析系统的....
base64编码和url编码 cuityang base64 url
import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.io.PrintWriter; import java.io.StringWriter; import java.io.UnsupportedEncodingException;
web应用集群Session保持 dalan_123 session
关于使用 memcached 或redis 存储 session ，以及使用 terracotta 服务器共享。建议使用 redis，不仅仅因为它可以将缓存的内容持久化，还因为它支持的单个对象比较大，而且数据类型丰富，不只是缓存 session，还可以做其他用途，一举几得啊。1、使用 filter 方法存储这种方法比较推荐，因为它的服务器使用范围比较多，不仅限于tomcat ，而且实现的原理比较简
Yii 框架里数据库操作详解-[增加、查询、更新、删除的方法 'AR模式'] dcj3sjt126com 数据库
public function getMinLimit () { $sql = "..."; $result = yii::app()->db->createCo
solr StatsComponent（聚合统计） eksliang solr聚合查询 solr stats
StatsComponent 转载请出自出处：http://eksliang.iteye.com/blog/2169134 http://eksliang.iteye.com/ 一、概述 Solr可以利用StatsComponent 实现数据库的聚合统计查询，也就是min、max、avg、count、sum的功能二、参数
百度一道面试题 greemranqq 位运算百度面试寻找奇数算法 bitmap 算法
那天看朋友提了一个百度面试的题目：怎么找出{1,1,2,3,3,4,4,4,5,5,5,5} 找出出现次数为奇数的数字. 我这里复制的是原话，当然顺序是不一定的，很多拿到题目第一反应就是用map,当然可以解决，但是效率不高。还有人觉得应该用算法xxx,我是没想到用啥算法好...！还有觉得应该先排序... 还有觉
Spring之在开发中使用SpringJDBC ihuning spring
在实际开发中使用SpringJDBC有两种方式： 1. 在Dao中添加属性JdbcTemplate并用Spring注入； JdbcTemplate类被设计成为线程安全的，所以可以在IOC 容器中声明它的单个实例，并将这个实例注入到所有的 DAO 实例中。JdbcTemplate也利用了Java 1.5 的特定(自动装箱，泛型，可变长度
JSON API 1.0 核心开发者自述 | 你所不知道的那些技术细节 justjavac json
2013年5月，Yehuda Katz 完成了JSON API(英文，中文) 技术规范的初稿。事情就发生在 RailsConf 之后，在那次会议上他和 Steve Klabnik 就 JSON 雏形的技术细节相聊甚欢。在沟通单一 Rails 服务器库—— ActiveModel::Serializers 和单一 JavaScript 客户端库——&
网站项目建设流程概述 macroli 工作
一.概念网站项目管理就是根据特定的规范、在预算范围内、按时完成的网站开发任务。二.需求分析项目立项　　我们接到客户的业务咨询，经过双方不断的接洽和了解，并通过基本的可行性讨论够，初步达成制作协议，这时就需要将项目立项。较好的做法是成立一个专门的项目小组，小组成员包括：项目经理，网页设计，程序员，测试员，编辑/文档等必须人员。项目实行项目经理制。客户的需求说明书　　第一步是需
AngularJs 三目运算表达式判断 qiaolevip 每天进步一点点学习永无止境众观千象 AngularJS
事件回顾：由于需要修改同一个模板，里面包含2个不同的内容，第一个里面使用的时间差和第二个里面名称不一样，其他过滤器，内容都大同小异。希望杜绝If这样比较傻的来判断if-show or not，继续追究其源码。 var b = "{{", a = "}}"; this.startSymbol = function(a) {
Spark算子：统计RDD分区中的元素及数量 superlxw1234 spark spark算子 Spark RDD分区元素
关键字：Spark算子、Spark RDD分区、Spark RDD分区元素数量 Spark RDD是被分区的，在生成RDD时候，一般可以指定分区的数量，如果不指定分区数量，当RDD从集合创建时候，则默认为该程序所分配到的资源的CPU核数，如果是从HDFS文件创建，默认为文件的Block数。可以利用RDD的mapPartitionsWithInd
Spring 3.2.x将于2016年12月31日停止支持 wiselyman Spring 3
Spring 团队公布在2016年12月31日停止对Spring Framework 3.2.x（包含tomcat 6.x）的支持。在此之前spring团队将持续发布3.2.x的维护版本。请大家及时准备及时升级到Spring
fis纯前端解决方案fis-pure zccst JavaScript
作者：zccst FIS通过插件扩展可以完美的支持模块化的前端开发方案，我们通过FIS的二次封装能力，封装了一个功能完备的纯前端模块化方案pure。 1，fis-pure的安装 $ fis install -g fis-pure $ pure -v 0.1.4 2，下载demo到本地 git clone https://github.com/hefangshi/f