解决php内存占用高-用生成器yield优化性能

在Python中对生成器这个内存性能优化的写法不陌生,但是但多PHPer或许都不知道生成器这个功能,可能是因为生成器是PHP 5.5版本引入的功能,也可以是生成器作用不是很明显。但是,生成器功能的确非常有用。 最近在写csv导入导出,需要处理大量的数据,想到了PHP的生成器,写个总结吧

优点
生成器有哪些优点,如下:
生成器会对PHP应用的性能有非常大的影响
PHP代码运行时节省大量的内存
比较适合计算大量的数据
概念引入
首先,放下生成器概念的包袱,来看一个简单的PHP函数:

function rangeNum($num){
    $data = [];
    for($i=0;$i<$num;$i++){
        $data[] = time();
    }
    return $data;
}

这是一个非常简单的PHP函数,我们在处理一些数组逻辑的时候经常会使用。这里的代码也非常简单。

下面我们再写一个函数去取出$data中的数据

$aData = rangeNum(5);
foreach($aData as $value){
    sleep(1);
    echo $value.'
'
; }

要循环的数组范围很小时,会非常完美,没有任何问题。

But:
我们在调用函数时传递100w或者更多的时候,那么调用函数的时候for循环100w次$data里面的100w条数据都是存储在内存当中的,在调用函数时候会占用大量内存。

创建生成器,我们直接修改函数

function rangeNum($num){
    for($i=0;$i<$num;$i++){
        yield time();
    }
}

//使用生成器
$data = rangeNum(10);
foreach($data as $value){
    sleep(1);
    echo $value.'
'
; }

到这里,你应该对生成器有点儿头绪。

概念理解
首先明确一个概念:生成器yield关键字不是返回值,他的专业术语叫产出值,只是生成一个值

实际开发应用
读取超大文件
PHP开发很多时候都要读取大文件,比如csv文件、excel文件,或者一些log文件。这些文件如果很大很大,比如20个G。这时,直接一次性把所有的内容读取到内存中进行处理不太现实。

百万级别的访问量
yield生成器是php5.5之后出现的,yield提供了一种更简单的方法来实现简单的迭代对象,相较于类实现 Iterator 接口的方式,性能开销和复杂性大大降低。

你可能感兴趣的:(PHP)