开发环境:ubuntu 14.0.4 + apache2 + php7.0.20
开源项目:libmf(做概率矩阵分解的一个很优秀的开源软件,内置sse ,avx,openMP等指令集优化,速度灰常快!)
地址:http://www.csie.ntu.edu.tw/~cjlin/libmf/
初步的想法是将libmf模块移植到php中,能够直接调用,也就是为php扩展一个新的模块.
首先下载libmf留后面备用,截止到2017/6/27 ,libmf的版本到了libmf-2.01,因此本次扩展所采用的正是libmf-2.01
$ sudo apt-get install apache2
产生的启动和停止文件是:/etc/init.d/apache2 配置文件保存在:/etc/apache2
相关操作:
$ sudo apache2ctl -k start //启动
$ sudo apache2ctl -k stop //停止
$ sudo apache2ctl -k restart //重新启动
在安装php7之前 先安装一些依赖库
sudo apt-get install autoconf
sudo apt-get install libxml2-dev
sudo apt-get install bzip2
sudo apt-get install libcurl3-openssl-dev
sudo apt-get install libcurl4-gnutls-dev
sudo apt-get install libjpeg-dev
sudo apt-get install libpng-dev
sudo apt-get install libxpm-dev
sudo apt-get install libfreetype6-dev
sudo apt-get install libt1-dev
sudo apt-get install libmcrypt-dev
sudo apt-get install libmysql++-dev
sudo apt-get install libxslt1-dev
sudo apt-get install libbz2-dev
如果在安装过程中出现 如下错误信息:
E: 无法修正错误,因为您要求某些软件包保持现状,就是它们破坏了软件包间的依赖关系。
解决方法:
更改软件源 :打开系统设置-> 软件和更新-> 在 下载自 的列表 选择 163 的镜像地址 而非 中国的服务器。
然后执行 sudo apt-get update
即可 再安装相关依赖库。
sudo apt-get install apache2-dev
安装 apache2-dev
,否则在配置php时无法指定--with-apxs2=/usr/bin/apxs
来生成 libphp7.so
从官网下载 php-7.0.20.tar.gz
地址:http://www.php.net/
$ tar xzvf php-7.0.20.tar.gz /解压到当前目录下
$ sudo cp php-7.0.20 /home/lw/桌面/php /将php源码拷贝到桌面下的php目录下
$ cd /home/lw/桌面/php/php-7.0.20 /进入php源码目录下
$ ./buildconf --force /编译执行前检查相关依赖
$ ./configure --prefix=/usr/local/php-7.0.20 --with-config-file-path=/usr/local/php-7.0.20/etc/ --enable-fpm --with-fpm-user=www-data --with-fpm-group=www-data --with-mysql-sock --with-mysqli --with-pdo-mysql --with-iconv-dir --with-freetype-dir --with-jpeg-dir --with-png-dir --with-libxml-dir=/usr --disable-rpath --enable-bcmath --enable-shmop --enable-inline-optimization --with-curl --enable-mbregex --enable-mbstring --enable-ftp --with-gd --enable-gd-native-ttf --enable-soap --without-pear --with-gettext --disable-fileinfo --enable-maintainer-zts --disable-debug --enable-shared --enable-opcache --enable-pdo --with-iconv --with-mcrypt --with-mhash --with-openssl --enable-xml --with-xmlrpc --with-libxml-dir --enable-pcntl --enable-sysvmsg --enable-sysvsem --enable-sysvshm --with-zlib --enable-zip --without-sqlite3 --without-pdo-sqlite --with-libdir=/lib/x86_64-linux-gnu --with-jpeg-dir=/usr/lib --with-apxs2=/usr/bin/apxs2 --enable-cgi --enable-wddx --with-zlib-dir --with-bz2 --enable-session --enable-exif /配置开启 php-fpm支持,--enable-fpm;开启多线程支持 --enable-maintainer-zts;开启线程安全以及其他模块
如果没有找到/usr/bin/apxs2 ,执行 sudo find / -name apxs2
或者sudo find / -name apxs
去查找其路径, 路径可能会有些许差别.
上一步没有报错的话,执行:
$ sudo make
编译可能出现的错误:
sockets 模块一直make出错,这个错误真是无解,换了许多php版本都报错….最后无奈只好在./configure 中将 –enable-sockets 去掉 如果没报错,那么恭喜你~~
继续执行:
sudo make install
如果要重新编译的话,需先执行sudo make clean
如果这一步没有出现成功提示,或者有报错信息,请参考https://gist.github.com/m1st0/1c41b8d0eb42169ce71a 安装相应依赖包。
安装php之后,它会将libphp7.so
安装到/usr/lib/apache2/modules
中,并在/etc/apache2/mods-enabled
文件夹中加入php7.load
,为了使得apache2能够解析php文件,我们需要在这个php7.load
文件尾加入一些信息。
$ sudo gedit /etc/apache2/mods-enabled/php7.load
加入信息如下:
LoadModule php7_module /usr/lib/apache2/modules/libphp7.so
Addtype application/x-httpd-php .php
Addtype application/x-httpd-php-source .phps
编辑测试页面
$ gksudo gedit /var/www/html/test.php
向test.php 添加如下信息:
echo phpinfo();
?>
重启apache2
$ sudo service apache2 restart
浏览器地址栏输:http://localhost/test.php 或http://127.0.1.1/test.php
注意: 如果在安装php 的过程中出现了错误,在重新编译安装之后,可能linux中的php路径会被去掉,使得apache不能解析php 这个时候需要手动向系统路径中添加php。
$ export PATH=$PATH:/usr/local/php-7.0.20/bin
然后 php -v查看是否生效,生效后在重启apache2 浏览器打开测试页面查看。
这一部分内容为的是拿到.so文件,先看一下我们需要什么文件吧 。
$ cd /home/lw/桌面/phpmf
$ tree
├── CMakeLists.txt
├── mf
│ ├── CMakeLists.txt
│ ├── mf.cpp
│ └── mf.h
├── mfTest
│ ├── CMakeLists.txt
│ └── mfTest.cpp
└── php_mf
├── CMakeLists.txt
├── mfWarp.cpp
├── mfWarp.h
├── php_mf.c
└── php_mf.h
说明:在这里 我首先从下载的 libmf-2.01 中取出 mf.h mf.cpp 文件放在mf文件夹内,这是整个软件的核心,mf.h定义了相应的数据结构以及函数声明,mf.cpp则是所对应的函数定义,源文件中还有my_train.cpp 和my_predict.cpp,这两个可为我们写自定义的功能函数提供参考,此外 我们还自己写了一个测试放在mftest目录下,而有关php扩展的内容放在了php_mf目录下。
下面我们按照目录顺序依次解析其内容
首先是phpmf 根目录下的 CMakeLists.txt
# CMake 最低版本号要求
cmake_minimum_required(VERSION 2.6)
# 支持旧版本的 CMake
if(WIN32)
set(CMAKE_INSTALL_PREFIX "${CMAKE_BINARY_DIR}/install" CACHE PATH "Installation Directory")
else()
set(CMAKE_INSTALL_PREFIX "/usr/local/phpmf" CACHE PATH "Installation Directory")
endif()
macro(use_cxx11)
if(CMAKE_VERSION VERSION_LESS "3.1")
if(CMAKE_CXX_COMPILER_ID STREQUAL "GNU")
set(CMAKE_CXX_FLAGS "--std=gnu++11 ${CMAKE_CXX_FLAGS}")
endif()
else()
set(CMAKE_CXX_STANDARD 11)
endif()
endmacro(use_cxx11)
#设置配置类型
if(CMAKE_CONFIGURATION_TYPES)
set(CMAKE_CONFIGURATION_TYPES "Debug;Release" CACHE PATH "Configs" FORCE)
endif()
use_cxx11()
project(phpmf)
#设置执行文件输出目录(在根目录的bin下)
set(EXECUTABLE_OUTPUT_PATH ${CMAKE_BINARY_DIR}/bin)
#设置链接库输出目录
set(LIBRARY_OUTPUT_PATH ${CMAKE_BINARY_DIR}/bin)
#添加子目录
add_subdirectory(mf)
add_subdirectory(mfTest)
add_subdirectory(php_mf)
#包含头文件
include_directories(include)
#获取源代码下的所有源文件和头文件
file(GLOB mf_src "./*.cpp")
file(GLOB mf_head "./*.h")
if(WIN32)
set(CMAKE_CXX_FLAGS "/W4 /nologo /O2 /EHsc /arch:AVX /openmp")
else()
set(CMAKE_CXX_FLAGS "-Wall -O3 -pthread -std=c++0x -march=native -mavx -fopenmp")
endif()
#开启sse avx omp
add_definitions(-DUSESSE -DUSEAVX -DUSEOMP -D_CRT_SECURE_NO_DEPRECATE)
add_library(mf SHARED ${mf_src} ${mf_head})
if(WIN32)
install(TARGETS mf
RUNTIME DESTINATION ./)
endif()
(这里仅贴出增加的自定义功能函数mf_my_train())
/************************************************************************************************
Function: mf_my_train()
Description: 对于指定的稀疏矩阵进行分解,返回分解后的P,Q矩阵,并保存在指定的路径下
Input: tr_path:需要进行矩阵分解的稀疏矩阵(绝对路径);model_path将模型保存到的路径
Output: 保存模型到本地是否成功,1(打开本地路径失败,即保存失败);0(成功)
Return: 返回的是状态值
Others:
***********************************************************************************************/
mf_int mf_my_train(
char const * tr_path,
char const * model_path)
{
mf_int status = -1;
mf_problem tr;
mf_model *model;
tr = read_problem(tr_path);
mf_parameter param = mf_get_default_param();
param.nr_iters = 40;
model = mf_train_with_validation(&tr, nullptr, param);
//printf("train success\A3\A1");
status = mf_save_model(model,model_path);
return status;
}
因为我们要制作动态链接库,在windows下是dll,linux下是so,因此在文件头,添加了类似与在windows下生成dll的语句.凡是需要
导出的函数都需要加上宏的标记 即MF_API。
#ifndef _LIBMF_H
#define _LIBMF_H
#include
#if (defined WIN32 || defined _WIN32)
#if defined(MF_EXPORTS) || defined(mf_EXPORTS)
#define MF_API __declspec(dllexport)
#else
#define MF_API __declspec(dllimport)
#endif
#elif defined __GNUC__ && __GNUC__ >= 4
#define MF_API __attribute__ ((visibility ("default")))
#else
#define MF_API
#endif
#ifdef __cplusplus
//extern "C"
//{
namespace mf
{
#endif
typedef float mf_float;
typedef double mf_double;
typedef int mf_int;
typedef long long mf_long;
enum {P_L2_MFR=0, P_L1_MFR=1, P_KL_MFR=2, P_LR_MFC=5, P_L2_MFC=6, P_L1_MFC=7,
P_ROW_BPR_MFOC=10, P_COL_BPR_MFOC=11};
enum {RMSE=0, MAE=1, GKL=2, LOGLOSS=5, ACC=6, ROW_MPR=10, COL_MPR=11,
ROW_AUC=12, COL_AUC=13};
struct mf_node
{
mf_int u;
mf_int v;
mf_float r;
};
struct mf_problem
{
mf_int m;
mf_int n;
mf_long nnz;
struct mf_node *R;
};
struct mf_parameter
{
mf_int fun;
mf_int k;
mf_int nr_threads;
mf_int nr_bins;
mf_int nr_iters;
mf_float lambda_p1;
mf_float lambda_p2;
mf_float lambda_q1;
mf_float lambda_q2;
mf_float eta;
bool do_nmf;
bool quiet;
bool copy_data;
};
MF_API struct mf_parameter mf_get_default_param();
struct mf_model
{
mf_int fun;
mf_int m;
mf_int n;
mf_int k;
mf_float b;
mf_float *P;
mf_float *Q;
};
MF_API mf_problem read_problem(char const * path);
MF_API mf_int mf_save_model(struct mf_model const *model, char const *path);
MF_API struct mf_model* mf_load_model(char const *path);
MF_API void mf_destroy_model(struct mf_model **model);
MF_API struct mf_model* mf_train(
struct mf_problem const *prob,
struct mf_parameter param);
MF_API mf_int mf_my_train(char const * tr_path, char const * model_path);
MF_API struct mf_model* mf_train_on_disk(
char const *tr_path,
struct mf_parameter param);
MF_API struct mf_model* mf_train_with_validation(
struct mf_problem const *tr,
struct mf_problem const *va,
struct mf_parameter param);
MF_API struct mf_model* mf_train_with_validation_on_disk(
char const *tr_path,
char const *va_path,
struct mf_parameter param);
MF_API mf_double mf_cross_validation(
struct mf_problem const *prob,
mf_int nr_folds,
struct mf_parameter param);
MF_API mf_double mf_cross_validation_on_disk(
char const *prob,
mf_int nr_folds,
mf_parameter param);
MF_API mf_float mf_predict(struct mf_model const *model, mf_int u, mf_int v);
MF_API mf_double calc_rmse(mf_problem *prob, mf_model *model);
MF_API mf_double calc_mae(mf_problem *prob, mf_model *model);
MF_API mf_double calc_gkl(mf_problem *prob, mf_model *model);
MF_API mf_double calc_logloss(mf_problem *prob, mf_model *model);
MF_API mf_double calc_accuracy(mf_problem *prob, mf_model *model);
MF_API mf_double calc_mpr(mf_problem *prob, mf_model *model, bool transpose);
MF_API mf_double calc_auc(mf_problem *prob, mf_model *model, bool transpose);
#ifdef __cplusplus
} // namespace mf
//} // extern "C"
#endif
#endif // _LIBMF_H
mf/mftest就不贴了吧..很简单的一个调用程序,详见博客底部链接~
此文件夹内容 (CMakelists文件除外)都是通过 开发php扩展获取,即在终端下输入:
$ cd /home/lw/桌面/php/php-7.0.20/ext
$ ./ext_skel --extname=php_libmf
Creating directory php_libmf
Creating basic files: config.m4 config.w32 .gitignore php_libmf.c php_php_libmf.h CREDITS EXPERIMENTAL tests/001.phpt php_libmf.php [done].
To use your new extension, you will have to execute the following steps:
1. $ cd ..
2. $ vi ext/php_libmf/config.m4
3. $ ./buildconf
4. $ ./configure --[with|enable]-php_libmf
5. $ make
6. $ ./sapi/cli/php -f ext/php_libmf/php_libmf.php
7. $ vi ext/php_libmf/php_libmf.c
8. $ make
Repeat steps 3-6 until you are satisfied with ext/php_libmf/config.m4 and
step 6 confirms that your module is compiled into PHP. Then, start writing
code and repeat the last two steps as often as necessary.
查看产生的文件(这里产生的是php_libmf.c而非.cpp,这是后来修改的)
config.m4 config.w32 EXPERIMENTAL php_libmf.cpp~ php_php_libmf.h tests
config.m4~ CREDITS php_libmf.cpp php_libmf.php php_php_libmf.h~
php_libmf.cpp
,php_php_libmf.h
是我们要用的,为了方便更改名称:php_libmf.cpp
->php_mf.c
php_php_libmf.h
->php_mf.h
这一部分的cmakelists的内容比较复杂, 大致可以分为三个部分 :
find_path(php_path NAMES php_ini.h)
#set(php_path "/usr/local/php-7.0.20/include/php/main/")
if(${php_path} STREQUAL php_path_NOTFOUND)
message(FATAL_ERROR "cannot find the path contain the php_ini.h, please mannual set to the php_src/main")
endif()
include_directories(${php_path} ${php_path}/.. ${php_path}/../TSRM ${php_path}/../Zend)
if(WIN32)
add_definitions(-DZEND_WIN32 -DPHP_WIN32 -DPHP_EXTENSION -DZTS -DCOMPILE_DL_MF=1 -DHAVE_MF=1 -DZEND_DEBUG=$<CONFIG:DEBUG>)
else()
add_definitions(-DPHP_EXTENSION -DZTS -DCOMPILE_DL_MF=1 -DHAVE_MF=1 -DZEND_DEBUG=$<CONFIG:DEBUG>)
endif()
set( cur_files mfWarp.cpp php_mf.c mfWarp.h php_mf.h)
add_library(php_mf SHARED ${cur_files})
if(WIN32)
set(mf_lib "${CMAKE_BINARY_DIR}/bin/Release/mf.lib")
set(mf_lib_debug "${CMAKE_BINARY_DIR}/bin/Debug/mf.lib")
else()
set(mf_lib "${CMAKE_BINARY_DIR}/bin/libmf.so")
set(mf_lib_debug "${CMAKE_BINARY_DIR}/bin/libmf.so")
endif()
if(WIN32)
find_library(php_lib NAMES php)
target_link_libraries(php_mf ${php_lib} $<$<CONFIG:Release>:${mf_lib}>$<$<CONFIG:Debug>:${mf_lib_debug}>)
else()
target_link_libraries(php_mf $<$<CONFIG:Release>:${mf_lib}>$<$<CONFIG:Debug>:${mf_lib_debug}>)
endif()
if(WIN32)
install(TARGETS php_mf
RUNTIME DESTINATION ext)
#else()
#install(TARGETS php_lib_mf
#LIBRARY DESTINATION ./)
endif()
一个简单的转换函数, 定义在php调用的函数 ,在其内部 调用c++ 函数.
#include "mfWarp.h"
int php_mf_my_train(char * tr_path,char * model_path)
{
int result = mf::mf_my_train(tr_path, model_path);
//printf("here %s", tr_path);
return result;
}
#pragma once
#include
#include
#include "../mf/mf.h"
extern "C" int php_mf_my_train(char * tr_path,char * model_path);
完整的代码详见文件,这里仅给出需要修改的地方。
mf_my_train
,获取参数,调用php_mf_my_train()
,因为php是c写的,因此我们只能调用c代码,因此需要一个转换,php_mf_my_train
则是以c的风格去调用我们已经在mf.cpp
中声明为外部api的接口函数mf_my_train()
,要特别注意的是PHP_FUNCTION(mf_my_train)
中的mf_my_train
与mf.cpp
中的mf_my_train
是完全不同的东西。PHP_FUNCTION(mf_my_train)
{
char *tr_path = "";
char *model_path = "";
size_t tr_path_len, model_path_len;
if (zend_parse_parameters(ZEND_NUM_ARGS() TSRMLS_CC, "ss", &tr_path, &tr_path_len, &model_path, &model_path_len) == FAILURE) {
return;
}
int result = php_mf_my_train(tr_path, model_path);
switch (result)
{
case 0:
php_printf(" train successfully \n");
break;
case -1:
php_printf(" train failed \n");
break;
default:
break;
}
RETURN_LONG(result);
}
代码的简要说明:
因为在mf_my_train(char * tr_path,char * model_path)
中,要传入两个字符串类型,因此有"ss"
,s(string)
,i(int)
…,ZEND_NUM_ARGS()
用于获取参数数目,·TSRMLS_CC
用于保证线程安全,然后后面类似于c中的scanf,要特别注意的是如果要传string类型的参数,后面一定要加上该字符串的长度。
const zend_function_entry mf_functions[] = {
PHP_FE(mf_my_train, NULL) /* For testing, remove later. */
PHP_FE_END /* Must be the last line in php_libmf_functions[] */
至此 所需要文件都配置完成! 读者可在右侧地址中获取整个工程文件~http://download.csdn.net/detail/orangesuan/9884327