国内第一份人工智能平台ACUMOS安装指南
Acumos是由美国电信运营商AT&T联合科技公司Tech Mahindra推出的人工智能开源平台项目。在今年3月举办的北美开放网络峰会上,Linux基金会成立Linux深度学习基金会,并宣布Acumos为该基金会的第一个人工智能项目。该项目已吸引中兴、Nokia、Orange等企业的加入,并计划在近期工作中集成百度的EDL以及腾讯Angel(这两个项目还处于linux深度学习基金会孵化阶段,未正式推出)。Acumos致力于实现AI开发过程的可视化、模块化,降低AI开发门槛,提高AI开发速度,扩大AI在产业界的应用规模,提升AI产品的商业价值。
Acumos官网于11月7号正式发布了该项目的第一个版本Athena,版本号为1.0.0。Acumos前期在研时,存在的问题较多,难以安装。正式版本出来后,采用oneclick_deploy.sh脚本化部署方式已能成功安装Acumos,但安装过程仍存在这样或那样的问题。在此记录安装过程供有兴趣的开发者参考。
1. 官网网址:https://acumos.org
2. 官方wiki:https://wiki.acumos.org
3. 官方安装教程:https://docs.acumos.org/(由于网络原因,有时访问不了官方网站,可以下载pdf文档:https://media.readthedocs.org/pdf/acumos/latest/acumos.pdf)
1. 硬件要求:16G的内存,100G的存储空间。
2. 软件要求:Ubuntu Xenial (16.04 LTS),稳定的网络。
建议:每安装好一套工具或软件就备份虚拟机状态,后续即使出现Ubuntu环境变量被改变,安装进行不下去的情况,也可以轻松恢复原来的环境。
1. 在virtualbox构建纯净的Ubuntu Xenial (16.04 LTS) 环境。可参考:https://jingyan.baidu.com/article/e52e36157a8cc740c60c51ee.html
2. 安装docker客户端。采用Docker官网给出的方法安装docker速度较慢,在此推荐一个国内比较快速的安装方法:https://blog.csdn.net/xie1xiao1jun/article/details/79413436。另外推荐docker入门书籍,有助于理解安装过程中遇到的问题:https://legacy.gitbook.com/book/yeasy/docker_practice/details
3. 安装nexus3,这部分内容网上较少,在此详细描述安装过程。首先从官网https://www.sonatype.com/download-oss-sonatype下载Nexus Repository Manager OSS 3.x – Unix
下载完毕后,文件被自动命名为nexus-3.14.0-04-unix.tar.gz,解压此文件,进入~/nexus-3.140-04/etc目录(如下图步骤1所示), 修改配置文件nexus-default.properties端口。nexus3默认端口号为8081,这个端口号经常被系统进程占用,需要把application-port改为30881(如下图步骤2所示),以配合Acumos的安装:
进入~/nexus-3.140-04/bin目录,执行:
./nexus start
即可启动nexus服务,如下图所示:
采用一键部署的方式安装acumos只有两步,非常容易理解:
首先,从官网下载安装脚本文件:
git clone https://gerrit.acumos.org/r/system-integration
其次是进入~/system-integration/AIO目录,执行以下命令:
bash oneclick_deploy.sh docker
在安装过程中会从国外服务器拉取诸多docker镜像,请耐心等待。
1.死循环:
"waiting for dpkg to beunlocked"
解决办法:注释掉oneclick_deploy.sh脚本第99、103行中的”wait_dpkg;”;然后运行bash oneclick_deploy.sh docker,这两行中的“apt-get install”正常运行,则说明dpkg并没有被加锁,并未出现“E: Couldnot get lock /var/lib/dpkg/lock - open (11: Resource temporarily unavailable)”
2.Oneclick_deploy.sh脚本第356行:git clone https://gerrit.acumos.org/r/platform-oam无法执行,导致安装失败。原因有两方面:(1)是gerrit.acumos.org访问不了,可以试试能否ping通,ping不同说明官网出问题了;(2)国内访问国外服务器网速不佳。
解决办法:可以访问GitHub上的platform-oam,把源代码修改为:git clone https://github.com/acumos/platform-oam.git
3.死循环:
curl: (7) Failed to connect 2375: Conenction refused.
+ log 'waiting 30 seconds for docker daemon to be ready'
出现原因:docker.service未配置2375端口
解决办法:修改Ubuntu docker.service(位于/lib/systemd/system目录)配置文件:ExecStart=/usr/bin/dockerd –H unix:// 改为:
ExecStart=/usr/bin/dockerd –H unix:// -H tcp://0.0.0.0:2375
参考:docker daemon远程连接设置https://blog.csdn.net/qq_37467907/article/details/79537801
4.死循环:
Curl: (56) Recv failure:connection reset by peer
+ log 'Kong admin API isnot ready... waiting 10 seconds'
这个问题还未完全解决,AT&T负责Acumos部署工作的Byran建议多次重装,就可以通过认证,如下图所示。
5.安装成功后,火狐浏览器并不能访问localhost:30443,使用google进行访问:
至此,就可以在本地启动Acumos服务了。
想进一步了解Acumos项目进展情况,参与项目讨论,请加入邮件列表:https://lists.acumos.org/
中国联通也开发了轻量级、微服务、容器化的AI模型AI模型打包、容器化封装、模型编排、模型发布、模型搜索、模型部署、AI能力开放、能力编排、能力演示的CubeAI平台,详情请见https://blog.csdn.net/yudajiangshan/article/details/104273987