点击上方“Python爬虫与数据挖掘”,进行关注
回复“书籍”即可获赠Python从入门到进阶共10本电子书
今
日
鸡
汤
急景忽云暮,颓年浸已衰。
Hi!大家好呀!我是你们努力的喵哥!
如果你使用 Python 或者 R 语言处理过 Excel 中数据,对于来回的导入导出 Excel 数据是不是烦恼?单纯的使用 Excel 顶部工具或者函数,是不是感觉没有代码来的直接和流畅?
如果是 Python + Excel 会是什么样的体验那?
所以,喵哥今天就给大家推荐 Grid Studio 这个项目。Grid Studio 是一个基于 Web 的电子表格应用程序,其最大的特点是集成了 Python 语言,作为交互方式。
Grid Studio 最厉害的地方在于解决表格数据处理中散乱的工作流。例如R studio 和 Excel 等多个工具间来回操作。也正因为集成了 Python,只需少量的几行代码,即可完成非常复杂的表格数据处理。
安装
在本地安装Grid studio非常简单:
1. Clone the repository with this command:
git clone https://github.com/ricklamers/gridstudio
2. Run the bash script (on Windows use e.g. Git Bash) with this command:
cd gridstudio && ./run.sh
3. Go to http://127.0.0.1:8080 in your browser. Note! Username: admin password: admin
注意:如果您使用的是Windows,请确保共享驱动器https://docs.docker.com/docker-for-windows/#shared-drives
注意:在Linux上,您可能需要运行(对于第2步):
因为Docker需要sudo访问权限才能运行。
使用
读、写
Python 集成的核心是对电子表格的读写接口,它可以在电子表格的数据和 Python 进程中的数据之间建立一个高性能的连接。
可以用以下方式在表格中写入数据:
sheet("A1:A3", [1, 2, 3])
用以下这种方式从表格中读取数据:
my_matrix = sheet("A1:A3")
你可以通过这种简单而高效的方式直接在表格中读取或写入数据,以自动化数据输入、提取、可视化等过程。
编写定制化表格函数
虽然通过一个简单的接口完成读写非常灵活,但有时编写可以直接调出的定制化函数也很重要。
除了 AVERAGE、SUM、IF 这些默认函数外,你可能还需要其他函数。
def UPPERCASE(a):
return str(a).uppercase()
写完这行代码后,在表格中调出该函数,就像调用常规函数一样。
利用 Python 生态
通过利用 Python 生态中各种强大的软件包,我们能立即访问到当前最优的数据科学工具,因此也能快速访问到强大的模型,例如线性回归和 支持向量机等。
因为本身 Grid studio 主要就是处理表格数据,那么将它们作为特征可以快速调用 SVM 等模型,从而探索隐藏在这些数据背后的特征。
数据可视化
在数据科学中,很常见的一个任务就是可视化数据,这样才能获得关于数据的「先验知识」。通过集成交互式绘图库 Plotly.js 和 Python 标准可视化库 Matplotlib,Grid studio 目前已经内置了高级绘图功能。如下所示我们可以在向量表格格式上使用高级绘图功能:
最后
Grid studio 的作者是 Rick Lamers。该项目共有9位维护者,已经维护了一年多。Grid studio 在 Github 上共收获了7.8k Star。其使用者正在逐渐增多。特别是在数据科学领域,也是最近的热门项目之一。
项目地址:https://github.com/ricklamers/gridstudio
在线官网:https://gridstudio.io/
------------------- End -------------------
往期精彩文章推荐:
欢迎大家点赞,留言,转发,转载,感谢大家的相伴与支持
想加入Python学习群请在后台回复【入群】
万水千山总是情,点个【在看】行不行
/今日留言主题/
随便说一两句吧~~