尽管已经2024年了,但是估计每一个人每天都无法避免要接触的软件之一就是电子表格(excel)。Python非常适合分析大数据集、自动化流程、连接托管数据集,进行复杂分析。电子表格则更适合于普通用户查看和可视化数据、简单计算以及与非专业人员共享传递,而将两者结合则能构成一个完美数据处理和展现、分享的流水线。
本文虫虫给大家介绍一些Python下处理excel表格的Python包供大家选用。
概述两个最广泛使用的电子表格应用程序是Microsoft Excel和Google Sheets。 Excel现在支持Python,但最近只支持一种称为Visual Basic Analysis(VBA) 的编程语言,而Google Sheets支持基于javascript的appscript。虽然VBA和 appscript扩展了两种流行的电子表格应用程序的功能,但这两种语言都不适合分析工作。 相比之下,Python拥有强大的开源库生态系统,例如Pandas、Numpy 和Scipy,使复杂的分析变得容易。Python 社区也更愿意使用他们熟悉的语言,而不是学习新的东西,而且Python对于那些还不熟悉它的人来说很容易学习。
作为数据分析和人工智能首选编程语言,Python现在可以说流行全世界,不光是编程届中,也在其他领域。Python处理电子表格也是一个非常流行的领域,其相关类包的发展历史也很悠久了。比如出现在2001年的PyExcelerator是Python在电子表格届的老大哥,也是第一个用于与电子表格交互的Python包,虽然他已经停止维护,但是后继者却层出不穷,其中不乏后起翘楚。
本文我们将介绍最流行的几个Python电子表格包。
pyspreadPyspread是一个开源的Python电子表格。与插入Excel的其他产品不同,Pyspread支持自己的电子表格界面,可在其单元格中的Python代码、访问Python库、导入和导出CSV、SVG和PDF以及图表。要运行该应用程序,计算机上必须已安装Python,然后下载Pyspread并运行它。Pyspread对所有用户免费。
站点:pyspread(dot)gitlab(dot)io
代码仓库:gitlab(dot)com/pyspread/pyspread
XlwingsXlwings是一个开源软件打包,其中预打包Anaconda和WinPython,所以无需本地环境预先安装Python环境。Xlwings支持安装Excel插件,支持使用Python脚本自动化Excel、用Python编写宏、编写用户定义的函数以及构建自定义加载项。
官方提供专业收费在线托管环境可支持更多功能,例如一键式安装程序、随处运行的基于Web 的加载项以及对Excel 365和Google Sheets的支持。专业版本收费为每年1490美元。
站点:xlwings(dot)org
代码仓库:github(dot)com/xlwings/xlwings
Excel
经过Python忠实用户多年的要求,Excel终于在Excel for Windows中添加了Python支持。Microsoft正在使用其beta版本中逐步向Windows用户推出Excel 中的Python支持。该功能可用后,将能够在单元格中键入“=PY”,将其转换为 Python单元格,然后在公式栏中编写自定义Python函数。菜单栏中将有一个“插入Python”按钮。单元格将包含Excel值或Python对象。使用Python导入数据需要通过PowerQuery进行处理。
目前beta版本功能需要Microsoft Office 365许可证,其费用为6.99美元/月。
Row ZeroRow Zero是一个在云中运行的电子表格SaaS应用程序,支持十亿行数据,并允许用户将Python直接写入应用程序的代码窗口或电子表格单元格中。 由于Row Zero 完全在云中运行,因此无需在本地计算机上进行安装。登录网站即可访问该产品。 该应用程序由一个高性能电子表格和一个Python代码窗口组成。 在代码窗口中,用户可以编写在电子表格中使用的Python函数,导入Python包(例如numpy、Scipy和Pandas),或者连接到托管数据集和API。Row Zero支持一个具有工作簿限制的免费版本和一个提供无限工作簿的付费版本。
站点:rowzero(dot)io
yxllPyxll是一个Excel插件,允许开发人员在电子表格中使用Python、构建应用程序、流数据集和创建模型。Pyxll还支持在Excel电子表格中运行Jupyter Notebook。运行该系统需要在本地计算机上运行Python。Python IDE(例如 Conda、Pycharm 或 VSCode)可用于编写和调试电子表格中使用的代码,并且pyxll提供广泛的文档和支持资源来帮助共享工作簿、执行分析和调试代码。该产品是收费软件,价格不月订购价为29美元,可以免费30天试用。
站点:pyxll(dot)com
总结
Python电子表格是可以提高大家日常工作的生产力工具。通过继承Python的分析能力与传统电子表格的用户友好界面相结合,可以满足各级别用户的各种需求。在连接到大规模数据,然后流式处理,复杂的分析,数据可视化,甚至连接AI智能分析,也提供对小白用户的简单电子表格应用的熟悉性和易用性操作。