内容有在续建设中,请持续关注,爱你们哟ღ( ´・ᴗ・` )。
近期工作压力巨大,常年在地铁上刷着干瘪的短视频和段子,我看到了世界的参差_(:з」∠)_,对于美的追求的精神世界无比枯竭。直到有一天,我看到了,在一些学术论文中,出现了许多美丽的图片(如反映多维数据分布及相关性的散点图和气泡图、表现流量分布的桑基图等),这些图片的美感在于,它们将冰冷的数据用生动的图像演绎出来,无比炫酷,给人以无限的遐想和学习的兴趣。
想想马上就要读研究生的我,也许多年后需要自己生成美丽的图像,为了多年后别把自己精心研究的数据(当然也可能是脚踩的数据)绘图成跟shi一样,更重要的是为了在感受世界的参差时静下心来,享受学术的美丽、数据的美丽,我决定入坑学习Python数据可视化,并把学习成果与大家交流共享。
持续建设中,大家可以关注,平日里要打工,不定期更新(提前为自己的咕咕咕找好借口)
OS:
Windows 10或者MacOS均可(注意:Windows 10或者MacOS仅在某些方面,比如文件路径的表示上可能略有不同)Python版本: 本项目采用
3.9.x 64-bit版本(截至2021年4月26日查询Python官网https://www.python.org,Python最新版本为3.9.x)推荐的编辑器:
Pycharm或Jupyter,看你喜好啦~推荐使用虚拟环境(venv),在为本项目进行必要的第三方库配置时,不影响其它Python项目的配置,不污染系统Python的环境。
pyecharts:本项目最主要的第三方库之一,打开cmd(或其它操作系统的终端),使用pip install pyecharts进行安装。
用途:将数据进行可视化,生成各种可交互式的图表。
导入方式:直接采用
import pyecharts导入有其不足点,通常我们这样导入pyecharts包
# 导入options模块并简写为opts import pyecharts.options as opts # 从pyecharts.charts中导入“某一特定类型图”(some-package)模块 from pyecharts.charts import <some-package>其中上述<some-package>,根据需要绘制的图形类型进行特别指定,画柱状图就换成Bar,画线状图就指定Line,画桑基图就指定Sankey等。
举例:假如要绘制柱状图(Bar chart),就这样导入pyecharts库
# 导入options模块并简写为opts import pyecharts.options as opts # 从pyecharts.charts中导入 Bar 模块 from pyecharts.charts import Baropenpyxl:第三方库,打开cmd(或其它操作系统的终端),使用pip install openpyxl进行安装。
用途:对excel表格进行读写操作。
导入方式:原则上采用
import openpyxl便足以满足开发需要,但是为了尽可能发挥代码提示的功能,推荐如下方式导入
import openpyxl # 最主要的导入 from openpyxl.utils import cell from openpyxl import Workbook # 这个导入和type注释会共同起作用 from openpyxl.worksheet.worksheet import Worksheet # 这个导入和type注释会共同起作用另注:为了显示代码提示,建议在对工作簿、工作表变量赋值后,用注释在同一行指明类型(格式:# type: 类型名),例如
import openpyxl # 最主要的导入 from openpyxl.utils import cell from openpyxl import Workbook # 这个导入和type注释会共同起作用 from openpyxl.worksheet.worksheet import Worksheet # 这个导入和type注释会共同起作用 workBook = openpyxl.load_workbook(filename=recordPath) # type: Workbook workSheet = photoParamBook["示例"] # type: Worksheet有时安装失败是因为国内网络有一些限制,这时您可以尝试使用清华大学镜像下载相应的包,即pip install -i https://pypi.tuna.tsinghua.edu.cn/simple some-package,其中some-package换成自己所需要安装的第三方库名。
注意:使用镜像前请确保自己的pip处于较新版本(>=10.0.0)
更新pip使用命令:
python -m pip install --upgrade pip
- 当您在运行Python的样例时,请预先安装好所需的第三方库依赖,并关闭resources目录中所涉及的文件(如果有),以免因为文件占用导致程序不能处理打开着的文件。
- 使用库的时候,不要死记硬背,常见的思路记住即可,细节的东西可以随机应变或者查官方文档进行处理。
- 导入第三方库时,部分第三方库(例如
openpyxl)的类单独导入进来,结合形如# type: ...格式的注释,有利于充分利用好编辑器的代码填充提示,使第三方库的封装更有意义。
本项目中,所涉及库等内容的文档链接如下。
Python官网及其官方文档
本项目最主要的第三方库之一pyecharts官方文档
openpyxl第三方库官方文档
清华大学开源软件镜像站(当第三方库无法直接下载时,可以考虑镜像站)
网址:清华大学开源软件镜像站 | Tsinghua Open Source Mirror
使用镜像安装第三方库格式:
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple some-package(请将上述
some-package换成自己需要的第三方库名,例如pyecharts)注意:使用镜像前请确保自己的pip处于较新版本(>=10.0.0)
更新pip使用命令:
python -m pip install --upgrade pip
Python自动化办公:使用os openpyxl python-docx pdfplumber等第三方库批量分类文件、批量读写Excel文档、批量读写Word文档、批量获取文字类Pdf文档、基于SMTP和MIME协议的邮件批量发送内容等,通过一些典型的应用场景,大幅提升职场办公室工作效率。