35.多条件筛选

李光朱课程 2024-04-03 10:09:23
案例导入

如下图,请筛选出部门为科室1,工资大于4000元的行数据。

图1.原始数据表

文心一言提示词

打开百度“文心一言”,输入提示词:“你是pandas专家,文件路径为:D:/Samples/各科室人员.xlsx。该Excel文件的第一个工作表中A1:G10为给定数据,A-G列分别为“编号”、“性别”、“年龄”、”学历“、”科室“、”职务等级“和“工资”数据。用pandas导入Excel文件的数据,第1行为索引行,引擎为"openpyxl",请筛选出部门为科室1,工资大于4000元的行数据。”

显示结果如下:

要完成这个任务,我们需要使用pandas库来读取Excel文件,并根据指定的条件筛选数据。首先,确保你已经安装了pandas和openpyxl库。如果没有安装,你可以使用pip来安装它们:

pip install pandas openpyxl

接下来,你可以使用以下Python代码来读取Excel文件并筛选数据:

import pandas as pd# 定义文件路径file_path = 'D:/Samples/各科室人员.xlsx'# 使用pandas读取Excel文件,指定引擎为'openpyxl',并且第一行为索引df = pd.read_excel(file_path, sheet_name=0, index_col=0, engine='openpyxl')# 筛选出部门为'科室1'且工资大于4000元的行数据filtered_df = df[(df['科室'] == '科室1') & (df['工资'] > 4000)]# 输出筛选后的数据print(filtered_df)

在上面的代码中,我们首先使用pd.read_excel函数读取Excel文件,并指定sheet_name=0来读取第一个工作表,index_col=0来设置第一列(即"编号"列)为索引列。engine='openpyxl'参数用于指定读取Excel文件时使用的引擎。

然后,我们使用布尔索引来筛选出满足条件的行数据。这里我们使用了&运算符来组合两个条件:df['科室'] == '科室1'和df['工资'] > 4000,分别表示“科室”列的值等于'科室1'且“工资”列的值大于4000。

最后,我们将筛选后的数据存储在filtered_df变量中,并使用print函数输出到控制台。

请确保你的Excel文件路径、工作表名称以及列名与代码中的相应部分相匹配。如果列名或工作表名称有所不同,你需要相应地修改代码中的相应部分。

Python编辑器运行

图2.Python运行结果

本合集使用的工具如下:

文心一言:3.5版本

Python编辑器:3.9.0

申明:以上结果皆为实际运行结果,如遇到无法运行可在评论区留言。部分数据来自网络,如有侵权请私信告知,感谢!

0 阅读:0

李光朱课程

简介:感谢大家的关注