35.多条件筛选

案例导入

如下图，请筛选出部门为科室1，工资大于4000元的行数据。

图1.原始数据表

文心一言提示词

打开百度“文心一言”，输入提示词：“你是pandas专家，文件路径为：D:/Samples/各科室人员.xlsx。该Excel文件的第一个工作表中A1:G10为给定数据，A-G列分别为“编号”、“性别”、“年龄”、”学历“、”科室“、”职务等级“和“工资”数据。用pandas导入Excel文件的数据，第1行为索引行，引擎为"openpyxl"，请筛选出部门为科室1，工资大于4000元的行数据。”

显示结果如下：

要完成这个任务，我们需要使用pandas库来读取Excel文件，并根据指定的条件筛选数据。首先，确保你已经安装了pandas和openpyxl库。如果没有安装，你可以使用pip来安装它们：

pip install pandas openpyxl

接下来，你可以使用以下Python代码来读取Excel文件并筛选数据：

import pandas as pd# 定义文件路径file_path = 'D:/Samples/各科室人员.xlsx'# 使用pandas读取Excel文件，指定引擎为'openpyxl'，并且第一行为索引df = pd.read_excel(file_path, sheet_name=0, index_col=0, engine='openpyxl')# 筛选出部门为'科室1'且工资大于4000元的行数据filtered_df = df[(df['科室'] == '科室1') & (df['工资'] > 4000)]# 输出筛选后的数据print(filtered_df)

在上面的代码中，我们首先使用pd.read_excel函数读取Excel文件，并指定sheet_name=0来读取第一个工作表，index_col=0来设置第一列（即"编号"列）为索引列。engine='openpyxl'参数用于指定读取Excel文件时使用的引擎。

然后，我们使用布尔索引来筛选出满足条件的行数据。这里我们使用了&运算符来组合两个条件：df['科室'] == '科室1'和df['工资'] > 4000，分别表示“科室”列的值等于'科室1'且“工资”列的值大于4000。

最后，我们将筛选后的数据存储在filtered_df变量中，并使用print函数输出到控制台。

请确保你的Excel文件路径、工作表名称以及列名与代码中的相应部分相匹配。如果列名或工作表名称有所不同，你需要相应地修改代码中的相应部分。

Python编辑器运行

图2.Python运行结果

本合集使用的工具如下：

文心一言：3.5版本

Python编辑器：3.9.0

申明：以上结果皆为实际运行结果，如遇到无法运行可在评论区留言。部分数据来自网络，如有侵权请私信告知，感谢！

玩酷网

35.多条件筛选

热门分类