45.用分隔符分列

李光朱课程 2024-04-24 03:45:23
案例导入

如下图,将规格中的数据用分隔符*分为3列,对应的列索引分别为”长“、”宽“和”高“。添加代码注释。

图1.原始数据表

文心一言提示词

打开百度“文心一言”,输入提示词:“你是pandas专家,文件路径为:D:/Samples/分割物质规格.xlsx。用pandas导入第1个工作表中的数据,第1行为索引行,导入前7行数据,引擎为"openpyxl"。将规格中的数据用分隔符*分为3列,对应的列索引分别为”长“、”宽“和”高“。添加代码注释。”

显示结果如下:

首先,确保你已经安装了pandas和openpyxl库。如果尚未安装,可以使用以下命令安装:

pip install pandas openpyxl

然后,可以使用以下Python代码来导入Excel文件中的数据,并对数据进行处理:

import pandas as pd# 定义文件路径file_path = 'D:/Samples/分割物质规格.xlsx'# 使用pandas读取Excel文件,引擎为'openpyxl',只读取前7行,第1行作为索引df = pd.read_excel(file_path, sheet_name=0, engine='openpyxl', nrows=7, header=0)# 假设'规格'列的数据格式为"长*宽*高",使用str.split方法按'*'分隔成3列# 并将这3列分别命名为'长'、'宽'和'高'df[['长', '宽', '高']] = df['规格'].str.split('*', expand=True)# 删除原来的'规格'列df.drop(columns=['规格'], inplace=True)# 查看结果print(df)

代码注释:

# 导入pandas库import pandas as pd# 定义文件路径# 这里将文件路径设置为'D:/Samples/分割物质规格.xlsx'file_path = 'D:/Samples/分割物质规格.xlsx'# 使用pandas的read_excel函数读取Excel文件# sheet_name=0表示读取第1个工作表# engine='openpyxl'指定使用openpyxl引擎来读取xlsx文件# nrows=7表示只读取前7行数据# header=0表示第1行是列名,将其用作索引df = pd.read_excel(file_path, sheet_name=0, engine='openpyxl', nrows=7, header=0)# 假设'规格'列的数据格式为"长*宽*高"# 使用str.split方法按照'*'字符分割'规格'列中的每个元素# expand=True表示将分割后的结果扩展到DataFrame的多列中# 将新生成的列分别命名为'长'、'宽'和'高'df[['长', '宽', '高']] = df['规格'].str.split('*', expand=True)# 删除原始的'规格'列,因为我们已经将其内容分割并存储在新的列中df.drop(columns=['规格'], inplace=True)# 打印处理后的DataFrame,查看结果print(df)

请注意,此代码假设'规格'列中的数据确实以''字符分隔,并且格式是"长宽*高"。如果数据格式与此不符,你需要相应地调整str.split方法的参数。此外,请确保Excel文件的路径正确,并且工作表确实存在。如果文件或工作表名称包含特殊字符或空格,你可能需要使用引号将它们括起来。

Python运行结果

图2.Python运行结果

本合集使用的工具如下:

文心一言:3.5版本

Python编辑器:3.9.0

申明:以上结果皆为实际运行结果,如遇到无法运行可在评论区留言。部分数据来自网络,如有侵权请私信告知,感谢!

0 阅读:11

李光朱课程

简介:感谢大家的关注