58.时间序列数据转换

李光朱课程 2024-05-18 03:20:41
案例导入

如下表所示,用匿名函数给每个测量值加上一个0-1之间不同的随机数。添加代码注释。

时间

测量值

2022-03-18 00:00:00

5

2022-03-18 01:00:00

9

2022-03-18 02:00:00

6

2022-03-18 03:00:00

9

2022-03-18 04:00:00

8

2022-03-18 05:00:00

10

2022-03-18 06:00:00

4

2022-03-18 07:00:00

3

2022-03-18 08:00:00

6

2022-03-18 09:00:00

3

2022-03-18 10:00:00

1

2022-03-18 11:00:00

6

2022-03-18 12:00:00

7

2022-03-18 13:00:00

4

2022-03-18 14:00:00

1

2022-03-18 15:00:00

7

2022-03-18 16:00:00

4

2022-03-18 17:00:00

10

2022-03-18 18:00:00

8

2022-03-18 19:00:00

6

2022-03-18 20:00:00

6

2022-03-18 21:00:00

1

2022-03-18 22:00:00

5

2022-03-18 23:00:00

4

2022-03-19 00:00:00

5

2022-03-19 01:00:00

5

2022-03-19 02:00:00

4

2022-03-19 03:00:00

1

2022-03-19 04:00:00

8

2022-03-19 05:00:00

6

2022-03-19 06:00:00

1

2022-03-19 07:00:00

2

2022-03-19 08:00:00

8

2022-03-19 09:00:00

4

2022-03-19 10:00:00

9

2022-03-19 11:00:00

1

2022-03-19 12:00:00

8

2022-03-19 13:00:00

2

2022-03-19 14:00:00

5

2022-03-19 15:00:00

2

2022-03-19 16:00:00

6

2022-03-19 17:00:00

9

2022-03-19 18:00:00

6

2022-03-19 19:00:00

2

2022-03-19 20:00:00

1

2022-03-19 21:00:00

8

2022-03-19 22:00:00

1

2022-03-19 23:00:00

2

2022-03-20 00:00:00

6

2022-03-20 01:00:00

6

2022-03-20 02:00:00

10

2022-03-20 03:00:00

9

2022-03-20 04:00:00

6

2022-03-20 05:00:00

7

2022-03-20 06:00:00

8

2022-03-20 07:00:00

10

2022-03-20 08:00:00

1

2022-03-20 09:00:00

3

2022-03-20 10:00:00

1

2022-03-20 11:00:00

3

2022-03-20 12:00:00

2

2022-03-20 13:00:00

10

2022-03-20 14:00:00

9

2022-03-20 15:00:00

5

2022-03-20 16:00:00

2

2022-03-20 17:00:00

4

2022-03-20 18:00:00

10

2022-03-20 19:00:00

7

2022-03-20 20:00:00

6

2022-03-20 21:00:00

10

2022-03-20 22:00:00

4

2022-03-20 23:00:00

7

2022-03-21 00:00:00

7

2022-03-21 01:00:00

9

2022-03-21 02:00:00

8

2022-03-21 03:00:00

6

2022-03-21 04:00:00

2

2022-03-21 05:00:00

6

2022-03-21 06:00:00

10

2022-03-21 07:00:00

3

2022-03-21 08:00:00

2

2022-03-21 09:00:00

1

2022-03-21 10:00:00

7

2022-03-21 11:00:00

2

2022-03-21 12:00:00

9

2022-03-21 13:00:00

1

2022-03-21 14:00:00

7

2022-03-21 15:00:00

2

2022-03-21 16:00:00

2

2022-03-21 17:00:00

10

2022-03-21 18:00:00

5

2022-03-21 19:00:00

5

2022-03-21 20:00:00

4

2022-03-21 21:00:00

6

2022-03-21 22:00:00

4

2022-03-21 23:00:00

1

2022-03-22 00:00:00

5

2022-03-22 01:00:00

10

2022-03-22 02:00:00

6

2022-03-22 03:00:00

9

文心一言提示词

打开百度“文心一言”,输入提示词:“你是pandas专家。文件路径为:D:/Samples/时间序列.xlsx。用pandas导入Excel文件中第1个工作表中的数据,将第1列作为索引列,引擎为”openpyxl”。使用匿名函数给每个测量值加上一个0-1之间不同的随机数。添加代码注释。”

显示结果如下:

首先,确保你已经安装了pandas和openpyxl库,因为openpyxl是用于读取和写入Excel 2010 xlsx/xlsm/xltx/xltm 文件的Python库。如果还没有安装,你可以通过pip安装它们:

pip install pandas openpyxl

接下来,你可以使用以下Python代码来导入Excel文件中的数据,将第1列作为索引列,并使用匿名函数(lambda)给每个测量值加上一个0-1之间不同的随机数:

import pandas as pdimport numpy as np# 文件路径file_path = 'D:/Samples/时间序列.xlsx'# 读取Excel文件,使用openpyxl作为引擎,并将第1列作为索引列# 注意:Excel中的第1列通常是A列,但在pandas中索引从0开始,所以这里指的是'A'列df = pd.read_excel(file_path, sheet_name=0, index_col=0, engine='openpyxl')# 生成一个与数据框(DataFrame)长度相同的0-1之间的随机数数组# 注意:这里我们使用numpy的random.rand函数,它生成[0, 1)之间的随机数random_numbers = np.random.rand(len(df))# 使用applymap(对于整个DataFrame)或apply(对于Series)是不合适的,# 因为我们想要对DataFrame中的每个元素进行操作,而不是整个Series或DataFrame。# 所以我们将直接使用广播功能,即直接将numpy数组与DataFrame相加# 但是,因为DataFrame可能包含不同类型的列(例如,既有整数又有浮点数),# 我们需要确保DataFrame中的所有列都是可以与浮点数相加的数值类型。# 如果不是,我们需要先转换它们。# 假设所有列都是数值类型,我们可以直接相加df_with_random = df.add(random_numbers, axis=0)# 注意:这里我们使用DataFrame的add方法,它将每个随机数与对应行(axis=0)的所有元素相加# 如果DataFrame中有非数值列,你需要先处理它们(例如,将它们设置为NaN或使用fillna()填充它们)# 现在df_with_random包含了带有随机数的数据print(df_with_random)

注意:上面的代码假设df的所有列都是数值类型的,可以直接与浮点数相加。如果DataFrame中有非数值类型的列(如字符串或日期),你需要先对它们进行处理,因为它们不能与浮点数直接相加。

此外,add方法默认会进行广播操作,即将random_numbers这个一维数组扩展为一个与df形状相同的二维数组(实际上并没有创建新的数组,只是进行了广播操作),然后逐元素相加。这样可以确保每个测量值都加上了一个不同的随机数。

Python运行结果

图1.Python运行环境

图2.Python运行结果

本合集使用的工具如下:

文心一言:3.5版本

Python编辑器:3.9.0

申明:以上结果皆为实际运行结果,如遇到无法运行可在评论区留言。部分数据来自网络,如有侵权请私信告知,感谢!

0 阅读:3

李光朱课程

简介:感谢大家的关注