55.从文件导入时间序列数据

李光朱课程 2024-05-14 01:57:38
案例导入

如下图所示,将第1列作为索引列,引擎为”openpyxl”。输出导入的数据。添加代码注释。

时间

测量值

2022-03-18 00:00:00

5

2022-03-18 01:00:00

9

2022-03-18 02:00:00

6

2022-03-18 03:00:00

9

2022-03-18 04:00:00

8

2022-03-18 05:00:00

10

2022-03-18 06:00:00

4

2022-03-18 07:00:00

3

2022-03-18 08:00:00

6

2022-03-18 09:00:00

3

2022-03-18 10:00:00

1

2022-03-18 11:00:00

6

2022-03-18 12:00:00

7

2022-03-18 13:00:00

4

2022-03-18 14:00:00

1

2022-03-18 15:00:00

7

2022-03-18 16:00:00

4

2022-03-18 17:00:00

10

2022-03-18 18:00:00

8

2022-03-18 19:00:00

6

2022-03-18 20:00:00

6

2022-03-18 21:00:00

1

2022-03-18 22:00:00

5

2022-03-18 23:00:00

4

2022-03-19 00:00:00

5

2022-03-19 01:00:00

5

2022-03-19 02:00:00

4

2022-03-19 03:00:00

1

2022-03-19 04:00:00

8

2022-03-19 05:00:00

6

2022-03-19 06:00:00

1

2022-03-19 07:00:00

2

2022-03-19 08:00:00

8

2022-03-19 09:00:00

4

2022-03-19 10:00:00

9

2022-03-19 11:00:00

1

2022-03-19 12:00:00

8

2022-03-19 13:00:00

2

2022-03-19 14:00:00

5

2022-03-19 15:00:00

2

2022-03-19 16:00:00

6

2022-03-19 17:00:00

9

2022-03-19 18:00:00

6

2022-03-19 19:00:00

2

2022-03-19 20:00:00

1

2022-03-19 21:00:00

8

2022-03-19 22:00:00

1

2022-03-19 23:00:00

2

2022-03-20 00:00:00

6

2022-03-20 01:00:00

6

2022-03-20 02:00:00

10

2022-03-20 03:00:00

9

2022-03-20 04:00:00

6

2022-03-20 05:00:00

7

2022-03-20 06:00:00

8

2022-03-20 07:00:00

10

2022-03-20 08:00:00

1

2022-03-20 09:00:00

3

2022-03-20 10:00:00

1

2022-03-20 11:00:00

3

2022-03-20 12:00:00

2

2022-03-20 13:00:00

10

2022-03-20 14:00:00

9

2022-03-20 15:00:00

5

2022-03-20 16:00:00

2

2022-03-20 17:00:00

4

2022-03-20 18:00:00

10

2022-03-20 19:00:00

7

2022-03-20 20:00:00

6

2022-03-20 21:00:00

10

2022-03-20 22:00:00

4

2022-03-20 23:00:00

7

2022-03-21 00:00:00

7

2022-03-21 01:00:00

9

2022-03-21 02:00:00

8

2022-03-21 03:00:00

6

2022-03-21 04:00:00

2

2022-03-21 05:00:00

6

2022-03-21 06:00:00

10

2022-03-21 07:00:00

3

2022-03-21 08:00:00

2

2022-03-21 09:00:00

1

2022-03-21 10:00:00

7

2022-03-21 11:00:00

2

2022-03-21 12:00:00

9

2022-03-21 13:00:00

1

2022-03-21 14:00:00

7

2022-03-21 15:00:00

2

2022-03-21 16:00:00

2

2022-03-21 17:00:00

10

2022-03-21 18:00:00

5

2022-03-21 19:00:00

5

2022-03-21 20:00:00

4

2022-03-21 21:00:00

6

2022-03-21 22:00:00

4

2022-03-21 23:00:00

1

2022-03-22 00:00:00

5

2022-03-22 01:00:00

10

2022-03-22 02:00:00

6

2022-03-22 03:00:00

9

文心一言提示词

打开百度“文心一言”,输入提示词:“你是pandas专家,文件路径为:D:/Samples/时间序列.xlsx。该Excel文件的第一个工作表中A-B列为给定数据。用pandas导入Excel文件的数据,将第1列作为索引列,引擎为”openpyxl”。输出导入的数据。添加代码注释。”

显示结果如下:

为了使用pandas来导入Excel文件中的数据,并将第一列作为索引列,我们可以使用pandas.read_excel函数。这里我们使用openpyxl作为引擎,因为它适用于.xlsx文件。以下是完整的代码,包含注释:

import pandas as pd# 定义Excel文件的路径file_path = 'D:/Samples/时间序列.xlsx'# 使用pandas的read_excel函数读取Excel文件# 参数sheet_name指定读取第一个工作表(默认为0或'Sheet1')# 参数index_col指定将哪一列作为索引(这里是第一列,即0)# 参数engine指定使用openpyxl作为读取引擎df = pd.read_excel(file_path, sheet_name=0, index_col=0, engine='openpyxl')# 输出导入的数据print(df)

这段代码将执行以下步骤:

导入pandas库。定义Excel文件的路径。使用pd.read_excel函数读取Excel文件,并指定工作表、索引列和读取引擎。将读取的数据存储在DataFrame df 中。打印DataFrame df 来查看导入的数据。

请注意,如果Excel文件中有多个工作表,并且你想读取的不是第一个工作表,你可以通过修改sheet_name参数的值来指定工作表的名称或索引。同时,请确保你已经安装了openpyxl库,因为pandas需要它来读取.xlsx文件。

Python运行结果

图1.Python运行结果

54. 创建时间序列数据

首发2024-05-08 22:24·李光朱

案例导入

起始日期时间为2022/3/18 00:00:00,每隔一个小时取一个1到10之间的随机数,取100个数。将“时间”列作为索引列,构造一个Series。输出数据,并把数据保存到文件”D:/Samples/时间序列.xlsx“。添加代码注释。

文心一言提示词

打开百度“文心一言”,输入提示词:“你是pandas专家。指定起始日期时间为2022/3/18 00:00:00,每隔一个小时取一个1到10之间的随机数,取100个数。日期时间数据为第1列,列名为“时间”,随机数为第2列,列名为“测量值”,将“时间”列作为索引列,构造一个Series。输出数据,并把数据保存到文件”D:/Samples/时间序列.xlsx“。添加代码注释。”

显示结果如下:

要完成这个任务,我们将使用Python的pandas库来创建数据,并使用numpy库来生成随机数。以下是完成该任务的代码,包括必要的注释:

import pandas as pdimport numpy as npfrom datetime import datetime, timedelta# 起始日期时间start_time = datetime(2022, 3, 18, 0, 0, 0)# 创建一个空的列表来保存时间和测量值times = []measurements = []# 循环100次,每次间隔1小时for i in range(100): # 计算当前时间 current_time = start_time + timedelta(hours=i) # 添加到时间列表 times.append(current_time) # 生成1到10之间的随机整数 measurement = np.random.randint(1, 11) # 添加到测量值列表 measurements.append(measurement)# 使用时间和测量值列表创建一个Series,并将时间作为索引series = pd.Series(measurements, index=pd.DatetimeIndex(times), name='测量值')# 打印Seriesprint(series)# 将Series保存为Excel文件series.to_excel('D:/Samples/时间序列.xlsx')# 注意:确保'D:/Samples/'目录存在,否则保存时会出错

在这个代码中,我们首先定义了起始日期时间start_time,然后创建了两个空列表times和measurements来保存时间和测量值。我们使用一个for循环,每次迭代时,都会更新当前时间并添加到times列表,同时生成一个随机数并添加到measurements列表。

之后,我们使用pd.Series创建一个新的Series对象,其中measurements列表作为数据,times列表转换为pd.DatetimeIndex作为索引,并指定列名为'测量值'。

最后,我们使用to_excel方法将Series保存为一个Excel文件。注意,你需要确保指定的路径D:/Samples/存在,否则代码会抛出错误。如果路径不存在,你可能需要创建该目录,或者选择一个已经存在的目录来保存文件。

Python运行结果

图1.Python运行结果

测量值

2022-03-18 00:00:00

4

2022-03-18 01:00:00

3

2022-03-18 02:00:00

2

2022-03-18 03:00:00

6

2022-03-18 04:00:00

2

2022-03-18 05:00:00

9

2022-03-18 06:00:00

4

2022-03-18 07:00:00

7

2022-03-18 08:00:00

3

2022-03-18 09:00:00

1

2022-03-18 10:00:00

5

2022-03-18 11:00:00

8

2022-03-18 12:00:00

4

2022-03-18 13:00:00

7

2022-03-18 14:00:00

9

2022-03-18 15:00:00

10

2022-03-18 16:00:00

2

2022-03-18 17:00:00

8

2022-03-18 18:00:00

7

2022-03-18 19:00:00

9

2022-03-18 20:00:00

2

2022-03-18 21:00:00

8

2022-03-18 22:00:00

2

2022-03-18 23:00:00

10

2022-03-19 00:00:00

6

2022-03-19 01:00:00

3

2022-03-19 02:00:00

3

2022-03-19 03:00:00

5

2022-03-19 04:00:00

3

2022-03-19 05:00:00

10

2022-03-19 06:00:00

2

2022-03-19 07:00:00

2

2022-03-19 08:00:00

3

2022-03-19 09:00:00

2

2022-03-19 10:00:00

10

2022-03-19 11:00:00

7

2022-03-19 12:00:00

10

2022-03-19 13:00:00

4

2022-03-19 14:00:00

8

2022-03-19 15:00:00

5

2022-03-19 16:00:00

6

2022-03-19 17:00:00

9

2022-03-19 18:00:00

7

2022-03-19 19:00:00

10

2022-03-19 20:00:00

6

2022-03-19 21:00:00

9

2022-03-19 22:00:00

10

2022-03-19 23:00:00

1

2022-03-20 00:00:00

1

2022-03-20 01:00:00

7

2022-03-20 02:00:00

3

2022-03-20 03:00:00

9

2022-03-20 04:00:00

9

2022-03-20 05:00:00

4

2022-03-20 06:00:00

3

2022-03-20 07:00:00

10

2022-03-20 08:00:00

3

2022-03-20 09:00:00

6

2022-03-20 10:00:00

2

2022-03-20 11:00:00

2

2022-03-20 12:00:00

6

2022-03-20 13:00:00

5

2022-03-20 14:00:00

9

2022-03-20 15:00:00

4

2022-03-20 16:00:00

7

2022-03-20 17:00:00

8

2022-03-20 18:00:00

4

2022-03-20 19:00:00

8

2022-03-20 20:00:00

4

2022-03-20 21:00:00

8

2022-03-20 22:00:00

7

2022-03-20 23:00:00

10

2022-03-21 00:00:00

2

2022-03-21 01:00:00

10

2022-03-21 02:00:00

9

2022-03-21 03:00:00

10

2022-03-21 04:00:00

6

2022-03-21 05:00:00

4

2022-03-21 06:00:00

6

2022-03-21 07:00:00

2

2022-03-21 08:00:00

9

2022-03-21 09:00:00

1

2022-03-21 10:00:00

4

2022-03-21 11:00:00

2

2022-03-21 12:00:00

9

2022-03-21 13:00:00

3

2022-03-21 14:00:00

3

2022-03-21 15:00:00

4

2022-03-21 16:00:00

8

2022-03-21 17:00:00

3

2022-03-21 18:00:00

3

2022-03-21 19:00:00

2

2022-03-21 20:00:00

7

2022-03-21 21:00:00

9

2022-03-21 22:00:00

2

2022-03-21 23:00:00

9

2022-03-22 00:00:00

1

2022-03-22 01:00:00

1

2022-03-22 02:00:00

2

2022-03-22 03:00:00

2

本合集使用的工具如下:

文心一言:3.5版本

Python编辑器:3.9.0

申明:以上结果皆为实际运行结果,如遇到无法运行可在评论区留言。部分数据来自网络,如有侵权请私信告知,感谢!

0 阅读:1

李光朱课程

简介:感谢大家的关注