链家二手房数据分析,以兰州市为例,从数据角度探析市场情况!

数据我来大话侃 2024-08-14 19:36:49

近年来,随着兰州城市发展的不断加速和居民生活水平的提高,二手房市场逐渐成为楼市的重要组成部分。无论是刚需购房者还是投资客,都在这片热土上寻找着属于自己的那份安宁与增值空间。

那么,兰州市各地区的二手房市场表现如何?哪些区域是热门之选?哪些区域蕴藏着潜力?让我们一同揭开这些谜团,以下是本次的案例数据,作者将根据此数据进行分析,相信会解答你的疑惑。

以上二手房数据是作者爬取的链家二手房实时数据,关于数据爬取内容可参考我前面的文章Python爬虫实战,链家二手房数据轻松抓取!,通过爬虫可爬取相应数据,首先导入二手房数据。

import pandas as pd #读取二手房数据文件file_path = r'C:\Users\Desktop\data\二手房数据.xlsx'df = pd.read_excel(file_path)

显示数据的前几行以了解其结构。

df.head()

处理'房屋单价'字段,将不可计算的字符型数据转化为数值型数据。

# 删除字段中的文字,保留其数字,并转换成数字类型df['房屋单价(元/平方米)'] = df['房屋单价'].str.replace(',', '').str.split('元/平').str[0].astype(int) df.head()

根据'地区板块'分组,统计每个分组中'房屋单价(元/平方米)'的平均值作为平均单价,以及统计每个分组中的数据条目数作为房源数量。

district_stats = df.groupby('地区板块').agg({'房屋单价(元/平方米)': 'mean', '房屋单价': 'size'}).reset_index()district_stats.columns = ['地区板块', '平均单价', '房源数量']district_stats

# 取房源数量前20位top_20_districts = district_stats.nlargest(20, '房源数量') top_20_districts

各地区二手房房源数概览

详细介绍城关区、七里河区、安宁区、西固区等主要区域的二手房房源数量,使用Python绘制各个地区的房源数量柱状图,对比各区域之间房源数量变化的差异。

import seaborn as snsimport matplotlib.pyplot as plt # 导入 matplotlib.pyplot 用于绘图 plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签plt.rcParams['axes.unicode_minus']=False #用来正常显示负号 # 准备数据districts = top_20_districts['地区板块'].tolist()house_counts = top_20_districts['房源数量'].tolist()avg_prices = top_20_districts['平均单价'].tolist() # 创建柱状图plt.figure(figsize=(9, 6))sns.barplot(x=districts, y=house_counts, palette="viridis")plt.title("房源数量柱状图")plt.xlabel("地区")plt.ylabel("房源数量")plt.xticks(rotation=45)plt.show()

由图可以看出,火车站的房源数最多,玉门街的房源数最少,在市区中心地带的房源数较多,而偏远的市区地带房源相对比较少。

各地区二手房平均单价分析

展示各区域二手房的平均单价,使用Python绘制各个地区的平均单价折线图,重点关注高价区域与低价区域的分布特点。

import seaborn as snsimport matplotlib.pyplot as plt # 导入 matplotlib.pyplot 用于绘图 plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签plt.rcParams['axes.unicode_minus']=False #用来正常显示负号 # 创建折线图plt.figure(figsize=(9, 6))sns.lineplot(x=districts, y=avg_prices, marker='o', color='r')plt.title("平均单价折线图")plt.xlabel("地区")plt.ylabel("平均单价")plt.xticks(rotation=45) # 显示图表plt.show()

由图可以看出,广武门的平均单价最高,兰州新区的平均单价最低,各个地区之间的平均单价存在很大的差距。

二手房平均单价与房源数的关系

最后使用Python绘制各个地区平均单价与房源数量的热力图,通过图表和数据,直观展示二手房平均单价与房源数之间的关联。

# 绘制热力图 import seaborn as snsimport matplotlib.pyplot as plt # 导入 matplotlib.pyplot 用于绘图 plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签plt.rcParams['axes.unicode_minus']=False #用来正常显示 # 设置主题为darkgrid sns.set_style("darkgrid")# 解决Seaborn中文显示问题并调整字体大小sns.set(font='SimHei',font_scale=0.9) plt.figure(figsize=(9, 6))# 将平均单价保留两位小数 top_20_districts['平均单价'] = top_20_districts['平均单价'].round(2) grouped_df = top_20_districts.pivot_table(index='平均单价', columns='地区板块', values='房源数量', aggfunc='sum') sns.heatmap(grouped_df,cmap='inferno') # 或其他合适的颜色映射 plt.title("二手房数据热力图")plt.xticks(rotation=45) # 显示图表plt.show()

由图可以看出,兰州新区的平均单价最低,但是房源数量较多,而广武门的平均单价最高,但是房源数量较低,每一个地区板块均呈现不同的特征。

通过对兰州市二手房市场的深入剖析,我们不难发现,各地区的房源数与平均单价之间存在着复杂而微妙的关系。在这个充满机遇与挑战的市场中,购房者需要更加理性地分析数据、把握趋势,才能找到最适合自己的那一方天地。

前蚂蚁金服数据运营,现京东经营分析,公众号、知乎、头条「大话数据分析」主理人,专注于数据分析的实践与分享,掌握Python、SQL、PowerBI、Excel等数据分析工具,擅长运用技术解决企业实际问题。

0 阅读:10