近年来,随着兰州城市发展的不断加速和居民生活水平的提高,二手房市场逐渐成为楼市的重要组成部分。无论是刚需购房者还是投资客,都在这片热土上寻找着属于自己的那份安宁与增值空间。
那么,兰州市各地区的二手房市场表现如何?哪些区域是热门之选?哪些区域蕴藏着潜力?让我们一同揭开这些谜团,以下是本次的案例数据,作者将根据此数据进行分析,相信会解答你的疑惑。
以上二手房数据是作者爬取的链家二手房实时数据,关于数据爬取内容可参考我前面的文章Python爬虫实战,链家二手房数据轻松抓取!,通过爬虫可爬取相应数据,首先导入二手房数据。
import pandas as pd #读取二手房数据文件file_path = r'C:\Users\Desktop\data\二手房数据.xlsx'df = pd.read_excel(file_path)显示数据的前几行以了解其结构。
df.head()处理'房屋单价'字段,将不可计算的字符型数据转化为数值型数据。
# 删除字段中的文字,保留其数字,并转换成数字类型df['房屋单价(元/平方米)'] = df['房屋单价'].str.replace(',', '').str.split('元/平').str[0].astype(int) df.head()根据'地区板块'分组,统计每个分组中'房屋单价(元/平方米)'的平均值作为平均单价,以及统计每个分组中的数据条目数作为房源数量。
district_stats = df.groupby('地区板块').agg({'房屋单价(元/平方米)': 'mean', '房屋单价': 'size'}).reset_index()district_stats.columns = ['地区板块', '平均单价', '房源数量']district_stats# 取房源数量前20位top_20_districts = district_stats.nlargest(20, '房源数量') top_20_districts各地区二手房房源数概览详细介绍城关区、七里河区、安宁区、西固区等主要区域的二手房房源数量,使用Python绘制各个地区的房源数量柱状图,对比各区域之间房源数量变化的差异。
import seaborn as snsimport matplotlib.pyplot as plt # 导入 matplotlib.pyplot 用于绘图 plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签plt.rcParams['axes.unicode_minus']=False #用来正常显示负号 # 准备数据districts = top_20_districts['地区板块'].tolist()house_counts = top_20_districts['房源数量'].tolist()avg_prices = top_20_districts['平均单价'].tolist() # 创建柱状图plt.figure(figsize=(9, 6))sns.barplot(x=districts, y=house_counts, palette="viridis")plt.title("房源数量柱状图")plt.xlabel("地区")plt.ylabel("房源数量")plt.xticks(rotation=45)plt.show()由图可以看出,火车站的房源数最多,玉门街的房源数最少,在市区中心地带的房源数较多,而偏远的市区地带房源相对比较少。
各地区二手房平均单价分析展示各区域二手房的平均单价,使用Python绘制各个地区的平均单价折线图,重点关注高价区域与低价区域的分布特点。
import seaborn as snsimport matplotlib.pyplot as plt # 导入 matplotlib.pyplot 用于绘图 plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签plt.rcParams['axes.unicode_minus']=False #用来正常显示负号 # 创建折线图plt.figure(figsize=(9, 6))sns.lineplot(x=districts, y=avg_prices, marker='o', color='r')plt.title("平均单价折线图")plt.xlabel("地区")plt.ylabel("平均单价")plt.xticks(rotation=45) # 显示图表plt.show()由图可以看出,广武门的平均单价最高,兰州新区的平均单价最低,各个地区之间的平均单价存在很大的差距。
二手房平均单价与房源数的关系最后使用Python绘制各个地区平均单价与房源数量的热力图,通过图表和数据,直观展示二手房平均单价与房源数之间的关联。
# 绘制热力图 import seaborn as snsimport matplotlib.pyplot as plt # 导入 matplotlib.pyplot 用于绘图 plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签plt.rcParams['axes.unicode_minus']=False #用来正常显示 # 设置主题为darkgrid sns.set_style("darkgrid")# 解决Seaborn中文显示问题并调整字体大小sns.set(font='SimHei',font_scale=0.9) plt.figure(figsize=(9, 6))# 将平均单价保留两位小数 top_20_districts['平均单价'] = top_20_districts['平均单价'].round(2) grouped_df = top_20_districts.pivot_table(index='平均单价', columns='地区板块', values='房源数量', aggfunc='sum') sns.heatmap(grouped_df,cmap='inferno') # 或其他合适的颜色映射 plt.title("二手房数据热力图")plt.xticks(rotation=45) # 显示图表plt.show()由图可以看出,兰州新区的平均单价最低,但是房源数量较多,而广武门的平均单价最高,但是房源数量较低,每一个地区板块均呈现不同的特征。
通过对兰州市二手房市场的深入剖析,我们不难发现,各地区的房源数与平均单价之间存在着复杂而微妙的关系。在这个充满机遇与挑战的市场中,购房者需要更加理性地分析数据、把握趋势,才能找到最适合自己的那一方天地。
前蚂蚁金服数据运营,现京东经营分析,公众号、知乎、头条「大话数据分析」主理人,专注于数据分析的实践与分享,掌握Python、SQL、PowerBI、Excel等数据分析工具,擅长运用技术解决企业实际问题。