Community Environment Optimization Model
Based on "Residents' Emotional Value – Residential Land Efficiency"
当前我国城市发展由增量扩张转向存量挖潜,老旧小区改造、居民幸福感提升成为城市规划的核心议题。
中国主要城市驱动城市规划下一个30年的主要动力,将会是旧城更新、再开发、重新利用和工业等存量用地改造,上海、北京等大城市正加快存量用地盘活步伐。
老旧小区由于设计年限存在诸多安全隐患,设计理念跟不上时代。上海政府提出以小区、街区、社区为更新单元,统筹做好区域规划、空间优化、功能转化。
城市化发展导致内部发展不平衡、人口密度增加、房价增高等问题。北京、上海等大城市幸福感低于拉萨、合肥等城市,居民"美好生活"期待尚待满足。
习近平总书记在党的二十大报告中指出"不断实现人民对美好生活的向往",要求城市规划将居民幸福感作为核心评价标准,全面提升居住条件与精神文化生活。
提出基于多源数据支持的住宅用地效率与居民幸福感评价体系,深入研究二者相关性,推动住宅用地渐进式优化。
解决已有评价体系指标散乱、针对性弱的问题,构建社会、经济、生态三维指标体系
解决传统情绪测度方式粗放、可研究范围小的难题,采用海量社交媒体文本数据
运用先进机器学习模型,深入分析住宅用地效率指标对居民幸福感的影响机制
利用模型算法,基于幸福感视角为住宅用地改造优先级提供依据,实现人本主义规划
选取上海市作为主要研究城市,北京市作为对比验证,覆盖超大城市核心住区场景。
整合地理空间数据、社交媒体数据、环境监测数据等多类型数据,构建全面的分析基础。
来源:百度 API
采集:2023年6月
用途:底图与空间分析
来源:高德 API
采集:2023年
用途:设施可达性计算
来源:地理空间数据云
采集:2022年8月
用途:空间分析辅助
来源:手机运营商
精度:Geohash 7位(154m×154m)
用途:邻里活力度测算
来源:中央气象台
采集:2023.01–10
用途:PM2.5、SO₂评估
来源:weibo.com
采集:2021–2023年
用途:居民情绪分析
来源:douyin.com
采集:2021–2023年
用途:居民情绪分析
来源:房地产平台
指标:房价、容积率、建成年代
用途:经济效益评价
从指标构建到机器学习解释,形成完整的"数据—评价—分析—解释"方法链。
基于文献研究、区域特点及《社区生活圈规划技术指南》《城市居住区规划设计标准》等国家规范,筛选并细化17个效率评价指标,涵盖社会、经济、生态三大效益维度。
对多类型数据进行空间预处理后,运用熵权法客观确定各指标权重,再通过 TOPSIS 优劣解距离法计算每个住区与理想解的相对贴近度,得出住区综合效率得分,并采用自然断点法分组。
爬取微博、抖音签到文本,使用百度 PaddlePaddleNLP 深度学习平台进行情感倾向分类,获得每条文本的正向概率与负向概率,最终以"文本得分 = 正向得分 − 负向得分"汇总计算住区幸福感均值。
以住宅用地效率指标为特征、幸福感得分为目标,训练 XGBoost 梯度提升树模型,评估 MAE、RMSE 和 R² 指标,按高/低效率住区分段训练,深入探究效率对幸福感的非线性影响。
引入 TreeSHAP(基于博弈论的 SHAP 变体)对 XGBoost 模型进行解释,通过 SHAP 绝对均值排序识别重要指标,通过 SHAP 分布图观察各指标的正负向影响,通过瀑布图(Waterfall Plot)解释单一样本的预测路径。
从社会、经济、生态三大效益维度构建 17 个要素层指标,覆盖建成环境、服务设施、经济价值与生态质量。
| 代码 | 指标名称 | 数据来源 | 计算方法 |
|---|---|---|---|
| A1 | 建成年代 | 房地产网站 | 建成年份 |
| A2 | 人均建筑面积 | 房地产网站 | 总建筑面积 / 总户数 × 平均人数 |
| A3 | 邻里活力度 | 手机信令数据 | 工作日内累计手机用户总数,反映内部人流活动强度 |
| A4 | 交通场站可达性 | OSM 路网 + POI | 地铁站 1000m 覆盖 + 公交站 1000m 覆盖(二值加和) |
| A5 | 公园广场可达性 | POI 数据 | ArcGIS 服务区分析,1000m 覆盖范围 |
| A6 | 教育设施可达性 | POI 数据 | 幼儿园 500m + 小学 1000m + 初中 1500m(三值加和) |
| A7 | 医疗设施可达性 | POI 数据 | 诊所 500m + 专科医院 1000m + 综合医院 1500m |
| A8 | 养老设施可达性 | POI 数据 | 养老院 1500m 覆盖范围 |
| A9 | 购物设施可达性 | POI 数据 | 商场 / 菜市场 / 生鲜超市 1000m 覆盖 |
| A10 | 文化设施可达性 | POI 数据 | 文化设施 1500m 覆盖 |
| A11 | 餐饮设施可达性 | POI 数据 | 生活服务设施 1000m 覆盖 |
| 代码 | 指标名称 | 数据来源 | 计算方法 |
|---|---|---|---|
| B1 | 容积率 | 房地产网站 | 总建筑面积 / 总用地面积 |
| B2 | 房价 | 房地产平台 | 当前房价(元/m²) |
| B3 | 物业费 | 房地产平台 | 当前物业费(元/m²/月) |
| B4 | 房屋闲置率 | 房地产平台 | 在售房屋数量 / 房屋总数量 |
| 代码 | 指标名称 | 数据来源 | 计算方法 |
|---|---|---|---|
| C1 | 绿化覆盖率 | 绿地 SHP 数据 | 内部绿地面积 / 用地总面积 |
| C2 | 空气污染度 | 环境监测站数据 | ArcGIS 泰森多边形分析,计算最近监测站的空气污染评分 |
从住宅用地效率空间分布、居民幸福感分布到二者相关性机器学习分析,全面呈现研究发现。
建成年代以 1992–2008 年为主,西侧小区整体较新;人均建筑面积整体偏低,东部和北部相对充裕;活力度偏低的小区占多数,距中心越远活力度相对越高。
交通场站可达性自市中心向外围递减;教育、医疗设施基本符合"中心高、四周低"规律,东南侧存在低值集聚;养老设施可达性整体较好,高值集中在西侧和南侧。
中心区容积率大,向四周递减;房价呈明显梯度,自中心向外递减;西部和南部房屋闲置率高;市中心和交通便利地段闲置率较低。
绿化率东侧优于西侧,高值主要分布在东南方,中心区及西侧绿化率较低;空气污染东侧低于西侧,中心商业区和交通繁忙区域污染度较高。
基于熵权 TOPSIS 法耦合17个指标,以自然断点法分组,住区效率分布较为均匀,高效率住区分布在西侧多于东侧,低效率住区在中部偏北、偏西部较为集中。
幸福感评价得分区间较为集中,整体差异不大。
核心城区幸福感普遍较低,离核心区越远,住区幸福感逐步升高,高值零散分布在核心区外围。
幸福感与空间距离核心区的远近呈现明显的梯度规律,内城高密度、高压力环境对居民情绪有负面影响,郊区环境相对宜居。
上海数据 p 值 = 0.8 > 0.05,效率得分与幸福感相关性不显著,相关系数极低。推测数据关系较为复杂,需引入机器学习模型进一步探究。
基于 TreeSHAP 模型对上海高效率住区居民幸福感影响因素的解析
重要指标(TOP 5):绿化覆盖率、房价、容积率、邻里活力度、人均建筑面积
绿化覆盖率:与幸福感正相关,高绿化带来更多开放空间,推动邻里关系和谐密切
房价:高效住区中房价越高,居民情绪价值升高;体现居民愿以金钱置换幸福感
容积率:与幸福感正相关,容积率越高,幸福感越高
邻里活力度:正相关,活力度增加提升居民归属感和安全感
人均建筑面积:负相关,人均建筑面积越大,幸福感反而越低
建成年代:负相关,建成时间越久,设施老化,幸福感越低
房屋闲置率:负相关,闲置率越高代表社区资源浪费与邻里关系疏远
基于 TreeSHAP 模型对上海低效率住区居民幸福感影响因素的解析
重要指标(TOP 5):建成年代、人均建筑面积、房价、物业费、房屋闲置率
建成年代:负相关,建成时间旧带来设施老化等问题,降低居民幸福感
房屋闲置率:负相关,闲置率提高意味着邻里联系越不紧密,孤独感影响幸福感
物业费:正相关,合理物业费带来有保障的服务与管理
房价:正相关,合理房价水平是居民幸福感的重要保障
人均建筑面积:正相关,在低效住区中,适当的居住空间有助于提升幸福感
住区建设不需要一味追求价格上的优胜,合理的房价、物业费带来有保障的服务与管理才是居民幸福感的重要保障。
高效住区集中分布在中环外环周边,呈圈状集中分布。特点:房价较低,但周边医疗、交通设施完善,公园广场等开放空间丰富。
二环三环之间小区幸福感最高,西北侧表现尤为显著。西南侧四环与五环之间有明显幸福感集中偏低区域(推测因城中村分布密集)。
北京数据 p = 0.03 < 0.05,住区效率与幸福感相关性显著,相关系数 r = 0.074,显示具有统计学意义的正相关。
邻里活力度、房价、建成年代、医疗设施可达性、房屋空置率为影响最大的5项指标。
特殊发现:邻里活力度与幸福感呈负相关——北京低效住区居民更倾向安静私密环境。
高效住区中,邻里活力度对预测影响程度最高,且与幸福感呈负相关。推测原因:特大城市社会原子化较为严重,居民更倾向于较为安静私密的场所,过高的邻里活力度可能干扰正常生活。规划建议:注重动静分区和公共性与私密性的划分。
按研究逻辑顺序展示各项效益指标、综合效率与居民幸福感的 GIS 空间分布,上海为主研究城市,北京为对比验证城市。
建成年代以 1992–2008 年为主,西侧更新,南北侧边缘久远;人均建筑面积整体偏低;活力度偏低小区占多数,离中心越远活力度相对越高
中心区域设施更加齐全;交通场站可达性自市中心向外递减;教育、医疗基本符合中心高四周低规律,东南侧低值集聚






中心区容积率大,向四周递减;房价呈明显梯度;西部和南部闲置率高;市中心和交通便利地段闲置率较低




绿化率东侧优于西侧,高值主要在东南方;空气污染整体东侧低于西侧,中心商业区和交通繁忙区域污染较高


基于 17 个指标耦合计算,自然断点法分组。高效率住区分布在西侧多于东侧;低效率住区在中部偏北、偏西集中
百度 NLP 情感分析结合 GIS 空间插值。核心区域幸福感普遍较低;离核心区越远,住区幸福感逐步升高
交通场站可达性自市中心向外围递减,以四环为分水岭;教育、医疗基本符合中心高规律;养老设施可达性整体较好








南部容积率高,西北闲置率高,房价自中心向外递减;绿化率北侧优于南侧








高效住区呈圈状集中分布在中环外环周边,具有房价较低、医疗交通设施完善、公园广场等开放空间丰富的特点
二环和三环之间幸福感最高,西北侧尤为显著;西南侧四环与五环之间出现明显低值集聚区域(城中村密集带)
XGBoost 模型在北京市数据集上表现出更佳的拟合效果,模型收敛验证了研究方法的有效性。
在评价指标、情绪测度方法和相关性分析方法三个维度实现创新突破,具有广泛的实践应用价值。
针对北京市人口流动频繁、居民更关注各类公共服务配套设施的特点定制指标体系,引入手机信令、环境监测站数据等高精度新型大数据进行测度,相比传统研究更具针对性。
采用可覆盖范围广的海量网络社交文本数据(微博 + 抖音),突破传统问卷调查样本量小、覆盖范围有限的瓶颈,并使用对中文文本语义分析支持良好的百度 PaddlePaddleNLP 模型进行情感判别。
摒弃简单的多元线性回归,采用能有效处理中低维数据和回归问题且准确度更高的 XGBoost 模型,并引入 TreeSHAP 模型对其进行可解释性分析,使研究结论更具说服力。
用于计划新建住区的选址评估,观测各住区建成后可能给居民带来的幸福感影响,从而选取最佳区位
评估已有住区的幸福感情况,从人本主义视角划分老旧住区更新的优先程度,推动渐进式更新
明确目标城市住区更新时应重点关注的环境或社会要素,打造更具针对性的更新策略
明确目标城市新建住区时最需关注的社会或环境要素,为居住区规划设计提供数据驱动的方向