项目描述:
该项目是一个基于 Python 的网络爬虫系统,旨在自动抓取主要房地产网站(如安居客、链家)的房源信息,包括小区名、地址、户型、总价、单价、发布时间等信息,并将数据存储至数据库中以供后续分析与可视化展示,辅助用户快速了解区域房价走势与趋势。
功能结构:
• ✅ 城市选择与区域定位爬虫入口
• ✅ 房源详情批量采集与更新调度
• ✅ 异常URL识别与补采
• ✅ 房源信息多字段清洗标准化
• ✅ 数据入库(MySQL / MongoDB双写)
• ✅ 热力图、区域均价对比图展示
• ✅ 历史记录趋势图分析