我主要掌握Python、C++、Java三门编程语言,能够根据项目需求选择合适的语言进行开发。
Python方面:熟悉Python基础语法和面向对象编程,能够使用requests、BeautifulSoup等库编写简单的网络爬虫,了解Flask轻量级框架,能够搭建基本的Web应用。熟悉Python操作Excel、Word等办公文档的自动化处理,能够编写实用脚本提升工作效率。
C++方面:掌握C++基础语法、指针、引用和内存管理基础,了解STL标准模板库(如vector、map等容器),能够编写基础的数据结构和算法程序,有控制台小项目的开发经验。
Java方面:熟悉Java基础语法和面向对象思想,了解集合框架和异常处理机制,能够编写简单的Java SE应用。
数据库方面:了解MySQL关系型数据库,掌握基础的SQL增删改查操作,能够使用Python连接MySQL进行数据存取。
工具方面:熟悉使用Git进行代码版本管理,能够使用GitHub托管代码;熟悉VSCode、PyCharm等开发工具;了解Markdown写作,能够编写清晰的文档。
项目名称
FilmMind · 电影嗅觉引擎 —— 基于多维度偏好建模的个性化电影推荐与探索平台
技术栈
数据层:Python(requests + BeautifulSoup + Selenium)爬虫(豆瓣/TMDb),pandas/numpy 数据清洗与特征工程
算法层:基于内容的推荐(TF-IDF + 余弦相似度)+ 简单协同过滤(Pearson相关系数),实现混合推荐
后端:Flask(RESTful API) + MySQL(用户数据、电影特征)
前端:Vue.js + ECharts(数据可视化) + Bootstrap(响应式)
部署:腾讯云轻量服务器 + Nginx + uWSGI + Docker
工具:Git + Jupyter Notebook
创新点
1. 多维偏好建模:不只依赖评分,还融入用户对“导演、演员、类型、年代、国家”的隐性偏好,通过TF-IDF构建电影特征向量,计算语义相似度。
2. 实时数据融合:爬取豆瓣/TMDb最新电影信息及影评摘要,结合情感分析(简单TextBlob)提取影评情感倾向,推荐更“有温度”的电影。
3. 兴趣可视化:用ECharts生成用户偏好雷达图、电影相似度网络图,让推荐结果“看得见”。
4. 冷启动解决方案:新用户可通过“电影基因测试”(选择几部喜欢的电影)快速建立初始偏好模型。
核心功能模块
数据爬虫模块:定时爬取豆瓣/TMDb电影信息(标题、导演、演员、类型、简介、评分、影评),存储至MySQL,每日更新。
偏好建模引擎:用户注册后,可对看过的电影评分,系统自动计算用户特征向量;新用户通过“偏好测试”选择喜欢的电影,系统基于内容推荐生成初始推荐。
混合推荐算法:
基于内容的推荐:计算用户特征向量与电影特征向量的余弦相似度。
协同过滤:寻找相似用户,推荐他们喜欢的电影(Pearson相关系数)。
加权融合,动态调整权重。
智能探索页面:推荐结果按“高匹配度”、“热门新片”、“小众佳作”分类展示,每个电影附带“匹配理由”和影评情感摘要。
兴趣可视化面板:展示你的偏好雷达图(导演、类型、年代分布)、电影词云、推荐电影网络图。
反馈优化:用户对推荐结果点赞/点踩,实时更新模型。