掌握 Python 数据处理、办公自动化、网页数据采集、AI 应用开发和基础机器学习/深度学习项目开发。
熟悉技术:
1. Python 基础开发:脚本编写、文件批处理、自动化工具开发
2. 数据处理:pandas、NumPy、openpyxl、CSV/Excel 数据清洗与统计
3. 文档处理:PDF/Word 内容提取、批量转换、自动生成报告
4. 网页数据采集:requests、BeautifulSoup、Selenium/Playwright,公开网页数据采集与整理
5. 数据可视化:matplotlib、seaborn、pyecharts,图表生成与实验数据可视化
6. AI 应用:Dify、Coze、LangChain/RAG、AI 知识库、文档问答机器人
7. 模型调用:OpenAI API、DeepSeek API、通义千问/Qwen 等大模型接口调用
8. 机器学习:scikit-learn,分类、回归、聚类等基础任务
9. 深度学习:PyTorch,了解 CNN、Transformer、目标检测等常见模型
10. 计算机视觉:OpenCV、YOLO,图片分类、目标检测、结果可视化
11. Web 后端:FastAPI、Flask,接口开发与简单后台服务
12. 简单前端/演示工具:Streamlit、Gradio,快速搭建可交互 demo
13. 数据库:SQLite、MySQL 基础使用
14. 部署工具:Git、Docker 基础,Linux 服务器基础操作
构建过一套电子病历质控数据与规则的分析工作集,由一份病历质控明细数据集和两份相互配套的质控规则表组成。数据集记录了质控人员在病历中发现并标注的问题(涵盖近万份病历文书、上万条质控问题),已完成清洗与字段解码,每份文书可对应一条或多条质控问题。规则表是质控评分所依据的完整条目库(百余条),按"是否在数据中实际出现过"拆分为两部分,并附人工可用性标注。数据集与规则表通过规则编号和病历类别相互关联,可配套使用。项目的核心目标之一,是处理那部分仅有文字描述、尚未映射到现有规则的问题——即从质控自由文本中归类,进而扩充或改写规则库。
本作品为医疗文书质控自研演示项目,面向病历书写规范检查场景。系统支持导入模拟病历文本,对主诉、现病史、诊断、医嘱等内容进行结构化解析,并按照预设规则检查缺项、格式不规范、时间逻辑异常、诊断表述不一致等问题,自动生成质控问题清单和修改建议。我主要负责规则设计、文本处理、结果展示和演
本作品为文档问答知识库自研演示项目,适用于企业资料、课程文档、产品手册和论文资料检索场景。系统支持上传 PDF、Word 等文档,对内容进行切分、向量化和检索,用户输入问题后可自动匹配相关资料并生成回答,同时展示参考来源,减少人工查找文档的时间。我主要负责知识库搭建、文档解析、问
本作品为文档问答知识库自研演示项目,适用于企业资料、课程文档、产品手册和论文资料检索场景。系统支持上传 PDF、Word 等文档,对内容进行切分、向量化和检索,用户输入问题后可自动匹配相关资料并生成回答,同时展示参考来源,减少人工查找文档的时间。我主要负责知识库搭建、文档解析、问