这是我独立全程完成的一个医疗与健康领域文本主题建模和分析的项目: 本人所在行业是医疗与健康行业,所以大部分的项目都是和医疗相关。数据是近30年来的医疗与卫生年报,文件都是OCR的PDF文件,每个文件比较大,有的多达1000页,少的也有200页。 目标对这些年报进行主题建模和分析。 目。 1. 转换PDF,word到txt文件 2. 对数据进行预处理(停用词,Abbreviation extraction, Lemmatization,Phrasing 等等) 3. 对这些文本使用LDA模型进行主题建模 4. 计算perplexity值选择最优的主题数目...
项目介绍:医鼎-是北京欧应科技有限公司开发运营的一款专用于住院骨科医师学习交流的平台。专为各亚专业住院医师提供海量学习资源和线上交流平台,通过线上学习交流和线下技能训练相结合,更快的提升住院医师的临床能力。 个人职责:1、 参与医鼎1.0版本的开发,使用OC编写,后期使用Swift复写 2、 负责医鼎首页模块的开发 ,主体采用ScrollView嵌套CollectionView实现页面布局,以及后期的优化 3、 负责用户权限的开发及更新4、 负责用户登录、注册模块的开发 5、 网络层及系统控件的自定义封装 6、 工具类、网络单例、 用户信息单例类代码的编写 7、 手势密码绘制、验证、修改功能...