基于Bi-LSTM的海量文本情感分类实

基本信息

案例ID:240188

技术顾问:    - 1年经验 - 邮电大学

联系沟通

微信扫码,建群沟通

项目名称:基于Bi-LSTM的海量文本情感分类实

所属行业:人工智能 - 其他

->查看更多案例

案例介绍

 基于 PyTorch 的 Bi-LSTM + Attention 作为基线模型(Baseline)。实现了中文字符级词表构建、序列截断与填充等数据预处理链路,验证了时序模型与注意力机制在中文情感分类上的有效性。
 引入 bert-base-chinese 预训练模型进行全量数据(逾 21 万条)的下游任务微调。针对原始数据集正负样本极度不平衡的痛点优化了评估策略,最终在测试集上取得了 89.36% 的准确率(Accuracy)和 77.08% 的宏平均 F1-Score,精准识别出长尾的负面及中立评价。
 独立打通了从数据清洗(Pandas)、批次化处理(DataLoader)、训练评估到模型本地化保存的完整 NLP 流水线。并以此为基础封装了轻量级的交互式推理脚本,实现了从任意相关文本输入到情感标签及置信度输出的实时预测。

相似案例推荐

其他人才的相似案例推荐

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服