智能联想文件检索工具
项目描述:以 c++为主语言,运行在 Linux 环境支持并发查询的服务器程序。根据客户端查询词,主动联想推荐相
关词,并搜索相关文件的检索工具。
技术概述:1、基于 Reactor+线程池模型,采用 epoll I/O 多路复用技术。将 I/O 操作与任务处理分离,实现并发
的高性能检索系统;
2、使用 cppjieba 库和 Simhash 算法对设计手册,技术规范等文件进行去重、分割、过滤停用词等处
理,生成相应的中间库文件;
3、根据用户输入的关键词,利用最小编辑距离算法等其他规则对比中间库文件,实现关键词联想功能;
4、设计 LRU 缓存存储查询热词,每个线程分配专属缓存并定时更新同步和持久化。
5、客户端与服务端采用 Json 格式收发数据,日志采用第三方开源库。