**CSV分析桌面工具:精简概览**
**核心目标**:一款桌面应用,旨在从CSV文件中提取属性类型元数据,并将其高效存入Neo4j图数据库,为后续知识图谱构建打下基础。
**系统架构**:
1. **Electron应用**: 提供GUI界面,用户配置CSV目录、关键列名(如“实体”、“属性”、“值”)及操作模式(“本地”或“API”)。主进程协调操作,调用Python脚本,并与API服务器(若启用)通信。
2. **Python脚本**: 数据处理核心。读取CSV,根据用户指定的“关系列”提取其下一列的原始数据作为属性,进行清洗(去空格、HTML反转义等),生成唯一的属性类型列表(存为JSON)。根据模式,将这些类型作为`:RelationTypeMaster`节点直写Neo4j(本地模式)或通过API发送给服务器(API模式)。
3. **Node.js Express服务器 (API模式)**: 提供API,关键接口包括 `/api/store-relation-types`(接收并批量写入属性类型到Neo4j)和任务管理/轮询接口。
**业务与功能**:用户通过界面指定数据源和列。工具从CSV中提取、清洗并存储唯一的属性类型到Neo4j,目前已实现此核心元数据流程。支持中文列名,能处理一定规模的数据。
**成果**:已成功打通从CSV到Neo4j的属性元数据导入,解决了编码、超时及服务器错误等问题,并可打包为桌面程序。