我要复刻max.turnitinplus.com查重网站
我要做一个 Turnitin 的代提交系统。因为官方没有 API,Selenium/Playwright 做浏览器自动化。
核心需求有三点:
多账号负载均衡:我有 20 个 Turnitin 账号。系统必须有一个账号池,实现自动轮询。每个账号每天限制提交 20次(防封号策略),达到上限后自动切换下一个。如果某个账号登录失败(被封),要自动剔除并告警。
全流程无人值守:用户上传文件 -> 系统自动找一个可用账号 -> 模拟登录 -> 提交文件(注意要勾选 No Repository) -> 轮询结果 -> 下载报告(相似度+AI) -> 回传给用户。
文件时效性:报告下载到服务器后,用户凭检测码下载。文件在服务器保留 3天,过期自动删除