本项目针对某强风控网站(采用Imperva Reese84反爬体系),开发高效数据采集系统,实现核心业务数据的规模化抓取。Reese84以复杂的设备指纹采集与动态Token生成著称,传统自动化工具或普通请求均被拦截。
我在本项目中负责核心风控对抗与协议还原,主要工作包括:
Reese84指纹与Token逆向:深入分析Reese84混淆JS源码,理清其Canvas、WebGL、音频等几十项设备指纹采集逻辑;通过AST解混淆与动态调试,定位核心加密入口。
补环境与算法复现:采用Node.js补环境技术,完美模拟浏览器运行时环境(BOM/DOM),抹除Node特征,成功生成合法有效的Reese84 Token。
纯协议高效采集:将生成Token的逻辑集成至Python请求层,彻底摒弃笨重的浏览器,实现轻量化、高并发采集,并配合代理IP池规避IP封禁。