毕业于北京大学,曾任中型公司和百亿上市公司高级专家或部门总经理职位,深圳市分析测试协会农产品委员会委员,MDPI中国学者,发表过ICPR等一系列EI检索的顶级机器学习会议论文,以及一系列JCR二区的SCI论文,申请发明专利近40项,授权近20项。参与过深圳市科技计划基础研究,广东省关键核心技术攻关和基础研究, 参与过深圳市人工智能产业发展白皮书政策制定。是多个EI或SCI检索会议和期刊的审稿人,例如ICIVC,IET Signal Processing等。
部分论文期刊发表情况(全部为第一作者):
Xiaohu Zhang,Yuexian Zou,Wenwu Wang,"LD-CNN: A Lightweight Dilated Convolutional Neural Network for Environmental Sound Classification"(ICPR2018)(EI,深圳市科技计划基础研究项目 No:JCYJ20170306165153653 & 深圳市科技计划基础研究项目JCYJ20170817160058246)
Xiaohu Zhang,Yuexian Zou,"DCH-Net: Densely Connected Highway Convolution Neural Network for Environmental Sound Classification" (DSP2018), (EI,深圳市科技计划基础研究项目 No:JCYJ20170817160058246 & JCYJ20170306165153653)
Xiaohu Zhang, Yuexian Zou and Wei Shi,Dilated Convolution Neural Network with LeakyReLU for Sound Event Classification,22nd International Conference on Digital Signal Processing (DSP2017),August 23-25, 2017, London, United Kingdom (EI)
Xiaohu Zhang; Haifeng Huang. "PSNet: P
公司名称:深圳市宏电技术股份有限公司(估值20亿,准IPO企业)
职位:AI部门总经理,股权激励技术骨干
规划公司整体AI架构,设计出基于瑞芯微和Intel架构的宏电AI边缘计算产品线,带领团队推出AI边 缘计算硬件产品Smart-2000人工智能监控边站,车载辅助驾驶平台的硬件平台,Intel人工智能监控边站。带领团队研发基于瑞芯微平台的入侵检测系统,工地安全监控系统,疲劳驾驶系统,冰柜违规物品 识别系统. 规划和申请发明专利,完成知识产权的保护,获得过宏电股份年度优秀员工一次。
具体工作包括如下:
1.Smart-2000人工智能监控边站:指导完成Smart-2000的整体硬件设计思路,提出采用 RK3399+1808的主CPU+协处理器的方式作为边缘计算的主要硬件架构,推出了可扩展算力从3T-6T 的方案。我带领团队设计的基于容器的轻量化框架可以灵活配置1-6路摄像头,1-6种人工智能算法。
2.车载辅助驾驶平台的硬件平台:指导团队完成基于RV1126的车载辅助驾驶平台,基于该平台设计 了DSM疲劳驾驶系统和ADAS车道线变道检测系统。我针对该平台CPU性能不足的问题,采用CPU并行计算方案,使得DSM和ADAS可以以8帧的速度运行。另外设计了后处理延时报警模块,使得DSM 和ADAS的误报率大幅度降低,目前已通过国标测试。
3.Intel人工智能监控边站:指导团队开发Intel人工智能监控边站,我在Intel官方方案(tiny Yolo v3 支持30路)基础上提出自主创新的基于权重共享的模型压缩方法,可以让tiny Yolo 支持40 路,每路7帧的速度,但是准确率基本不变。
4.申请发明专利6项,其中5项进入实审阶段。
公司名称:万科集团
职位:AI合伙人
带领团队研发AI 审图系统,攻克技术难点,负责产品的框架设计,算法难点攻克。为万科AI 审图系统的创始人和核心技术发明人,万科AI审图项目所有发明专利的第一作者,在万科集团获得年度优秀员工一次。
具体工作包括如下:
1.主持AI审图算法研发工作,包括图像高速语义分割模型设计,图纸构件识别和审查,构件信息的检测方法等,采用基于并行模型技术的目标检测,图像分割等算法融合的方式处理AI审图系统中的难题。我主持AI审图核心算法设计期间,创新性的提出并实现了基于人工智能的建筑图纸构件识别方法,图像分割方法,构件信息的检测方法,建筑图纸预处理方法,建筑图纸识别方法,建筑图纸构件识别模型构建方法等。使得万科AI审图底层算法框架得以构建,并且这些算法让AI审图模型的准确率达到90%以上,为AI审图的核心技术,使得AI审图可以走向商用化。万科AI 审图系统发布后,在集团内外部大量使用。另外我创新性提出规则快速开发框架,将原有的开发系统分层解耦,使得规则开发人员只需要了解 需要了解的部分代码即可上手开发。将审图规则的开发效率从每人每月3条规则开发效率提高到每人 每月20条规则开发效率,成功将万科AI 审图系统发布上市,在集团内外部大量使用。
2020年4月,万科要求集团所有的住宅项目全面上线AI审图。一年时间里,设计底线的问题锐减80%,在部分领域的审图效率甚至是人工的七八倍。AI审图撬动了整个地产开发产业,在这个保守而传统的红海市场中,捕获了一片百亿蓝海新商机。2021年1月18日,深圳市住房和建设局举行AI审图系统上线发布会,会上宣布,未来深圳市所有房屋建设类施工图纸都将通过AI审图系统进行抽查。深圳市建筑工程人工智能审图试点项目由国家住建部批准,在施工图审查制度改革的大背景下,采用前沿技术助力设计质量管理。本次上线的万科AI审图系统在深圳市展开AI审图试点工作,使深圳成为全国首个全面应用人工智能技术进行施工图质量监管的城市,在地产科技的应用上先行先试,走在全国前列。
2.带领团队研发AI审图中的OCR核心技术,我提出采用预处理-OCR-后处理三层框架结构,组织开发预处理系统, OCR核心算法,后处理字典校正系统。构建OCR算法开发平台,该平台可以根据不同OCR需求场景 进行模型的微调,在万科CAD图纸识别等不同场景下均能达到极高的准确率。
3. 在工作期间将自己发明的技术成果转化为知识产权,申请发明专利20余项,目前已有10项发明专利已授权。
角色 | 职位 |
负责人 | 技术专家 |
队员 | 产品经理 |
队员 | UI设计师 |
队员 | 前端工程师 |
队员 | 后端工程师 |
我国地震、火灾等灾害频发,不仅直接造成重大人员伤亡和财产损失,而且时常在灾害救援现场因产生次生灾害导致大量人员伤亡。这种次生灾害通常是由于建筑物突然坍塌导致。如2003年湖南衡阳衡州大厦火灾,在全部救出412名人员后,突发8层高楼坍塌事故,造成20名救援的消防指战员殉职。但是,灾
从提升编程能力角度来看,DeepSeek大模型机器人平台为师生提供了一个实操平台,有助于大模型编程能力的显著提升。通过在机器人上进行复杂算法的实践,学生能够深入理解大模型架构下数据的流向与处理机制,学会如何优化代码以适配大模型的运算逻辑,从而高效地完成复杂任务。在人工智能编程方面
随着安防技术的发展,视频监控系统向着高清化、数字化、智能化不断发展。智能高清网络视频监控系统的应用也越来越多。随着近几年,AI人工智能的发展,智能监控摄像头被越来越多的应用到各种场景。AI智能监控系统不仅有高清的画质,同时还支持智能分析、智能识别。相较上一代产品而言,AI智能监控
本选题针对精神分裂症的诊断问题,包括人力、物力开销大、医龄较小的医生诊断的错误率高等,采用了卷积神经网络和yolov5模型相结合,对EEG进行分析并在此基础上加上了基于opencv识别的眼动图的辅助。在前端建立可视化平台,并使用Myriad MA2485 X人工智能NPU协处理器
该脂肪肝自动化审查系统基于深度学习算法,综合利用CT影像数据中的多个尺度特征,提取相关的影像信息,并对大量数据进行学习和优化,从而构建出准确性较为强大的诊断模型。该系统在训练和预测过程中能够自动学习CT影像数据中的复杂高阶特征,进而对脂肪肝的预测和诊断能力进行不断提高。该系统的设
舞台音频调节是语音信号处理的一个重要应用领域,语音信号处理作为人工智能的关键分支,旨在对音频进行修正、增强和转换。这一技术已经在音视频创作、虚拟互动娱乐等多种场景中得到广泛应用,尤其是在需要实时处理和调节音频的舞台场景中具有极大的实际价值。舞台音频调节的应用场景非常丰富,涵盖了直