MIVCN

人工智能-其他 wong-slow

In the field of computer vision, it is a challenging task to generate natural language captions from videos as input. To deal with this task, videos are usually regarded as feature sequences and input into Long-Short Term Memory (LSTM) to generate natural language. To get richer and more detailed vi...

MIVCN
MIVCN
MIVCN

科大讯飞脑PET比赛TOP5

人工智能-其他 wong-slow

nnUNet的出现,一棒子打死了近年来所有的新的网络结构。作者认为网络结构上的改进并没有什么用,应该更多的关注结构以外的部分,比如预处理、训练和推理策略、后处理等部分。 目前为止nnUNet的代码已经被很多地方使用并且证明了它的效果,这不禁引起我们的深思,确实网络结构在这么多年来的所谓的创新,是不是真的都只是过拟合,都是论文作者的一厢情愿。 在没有充分的理论支撑的情况下,越是复杂的东西,就越容易过拟合,不是没有道理的。在深度学习领域的钻研方向问题上,学术界是不是走了很多弯路?更多的精力放在理解数据上,可能更能得到质的提升。...

科大讯飞脑PET比赛TOP5
科大讯飞脑PET比赛TOP5
------ 加载完毕 ------
联系聘用方端客服