5 Jan 2017 Jahr - Deep Learning with Low
Precision by Half-wave
Gaussian Quantization (HWGQ)
Beschreibung:
本文主要讨论了在低位宽量化的近似梯度训练中,梯度消失的问题,通过设计新的量化函数(sign/Q)和激活函数来保证梯度不消失,以实现量化模型的收敛。有趣的是,仅通过对relu函数的剪切或者log-tail变换,模型的性能得到了显著提升。这或许就是特征的影响
Zugefügt zum Band der Zeit:
Datum:
~ 7 years and 4 months ago