1 gen 2019 anni - HAQ: Hardware-Aware
Automated Quantization
With Mixed Precision, CVPR, 2019
Descrizione:
一种基于硬件反馈的自动的混合精度的神经量化方法,通过强化学习,智能体自动根据硬件的反馈,包括延时和能耗等指标,逐层选择合适的量化策略,实现不同层的自动量化,在整体上实现自动的混合精度量化,其中亮点有两个,一个是硬件反馈,这在作者之前的文章里也实现了硬件反馈的思路,另一个是自动混合精度量化,混合精度在相同压缩比和计算效率下可以实现比固定精度更低的精度下降,但是难以人工/经验设定,因为搜索空间极大。
Aggiunto al nastro di tempo:
Data:
~ 5 years and 4 months ago