Deep Model Compression for Mobile Devices: A Survey
1 : Institut Pascal - Clermont Auvergne
SIGMA Clermont, Université Clermont Auvergne : UMR6602, Centre National de la Recherche Scientifique : UMR6602
Ces dernières années, les réseaux de neurones profond sont devenus indispensables pour le développement d'applications intelligentes. Ils ont atteint des performances remarquables, devenant plus complexes et cumulant des millions de paramètres. Ainsi, faire fonctionner ce type de modèle sur des appareils disposant de ressources limitées comme des téléphones mobiles n'est pas une tâche triviale. Cet article a pour but de présenter des méthodes permettant le portage de ces modèles sur plateformes mobiles. Nous nous focalisons sur des techniques de compression permettant de diminuer la consommation des modèles de manière globale (en taille, en mémoire, ou en temps de calcul par exemple).