James O'Neill, Sourav Dutta: Self-Distilled Quantization: Achieving High Compression Rates in Transformer-Based Language Models. CoRR abs/2307.05972 (2023)