参考:https://www.cnblogs.com/bruceleely/p/17348782.html
##8bit model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).quantize(8).half(
京公网安备 11010502049817号