**应严格按照各版本进行安装,以免后面遇到一系列未知问题。**
博客地址:https://blog.csdn.net/weixin_46530492/article/details/133029584?spm=1001.2014.3001.5502
博客地址:https://blog.csdn.net/weixin_46530492/article/details/133024073?spm=1001.2014.3001.5502
博客地址:https://blog.csdn.net/weixin_46530492/article/details/133029441?spm=1001.2014.3001.5502
git clone https://github.com/THUDM/ChatGLM2-6B

pip install -r requirements.txt
huggingface下载模型git clone https://huggingface.co/THUDM/chatglm2-6b

小型文件可以clone下来,但是好几G的model.bin文件只能手动下载。


为避免与平时使用的python环境以及python工具包冲突,建议使用venv创建python虚拟环境进行部署
python -m venv your_venv_name
cd venv\Scripts #切换路径
activate #激活虚拟环境
默认情况下,模型以 FP16 精度加载,运行上述代码需要大概 13GB 显存。如果你的 GPU 显存有限,可以尝试以量化方式加载模型,使用方法如下:
# 按需在web_demo.py中修改,目前只支持 4/8 bit 量化
model = AutoModel.from_pretrained("THUDM/chatglm2-6b", trust_remote_code=True).quantize(4).cuda()
这是int4量化,其中的预训练文件我们已经下载,文件路径应改为实际路径,比如
我的
"E:\coding\chatGLM2\chatGLM2_model\chatglm2-6b"
cli_demo.py本地命令行调用,直接运行或者python cli_demo.py
web_demo.pygradio界面生成,直接运行或者python web_demo.py,gradio界面在国内访问不太方便。
web_demo2.py
streamlit界面生成,直接运行或者python web_demo2.py都会遇到组件属性不存在的现象
AttributeError: st.session_state has no attribute "history". Did you forget to initialize it? More info: https://docs.streamlit.io/library/advanced-features/session-state#initialization
应使用streamlit run web_demo2.py的方式运行
streamlit国内访问良好。

prompt,模型开始运行RUNNING,说明模型开始运行