一个技术探索与知识分享的平台~

ChatGLM-6B本地部署

发布： 2023-04-23 10:37

更新： 2023-04-23 10:37

字数：1292

下载项目代码

git clone https://github.com/THUDM/ChatGLM-6B.git

创建虚拟环境，建议使用 conda 管理

conda create -n chatglm python==3.8

安装依赖

conda activate chatglm
pip install -r requirements.txt
conda install cudatoolkit=11.7 -c nvidia

PS：没有安装 cudatoolkit 的话，会报 RuntimeError: Library cudart is not initialized 错误

但 issues 里也有人说可以通过使用CPU输出量化模型后直接调用的方式解决，暂未尝试。

issues 地址: https://github.com/THUDM/ChatGLM-6B/issues/115

硬件需求

量化等级	最低 GPU 显存（推理）	最低 GPU 显存（高效参数微调）
FP16（无量化）	13 GB	14 GB
INT8	8 GB	9 GB
INT4	6 GB	7 GB

修改一下启动参数

model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).half().cuda()

使用量化模型

# 按需修改，目前只支持 4/8 bit 量化
model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).quantize(4).half().cuda()

下载模型和启动 Gradio 界面

cd ChatGLM-6B
python web_demo.py

运行效果

_EOF_

ChatGLM-6B本地部署

本文作者： 程序设计实验室

本文链接： https://blog.deali.cn/p/chatglm-6b-local-deployment

关于博主： 欢迎扫码关注公众号，交流技术 & 分享经验！

微信公众号：「程序设计实验室」专注于互联网热门新技术探索与团队敏捷开发实践，包括架构设计、机器学习与数据分析算法、移动端开发、Linux、Web前后端开发等，欢迎一起探讨技术，分享学习实践经验。

LLM探索：使用DeepSeek免费平替cursor

Cursor太贵？DeepSeek+Cline勉强能用，但token烧得比我还快。生成的代码bug一堆，还不如自己敲。32k上下文调整后总算不报错，效果嘛...

2025-01-31

LLM探索：离线部署Ollama和one-api服务

离线部署Ollama？手动下载上传，导入模型文件，啧，麻烦。one-api用Docker，tiktoken需下载重命名，更烦。添加渠道？简单。

2025-02-18

LLM探索：大模型背后的向量魔法，Embedding技术初探

Embedding技术从Word Embedding发展到动态预训练模型，无处不在，但本文只是过时的基础。LLM时代，向量魔法如此关键，作者却拖更太久，内...

2025-02-07

LLM探索：DeepSeek火爆全网，官网宕机？本地部署一个随便玩

DeepSeek官网又崩？本地部署14b模型，web界面倒还凑合。国产大模型热度高，服务器不行就自己搭，呵。代码能力待验证，反正比官网强。

2025-01-30

讨论区

共 {{total}} 条讨论

良言一句三冬暖，恶语伤人六月寒。

@{{replyComment.anonymousUser.name}}

刷新

重置

发表

首次发言：{{comment.anonymousUser.createdTime}}
网站地址：{{comment.anonymousUser.url}}

@{{comment.replyUser}} {{comment.content}}

一个技术探索与知识分享的平台~

ChatGLM-6B本地部署

ChatGLM-6B本地部署

讨论区

{{comment.anonymousUser.name}}

{{comment.anonymousUser.name}}

一个技术探索与知识分享的平台~

ChatGLM-6B本地部署

相关文章

LLM探索：使用DeepSeek免费平替cursor

LLM探索：离线部署Ollama和one-api服务

LLM探索：大模型背后的向量魔法，Embedding技术初探

LLM探索：DeepSeek火爆全网，官网宕机？本地部署一个随便玩

讨论区

{{comment.anonymousUser.name}}

{{comment.anonymousUser.name}}