关于 — AI 部署手记

我是谁

我是 jackyrwj，是一名软件工程师，日常工作涉及自动化测试和基础设施运维。从 2023 年底开始，我开始在自己的 GPU 服务器上折腾本地大模型，先是为了省 API 费用，后来慢慢变成了一件很上头的事。

目前我主要在跑 Qwen 系列模型，推理框架用 vLLM，模型管理用 GPUStack，前端用 LobeChat。说白了就是自己攒了一套"私有 ChatGPT"，日常当编程助手和文档助理用。

刚开始搞本地部署的时候，走了很多弯路。网上的教程要么太旧（跑不通），要么太浅（遇到报错完全不知道怎么排查），要么就是 AI 生成的废话。

我踩过的坑包括但不限于：

这些问题现在看来都是小事，但当时真的花了很多时间。所以我想把这些经历记录下来，希望能帮到同样在折腾这些东西的人。

主要三类内容：

我会尽量避免只是搬运官方文档或者大而全的"介绍文章"。每篇文章都应该解决一个具体的问题，或者让你对某个工具的选择有更清晰的判断。

目前在用的工具和环境：

这些工具组合在一起，基本能覆盖日常的个人 AI 使用需求，成本比买云 API 低很多，数据也在自己手里。

如果你在部署过程中遇到了问题，或者有什么想讨论的，可以通过联系页面给我发消息。我不一定能很快回复，但我会看的。

如果这里的文章对你有帮助，把它分享给有需要的人就是最好的支持。