llama.cpp教程:Windows系统上无需编译,直接运行一个自己的LLaMA 2 作者: 怕刺 时间: 2023-10-19 分类: 技术 2 条评论 llama.cpp是一个量化模型并实现在本地CPU上部署的程序,使用c++进行编写。将之前动辄需要几十G显存的部署变成普通家用电脑也可以轻松跑起来的“小程序”。不久前写过使用CloudFlare Workers 创建自己的AI程序,基于meta llama-2-7b大语言模型,但是 Wor ...