请求协助在Ubuntu系统本地安装官方仓库的llama.cpp
请求协助在Ubuntu系统本地安装官方仓库的llama.cpp
Hey Pablo, no need to stress—let’s get llama.cpp up and running on your Ubuntu system using the official repo’s method, no sketchy YouTube guides or unvetted ChatGPT steps involved. Here’s a straightforward, tested walkthrough:
1. 安装必要的系统依赖
首先确保你的系统拥有编译llama.cpp所需的全部工具。打开终端,依次运行以下命令:
- 更新软件包列表:
sudo apt update - 安装基础编译工具、git以及可选的BLAS库(用于加速推理):
BLAS库不是必须的,但能显著提升模型推理的速度。sudo apt install build-essential cmake git libopenblas-dev
2. 克隆官方llama.cpp仓库
接下来获取官方仓库的代码文件。在终端运行以下命令,将仓库克隆到名为llama.cpp的本地目录:
git clone https://github.com/ggerganov/llama.cpp.git
3. 进入仓库目录
切换到刚创建的代码文件夹:
cd llama.cpp
4. 编译llama.cpp可执行文件
现在我们来构建可执行程序。官方仓库使用make进行编译:
- 基础编译(无BLAS加速):
make - 如果之前安装了BLAS库,想要启用加速以获得更好的性能:
编译完成后会生成make LLAMA_BLAS=1 LLAMA_BLAS_VENDOR=OpenBLASmain主程序以及server等工具(用于API访问)。
5. 验证安装是否成功
为了确认安装正常,运行主程序的帮助命令:
./main --help
如果看到一长串命令行选项和使用说明,恭喜你——llama.cpp已经安装完成并可以使用了!
后续快速操作提示
安装完成后,你需要准备一个兼容的LLaMA模型(推荐使用GGUF格式,这是llama.cpp的首选格式),并将其放入models目录(如果该目录不存在可以自行创建)。之后就可以用类似以下的命令运行模型:
./main -m models/你的模型文件.gguf -n 512
如果编译过程中遇到错误(比如提示缺失库),请仔细检查步骤1中的依赖是否全部安装完成。你也可以先运行sudo apt upgrade更新系统软件包,然后重新执行编译命令。
备注:内容来源于stack exchange,提问作者Pablo




