请求协助在Ubuntu系统本地安装官方仓库的llama.cpp

阿华AIGC实验室

2026-4-23

Hey Pablo, no need to stress—let’s get llama.cpp up and running on your Ubuntu system using the official repo’s method, no sketchy YouTube guides or unvetted ChatGPT steps involved. Here’s a straightforward, tested walkthrough:

1. 安装必要的系统依赖

首先确保你的系统拥有编译llama.cpp所需的全部工具。打开终端，依次运行以下命令：

更新软件包列表：
```
sudo apt update
```
安装基础编译工具、git以及可选的BLAS库（用于加速推理）：
```
sudo apt install build-essential cmake git libopenblas-dev
```
BLAS库不是必须的，但能显著提升模型推理的速度。

2. 克隆官方llama.cpp仓库

接下来获取官方仓库的代码文件。在终端运行以下命令，将仓库克隆到名为llama.cpp的本地目录：

git clone https://github.com/ggerganov/llama.cpp.git

3. 进入仓库目录

切换到刚创建的代码文件夹：

cd llama.cpp

4. 编译llama.cpp可执行文件

现在我们来构建可执行程序。官方仓库使用make进行编译：

基础编译（无BLAS加速）：
```
make
```
如果之前安装了BLAS库，想要启用加速以获得更好的性能：
```
make LLAMA_BLAS=1 LLAMA_BLAS_VENDOR=OpenBLAS
```
编译完成后会生成main主程序以及server等工具（用于API访问）。

5. 验证安装是否成功

为了确认安装正常，运行主程序的帮助命令：

./main --help

如果看到一长串命令行选项和使用说明，恭喜你——llama.cpp已经安装完成并可以使用了！

后续快速操作提示

安装完成后，你需要准备一个兼容的LLaMA模型（推荐使用GGUF格式，这是llama.cpp的首选格式），并将其放入models目录（如果该目录不存在可以自行创建）。之后就可以用类似以下的命令运行模型：

./main -m models/你的模型文件.gguf -n 512

如果编译过程中遇到错误（比如提示缺失库），请仔细检查步骤1中的依赖是否全部安装完成。你也可以先运行sudo apt upgrade更新系统软件包，然后重新执行编译命令。

备注：内容来源于stack exchange，提问作者Pablo

火山引擎最新活动

方舟 Coding Plan

HOT

模型自由，工具不限，免费解锁 ArkClaw，7*24 小时在线的专属智能伙伴

查看详情

一键部署 OpenClaw

分钟级部署，云服务器包月低至￥9.9，与 CodingPlan 组合购买仅需19.8元

查看详情

Seedance2.0 体验中心上线

注册即享免费500万Tokens，抢先领略新一代AI视频技术跃迁

查看详情

新用户特惠专场

大模型19元起，Al应用9.9元畅享，新人首购爆款尽享优惠

查看详情

ArkClaw 专属智能伙伴