You need to enable JavaScript to run this app.
最新活动
大模型
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

请求协助在Ubuntu系统本地安装官方仓库的llama.cpp

请求协助在Ubuntu系统本地安装官方仓库的llama.cpp

Hey Pablo, no need to stress—let’s get llama.cpp up and running on your Ubuntu system using the official repo’s method, no sketchy YouTube guides or unvetted ChatGPT steps involved. Here’s a straightforward, tested walkthrough:

1. 安装必要的系统依赖

首先确保你的系统拥有编译llama.cpp所需的全部工具。打开终端,依次运行以下命令:

  • 更新软件包列表:
    sudo apt update
    
  • 安装基础编译工具、git以及可选的BLAS库(用于加速推理):
    sudo apt install build-essential cmake git libopenblas-dev
    
    BLAS库不是必须的,但能显著提升模型推理的速度。

2. 克隆官方llama.cpp仓库

接下来获取官方仓库的代码文件。在终端运行以下命令,将仓库克隆到名为llama.cpp的本地目录:

git clone https://github.com/ggerganov/llama.cpp.git

3. 进入仓库目录

切换到刚创建的代码文件夹:

cd llama.cpp

4. 编译llama.cpp可执行文件

现在我们来构建可执行程序。官方仓库使用make进行编译:

  • 基础编译(无BLAS加速):
    make
    
  • 如果之前安装了BLAS库,想要启用加速以获得更好的性能:
    make LLAMA_BLAS=1 LLAMA_BLAS_VENDOR=OpenBLAS
    
    编译完成后会生成main主程序以及server等工具(用于API访问)。

5. 验证安装是否成功

为了确认安装正常,运行主程序的帮助命令:

./main --help

如果看到一长串命令行选项和使用说明,恭喜你——llama.cpp已经安装完成并可以使用了!

后续快速操作提示

安装完成后,你需要准备一个兼容的LLaMA模型(推荐使用GGUF格式,这是llama.cpp的首选格式),并将其放入models目录(如果该目录不存在可以自行创建)。之后就可以用类似以下的命令运行模型:

./main -m models/你的模型文件.gguf -n 512

如果编译过程中遇到错误(比如提示缺失库),请仔细检查步骤1中的依赖是否全部安装完成。你也可以先运行sudo apt upgrade更新系统软件包,然后重新执行编译命令。

备注:内容来源于stack exchange,提问作者Pablo

火山引擎 最新活动