Skip to content

侧端大模型对话指南

端侧大模型对话是基于 AidGenAidGenSE 构建的一个与端侧大模型对话的应用。

本指南适用于用户在 Linux 或 Android 设备 上手动上传大模型文件夹,完成模型加载、配置与调用,并部署 aidllm 接口及 UI 服务。

一、平台支持情况

当前支持运行在高通平台,具体如下:

项目Linux 平台(QCS8550 / QCS6490)Android 平台(QCS7675)
支持模型类型加密模型、GGUF 模型、BIN 模型加密模型、GGUF 模型
模型支持限制QCS6490 当前仅支持 GGUF 模型暂无特殊限制

💡 注意

Android 平台需在 AidLux 融合系统(AidLux APP)环境中运行。

二、安装与部署流程

安装 AidLux APP(仅 Android)

  • Linux 用户可跳过。
  • 该 AidLux APP 是精简版系统应用,用于提供运行环境。
  • 请联系阿加犀技术支持获取安装包并完成安装。

大模型环境部署

操作入口

  • Android 环境:必须在 AidLux APP 中的命令行窗口操作
  • 可通过拷屏远程访问 Android 界面,参考常见问题部分。

工具安装

适用于 Linux 与 Android:

bash
# 下载 aidllm 安装包
wget https://aidllm.aidlux.com/files/aidllm_2.1.0_arm64.aid.gpg 

# 安装 aidllm
sudo aid-pkg -i -d aidllm_2.1.0_arm64.aid.gpg 

# 安装 aidgen-sdk
sudo aid-pkg -i aidgen-sdk

# 下载 aid-open-api 安装包
wget https://aidllm.aidlux.com/files/aid-openai-api_2.0.0_arm64.aid.gpg

# 安装 aid-openao-api
sudo aid-pkg -i -d aid-openai-api_2.0.0_arm64.aid.gpg

💡注意

无法找到或安装 aidgen-sdk,对应平台未支持。

查询可用模型

bash
# 查看远程支持的模型
aidllm remote-list api

示例输出:

yaml
Current Soc : 8550

Name                    Url                           CreateTime
-----                   ---------                     ---------
aplux_qwen2.5-3B        aplux/aplux_qwen2.5-3B        2025-03-05 14:52:23
aplux_qwen2-7B          aplux/aplux_qwen2-7B          2025-03-05 14:52:37
...

下载并加载模型

bash
# 下载远程模型到本地
aidllm pull api aplux/aplux_qwen2.5-3B

# 查看本地已下载模型列表
aidllm list api

# 加载模型
aidllm start api -m aplux_qwen2.5-3B

UI 服务部署

bash
# 安装 UI 前端服务
sudo aidllm install ui

使用UI进行对话验证模型是否可用

image-20250717112317614

设置 Demo 开机自启动

在 Linux 上设置:

bash
sudo cp /opt/aidlux/cpf/aidllm/scripts/start_llm.sh /etc/aidlux/

在 Android 上设置:

编辑 .bashrc 文件:

bash
vi /root/.bashrc

添加以下内容至末尾:

bash
bash /opt/aidlux/cpf/aidllm/scripts/and_start_llm.sh

保存后,重启 AidLux App 生效。