模块 LLM 使用介绍

csdndevpressbyzer

28人浏览 · 2023-12-07 14:08:02

csdndevpressbyzer · 2023-12-07 14:08:02 发布

LLM 模块介绍

Byzer-LLM Finetune/Deploy 大模型主要通过 LLM 模块。比如部署一个模型的典型示例如下：

-- 全局环境参数
!python conf "rayAddress=127.0.0.1:10001";
!python conf "pythonExec=/home/winubuntu/miniconda3/envs/byzerllm-desktop/bin/python";
!python conf "dataMode=model";
!python conf "runIn=driver";

!python conf "num_gpus=0.4";
!python conf "maxConcurrency=1";
!python conf "standalone=true";

!python conf "schema=file";

-- 允许该模块需要的参数
run command as LLM.`` where 
action="infer"
and pretrainedModelType="chatglm"
and localPathPrefix="/my8t/byzerllm/jobs"
and localModelDir="/my8t/byzerllm/jobs/checkpoint-17000/pretrained_model"
and modelWaitServerReadyTimeout="300"
and udfName="chat"
and modelTable="command";

和标准SQL 语句很像，运行 LLM 模块，然后参数包含两部分：

全局环境变量，使用 !python conf 来配置。
模块参数，放在where条件后面。

在这段代码里，你只需要修改 localModelDir 指向一个正确的chatglm模型地址，就能部署该模型。

简化全局参数配置

用户也可以使用如下代码简化全局参数配置：

-- 全局环境参数
!byzerllm setup single;
!byzerllm setup "num_gpus=0.4";

-- 允许该模块需要的参数
run command as LLM.`` where 
action="infer"
and pretrainedModelType="chatglm"
and localPathPrefix="/my8t/byzerllm/jobs"
and localModelDir="/my8t/byzerllm/jobs/checkpoint-17000/pretrained_model"
and modelWaitServerReadyTimeout="300"
and udfName="chat"
and modelTable="command";

这里 !byzerllm setup single; 会设置一些默认参数。用户可以执行这条语句获得所有模型配置值。接着单独设置pythonExec，num_gpus 覆盖默认参数。最终达到和第一个示例完全一样的效果。

下面我们详细介绍上面的参数。

LLM 参数介绍

全局环境变量

Parameter	Description
rayAddress	Byzer Finetune 和部署都需要 Ray。这里填写 Ray的地址
pythonExec	指定 Byzer 和 Ray 的 Python 环境
dataMode	可选值 model/data. 在 Byzer-LLM 中一律指定为 model
runIn	指定 ray client 运行在 Byzer 的driver端还是 executor端。建议 driver端。可选值： driver/executor
num_gpus	指定部署的模型实例需要的GPU资源。注意这里是指一个模型实例需要的GPU资源。可以是小数，这样可以方便多个模型可以调度到一个GPU上
maxConcurrency	部署多少个模型实例。如果你有多个GPU，可以部署多个实例，从而获得更好的并发
standalone	如果你每次模型部署模型只会设置1个实例或者会使用在部署模型时使用 localModelDir, 需要将该值设置为true，其他情况设置为false
schema	在 Byzer-LLM 中设置为 file 即可

当 num_gpus 是小数时，比如启动A模型设置为0.5 他会给A模型看到第一块GPU，接着：

启动B模型，还是设置为0.5, 那么他一算，第一块GPU 应该还够，会继续让A模型看到第一块GPU，这样两个模型都跑在同一块GPU上了。
启动B模型，如果你设置为 0.6, 他一算，发现超了，于是让B 看到第二块GPU ，B就跑在第二块GPU上了。

通过合适的启动顺序和 num_gpus 配比，可以充分利用有限的GPU显存。

通用参数

Parameter	Description
`action="infer"`	finetune 还是部署模型。可选值为： infer/finetune
`pretrainedModelType="chatglm"`	模型类型。可选值：chatglm,moss,bark,whisper,dolly,qa,falcon,sass/chatglm,llama
`localPathPrefix="/my8t/byzerllm/jobs"`	临时文件目录。部署模型的 worker 会产生很多临时文件，需要指定一个目录进行存储，防止默认 /tmp 太小的问题
`modelWaitServerReadyTimeout="60"`	单位秒。Byzer-LLM 会提供模型的 socket server ,这里可以设置为等待socket server ready的时间建议修改成 300
`dataWaitServerReadyTimeout="60"`	单位秒。Byzer-LLM 会提供数据的 socket server ,这里可以设置为等待socket server ready的时间建议修改成 300
`modelTable="d_chatglm_6b_model"`	Byzer-LLM 将模型也抽象成表，这里指定模型表的名称
`localModelDir="/my8t/byzerllm/jobs/checkpoint-17000/pretrained_model"`	指定worker 本地的模型，这样可以极大的加速模型的加载
`reconnect="false"`	默认为false.有的时候 Byzer引擎重启，但是 Ray中的模型实例还在，就可以设置为 true 然后执行重连操作。

注意1：modelTable 和 localModelDir 两个参数本质都是指定模型文件在哪里。如果都被配置了，会优先使用 localModelDir。 modelTable 需要使用模型分发，速度较慢。如果单机的话，建议使用 localModelDir 参数。当使用 localModelDir的时候，此时将 modelTable 参数配置成 command。

注意2：对于大模型 SaaS 服务，部署时需要将 num_gpus 设置为 0 (通过命令： !python conf "num_gpus=0"; 来完成), 避免占用 GPU 资源。

部署参数

Parameter	Description
`udfName="origin_model_predict"`	Byzer-LLM 会将模型调用抽象成 SQL 函数，这里可以随意取一个名字，方便后续调用

sass/chatglm 独有参数：

Parameter	Description
`apiKey="xxxx"`	ChatGLM Saas 服务的 apiKey
`publicKey="xxxx"`	ChatGLM Saas 服务的 publicKey

微调参数

Parameter	Description
`learningRate="5e-5"`	学习率
`maxSteps="100"`	最大迭代步数
`saveSteps="50"`	每多少步数保存一次checkpoint

chatglm专属：

Parameter	Description
`quantizationBit="false"`	是否进行量化. This option is only works for ChatGLM. The Moss will auto detect according the model files
`quantizationBitNum="8"`	量化位可选 8/4
`finetuningType="lora"`	action=finetune 时，指定 fintune的类型。默认为 lora。目前仅支持 chatglm 的fintune, 可选值： p_tuning/freese/lora

删除大模型实例

!byzerllm model remove chat;

这样就可以删除之前部署的 chat 模型函数。

一门面向 Data 和 AI 的低代码、云原生的开源编程语言

无需安装部署，在线快速体验 Byzer

更多推荐

编译时权限控制

前言权限控制，对于 MLSQL 而言的重要程度可以说是生命线。 MLSQL 需要面对各式各样的资源访问，比如 MySQL, Oracle,HDFS，Hive，Kafka，Sorl，ElasticSearch，Redis，API，Web等等，不同用户对这些数据源（以及表，列）的权限是不一样的。传统模式是，每个用户都需要有个 proxy user，然后到每个数据源里面给这个 proxy user

Byzer 白泽

Byzer 支持 JDBC 聚合下推

聚合下推PR链接聚合下推我们知道 Byzer 支持多数据源和联邦查询，可以方便分析师在一个平台上快速的分析来自多种数据源的数据，从而进行灵活的探索式分析。使用场景和优势当前 Byzer 中加载数据的方式会拉取明细数据到 spark 中进行聚合计算，对于小数据量或者在分布式文件系统上的数据源来说是常规操作。但是对于 JDBC 数据源或者有分析能力的 OLAP 系统来说拉取明细数据可能就不是最

Byzer 白泽

Byzer 术语表

Byzer-lang Byzer ，又称为 Byzer-lang，一门面向 Data 和 AI 的低代码、云原生的开源编程语言。 Byzer 是一门结合了声明式编程和命令式编程的混合编程语言，其低代码且类 SQL 的编程逻辑配合内置算法及插件的加持，能帮助数据工作者们高效打通数据链路，完成数据的清洗转换，并快速地进行机器学习相关的训练及预测。 Byzer 希望能够提供一套语言、一个引擎，就能覆盖整