Byzer-LLM API 调用

csdndevpressbyzer

53人浏览 · 2023-12-07 14:12:55

csdndevpressbyzer · 2023-12-07 14:12:55 发布

Byzer-LLM 一旦完成模型部署，你将会得到一个函数，该函数可以应用于Byzer-lang中的 ETL, 流式计算等形态的任务中。与此同时，Byzer-LLM 也暴露出一个 endpoint, 方便你通过 http 协议获得交互。

地址形式为：

http://127.0.0.1:9003/model/predict

我们以Python为例，调用方式如下：

import requests

# select finetune_model_predict(array(feature)) as a
def request(sql:str,json_data:str)->str:
    url = 'http://127.0.0.1:9003/model/predict'
    data = {
        'sessionPerUser': 'true',
        'sessionPerRequest': 'true',
        'owner': 'william',
        'dataType': 'string',
        'sql': sql,
        'data': json_data
    }
    response = requests.post(url, data=data)
    if response.status_code != 200:
        raise Exception(response.text)
    return response.text

def chat(s:str,history:List[Dict[str,str]])->str:    
    json_data = json.dumps([
        {"instruction":s,"history":newhis}
    ])
    ## chat 是我们注册的模型函数， feature 就是 json_data里的每一条记录
    response = request('''
     select chat(array(feature)) as value
    ''',json_data)   

    ## 解析结果的方式 
    t = json.loads(response)
    t2 = json.loads(t[0]["value"][0])
    return t2[0]["predict"]

POST 请求参数介绍：

Parameter	Value	Desc
sessionPerUser	true	用户隔离命名空间
sessionPerRequest	true	在用户隔离的基础上按请求隔离命名空间
owner	william	函数的所有者
dataType	string	设置为string即可
sql		对 data 如何进行处理的 SQL 描述
data		传递的数据。注意这两是json 字符串，而不是json结构

其中 data 是 json 字符串结构如下：

Parameter	Value	Desc
instruction		用户当前发送的对话
history	数组	历史会话，数组，里面的元数结构为 {"role":"","content":""} 结构。其中role值为： system/user/asssitant
timeout_s	超时时间，单位秒	默认 300
stopping_sequences	停止提示	无。多个字符串按逗号分隔。当生成模型遇到指定的字符之一，就会停止生成，目前的实现比较消耗性能
stopping_sequences_skip_check_min_length	默认值0	生成多少个字符后再做stopping_sequence的检查。
top_p	0.95	设置越高，回答越固定
temperature	0.1	设置越低，回答越固定
max_length	1024	总token长度限制
embedding	false	是否切换为embedding请求，也就是帮你把文本转换为向量表示形式，一般QA数据库需要