Byzer-LLM 如何通过日志排查错误

csdndevpressbyzer

14人浏览 · 2023-12-07 13:58:12

csdndevpressbyzer · 2023-12-07 13:58:12 发布

如何通过日志排查错误

Byzer-LLM 目前会使用 Ray 部署模型。一个模型分成两个部分，一个是 UDFMaster，一个是 UDFWorker。通常一个模型部署实例，对应一个UDFMaster ，一个或者多个UDFWorker。

当我使用如下代码进行部署时：

!byzerllm setup single;
!byzerllm setup "num_gpus=1";
!byzerllm setup "maxConcurrency=1";

run command as LLM.`` where 
action="infer"
and pretrainedModelType="llama"
and localModelDir="/home/byzerllm/models/openbuddy-llama-7b-v4-fp16"
and reconnect="false"
and udfName="chat"
and modelTable="command";

此时打开 Ray Dashborad ，进入 Actors 页面：

http://127.0.0.1:8266/#/actors

你应该可以看到两个 Actor, 一个名字叫 chat UDFMaster ，一个没有名字的 UDFWorker。其中：

num_gpus 控制一个 UDFWorker 使用多少个 GPU
maxConcurrency 控制一个 UDFMaster 最多可以同时运行多少个 UDFWorker

你可能看到的图类似这样：

可以看到，我们部署的 chat 函数已经都处于 alive状态了。

现在你可以点击 UDFWorker 进去查看日志，日志包含两部分：

Logs 标签页，包含了 UDFWorker 的日志。包括 stderr 和 stdout.
Tasks History 标签页，包含了 UDFWorker 执行过的任务。

一般而言，我们重点关注 Tasks History 标签页，如果你的 UDFWorker 在执行推理时有错误，你可以在这里看到错误信息。

Tasks History 标签页类似这样：

一门面向 Data 和 AI 的低代码、云原生的开源编程语言

无需安装部署，在线快速体验 Byzer

更多推荐

编译时权限控制

前言权限控制，对于 MLSQL 而言的重要程度可以说是生命线。 MLSQL 需要面对各式各样的资源访问，比如 MySQL, Oracle,HDFS，Hive，Kafka，Sorl，ElasticSearch，Redis，API，Web等等，不同用户对这些数据源（以及表，列）的权限是不一样的。传统模式是，每个用户都需要有个 proxy user，然后到每个数据源里面给这个 proxy user

Byzer 白泽

Byzer 支持 JDBC 聚合下推

聚合下推PR链接聚合下推我们知道 Byzer 支持多数据源和联邦查询，可以方便分析师在一个平台上快速的分析来自多种数据源的数据，从而进行灵活的探索式分析。使用场景和优势当前 Byzer 中加载数据的方式会拉取明细数据到 spark 中进行聚合计算，对于小数据量或者在分布式文件系统上的数据源来说是常规操作。但是对于 JDBC 数据源或者有分析能力的 OLAP 系统来说拉取明细数据可能就不是最

Byzer 白泽

Byzer 术语表

Byzer-lang Byzer ，又称为 Byzer-lang，一门面向 Data 和 AI 的低代码、云原生的开源编程语言。 Byzer 是一门结合了声明式编程和命令式编程的混合编程语言，其低代码且类 SQL 的编程逻辑配合内置算法及插件的加持，能帮助数据工作者们高效打通数据链路，完成数据的清洗转换，并快速地进行机器学习相关的训练及预测。 Byzer 希望能够提供一套语言、一个引擎，就能覆盖整