登录社区云,与社区用户共同成长
邀请您加入社区
Byzer 最强悍的地方在于,不需要任何开发就可以把数据特征工程和模型预测迁移到 API 服务上。 这是通过将 ET 快速注册为 UDF 实现的, 详情可以翻看自定义 ET 插件开发。 本章节还会涉及 Byzer API 相关知识,详情可以翻看Byzer Engine Rest API 设计和原理 使用 Byzer 完成模型训练后,部署模型并
在Byzer-python中,介绍了 Byzer 对 Python 的支持。 然而在集群模式下,用户需要做一些配置,并在每个节点安装conda。这未免有些麻烦。 与之相对,Byzer 还提供了一些内置的、开箱即用的算法。 我们将重点讲解这些算法的原理并提供示例。 自动机器学习/AutoMLK 均值聚类算法/KMeans朴素贝叶斯法/Naive
什么是特征工程? 有这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。那特征工程到底是什么呢?顾名思义,其本质是一项工程活动,目的是最大限度地从原始数据中提取特征以供算法和模型使用。 Byzer 提供了非常多的特征工程算子,能够很好的解决这一痛点。 Byzer 内置的这些特征工程算子有如下特点: 训练阶段可用,保证吞吐量预测阶段使用,保证性能,一般毫秒级
在统计学中,探索式数据分析 / Exploratory Data Analysis在统计学中用于分析数据集来获取数据的主要特征,经常会被用于统计图表 (statistical graphics)以及数据可视化(data visualization)中。 Byzer 在byzer-org/byzer-extension的mlsql-mlib提供了相关功能的插件实现, 包含如下算子: 数据剖析/Dat