orchest
项目核心内容总结:
Orchest 是一个用于构建数据流水线的工具,支持直接使用 Python、R 或 Julia 编写代码,无需依赖框架或 YAML 配置。其主要功能包括:
- 可视化构建流水线:通过用户界面拖拽操作;
- 代码集成:支持在 Notebook 和脚本中编写代码;
- 灵活运行:可运行流水线的任意子集,支持周期性任务;
- 环境管理:定义依赖以在任意机器上运行;
- 服务管理:启动跨流水线运行的长期服务;
- 版本控制:通过 Git 管理项目版本。
使用方法:
- 通过 快速入门教程 或 视频教程 学习;
- 可直接使用 Orchest Cloud 云服务跳过本地安装;
- 参考示例项目(如模型训练、数据库连接、PySpark 等)快速上手。
注意事项:
- 项目当前处于 Beta 阶段,但 已停止商业开发,建议考虑替代方案(如 Apache Airflow);
- 代码分目录采用 Apache-2.0 或 AGPL-3.0 许可证;
- 社区贡献可通过 Slack 或提交 GitHub Issues 参与。