Linkis作为一个计算中间件,是scritpis,visualis,qualitis,exchangis等数据应用组件的计算入口,至关重要。
本文主要的关注点是linkis的组件构成
,以及linkis中的作业执行流程
;
Linkis作为一个计算中间件,是scritpis,visualis,qualitis,exchangis等数据应用组件的计算入口,至关重要。
本文主要的关注点是linkis的组件构成
,以及linkis中的作业执行流程
;
DSS(DataSphereStudio)的实现强依赖于Linkis计算中间件,dss包含6个,而底层linkis需要部署18个服务,所以一般基于dss二次开发,关键就是对linkis的hadoop集群做适配,以及超多的微服务导致部署的问题(工作量大,服务间存在依赖,容易出错)。
本文主要的关注点是如何将dss应用于生产环境并采用gerrit + jenkins + ansible + docker
实施cicd
,实现对linkis和dss的自动化部署,封装每个微服务在不同运行环境的配置和启动脚本。
airflow要投入生产,定制成本太高,国产apache dolphinScheduler真香,只是可惜airflow使用python代码对dag进行版本控制的思路没有采用,得自己实现版本控制。
airflow和传统的调度系统的最大区别是采用workflow as code
思想,,dag是采用python代码定义,目标用户是熟悉python的工程师,普通用户使用成本较高。
一个调度系统,涉及的功能可按任务执行周期分为3部分:
本文记录数据仓库的术语
传统领域实体建模一般采用PowerDesign等UML软件实现,设计更新没有版本控制,不易维护和团队分享;
可采用JDL(Jhipster Domain Language)实现document as code,编写jdl文件并用git进行版本控制;
JDL建模IDE可采用online,visual studio code,atom等通用文本编辑器,可导出图片预览UML效果;
JDL编写好后,可用jhipster import-jdl工具生成entity层的java代码。
全栈之路必备springboot+vuejs,点亮vue
ansible自动化运维-mysql
关键词:数据血缘、元数据治理、metadata
团队REST接口定义规范
用linkedin开源框架datahub实现元数据管理
OPS笔记:centos7系统默认python2升级python3
本文描述数据库表的设计流程以及DDL和DML的设计规约;
记录如何用kubernetes官方提供的kubeadm工具安装k8s集群
记录如何用kuboard工具安装k8s集群
Ansible自动化运维工具学习笔记,告别乱糟糟的shell脚本
git commit -m “commit message” 每次提交的时候,总得写点什么,如果团队中小伙伴都按一定的范式来书写提交记录,问题追溯将变的有迹可循;
目前,社区有多种 Commit message 的规范。不过一般采用较多的是Google的AngularJS的规范,有现配套的工具来实现规范化提交。
记录docker容器安装etcd,以及etcd的日常使用命令