文档简介:
-
登录诸葛AI大数据平台,创建工程,编写数据处理工作流
-
步骤1:登录后,在首页点击: 创建工程。
步骤2:根据提是填写信息,然后点击确定。
步骤3:点击 创建流 ,根据提是填写信息,然后点击 确认 。
步骤4: 双击双创建的流,然后进入流开发界面script。
步骤5:根据需要开发的代码,选择相应模块,然后 拖拽模块 到右侧白色画布,鼠标左
键单击模块 可以在右侧设置参数,鼠标双击 进入模块的开发页面,点击模块,模块可以复制以及脚本关联等操作。
重要提示:数据开发的shell是开发shell脚本的,hql是开发hive sql的,pySpark写python spark , scala 时用scala开发spark项目,python 只是简单的pyhon开发环境,jdbc时关系型数据库的sql开发。
步骤6:双进scala 进入如下界面,可以在空白界面开发代码,可以在菜单栏配置参数,点击左侧菜单栏进行功能切换,以及点击7号位置打开附加功能
步骤8:流之间的小模块(Job)依赖关系连接好之后,点击菜单导航栏的执行,流开始运行。
运行中的流:
开发数据报表实现数据可视化
步骤1:拖拽可视化模块到右侧工作流区域,在流菜单导航栏里提娜佳可视化模块。
步骤2: 添加可视化数据源。
步骤3:添加视图列表
步骤4:编写视图列表,设计数据显示模型
步骤5:选择可视化指标插件列表。
步骤6: 添加可视化插件,并保存可视化插件
步骤7:选择可视化面板,添加看板和 DashBoard。
步骤8:看板视图设置。
步骤9: 新增dashboard,给dashboard取名。
步骤10:给dashboard添加看板。
步骤11:鼠标悬停天翼云,返回首页,点击项目的发部,发布项目,可以进入调度系统通过azkaban调度发布的项目。
-
数据交换使用
步骤1: 用户权限管理
步骤2: 添加数据源
步骤3: 配置数据交换任务
步骤4: 添加数据交换任务
步骤5: 执行数据交换任务
步骤6: 查看任务历史记录