Dashboard#

openYuanrong提供了可视化的 dashboard ,用于查看openYuanrong集群和实例的状态和详细信息,以便于用户可以查看系统的性能并快速排查问题。目前 dashboard 支持上千条实例数据的稳定承载与展示。

启动 Dashboard#

要访问 dashboard ,需要在启动openYuanrong系统时,加上 --enable_dashboard=true 参数以及依赖项参数。使用 dashboard 全量功能的命令如下:

yr start --master --enable_faas_frontend=true --enable_dashboard=true --enable_collector=true --enable_separated_redirect_runtime_std=true --prometheus_address=prometheus_ip:prometheus_port --enable_metrics=true --metrics_config_file={file_name}.json --port_policy=FIX

您可参考 部署参数表 按需裁剪不需要的功能。

上方 yr start 命令会启动openYuanrong系统的 master 节点,并打印出包含 local_ipdashboard_port 信息,如下所示:

Yuanrong deployed succeed
Cluster master info:
    local_ip:7.185.105.138,master_ip:7.185.105.138,etcd_ip:7.185.105.138,etcd_port:32379,global_scheduler_port:22770,ds_master_port:12123,etcd_peer_port:32380,bus-proxy:22772,bus:22773,ds-worker:31501,dashboard_port:9080,

使用 http://local_ip:dashboard_port 作为 dashboard 的 URL (默认 URL 为 http://localhost:9080)。

页面介绍#

dashboard 有多个页面,根据不同作用,请查看对应页面:

Overview 页面#

Overview 页面可以查看总逻辑资源占用率、概览所有组件和实例状态。

逻辑资源卡片展示了 Logical CPU 总占用核数、总核数及总占用率,Logical Memory 总占用量(GB)、总内存量(GB)及总占用率。 集群状态卡片展示了总节点数和活跃节点数。 实例状态卡片展示了总实例数和 runningexitedfatal 状态实例数。

页面示例:

Cluster 页面#

Cluster 页面可以查看总逻辑资源占用率,所有节点和组件的状态及各资源指标使用情况,并将节点和组件的层次关系可视化。

逻辑资源卡片展示了 Logical CPU 总占用核数、总核数及总占用率,Logical Memory 总占用量(GB)、总内存量(GB)及总占用率。 组件卡片展示了节点和运行在节点上的 agent 代理的状态、地址、CPU 和 NPU 占用率、Memory/Disk/Logical CPU/Logical Memory 各指标的使用量、总量及占用率。

页面示例:

Instances 页面#

Instances 页面可以查看所有实例的详细信息。

实例详细信息说明:

  • ID:实例 id。

  • status:实例状态。

  • jobID:实例对应 job 的 id。

  • PID:运行实例进程的 pid。

  • IP:运行节点的 ip。

  • nodeID:运行节点的 id。

  • parentID:父实例的 id。

  • createTime:实例的创建时间。

  • required CPU:实例需要的 CPU 核数。

  • required Memory:实例需要的内存量,单位为 MB。

  • required GPU:实例需要的 GPU 核数。

  • required NPU:实例需要的 NPU 核数。

  • restarted:实例重启次数。

  • exitDetail:实例退出时的详细信息。

页面示例:

点击 IDlog 跳转至 instance 详情页,可查看此 instance 的详细信息、打印的日志和错误信息。页面示例:

Logs 页面#

Logs 页面可以查看所有日志内容和错误信息。页面示例:

点击选中的节点,可查看该节点下所有日志文件列表。页面示例:

点击想要查看的文件,即可展示文件内容。页面示例: