datasystem.DsTensorClient#
- class datasystem.DsTensorClient(host, port, device_id, connect_timeout_ms=60000, client_public_key='', client_private_key='', server_public_key='')#
异构对象客户端。
- 参数:
host (str) - 数据系统 Worker 的主机 IP 地址。
port (int) - 数据系统 Worker 的端口号。
device_id (int) - 客户端所在进程绑定的device id。
connect_timeout_ms (int) - 客户端连接和请求超时时间,单位为毫秒。默认值:
60000。client_public_key (str) - 用于 curve 认证的客户端公钥。默认值:
""。client_private_key (str) - 用于 curve 认证的客户端私钥。默认值:
""。server_public_key (str) - 用于 curve 认证的服务端公钥。默认值:
""。
- 输出:
DsTensorClient
方法:
初始化数据系统客户端。
将 device 的数据写入到 host 中。
从 host 中获取数据并写入 device 中。
将 device 的数据写入到 host 中的异步接口。
从 host 中获取数据并写入 device 中的异步接口。
删除 host 中的 key。
订阅发布到数据系统的异构对象,并接收数据写入 tensors。
将 device 上的内存发布为数据系统的异构对象,发布后的异构对象可通过 dev_recv 获取。
通过数据系统缓存 Device 上的数据。
获取 device 中的数据,并写入到 Tensor 中。
从数据系统删除本节点上此 key 的元数据,不再管理此 key 对应的 device 内存。
从数据系统删除此 key 的元数据,不再管理此 key 对应的 device 内存。
从数据系统删除此 key 的元数据的异步接口,删除成功后不再管理此 key 对应的 device 内存。
将 PagedAttention 的层级 Tensor 发布为数据系统的异构对象。发布后的异构对象可通过 get_page_attn_layerwise_d2d 获取。
根据 key 获取缓存在数据系统的 PagedAttention 的层级 Tensor。
将 PagedAttention 的层级 Tensor 异步写入 Host 中。
从 Host 中获取 PagedAttention 的层级 Tensor 并写入 Device 中。