Skip to content

Commit

Permalink
✨ feat: 动态虚拟化时,在芯片复位或系统重启后,已创建的vNPU会自动销毁
Browse files Browse the repository at this point in the history
  • Loading branch information
colynn committed Sep 5, 2024
1 parent 2d63ab9 commit 2e79739
Showing 1 changed file with 1 addition and 0 deletions.
1 change: 1 addition & 0 deletions kubernetes/ascend/README.md
Original file line number Diff line number Diff line change
Expand Up @@ -311,6 +311,7 @@ helm install -n kube-system ascend-device-plugin .
- 物理NPU虚拟化出vNPU后,不支持再将该物理NPU挂载到容器使用;如果物理机上创建了虚拟机,不支持再将该物理NPU直通到虚拟机使用。
- Atlas 300I Duo 推理卡上两路NPU的工作模式必须一致。即均使用虚拟化实例功能,或均整卡使用。请根据业务自行规划。
- 虚拟化实例模板是用于对整台服务器上所有标卡进行资源切分,不支持不同规格的标卡混插。如Atlas 300V Pro 视频解析卡支持24G和48G内存规格,不支持这两种内存规格的卡混插进行虚拟化。
- 使用动态虚拟化时,在芯片复位或系统重启后,已创建的vNPU会自动销毁,需要重新创建. 参看[接口文档说明](https://support.huawei.com/enterprise/zh/doc/EDOC1100388862/4bad8e23?idPath=23710424|251366513|22892968|252309113|254184887), 对于我们私有化服务器重启的场景必然是会存在的,当前的解决方案是通过kubernetes的event事件侦听Pod的状态,匹配对应的异常时,删除Pod触发volcano的重新调度即可修复。

### 静态虚拟化

Expand Down

0 comments on commit 2e79739

Please sign in to comment.