|
--- |
|
license: mit |
|
language: |
|
- en |
|
tags: |
|
- ONNX |
|
- ONNXRUNTIME |
|
- AXEngine |
|
--- |
|
|
|
## 简介 |
|
|
|
**PyAXEngine** 基于 cffi 模块实现了 Axera NPU Runtime 的 Python API,其 Python API 与 ONNXRuntime 高度兼(相)容(似),并同时支持开发板和M.2算力卡形态,方便开源社区开发者使用 |
|
Python 脚本快速构建 NPU 推理脚本 |
|
|
|
支持芯片 |
|
|
|
- AX650N |
|
- AX630C |
|
|
|
环境版本 |
|
|
|
- python >= 3.8 |
|
- cffi >= 1.0.0 |
|
- ml-dtypes >= 0.1.0 |
|
- numpy >= 1.22.0 |
|
|
|
*需要注意的是,如果您的开发环境是算力卡,那么更建议您优先考虑使用 [pyAXCL](https://github.com/AXERA-TECH/pyaxcl) 进行项目开发;pyAXCL 项目完整包含了算力卡形态的全部 API,更适合用于正式部署;PyAXEngine 项目更适合算法工程师进行快速原型验证,且用于计算卡环境时,PyAXEngine 不能调用编解码等模块(不是 PyAXEngine 的设计目标)。* |
|
|
|
*AX650 SDK 2.18,AX620E SDK 3.12 以前的版本不支持 bf16,llm 模型会有返回 unknown 的 dtype问题,请注意升级* |
|
|
|
*如果您评估认为不知道如何升级 SDK,也可以提交 issue 索要下载,不需要更新完整 SDK,只更新 libax_engine.so 即可* |
|
|
|
## 快速上手 |
|
|
|
基于社区开发板 **爱芯派Pro(AX650N)** 进行展示 |
|
|
|
### 获取 wheel 包并安装 |
|
|
|
- [下载链接](https://github.com/AXERA-TECH/pyaxengine/releases/latest) |
|
- 将 `axengine-x.x.x-py3-none-any.whl` 拷贝到开发板上,执行 `pip install axengine-x.x.x-py3-none-any.whl` 安装 |
|
|
|
### 简单示例 |
|
|
|
当前示例需要分别依赖 PIL 和 OpenCV,可以用 `pip install pillow opencv-python-headless` 安装。其中 `opencv-python-headless` 是 OpenCV 的 headless 版本,不依赖 GUI(非 headless 的版本需要依赖 OpenGL ES,运行环境中并没有)。 |
|
|
|
```python |
|
将 [classification.py](https://github.com/AXERA-TECH/pyaxengine/blob/main/examples/classification.py) 拷贝到开发板上并执行。 |
|
|
|
```bash |
|
root@ax650:~/samples# python3 classification.py -m /opt/data/npu/models/mobilenetv2.axmodel -i /opt/data/npu/images/cat.jpg |
|
[INFO] Available providers: ['AXCLRTExecutionProvider', 'AxEngineExecutionProvider'] |
|
[INFO] Using provider: AxEngineExecutionProvider |
|
[INFO] Chip type: ChipType.MC50 |
|
[INFO] VNPU type: VNPUType.DISABLED |
|
[INFO] Engine version: 2.10.1s |
|
[INFO] Model type: 0 (single core) |
|
[INFO] Compiler version: 1.2-patch2 7e6b2b5f |
|
------------------------------------------------------ |
|
Top 5 Predictions: |
|
Class Index: 282, Score: 9.774 |
|
Class Index: 278, Score: 8.981 |
|
Class Index: 277, Score: 8.453 |
|
Class Index: 281, Score: 8.321 |
|
Class Index: 287, Score: 7.924 |
|
------------------------------------------------------ |
|
min = 0.890 ms max = 22.417 ms avg = 1.119 ms |
|
------------------------------------------------------ |
|
``` |
|
|
|
示例也演示了如何选择计算设备:这意味着既可以在 **AX650/AX630C** 等开发板上运行,也可以在 AX650 M.2 算力卡上运行。 |
|
|
|
切换计算设备的方式是通过 `-p` 参数指定,如 `-p AxEngineExecutionProvider` 表示使用开发板上的 NPU 进行推理,而 `-p AXCLRTExecutionProvider` 表示使用 M.2 算力卡进行推理。 |
|
注意:在使用 M.2 算力卡进行推理时,需要将算力卡插入宿主机上,并且已经安装驱动,详见: [axcl](https://axcl-docs.readthedocs.io/zh-cn/latest/)。 |
|
|
|
```bash |
|
root@ax650:~/samples# python3 classification.py -m /opt/data/npu/models/mobilenetv2.axmodel -i /opt/data/npu/images/cat.jpg -p AXCLRTExecutionProvider |
|
[INFO] Available providers: ['AXCLRTExecutionProvider', 'AxEngineExecutionProvider'] |
|
[INFO] Using provider: AXCLRTExecutionProvider |
|
[INFO] SOC Name: AX650N |
|
[INFO] VNPU type: VNPUType.DISABLED |
|
[INFO] Compiler version: 1.2-patch2 7e6b2b5f |
|
------------------------------------------------------ |
|
Top 5 Predictions: |
|
Class Index: 282, Score: 9.774 |
|
Class Index: 278, Score: 8.981 |
|
Class Index: 277, Score: 8.453 |
|
Class Index: 281, Score: 8.321 |
|
Class Index: 287, Score: 7.924 |
|
------------------------------------------------------ |
|
min = 1.587 ms max = 12.624 ms avg = 1.718 ms |
|
------------------------------------------------------ |
|
root@ax650:~/samples# python3 classification.py -m /opt/data/npu/models/mobilenetv2.axmodel -i /opt/data/npu/images/cat.jpg -p AxEngineExecutionProvider |
|
[INFO] Available providers: ['AXCLRTExecutionProvider', 'AxEngineExecutionProvider'] |
|
[INFO] Using provider: AxEngineExecutionProvider |
|
[INFO] Chip type: ChipType.MC50 |
|
[INFO] VNPU type: VNPUType.DISABLED |
|
[INFO] Engine version: 2.10.1s |
|
[INFO] Model type: 0 (single core) |
|
[INFO] Compiler version: 1.2-patch2 7e6b2b5f |
|
------------------------------------------------------ |
|
Top 5 Predictions: |
|
Class Index: 282, Score: 9.774 |
|
Class Index: 278, Score: 8.981 |
|
Class Index: 277, Score: 8.453 |
|
Class Index: 281, Score: 8.321 |
|
Class Index: 287, Score: 7.924 |
|
------------------------------------------------------ |
|
min = 0.897 ms max = 22.542 ms avg = 1.125 ms |
|
------------------------------------------------------ |
|
``` |
|
|
|
## 社区贡献者 |
|
|
|
- [zylo117](https://github.com/zylo117): 提供了基于 cffi 的 AXCL Runtime Python API 实现 |
|
- [nnn](https://github.com/nnn112358),[HongJie Li](https://github.com/techshoww) 和 [Shinichi Tanaka](https://github.com/s1tnk) 报告 cffi 的使用问题,[Shinichi Tanaka](https://github.com/s1tnk) 提供了解决方案 |
|
|
|
|
|
## 关联项目 |
|
|
|
- [ax-samples](https://github.com/AXERA-TECH/ax-samples) |
|
- [ax-llm](https://github.com/AXERA-TECH/ax-llm) |
|
- [Pulsar2](https://pulsar2-docs.readthedocs.io/zh-cn/latest/) |
|
- [AXCL](https://axcl-docs.readthedocs.io/zh-cn/latest/) |
|
- [pyAXCL](https://github.com/AXERA-TECH/pyaxcl) |