NM Testing

company

AI & ML interests

None defined yet.

Recent Activity

nm-autobot updated a model about 8 hours ago

nm-testing/w4a16_moe-e2e

nm-autobot updated a model about 8 hours ago

nm-testing/w8a8_static_asym-e2e

nm-autobot updated a model about 8 hours ago

nm-testing/Qwen3-30B-A3B-NVFP4-AWQ-e2e

View all activity

nm-testing 's models 554

nm-testing/granite-3.1-8b-instruct2of4-sparse

8B • Updated Jan 26, 2025 • 3

nm-testing/Mistral-7B-Instruct-v0.3-W4A16-G128

7B • Updated Jan 26, 2025 • 5

nm-testing/Mistral-7B-Instruct-v0.3-W8A8-Dynamic-Per-Token

7B • Updated Jan 26, 2025 • 6

nm-testing/granite-8b-code-instruct-128k-W4A16-G128

8B • Updated Jan 26, 2025 • 4

nm-testing/granite-8b-code-instruct-128k-W8A8-Dynamic-Per-Token

8B • Updated Jan 26, 2025 • 10

nm-testing/granite-3.1-8b-instruct-W4A16-G128

8B • Updated Jan 26, 2025 • 4

nm-testing/granite-3.1-8b-instruct-W8A8-Dynamic-Per-Token

8B • Updated Jan 26, 2025 • 10

nm-testing/DeepSeek-R1-Distill-Qwen-14B2of4-W8A8-FP8-Dynamic-Per-Token

15B • Updated Jan 26, 2025 • 5

nm-testing/DeepSeek-R1-Distill-Qwen-14B2of4-sparse

15B • Updated Jan 26, 2025 • 5

nm-testing/Mistral-7B-Instruct-v0.3-FP8-Dynamic

7B • Updated Jan 26, 2025 • 9

nm-testing/DeepSeek-R1-Distill-Qwen-14B-W4A16-G128

15B • Updated Jan 26, 2025 • 5

nm-testing/granite-8b-code-instruct-128k-FP8-Dynamic

8B • Updated Jan 26, 2025 • 5

nm-testing/DeepSeek-R1-Distill-Qwen-14B-W8A8-Dynamic-Per-Token

15B • Updated Jan 26, 2025 • 13

nm-testing/granite-3.1-8b-instruct-FP8-Dynamic

8B • Updated Jan 26, 2025 • 4

nm-testing/DeepSeek-R1-Distill-Qwen-14B-FP8-Dynamic

15B • Updated Jan 26, 2025 • 6

nm-testing/kyle-Qwen2-VL-72B-Instruct-W4A16-G128

74B • Updated Jan 24, 2025 • 5

nm-testing/llama2.c-stories42M-pruned2.4-compressed

48.6M • Updated Jan 22, 2025 • 29

nm-testing/granite-3.1-2b-instruct-W4A16-G128

3B • Updated Jan 22, 2025 • 4

nm-testing/DeepSeek-R1-Distill-Qwen-1.5B-W4A16-G128

2B • Updated Jan 22, 2025 • 4

nm-testing/whisper-large-v2-W4A16-G128

2B • Updated Jan 21, 2025 • 3

nm-testing/whisper-tiny-W4A16-G128

58M • Updated Jan 20, 2025 • 6

nm-testing/llama2.c-stories42M-quantized-fp8-Dynamic

58.1M • Updated Jan 14, 2025 • 4

nm-testing/TinyLlama-1.1B-Chat-v1.0-W8A8-Dynamic-Per-Token-uncompressed

1B • Updated Jan 14, 2025 • 170

nm-testing/TinyLlama-1.1B-Chat-v1.0-W8A8-Dynamic-Per-Token-compressed

1B • Updated Jan 14, 2025 • 357

nm-testing/TinyLlama-1.1B-Chat-v1.0-W8A16-G128-uncompressed

1B • Updated Jan 14, 2025 • 171

nm-testing/TinyLlama-1.1B-Chat-v1.0-W8A16-G128-compressed

1B • Updated Jan 14, 2025 • 427

nm-testing/TinyLlama-1.1B-Chat-v1.0-W4A16-G128-uncompressed

1B • Updated Jan 14, 2025 • 174

nm-testing/TinyLlama-1.1B-Chat-v1.0-W4A16-G128-compressed

1B • Updated Jan 14, 2025 • 372

nm-testing/TinyLlama-1.1B-Chat-v1.0-FP8-Dynamic-uncompressed

1B • Updated Jan 14, 2025 • 166

nm-testing/TinyLlama-1.1B-Chat-v1.0-FP8-Dynamic-compressed

1B • Updated Jan 14, 2025 • 407