Edit Models filters

Inference Providers

HF Inference API

Misc

compressed-tensors

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

2,764

Full-text search

Active filters: compressed-tensors

cpatonn/Qwen3-Omni-30B-A3B-Instruct-AWQ-4bit

Any-to-Any • 10B • Updated 1 day ago • 731 • 14

inclusionAI/Ring-mini-linear-2.0-GPTQ-int4

Text Generation • 3B • Updated about 8 hours ago • 4

inclusionAI/Ring-flash-linear-2.0-GPTQ-int4

Text Generation • 15B • Updated about 8 hours ago • 4

zai-org/GLM-4.5-Air-FP8

Text Generation • 111B • Updated Aug 12 • 63.9k • • 55

allenai/olmOCR-7B-0725-FP8

Image-to-Text • 8B • Updated Aug 19 • 27.6k • 17

cpatonn/Qwen3-Next-80B-A3B-Instruct-AWQ-4bit

Text Generation • Updated 6 days ago • 109k • 29

MattisR/Voxtral-Small-24B-2507-FP8-dynamic

Automatic Speech Recognition • 24B • Updated 6 days ago • 47 • 3

RedHatAI/whisper-large-v3-turbo-FP8-dynamic

Automatic Speech Recognition • 0.9B • Updated Apr 22 • 383 • 4

RedHatAI/DeepSeek-R1-0528-quantized.w4a16

Text Generation • Updated 8 days ago • 2.17k • 12

cpatonn/GLM-4.5-Air-AWQ-4bit

Text Generation • 19B • Updated 28 days ago • 13.3k • 15

RedHatAI/Voxtral-Mini-3B-2507-FP8-dynamic

Automatic Speech Recognition • 5B • Updated 5 days ago • 1.32k • 6

nm-testing/Qwen3-Coder-30B-A3B-Instruct-W4A16-awq

5B • Updated 28 days ago • 709 • 3

cpatonn/Qwen3-Omni-30B-A3B-Thinking-AWQ-4bit

Any-to-Any • 6B • Updated 1 day ago • 258 • 2

RedHatAI/Meta-Llama-3.1-8B-Instruct-FP8-dynamic

Text Generation • 8B • Updated 8 days ago • 47.4k • 6

RedHatAI/Qwen2.5-Coder-14B-Instruct-FP8-dynamic

Text Generation • 15B • Updated 7 days ago • 113 • 1

RedHatAI/Qwen2.5-14B-quantized.w8a8

Text Generation • 15B • Updated Dec 3, 2024 • 29 • 2

RedHatAI/whisper-large-v3-FP8-dynamic

Automatic Speech Recognition • 2B • Updated Apr 22 • 494 • 2

gaunernst/gemma-3-27b-it-qat-compressed-tensors

Image-Text-to-Text • 6B • Updated Apr 8 • 39.8k • 10

RedHatAI/Llama-4-Scout-17B-16E-Instruct-FP8-dynamic

Image-Text-to-Text • 109B • Updated 8 days ago • 8.86k • 27

RedHatAI/gemma-3-27b-it-FP8-dynamic

Image-Text-to-Text • 27B • Updated Jun 9 • 84.7k • 8

RedHatAI/Qwen3-8B-FP8-dynamic

Text Generation • 8B • Updated 8 days ago • 12.3k • 7

RedHatAI/Qwen3-32B-quantized.w4a16

Text Generation • 6B • Updated May 13 • 2.47k • 11

RedHatAI/Qwen3-30B-A3B-quantized.w4a16

Text Generation • 5B • Updated May 13 • 7.09k • 5

OuteAI/OuteTTS-1.0-0.6B-FP8

Text-to-Speech • 0.8B • Updated May 18 • 908 • 3

RedHatAI/Kimi-K2-Instruct-quantized.w4a16

Text Generation • Updated 8 days ago • 2.93k • 10

RedHatAI/gemma-3n-E2B-it-quantized.w4a16

Image-Text-to-Text • 4B • Updated Aug 1 • 571 • 1

cpatonn/Qwen3-4B-Instruct-2507-AWQ-4bit

Text Generation • 1B • Updated Aug 6 • 13.8k • 3

RedHatAI/gpt-oss-120b-FP8-dynamic

Text Generation • 117B • Updated Aug 26 • 1.55k • 7

NousResearch/Hermes-4-405B-FP8

Text Generation • 406B • Updated 28 days ago • 2.76k • 19

tencent/Hunyuan-MT-7B-fp8

Translation • 8B • Updated 28 days ago • 2.7k • 25