Edit Models filters

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

26,959

Full-text search

Active filters: 8-bit

openai/gpt-oss-120b

Text Generation • 120B • Updated Aug 26, 2025 • 3.1M • • 4.45k

openai/gpt-oss-20b

Text Generation • 22B • Updated Aug 26, 2025 • 5.98M • • 4.31k

nvidia/NVIDIA-Nemotron-3-Nano-30B-A3B-NVFP4

Text Generation • 18B • Updated 8 days ago • 91k • 76

microsoft/bitnet-b1.58-2B-4T

Text Generation • 0.8B • Updated Dec 17, 2025 • 6.44k • 1.29k

GadflyII/GLM-4.7-Flash-NVFP4

Text Generation • 18B • Updated 17 days ago • 266k • 58

mlx-community/Qwen3-Coder-Next-8bit

Text Generation • 80B • Updated 3 days ago • 725 • 6

openai/gpt-oss-safeguard-20b

Text Generation • 22B • Updated 23 days ago • 33.7k • • 190

mlx-community/Qwen3-ASR-1.7B-8bit

0.8B • Updated 8 days ago • 503 • 7

MultiverseComputingCAI/HyperNova-60B

Text Generation • 60B • Updated 29 days ago • 1.5k • 51

unsloth/NVIDIA-Nemotron-3-Nano-30B-A3B-NVFP4

Text Generation • 18B • Updated 9 days ago • 241 • 6

RedHatAI/Qwen3-VL-235B-A22B-Instruct-NVFP4

Text Generation • 133B • Updated Dec 4, 2025 • 14k • 10

Salyut1/GLM-4.7-NVFP4

Text Generation • 177B • Updated Dec 23, 2025 • 3.88k • 14

GadflyII/GLM-4.7-Flash-MXFP4

Text Generation • 18B • Updated 11 days ago • 9.2k • 8

inferencerlabs/Qwen3-Coder-Next-MLX-9bit

Text Generation • 80B • Updated 3 days ago • 764 • 3

MaziyarPanahi/Qwen3-14B-GGUF

Text Generation • 15B • Updated Apr 28, 2025 • 262k • 7

nvidia/Qwen3-30B-A3B-NVFP4

Text Generation • 16B • Updated Sep 10, 2025 • 23.6k • 23

unsloth/gpt-oss-20b

Text Generation • 22B • Updated Aug 9, 2025 • 31.2k • 41

openai/gpt-oss-safeguard-120b

Text Generation • 120B • Updated Oct 29, 2025 • 25.9k • 84

nvidia/NVIDIA-Nemotron-Nano-12B-v2-VL-NVFP4-QAD

Image-Text-to-Text • 8B • Updated Nov 13, 2025 • 36.2k • 17

kldzj/gpt-oss-120b-heretic-v2

Text Generation • 117B • Updated Nov 18, 2025 • 378 • 19

lukealonso/MiniMax-M2.1-NVFP4

115B • Updated Jan 6 • 27.3k • 21

GadflyII/GLM-4.6V-NVFP4

Image-Text-to-Text • 62B • Updated 25 days ago • 5.82k • 4

lmstudio-community/GLM-4.7-Flash-MLX-8bit

Text Generation • 30B • Updated 15 days ago • 778k • 7

mlx-community/Qwen3-TTS-12Hz-1.7B-CustomVoice-8bit

Text-to-Speech • 0.8B • Updated 11 days ago • 935 • 4

CalamitousFelicitousness/HunyuanImage-3.0-Instruct-Distil-SDNQ-4bit-dynamic

Image-to-Image • 45B • Updated 7 days ago • 72 • 2

DeathGodlike/SicariusSicariiStuff_Assistant-Pepe-8B_EXL3

Text Generation • Updated 5 days ago • 2 • 2

mlx-community/GLM-OCR-8bit

Image-to-Text • 0.6B • Updated 3 days ago • 520 • 2

EpistemeAI/rsi-gpt-oss-120bv2-8bit

Text Generation • 120B • Updated about 7 hours ago • 126 • 2

StefanKrsteski/Phi-3-mini-4k-instruct-GPTQ-8bit

Text Generation • 4B • Updated Jun 8, 2024 • 27 • 2

MaziyarPanahi/Mistral-Nemo-Instruct-2407-GGUF

Text Generation • 12B • Updated Jul 22, 2024 • 181k • 51