giladgd
/

Qwen3-Reranker-8B-GGUF

Model card Files Files and versions

giladgd commited on Sep 27, 2025

Commit

3398b1b

·

verified ·

1 Parent(s): e280f3c

Update README.md

Files changed (1) hide show

README.md +4 -5

README.md CHANGED Viewed

@@ -29,7 +29,6 @@ Static quants of [`Qwen/Qwen3-Reranker-8B`](https://huggingface.co/Qwen/Qwen3-Re
 | [GGUF](https://huggingface.co/giladgd/Qwen3-Reranker-8B-GGUF/resolve/main/Qwen3-Reranker-8B.Q5_K_M.gguf) | `hf:giladgd/Qwen3-Reranker-8B-GGUF:Q5_K_M` | Q5_K_M | 5.4GB |
 | [GGUF](https://huggingface.co/giladgd/Qwen3-Reranker-8B-GGUF/resolve/main/Qwen3-Reranker-8B.Q6_K.gguf) | `hf:giladgd/Qwen3-Reranker-8B-GGUF:Q6_K` | Q6_K | 6.2GB |
 | [GGUF](https://huggingface.co/giladgd/Qwen3-Reranker-8B-GGUF/resolve/main/Qwen3-Reranker-8B.Q8_0.gguf) | `hf:giladgd/Qwen3-Reranker-8B-GGUF:Q8_0` | Q8_0 | 8.0GB |
-| [GGUF](https://huggingface.co/giladgd/Qwen3-Reranker-8B-GGUF/resolve/main/Qwen3-Reranker-8B.MXFP4.gguf) | `hf:giladgd/Qwen3-Reranker-8B-GGUF:MXFP4` | MXFP4 | 8.0GB |
 | [GGUF](https://huggingface.co/giladgd/Qwen3-Reranker-8B-GGUF/resolve/main/Qwen3-Reranker-8B.F16.gguf) | `hf:giladgd/Qwen3-Reranker-8B-GGUF:F16` | F16 | 15.1GB |
 > [!TIP]
@@ -49,7 +48,7 @@ brew install nodejs
 ### CLI
 Chat with the model:
 ```bash
-npx -y node-llama-cpp chat hf:giladgd/Qwen3-Reranker-8B-GGUF:MXFP4
 ```
 ### Code
@@ -61,7 +60,7 @@ npm install node-llama-cpp
 ```typescript
 import {getLlama, resolveModelFile, LlamaChatSession} from "node-llama-cpp";
-const modelUri = "hf:giladgd/Qwen3-Reranker-8B-GGUF:MXFP4";
 const llama = await getLlama();
@@ -94,10 +93,10 @@ brew install llama.cpp
 ### CLI
 ```bash
-llama-cli -hf giladgd/Qwen3-Reranker-8B-GGUF:MXFP4 -p "The meaning to life and the universe is"
 ```
 ### Server
 ```bash
-llama-server -hf giladgd/Qwen3-Reranker-8B-GGUF:MXFP4 -c 2048
 ```

 | [GGUF](https://huggingface.co/giladgd/Qwen3-Reranker-8B-GGUF/resolve/main/Qwen3-Reranker-8B.Q5_K_M.gguf) | `hf:giladgd/Qwen3-Reranker-8B-GGUF:Q5_K_M` | Q5_K_M | 5.4GB |
 | [GGUF](https://huggingface.co/giladgd/Qwen3-Reranker-8B-GGUF/resolve/main/Qwen3-Reranker-8B.Q6_K.gguf) | `hf:giladgd/Qwen3-Reranker-8B-GGUF:Q6_K` | Q6_K | 6.2GB |
 | [GGUF](https://huggingface.co/giladgd/Qwen3-Reranker-8B-GGUF/resolve/main/Qwen3-Reranker-8B.Q8_0.gguf) | `hf:giladgd/Qwen3-Reranker-8B-GGUF:Q8_0` | Q8_0 | 8.0GB |
 | [GGUF](https://huggingface.co/giladgd/Qwen3-Reranker-8B-GGUF/resolve/main/Qwen3-Reranker-8B.F16.gguf) | `hf:giladgd/Qwen3-Reranker-8B-GGUF:F16` | F16 | 15.1GB |
 > [!TIP]
 ### CLI
 Chat with the model:
 ```bash
+npx -y node-llama-cpp chat hf:giladgd/Qwen3-Reranker-8B-GGUF:Q4_K_M
 ```
 ### Code
 ```typescript
 import {getLlama, resolveModelFile, LlamaChatSession} from "node-llama-cpp";
+const modelUri = "hf:giladgd/Qwen3-Reranker-8B-GGUF:Q4_K_M";
 const llama = await getLlama();
 ### CLI
 ```bash
+llama-cli -hf giladgd/Qwen3-Reranker-8B-GGUF:Q4_K_M -p "The meaning to life and the universe is"
 ```
 ### Server
 ```bash
+llama-server -hf giladgd/Qwen3-Reranker-8B-GGUF:Q4_K_M -c 2048
 ```