Qwen
/

Qwen3-Embedding-0.6B

Feature Extraction

sentence-transformers

text-generation

sentence-similarity

text-embeddings-inference

text-generation-inference

Model card Files Files and versions

alvarobartt HF Staff commited on Jun 16

Commit

b92a382

·

verified ·

1 Parent(s): 72bb2d1

Update README.md

Files changed (1) hide show

README.md +3 -3

README.md CHANGED Viewed

@@ -207,19 +207,19 @@ print(scores.tolist())
 ### Text Embeddings Inference (TEI) Usage
-You can either deploy TEI on CPU as:
 ```bash
 docker run -p 8080:80 -v hf_cache:/data --pull always ghcr.io/huggingface/text-embeddings-inference:cpu-1.7.2 --model-id Qwen/Qwen3-Embedding-0.6B
 ```
-Or on NVIDIA GPU devices as:
 ```bash
 docker run --gpus all -p 8080:80 -v hf_cache:/data --pull always ghcr.io/huggingface/text-embeddings-inference:1.7.2 --model-id Qwen/Qwen3-Embedding-0.6B --dtype float16
 ```
-And then generate embeddings sending a HTTP POST request as:
 ```bash
 curl http://localhost:8080/embed \

 ### Text Embeddings Inference (TEI) Usage
+You can either run / deploy TEI on NVIDIA GPUs as:
 ```bash
 docker run -p 8080:80 -v hf_cache:/data --pull always ghcr.io/huggingface/text-embeddings-inference:cpu-1.7.2 --model-id Qwen/Qwen3-Embedding-0.6B
 ```
+Or on CPU devices as:
 ```bash
 docker run --gpus all -p 8080:80 -v hf_cache:/data --pull always ghcr.io/huggingface/text-embeddings-inference:1.7.2 --model-id Qwen/Qwen3-Embedding-0.6B --dtype float16
 ```
+And then, generate the embeddings sending a HTTP POST request as:
 ```bash
 curl http://localhost:8080/embed \