Nomic Embed: The First Fully Open 8192-Context Embedding Model

nomic-embed-text-v1.5 supports 8192-token context with Matryoshka embeddings at multiple dimensions - fully open training data, code, and weights under Apache 2.0.

Mahmudul Haque Qudrati

CEO & ML Engineer

May 12, 2026

7 min read

// tags

#nomic-embed#embeddings#open-source#8192-context#rag

FIG. ART-27

7 min read

“

Nomic Embed: The First Fully Open 8192-Context Embedding Model

// reading plan

sections

383

words

min read

// Developer Tools

Open Code Review – An AI-powered code review CLI tool: A Practical Overview

Open Code Review is an open-source CLI tool from Alibaba that uses AI to review code changes. It runs locally, supports multiple LLMs, and costs about $0.01 per review. Here's a practical breakdown.

4 min read

// LLMs & Language Models

When to Fine-Tune an LLM (And When to Rely on RAG Instead)

Task Prefix Convention

nomic-embed uses prefixes to signal the embedding use case:

# For retrieval queries
query_embedding = model.encode(["search_query: What causes transformer models to hallucinate?"])

# For documents being indexed
doc_embedding = model.encode(["search_document: Hallucination in LLMs occurs when..."])

# For classification/clustering (no prefix)
cluster_embedding = model.encode(["Machine learning is a subset of artificial intelligence"])

MTEB Performance

nomic-embed-text-v1.5 achieves an MTEB (Massive Text Embedding Benchmark) average of 62.3% - competitive with OpenAI's text-embedding-3-small (62.3%) and substantially better than all-MiniLM-L6-v2 (56.3%). The key differentiator is the 8192 context at equivalent quality.

nomic-embed-vision

Nomic also released nomic-embed-vision, a CLIP-compatible image embedding model aligned to the same embedding space as nomic-embed-text. This means you can embed both images and text into the same vector space and do cross-modal retrieval without a separate model:

from PIL import Image
from sentence_transformers import SentenceTransformer

vision_model = SentenceTransformer("nomic-ai/nomic-embed-vision-v1.5", trust_remote_code=True)
text_model = SentenceTransformer("nomic-ai/nomic-embed-text-v1.5", trust_remote_code=True)

image_emb = vision_model.encode(Image.open("diagram.png"))
text_emb = text_model.encode(["search_query: neural network architecture diagram"])
similarity = np.dot(image_emb, text_emb.T)

Deployment With Ollama

ollama pull nomic-embed-text
curl http://localhost:11434/api/embeddings -d '{
  "model": "nomic-embed-text",
  "prompt": "search_document: Your document text here"
}'

Full Openness Under Apache 2.0

Unlike most embedding models where the training data and pipeline are proprietary, nomic-embed releases training code, training data details, and weights under Apache 2.0 - enabling auditing, fine-tuning, and commercial deployment without restriction.

Nomic Embed: The First Fully Open 8192-Context Embedding Model

Related Articles

Open Code Review – An AI-powered code review CLI tool: A Practical Overview

The 512-Token Bottleneck

Matryoshka Embeddings

Task Prefix Convention

MTEB Performance

nomic-embed-vision

Deployment With Ollama

Full Openness Under Apache 2.0

Links

The workspace your team
actually needs

AI & ML insights, weekly

Mahmudul Haque Qudrati

When to Fine-Tune an LLM (And When to Rely on RAG Instead)

ONNX: Export Any ML Model and Run It Anywhere

Nomic Embed: The First Fully Open 8192-Context Embedding Model

Related Articles

Open Code Review – An AI-powered code review CLI tool: A Practical Overview

The 512-Token Bottleneck

Matryoshka Embeddings

Task Prefix Convention

MTEB Performance

nomic-embed-vision

Deployment With Ollama

Full Openness Under Apache 2.0

Links

The workspace your teamactually needs

AI & ML insights, weekly

Mahmudul Haque Qudrati

When to Fine-Tune an LLM (And When to Rely on RAG Instead)

ONNX: Export Any ML Model and Run It Anywhere

The workspace your team
actually needs