---
title: nomic-ai/nomic-embed-text-v2-moe
description: Blog | Technical Report | AWS SageMaker | Atlas Embedding and Unstructured Data Analytics Platform. NomicBERT, 475M parameters.
canonical_url: https://superlinked.com/models/nomic-ai-nomic-embed-text-v2-moe
last_updated: 2026-05-25
---

# nomic-ai/nomic-embed-text-v2-moe

Blog | Technical Report | AWS SageMaker | Atlas Embedding and Unstructured Data Analytics Platform

Source: [nomic-ai/nomic-embed-text-v2-moe on HuggingFace](https://huggingface.co/nomic-ai/nomic-embed-text-v2-moe)
Base model: [nomic-ai/nomic-embed-text-v2-moe-unsupervised](https://huggingface.co/nomic-ai/nomic-embed-text-v2-moe-unsupervised)

## Overview

| Field | Value |
|-------|-------|
| Architecture | NomicBERT |
| Parameters | 475M |
| Tasks | Encode |
| Outputs | Dense |
| Dimensions | Dense: 768 |
| Max sequence length | 2,048 tokens |
| License | apache-2.0 |
| Inputs | text |
| Languages | en, es, fr, de, it, pt, pl, nl, tr, ja, vi, ru, id, ar, cs, ro, sv, el, uk, zh, hu, da, no, hi, fi, bg, ko, sk, th, he, ca, lt, fa, ms, sl, lv, mr, bn, sq, cy, be, ml, kn, mk, ur, fy, te, eu, sw, so, sd, uz, co, hr, gu, ce, eo, jv, la, zu, mn, si, ga, ky, tg, my, km, mg, pa, sn, ha, ht, su, gd, ny, ps, ku, am, ig, lo, mi, nn, sm, yi, st, tl, xh, yo, af, ta, tn, ug, az, ba, bs, dv, et, gl, gn, gv, hy |

## Benchmarks

### CQADupstackPhysicsRetrieval

Domain: scientific · Task: retrieval · Language: en

Duplicate question retrieval from StackExchange Physics

Corpus: 38,314 · Queries: 1,039

**Performance (L4 b1 c16):** Corpus 13.0K tok/s · Corpus p50 149.6ms · Query 1.2K tok/s · Query p50 143.2ms

[Reference](http://nlp.cis.unimelb.edu.au/resources/cqadupstack/)

### CosQA

Domain: technology · Task: retrieval · Language: en

Code search with natural language queries

Corpus: 6,267 · Queries: 500

**Performance (L4 b1 c16):** Corpus 807 tok/s · Corpus p50 595.7ms · Query 139 tok/s · Query p50 634.4ms

[Reference](https://arxiv.org/abs/2105.13239)

### NanoFiQA2018Retrieval

Domain: finance · Task: retrieval · Language: en

Smaller subset of the FiQA financial QA dataset

**Quality:** ndcg at 10: 0.5207 · map at 10: 0.4283 · mrr at 10: 0.5634

**Performance (L4 b1 c16):** Corpus 20.1K tok/s · Corpus p50 135.4ms · Query 1.7K tok/s · Query p50 119.2ms

[Reference](https://sites.google.com/view/fiqa/)

### SCIDOCS

Domain: scientific · Task: retrieval · Language: en

Citation prediction, document classification, and recommendation for scientific papers

Corpus: 25,656 · Queries: 1,000

**Performance (L4 b1 c16):** Corpus 2.4K tok/s · Corpus p50 1.3s · Query 74 tok/s · Query p50 1.7s

[Reference](https://allenai.org/data/scidocs)

### StackOverflowQA

Domain: technology · Task: retrieval · Language: en

Programming question answering from Stack Overflow

Corpus: 19,931 · Queries: 1,994

**Performance (L4 b1 c16):** Corpus 24.1K tok/s · Corpus p50 145.6ms · Query 33.4K tok/s · Query p50 142.9ms

[Reference](https://arxiv.org/abs/2407.02883)