Alibaba-NLP/gte-modernbert-base

Primitive: /encode · Encode · ModernBERT

We are excited to introduce the `gte-modernbert` series of models, which are built upon the latest modernBERT pre-trained encoder-only foundation models. The `gte-modernbert` series models include both text embedding models and rerank models.

Long contextDense

View on Hugging Face → Fine-tuned from answerdotai/ModernBERT-base

Overview

Hardware: — drives latency, throughput & cost

Size	149M params
Tasks	/encode
License	apache-2.0
Languages	en
Latency	—
Throughput	—
Cost	— /1M tok

Cost is approximate — computed from list GPU prices; your actual price depends on the provider you deploy SIE with.

Embedding

Output types	Dense
Dimensions	dense: 768
Max sequence length	8,192
Inputs	text

Benchmarks

CQADupstackPhysicsRetrieval

scientific retrieval en

Duplicate question retrieval from StackExchange Physics

Corpus: 38,314 Queries: 1,039

Quality

map at 10 0.4276

mrr at 10 0.4853

ndcg at 10 0.4922

Reference →

CosQA

technology retrieval en

Code search with natural language queries

Corpus: 6,267 Queries: 500

Quality

map at 10 0.3438

mrr at 10 0.3946

ndcg at 10 0.4318

Reference →

FiQA2018

finance retrieval en

Financial opinion mining and question answering

Corpus: 57,599 Queries: 648

Quality

map at 10 0.4340

mrr at 10 0.6064

ndcg at 10 0.5243

Reference →

NFCorpus

medical retrieval en

Biomedical literature search from NutritionFacts.org

Corpus: 3,593 Queries: 323

Quality

ndcg at 10 0.3664

map at 10 0.1335

mrr at 10 0.5635

Reference →

SCIDOCS

scientific retrieval en

Citation prediction, document classification, and recommendation for scientific papers

Corpus: 25,656 Queries: 1,000

Quality

map at 10 0.1183

mrr at 10 0.3498

ndcg at 10 0.1997

Reference →

SciFact

scientific retrieval en

Scientific claim verification using research literature

Corpus: 5,183 Queries: 300

Quality

map at 10 0.7297

mrr at 10 0.7400

ndcg at 10 0.7771

Reference →

StackOverflowQA

technology retrieval en

Programming question answering from Stack Overflow

Corpus: 19,931 Queries: 1,994

Quality

map at 10 0.8955

mrr at 10 0.8955

ndcg at 10 0.9111

Reference →

Alibaba-NLP/gte-modernbert-base

Overview

Embedding

Benchmarks

CQADupstackPhysicsRetrieval

CosQA

FiQA2018

NFCorpus

SCIDOCS

SciFact

StackOverflowQA

Open source inference for agents