cross-encoder/ms-marco-MiniLM-L-6-v2

Primitive: /score · Score · BERT

This model was trained on the MS Marco Passage Ranking task.

View on Hugging Face → Fine-tuned from cross-encoder/ms-marco-MiniLM-L12-v2

Overview

Hardware: — drives latency, throughput & cost

Size	23M params
Tasks	/score
License	apache-2.0
Languages	en
Latency	46 ms
Throughput	51.1K tok/s
Cost	$0.0043 /1M tok

Cost is approximate — computed from list GPU prices; your actual price depends on the provider you deploy SIE with.

Scoring

Inputs	text
Max sequence length	512

Benchmarks

AskUbuntuDupQuestions

technology reranking en

Duplicate question detection from AskUbuntu

Corpus: 6,743 Queries: 360

Quality

ndcg at 10 0.6027

map at 10 0.4439

mrr at 10 0.6776

Performance L4 b1 c16

Query 948 tok/s

Query p50 362.8ms

Reference →

CMedQAv1Reranking

medical reranking zh

Chinese medical question answering reranking (v1)

Corpus: 100,000 Queries: 2,000

Quality

map at 10 0.0835

mrr at 10 0.1371

Reference →

CMedQAv2Reranking

medical reranking zh

Chinese medical question answering reranking (v2)

Corpus: 108,000 Queries: 4,000

Quality

map at 10 0.0926

mrr at 10 0.1425

Reference →

CQADupstackPhysicsRetrieval?candidates_model=Alibaba-NLP

general retrieval en

Performance L4 b1 c16

Query 44.3K tok/s

Query p50 44.6ms

CosQA?candidates_model=Alibaba-NLP

general retrieval en

Performance L4 b1 c16

Query 20.5K tok/s

Query p50 43.6ms

FiQA2018?candidates_model=Alibaba-NLP

general retrieval en

Performance L4 b1 c16

Query 51.1K tok/s

Query p50 43.4ms

LegalBenchConsumerContractsQA?candidates_model=Alibaba-NLP

general retrieval en

Performance L4 b1 c16

Query 91.7K tok/s

Query p50 45.6ms

MMarcoReranking

general reranking zh

Multilingual MARCO passage reranking (Chinese)

Quality

map at 10 0.0543

mrr at 10 0.0544

Performance L4 b1 c16

Reference →

NFCorpus?candidates_model=Alibaba-NLP

general retrieval en

Performance L4 b1 c16

Query 70.8K tok/s

Query p50 45.9ms

NanoFiQA2018Retrieval

finance retrieval en

Smaller subset of the FiQA financial QA dataset

Performance L4 b1 c16

Query 7.5K tok/s

Query p50 388.1ms

Reference →

SCIDOCS?candidates_model=Alibaba-NLP

general retrieval en

Performance L4 b1 c16

Query 53.7K tok/s

Query p50 42.5ms

SciFact?candidates_model=Alibaba-NLP

general retrieval en

Performance L4 b1 c16

Query 67.4K tok/s

Query p50 42.1ms

StackOverflowQA?candidates_model=Alibaba-NLP

general retrieval en

Performance L4 b1 c16

Query 98.6K tok/s

Query p50 47.2ms

T2Reranking

general reranking zh

Chinese passage ranking benchmark

Quality

map at 10 0.4714

mrr at 10 0.7102

Reference →

cross-encoder/ms-marco-MiniLM-L-6-v2

Overview

Scoring

Benchmarks

AskUbuntuDupQuestions

CMedQAv1Reranking

CMedQAv2Reranking

CQADupstackPhysicsRetrieval?candidates_model=Alibaba-NLP

CosQA?candidates_model=Alibaba-NLP

FiQA2018?candidates_model=Alibaba-NLP

LegalBenchConsumerContractsQA?candidates_model=Alibaba-NLP

MMarcoReranking

NFCorpus?candidates_model=Alibaba-NLP

NanoFiQA2018Retrieval

SCIDOCS?candidates_model=Alibaba-NLP

SciFact?candidates_model=Alibaba-NLP

StackOverflowQA?candidates_model=Alibaba-NLP

T2Reranking

Open source inference for agents