gpt-oss-120b

groq • Performance Analytics

Core Performance Metrics

Total Requests

579

9.7%

Error Rate

1.73%

981.3%

Total Input Tokens

1,424,629

29.1%

Total Output Tokens

137,986

18.8%

Access gpt-oss-120b through LangDB AI Gateway

Recommended

Integrate with openai's gpt-oss-120b and 250+ other models through a unified API. Monitor usage, control costs, and enhance security.

Unified API

Cost Optimization

Enterprise Security

Get Started Now

Free tier available • No credit card required

Instant Setup

99.9% Uptime

10,000+Monthly Requests

Performance Percentiles

Response Time

0.76s

23.9%

TTFT

0.33s

36.0%

TPS (Tokens/Second)

3546.9 TPS

4.3%

TPOT (Time/Output Token)

0.000ms

Performance Analytics for gpt-oss-120b

Usage Statistics (Last 4 Days):

Total Requests: 579 API calls
Average TPS: 3546.92 tokens per second
Average Response Time: 760.90ms
Average Time to First Token: 333.00ms
Total Cost: $0.38
Average Request Cost: $0.0007

Daily Performance Breakdown:

Date	Requests	TPS	Response Time	TTFT	Cost
10/3/2025	200	2789.43	995.70ms	488.60ms	$0.14
10/4/2025	84	3766.01	776.40ms	246.10ms	$0.06
10/7/2025	294	4347.47	595.30ms	249.20ms	$0.17
10/8/2025	1	508.85	1171.30ms	1171.30ms	$0.00

Performance Summary:

Model: gpt-oss-120b by groq

Monitoring Period: 10/2/2025 to 10/9/2025

Average Daily Requests: 145

Peak Daily Requests: 294

Performance Trends

Oct 2 - Oct 9, 2025

Request Volume

Daily API requests

579

Performance (TPS)

Tokens per second

3546.92 tokens/s

Response Time

Average response latency (ms)

760.90 ms

TTFT

Time to First Token (ms)

333.00 ms

Token Analytics

Token usage distribution and efficiency metrics

Token Distribution

Input vs Output token usage

Input Tokens:1,424,629

Output Tokens:137,986

Total Tokens:1,562,615

Token Usage Timeline