> ## Documentation Index
> Fetch the complete documentation index at: https://veniceai-mintlify-6ce01df5.mintlify.site/llms.txt
> Use this file to discover all available pages before exploring further.

# حدود المعدل

> حدود معدل الطلبات والـ tokens لـ Venice API.

تختلف حدود المعدل حسب النموذج والمستوى. الحدود الافتراضية أدناه مرجع مفيد، لكن endpoint API `/api_keys/rate_limits` هي الطريقة الرسمية لجلب حدودك الحالية. يمكنك التحقق من حدودك الدقيقة في أي وقت:

<CardGroup cols={2}>
  <Card title="عرض حدودك" icon="gauge-high" href="/api-reference/endpoint/api_keys/rate_limits?playground=open">
    ساحة لعب تفاعلية
  </Card>

  <Card title="سجلات حدود المعدل" icon="clock-rotate-left" href="/api-reference/endpoint/api_keys/rate_limit_logs?playground=open">
    شاهد الطلبات التي وصلت إلى الحدود
  </Card>
</CardGroup>

```bash theme={"system"}
curl https://api.venice.ai/api/v1/api_keys/rate_limits \
  -H "Authorization: Bearer $VENICE_API_KEY"
```

## الحدود الافتراضية

### نماذج النصوص

تُجمَّع نماذج النصوص في مستويات بناءً على الحجم. تعرض كل بطاقة نموذج في [صفحة النماذج](/models/text) شارة مستواها.

| المستوى | طلبات/دقيقة | Tokens/دقيقة |
| :------ | ----------: | -----------: |
| XS      |         500 |    1,000,000 |
| S       |          75 |      750,000 |
| M       |          50 |      750,000 |
| L       |          20 |      500,000 |

<Accordion title="ما هي النماذج في كل مستوى؟">
  **XS** `qwen3-4b` `llama-3.2-3b`

  **S** `mistral-31-24b` `venice-uncensored`

  **M** `zai-org-glm-5` `qwen3-next-80b` `google-gemma-3-27b-it`

  **L** `qwen3-235b-a22b-instruct-2507` `qwen3-235b-a22b-thinking-2507` `deepseek-ai-DeepSeek-R1` `grok-41-fast` `kimi-k2-thinking` `gemini-3-pro-preview` `hermes-3-llama-3.1-405b` `qwen3-coder-480b-a35b-instruct` `zai-org-glm-4.7` `openai-gpt-oss-120b`
</Accordion>

### النماذج الأخرى

| النوع            | طلبات/دقيقة |
| :--------------- | ----------: |
| Image            |          20 |
| Audio            |          60 |
| Embedding        |         500 |
| Video (queue)    |          40 |
| Video (retrieve) |         120 |

## التعامل مع الأخطاء

يجب إعادة محاولة الطلبات الفاشلة (500، 503، 429) باستخدام exponential backoff.

بالنسبة لأخطاء 429 تحديدًا، تحقق من header `x-ratelimit-reset-requests` للحصول على الطابع الزمني Unix الدقيق متى يمكنك إعادة المحاولة. تحتوي معظم مكتبات HTTP على آليات إعادة محاولة مدمجة تتعامل مع هذا تلقائيًا.

### الحماية من الإساءة

إذا قمت بتوليد أكثر من 20 طلبًا فاشلًا في 30 ثانية، ستحظر الـ API الطلبات الإضافية لمدة 30 ثانية:

```
Too many failed attempts (> 20) resulting in a non-success status code. Please wait 30s and try again.
```

## رؤوس الاستجابة

تتضمن كل استجابة هذه الرؤوس:

| Header                           | الوصف                                              |
| :------------------------------- | :------------------------------------------------- |
| `x-ratelimit-limit-requests`     | الحد الأقصى للطلبات المسموح بها في النافذة الحالية |
| `x-ratelimit-remaining-requests` | الطلبات المتبقية في النافذة الحالية                |
| `x-ratelimit-reset-requests`     | طابع Unix الزمني عند إعادة تعيين النافذة           |
| `x-ratelimit-limit-tokens`       | الحد الأقصى لـ tokens المسموح به في الدقيقة        |
| `x-ratelimit-remaining-tokens`   | الـ tokens المتبقية في الدقيقة الحالية             |
| `x-ratelimit-reset-tokens`       | الثواني حتى إعادة تعيين حد الـ tokens              |

## مستوى الشريك

يحصل الشركاء على حدود معدل أعلى بكثير:

| المستوى | طلبات/دقيقة | Tokens/دقيقة |
| :------ | ----------: | -----------: |
| XS      |         500 |    2,000,000 |
| S       |         150 |    1,500,000 |
| M       |         100 |    1,500,000 |
| L       |          60 |    1,000,000 |

| النوع     | طلبات/دقيقة |
| :-------- | ----------: |
| Image     |          60 |
| Audio     |         120 |
| Embedding |         500 |

إذا كنت تصل باستمرار إلى حدود المعدل وتُظهِر أنماط استخدامك **طلبًا مستمرًا عبر الزمن**، تواصل لمناقشة الوصول كشريك: [api@venice.ai](mailto:api@venice.ai).

يمكن تعديل حدود مستوى الشريك بناءً على احتياجاتك المحددة.