Pag-save sa Prompt Base sa Provider
Ang Superdav AI Agent v1.12.0 nagpaila og provider-aware prompt caching, nga makapahimo og pag-optimize sa gasto sa API ug latency pinaagi sa pag-cache sa mga prompts gikan sa lainlaing LLM providers. Ang matag provider adunay lahi kaayo nga mekanismo ug configuration sa caching.
Overview
Ang prompt caching nagtugot kanimo sa:
- Pag-save og dagko, kasagarang gigamit nga mga prompts
- Pagpamenos sa gasto sa API pinaagi sa paglikay sa sobra o duha ka beses nga pagproseso
- Pagpaayo sa latency para sa mga request nga na-cache
- Pagdumala sa cache lifecycle direkta
Lahi ang paagi sa pagpatuman og caching sa lainlaing providers:
- Google Gemini:
cachedContentsAPI - Azure OpenAI: Prompt caching uban ang TTL (Time To Live)
- OpenRouter: Caching nga espesipiko sa provider
- Vertex Anthropic: Prompt caching uban ang cache control
Google Gemini: cachedContents API
Naghatag ang Google Gemini og klaro nga pagdumala sa cache pinaagi sa cachedContents API.
Configuration
$config = [
'provider' => 'google-gemini',
'model' => 'gemini-2.0-flash',
'caching' => [
'enabled' => true,
'ttl' => 3600, // 1 hour in seconds
'max_tokens' => 1000000, // Max tokens to cache
],
];
Paghimo og Na-cache nga Prompt
use Superdav\AI\Providers\GoogleGemini;
$gemini = new GoogleGemini( $config );
$cached_content = $gemini->create_cached_content(
[
'system_prompt' => 'You are a helpful assistant...',
'context' => 'Large context document...',
'ttl' => 3600,
]
);
// Returns: ['cache_id' => 'abc123', 'expires_at' => timestamp]
Paggamit sa Na-cache nga Prompt
$response = $gemini->generate(
[
'cache_id' => 'abc123',
'prompt' => 'User question here',
]
);
Cache Lifecycle
// List cached contents
$caches = $gemini->list_cached_contents();
// Get cache details
$cache = $gemini->get_cached_content( 'abc123' );
// Extend cache TTL
$gemini->update_cached_content(
'abc123',
['ttl' => 7200] // Extend to 2 hours
);
// Delete cache
$gemini->delete_cached_content( 'abc123' );
Best Practices para sa Gemini
- I-set ang saktong TTL: Balanseha ang pagtipig og gasto batok sa ka-karaan (staleness) sa cache.
- I-cache ang system prompts: Gamita pag-usab ang parehas nga system prompt sa tanang requests.
- Monitor ang paggamit sa cache: Bantayi kung unsang mga cache ang kasagaran gigamit.
- Limpyohan ang expired caches: Regular kining i-delete ang mga cache nga wala na magamit.
Azure OpenAI: Prompt Caching
Gisuportahan sa Azure OpenAI ang prompt caching uban ang automatic TTL management.
Configuration
$config = [
'provider' => 'azure-openai',
'model' => 'gpt-4-turbo',
'api_version' => '2024-08-01-preview',
'caching' => [
'enabled' => true,
'cache_control' => 'max_age=3600',
],
];
Pagpahaktol sa Caching
use Superdav\AI\Providers\AzureOpenAI;
$azure = new AzureOpenAI( $config );
$response = $azure->generate(
[
'system_prompt' => 'You are a helpful assistant...',
'context' => 'Large context document...',
'prompt' => 'User question here',
'cache_control' => 'max_age=3600',
]
);
// Response includes cache usage:
// [
// 'content' => '...',
// 'cache_creation_input_tokens' => 1000,
// 'cache_read_input_tokens' => 500,
// ]
Cache Headers
Naggamit ang Azure OpenAI og HTTP headers para sa cache control:
Cache-Control: max_age=3600
Mga suportado nga values:
max_age=<seconds>: I-cache sulod sa gitakda nga panahon.no_cache: Ayaw i-cache kining request.no_store: Ayaw i-cache ug ayaw usab kini gamiton pag-usab.
Pagmonitor sa Cache Usage
$response = $azure->generate( [...] );
$cache_tokens = $response['cache_creation_input_tokens'] ?? 0;
$cache_hits = $response['cache_read_input_tokens'] ?? 0;
echo "Cache creation: $cache_tokens tokens\n";
echo "Cache hits: $cache_hits tokens\n";
Best Practices para sa Azure OpenAI
- Gamit og consistent nga prompts: Ang parehas nga prompts makabenepisyo gikan sa caching.
- I-set ang rasonable nga TTL: Balanseha ang gasto batok sa pagka-fresh (freshness).
- Monitor ang cache metrics: Bantayi ang paghimo ug paggamit sa cache.
- Batch og susama nga requests: Igrupo ang mga request aron ma-maximize ang cache hits.
OpenRouter: Provider-Specific Caching
Gisuportahan sa OpenRouter ang caching pinaagi sa underlying providers (OpenAI, Anthropic, etc.).
Configuration
$config = [
'provider' => 'openrouter',
'model' => 'openai/gpt-4-turbo',
'caching' => [
'enabled' => true,
'provider_cache' => 'openai', // Use OpenAI's caching
],
];
Paggamit sa OpenRouter Caching
use Superdav\AI\Providers\OpenRouter;
$router = new OpenRouter( $config );
$response = $router->generate(
[
'system_prompt' => 'You are a helpful assistant...',
'context' => 'Large context document...',
'prompt' => 'User question here',
'cache_control' => 'max_age=3600',
]
);