(01)
Кэширование ответов LLM — как срезать счёт за API вдвое
В типовом продакшен-LLM 40–60% запросов повторяются дословно или семантически. Разбираем 4 уровня кэша: exact, prompt cache, семантический, на retrieve — и где какие риски.
→
(02)
Стратегии Service Worker для работы без сети
Cache-first, network-first, stale-while-revalidate — каждая стратегия для своих данных. Что и куда применять.
→