LMCache

LMCache 是一个用于优化大语言模型（LLM）推理性能的缓存系统，主要功能是通过存储和复用键值（KV）缓存，减少首次生成令牌时间（TTFT）并提高吞吐量，尤其适用于长上下文场景。其核心特性包括：

使用方法：通过 pip install lmcache 安装，详细用法可参考官方文档中的快速入门示例。
许可证：采用 Apache License 2.0 协议。