Mlx lm ml explore mlx-lm ¶ MLX LM 是面向 Apple 芯片的 Python 包,可在 MLX 上生成文本并微调大型语言模型。它支持与 Hugging Face Hub 集成、模型量化与上传、低秩与全量微调、分布式推理和训练,并提供命令行与 Python API 进行生成、聊天、流式输出、采样控制。还支持长提示优化(旋转 KV 缓存与提示缓存)、批量生成,以及大量 Hugging Face 模型的加载与量化转换。