Fullmoon 开源项目是一款基于苹果生态的 iOS/macOS 本地大语言模型(LLM)聊天应用。它利用 Apple Silicon 强大的算力和 Apple 开源的 MLX Swift 框架,实现了在设备端离线运行 LLM,保证了数据隐私的安全性。遵循 MIT 开源协议.项目不仅提供了 iOS 客户端,还包含了 macOS 和 visionOS 的适配代码。

Fullmoon 核心定位是 ‍“私有 LLM 的最简使用方式”‍。与传统的云端 AI 不同,Fullmoon 允许用户在 iPhone、iPad、Mac 甚至 Vision Pro 等 Apple 设备上,完全离线 地运行大语言模型。这意味着用户的对话内容不会发送到服务器,而是安全地保存在本地,摆脱了对网络连接的依赖。

Fullmoon 的实现得益于苹果对机器学习框架的深度优化。它基于 Apple 官方开源的 MLX Swift 框架

  • MLX Swift:这是 Apple 在 WWDC 2025 推出的机器学习框架,专为 Apple Silicon 设计。它允许开发者在 Swift 环境中直接调用机器学习模型,利用 Metal 3 图形框架进行高效计算。
  • 硬件加速:Fullmoon 通过底层调用 Metal,直接在 iPhone、iPad 或 Mac 的 GPU 上运行模型,提供了比传统 CPU 推理更快的速度,同时大幅降低了能耗。

为了在移动设备上流畅运行,Fullmoon 支持了多种经过量化处理的模型。

  • Llama-3.2 系列:支持 1B 和 3B 参数的 Instruct 版本,且采用了 4-bit 量化技术(如 Llama-3.2-1B-Instruct-4bit),极大地减少了模型大小和内存占用。
  • DeepSeek 系列:如 DeepSeek-R1-Distill-Qwen-1.5B-4bit 等,这些模型在保持相对较小体积的同时,仍然具备较强的推理能力。

Fullmoon 不仅仅是一个运行模型的容器,它在用户体验上也下了很大功夫:

  • 主题与自定义:用户可以调整应用的主题颜色、字体大小,甚至自定义系统提示(system prompt),个性化程度高。
  • 快捷指令(Shortcuts)集成:Fullmoon 支持 iOS Shortcuts,用户可以将模型的输出作为其他自动化操作的输入,实现更灵活的工作流。
  • 离线完整体验:即便在无网络环境下,Fullmoon 依然可以调用本地模型进行对话,适合出差、旅行等场景。

源代码:https://github.com/mainframecomputer/fullmoon-ios

Apple 商店:https://apps.apple.com/us/app/fullmoon-local-intelligence/id6727014156