英伟达创始人黄仁勋最爱用的 AI 聊天机器人是什么?《连线》杂志的采访揭开了谜底——Perplexity

没有狂轰滥炸的广告宣传,也没有声嘶力竭的吆喝,仅凭创始人的苦口婆心和一群忠实拥趸的口口相传,Perplexity 的月活跃用户便已轻松越过了千万的门槛,其在 iOS 与 Android 平台上的应用下载量,也已轻松破百万

然而, 今天, Perplexity 有了开源版本, 目前在 Github 上已经获得了 10K + 的 Star 数.

https://github.com/ItzCrazyKns/Perplexica

概述

Perplexica 是一个开源的 AI 驱动搜索工具或 AI 驱动的搜索引擎,能够深入互联网寻找答案。受 Perplexity AI 启发,它不仅进行网页搜索,还能理解你的问题。它使用相似性搜索和嵌入等先进的机器学习算法来优化结果,并提供带有引用来源的清晰答案。

使用 SearxNG 来保持最新状态并完全开源,Perplexica 确保你始终能获取最新信息,同时不损害你的隐私。

特性

  • 本地 LLMs:你可以使用 Ollama 利用本地 LLMs(如 Llama3 和 Mixtral)。
  • 两种主要模式
    • Copilot 模式:(正在开发中)通过生成不同的查询来增强搜索,以找到更相关的互联网资源。类似于普通搜索,而不是仅仅使用 SearxNG 的上下文,它会访问最匹配的结果,并尝试直接从页面找到与用户查询相关的资源。
    • 普通模式:处理你的查询并执行网页搜索。
  • 专注模式:为更好地回答特定类型的问题而设的特殊模式。Perplexica 目前有 6 种专注模式:
    • 全模式:搜索整个网络以找到最佳结果。
    • 写作助手模式:有助于不需要搜索网络的写作任务。
    • 学术搜索模式:查找文章和论文,适合学术研究。
    • YouTube 搜索模式:根据搜索查询查找 YouTube 视频。
    • Wolfram Alpha 搜索模式:使用 Wolfram Alpha 回答需要计算或数据分析的查询。
    • Reddit 搜索模式:在 Reddit 上搜索与查询相关的讨论和意见。
  • 最新信息:一些搜索工具可能会提供过时的信息,因为它们使用来自爬虫机器人的数据,并将其转换为嵌入并存储在索引中。而 Perplexica 使用 SearxNG(一种元搜索引擎)来获取结果,并重新排名,找到最相关的资源,确保你总是能获取最新的信息,而不需要每天更新数据。

Perplexica 的架构

  • 用户界面:一个基于网络的界面,允许用户与 Perplexica 互动,以搜索图片、视频等内容。
  • 代理/链:这些组件预测 Perplexica 的下一步行动,理解用户查询,并决定是否需要进行网页搜索。
  • SearXNG:Perplexica 使用的元搜索引擎,用于在网络上搜索资源。
  • LLMs(大语言模型):代理和链使用的大语言模型,用于理解内容、撰写回应和引用来源。例子包括 Claude、GPT 等。
  • 嵌入模型:为了提高搜索结果的准确性,嵌入模型使用相似性搜索算法(如余弦相似性和点积距离)重新排名结果。

使用

Perplexica 支持使用 Docker 部署, 你只需要:

  1. git clone https://github.com/ItzCrazyKns/Perplexica.git
  2. 编辑 config.toml, 设置 OPENAI / OLLAMA(本地部署) 等 API KEY
  3. docker compose up -d

即可拥有属于你自己的 Perplexity, 还不赶快试试!