在科技与自然的交汇处,一款名为 whoBIRD 的开源Android应用正为全球鸟类爱好者打开全新的观察视角。基于康奈尔大学 BirdNET 项目的先进框架,whoBIRD 凭借机器学习算法,实现了对全球 6000多种鸟类 声音的实时识别,且完全无需网络连接。项目基于Kotlin和Java编写,遵守GPL 3.0开源协议。

核心技术:BirdNET与设备端AI的完美结合

whoBIRD 的核心依赖于 BirdNET 开源框架,其声音识别模型基于 TensorFlow Lite 实现,所有计算均在本地设备完成,无需依赖云端服务。首次启动时,应用会自动下载约 300MB 的模型文件,此后即可在森林、湖泊甚至偏远山区等无网络环境中实时分析鸟鸣。这种离线设计不仅保障了隐私,也大幅降低了使用门槛。


功能特色:

  1. 实时声音识别
    • 打开应用即可自动监听环境声,通过频谱分析快速匹配鸟种,结果以概率排序显示。用户反馈显示,其对常见鸟类(如煤山雀、麻雀)的识别准确率较高,但对人类模仿的鸟鸣可能误判为“口哨”。
    • 支持 高置信度时自动下载鸟类图片(需手动开启和联网),但需注意存储空间占用。
  2. 数据管理
    • 检测记录可通过 CSV导出 进行科研分析,并支持备份、分享或删除数据库。
    • 可启用保存 .wav 文件 :每次检测后,都会在 Music 目录中保存一个 .wav 文件。

应用场景:从爱好者到研究者的多元需求

  • 自然观察:在野外快速识别鸟种,记录出现频率与地点。
  • 教育推广:内置鸟类百科与趣味铃声,帮助普及生态知识。
  • 科学研究:长期采集声音数据,辅助生物多样性监测。

开源优势:透明、自由与社区共建

与康奈尔大学官方应用 Merlin(需注册且闭源)不同,whoBIRD 遵循 GPLv3协议 完全开源,代码托管于 GitHub。其依赖的生态项目包括:

  • BirdNET(CC BY NC SA 4.0):提供声音识别模型。
  • TensorFlow(Apache 2.0):支持机器学习推理。
  • Zip4j与iirj:处理音频压缩与滤波。

用户可通过 F-Droid 安装最新版本,并参与多语言翻译以完善社区支持。


用户评价与横向对比

  • 便携性:相比需携带树莓派等硬件的 BirdNet-Pi Portable,whoBIRD 仅需一部手机即可运行,隐蔽性更强。
  • 功能性:虽界面不如 Merlin 精美,但核心识别能力接近,且无需注册即可使用。

总结

whoBIRD 不仅是一款工具,更是开源精神与自然保护的结合体。它降低了鸟类识别的技术门槛,让每个人都能成为公民科学家,记录并守护地球的生物多样性。无论是野外探险者、教育工作者,还是技术极客,都能在这款应用中找到属于自己的自然之声。

https://github.com/woheller69/whoBIRD

F-driod下载:https://f-droid.org/packages/org.woheller69.whobird/