Moondream是一个免费开源的小型的人工智能视觉语言模型,虽然参数量小(Moondream1仅16亿,Moondream2为18.6亿)但可以提供高性能的视觉处理能力,可在本地计算机甚至移动设备或 Raspberry Pi 上运行,能够快速理解和处理输入的图像信息并对用户提出的问题进行解答。该模型由开发人员vikhyatk推出,使用SigLP、Phi-1.5和LLaVa训练数据集和模型权重初始化进行构建。Moondream基于宽松的Apache 2.0许可证,允许商用。

确认电脑上已安装Git和Python3,然后打开终端命令依次运行以下命令:

然后打开浏览器在moondream2 gradio界面中上传图像和输入文本提示,点击Submit即可

Moondream – 开源的轻量级AI视觉语言模型,可在本地快速运行  第1张
(图片来源网络,侵删)

同样首先确认电脑上已安装Git和Python3,然后打开终端命令依次运行以下命令:

然后浏览器打开 http://localhost:8501 即可运行

Moondream – 开源的轻量级AI视觉语言模型,可在本地快速运行  第2张
(图片来源网络,侵删)