DIGIPUNK
去投稿

Nvidia发布NVLM 1.0多模态模型,性能媲美GPT-4o与Llama 3-V

Nvidia发布多模态大型语言模型NVLM 1.0,展示了在视觉语言与文本任务上的强大表现,特别是在OCR和自然图像理解方面。该模型权重与程序代码已开源,性能接近GPT-4o和Llama 3-V。

2024年10月03日