开源创新
MiniCPM-V 2.6是OpenBMB推出的最新版本,针对中文自然语言处理进行了进一步优化。它在减少参数量的同时,保持了高效的文本生成和理解能力,为开发者提供了更加灵活的部署选择。该版本特别适合在计算资源有限的环境中应用,进一步推动了中文预训练模型的普及和发展。
微软联合加州大学等机构最近发布了一款名为MM-Navigator的多模态大模型。该模型基于GPT-4V技术构建,旨在改善智能手机GUI(图形用户界面)的零镜头导航能力。MM-Navigator允许智能手机屏幕实现类似人类用户的交互方式,并能根据给定指示决定后续行动。该模型特别强调其在屏幕解释、行动推理和行动定位方面的先进能力