鸿海精密工业股份有限公司近期提交了 "FoxBrain" 商标注册申请,该模型是富士康首款 AI 推理大模型及台湾省首个此类系统。FoxBrain 由鸿海研究院开发,基于 Meta 的 Llama3.1 架构,针对繁体中文优化,潜在应用于企业智能决策领域。
OpenAI宣布从即日起至9月23日,免费为4级、5级用户提供GPT-4o mini微调服务,每天限制200万tokens。9月24日后将收取每100万tokens 3美元的费用,显著降低开发成本,意在应对Meta的Llama3.1系列模型竞争。
浪潮信息推出“源2.0-M32”大模型,采用“基于注意力机制的门控网络”技术,构建32个专家的混合专家模型(MoE),显著提升了算力效率。M32在仅激活37亿参数的情况下,达到了与700亿参数LLaMA3相当的性能,所消耗算力仅为LLaMA3的1/19。
幻方量化旗下AI公司DeepSeek发布全新第二代MoE大模型DeepSeek-V2。该模型性能接近GPT-4Turbo,具备2360亿参数,每token激活210亿参数,支持128K上下文长度,成本显著降低。
科技界近日传出消息,Meta正计划于今年7月推出其最新的人工智能大模型Llama3,旨在其性能上能与OpenAI的GPT-4匹敌。