硬AI
2024年5月7日
媒体报道,微软 (MSFT.US)目前正在开发自家的人工智能模型,与谷歌、Anthropic 以及 OpenAI 竞争。
据了解,这是自从微软向 OpenAI 投资超过 100 亿美元以重新获得后者人工智能模型的使用权以来,微软首次开始训练一个规模足够大的内部 AI 模型。这个新模型在内部被称为 MAI-1,由 Mustafa Suleyman 负责,他曾是谷歌 AI 的负责人,此前也担任 AI 初创公司 Inflection 的首席执行官,之后微软收购了这家初创公司的大部分员工,并在 3 月份支付了 6.5 亿美元获取其知识产权。
不过内部人士透露,这个模型完全是微软自己的,而非来自 Inflection,但可能基于来自该 Inflection 的训练数据和其他技术。据两位知情的微软员工表示,MAI-1 与 Inflection 之前发布的 Pi 模型是独立的。
知情人士还说,MAI-1 将比微软之前训练过的任何小型开源模型都大,这意味着它需要更多的计算能力和训练数据,因此成本更高。MAI-1 将拥有约 5000 亿个参数,或者也可以根据训练期间模型的学习内容来调整参数环境。相比之下,OpenAI 的 GPT-4 拥有超过 1 万亿个参数,而像 Meta Platforms 和 Mistral 等公司发布的小型开源模型则拥有 700 亿个参数。
分析认为,这意味着微软现在正采取双轨路线,旨在开发既能用于应用程序并可在移动设备上运行的“小型语言模型”,同时又能开发更大、最先进的 AI 模型。知情人士之一表示,新模型的确切用途尚未确定,将取决于它的表现。
这也表明微软愿意在 AI 领域开辟一条与 OpenAI 技术不同的新路,目前微软的所有“Copilot”人工智能聊天机器人都基于 OpenAI 的技术,它们可以自动生成电子邮件或快速总结文件。截至目前,微软现在已经在 OpenAI 上投资了超过 130 亿美元,并将其模型添加到 Office 应用程序、其 Bing 搜索引擎、Edge,甚至其 Windows 操作系统中。
同时,为了训练这个新模型,微软已经为其配备了大量搭载英伟达显卡的服务器,并一直在编译一系列训练数据来提高模型的性能,其中包括从以前用于训练小型模型的各种数据集中提取的数据,包括由 OpenAI 的 GPT-4 生成的文本,以及其他来源的信息,如互联网上的公共数据。
知情人士之一表示,微软可能会在本月晚些时候的 Build 开发者大会上提前展示这个新模型,具体取决于接下来几周的开发进展。
微软股价周一美股收盘上涨 1.69%,报 413.54 美元。该公司股价今年迄今已经上涨超过 10%。
有网友对微软的决策表示肯定:
“任何拥有计算和数据能力的大型科技公司如果没能加入这场战局,那就是失职,即便水平不在第一梯队也应该加入。毕竟,如果一直旁观,并且将整个 AI 能力外包,未来将很难预测。”
但也有网友表示不看好,
“虽然一个智能的模型很重要,但围绕它构建一个代理框架的能力是提供价值的唯一途径(尤其是在企业规模来看)。而微软在这方面拥有最糟糕的框架……他们臃肿的生态系统永远不会像 Abacus、CrewAI 或一些特定平台那样精简和易于创建。”
有网友说这是消费者的福音:
“很高兴看到所有人都在 AI 聊天机器人方面疯狂砸钱,这样他们除了免费提供产品之外别无选择。”
还有网友说,认为微软之所以要自研 AI,是因为现在在 Copilot 里内置 GPT-4 的成本已经太高,快负担不起了。
有网友说,
“希望微软能做正确的事,将模型开源。”
还有网友认为微软推出自研 AI 模型后,和 OpenAI 之间的关系将变得微妙:
“这是一个很有趣的进展,因为 OpenAI 历来依靠微软 Azure 的算力来训练他们的模型。”
有博主评论,这个模型显然要从 OpenAI 拿走很多数据,意味着虽然 OpenAI 严禁分发通用人工智能(AGI),但微软正在利用 OpenAI 的力量来研发通用人工智能。
下面有网友跟帖称,
“所以 GPT5 推迟发布是因为它是 AGI,但由于马斯克的诉讼,OpenAI 现在暂时不能发布。所以这是 OpenAI 这是在花时间削弱 GPT-5 然后和微软‘咨询’如何打造一个‘有竞争力’的赚钱机器?“
但贴主表示,
“我不这么认为。我认为他们已经拥有 AGI,但还未成规模。GPT-5 还不是 AGI,但它具备了基本元素,在一般使用中表现得非常好,以至于你会感受到 AGI 的雏形。但 OpenAI 的准则禁止分发 AGI。所以微软可能别无选择,只能从 OpenAI 那里窃取并复制以创建自己的模型。当然,我们不清楚 OpenAI 和微软之间的协议详细内容,但毫无疑问,微软不会在没有预期回报的情况下向一家公司投资 800 亿美元。因此,这很可能是问题所在。”
OpenAI 首席执行官 Altman 此前则表示,GPT-5 的性能远超 GPT-4,而且 OpenAI 不怕 copy。
华尔街见闻此前报道,Altman 上月底在斯坦福大学的一次演讲中说,他不知道 AGI 何时到来,GPT-5 性能将远超 GPT-4,GPT-6 会比 GPT-5 更加厉害。
奥特曼认为,现在很多组织、个人开发者都能轻松复现 GPT-4 的能力,甚至在个别单元测试中超过它。但 OpenAI 的核心能力是技术变革,可以真正定义 AI 能力的下一个范式转变,就像苹果的 iPhone 对移动领域带来的颠覆性影响。
在谈到如何实现 AGI 时,奥特曼认为开源不是最佳途径。开源意味着放弃对技术的专有控制,对于 OpenAI 来说,他们投入大量的人力和算力资源开发的产品,需要有商业回报。
阅读 415
本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。