—
62人的公司,卖了94亿!
来源 / 融中财经 (ID:thecapital)
作者 / 张淼 · 编辑 / 吾人
近日,大数据巨头公司Databricks宣布亿13亿美元的价格(约合94亿人民币)收购生成式AI初创公司MosaicML。该笔发生在美国硅谷的收购案,为年内生成式AI领域内公布的最大一笔。引来业界高度关注。
MosaicML于2021年成立于美国旧金山,其刚成立不久便成功完成了第一轮融资,知名风投DCVC、Lux Capital、Future Ventures等投资机构参与,MosaicML共获得3700万美元的融资。
第一轮融资时,MosaicML公司估值为2.2亿美元,但在此次收购中,MosaicML的估值直接提高近6倍,令业界感到惊叹。
成立不到两年,估值便如此之高,这家生成式AI初创公司到底有何“看家本领”?
01
AI模型服务企业端
产品质优价廉
根据公开资料显示,MosaicML的产品组合包括开源的、商业授权的MPT Foundation系列模型和MosaicML 推理和训练服务。
其推出的MosaicML Composer开源的深度学习库,提供20种用于计算机视觉和自然语言处理的方法,包括模型、数据集和基准。推出的MosaicML Explorer可以帮助开发人员探索和理解不同的云服务和硬件选项之间的时间、性能和成本,以简化和评估实施选项。推出的MosaicML AI开发平台,提供了成本效益高的模型部署和定制训练,同时保证数据安全,使用户能够拥有模型的所有权等。
值得一提的是,MPT基础模型系列是MosaicML 提供的一系列开源、商业可用的大型语言模型,它们可以作为用户构建自己的生成式AI应用的基础。
MosaicML 的MPT基础模型系列包括MPT-7B 和MPT-30B 两个模型,分别有70亿和300亿个参数。
MPT-7B是MosaicML在今年5月5日发布的类ChatGPT开源大语言模型。MPT-7B 在MosaicML平台上进行了9.5天的训练,零人工干预,成本仅用了20万美元。该模型具备可商业化、高性能、资源消耗低、1T训练数据、可生成代码等技术优势。
AI2、Generally Intelligence、Hippocratic AI、Replit 和 Scatter Labs等知名厂商皆使用MPT-7B开发各种生成式AI产品。
截至目前,MPT-7B开源项目的下载量超过300万次。收购方Databricks表示,这也是其收购MosaicML的重要原因之一。
另一款模型MPT-30B推出之后,同样引来业界关注,十分受欢迎。其训练成本远低于其他竞争对手,有望推动AI模型在更广泛领域的应用并逐步降低训练成本。
MosaicML首席执行官兼联合创始人Naveen Rao表示,MPT-30B的训练成本仅为70万美元,远远低于类似产品如GPT-3所需的数千万美元训练成本。该模型由于成本低、体积小,可以更快速地进行训练,并且更适合在本地硬件上部署。
MosaicML还介绍称,公司用 2 个月的时间训练了 MPT-30B,通过数据混合进行预训练,从 10 个不同的开源文本语料库中收集了 1T 个预训练数据 token,并使用 EleutherAI GPT-NeoX-20B 分词器对文本进行分词,并根据上述比率进行采样。
需要注意的是,开发者可以从Hugging Face下载并使用开源的MPT-30B基础模型,还可以使用自己的数据在本地硬件上进行微调。
MosaicML同时表示,将模型参数扩展到300亿只是第一步,随后他们将以降低更低成本推出更大体积、更高质量的模型。
MosaicML另一个比较有亮点的产品是今年推出的面向企业的MosaicML推理。
MosaicML首席执行官兼联合创始人Naveen Rao表示:“一些初创公司已经在使用MosaicML的模型和工具来构建自然语言前端和搜索系统。MosaicML允许企业使用公司的模型架构根据自己的数据训练模型,然后通过其推理API部署模型。如果客户训练了一个模型,他们可以放心,他们拥有该模型的所有迭代,该模型就是他们的。我们对此不拥有所有权。使用 MosaicML 的新推理产品,企业客户可以部署用于文本完成和文本嵌入的 AI 模型,其成本比使用OpenAI的LLM低4倍,而图像生成的成本比使用OpenAI的DALL-E 2便宜 15倍。”
“我们希望让尽可能多的人了解和使用这项技术,这就是我们的目标。这并不是排他性的。这不是精英主义。”Naveen Rao同时表示。
02
由英特尔前高管创立
MosaicML起点不低
作为初创公司的MosaicML,为何会连续推出爆款产品,这当然很其创始人有很大关系。
MosaicML是由曾在英特尔担任AI产品负责人、Nervana Systems 的联合创始人 Naveen Rao ,以及英特尔AI实验室的高级主管Hanlin Tang创立。
MosaicML的创始人Naveen Rao ,1997年毕业于杜克大学的计算机科学专业,后取得布朗大学神经科学的博士学位。Naveen Rao长期致力于人工智能神经网络的学习和开发,曾在高通担任过神经形态机器的研究员,并在2014年创立了人工智能公司Nervana Systems。后来这家公司在2016年以4.08亿美元被英特尔收购。
Hanlin Tang毕业于哈佛大学,研究人类视觉中的递归神经网络。他在普林斯顿大学取得物理学学士学位,随后在哈佛大学取得生物物理学的博士学位,研究人类视觉中的递归神经网络,Hanlin Tang少年时代在台北度过。后来也要看到,中国是美国市场之外唯一一个拥有完整的AIGC产业链的国家,在这场第四次工业革命之中,大家都没有退路。
参考资料:
https://baijiahao.baidu.com/s?id=1770181890496791618&wfr=spider&for=pc
http://t.10jqka.com.cn/pid_294033785.shtml
加入我们
专题推荐