据EDN电子技术设计报道,3 月底,人工智能(AI)领域的先锋人物李开复创建了AI创业公司零一万物(01.AI),旨在为中国市场开发本土化的大型语言模型。在不到8个月时间内,李开复把这家公司带成了一家“独角兽”,估值超过10亿美元。
今年3月,李开复创建零一万物(01.AI), 6月份01.AI启动运营。在成立 7 个月后,这家初创公司发布了它的第一个模型--开源 Yi-34B。根据Hugging Face的排名,Yi-34B是一个用340亿个参数训练的双语(中英文)基础模型,比其他开放模型(如Falcon-180B和Meta LlaMa2-70B)小得多。
目前,零一万物的开源基础大语言模型Yi-34B已通过中英文版本提供给世界各地的开发者。大语言模型(LLM)是经过大量数据训练的计算机算法,用于阅读、理解和生成类似人类的文本、图像和代码。
据EDN了解,在一些关键指标上,Yi-34B已经优于市场上已有的领先开源模型,包括脸书母公司Meta备受好评的Llama 2。在Hugging Face上周末发布的大语言模型排行榜显示,Yi-34B在预训练基础大语言模型中排名第一。
李开复在接受采访时解释了创办 01.AI 背后的动机。"与世界其他地方不同,中国没有机会接触到 OpenAI 和Google,因为这两家公司没有在中国提供产品,所以我认为许多做 LLM 的人都想尽自己的一份力,为真正需要这个市场的人创造一个解决方案。"
李开复说,决定推出开放式 LLM 作为首款产品,是对社会的一种"回馈"。对于那些认为 LLaMA 是"天赐之物"的人来说,"我们提供了一个令人信服的选择,"他补充道。
李开复表示,在获得Sinovation Ventures、阿里巴巴云和其他未披露的投资者的融资后,01.AI的估值达到了10亿美元。
零一万物刚刚推出的Yi-34B拥有340亿个参数,这个规模是经过精心挑选的,这样它就可以在不那么昂贵的计算机上运行。该公司还发布了一款6B模型(60亿个参数),以吸引更广泛的开发者。
此外,李开复透露现在,他们已经在研发一个超过1000亿个参数的模型。
李开复表示,“我们的专有模型将以GPT-4(OpenAI大语言模型)为基准”。他指出,提供中英文系统将有利于银行、保险公司和贸易公司等跨国公司。零一万物计划在未来增加更多语言。
据悉,01.AI 已经发展到 100 多名员工,其中一半以上是来自大型跨国公司和中国科技公司的法学硕士专家。例如,公司的技术副总裁是Google Bard的早期成员,首席架构师是 TensorFlow 的创始成员,曾与杰夫-迪恩(Jeff Dean)和萨米-本吉奥(Samy Bengio)等著名研究人员在Google大脑(Google Brain)共事。Yi-34B背后的关键人物是微软亚洲研究院资深研究员黄文昊和曾在华为和阿里巴巴担任高级人工智能职位的Ethan Dai。
李开复通过创新工场支持了十多家独角兽企业,并通过风险投资建立了七家公司,他可能是中国人脉最广的投资者和企业家之一。
李开复认为:"中国在LLM方面并不领先于美国,但毫无疑问,中国可以开发出比美国开发者更好的应用,这主要是因为中国在过去12年左右的时间里建立了惊人的移动互联网生态系统。"
李开复认为,这家初创公司的最终目标是成为一个生态系统,让外部开发者可以轻松地构建应用程序。他说:"我们的职责不仅仅是推出优秀的研究模型,更重要的是让应用开发变得简单,这样才能有引人注目的应用。说到底。这是一个生态系统的游戏。"