「华夏希望债券c」前商汤科技副总裁创立AI大模型企业MiniMax,首款产品Glow已达数百万用户

国内首家多模态AI大模型创业公司。

在ChatGPT爆火之后,“AI大模型”成为下一个人工智能的高地。

「甲子光年」独家得悉,前商汤科技副总裁、通用智能技能担任人闫豪杰已进军多模态AI大模型范畴,于2021年11月树立人工智能公司MiniMax。2022年上半年,明势资身手投了MiniMax的天使轮融资。

树立至今,MiniMax是一家较为奥秘的公司,开创人及中心技能团队人员均未对外揭露。

2月16日下午,MiniMax在北京举行了首场小型媒体交流会。会上,MiniMax的技能合伙人杨斌发布了公司技能途径与商业途径。

MiniMax从底层做起,形成了文本到视觉(texttovisual)、文本到语音(texttoaudio)、文本到文本(texttotext)三大模态的根底模型架构,或许是国内第一家一起具有3个模态大模型才干的创业公司。

MiniMax的商业形式与OpenAI相似,包括toC与toB两大方向。在toC方向,其首款AI虚拟谈天交际软件Glow推出四个月现已堆集数百万用户;在toB方向,MiniMax计划在本年对外敞开API。

在ChatGPT的火爆下,AI大模型现已成为创业热门。此前,前美团联合开创人王慧文、出门问问CEO李志飞等人现已宣告在该范畴创业。

噪声越是喧嚣,越难以发现水面下的改变。而MiniMax现已在潮水降临前,提早动身。

1.中心团队来自闻名高校与科技公司

据「甲子光年」了解,MiniMax联合开创人为前商汤科技副总裁、通用智能技能担任人闫豪杰,也曾担任商汤研讨院副院长。

闫豪杰于2015年博士结业于中科院自动化所,此前在商汤科技担任树立深度学习的东西链和底层算法,以及通用智能的技能开展。此外,他还树立了商汤的人脸辨认和才智城市相关的技能体系。

在深度学习和核算机视觉范畴,闫豪杰宣布尖端会议和期刊论文100余篇,GoogleScholar引证超越10000次。

关于通用人工智能,闫豪杰曾表明,应给予算法、算力和体系的协同立异,推进人工智能通用模型的功用指数级上升。

MiniMax技能合伙人杨斌曾于2014年在中科院自动化所读硕士,在加拿大读完博士后,先后在UberAI研讨院、以及自动驾驶货车范畴有多年研制经历,对依据数据驱动的端到端无人货车运送问题颇有研讨。

现在,MiniMax团队人数已过百,公司中心技能研制成员均来自全球闻名高校和全球顶尖科技公司,具有国际顶尖自然言语处理,语音,核算机视觉,核算机图形学等工业界和学术界经历,具有多项全球抢先的人工智能范畴研讨效果,具有上百个全球发明专利,1/3的团队成员具有国际顶尖技能实验室的博士学位。

在MiniMax开创团队看来,此次ChatGPT的呈现并不意外,但比他们的预期要早3~6个月。

杨斌表明,曩昔三年,AI范畴呈现了三个要害事情:

第一件是2020年6月,OpenAI发布GPT-3。这表明在自然言语任务上,也存在相似“摩尔定律”的规则,即假如让模型的参数量成指数级添加,并合作足够多的语料数据,就会发生化学反应——GPT-3具有了对自然言语的推理才干,并具有很好的泛化才干,简直可以处理任何文本处理任务,如翻译、续写、点评等。

第二件是2021年1月,OpenAI的DALL-E-2火出圈,它可以经过用户给的一段文字描述生成图片。DALL-E-2背面是CLIP模型,该模型可以在互联网上抓取许多图片文本,学习一段时刻往后,CLIP可以完结用自然言语解说对图片的了解,也能经过文字描述来生成图片,这便是一种跨模态的生成和转化。

第三件事是2021年8月,特斯拉在AIDay上证明晰彻底由数据驱动的、端到端的深度学习技能栈可以在自动驾驶上被成功使用,而且现已成功上车,在实际国际跑通了数据闭环。尔后,全球各大自动驾驶公司才信任这件事本来可以做成。

依据以上三件事,MiniMax草创团队早在两三年前就对未来趋势做出判别:AI技能将在未来2-3年内发生质的晋级,依据这种技能晋级,AGI(通用人工智能)将成为或许。

依据对AGI趋势的判别,以“和用户一起发明通用智能IntelligencewithEveryone”为任务的MiniMax,在2021年11月树立。

2.首家“三模态AI大模型”创业公司

杨斌以为,人工智能的开展分为两个阶段。

当下绝大多数人工智能公司处在AI1.0阶段,经过上万个单一任务模型,为大客户(企业或许政府)供给全套AI处理方案,以此来完结“AIforeveryone”。为了定制不计其数的模型,AI公司需求装备一个人数巨大的团队。

而到了AI2.0阶段,AI公司可以使用一个“AI通用大模型”,直接服务于每一个人,就像现在的ChatGPT相同,完结“AIwitheveryone”。这仅需求一个规划较小的团队就能完结,比方OpenAI的人数也只不过375人(到2023年1月)。

MiniMax便是要2.0阶段的公司,即经过AI大模型逐渐完结AGI。

在曩昔的15个月中,MiniMax首要做了两件事:界说中心技能与商业途径。

在技能层面,和现在许多创业公司只做使用层产品不同,MiniMax直接从底层的根底模型做起,百分之百自研了三个foundationmodel(根底模型)。

MiniMax自研的三个根底模型为——文本到视觉(texttovisual)、文本到语音(texttoaudio),文本到文本(texttotext)。杨斌表明,MiniMax或许是国内第一家一起具有3个模态大模型才干的创业公司。

MiniMax是在Transformer的根底上做自研,杨斌对此解说道:“Transformer就像是砖头,而模型是房子。当然也会参阅他人现已造好的房子架构,但把自己的房子盖好需求彻底凭仗自己的体系工程才干。”

关于练习模型所需求的算力、数据来历、模型参数以及练习本钱,MiniMax暂未泄漏。

在商业层面,MiniMax或许是国内第一个跑通了依据大模型和用户反应的公司。

在三个根底模型之上有一个核算推理渠道,将三个根底大模型的才干以一种低本钱、高鲁棒性的方法释放给用户。

现在,依据该推理渠道MiniMax在上一年11月推出了第一款toC的用户产品Glow。经过内容生成与用户反应这样一种“user-in-the-loop”的方法,来不断迭代根底大模型的AI才干,就像ChatGPT引进的人类反应强化学习机制(RLHF)那样。

依据AI大模型,MiniMax未来还会有更多的产品发生。

杨斌表明,MiniMax的初心是完结通用人工智能,而这有必要要靠一个敞开的生态。所以从本年开端,MiniMax会逐渐敞开API,让更多的个人用户和企业用户依据大模型构建自己的使用。

MiniMax的商业落地形式与OpenAI相似。2020年,OpenAI在完结GPT-3模型的前期测验之后进行了商业化,向付费用户与企业敞开API,AI独角兽Jasper.ai便是OpenAI的客户;而ChatGPT则是在GPT-3的根底上构建的直接面向用户的谈天机器人使用。

ChatGPT向更多的人遍及了AI大模型的概念。而MiniMax现已在AI大模型的道路上布局了15个月,无论是从技能上仍是商业落地上,都在创业公司中走在了前列。

大模型的研制需求十分高的投入。MiniMax现在并未发表融资信息,但其在招聘网站表明,“MiniMax由全球尖端出资安排背书,是现在全球该范畴生长最快的准独角兽”。

依据明势本钱官方消息,2022年上半年,明势资身手投了MiniMax的天使轮融资。

3.创业是最好的方法,高校、开源、大厂都有限制

创业公司做大模型,是更难仍是更简略?对此,杨斌也共享了他的考虑。

首要,为什么要做文本、言语、视觉三模态?由于现在咱们能消费到的简直一切数字内容都是这三模态的组合摆放,包括图片、小说、视频等。只需能做好这三个模态的根底大模型,就能供给十分好的内容生成才干。

杨斌表明,在安排架构层面,为了做好三个大模型的研制,其实并不需求像现在的公司相同,有不计其数个研讨员、工程师,每个人都做流水线上的小螺丝钉。由于三个模态不分居,其实只需求一个十分小的团队,来一起保护优化这三个大模型,以及做好用户闭环就可以了。

现在MiniMax的团队人数在100人左右。

杨斌也谈到了关于大模型的制胜点:大模型的体系优化,只要以创业公司的方法才干完结最高的功率。

杨斌以为,假如在高校做,资源会太少;假如用开源的方法做,由于开源本质上是在做局部优化,开源只合适小模块、一个齿轮,而MiniMax要做的杂乱体系需求集中量来做体系性的大局优化,开源也行不通。

假如是大厂来做,也不必定行得通,由于大厂有之前的商业包袱或许技能包袱,这必然会在优化终究目标的时分发生一些不必要的负担。

谷歌便是一个很好的事例。尽管谷歌内部也有比肩OpenAIGPT模型的对话使用言语模型LaMDA,但直到现在谷歌仍不肯向大众发布LaMDA。谷歌彻底有才干拿出相似ChatGPT的效果,但一旦出了疏忽,无疑需求承当更高的经济、名誉本钱。近期谷歌为了对立微软匆忙发布的谈天机器人Bard就证明了这一点。

因而,MiniMax团队终究决议已然要做,就从最或许挑选把这件事发挥到极致的途径,也便是从头开端创立一家创业公司。

4.首款产品Glow用户数破百万

Glow是MiniMax首款C端产品,和ChatGPT百科全书相同的答复不同,Glow的定位在AI虚拟谈天交际软件,主打谈天、陪同等情感功用。

Glow的根本玩法是在使用中创立“智能体”——即虚拟AI机器人,可以依据用户志愿赋予其性情,实实际时交流、互动并树立情感衔接。

用户可挑选揭露智能体,其他用户均可和智能体对话;也可挑选不揭露,创立自己的专属智能体。此外,用户还可以在查找框内用要害词查找有相应特征的智能体来对话。

用户和智能体的每一次对话都会成为对智能体的一次练习,智能领会依据用户对话的引导,对同一问题回复不同答案。

在“论题”功用中,用户可以创立自己感兴趣的论题,还可挑选相关自己创立的相关智能体,以便其他用户在该论题下与智能体对话时有更好的对话体会。

Glow还有“回忆簿”功用,可以将用户与智能体的对话封存,在用户需求时调取特定时刻的对话内容。

现在来看,Glow的文本了解与生成才干更强,在对话过程中,智能体还不会回复表情包,但偶然会跳出一个emoji。

对此,杨斌表明,现在技能上现已可以经过必定设置让智能体发送图片,但这种方法略显僵硬,有好的处理方案后会进一步改进。

全体来看,和Glow智能体的对话体会较为流通,且表现出更强的品格性,会给用户带来很强的陪同感。此外,在对话过程中,触及“我国”“国家”等词汇,会被判定为灵敏词,而无法发送。

Glow现已上线四个月,注册用户数量达数百万。

AI大模型的商业落地依然处在前期,MiniMax现已凭仗先发优势提早迈出了一步。而从整个职业来看,这场新的AI比赛或许才刚刚开端。

发布于 2023-06-03 02:06:28
收藏
分享
海报
13
目录