探索生命科学大模型弯道超车:李彦宏所创百图生科推出AIGP平台
21世纪经济报道记者 申俊涵 北京报道
当微软、谷歌、百度等巨头公司纷纷加进AI大模型的全球竞赛,一些创业公司在大模型的垂直使用场景也展现出技术实力。
3月23日,百图生科在北京发布生命科学大模型驱动的AIGP——AI Generated Protein平台。同时,公司发布AIGP生态协作计划,期看将生命科学大模型的能力与医疗健康、药物设计、能源环保等领域的需求相结合。
百图生科并非无名之辈,其在两年前刚成立时便引发业内广泛关注。它在2020年由百度创始人李彦宏发起创立,百度风投CEO刘维担任公司联合创始人兼CEO。一年之后,国际机器学习专家宋乐博士加进公司成为CTO兼首席AI科学家。
同时,百图生科也在2021年完成上亿美元A轮融资,由GGV资能耐投,百度、君联资本、蓝驰创投等跟投,公司创始人李彦宏继续追加投资。
今年初,ChatGPT的全网火爆把AI大模型带进到公众视野。百图生科花费两年多时间所构建了千亿参数的跨模态大模型 “xTrimo”也逐渐展露头角,它的出现意味着生命科学领域或将走向“ChatGPT时刻”。
“目前,国际上大模型能力较强的公司主要是谷歌、微软这种大型公司。虽然他们也在做生命科学相关的大模型,但更多是在发论文层面。国际上的生命科学公司层面,还没有具备很强大模型练习能力的公司。”宋乐说。百图生科具有大模型练习能力以及专业的生命科学团队,这种合成发展的方式在国际上具有领先性和高门槛。
刘维也指出,虽然国外在生命科学基础研发和AI基础研发层面,有很多领先的地方。但AI驱动下的生命科学研究方面,中国企业存在弯道超车的机会。百图生科的AIGP平台既期看服务于中国的生命科学研究者,也期看面向全球的研发者。
错位竞争,开启生命科学领域大模型创业
“大模型理念在2018年左右开始火起来,在AI界比较有关注度。我们在2020年成立百图生科,很重要的目的就是给昂贵又有很大价值的大模型技术找到使用场景,生命科学领域是很有价值的场景。”刘维在接受21世纪经济报道摘访时说。
另一方面,在刘维看来,主流的互联网公司在自然语言的语料、技术层面有很深的积存,初创公司没有特殊大的竞争优势。新一代大模型创业者应该走向更前沿,在新问题、新模态上觅觅答案,与如今的主流大公司形成互补,这里边是存在机会的。
由此,团队创办了生物计算引擎驱动的创新药物研发平台——百图生科。成立两年多以来,百图生科蓄力打造生命科学领域的AI大模型xTrimo。据了解,该大模型从跨物种、跨模态的生命信息中学习蛋白质如何构成和实现功能、如何相互作用、如何组合和调控细胞功能的要害法则,从而破解生命的自然语言—— 蛋白质。
基于大模型,AI在一系列任务算法上取得明显的进展,除了更好地完成结构推测等基础任务外,也开始可以依据不同的问题输进,以生成的方式,设计创新的蛋白质,往返答各种生命科学问题。
3月23日,百图生科发布生命科学大模型驱动的AIGP平台。据了解,目前百图生科AIGP平台设置了3类功能模块。依据不同模块的输进和要求,AIGP平台可在较短时间内设计和生成具有特定性质的蛋白质。
展开全文
“经过两年的发展,虽然百图生科的AI大模型和与之配套的大规模数据图谱、高通量验证体系都远不完美,但已经凝聚了很多前沿技术的创新和探索。”刘维说。接下来,从开始展露一些能力到提高它的泛化能力和速度,需要专业伙伴的协作的加进,而且,协作伙伴也将得益这一系列尝试,实现前沿项目的加速研发。
“就像ChatGPT在2018年发布第一版的GPT-1,经过5年迭代达到现在的影响力。我们今天有点像2018年时的ChatGPT,期看5年时间内也把AIGP带到跟今天大家看到的完全不一样的水平,真的解决很多问题。”刘维说。
百度背景带来资源优势,新一轮融资正在推进中
此前,AIGP平台已经进行了一段时间的内测,有近20家协作伙伴和百图生科开展了AIGP联合研发协作,方向覆盖高性能弹头设计、新功能蛋白质设计、靶点挖掘和调控蛋白设计等领域,其中多个项目取得了阶段性的发现成果。随着此次的对外发布,AIGP平台将为更多伙伴,包括科研、环保、素材、消费等更多场景的需求,提供解决方案。
“类似于OpenAI接进到人力招聘、写作辅助的垂直行业公司,用大模型赋能这些公司的AI能力。百图生科也期看跟未来跟AI药物公司间形成协作关系,用预练习的大模型赋能他们AI任务模型进一步提升。”刘维说。
谈及百图生科与CRO企业的关系,刘维表达,百图生科跟主流的CRO企业间仍然是协作的关系。CRO企业的优势在于,对行业里面有解的问题做得更专业高效、成本更低、质量更可控。百图生科的模式是通过自身特殊的技术,与协作伙伴共同投进、共担风险、共享收益,这不是服务的模式而是联合研发模式。
值得一提的是,李彦宏是百图生科的创始人和早期投资人。刘维对21世纪经济报道表达,背靠百度资源,为百图生科做好生命科学领域的大模型带来优势。百度为百图生科提供低成本的算力资源支持,同时,百图生科和百度在大模型技术上有一定互相借鉴的地方,两方团队还在NLP(自然语言处理)相关领域进行协作研发。
除了李彦宏的加持,百图生科还在2021年获得GGV资本、君联资本等的青睐,A轮时就完成上亿美元的巨额融资。刘维坦言,巨额融资背后,是大模型领域创业确实需要很高的投进,公司一年的研发投进在大几千万美元。
“好在我们的研发效率还挺高,团队同时跑四十多个生命科学研发项目,假如按照传统的生命科学逻辑研发,这可能需要花费十亿美金。”刘维说。得益于协作伙伴的资源平台的优势,百图生科的很多研发项目都有不错的产出预期,投进产出比是比较划算的。
同时,刘维透露,公司今年正在新一轮融资推进过程中。“做大模型很需要成本,我们期看找到情愿长周期投进支持这件事的投资方。一些既可以投进资金又可以带来资源,或者对行业问题有深度看法的产业投资人,也是我们所欢迎的。”他说。
更多内容请下载21财经APP