采访|周鑫雨 邓咏仪文|周鑫雨编辑|苏建勋在阿里、字节接连做了近7年大模型的杨红霞,身上有一种鲜明的挑战精神。在阿里早期,她从内部的业务阿里搜索推荐系统,投身于初期并不被看好的大模型研究之路。后来,她带领林俊旸(现通义千问负责人)、周畅(前通义千问大模型负责人)等这一轮中国大模型的核心人才,在达摩院磕出了通义千问的前身,M6 大模型。2024年7月,杨红霞从字节离职创业后,被曝出仍要做模型相关技术的消息。“阿里、字节大模型核心人物”的光环,没有盖住彼时市场上悲观的声音:入局太晚,创业公司怎么和大厂争?时隔一年零三个月,杨红霞带着她的新 AI 公司 InfiX.ai,杀回了大模型赛道。10月初,《智能涌现》与身在香港的杨红霞,在线上交流了她的创业近况。她没有选择创业资源集中的北上广深,而是加入了香港理工大学。在杨红霞看来,前往香港是一个极具性价比的决定:人工智能相关的产学研项目,拥有丰厚的资金和算力补贴;因为香港拥有全球领先的人才密度,公司得以快速组建了40人规模的团队。出于种种考虑,杨红霞希望在访谈中只讨论技术,不透露商业化的细节。但仅从技术中,就能窥见 InfiX.ai 的宏大版图:这一次,杨红霞不仅想和市面上的顶尖模型叫板,甚至想革新大模型的训练和落地范式。当下主流的顶尖模型,包括GPT,都是由某个大机构主导的、“中心化”的。杨红霞解释,“(中心化的模型)需要集中投入非常多的数
...
继续阅读
(17)