
2026年2月,前谷歌DeepMind席科学、AlphaGo核心戴维·席尔瓦(David Silver)正式离职海西橱柜台面胶,在伦敦创立AI初创公司Ineffable Intelligence,目前正进10亿美元种子轮融资,额度追平OpenAI前席科学伊利亚2024年创业的融资纪录,成为资本市场押注“后大模型时代”的重要信号。这位耕强化学习15年的技术大佬,决意绕开当下主流的大语言模型(LLM)范式,以纯强化学习路线探索真正摆脱人类知识束缚的智能,也折射出全球AI域正迎来关键的技术路线大分流。
核心动因:大模型有“天花板”,人类数据锁死AI上限
席尔瓦认为,以GPT、Gemini为代表的主流大模型,核心依托“海量文本预训练+人类反馈强化学习(RLHF)”,本质是模仿人类语言的统计规律复刻,存在法突破的本质局限:AI的能力上限被人类数据和评估员的认知边界锁定,只能“假装思考”,法发现人类未知的规律。
2025年4月,他与师、图灵得主查理·萨顿发表论文《欢迎来到经验时代》,提出新代AI的核心向——从经验中学习:让智能体通过与环境的持续交互、试错和自我迭代积累经验,而非依赖静态人类数据,这理念也成为新公司的技术基石。席尔瓦直言,要实现越人类认知的智能,须让AI拥有自主探索的能力。
技术根基:从AlphaGo到MuZero,强化学习已验证“人类能力”
席尔瓦的路线并非空谈,而是建立在其主的Alpha系列AI的扎实成果之上,这也是资本市场信任的关键:
1. AlphaGo的“不可言说之智”:2016年击败李世石的“37手”,违背所有人类围棋定式却成为胜局关键,AI次发现人类未掌握的规律海西橱柜台面胶,这也是新公司名称“Ineffable(不可言说)”的由来;
2. AlphaZero师自通:不依赖任何人类棋谱,仅被告知规则,自我对弈3天便击败AlphaGo,验证纯强化学习的人类潜力;
3. MuZero突破规则限制:需知晓游戏规则,就能自主摸索并在围棋、象棋、Atari游戏中达到人水平。
奥力斯 pvc管道管件胶批发 联系人:王经理 手机:15226765735(微信同号) 地址:河北省任丘市北辛庄乡南代河工业区
这些成果证明,在规则明确、可模拟的系统中,强化学习能让AI从原理出发优解。席尔瓦坚信,只要设计理的励机制,这模式可复刻到复杂现实任务中。
新公司愿景:构建“持续学习的智能”
Ineffable Intelligence的核心目标,是研发摆脱人类知识束缚、能永止境自主学习的智能:该系统不仅能处理语言,能在模拟环境中通过自我博弈、亿万次试错,立探索未知问题的解决案,而非简单复刻人类已有知识。
目前公司已在伦敦设立总部海西橱柜台面胶,启动全球顶强化学习研究员招募,虽未公布产品时间表,保温护角专用胶但10亿美元融资将要解决力成本难题——为支撑AI在模拟环境中的试错训练,需构建复杂的数字孪生系统,这也是其路线核心的技术挑战。
行业变局:AI路线大分流,后大模型时代多路径竞逐
席尔瓦的创业,标志着全球顶AI科学对“LLM并非AGI终答案”已形成共识,行业进入多路径探索智能的新阶段,核心玩各有向:
- 席尔瓦(Ineffable Intelligence):激进颠覆,放弃LLM范式,回归纯强化学习,从“经验交互”实现智能跃迁;
- 伊利亚(SSI):渐进优化,通过扩大计规模、优化模型结构,在现有大模型基础上实现智能;
- 杨立昆(Meta):重构架构,重组“智能实验室”,探索非Transformer架构的新路径;
- Reflection AI:前AlphaGo团队成员创立,延续强化学习与决策智能的探索。
正如行业观察所言,当前局面堪比2010年代度学习爆发前夜,科学们已意识到,智能的本质是决策与探索,而非语言预测,这也让强化学习成为后大模型时代的核心探索向。
争议与挑战:强化学习的现实难题待解
尽管路线前景可期,席尔瓦的探索仍面临诸多质疑:强化学习在围棋、游戏等规则明确、反馈及时的封闭环境中表现优异,但在现实世界这种规则模糊、反馈稀疏的开放环境中,其有尚未得到充分验证。
此外,大语言模型的核心优势是低成本获取人类常识(语言是人类智慧的度压缩),而纯强化学习路线若摒弃这路径,不仅需要天文数字的力支撑试错,还需解决智能体在开放环境中的“经验积累率”问题,这也是Ineffable Intelligence未来需要突破的核心关卡。
资本逻辑:10亿押注的本质,是对“范式突破”的战略布局
在创投环境趋冷的当下,资本市场愿为尚未发布产品的公司开出10亿美元支票,核心基于两点:是对席尔瓦个人技术声望的对信任——他耕强化学习15年,论文被引28万次,h-index达104,是DeepMind“Alpha系列”的核心;二是对后大模型时代技术路线的战略押注,当前资本已从AI应用层转向基础层,“范式突破”成为比商业落地核心的投资逻辑。
席尔瓦的探索,不仅是位顶科学的个人选择,是全球AI发展的重要转折点:当大模型的商业化红利见顶,真正的智能革命,或许正藏在强化学习的自主探索之中。而Ineffable Intelligence的成败海西橱柜台面胶,也将刻影响未来十年AI技术的演进向。
相关词条:离心玻璃棉 塑料挤出机 钢绞线厂家 铝皮保温 pvc管道管件胶
