王峰随笔:关于深度学习之父辛顿、诺贝尔奖和大科学家的好事多磨
更新/今天聊聊杰弗里.辛顿和诺贝尔物理学奖。顺便扯的远一点。
辛顿是人工智能领域没有争议的“深度学习之父”。他的根本贡献来自于深度学习中大量使用的反向传播算法理论。前年深秋,圣何塞,我第一次在油管上看见辛顿在接受采访时,就被吸引住了。辛顿的样子让人过目不忘。像极了《木偶奇遇记》中的比诺曹,尤其像的地方,是小木人的尖鼻子。那时候,全世界都知道了OpenAI和ChatGPT。但是除了AI圈,却少有人知道辛顿的名字。
我拿比诺曹开老爷子的玩笑。
一个天真充满好奇心的小木偶,一心想让自己成为真人。同样,辛顿一心想让人工智能成为现实,也一轮被嘲笑。熟悉计算机发展史的人应该知道,人工智能领域道路崎岖,技术投入几起几落,从业者一路被讥笑。你去看辛顿讲话的样子,那眼神和表情,有几分比诺曹的优雅。
诺贝尔颁奖通知电话从瑞典打来,是夜里两点。
斯德哥尔摩那边的电话里问。您在哪里?“我在加州一家便宜的酒店里,这里网络环境比较差。” 辛顿的回答有点囧。此时此刻,你得到物理学奖的感受。辛顿说以为是恶作剧开玩笑、然后用了一个词“dream amazing”,梦一样的惊讶。
“你怎样描述自己?
究竟是一名计算机科学家,还是一名尝试理解生物学的物理学家?”
辛顿并没有在两个简单选择中给出答案。
我这么多年的观察,凡是直接在人家给选择题中做答案的,都不是什么真正的强人。
无论学历有多高,都没有用。我们很多人非常习惯做题,一旦毕业后就进入失重状态,有一种漂浮无力感。因为人进入到一个阶段,不是做题,而是找路。现实中,绝大多数他人预设的初始问题,本身就往往是形而上学。何况人家也就是随便那么一问,没过太多大脑。路是自己走出来的。
辛顿说,自己是“一生都在思考人脑是怎样工作的的人。我在试图了解大脑是如何工作的时候找到了一种技术,效果出奇的好。”
这个回答非常漂亮。辛顿一生的努力和坚持,终让人工智能成为现实。年轻时,辛顿在剑桥大学求学,为了搞清楚人脑如何思考,试图同时主修物理学和生理学,一年后均放弃后,改学建筑,然后放弃。一年后居然又改修哲学,两年后和导师不合而放弃,最终得到实验心理学学士学位。然后,毕业即失业。
很多人不知道,辛顿毕业后居然干了一年木匠活。哈哈,前面的比诺曹埋到这里了。
直到听说有一个专业叫做人工智能。
辛顿果断去爱丁堡大学,拿到人工智能博士学位,毕业后去美国卡内基梅隆(CMU)任教,“惊讶于这里的人都在实验室。”辛顿曾抱怨,他在英国的圈子下班就只知道去咖啡馆。最初,辛顿说在CMU几乎没有什么校内交往,唯一交流的是美国另一所大学的教授,以及一位后来进入CMU的统计学专家,才可以一起讨论人工智能学术方向。找不到办法,找不到投缘AI的人,在最无聊的时光里,辛顿居然也去读俄罗斯作家陀思妥耶夫斯基的《罪与罚》。
辛顿于1986年发表反向传播算法(BP)理论。一言难尽,解释起来要花点功夫。一句话,BP提供了深度学习在大数据集上训练上的能力,无论是图像识别、语音识别还是自然语言处理,甚至能为今天十分流行的Transfomer大模型提供了未见数据场景的泛化能力。今天,OpenAI闭源的ChatGPT和Meta开源的LLaMA,开始为业界所熟悉,其实都是基于Transfomer架构上的。通过大量文本数据进行预训练。反向传播算法能够在此过程中调整模型中的参数,使得模型更好地捕捉到语言统计规律。
计算机专业大学课堂的机器学习教程,反向传播必然是重点章节。
我记得,七年前,我读过清华大学周志华教授所著的《机器学习》(因为封面有一个西瓜,圈中人称西瓜书)在其中一章“神经网络”中,有专门的小节讲解了“误差逆传播算法”,即通常我们所说的反向传播算法(BP算法)。这一算法是神经网络训练中的关键技术,用于通过“梯度下降法”更新网络权重,以最小化网络的预测误差。
相比较个人电脑、互联网、智能手机以及云计算等技术热潮,同样在计算机科学领域深耕的辛顿,和他追逐的人工智能梦,一连坐了三四十年的冷板凳。快七十岁的时候,辛顿看见全世界的人工智能都在用自己提出的深度学习算法。
熟悉辛顿的人一定知道,OpenAI前首席科学家Ilya Sutskever是他在多伦多大学执教时期的学生,算是关门弟子。辛顿很认可这个学生的知觉和工程能力。辛顿讲了一个故事,Ilya要给数学计算工具MatLab写一个API接口,以便于把他们团队整理复杂的数据格式一致。老师辛顿说我们别浪费研究时间,这个工作要耗费一个月时间,学生Ilya说我今天早晨已经写完了程序。2013年,Google收购了辛顿和Ilya共同创办的AI初创公司DNNresearch。应该说,这家公司是辛顿研究小组的衍生物,当时正在进行图像识别领域的机器学习研究,Google利用这项技术增强了照片搜索等功能 。
辛顿是英国人。
很多人说英国人不行了。英国人不是日不落帝国时期的那股子劲了。今年夏天我去英国转了一圈,伦敦的朋友提醒,小心飞车党。说说和辛顿有关的两所英国大学,你就知道我们不能自嗨。剑桥大学内,三一学院,仅仅在理论物理学研究中,这里走出了牛顿、麦克斯韦和霍金,几乎奠基夯实物理学三个重要时代。计算机领域,同样地,国王学院中除了我们知道的徐志摩,更走出了阿兰图灵和辛顿。图灵提出了著名的问题,如何测试机器有否智能?辛顿却用一生解决问题。2018年,辛顿和另外两位人工智能科学家一起拿到图灵奖。当年的图灵,何等天才级人物,却承受巨大精神痛苦,啃下一口涂抹氰化钾的苹果就走 了。今天,英国人开始把图灵的肖像印到50英磅纸币上。说回来,很多人对欧美人文化中三一没有概念,还以为和三一重工意思差不多。“三一”(Trinity)在基督教教义中指的是“三位一体”,即圣父、圣子、圣灵三位一体,其实是一个纯粹的神学概念。英国这些重点大学,除了教室、图书管就是教堂,神人频出。
辛顿在爱丁堡大学找到学术归宿。
爱丁堡太美。神秘的黑色中世纪风,也许会促使人思考源头和去向问题。电磁学之父麦克斯韦也是最早在爱丁堡学数学和物理的。一百年前,北大懂六门外语的辜鸿铭,上课头戴旧式礼帽手拿茶壶,几乎一人和五四革新派对立,他曾在爱丁堡读的哲学博士。我们那时的北大,从校内吵到校外,既容得下革命派,也能有辜老爷子这样的保守派。毛泽东在长沙师范读书时期的老师,杨昌济是爱丁堡大学哲学系毕业的,杨昌济十分喜欢毛,后来到北大,把女儿许配给他,给毛在图书馆安排工作。毛改变了中国,毛的思想启蒙来自于毕业于爱丁堡大学的杨昌济。
很多人说诺贝尔奖给计算机科学家物理学奖,有点不务正业了。其实,诺贝尔奖并不是第一次给计算机领域,之前有肖克利和贝尔实验室团队。1958年,因为发明晶体管获奖,他的贡献直接推动了计算机芯片技术。美国硅谷芯片行业的黄埔军校,应该首推肖克利实验室,因为科学家不善管理,内部分崩离析,先后出去创办了仙童去半导体和Intel,提出摩尔定律的摩尔,是他实验室的员工,也是著名的硅谷“八叛逆”之一。今天的英伟达和台积电,其实算是他们的徒孙辈。
科学家辛顿在Google工作了十年,做副总裁,最终离开。
并非意见不合,而是因为担心人类无法控制AI的风险而放弃在企业中的工作,从企业里离开,是为了可以自由地讨论人工智能的风险,而不被企业内政策限制,辛顿成为了一个人工智能领域的批评者。观察现代历史,我发现,真正的科学家,一旦进入商业和政治,总是充满爱恨情仇。同样的分歧,出现在Ilya和Altman之间,因为“天真”。请杠精们放过我,这里我的用词,乃是一个大大的褒义。二战期间,物理学家奥本海默帮助美国军方制造出原子弹,战争结束后,却一生都在反对继续氢弹。他发现,自己用技术改变了世界,但是这项技术在一部分人手里,随时能走向失控。奥本海默有很多科研成果,都能申请诺贝尔奖,但是诺贝尔奖怎么会给一个造原子弹的人。他生命的晚景是痛苦和孤寂的。和奥本海默一样,辛顿也是这样的担忧,他公开批评OpenAI对人工智能安全的漠视,是“资本主义的逐利性”。如果我们回头看看,一百多年前科幻作家乔治奥威尔的《时间机器》,就该知道,我们今天,已经是他们笔下的科幻世界了。但是,今天的人类还能够向前走到多远,为何失控、幻灭和拯救一直是科幻的主旋律?
如果我写科幻,第一个序章,就是因为两国大战,人类被核武器消灭,碳基生命消亡,藏于地下深处的硅基生物人利用光能源和算法,自我升级繁衍,统治地球。我们已经有的大数据,异化为硅基人血液和细胞。今天的地球文明成为星际史前。仅有少数人乘诺亚号去了火星,经过几代人的努力,准备打回故土。
觉得剧本俗套?我是凡人。
科学是人类文明阶梯以及跳跃演进中的核心组件,本无善恶。但是近代以后科学最早的应用对象,几乎先用于军事。
什么是“科学之心”?我不敢下断言。像辛顿这样的科学家不少。他们内心干净,好奇心强,专注一件事从不受外界干扰。我能感受到。大科学家,从对一件微小的事物好奇心驱使的探索之爱,最终走向对人类命运的关切之爱。顶尖思维只来自于一个字,爱。其间,常有悲情。
我们常说,好事多磨。
但是可能,大好事要磨尽一生。
比推快讯
更多 >>- 美众议院金融服务委员会新任主席:在立法会议的前100天内,将引入一项全面的加密市场结构法案
- 数据:Aave v3 TVL 增至 270 亿美元,30天涨幅64%
- 某余额为1700万USDT的链上地址被冻结
- 加密矿商 CleanSpark 拟通过私募可转换债券发行筹集 5.5 亿美元
- 人工智能和数据公司Databricks接近完成 95 亿美元融资,并计划额外筹集 45 亿美元债务融资
- Deribit 数据显示目标价为 5 美元的XRP看涨期权正在激增
- USDC Treasury在以太坊区块链上新增铸造5000万枚USDC
- 500 枚BTC 从Coinbase转移到未知钱包
- MagicBlock 开源 a16z 支持的“ephemeral rollup”技术
- Bit Global 就 Coinbase 下架 WBTC的行为对其提起诉讼
- 区块链项目 MegaLabs 通过Echo平台完成1000万美元融资,将推出 MegaETH
- Pantera Capital创始人:加密货币是一种新兴资产类别,在很大程度上仍未被机构投资者开发
- VanEck发布2025年十大预测:加密牛市在第一季度达到中期高峰,在第四季度创下新高
- 数据:6-12个月的持有者共持有SOL 27%的总供应量
- Glassnode:截至 12 月 5 日,BTC矿工累计获得 714.9 亿美元的收入
- 灰度向某未知地址转移约601枚BTC,价值6000万美元
- Peter Thiel:不会在特朗普的第二任期政府中担任“全职”角色
- 数据:12月加密市场日活用户达到1870万历史新高
- 美民调显示半数美国人对特朗普提名合格内阁成员的能力缺乏信心
- 福克斯记者:美众议院数字资产小组委员会主席职位目前有三位潜在继任者
- 分析师:比特币重要支撑位在94,300美元到100,250美元之间,有超过218万枚比特币被225万个钱包持有
- CoinShares:Q3上市矿企加权平均BTC开采成本升至55,950美元,同比增长13%
- Nexo 分析师:以太坊或将在 2025 年初达到5,000 美元
- Bitwise CIO:当比特币达到100万美元时,未参与的投资者会后悔错过看涨迹象
- 花旗:预计美联储在明年 7 月之前的每次会议都降息 25 个基点
- Pantera创始人:比特币比黄金更好,建议美国政府继续增持
- Nexo 关联巨鲸地址解质押1.8万枚 ETH 并转入币安,约合7080万美元
- 射击游戏 Shrapnel 的工作室 Neon Machine 任命 Ken Rosman 为新CEO
- 与 Tether 有关联的金融服务公司 Cantor Fitzgerald 已同意向 SEC 支付675万美元罚款
- 比特币生态钱包 Xverse 将集成 Stacks 的 sBTC
- 推动新能源资产 RWA,Sui 与蚂蚁数科达成合作
- Metis 宣布去中心化排序器(DSEQ)重启计划即将上线
- Bybit 调整欧洲业务,暂停产品运营服务以应对监管变化
- 去中心化协议 Prosper 宣布从比特大陆收购超 7,000 台 ASIC 矿机
- 贝莱德 IBIT 今日前交易量为3400万美元,50%为活跃买单
- Riot Platforms 以 5.1 亿美元购买 5117 枚比特币
- 灰度向 Coinbase Prime 转入555.67枚比特币
- 特朗普宣布下周将与亚马逊创始人杰夫·贝佐斯和谷歌 CEO 举行会晤
- 今日美国比特币 ETF 净流入5181枚 BTC,以太坊 ETF 净流入61434枚 ETH
- BONK 市值超越 WIF,成为市值最高的 Solana 链上 Meme 币
- 美银经济学家:美联储明年1月份可能会暂停降息
- 某交易员在 meme 币 rich 上频繁高买低卖,3分钟亏损73.9万美元
- 比特币短时跌破10万美元
- Vitalik 展示利用腾讯混元大模型创作的AI视频,并称赞该模型
- OpenAI 创始人将向特朗普就职基金捐赠100万美元
- 美 SEC 对马斯克发出和解要求,涉及此前 Twitter 交易相关指控
- Baby Doge:已向 Coinbase 提交上市申请
- 加密技术公司 Fireblocks 在日本东京设立区域办事处
- 某鲸鱼向 Binance 存入199,923枚 LINK,浮盈344万美元
- MicroStrategy 创始人:市场在争夺每天开采的比特币
比推专栏
更多 >>观点
项目
比推热门文章
- 美众议院金融服务委员会新任主席:在立法会议的前100天内,将引入一项全面的加密市场结构法案
- 数据:Aave v3 TVL 增至 270 亿美元,30天涨幅64%
- 某余额为1700万USDT的链上地址被冻结
- 加密矿商 CleanSpark 拟通过私募可转换债券发行筹集 5.5 亿美元
- 人工智能和数据公司Databricks接近完成 95 亿美元融资,并计划额外筹集 45 亿美元债务融资
- Deribit 数据显示目标价为 5 美元的XRP看涨期权正在激增
- USDC Treasury在以太坊区块链上新增铸造5000万枚USDC
- 500 枚BTC 从Coinbase转移到未知钱包
- MagicBlock 开源 a16z 支持的“ephemeral rollup”技术
- Bit Global 就 Coinbase 下架 WBTC的行为对其提起诉讼