近日,零一万物首席执行官李开复博士与卡内基梅隆大学计算机科学学院教授、全球首个机器学习系创立者汤姆·米切尔展开了一场深度对话。作为人工智能领域的先驱,李开复分享了他在语音识别技术突破中的关键经历,并展望了行业未来发展方向。
1979年,李开复在哥伦比亚大学求学期间便对人工智能产生浓厚兴趣。他回忆道,当时在导师约翰·肯德尔的推荐下进入卡内基梅隆大学深造,这段经历成为其科研生涯的重要转折点。在研究语音识别技术时,他选择突破传统专家系统框架,转而探索基于隐马尔可夫模型的统计学习方法。这一决策得到导师拉吉·瑞迪的支持,后者那句"我不同意你,但我会支持你"的鼓励,让他坚定了走不同技术路线的信心。
在资源获取方面,李开复展现出独特的战略眼光。他争取到20台SPARCstation计算机的使用权,构建起当时罕见的计算集群。通过与彼得·布朗合作,他系统掌握了隐马尔可夫模型理论,同时获得弗雷德里克·耶利内克"数据至上"理念的启发。这些要素的叠加,使他在连续语音识别任务中取得突破性进展——系统准确率从60%跃升至96%,这一成果后来成为行业基准。
谈及技术演进规律,李开复指出模型架构、数据规模、计算能力和上下文处理能力是四大核心要素。他特别提到日本学者鹿野清宏建议的梅尔倒谱表示法,这种信号处理方式的改进使系统性能显著提升。在语言模型构建上,他采用二元语法和三元语法替代复杂的上下文无关文法,这种工程优化为后续深度学习发展奠定了基础。
对于当前AI发展态势,李开复认为行业正经历范式转变。他以自身经历对比说明:当年IBM使用的n-gram模型只能处理有限上下文,而现代Transformer架构可处理百万级词语关联。这种跨越式发展得益于算力提升与算法创新的双重驱动。他特别强调年轻研究者的价值,指出生成式AI时代的原住民正在创造新的科研范式。
在对话中,李开复对AI科学突破表现出强烈期待。他认为未来三四年可能出现诺贝尔奖级成果,特别是在药物研发、材料科学等领域。针对学术研究,他建议博士生既要关注企业合作获取计算资源,也要勇于探索Transformer之外的新范式。他以自动驾驶领域的发展为例,说明当技术进入工程化阶段后,学术研究应转向更具开创性的方向。
当被问及最意外的技术进展时,李开复列举了Transformer架构的扩展性、Scaling Law的持久效力以及强化学习的突破性应用。他坦言自己曾受"路径依赖"影响,对技术发展速度估计不足,这种认知转变使他更加重视年轻研究者的创新思维。这场对话不仅展现了AI技术演进的历史脉络,也为行业未来发展提供了重要参考。















