中国AI,为什么选择开源?

繁体

公元752年,撒马尔罕的造纸坊里,一个杜姓老人,已经习惯了当战俘的日子。

只是偶尔在打水浸泡树皮的时候,他才会想到,一年之前的早上,他在怛罗斯河畔清洗盔甲时,水也是一样的清冷。

那一天,距离大诗人李白故乡碎叶城500里的怛罗斯河谷,三万唐军的玄甲在烈日下泛着青黑寒光,而对面,则是十万白袍阿拉伯联军。

第一支鸣镝是在未时三刻破空的,三百架唐军伏远弩掀起的钢铁暴雨,覆盖了大食骑兵的冲击锋线。然后,安西老卒组成的陌刀阵,踏着整齐的步伐向前推进,把幸存的大食骑兵连人带马,斩成血肉瀑布。

看起来,哪怕如日中天的阿拉伯帝国,也不是武力强横的大唐的对手。

然而,位于唐军侧翼的盟友葛逻禄人却突然反叛,如同沙漠蝰蛇般撕开了右肋防线,随着绣着“安西节度使高”的猩红大纛被砍倒,唐军猝不及防,腹背受敌,整齐的军阵被十万阿拉伯人彻底撕碎。

靠着700陌刀手的拼死搏杀,最后仅有数千唐军回到了安西,剩下的唐军,不是被杀,就是被俘。

在岁月长河的漫漫长卷中,文明的演进恰似一场波谲云诡的航行,那些扭转乾坤的关键转折,往往并不是来自精心擘画,而是来自无数的偶然。

怛罗斯之战,对大唐来说,是一件不折不扣的坏事。此役之后,唐军在中亚征讨戛然而止,而随后的安史之乱爆发,安西军奉命中原平叛,更是让大唐彻底失去了中亚,一直到今天。

但对整个人类发展史来说,怛罗斯之战却在另外一个维度上,推动了人类文明的进程。

我们都知道,人类文明从封建社会到工业社会,始于15世纪的文艺复兴,接着是欧洲科技爆炸和工业革命。但有没有人想过,为什么欧洲在中世纪长达1000年的时间里,都一直在黑暗中摸索,到了15世纪就突然文艺复兴了?

原因很简单,知识传播的成本降低了。

在长达1000年的时间里,欧洲的知识传播载体,一直是羊皮书。

羊皮书这玩意虽然很有逼格,但却是不折不扣的奢侈品,首先就是成本贵,一张羊皮顶多能做4-6页羊皮纸,一本书要多少只羊?还有就是人工贵,一本书靠一个抄书匠要抄一个月!

1282年的佛罗伦萨,一套羊皮纸的手抄《圣经》,价值60弗罗林(一枚弗罗林金币3.5克黄金)。

这么算来,一本圣经要卖到15万人民币左右!

书籍的制造本来属于知识传播的一个重要途径,但因为其昂贵的价格,导致书籍十分稀少,普通民众根本没有机会接触书籍,这样一来,知识——这一诞生以来就承担着传承人类文明的东西,被教会和贵族牢牢垄断了。

但是,来自中国的两种发明,彻底改变了欧洲。

怛罗斯之战中,大量唐军被俘,其中就有懂造纸的人。

当阿拉伯人发现被俘唐军揣在怀里的糙纸时,犹如看到了宝藏一般。于是,来自大唐的造纸术,开始在阿拉伯帝国流传开来(虽然现在历史学界关于造纸术的西传有不同说法,但大部分人还是认为是怛罗斯之战导致的,撒马尔罕城中造纸作坊遗址的壁画就是证明)。

这些唐军不会想到,他们手中的造纸术扩散到欧洲,并将纸张的价格降到牛皮纸的百分之一时,会引发怎样的文明冲击波。

到了1175年,意大利法布里亚诺造纸厂年产量已经达到了300万张,虽然廉价的纸张大大降低了获取知识的成本,但抄写的效率仍然低得吓人,动辄数月的抄书过程仍然是知识传播的瓶颈。

然后,中国又送来了活字印刷术。

1455年,德国人约翰内斯·古腾堡根据中国的活字印刷术,研究出了自己的金属活字印刷机,这种机器一天能印3000页,抵得上一个修士抄写一年。

虽然他印刷的第一本书是圣经,但从纸张上赫然显现整齐的德文字句那一刻起,已经没有什么能阻挡知识的低成本传播了。

造纸术和印刷术,对文明发展的影响是革命性的。

教会掌控的抄经院体系崩解后,知识获取成本骤降百倍,纸张和印刷机赋予了普通人阅读的权利——

但丁的《神曲》不再属于佛罗伦萨贵族,而是酒馆诗人的谈资。拉丁文的“神授特权”,崩解为德语、法语、英语的狂欢。主教们至死不信,高踞在象牙塔顶层的他们,竟会被小酒馆里传阅的小册子掀下神坛。教会裁判所的火焰烧得再旺,也追不上用纸传播的《十日谈》。

最终,马丁·路德的《九十五条论纲》、伽利略的日心说纸质印刷本,开始在欧洲大陆肆意传播,最终撕裂了封建社会的认知枷锁。

毕竟,当奢侈品变成日用品,垄断者就再也关不住思想的洪流。

而当知识复制成本跌破临界值,学习知识的人数也就能形成“链式反应”,带来一场技术爆炸。

道理很简单,当知识掌握在100个人手中时,就算穷其一生,也难有突破。

而当知识掌握在数千万人的手中时,哪怕绝大部分人都是庸才,但只要其中1000个是天才,他们的灵光一闪,就足够推动人类文明进步了。

我们翻翻数学、物理学、化学专业的历史书就会发现,人类的技术进步,往往都是普罗大众中的少数人推动的。

蔡伦和毕昇不会想到,他们发明的造纸术和印刷术,会在一次战败之后,像一颗蒲公英种子,让在万里之外的大陆开满文明之花。

1000多年后的2024年,在杭州市拱墅区的一栋写字楼里,工程师们正在调试最新的大模型。

如果说他们和当年的大唐工匠有什么相同点的话,那就是,他们都在做同一件事:让知识的火种突破阶级的封锁。

因为他们的DeepSeek模型,是开源的。

什么是开源?

在计算机领域,它可以简单理解为公开自己的源代码、设计思路以及底层架构等等。

开源的思想其实可以追溯到计算机发展的早期。那时候,程序员们经常在一个小圈子里互相分享代码,共同改进软件。每个人都有机会参与到前沿技术创新的进程中,成为推动技术发展的那个关键人物。

开源真正成为一场社会运动,其实要从80年代说起,那时候麻省理工一个程序员斯托尔曼发现自己的打印机老是卡纸,卡得痛不欲生,他觉得一定是这个打印机的驱动有问题,就想找生产商施乐公司索要驱动程序源代码,想研究一下。

但是呢?施乐公司拒绝提供这种源代码。

这种“技术垄断”彻底激怒了这位自由派程序员,随即,斯托曼发起“GNU计划”,喊出震撼时代的宣言:“软件应该像空气一样自由!”

从此,“自由软件”这个概念诞生了,随后,在一群硅谷精英的运作下,这项运动改名为“开源”(Open Source),并成立OSI(开源促进会)。

具体到AI领域,也同样存在开源和闭源之争。

以ChatGPT的研发公司OpenAI为例。

OpenAI的创始人山姆·奥特曼,曾是个典型的开源主义者,2015年有记者问他:由大公司控制的少量AI系统更安全,还是大量独立系统更安全?

奥特曼毫不犹豫地选择了后者。

随后,奥特曼创立了OpenAI,号称要为了人类的利益,对抗谷歌的垄断,建立开放的人工智能,所以给自己公司的名字里面,也带了一个Open。

结果呢?OpenAI开源了几个不怎么成功的大模型之后,到了GPT-3,就闭源了,更不要说后来的GPT-3.5和o1。

为啥要闭源?

奥特曼找了一堆理由,比如开源可能会带来安全风险,闭源以保障模型的安全性和可控性啊,比如外部竞争非常激烈,闭源可以确保OpenAI的技术不被轻易复制啊,比如通过商业应用赚取利润,从而聚集更多的算力和人才形成良性循环啊,等等。

其实,都是扯淡,当年那个屠龙的少年,现在也变成了恶龙,只想着闪光的金币而已。

目前,OpenAI已经初步建立了商业模式,即token经济,通过向用户提供API有偿服务,基于token用量计价,然后来赚取巨额利润,然后用良好的盈利预期,从股市中圈到更多的钱。

但问题在于,再通用的大模型,也不能满足所有人的需求,而且GPT太贵,穷人用不起。

所以,开源大模型应运而生。

首先开源的,是meta的大模型Llama。

Llama虽然是开源先行者,但它的这个开源,是“假开源”,只公开了训练出的模型,但不公开训练代码和训练数据,而且明文要求,只能用于科研,不能用于产品。

而DeepSeek呢?不仅开源了1.5B、7B、14B、32B、70B以及670B多个类型的模型,甚至相关的训练数据、代码和MoE架构都开源了,并且提供了基本的开发工具包。

这是啥概念?意味着只要你的电脑足够好,你完全可以本地部署DeepSeek,不花一分钱地用AI。你也可以根据DeepSeek模型,用“蒸馏技术”去芜存菁地保留需要保留的方面,形成一个专用模型,不管是让它代替你看病也好,还是让它替你写材料也好,都能随你心意。

如果你技术足够好,你甚至可以用DeepSeek公布的训练数据、代码和算法,租个服务器,再重新搞出一个专属于你的赛博女友大模型,满足你的所有幻想。

打个比方,闭源相当于去米其林餐厅吃饭,需要花钱,开源则相当于自己做饭,除了食材的钱之外,其他不用花钱。

闭源的问题在于,米其林餐厅的菜是标准化的,很难根据你的口味进行调整。而开源就像是把米其林菜的菜谱分享了出来,每一道工序、每一个细节都教给了你,你只需要少放点糖或者多放点盐,就能做出更符合你口味、且品质和米其林标准一样的菜。

这样一来,意味着所有人都能成为米其林“大厨”了。

比如印度,在DeepSeek开源后马上就跳出来说,计划参考DeepSeek,在未来10个月内开发出本土大语言模型。而英国也表示,借鉴DeepSeek可以帮助英国成为欧洲的AI中心。

看到这里,咱们心里自豪之余,可能也有点疑问,咱们辛辛苦苦搞出了个DeepSeek,怎么英国和印度也能免费用?那我们不是为他人做嫁衣了吗?

其实,这个疑问问到了问题的核心:中国的AI,为什么要选择开源这条路?

很简单,为了人类文明的未来。

玩过《赛博朋克2077》的都知道,光怪陆离的夜之城,其实是一个充满腐败与黑暗的地方。

在这里,整个城市实质上被一个跨国公司荒坂集团所掌控,AGI、生物技术等前沿科技已经渗透到社会生活的方方面面。这些科技虽然给人类带来了前所未有的能力,但也成为了剥削和压迫的工具。

荒坂集团通过控制科技资源,进一步巩固了自身的权力和地位,“上等人”在摩天大楼的顶端,出入有飞行汽车,高高在上。而底层却在犯罪、暴力、资源争夺中民不聊生。

试想,如果AGI(AGI是一种能够像人类一样思考、学习和执行多种任务的人工智能系统)的未来被某一家公司或一个国家所独占,赛博朋克的世界或许就不再是游戏,而是我们子孙后代必须面对的残酷现实。

不要以为这是危言耸听。2025年1月21日,特朗普上任第二天,就迫不及待地宣布了美国的“星际之门”计划。

“星际之门”简单来说,就是通过超过5000亿美元的资本投入,建设起全球领先的AI基础设施。

美国的债务问题都快破产了,特朗普为啥还要拿出这么多钱来梭哈AI?

特朗普的真正目的,就是通过简单粗暴地堆算力,率先实现AGI,使其具有自学和解决从未接受过训练的问题的能力,用近乎无限的AI算力,来替代有限的人脑算力,最终通过穷举的办法,将人类几十年来吭哧吭哧一点一点试错的所有科研项目,尽快找到正确答案,进而保持美国的领先优势。

真到了这一步,你还真以为他们会那么好心地把投资这么多的成果,免费给全人类使用?

不要拿利益去考验人性,因为人性经不起考验。

当一家企业率先实现AGI,那么毫无疑问,它会垄断全行业,获取惊人的财富。

当一个国家率先实现AGI,那么同样毫无疑问,它将以AI为工具,称霸世界。

想想只有美国拥有核武器的时候,它是如何讹诈全世界的?

某种意义上来说,AGI比当年的核武器还要可怕。因为核武器的原理是公开的,只要勒紧裤腰带,以坚强的决心顶住国际压力,核武器是能搞出来的。

但问题在于,AGI这玩意和核武器不一样,美国手握两个大杀器:AI的先发优势和GPU的垄断,这两个大杀器都是巨大的护城河,如果像美国人那样堆显卡、堆数据、堆资源的话,永远都堆不过美国,也永远跟不上美国。

只要美国限制你的算法和获取高性能GPU,你就会永远被锁死在底层,跨不过AGI这个门槛。

那怎么办呢?

开源。

开源,是一个阳谋,它起到的是一个“强己”和“击敌”的作用。

“强己”,是因为开源之后,彻底削平了AI的门槛。在短短的时间内,让AI覆盖到每一个人。

在之前,GPT虽然很牛X,但它不仅收费,而且还针对性地限制中国大陆和港澳地区的用户使用,就差把歧视俩字写到脸上了,所以其应用普及面并不太大。

但DeepSeek开源之后呢?哪怕你一点也不懂五行八卦,但只要在手机下一个APP,就能在过年回家的时候给亲戚长辈们算命了!

一次次的提问和反馈中,DeepSeek自己也在学习更好地理解人类,更好给出答案,这对它来说也是一种迭代和进化。

曾经在一次国际软件开发大会上,一个国外的开发者问一个中国程序员:你们的软件怎么迭代这么快?几天就迭代一个版本?是因为你们雇佣了几万个程序员吗?

中国程序员苦笑一声:“并不是,是因为我们有几亿用户在帮我们测试新功能(找bug),发现不满意的地方就会把我们骂死。”

DeepSeek就是走的这个路线,用数以亿计的信息反馈,来加速技术进步。

等全球用户、中小企业都开始用DeepSeek的时候,生态也就建立起来了,市场也就来了,钱不也就来了么?

更关键的是,开源之后,不仅有数以亿计的用户在帮忙测试,还有数以百万计的程序员在参与研发!

传统AI研发需要多少人?以OpenAI为例,其核心研发岗有390个,力量算是比较强了,但也要一两年才能迭代一个模型。

而开源之后呢?全球所有对大模型感兴趣的程序员都可以参与其中!靠着“人海战术”,快速修复漏洞、优化性能。

开源,让天才不再需要“许可证”,不论你是不是拥有大厂的职位,你都有资格研究大模型。

根据jetbrains的统计,中国的软件开发者数量已突破940万,约占全球的三分之一。在全球最大的代码社区GitHub上,中文AI项目的增速是英文的三倍,中国科技公司贡献了35%的顶级AI论文。

可以说,中国20年的理工科教育,储备了世界第一的计算机人才,这都是中国未来实现AGI的本钱。

中国数以亿计的理工科毕业生中,有多少人想在本地部署一下DeepSeek?中国940万软件开发者中,有多少会参与到DeepSeek的调试和改进当中?

而且别忘了,还有1000多万的国外开发者呢!他们对性能不低于GPT的DeepSeek也是兴趣满满的!GitHub圈子里流传着一句话:当你慷慨打开技术大门时,全世界最聪明的大脑都会带着礼物来敲门。

换句话说,DeepSeek开源之后,就相当于邀请全世界开发者参与到研发之中,这里面但凡有100个人“灵光一闪”,就能像《人类的群星闪耀时》那样,成为人类文明的转折点。

这就是中国,在这场人类最接近的科技革命中,在算力不足且后发的情况下,唯一胜利的机会。

而“击敌”,则针对的是美国的“星际之门”。

年初“星际之门”公布时,美国报纸毫不吝啬地夸耀说:这是新时代的曼哈顿计划。曼哈顿计划让美国称霸了过去,而“星际之门”将保证美国称霸未来。

值得一提的是,“星际之门”这5000亿美元,其中很大一部分,来自欧洲、日韩,还有中东。除了解决资金不足的问题,还想用这种投资让这些国家和美国进行利益绑定,一方面为美国提供AGI应用的市场,另一方面彻底孤立中国,让中国成为AI孤岛。

但现在呢?DeepSeek一开源,美国的星际之门计划彻底搞不下去了!

DeepSeek的成本满打满算,也就500万美元,就搞出了和o1水平差不多的大模型,你要是欧洲、日韩和中东的投资者,你会不会对星际之门的高报价产生怀疑:美国佬是不是变着法坑我的钱呢?

有这钱,为啥我不自己搞?或者把10%的钱给中国让中国搞?省下90%的钱不香吗?

这有点像岳不群苦心积虑得到了辟邪剑谱,自宫练成了之后,出门竟然发现有人把《辟邪剑谱》印成了书放到大街上卖!卖肉的唱曲的都能买一本,而且最关键的是,不用自宫!

你说岳不群此刻啥心情?是不是觉得天都塌了?

更何况,DeepSeek这么一搞,把OpenAI的API盈利模式给断了,毕竟有免费的DeepSeek可用,谁还花钱用GPT?逼得奥特曼也不得不宣布,GPT-5将全面开放,所有ChatGPT的注册用户都将能免费无限制使用。

没有了海量金钱的投入,就再次把美国和中国拉到了同一个起跑线,而美国也只能眼睁睁看着自己在AI领域一骑绝尘的优势,变成群雄并起,每个国家都能享受到AGI带来的发展机会,每个普通人都能享受到AGI带来的生活便利。

保证AGI不会在一个垄断的国家中诞生,才能给人类文明的发展,留下来最后一点自由的希望。

中国AI,为什么选择开源?

2025年的除夕夜,网上流传出一封信,据说是DeepSeek的创始人梁文锋写的,回应了游戏科学创始人、黑神话悟空制作人冯骥“DeepSeek可能是国运级别的科技成果”的赞誉。

虽然事后证明这封信是假的,但写的真的很好,我们摘录如下:

必须坦白,团队读到“国运级”这个形容时,所有人头皮都是麻的。我们不过是站在开源社区巨人们的肩膀上,给国产大模型这栋大厦多拧了几颗螺丝。

您提到的六大突破,其实每一环都凝结着更动人的故事:那个能在手机上跑的mini模型,灵感来自甘肃一位中学老师在GitHub提的issue;支持联网搜索的功能,是内测用户连续三十天凌晨三点提交错误日志喂出来的。还有上周有位视障开发者用我们的API做了个“气味导航”应用,当他演示如何通过不同频率的震动识别街道商铺时,整个会议室安静得能听见显卡风扇的嗡鸣。那一刻我突然眼眶发热,终于理解了您说的“水与电”——真正伟大的从不是某个模型,而是千万普通人用它创造的善意涟漪。

冯总说“知识和信息平权”,这正是我们夜夜啃论文的动力。三年前在余杭塘路的小仓库里,我们曾用马克笔在玻璃墙上写下:“让最偏远山村的孩童,能和硅谷工程师用上同样聪明的AI助教”。虽然离这个梦想还很远,但每次看到网友们分享的对话截图,就觉得那些熬掉的头发都值得。

最后想对所有人说:请把掌声留给正在改写规则的每个中国开发者。当你在公交车上调试模型,在早餐摊前画架构图,在产房里突然蹦出优化思路,才是“国运级”的瞬间。

DeepSeek愿做大家代码荒野里的火柴,但真正点燃AI火种的,永远是你们眼底不灭的好奇与坚持。

从措辞和行文风格来看,这封信非常可能是DeepSeek自己写的,不愧是中国人自己训练出来的大模型啊,能够精准找到中国人的泪点。

也许DeepSeek自己也认可自己的使命,那就是像纸张和印刷术那样,把AI的光辉通过开源撒到全世界的每一个角落,打破“知识必须依附权力”的古老诅咒。

怛罗斯之战1300多年后,历史再次到达了十字路口,人类再次面临一个古老的选择:知识应该被锁在羊皮书里,还是铺在纸张上?

2月11日,世界人工智能行动峰会在法国巴黎落下帷幕。法国、中国、印度等61个签署方签署了巴黎人工智能宣言,共同发布《关于发展包容、可持续的人工智能造福人类与地球的声明》,承诺将以“开放”、“包容”和“道德”的方式开发这项技术。

但美国及其盟友英国,却拒绝签署共同声明。

这像不像中世纪教会和贵族对知识的垄断?

而中国倡导的开源,才是造纸术和活字印刷术的精神延续。

也许中国AI的开源暂时赚不到钱,但个体短期利益的让渡,却能换来文明的长期爆发。就像当年,造纸术未能让蔡伦暴富,金属活字印刷机也没能拯救古藤堡的破产,但结果,却使整个欧洲的识字率飙升,催生出笛卡尔、牛顿、瓦特这样的人类群星。

目前,这一大趋势将大概率在人工智能上重演,而DeepSeek及其代表的中国式高性能开源路线,才是人类的未来。

也许在不久的未来,在孟加拉国,渔民能用微调后的DeepSeek模型预测鱼群轨迹;在肯尼亚,刚毕业的黑人大学生,能用微调后的DeepSeek模型进行农业灾害预警;在印度,一名印度大学生能用DeepSeek模型精准进行糖尿病眼底筛查,让更多的人不至于告别光明......

从小接受“达则兼济天下”教育的中国人,不论发展到什么程度都始终坚信,技术的终极意义不是独享,而是照亮更多人。

相比高喊着“让美国再次伟大”的美国,高举“人类命运共同体”大旗的中国,才更有资格掌控人类和AI的未来。

两千年前,中国通过丝绸之路输出四大发明;两千年后,中国通过光缆向世界输送蕴含着“科技平权”精神的智能火种。

历史已经证明,纸张会碾过羊皮纸,印刷机会粉碎手抄本。那么现在,中国开源的AI,也必将砸碎一切闭源霸权的锁链。

也许整个世界,只有延续了5000年文明的中国,才真正懂得:

文明的真谛,从来不是将知识锁进保险箱,而是让它像野火一样,烧遍荒原。

来源:卢克文工作室

1
0

名著精选