关于DeepSeek和人工智能——一场没有硝烟的战争
本文于 79 天前发布,最后更新于 75 天前

近来DeepSeek很火,也算得上是最近震撼世界的一件大事。首先,大家都知道,现在世界上最领先的AI公司叫OpenAI,它有一个非常有名的应用叫ChatGPT,很多人现在也都在使用这个软件。ChatGPT自从2022年末诞生至今,一直是AI领域的领头羊,一提到AI大家首先就会想到它。虽然,后来也出现了很多优秀的AI应用,比如谷歌的Gemini还有Claude,国内的百度文心一言还有阿里的通义千问等等,但是没有人能够威胁ChatGPT的位置。就像虚拟货币虽然有很多,但没有人能够撼动比特币一样。ChatGPT之所以能够稳坐世界一哥的位置,就是因为它是目前世界上最好的AI模型,这个AI“大模型”是什么意思呢?可能很多不研究AI的人无法理解,简单来说它就是AI的大脑,在这个专业领域里叫大模型……ChatGPT之所以厉害,就是因为它有这个世界上最好的人工智能的大脑,它很聪明。

这些AI公司,比如说OpenAI,就是造这个大脑的,给它设计很多神经元,编制复杂的网络,也就是神经网络,理论上神经元越多网络越复杂,这个大脑就会越聪明,和人是一样的。这些人工智能公司也是在模仿人类的大脑来制造人工智能的大脑,那么造出来这个大脑之后,就会对这个大脑进行测试评分,评分越高的大脑就是越聪明。到目前为止,ChatGPT的大脑都是评分最高的,所以它是最领先的。

要造出这么一个聪明的大脑就需要几样东西,一个就是算力,一个是算法,还有就是高质量的数据。这和培养一个孩子是一样的。要培养出一个优秀的孩子,就需要这个孩子他本身智商就高,这就是算法的部分,然后他要学习非常精良的知识,这样的话他成绩很快就可以提高,所以培养大模型其实和培养人是一样的,但有一个地方不一样,就是培养人工智能还有个算力的部分,这个是我们人类没有的,因为我们人类的大脑结构是固定的,它已经不能改变了,但是人工智能不一样,它可以靠堆芯片复杂化它的神经元和神经网络让它变得更聪明。所以理论上,它的智商是一定会超过我们的,因为它可以无限地聪明下去,而我们是有极限的,这是我们大脑结构决定的。而这个堆芯片的事情就是算力的部分,所以人工智能的智商其实是由算力和算法共同作用的结果。

OpenAI制作的这个ChatGPT之所以能够称霸世界就是因为它在算力、算法和数据方面都是世界最顶尖的。其实算法和数据的部分,世界顶尖的AI公司大家都是差不多的。因为构建大脑的方法,这个算法的部分很多是基于公开的论文的,所以大家的底层逻辑都是差不多的。也就是说大家造这个大脑从外观上来看应该是没有太大区别,而数据也都是来自于互联网,互联网的数据是公开的,也没有什么太多竞争的余地,所以最后大家竞争的就是算力的部分,就是看谁能往里堆更多的芯片,让它更复杂,它就更聪明了。

而这个计算芯片来自于一家叫做英伟达的公司,就是现在最受瞩目的计算机芯片公司,这个芯片不是要多少有多少的,它的产量是有限的,而且价格非常的昂贵,而OpenAI在早期投资大量这个芯片,它囤积了大量的芯片,像英伟达现在最先进的芯片叫B200,一张芯片的价钱是4万美金。但是各大AI公司要竞争算力,所以谁有芯片多,谁就厉害。OpenAI就一直在囤积芯片,基本上就是有多少就要多少。它为什么要囤积这个芯片,其实现在也用不上,它囤积的原因有两个,一个就是为以后的使用做准备,因为是短缺资源,不是想用的时候就一定会有,一旦未来想用的话没有就不好了,所以现在要囤。还有一个,就是如果不买的话,就留给竞争对手了,所以用不用都得买。

OpenAI也不是自己囤,其实OpenAI可能没有太多的钱,它和它的母公司微软一起囤,微软是主要出资的。那么它们究竟已经囤了多少芯片,这个目前是不得而知的。但是就目前来说他们训练这个模型是用了5万张H100的芯片,并不是现在最先进的。而很快他们需求就要达到100万张左右了,需求量就是这么大。现在仅用了5万张就到了ChatGPT这个水平了,以后要100万张。芯片这个东西一直是美国的强项,美国之所以能够在科技领域一直领先也是因为它在芯片领域是全球最顶尖的,处于霸权地位。所以就保证了像OpenAI、谷歌这一众AI公司的算力一直就是世界最领先的,也就保证了美国在AI领域的领先。不光是OpenAI,美国整体的水平就是要高出其他国家很多。

但就这个事情在前阵子突然间,发生了变化,就是有一家公司悄无声息地撼动了ChatGPT在AI领域的地位。关键这不是一家美国公司,而是一家来自于中国杭州的公司,它的名字叫DeepSeek。DeepSeek撼动OpenAI最直观的一个表现,就是在1月27日这一天,多年霸榜手机应用榜首的ChatGPT变成了第二名,第一名出现了一个罕见的名字——DeepSeek。为什么说是悄无声息呢?是因为DeepSeek从来没有宣传过它这个产品,再一个就是DeepSeek这个公司在AI领域不是太有名,它的手机应用1月15日才刚刚上架,仅仅过了两周就超过了ChatGPT,这一下子不仅ChatGPT慌了,整个美国所有搞AI的人都慌了。之前,不论AI怎么争,都是美国的公司之间在争,美国也一直深信他们就是AI界的老大,霸权的地位是不可能被动摇的。结果没想到一个从没听说过的中国公司一下子要改变了这个局势。大家现在到手机商店搜DeepSeek的话也能看到这个软件,下载下来可以用用看,它和ChatGPT几乎是一样功能的软件。就是你可以问它问题,它就能回答,说实话也没比ChatGPT高级到哪去。那么这个和ChatGPT差不多的东西,为什么能够超越ChatGPT?其实就四个字——物美价廉。

物美体现在它的性能是比肩ChatGPT目前在市场上的旗舰模型。ChatGPT现在有两个主力模型,一个叫4o,一个叫o1。这两个模型的类型是不一样的,就是两个不一样的大脑,4o是处理日常业务的,它很聪明,反应也很快。而o1是深度思考模型,它反应慢点,但思索更深。所以4o相当于你的一个个人助理,而o1是一个顾问,不是所有的事情都要问顾问,有些简单的事情4o就可以解决了。而DeepSeek也出了两个模型,分别叫V3和R1,V3对标4o,R1对标o1,性能几乎是一样的,都能打个平手。甚至DeepSeek在某些领域的评分是要超过ChatGPT的模型的。

但是呢,东西好并不是它的重点,真正令人惊艳的是它的价廉。它的价钱有多便宜呢?我们先说一下ChatGPT的价钱,ChatGPT虽然免费用户也是可以使用的,但是有很多的限制,付费用户20美金/月,专业用户200美金/月。就是你如果想用它最先进的大脑的话,一个月就要花200美金。而DeepSeek是免费的,谁都可以免费使用它最聪明的大脑,对标o1的那个大脑都是可以使用的。除了手机应用之外,ChatGPT还有一个挣钱的地方,就是API调用,就是企业使用这种大脑的时候他们就要另付费,和我们个人用手机应用稍微有点不一样。比如企业他们很多服务是基于人工智能的,像客服,以前的客服就真的有人在接电话或者在网上回答你的问题,但现在渐渐变成人工智能了。客服怎么能够变成人工智能呢?是ChatGPT把它这个大脑锁在一个数据中心,给你一条线接给你,说以后客户问问题都直接连到我这个大脑,我的大脑分析完给他答案,所以你就不用管客服问问题了,所有问题由我ChatGPT为你解答。但是呢,你要给我钱。怎么算钱呢?按字算钱。问的内容每个字是多少钱,回答的内容每个字是多少钱,价钱是不一样的,大概差4倍的价钱。也就是说ChatGPT输入,价钱便宜。ChatGPT输出,价钱贵。所以现在很多企业都使用ChatGPT的这个调用的服务。当然,不光是人工客服,很多的地方,比如说用人工智能来导航,带有人工智能的游戏或者人工智能的股票分析系统……都是这样一个原理,都是按字算钱的。而且也不仅仅是通过这个来挣钱,ChatGPT也通过这个方式来锁定客户。就是一旦,你把你的所有客服都辞掉了,用了我的ChatGPT服务,你以后就只能用我了,你就停不下来了。而DeepSeek也提供完全相同的服务,就是API调用,价钱是ChatGPT的十分之一。(DeepSeek-R1 API 服务定价为每百万输入 tokens 1 元(缓存命中)/ 4 元(缓存未命中),每百万输出 tokens 16 元)也就是说。你花同样的钱,可以应付10倍以上的客户,应对的质量也一样。谁不用呢?所以DeepSeek的低价格是十分惊艳的。

但是廉价并不是DeepSeek引发轰动的原因,只是它的一个特点。真正引发轰动的原因是DeepSeek把它这个大模型给开源了,人人就都可以下载到这个大模型,在你自己本地的电脑上运行,你就有了像OpenAI一样的能力,你甚至可以开一个像OpenAI一样的公司,去赚钱。这一开源,对全世界的企业和个人来说吸引力就太大了,而且不仅仅是吸引力的问题。它对OpenAI这样闭源的AI公司就是核心打击,把人家吃饭的碗给砸了。OpenAI赚钱靠什么,靠锁住它的大脑,没有人能够看到它的大脑是怎么思考的,你只能问,它只会给你答案,所以靠这问答来赚钱。就好像OpenAI训练一个非常厉害的律师,你要有什么问题可以问它这个律师,但是你就需要交咨询费。但是DeepSeek不一样,它把这个律师公开了,谁都可以把这个律师领回家,就成为你的私人顾问了,完全不要钱。当然,我们也坦诚地说,你要想在电脑上运行最聪明的一个大脑,普通的电脑肯定不行,你需要一个更好的电脑。但是运行一个差不多的阉割版本是可以的。

什么感觉呢?就是地球上原先只有OpenAI一家公司会打井,所以你想喝水就只能给它交钱。结果冒出一个DeepSeek造了一个打井器,人人都可以把打井器拿回家钻你自己的井,钻出这井的水和OpenAI一样的甜,你说OpenAI它能不着急吗。就算你不会用打井器,你不想用打井器自己打井,你可以用DeepSeek的水,它和OpenAI也是一样的,价钱只有它的十分之一。所以DeepSeek一出来美国就炸锅了,DeepSeek登顶当天1月27日,美国所有和AI相关的股票全面大跌,做芯片的全都大跌。跌得最严重的就是英伟达,股价一天就跌了17%,市值蒸发6000亿美元,创下美国股市历史上最大单日跌幅,以前就没这么跌过。那么DeepSeek撼动了OpenAI,按理说跌得应该是OpenAI,但是OpenAI没上市,为什么英伟达会跌呢?

因为还有一点没提到,就是DeepSeek不仅仅是物美价廉,开源这么简单,它的开发成本还超级低。DeepSeek之所以能开源,就是因为它做这个大脑没花几个钱,OpenAI做这两个顶级大脑4o和o1据说花了数十亿美金,主要钱都花在买英伟达的芯片上,前文说过,算力就是王道,堆芯片,所以就不停地在花钱。而DeepSeek的这两个同等级别的大脑做出来只花了560万美元,保守估计是OpenAI的1%。而且它不是用最高端的芯片,做出来的这个大脑,它是用非常普通的芯片做出来的。当然,这个普通对于个人来说可能也是挺高端的,但是对于AI公司来说是相当低级的,大家可能都不会使用的那种芯片。它之所以用这种普通芯片,是因为美国对中国是有芯片禁运的,最高级的芯片中国是拿不到的。虽然传说,它在早起曾经囤积了一些高级的芯片,但是能囤积也囤积不了多少,就那一点点,就造出了这么厉害的大脑。整体来说,就是DeepSeek用很少的钱,用比较低端的工具,就把美国投入了几十亿美元甚至上百亿美元的事情给办了。如果美国公司靠堆一大堆芯片办的事情,人家用很少的钱很少的芯片就能办的话,那谁还去买这高端的芯片,所以市场普遍认为,当初对英伟达这个芯片的估值过高,就是它最高端的芯片没有这个价值,所以就纷纷抛售英伟达的股票。

大家知道美国在AI市场已经布局两年,也在不停地宣称自己的霸主地位,如果DeepSeek没有出现,那它就是霸主毋庸置疑,也会一直霸主下去。两年的布局一下子被击穿,所以美国的公司都坐不住了。它们对于DeepSeek为何能用如此低的成本如此短的时间(它训练两个大脑只用了两个月的时间)造出如此好的东西表示怀疑,就是四个字——不可思议。因为感觉DeepSeek没有那么强大的AI开发背景,DeepSeek全称叫杭州深度求索人工智能基础技术研究有限公司,是一家成立于2023年7月份的公司。这个公司的创始人叫梁文峰,他曾经是中国知名量化对冲基金“幻方量化”的创始人,而“幻方量化”就是DeepSeek的母公司,是十年前成立的一家对冲基金和人工智能公司,主营业务是量化投资。量化投资就是利用数学、统计学和计算机程序对大量数据进行分析以制定投资策略的一种投资方式,简单来说就是人工智能加计算机来进行自动投资运作的公司。DeepSeek就是他的一个子公司,专门研究底层人工智能技术,因为他需要这个技术来进行投资。结果就研究出了这两个聪明的大脑,所以其实DeepSeek的背景是相当强大的。它的母公司是一个投资公司,是相当有钱的,而且这个公司也确实是一直在研究人工智能的。

但是美国那边觉得这不足以说明它为什么能够在这么短的时间内研究出最顶尖的人工智能,所以就怀疑DeepSeek是否有使用不正当的手段弯道超车,比如说DeepSeek有抄袭ChatGPT之类的。但是这个明显是不可能的,因为ChatGPT是闭源的,而DeepSeek是开源的。开源明显是不能抄袭闭源的。比如说操作系统,有苹果的操作系统iOS,微软的操作系统Windows之所以不能被抄袭就是因为它们都是闭源的,看不见,抄不到。如果DeepSeek真的有抄袭ChatGPT的话,它开源以后OpenAI就会发现代码和他们的一样,然而并没有。就像是OpenAI是一个做饭非常厉害的大厨,没有人看到过它怎么做饭,只知道食材进去之后,它就能做出非常好吃的饭。而过两天,DeepSeek也做出了一个非常好吃的饭,所以它怀疑你是不是抄袭了我的厨艺。但问题是没人看到你是怎么做的饭。DeepSeek 就算吃过你做的饭,它也没见过你怎么做的。而且还有一个事情可以非常直观的证明DeepSeek没有抄袭,是因为DeepSeek有一个特点,就是你问它问题,它会把它的思考过程显示出来,它如何一步一步得到问题的答案,每一步都非常清晰。反而ChatGPT不行,它是闭源的。它只给答案,思考过程不会告诉你。所以DeepSeek是不可能抄袭ChatGPT。如果它具备反推理的能力,就是通过答案能推理出思考的过程的话,那它就有正面思考的能力,那这也不是抄袭,所以抄袭的说法是明显不成立的。事实也是如此,OpenAI从来没有说过DeepSeek抄袭它。但是OpenAI的母公司微软说他们发现去年秋天的时候疑似DeepSeek的人员有调用它们的数据,就是有可能通过他们的数据来训练了DeepSeek。ChatGPT是个非常优秀的老师,然后DeepSeek找了个人不停地问问题。微软说它有证据,但是并没有拿出来。这个其实从法律层面来说是没有问题的。因为AI生成的东西是不受版权法的保护的。但是OpenAI的使用条款上有规定,就是不能用OpenAI的回答去训练竞品。就比如OpenAI是老师,你是学生,你可以不停地跟OpenAI学习,你可以很优秀,但你不能当老师,一辈子不能当老师。不过话说回来,到目前为止,没有任何证据证明DeepSeek使用了OpenAI的数据。就在微软提出这个怀疑的当天1月29日的那一天,英伟达和微软的股价再次大幅下跌,因为DeepSeek开源,开源之后,全世界最顶尖的学者和技术大神们就开始研究DeepSeek的文档和代码,结果发现一个令人更加惊奇的事情,就是他们发现DeepSeek使用了一个完全创新的技术训练大模型,才能够使得大模型在短短两个月的时间之内完成训练。

这就要讲一下英伟达为什么成为计算芯片垄断的一个企业了。其实计算芯片很多公司都能产,但是英伟达在这个计算芯片上面做了一个叫做CUDA的东西,就是一个计算平台,你可以理解为它是一个生态。便于理解打个比方,计算芯片因为它有很强的算力,你可以把它理解为核能,但是核能不可以直接利用,你就需要一个核电厂把它转化成电能再进行利用,而英伟达就是造这个核电厂的公司,通过非常复杂的过程把核能转化并高效利用。一旦你使用了英伟达的芯片,就不需要考虑核能转化电能的事情。所以只要使用了,就停不下来。结果通过DeepSeek的代码发现它绕过了核电厂,利用英伟达的底层技术直接调用核能,而且绕过CUDA这个事情就意味着它不需要使用英伟达的芯片,因为只有英伟达的芯片上有CUDA,它能直接调用核能,只要有芯片,都可以用。所以,发现了这个事情的当天英伟达股价再次下跌。而就在这个事情的第二天,英伟达、微软、亚马逊都表示他们的计算平台上架了DeepSeek大模型,在他们的平台上也可以使用DeepSeek,证明他们已经承认了DeepSeek。所以数据的争议姑且不论,DeepSeek创新的思路和高超的技术是有目共睹的,它也从来没有解释过什么。东西就摆在这,你想看就看。所以才说DeepSeek在一夜之间改变了这个世界的AI格局。

对于此事,川普在1月27日也发表了回应。他说:“DeepSeek的出现,是对美国科技主导地位的挑战,该成为美国AI行业的‘警钟’,接下来我们一定要通力合作,确保美国在AI领域的主导地位。”关键DeepSeek最先进的R1模型公布是在中国的农历新年时候公布的,而川普是在1月20日宣布就职,21日的时候他就在白宫和OpenAI、甲骨文,还有日本的软银宣布说启动了一个“星际之门”的人工智能基础设施投资计划,说投资5000亿美元,打造全球最先进的AI中心。就是向世界发出一个信号,说未来美国也是AI界的主导了,你们就不要比了。结果这个计划宣布之后,首先出来打脸的还不是DeepSeek,是埃隆 · 马斯克。马斯克说这几个公司根本就没钱,哪来的5000亿美元。说这句话的时候,人们才注意到,这几个公司里居然没有马斯克,却有马斯克的竞争对手OpenAI,OpenAI和马斯克的恩怨来源已久。虽有马斯克的打脸,但是川普宣布这个星际之门计划之后,美国所有的AI股都开始涨,结果没涨几天,DeepSeek一出现,一切就都乱了。硅谷知名的投资人马克 · 安德森说:“DeepSeek的出现堪称人工智能的斯普特尼克时刻。”斯普特尼克时刻就是1957年苏联成功发射了第一颗人造卫星——斯普特尼克一号,标志着人类进入太空时代的同时,令西方世界陷入了一片恐慌。在那之前,美国一直认为自己的航空领域是领先的,它发过两次卫星都没成功,结果莫名其妙苏联发了一颗就成功了,一下子就把整个西方世界全部吓坏了。而这个斯普特尼克时刻就造就了NASA的成立和之后20年的苏美太空争霸。所以接下来,就可能是中美的人工智能争霸。

暂无评论

发送评论 编辑评论


|´・ω・)ノ
ヾ(≧∇≦*)ゝ
(☆ω☆)
(╯‵□′)╯︵┴─┴
 ̄﹃ ̄
(/ω\)
∠( ᐛ 」∠)_
(๑•̀ㅁ•́ฅ)
→_→
୧(๑•̀⌄•́๑)૭
٩(ˊᗜˋ*)و
(ノ°ο°)ノ
(´இ皿இ`)
⌇●﹏●⌇
(ฅ´ω`ฅ)
(╯°A°)╯︵○○○
φ( ̄∇ ̄o)
ヾ(´・ ・`。)ノ"
( ง ᵒ̌皿ᵒ̌)ง⁼³₌₃
(ó﹏ò。)
Σ(っ °Д °;)っ
( ,,´・ω・)ノ"(´っω・`。)
╮(╯▽╰)╭
o(*////▽////*)q
>﹏<
( ๑´•ω•) "(ㆆᴗㆆ)
😂
😀
😅
😊
🙂
🙃
😌
😍
😘
😜
😝
😏
😒
🙄
😳
😡
😔
😫
😱
😭
💩
👻
🙌
🖕
👍
👫
👬
👭
🌚
🌝
🙈
💊
😶
🙏
🍦
🍉
😣
Source: github.com/k4yt3x/flowerhd
颜文字
Emoji
小恐龙
花!
上一篇
下一篇