同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

潮新闻讯 辞旧迎新之际,如旋风般席卷全球AI圈的浙产AI大模型DeepSeek,继续创造历史。

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

图源:苹果美国区应用商店

1月27日,DeepSeek应用登顶苹果美国地区应用商店免费App下载排行榜,力压此前霸榜的OpenAI的ChatGPT,而排在第三名的是Meta旗下的Threads。

同日,苹果中国区应用商店免费榜显示,DeepSeek成为中国区第一。

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

图源:苹果中国区应用商店

作为“神秘东方力量”的组成部分、“杭州科技六小龙”之一,国产大模型公司深度求索(DeepSeek)被认为是大模型行业的最大“黑马”。2024年底,其以极低的算力(仅为同行的1/11)和GPU芯片数量(2000个)训练出了性能超越GPT-4o的大模型DeepSeek-V3,总训练成本仅557.6万美元(GPT-4约为7800万美元),被誉为“AI界的拼多多”。

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

图源:DeepSeek官网

去年12月DeepSeek-V3发布后,轰动世界AI圈。不到一个月之后,今年1月20日,DeepSeek正式开源R1推理模型。

据DeepSeek介绍,其最新发布的模型DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。

低成本实现高性能模型研发,对用户来说的体验感也立竿见影——它功能强大,但却免费使用,并且DeepSeek还将代码面向开发者进行了开源。

据了解,DeepSeek R1没有使用业内普遍使用的监督微调(SFT)训练范式,而是直接通过强化学习让模型自主进化出复杂的推理能力,包括反思和长链思考等能力。这种方法不仅提高了训练效率,还减少了对昂贵计算资源的依赖。

1月24日,一条发布在teamblind平台上的帖子疯传。一名Meta员工称,现在Meta内部因为DeepSeek的模型,已进入恐慌模式。

这位Meta员工写道:“一切源于DeepSeek-V3的出现,它在基准测试中已经让Llama4相形见绌。更让人难堪的是,一家‘仅用550万美元训练预算的中国公司’就做到了这一点。工程师们正在争分夺秒地分析DeepSeek,试图复制其中的一切可能技术……当部门里一个高管的薪资就超过训练整个DeepSeek V3的成本,而且这样的高管还有数十位,他们该如何向高层交代?”

潮新闻记者在手机上下载了R1免费版本的DeepSeek应用,尝试着让它写一副蛇年春联,其中要包括“龙”与“蛇”。大约两三秒就给出了结果,有对仗的上下联和横批,还写了一段文字来解读这幅对联的寓意,十分周全。

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

同时,记者增加难度,让它模仿贾谊的《过秦论》写一下隋朝,以《过隋论》为标题。不到一分钟,它就写了洋洋洒洒一大篇,按时间顺序,从隋文帝杨坚的开皇之治到隋炀帝杨广的倒行逆施导致隋朝二世而亡都写到了,条理清晰,观点鲜明。

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

最后,记者问它“为什么能够在美国苹果免费应用下载榜上超越ChatGPT”,它给出的答案就有点泛泛而谈了,给人一种“车轱辘话”的感觉。

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

1月26日,游戏科学创始人、CEO,《黑神话:悟空》制作人冯骥在微博上评价DeepSeek:可能是个国运级别的科技成果。

冯骥表示:“希望DeepSeek R1会让你对当前最先进的AI祛魅,让AI逐渐变成你生活中的水和电。太幸运了!太开心了!这样震撼的突破,来自一个纯粹的中国公司。知识与信息平权,至此又往前迈出了坚实的一步。”

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

图源:冯骥微博账号

值得一提的是,1月20日,深度求索的创始人梁文锋参加了国务院总理李强主持召开的专家、企业家和教科文卫体等领域代表座谈会。

据东方网报道,梁文锋本科、研究生毕业于浙江大学,拥有信息与电子工程学系本科和硕士学位。2008年起,他开始带领团队使用机器学习等技术探索全自动量化交易。2023年7月,DeepSeek正式成立,进军通用人工智能领域,至今从未对外融资。

DeepSeek团队规模不大,不到 140 人,但 “人才密度” 极高,成员多是来自清华、北大、北航等顶尖高校的应届博士毕业生、在读生以及硕士生。值得一提的是,团队没有“海归”,完全本土人才。

同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答

左一为梁文锋。图源:央视新闻截图

梁文锋秉持“看能力,不看经验”的理念,“选人的标准一直都是热爱和好奇心”,这吸引了大量年轻高潜人才,让众多 35 岁以下、工作经验不超五年的年轻人有充分的施展才华的舞台。

在团队管理上,梁文锋采用扁平化管理,淡化职级,鼓励自由讨论和创新,成员依兴趣选择研究方向并自由组队。当一个有潜力的构想出现时,公司会自上而下调配资源。而且,成员对资源和人员的调动不设上限,不存在层级和跨部门的限制,只要有想法,随时可以灵活调用。

梁文锋观点:

“我们创新缺的肯定不是资本,而是缺乏信心以及不知道怎么组织高密度的人才实现有效的创新。”

“对顶级人才吸引最大的,肯定是去解决世界上最难的问题。”

“创新不完全是商业驱动的,还需要好奇心和创造欲。”

“开源更像一个文化行为,而非商业行为。给予其实是一种额外的荣誉。一个公司这么做也会有文化的吸引力。”

主题测试文章,只做测试使用。发布者:九派网,转转请注明出处:https://www.uuxn.cn/article/4279.html

(0)
九派网的头像九派网
上一篇 2025年1月28日
下一篇 2025年1月28日

相关推荐

  • AI绘春晖|李华的春日来信

    “亲爱的李华……”,熟悉的作文开头,好像一直陪伴着我们从小长到大。这个三月,央视网以妙趣横生的创意AI演绎了这位素未谋面的友人的春日来信:“亲爱的同学,你好!我是李华。当你看到这封回信时,我们都已经长大了。一路行来,我路过你的课堂,琅琅读书声那样清脆响亮;我目睹文物修复师笔尖流转,朱砂雌黄描摹出历史的模样;我驰骋于辽阔的草原,在蓝天的见证下,追逐风吹草浪、马…

    2025年3月8日
    3500
  • 李强同欧盟委员会主席冯德莱恩通电话

    新华社北京4月8日电 国务院总理李强4月8日下午同欧盟委员会主席冯德莱恩通电话。 李强表示,当前,中欧关系呈现稳中向好势头。今年是中欧建交50周年,双方关系发展面临重要机遇。年初,习近平主席同科斯塔主席通话,为深化中欧关系奠定基调、指明方向。中国和欧盟互为彼此最重要的贸易伙伴,经济高度互补、利益紧密交融。中方愿同欧方携手努力,保持良好顺畅的高层交往,增进政治…

    2025年4月9日
    1800
  • 焦点访谈丨人形机器人加速进化 具身智能未来如何演绎?

    过去几个月,您一定刷到过这样的视频,各种人形机器人在不同的场景中,展现出各类绝活。伴随人形机器人出圈的还有一个新词:具身智能。所谓具身智能,简单说,就是具有了物理身体,能够和环境实现交互的人工智能。这项科技主要研究如何使机器人具备类似人类的感知、规划、决策和行为能力。作为发展新质生产力的重要组成部分,具身智能将会对我们的生产生活带来怎样的影响?人形机器人何时…

    2025年4月11日
    1800
  • 怎么观测80米古树?500岁古树烧成炭还能活?这些古树名木值得了解

    “古树名木”,这里的“古树”指树龄在100年以上的树木,不包括人工培育、以生产木材为主要目的的商品林中的树木。而“名木”,是指具有重要历史、文化、科学、景观价值或者具有重要纪念意义的树木。 自3月15日起,《古树名木保护条例》将施行。根据全国第二次古树名木资源普查结果显示,全国普查范围内的古树名木共计508.19万株。作为有生命的文物,每一棵古树都是活着的历…

    2025年3月14日
    3100
  • 四川自贡“7·17”重大火灾原因查明 32名公职人员被追责问责

    央视新闻讯 2024年7月17日,四川省自贡高新技术产业开发区九鼎川南书城(以下简称九鼎大楼)发生重大火灾事故,造成16人死亡,39人受伤,直接经济损失2670.18万元。日前,四川省人民政府常务会议审议通过了四川自贡九鼎大楼“7·17”重大火灾事故调查报告。 经调查认定,这是一起因九鼎集团违规组织无气割作业资格人员气割拆除自动扶梯,作业现场安全管理缺失、初…

    2025年4月10日
    1700

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信