如何评价 deepseek 上线的 deepseek-V3 模型?
有句话是:没杀死敌人,先杀自己人!!! 阿里的QWEN,已经被比下去了! 最主要的是 Deepseek V3的价格,只是比GPT4O MINI贵不到1倍。 Model Input Output ───────────────────────────────────── Claude 3.5 Sonnet $3.00 $15.00 GPT-4o $2.50 $10.00 Gemini 1.5 Pro $1.25 $5.00 Deepseek V3 $0.27 $1.10 GPT-4o-mini $0.15 $0.60这在最大的AI API 中转站那只要0.14刀。 仅仅用了8 x NVI…
媒体报道称小米正斥巨资搭建 GPU 万卡集群,这会不会引领 AI 大模型发展新浪潮?
雷军万卡集群跟DeepSeek规模差不多,不过,DeepSeek用的似乎是十三幺散件万卡集群。而且军子最近又招募了天才少女罗福莉(DeepSeek)。 雷军这个人,眼光毒辣,又一肚子坏水,小米挖极氪团队,相当于把007据为己有(由于业务关系,我跟极氪的人比较熟,他们的技术和正在研发的车型,我比你们都多知道一点,极氪在烧钱上一点都不含糊。雷军把经验烧满的团队,直接就拉走了。)军子现在又挖DeepSeek的墙角,中国哪两个团队最强,我想大…
如何看待 OpenAI 最新发布的 o3 模型?有多强大?
o1 刚出来的时候,很多人还质疑这还达不到 AGI(通用人工智能)。o3 体现出的编程和数学能力,不仅达到了 AGI 的门槛,甚至摸到了 ASI(超级人工智能)的边。o3 也进一步验证了 RL 和 test-time scaling 的价值,在高质量预训练数据基本耗尽,模型能力 “撞墙” 的情况下,提供了一条通过后训练和增加推理时间,继续提升模型智力,解决更困难问题的路径。 o3 具体的性能指标很多人都看到了,我就不再重复了。省流版: o3 在 Code…
继VAR后,如何评价字节推出的改进模型Infinity?
VAR这前几天刚拿了 NeurIPS 2024最佳论文奖,VAR的文生图模型Infinity就放出来了。从论文所展示的生成的图像例子来看,Infinity生成的图像质量不错,也支持多分辨率生成,而且所展示的文字效果也不错。 从定量对比来看,2B参数的Infinity在GenEval和DPG两个benchmark上能达到SD3的性能,说明Infinity有比较好的文本遵循能力。 人工评测上,2B的Infinity优于2B的SD3-Medium。 总之,从论文所展示的效果来看, Infinity确实超过了…
simscape如何建立制冷系统仿真模型?
空调库是小型制冷装置设计和仿真必学的课程之一,空调库当中包含了制冷空调系统仿真的各种元件,除了制冷系统最基本的 四大件:压缩机、冷凝器、节流阀、蒸发器,也包含了制冷辅助部件,比如:储液器、阀门等;相比于两相流库,空调库可以建立详细的换热器的仿真模型,比如平行流换热器、翅片管式换热器、板式换热器等,还可以建立详细的热力膨胀阀模型,通过设定各类膨胀阀的参数,详细的模拟膨胀阀的节流效果。《Amesim制冷仿…
孩子很喜欢玩模型玩具,有什么比较好的品牌么?
模型玩具:玩具可以是抽象概念(汽车,飞机,坦克,枪械,卡通人偶,等) 品牌有很多,不好做过多推荐。 手工达人;全凭想象可以制作出许多不可思议的手工模型玩具。 我觉得;孩子需要在父母帮助之下,完成一件属于自己的手工模型玩具,而却这样可以让孩子更有自信,也会更有兴趣去了解它。
目前chatgpt哪个模型最强?
要说最强,当然是o1,但要说实用,那肯定是GPT-4o了~~ o1更适合科研一些~ 使用的话也很简单!现在AI领域也非常广,不仅仅 ChatGPT,还有很多其他领域~ AI的确很强大,不仅能帮助你节省时间、提高工作效率,还能做很多事~ 就像有了一把多功能的瑞士军刀,让你在工作中游刃有余,事半功倍。 以下是一些可以帮助你提高效率的AI工具,希望对你有帮助~ 1、AI工具类① AI 一下:yixiaai.com AI助手工具,100+助手模板,支持各种大模型…
中国在 GPT/LLM 大模型上是否已经实现了弯道超车?
这个问题真是一言难尽啊! 还是谈一下现状吧。中国的大模型公司与美国的大模型公司其实在数量上可能中国更多一些吧。 美国的OpenAI:No.1,毫无疑问!Google:尽管落了,但是依然是全球第二的实力吧?Meta:开源全靠它家的Llama系列。Microsoft:大家都知道,持有了大部分OpenAI的股份。但是自己的研发实力也是全球顶级的!Anthropic:OpenAI的一半员工干的。StabilityAI:尽管它家LLM不咋地,但是生图厉害啊!EleutherAI:一个…
字节跳动大模型训练被实习生恶意注入破坏代码,涉事者已被辞退,攻击带来的影响有多大?暴露出哪些问题?
今天全程当了吃瓜群众,攻击带来的影响不小,对于AI圈吃瓜的影响力也不小。 最新的消息是这个: 相关来源网址: GitHub - JusticeFighterDance/JusticeFighter110: 恶意攻击集群事件的证据揭露 一失足成千古恨,今天这样的反转再反转反而让事情更加戏剧化,影响力更大。 下面给不了解情况的朋友做一个事情概况的介绍: 在今年,某知名高校硕士生在某大型科技公司商业化技术团队实习期间,因对团队资源分配感到不满,于六月底利用…
人工智能中大模型和小模型的实际应用区别是什么?
大家好,我是TFlow AI的产品负责人。负责一款B端Agent的产品策划。TFlow AI 产品简介:是面向B端Agent平台,主要做模型应用层的开发。包含:任务流程agent、助手agent,rag等标准化的SDK,企业可以直接使用SDK等完成 二次开发 ,从而为业务提效。目前主要的SDK“任务流程agent”:能按流程处理任务(SOP),围绕目标来进行离散推理。能快速搭建Ai客服、AI导购等应用。体验地址: 点击体验 今天我们来看下,传统AI1.0和大模型AI2.0…
有哪些“百试不爽”,提高思考深度的思维模型?
俗话说思维决定格局,格局决定命运。 最近发现了一套让人茅塞顿开的思维模型,在这里分享给大家,一起打开格局! 建议收藏哦~学习力1 学习金字塔主动式学习,才是有效的学习! 2 费曼技巧(费曼学习法)想学会一个知识,不如尝试把它教给别人~ 3 刻意练习专注、重复、持续反馈。 4 RIA阅读法用自己的语言重述知识,并结合自己的相关经验,思考今后如何运用。 5 二八定律要用80%的时间做好那20%最重要的事! 思考力6 黄金圈法则杰…
听说百度要放弃基础通用大模型的研发了,真的假的?
整个国内模型底座第一次泡沫破裂就要来了。说个理想情况吧: 一,阶跃和智谱作为南北国家队,有政府投入兜底,保留革命火种。其他五小龙里除了DeepSeek,应该都赶紧放弃通用模型开发。转型专注做APP孵化或者B端客户实施(类似SAP,oracle,用友,金蝶)。拿着现在的算力GPU当做下轮融资入股,是最高收益解,能最大程度保护好已经入场投资人利益。而阶跃和智谱,即使获得其他四小龙算力支持,想要和LLaMA4这种赛亚人降临地球那样…
OpenAI新模型o1表现接近理化生博士水平,能解决83%国际奥数问题。国内的ai怎么水平还那么差?
我倒是不太担心o1把国内的AI甩得太远。o1这种类似于CoT的模式能成功,说明原本那些模型(GPT-4o, Claude 3.5 Sonnet等等)的上限是非常高的,只是之前的推理范式不给它们足够的token数思考。用GPT-4o mini做的o1 mini推理能力也这么强,更加证明推理能力和模型本身智力的关联并没有那么大。 现在OpenAI把reasoning这条路走通了,有理由相信Anthropic, xAI, 阿里,幻方都可以在几个月内跟上。也许最终的完成度没有OpenAI那么高,…
为什么现在的ai大模型好像只有中美在做,世界上其他国家都好像完全消失了?
当年美苏太空竞赛不就这样么 你能太空漫步我就直接登月行走 太空是一定会达成的目标,但人们都忽视了成本与收益,把长期目标极致缩短 然后苏联没了 当然,苏联没了有各种原因,但各种竞赛所消耗的海量资金无疑是拖垮苏联的重要一环 现在看AI竞赛真的有一种异曲同工之妙 同样的阳谋:落后就会挨打、无法证伪的目标 希望只是想多了
为什么会有那么多大模型答错「9.9 和 9.11 哪个大」?
省流:不是tokenizer的问题,也不是注意力错误,也不是语义建模错误。我不知道为什么,这简直是这几天最令我困惑的事情了。 最简单的回答是归咎于tokenizer,但这很可能是过度简化了问题。 对于其他答主提及的gpt4o等模型,其tokenizer可以从openai的网站或tiktoken获得,其将 11 分词为一个token并不能证明是直接导致该现象的原因。 我们可以很简单地找到反例。如llama系列,从第一代开始其tokenizer就将单个数字作为分词。baic…
大模型如何赋能BI产品?
分享自然堂集团问数GPT项目自然堂构建数据中台至今,已经积累了大量的数据,涵盖了供应链、生产、销售、营销和会员管理等各个方面。这些数据的积累提供了宝贵的资源,但同时也带来了一些挑战。 临时性一次性需求多:灵活变动的业务常常带来一次性需求。通常,业务方提出需求后,产品经理需要进行对接,讨论业务场景、数据口径和价值,形成PRD,并由开发人员进行开发。整个过程效率不高。重复需求多:梳理了自然堂的日常数据应用…
《黑神话悟空》最新的宣传片里,猴哥的模型很奇怪为什么没有人提出来?
笑死,作为一个3D模型设计师可以负责任的告诉你,你随便去找市面上能找得到的游戏原模型下载下来,丢到blender 3Dmax还是什么其他哪个软件里去看都可以,会很惊讶的发现,99%以上的模型不光看上去左右对称,实际上真的是左右对称,连脸上的网格点坐标都能精确到小数点后3位来镜像重叠。
阅兵时的各种导弹是真的吗,还是模型?
16年还在文 工团时,下部 队听过一个趣事。大家都知道部 队士 官四期转五期特别难,一个 旅甚至一个军都没一个!14年某导东风快递车队驾驶员四期到了转不了5期只好退 役。 这些驾驶员可都是部 队里的宝贝,曾驾驶快递车参加过多次演习和阅 兵,再破的路也能开的非常平稳,每当有重大活动都是他们开车。当他们旅街接到通知,快递车要经过天安 门时,部 队领导和新驾驶员都麻爪了,战 士心里没底不敢开,领导也觉得不保险不敢让他…
如何看待Huggingface CEO恭喜阿里Qwen2蝉联开源大模型榜首,并称中国处于领导地位?
开源精神是互联网精神的支柱,GitHub 和 Huggingface两大开源平台则是互联网的启明星。通过开源平台分享自己的见识与成果,公允地面对质疑与挑战,让无论是开源代码还是开源产品触达更多地使用者,让技术的便利传播到更远的受众中,这就是开源的魅力。 在大模型这个高度集成的系统工程中,无数的训练、部署、适配都相互依赖,都需要专业人员去建设,Llama开源了,因此有海量的支持 Llama 框架的插件、服务、专属优化提供,SD 这…