Deepseek 开源 - 搜索 News

6 天

16 个月后，DeepSeek 已不是孤身走暗巷

这一次，是 DeepSeek V4 把 Muon 优化器作为模型架构层的三大更新之一。Muon 是一种二阶优化器，解决的是训练阶段参数更新的效率和稳定性问题，用来取代已经用了 10 年的 Adam。Kimi 是最早把 Muon ...

腾讯网

DeepSeek V4开源，但这次不止一位屠龙少年

屠龙少年终于归来DeepSeek 上一次让全世界瞩目，还是在去年的春节前发布 V3 和 R1。这一年多，圈子里反复问同一个问题：DeepSeek ...

8 天

海外评测DeepSeek-V4：智能体任务排名开源第一，幻觉率上升，Token消耗大

完成标准测评流程，V4-Pro输出Token消耗量达1.9亿，属于本次测评中Token消耗最高的模型之一；V4-Flash消耗进一步攀升至2.4亿Token。即便定价偏低，高额的Token消耗仍是V4-Pro综合使用成本高于其他开源模型的核心原因。

8 天

V4登场，华为入局！DeepSeek融资传闻背后，一个开源旗手的理想与现实

DeepSeek最近一直深陷“舆论”中，因为其“不差钱、不融资”的高冷人设被一则传闻打破：阿里、腾讯正在洽谈投资。这是创始人梁文锋首次被传松口。在业内人士看来，背靠幻方量化却突然拥抱外部资本，缺的绝不是银子，而是能稳住人心的筹码。

21IC电子网

[导读]一直以来DeepSeek都很低调，近日DeepSeek宣布推出V4推理模型，距其2025年1月发布的R1已经过去一年多，所以业界对新版本格外关注。一直以来DeepSeek都很低调，近日DeepSeek宣布推出V4推理模型，距其2025年1月发布的R1已经过去一年多，所以业界对新版本格外关注。外媒MIT Technology Review撰文指出，在过去一年多时间里，DeepSeek经历 ...

7 天

DeepSeek：V4-Pro编程能力达开源第一，全球第九

近日消息，万众期待的DeepSeek V4发布了，距离去年1月份发布R1已经过去15个月了，这一年多时间全球AI领域可谓是城头变幻大王旗，一浪更比一浪高。对于DeepSeek V4，大家的期待值非常高，做到开源第一已经不算惊喜了，网友希望看到的是DeepSeek V4能跟御三家最强的AI掰手腕，尤其是在AI编程、智能体等目前最火的领域。 DeepSeek官方也在发布说明中提到了V4的性能，相比前 ...

腾讯网

超越DeepSeek-V4！罗福莉交出小米最强开源模型，首日适配5家国产芯片

智东西（公众号：zhidxcom）作者 | 李水青编辑 | 云鹏智东西4月28日报道，刚刚，小米开源罗福莉带队研发的MiMo-V2.5系列模型，采用MIT协议，允许商用推理部署与二次训练，无需额外授权。▲MiMo-V2.5-Pro在Hugging ...

腾讯网

开源和闭源模型的差距在拉大：这是DeepSeek论文揭示的残酷真相

12月2日，DeepSeek 发布了 V3.2 技术报告。在这篇论文里，他们做了一件罕见的事：明确指出开源大模型与闭源模型的性能差距不是在缩小，而是在扩大。这是基于大量实测数据的冷静判断。 2024年，当 DeepSeek、Qwen、GLM 等开源模型接连发布时，社区充满乐观情绪。

7 天on MSN

DeepSeek与Kimi技术“撞车”背后：中国开源AI双子星携手改写全球格局

中国AI开源领域迎来重大突破，DeepSeek与Kimi两大模型近期接连发布新一代产品，引发全球技术社区高度关注。4月24日，沉寂15个月的DeepSeek正式开源全新模型DeepSeek-V4，该模型支持百万词元超长上下文，在Agent能力、世界知识储备及推理性能方面实现质的飞跃，被海外开发者誉为"鲸鱼回归"。同日发布的Artificial ...

纽约时报中文网

DeepSeek发表新模型，开源令中国AI企业扩大影响力

DeepSeek将旗下模型以开源形式发布，意味着他人可自由使用和修改这些模型。OpenAI与Anthropic则将其领先模型作为专有技术保留。此次事件印证：开源系统的性能水准已接近封闭自研模型。此后数月，多家中国企业陆续推出数十款开源模型。截至202 ...

A5站长网

深度解析deepseek开源是什么意思

Deepseek开源是指Deepseek项目的源代码被公开，允许任何人免费查看、使用、修改和分发。开源的核心在于透明性和协作性，开发者可以基于Deepseek的代码进行二次开发，或将其集成到自己的项目中。下面UU云小编将对deepseek开源是什么意思进行详细解析。开源的 ...

5 天

超越DeepSeek-V4！小米最强开源模型，首日适配5家国产芯片

智东西4月28日报道，刚刚，小米开源罗福莉带队研发的MiMo-V2.5系列模型，采用MIT协议，允许商用推理部署与二次训练，无需额外授权。 ▲MiMo-V2.5-Pro在Hugging Face的开源页面截图此前，该系列模型于4月23日开启公测，包括MiMo-V2.5-Pro、MiMo-V2.5两款模型。模型具备更强Agent能力，支持100万上下文，且Token效率大幅提升。 MiMo-V2.

一些您可能无法访问的结果已被隐去。

显示无法访问的结果