DeepSeek

关键词
老妈都能玩转的 deepseek 教程

其实还有很多人没用过大模型,就算不说老人小孩,成年人要是对新事物不太感冒,可能都没有用过。考虑到这点,写个教程,尽可能简单,也足够有趣,让老妈都能玩转 deep...

除了DeepSeek外,还有哪些工具比较好用?

除了DeepSeek外,还有哪些工具比较好用?

阿里发布全新开源推理模型 QwQ-32B,其性能可与 DeepSeek-R1 媲美

阿里云通义千问官方公众号发文宣布,推出最新的推理模型 QwQ-32B。一款拥有 320 亿参数的模型,其性能可与具备 6710 亿参数(其中 370 亿被激活)...

中国Deepseek为何震惊了国内外,特别是美国人?

中国Deepseek为何震惊了国内外,特别是美国人?

通俗解读 DeepSeek-R1 训练过程

通俗解读 DeepSeek-R1 训练过程】 DeepSeek-R1 通过创新性地结合强化学习和监督学习,以低成本实现了与现有顶尖模型相当的推理能力,挑战了传...

超越DeepSeek R1与GPT 4.5,百度周末两连发!文心大模型4.5及X1,免费!

超越DeepSeek R1与GPT 4.5,百度周末两连发!文心大模型4.5及X1,免费!3月16日,文心大模型4.5和文心大模型X1正式发布!同时,文心大模型...

一个讲解如何从头开始构建 DeepSeek R1的项目

开发者Fareed Khan's 用手绘流程图以及代码的方式,逐步讲解如何按照 deepseek 技术报告构建一个可以在本地运行的小型基础模型。非常详...

如何用DeepSeek-R1蒸馏出属于你自己的大模型

发现了一个新的fune-tune框架,可以在1小时内让DeepSeek-R1蒸馏出属于你自己的小模型,整个过程是全自动的,不需要编写代码或者手动调节,仅需定义你...

使用DeepSeek-R1蒸馏属于自己推理小模型

使用DeepSeek-R1蒸馏属于自己推理小模型!昨天介绍了使用DeepSeek-R1蒸馏出普通模型,今天是蒸馏出推理模型!

医护人员,Deepseek使用指南!

医护人员,Deepseek使用指南!

刚刷到了Andrew (吴恩达)对deepseek 的看法,用GPT翻译了一份给大家

刚刷到了Andrew (吴恩达)对deepseek 的看法,用GPT翻译了一份给大家:本周围绕 DeepSeek 的热议让许多人清晰认识到一些重要趋势,这些趋势...

目前为止分析DeepSeek最全面的文章了

目前为止分析DeepSeek最全面的文章了:>专家混合(MoE)>多头潜在注意力(MLA)>多标记预测(MTP)>群体相对策略优化(GR...

推荐资讯