DeepSeek

关键词
老妈都能玩转的 deepseek 教程

其实还有很多人没用过大模型,就算不说老人小孩,成年人要是对新事物不太感冒,可能都没有用过。考虑到这点,写个教程,尽可能简单,也足够有趣,让老妈都能玩转 deep...

中国Deepseek为何震惊了国内外,特别是美国人?

中国Deepseek为何震惊了国内外,特别是美国人?

阿里发布全新开源推理模型 QwQ-32B,其性能可与 DeepSeek-R1 媲美

阿里云通义千问官方公众号发文宣布,推出最新的推理模型 QwQ-32B。一款拥有 320 亿参数的模型,其性能可与具备 6710 亿参数(其中 370 亿被激活)...

Deepseek-v3技术报告简报

Deepseek-v3技术报告简报。大家知道,硅谷的某几个前沿闭源模型公司,对外分享的技术信息越来越少了,报告里谈细节也是语焉不详。但是这次Deepseek-v...

一个讲解如何从头开始构建 DeepSeek R1的项目

开发者Fareed Khan's 用手绘流程图以及代码的方式,逐步讲解如何按照 deepseek 技术报告构建一个可以在本地运行的小型基础模型。非常详...

超越DeepSeek R1与GPT 4.5,百度周末两连发!文心大模型4.5及X1,免费!

超越DeepSeek R1与GPT 4.5,百度周末两连发!文心大模型4.5及X1,免费!3月16日,文心大模型4.5和文心大模型X1正式发布!同时,文心大模型...

通俗解读 DeepSeek-R1 训练过程

通俗解读 DeepSeek-R1 训练过程】 DeepSeek-R1 通过创新性地结合强化学习和监督学习,以低成本实现了与现有顶尖模型相当的推理能力,挑战了传...

如何用DeepSeek-R1蒸馏出属于你自己的大模型

发现了一个新的fune-tune框架,可以在1小时内让DeepSeek-R1蒸馏出属于你自己的小模型,整个过程是全自动的,不需要编写代码或者手动调节,仅需定义你...

医护人员,Deepseek使用指南!

医护人员,Deepseek使用指南!

使用DeepSeek-R1蒸馏属于自己推理小模型

使用DeepSeek-R1蒸馏属于自己推理小模型!昨天介绍了使用DeepSeek-R1蒸馏出普通模型,今天是蒸馏出推理模型!

刚刷到了Andrew (吴恩达)对deepseek 的看法,用GPT翻译了一份给大家

刚刷到了Andrew (吴恩达)对deepseek 的看法,用GPT翻译了一份给大家:本周围绕 DeepSeek 的热议让许多人清晰认识到一些重要趋势,这些趋势...

目前为止分析DeepSeek最全面的文章了

目前为止分析DeepSeek最全面的文章了:>专家混合(MoE)>多头潜在注意力(MLA)>多标记预测(MTP)>群体相对策略优化(GR...

推荐资讯

《DeepSeek:从入门到精通》 104 页高清PDF,清华大学出品! ​ 《DeepSeek从入门到精通2025》是由清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室的余...
PHP老矣,尚能饭否? 近日 GitHut 最新公布的数据显示,开发者在 GitHub 提交的 PR 中,所使用语言为 PH...
国内Ai大模型排行榜 国内AI大模型的发展呈现出多样化的态势,各种类型的大模型纷纷涌现,包括改头换面的、剑走偏锋的、借壳炒...
什么是全栈开发人员:所需的基本技能 当您使用应用程序时,您通常认为谁负责?我相信您会考虑web开发人员。尽管您部分正确,但全栈开发人员是...
为什么 Laravel 这么优秀 Laravel 一直是我心中最优雅的后端框架,为了向更多的人解释为什么 Laravel 这么优雅?框...
微信小程序学习笔记,知识点全面概括总结 微信小程序学习笔记,知识点全面概括总结
DeepSeek 团队分享了针对 DeepSeek-R1 部署的最佳设置,以及如... DeepSeek 团队分享了针对 DeepSeek-R1 部署的最佳设置,包含了推荐的温度设置、系统...
MySQL安全最佳实践指南(2024版) 由于存储着敏感数据,MySQL数据库正沦为网络罪犯的攻击目标。这份全面的安全指南将深入研究保护MyS...
一文读懂!DeepSeek R1超简易本地安装运行部署教程 部署 DeepSeek R1 本地模型,并通过 Ollama 提供 API 支持。配合全栈AI助手 ...
歸藏老师的文本转可视化网页Prompt 歸藏老师的文本转可视化网页Prompt,可以把任何文本转化为精美网页。