第5页_大模型_AI_全栈开发网

栏目

文章 AI AIGC ChatGPT AI绘画机器学习深度学习大模型自然语言处理人工智能专题 Wiki 软件

关键词

搜索

排序

时间排序点击排序

发现了一个新的fune-tune框架，可以在1小时内让DeepSeek-R1蒸馏出属于你自己的小模型，整个过程是全自动的，不需要编写代码或者手动调节，仅需定义你...

DeepSeek 蒸馏大模型 2025-03-06 10:46:49 30 浏览

什么模型好？最近又密集做了一波应用，换了很多模型，感受：国内模型相比于顶尖国外模型还有差距，尤其是在真实生产环境（包括RAG、Agent、数据合成等应用中）

大模型 2025-02-18 14:53:16 27 浏览

网友分享的在不同任务场景选择的最佳模型：

大模型 2025-03-18 13:35:01 24 浏览

28日凌晨，OpenAI 正式发布 GPT-4.5 模型。GPT-4.5 支持联网搜索，并能够处理文件和图片上传，还可以使用 Canvas 来进行写作和编程。

OpenAI AI GPT 2025-03-08 10:08:12 23 浏览

刚刷到了Andrew （吴恩达）对deepseek 的看法，用GPT翻译了一份给大家：本周围绕 DeepSeek 的热议让许多人清晰认识到一些重要趋势，这些趋势...

DeepSeek 2025-03-06 10:50:11 18 浏览

使用DeepSeek-R1蒸馏属于自己推理小模型！昨天介绍了使用DeepSeek-R1蒸馏出普通模型，今天是蒸馏出推理模型！

DeepSeek 蒸馏小模型 2025-03-06 10:39:09 17 浏览

目前为止分析DeepSeek最全面的文章了：>专家混合（MoE）>多头潜在注意力（MLA）>多标记预测（MTP）>群体相对策略优化（GR...

DeepSeek 2025-03-06 10:35:31 14 浏览

OpenAI的GPT4.5是一个文科模型简单汇总了一下反馈1、写作很强。有人评价说“这是第一个真正可以书写的模型，这实际上正是写作的MidJouney”时刻。2...

OpenAI AI GPT 2025-03-07 22:14:21 14 浏览

《DeepSeek：从入门到精通》 104 页高清PDF，清华大学出品！《DeepSeek从入门到精通2025》是由清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室的余...

国内Ai大模型排行榜国内AI大模型的发展呈现出多样化的态势，各种类型的大模型纷纷涌现，包括改头换面的、剑走偏锋的、借壳炒...

DeepSeek 团队分享了针对 DeepSeek-R1 部署的最佳设置，以及如... DeepSeek 团队分享了针对 DeepSeek-R1 部署的最佳设置，包含了推荐的温度设置、系统...

一文读懂！DeepSeek R1超简易本地安装运行部署教程部署 DeepSeek R1 本地模型，并通过 Ollama 提供 API 支持。配合全栈AI助手 ...

AI 的关键是语料我的观点是，不管怎么调整模型的架构、功能、参数，作用是有限的，真正决定性的因素是训练模型的语料。不需...

本地运行DeepSeek R1的全面入门指南本地运行DeepSeek R1的全面入门指南，介绍各种本地运行DeepSeek R1方法。