Claude 3.7 Sonnet 是 Anthropic 迄今最聪明的模型,也是首个 Claude 模型,能进行“扩展思考”,也就是通过细致的、一步步的推理来...
阿里云通义千问官方公众号发文宣布,推出最新的推理模型 QwQ-32B。一款拥有 320 亿参数的模型,其性能可与具备 6710 亿参数(其中 370 亿被激活)...
谷歌近日推出了最新版本的 Gemma AI 模型 ——Gemma3,声称这是 “全球最强的单加速器模型”。与之前发布的 Gemma AI 系列相比,Gemma3...
马斯克发布的Grok-3,各种评测上都很强。考虑到Grok的起步晚,开始的时候各种差,还得是马斯克,v3版本就赶上来了!
开发者Fareed Khan's 用手绘流程图以及代码的方式,逐步讲解如何按照 deepseek 技术报告构建一个可以在本地运行的小型基础模型。非常详...
Deepseek-v3技术报告简报。大家知道,硅谷的某几个前沿闭源模型公司,对外分享的技术信息越来越少了,报告里谈细节也是语焉不详。但是这次Deepseek-v...
强化学习在大语言模型的后训练阶段开创了新的Scaling范式,这一突破正日益受到业界重视。随着OpenAI O系列模型与DeepSeek R1的相继发布,模型展...
通俗解读 DeepSeek-R1 训练过程】 DeepSeek-R1 通过创新性地结合强化学习和监督学习,以低成本实现了与现有顶尖模型相当的推理能力,挑战了传...
【GPT-4.5 登场:OpenAI 最强、最佳 AI 聊天模型,更睿智、更高“情商”、更少幻觉】#GPT4.5将首先向ChatGPTPro用户开放# 2 月 ...
在首届开发者大会上,Anthropic推出了两款声称"业界最强"的AI模型,加剧了与OpenAI和谷歌的竞争Anthropic在周四举行的首...
发现了一个新的fune-tune框架,可以在1小时内让DeepSeek-R1蒸馏出属于你自己的小模型,整个过程是全自动的,不需要编写代码或者手动调节,仅需定义你...
据「中国信通院」公众号消息,中国信息通信研究院人工智能所基于前期的 AI Safety Benchmark 测评工作,发起大模型幻觉测试。本轮幻觉测试工作将以大...