第4页_大模型_AI_全栈开发网

栏目

文章 AI AIGC ChatGPT AI绘画机器学习深度学习大模型自然语言处理人工智能专题 Wiki 软件

关键词

搜索

排序

时间排序点击排序

一文看懂小模型与端侧模型

“小模型”通常指的是那些参数规模远少于GPT-3或Llama-13B的大语言模型，几个具有代表性的参数为1.5B、3B、7B等。“端侧模型”则通常指的是部署在手...

小模型端侧模型推荐 2025-02-17 16:34:25 73 浏览

OpenAI发布最新模型规范

OpenAI在官网发布了最新的模型规范，希望可以进一步强化对可定制性、透明度以及探索、辩论和使用AI的智力自由的承诺。

OpenAI AI 大模型 2025-02-19 10:18:06 72 浏览

Claude4来袭!Anthropic推出"业界最强"AI模型，编程能力全面超越竞争对手

在首届开发者大会上，Anthropic推出了两款声称"业界最强"的AI模型，加剧了与OpenAI和谷歌的竞争Anthropic在周四举行的首...

AI 编程 Claude Anthropic 2025-05-23 10:47:43 68 浏览

Google 的 Gemini 2.0 正式面向所有用户开放！

Gemini 2.0 现已全面开放，为开发者和用户带来了显著更新和新模型。这次的发布建立在此前 Gemini 2.0 实验版的基础之上，使强大 AI 变得更加易...

Google Gemini 2025-03-08 10:53:31 64 浏览

老妈都能玩转的 deepseek 教程

其实还有很多人没用过大模型，就算不说老人小孩，成年人要是对新事物不太感冒，可能都没有用过。考虑到这点，写个教程，尽可能简单，也足够有趣，让老妈都能玩转 deep...

deepSeek 2025-02-18 14:38:04 60 浏览

阿里发布全新开源推理模型 QwQ-32B，其性能可与 DeepSeek-R1 媲美

阿里云通义千问官方公众号发文宣布，推出最新的推理模型 QwQ-32B。一款拥有 320 亿参数的模型，其性能可与具备 6710 亿参数（其中 370 亿被激活）...

推理模型大模型阿里 QwQ 2025-03-07 09:30:30 54 浏览

阿里视频生成大模型万相2.1开源！效果超Sora，消费级显卡就能跑

阿里云视频生成大模型万相2.1（Wan）正式开源，此次开源采用Apache2.0协议，14B和1.3B两个参数规格的全部推理代码和权重全部开源，同时支持文生视频...

阿里大模型万相 2025-03-08 10:38:06 50 浏览

通俗解读 DeepSeek-R1 训练过程

通俗解读 DeepSeek-R1 训练过程】 DeepSeek-R1 通过创新性地结合强化学习和监督学习，以低成本实现了与现有顶尖模型相当的推理能力，挑战了传...

DeepSeek 训练 DeepSeek-R1 2025-03-06 10:36:53 43 浏览

谷歌推出Gemma 3：单GPU上运行的最强AI模型

谷歌近日推出了最新版本的 Gemma AI 模型 ——Gemma3，声称这是 “全球最强的单加速器模型”。与之前发布的 Gemma AI 系列相比，Gemma3...

AI Gemma 谷歌 2025-03-17 15:29:40 39 浏览

GPT-4.5 登场：OpenAI 最强、最佳 AI 聊天模型，更睿智、更高“情商”、更少幻觉

【GPT-4.5 登场：OpenAI 最强、最佳 AI 聊天模型，更睿智、更高“情商”、更少幻觉】#GPT4.5将首先向ChatGPTPro用户开放# 2 月 ...

OpenAI AI GPT 2025-03-07 22:11:19 36 浏览

超越DeepSeek R1与GPT 4.5,百度周末两连发！文心大模型4.5及X1，免费！

超越DeepSeek R1与GPT 4.5,百度周末两连发！文心大模型4.5及X1，免费！3月16日，文心大模型4.5和文心大模型X1正式发布！同时，文心大模型...

DeepSeek GPT 大模型文心大模型百度 2025-03-16 14:52:16 36 浏览

好的日常使用的模型推荐

好的日常使用的模型推荐（非广告～）

大模型 2025-03-17 15:56:30 35 浏览

马斯克发布的Grok-3，各种评测上都很强

马斯克发布的Grok-3，各种评测上都很强。考虑到Grok的起步晚，开始的时候各种差，还得是马斯克，v3版本就赶上来了！

Grok 2025-03-08 10:55:04 33 浏览

Kimi 最新模型 k1.6 登顶，编程能力超越 GPT o3mini、o1

2 月 27 日消息，Kimi 最新模型 k1.6 今日曝光。据全球动态基准测试平台 LiveCodeBench，Kimi k1.6 超过 GPT o3mini...

Kimi 2025-03-17 15:42:01 33 浏览

一个讲解如何从头开始构建 DeepSeek R1的项目

开发者Fareed Khan's 用手绘流程图以及代码的方式，逐步讲解如何按照 deepseek 技术报告构建一个可以在本地运行的小型基础模型。非常详...

DeepSeek 2025-03-17 16:12:02 31 浏览

推荐资讯