第2页_大模型_AI_全栈开发网

栏目

文章 AI AIGC ChatGPT AI绘画机器学习深度学习大模型自然语言处理人工智能专题 Wiki 软件

关键词

搜索

排序

时间排序点击排序

MoE模型 vs Transformer模型核心区别

MoE模型 vs Transformer模型核心区别是什么呢，主要有四点。

大模型 MoE Transformer 2025-02-28 18:34:17 381 浏览

除了 temperature 之外，还有哪些参数对大模型的输出有比较大的影响

除了 temperature 之外，还有哪些参数对大模型的输出有比较大的影响除了 temperature 之外，还有几个重要参数会显著影响大模型的输出，尤其是对...

大模型 2025-02-20 11:36:51 285 浏览

能在24GB显存显卡上运行的最佳模型是什么？

能在24GB显存显卡上运行的最佳模型是什么？reddit上一位老哥kyazoglu，花了一个半月测试了在24GB显存显卡上运行的所有模型，得出来这张表。给希望本...

大模型显存 2025-03-06 10:32:57 265 浏览

多个大模型常用的搜索api插件分享

推荐谷歌搜索插件、exa search api和firecrawl搜索API工具。exa提供精炼html搜索结果，firecrawl价格亲民，结果适合大模型。搜...

大模型搜索 2025-03-22 09:56:42 251 浏览

OpenAI GPT-4o 上线图像生成功能

OpenAI 宣布为 ChatGPT 推出图像生成功能：“将迄今最先进的图像生成器集成至 GPT-4o”，这是最近几年 ChatGPT 在图片处理能力方向的一次...

OpenAI AI GPT-4o 推荐 2025-03-27 13:07:01 245 浏览

一文图解 DeepSeek-R1 的出众推理能力从何而来？

今天这篇深度解析 DeepSeek-R1 训练方法的文章，将展示一个令人耳目一新的解决方案：如何通过创新的强化学习方法，在少量高质量人工标注数据的情况下，打造出...

DeepSeek 2025-02-19 10:24:17 230 浏览

数字人的DeepSeek时刻！“中国造”heygem.ai全球开源72小时破1.3k stars

短短72小时，硅基智能在GitHub开源的数字人模型Heygem.ai便突破1,300颗Star，迅速成为全球技术社区瞩目的焦点。这一现象级的增长速度不仅彰显了...

heygem 数字人 2025-03-13 10:34:52 227 浏览

2025 LLM 入门+进阶路线图 by Sebastian Raschka

核心在于为学习和应用大型语言模型（LLM）技术在2025年及以后提供了一个循序渐进的“路线图”。它以三个简洁明了的步骤，概括了从理论基础到实际应用的进阶路径，...

LLM 2025-03-08 10:39:14 193 浏览

用Gemini翻译文章的优缺点及注意事项

用Gemini翻译文章的优缺点及注意事项，Gemini优点是上下文超长，翻译完成度极高，优化Prompt后甚至能避免某些“AI味检测”。而缺点或要注意的地方可能...

Gemini 翻译 2025-03-20 10:39:43 176 浏览

DeepSeek的R1系列模型的官方推荐设置

很多人觉得第三方DeepSeek或自己用API时，效果和官方DeepSeek有差异。这种差异有些是因为初始设置不同造成的。DeepSeek的官推刚给出了R1系列...

DeepSeek DeepSeek-R1 2025-03-08 10:20:36 160 浏览

大语言模型（LLM）学习路径和资料汇总

收集整理的一些大语言模型（LLM）学习路径和资料汇总

大语言模型大模型 LLM 推荐 2025-02-19 10:09:16 146 浏览

ai大模型的接口的system role重要吗

在 AI 大模型接口中，system role 是非常重要的，它起到设置整个对话基调和上下文的作用。不同的模型和接口实现可能有所不同，但 system role...

大模型 2025-02-20 11:31:39 146 浏览

DeepSeek R1 系统提示词

DeepSeek R1 系统提示词：您是由中国公司深度求索（DeepSeek）独家开发的智能助手DeepSeek-R1。您将为用户提供有益、无害且详尽的回答。关...

DeepSeek DeepSeek-R1 2025-03-19 10:07:58 144 浏览

2023 年度 AI 大事记

2023 年度 AI 大事记,记录了 2023 年人工智能的重要时间线（1 月至 12 月）

AI 人工智能 2024-03-18 11:02:14 139 浏览

LLaMA模型系统全面解读

简介：LLaMA模型系统由Meta AI推出，基于Transformer架构，具有高效参数利用和灵活规模选择等优势。本文深入解读LLaMA模型的核心原理、技术特...

大模型 Llama 2025-02-20 10:26:56 131 浏览

推荐资讯

《DeepSeek：从入门到精通》 104 页高清PDF，清华大学出品！《DeepSeek从入门到精通2025》是由清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室的余...

国内Ai大模型排行榜国内AI大模型的发展呈现出多样化的态势，各种类型的大模型纷纷涌现，包括改头换面的、剑走偏锋的、借壳炒...

DeepSeek 团队分享了针对 DeepSeek-R1 部署的最佳设置，以及如何避免模型绕过思维的指南

DeepSeek 团队分享了针对 DeepSeek-R1 部署的最佳设置，以及如... DeepSeek 团队分享了针对 DeepSeek-R1 部署的最佳设置，包含了推荐的温度设置、系统...

一文读懂！DeepSeek R1超简易本地安装运行部署教程部署 DeepSeek R1 本地模型，并通过 Ollama 提供 API 支持。配合全栈AI助手 ...

AI 的关键是语料我的观点是，不管怎么调整模型的架构、功能、参数，作用是有限的，真正决定性的因素是训练模型的语料。不需...

本地运行DeepSeek R1的全面入门指南本地运行DeepSeek R1的全面入门指南，介绍各种本地运行DeepSeek R1方法。