关键词
个人单机本地部署大模型,一步到位硬件怎么选?

个人单机本地部署大模型,一步到位、两三年内不过时的话设备怎么选,最近周围朋友这方面聊得比较多。1.5B、7B、8B等小模型效果有限,目前32B费效比最高未来70...

AI 的关键是语料

我的观点是,不管怎么调整模型的架构、功能、参数,作用是有限的,真正决定性的因素是训练模型的语料。不需要说,你的模型多新颖、多强大,只需要告诉我,你用什么语料训练...

2023 年度 AI 大事记

2023 年度 AI 大事记,记录了 2023 年人工智能的重要时间线(1 月至 12 月)

小型语言模型(参数在 0.5B-3B )可以做哪些事情?

大模型很有用基本上是共识,参数只有几b的小模型呢?因为性能不高直接当作对话工具显然不太行,但也有很多应用场景。这里整理了Hacker News上的一个讨论“有人...

大模型的上下文窗口大小是什么

大模型的上下文窗口大小是什么在中文语境中,“大模型的上下文窗口大小”指的是大型语言模型(如我这样的Grok)在处理输入和生成输出时能够“记住”或“考虑”的文本长...

除了 temperature 之外,还有哪些参数对大模型的输出有比较大的影响

除了 temperature 之外,还有哪些参数对大模型的输出有比较大的影响除了 temperature 之外,还有几个重要参数会显著影响大模型的输出,尤其是对...

大语言模型(LLM)学习路径和资料汇总

收集整理的一些大语言模型(LLM)学习路径和资料汇总

刚刚,全球首个混合推理模型Claude 3.7降世!最强编程大脑暴击DeepSeek R1

就在刚刚,Anthropic祭出首个混合推理Claude3.7Sonnet,堪称扩展思考模式的最强模型。在最新编码测试中,新模型暴击o3-mini、DeepSe...

一个测试模型是否是DeepSeek R1 满血版的简单测试题

一个测试模型是否是DeepSeek R1 满血版的简单测试题:

本地运行DeepSeek R1的全面入门指南

本地运行DeepSeek R1的全面入门指南,介绍各种本地运行DeepSeek R1方法。

ai大模型的接口的system role重要吗

在 AI 大模型接口中,system role 是非常重要的,它起到设置整个对话基调和上下文的作用。不同的模型和接口实现可能有所不同,但 system role...

DeepSeek的R1系列模型的官方推荐设置

很多人觉得第三方DeepSeek或自己用API时,效果和官方DeepSeek有差异。这种差异有些是因为初始设置不同造成的。DeepSeek的官推刚给出了R1系列...

2025 LLM 入门+进阶路线图 by Sebastian Raschka

核心在于为学习和应用大型语言模型(LLM)技术在2025年及以后提供了一个循序渐进的“路线图”。 它以三个简洁明了的步骤,概括了从理论基础到实际应用的进阶路径,...

多个大模型常用的搜索api插件分享

推荐谷歌搜索插件、exa search api和firecrawl搜索API工具。exa提供精炼html搜索结果,firecrawl价格亲民,结果适合大模型。搜...

什么是模型蒸馏

模型被问的最多的一类问题是:“你是什么模型?你的开发者是谁?”,然而你有时候并不能得到准确的答案,很多模型会自称是 GPT-4 或者 Claude,但实际上它们...

推荐资讯

国内Ai大模型排行榜 国内AI大模型的发展呈现出多样化的态势,各种类型的大模型纷纷涌现,包括改头换面的、剑走偏锋的、借壳炒...
《DeepSeek:从入门到精通》 104 页高清PDF,清华大学出品! ​ 《DeepSeek从入门到精通2025》是由清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室的余...
一文读懂!DeepSeek R1超简易本地安装运行部署教程 部署 DeepSeek R1 本地模型,并通过 Ollama 提供 API 支持。配合全栈AI助手 ...
DeepSeek 团队分享了针对 DeepSeek-R1 部署的最佳设置,以及如... DeepSeek 团队分享了针对 DeepSeek-R1 部署的最佳设置,包含了推荐的温度设置、系统...
AI 的关键是语料 我的观点是,不管怎么调整模型的架构、功能、参数,作用是有限的,真正决定性的因素是训练模型的语料。不需...
本地运行DeepSeek R1的全面入门指南 本地运行DeepSeek R1的全面入门指南,介绍各种本地运行DeepSeek R1方法。