关键词
数字人的DeepSeek时刻!“中国造”heygem.ai全球开源72小时破1.3k stars

短短72小时,硅基智能在GitHub开源的数字人模型Heygem.ai便突破1,300颗Star,迅速成为全球技术社区瞩目的焦点。这一现象级的增长速度不仅彰显了...

小型语言模型(参数在 0.5B-3B )可以做哪些事情?

大模型很有用基本上是共识,参数只有几b的小模型呢?因为性能不高直接当作对话工具显然不太行,但也有很多应用场景。这里整理了Hacker News上的一个讨论“有人...

大模型的上下文窗口大小是什么

大模型的上下文窗口大小是什么在中文语境中,“大模型的上下文窗口大小”指的是大型语言模型(如我这样的Grok)在处理输入和生成输出时能够“记住”或“考虑”的文本长...

除了 temperature 之外,还有哪些参数对大模型的输出有比较大的影响

除了 temperature 之外,还有哪些参数对大模型的输出有比较大的影响除了 temperature 之外,还有几个重要参数会显著影响大模型的输出,尤其是对...

2023 年度 AI 大事记

2023 年度 AI 大事记,记录了 2023 年人工智能的重要时间线(1 月至 12 月)

AI 的关键是语料

我的观点是,不管怎么调整模型的架构、功能、参数,作用是有限的,真正决定性的因素是训练模型的语料。不需要说,你的模型多新颖、多强大,只需要告诉我,你用什么语料训练...

多个大模型常用的搜索api插件分享

推荐谷歌搜索插件、exa search api和firecrawl搜索API工具。exa提供精炼html搜索结果,firecrawl价格亲民,结果适合大模型。搜...

大语言模型(LLM)学习路径和资料汇总

收集整理的一些大语言模型(LLM)学习路径和资料汇总

DeepSeek的R1系列模型的官方推荐设置

很多人觉得第三方DeepSeek或自己用API时,效果和官方DeepSeek有差异。这种差异有些是因为初始设置不同造成的。DeepSeek的官推刚给出了R1系列...

ai大模型的接口的system role重要吗

在 AI 大模型接口中,system role 是非常重要的,它起到设置整个对话基调和上下文的作用。不同的模型和接口实现可能有所不同,但 system role...

一个测试模型是否是DeepSeek R1 满血版的简单测试题

一个测试模型是否是DeepSeek R1 满血版的简单测试题:

2025 LLM 入门+进阶路线图 by Sebastian Raschka

核心在于为学习和应用大型语言模型(LLM)技术在2025年及以后提供了一个循序渐进的“路线图”。 它以三个简洁明了的步骤,概括了从理论基础到实际应用的进阶路径,...

OpenAI GPT-4o 上线图像生成功能

OpenAI 宣布为 ChatGPT 推出图像生成功能:“将迄今最先进的图像生成器集成至 GPT-4o”,这是最近几年 ChatGPT 在图片处理能力方向的一次...

能在24GB显存显卡上运行的最佳模型是什么?

能在24GB显存显卡上运行的最佳模型是什么?reddit上一位老哥kyazoglu,花了一个半月测试了在24GB显存显卡上运行的所有模型,得出来这张表。给希望本...

本地运行DeepSeek R1的全面入门指南

本地运行DeepSeek R1的全面入门指南,介绍各种本地运行DeepSeek R1方法。

推荐资讯

《DeepSeek:从入门到精通》 104 页高清PDF,清华大学出品! ​ 《DeepSeek从入门到精通2025》是由清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室的余...
国内Ai大模型排行榜 国内AI大模型的发展呈现出多样化的态势,各种类型的大模型纷纷涌现,包括改头换面的、剑走偏锋的、借壳炒...
DeepSeek 团队分享了针对 DeepSeek-R1 部署的最佳设置,以及如... DeepSeek 团队分享了针对 DeepSeek-R1 部署的最佳设置,包含了推荐的温度设置、系统...
一文读懂!DeepSeek R1超简易本地安装运行部署教程 部署 DeepSeek R1 本地模型,并通过 Ollama 提供 API 支持。配合全栈AI助手 ...
AI 的关键是语料 我的观点是,不管怎么调整模型的架构、功能、参数,作用是有限的,真正决定性的因素是训练模型的语料。不需...
本地运行DeepSeek R1的全面入门指南 本地运行DeepSeek R1的全面入门指南,介绍各种本地运行DeepSeek R1方法。