大模型

关键词
ai大模型的接口的system role重要吗

在 AI 大模型接口中,system role 是非常重要的,它起到设置整个对话基调和上下文的作用。不同的模型和接口实现可能有所不同,但 system role...

多个大模型常用的搜索api插件分享

推荐谷歌搜索插件、exa search api和firecrawl搜索API工具。exa提供精炼html搜索结果,firecrawl价格亲民,结果适合大模型。搜...

什么是模型蒸馏

模型被问的最多的一类问题是:“你是什么模型?你的开发者是谁?”,然而你有时候并不能得到准确的答案,很多模型会自称是 GPT-4 或者 Claude,但实际上它们...

o3-mini 模型选择思路|什么时候坚决不用 o3-mini,只用 o1 满血版?

o3-mini 模型选择思路|什么时候坚决不用 o3-mini,只用 o1 满血版?在数学、编程等STEM 任务上,o3-mini-high 超越 o1;但是,...

能在24GB显存显卡上运行的最佳模型是什么?

能在24GB显存显卡上运行的最佳模型是什么?reddit上一位老哥kyazoglu,花了一个半月测试了在24GB显存显卡上运行的所有模型,得出来这张表。给希望本...

LLaMA模型系统全面解读

简介:LLaMA模型系统由Meta AI推出,基于Transformer架构,具有高效参数利用和灵活规模选择等优势。本文深入解读LLaMA模型的核心原理、技术特...

OpenAI发布最新模型规范

OpenAI在官网发布了最新的模型规范,希望可以进一步强化对可定制性、透明度以及探索、辩论和使用AI的智力自由的承诺。

阿里视频生成大模型万相2.1开源!效果超Sora,消费级显卡就能跑

阿里云视频生成大模型万相2.1(Wan)正式开源,此次开源采用Apache2.0协议,14B和1.3B两个参数规格的全部推理代码和权重全部开源,同时支持文生视频...

阿里发布全新开源推理模型 QwQ-32B,其性能可与 DeepSeek-R1 媲美

阿里云通义千问官方公众号发文宣布,推出最新的推理模型 QwQ-32B。一款拥有 320 亿参数的模型,其性能可与具备 6710 亿参数(其中 370 亿被激活)...

Claude 3.7 Sonnet 是 Anthropic 迄今最聪明的模型

Claude 3.7 Sonnet 是 Anthropic 迄今最聪明的模型,也是首个 Claude 模型,能进行“扩展思考”,也就是通过细致的、一步步的推理来...

如何用DeepSeek-R1蒸馏出属于你自己的大模型

发现了一个新的fune-tune框架,可以在1小时内让DeepSeek-R1蒸馏出属于你自己的小模型,整个过程是全自动的,不需要编写代码或者手动调节,仅需定义你...

ChatGPT API 相比 ChatGPT 的一些优点

ChatGPT API 相比 ChatGPT 的一些优点:显式定义角色,选择性地去掉会话中的信息,返回多个结果供选择,使用 logit_bias 参数调整特定词...

网友分享的在不同任务场景选择的最佳模型

网友分享的在不同任务场景选择的最佳模型:

国产AI大模型开源引爆海外 新闻时间线总结

#国产AI大模型开源引爆海外# 新闻时间线总结

中国信通院发起大模型幻觉测试,总体涉及五种测试维度

据「中国信通院」公众号消息,中国信息通信研究院人工智能所基于前期的 AI Safety Benchmark 测评工作,发起大模型幻觉测试。本轮幻觉测试工作将以大...

推荐资讯