昨天心血来潮整理了一下中美大模型名字的由来,发现还挺有意思。
原来很多 AI 模型名,不只是品牌名,更像是一句隐藏的自我介绍。
中国模型:
1. Qwen / 通义千问:
「通义」有理解万物之义,「千问」就是回答千百种问题。Qwen 基本就是「千问」的国际化写法。
2. GLM:
来自 General Language Model,直译就是「通用语言模型」。名字很学术,也很清华系,先讲技术范式,再讲产品人格。
3. Kimi:
来自月之暗面创始人杨植麟的英文名。更有意思的是,Moonshot AI「月之暗面」据说还和 Pink Floyd 的《The Dark Side of the Moon》有关。
4. DeepSeek:
中文名叫「深度求索」。Deep 是深度,Seek 是寻找、求索。这个名字很直白,但也很符合它的气质:不太会讲故事,主要靠技术结果说话。
5. MiniMax:
来自 AI 和博弈论里的 minimax 算法,大概意思是:在最坏情况下争取最优解。这个名字其实很工程师,听起来像在说「我要把风险压到最低,把收益拉到最高」。
6. MiMo:
小米的大模型名,带着很强的小米品牌感:Mi Mo。名字很轻,但定位不轻,更像是小米「人车家」生态里的智能底座。
美国模型:
7. ChatGPT:
最朴素,也最成功。Chat GPT。GPT 是 Generative Pre-trained Transformer。原本技术味很重,但加了一个 Chat,瞬间变成人人都能理解的产品。
8. Claude:
一般认为来自 Claude Shannon,也就是信息论之父克劳德·香农。Anthropic 给模型起了一个人的名字,也让它从一开始就更像「助手」,而不是「机器」。
9. Gemini:
双子座。这个名字一方面对应 Google Brain 和 DeepMind 的合并,另一方面也暗合多模态:文字、图像、音频、视频,多种能力像「双子」一样合在一起。
10. Grok:
来自 Robert A. Heinlein 科幻小说《异乡异客》里的词,意思接近「深度理解」「彻底领会」。这个名字很马斯克:极客、科幻、有点叛逆,还带着 X 平台的社交气质。
看完这些名字会我发现,中国模型更喜欢「能力感」和「志向感」:千问、求索、通义、智谱。美国模型更喜欢「人格感」和「文化梗」:Claude、Gemini、Grok。
一个像是在说「我能做什么」;
一个像是在说「我是谁」。