对于国内 AI 我的认知大约是幸存者偏差了(llm 模型)
由于我所在的情况和我所接触到的人(主要指网友),大多都是使用国外御三家(Gemini
,Claude
(也会叫克劳德
),GPT
),我不论电脑/手机都是国外御三家(曾经是DeepSeek/通义千问);
国内的豆包
/元宝
都是 C 端宣传做的很好,豆包网页端用过几次,也仅仅是因为其 AI 编程模式能引用 GitHub 仓库,元宝完全没用过,相比之下,我使用 DeepSeek
/Kimi
/通义千问
的次数多得多了,而这三的使用人数应该远少于豆包(大概)
为什么我不使用豆包?除了模型本身能力外是因为图标,我极其讨厌豆包的图标,这啥逆天…Gemini(之前的图标,不是现在黑黑一坨的),GPT,DeepSeek,通义千问,Kimi这些的图标我觉得都挺好(我讨厌的是具备明显或类似AI特征的图片内容,就豆包这个我都不知道是什么生物了,还不如搞个类似
全棉时代
那种的形象,我觉得还蛮好看的)另: Gemini这名字我觉也挺好的
国内 AI 接触历程早期是通义千问,被别人推荐的(当时接触ShortX,写shell和mvel),然后是 Kimi (因其宣传超长上下文, 用下来感觉也一般), 最后是 DeepSeek v3(24 年底),不过我当时接触的认为是尚未达到预期(即 就我使用的方面来看,相较于同时期其他模型,没有到断崖式领先的地步(可能是我当时还不够了解吧); 另一方面是当时升级到v3有人说很厉害,拉高了我的期待),后来很火就是了(同时也展现出了国内丑陋的网络生态/短视频生态/…)
百度的文心一言说实话刚刚都没想起来,感觉纯小丑一样,我不是很喜欢百度;要知道他们 CEO(或者是创始人,忘了) 当时可是说 开源是智商税 的,后来 DeepSeek 火了,百度也去开源去了🤣
并且,我使用的更多场景是 API,国内对于 API …我把我想白嫖写脸上了(目前是用魔塔的API去使用DeepSeek和Qwen,国内这俩模型挺不错的),而且国内模型大多日常用用很不错,但是到代码…;这就不得不提到我们的 Google 大善人了,对所有人(只要你能注册账户和处于支持的地区)提供免费 API 额度使用,网页端额度我不知道,算是接近无限?除了工具调用(例如搜索能力)有次数限制;Gemini 系列模型本身素质不差(代码),且其拥有 1M(一百万)tokens上下文长度(例如Gemini 2.5 Pro)
除此之外还有 思想钢印(道德限制) (以下内容均在未破限/微调的情况下),这亦是我的翻译模型都不使用国内模型的原因: 会出现例如从英文翻译到中文,以 Qwen (通义千问) 开源本地部署模型为例,如果需要翻译的内容包含粗口,可能会出现直接开始教你不要说脏话,不翻译了(NSFW 内容同理); 第二个大致能算政治方面?例如你在接近高考期间,各大 APP/游戏 禁止改名/修改头像 的时候,问 DeepSeek 最近(今天)是什么日子,基本是不会回答(正确内容)的
最后一个是我认为最重要的,原生多模态,例如 DeepSeek 是不具备图像识别能力的,你发给它图片是看不懂的,实际上是经过 OCR 后变为文字输入(官方网页/APP应该只是OCR,我之前用API的时候是本地部署了一个视觉模型去代替缺失的视觉,效果挺不错的),而 Gemini(Claude 等)是支持图片输入的,即模型看得懂图片,甚至能去当 OCR 工具使用,毕竟使用得当(prompt 写好)的情况下其文字提取能力远超 OCR 模型,能应对各种文字不清/不全(拍摄不清晰),多语言,排版(包括提取数学公式之类的)
当然,或许还有一个强限制原因:GFW (来自东方的神秘力量),毕竟不是人人都可以绕过这股神秘力量,大概只能使用各种中转出来的付费服务了…?
接触 AI 学到了不少内容,但对于真正的内容,这或许只是沧海一粟…毕竟我的了解较为浅显,写不出来优秀的 prompt,本地部署也仅仅停留在了”会部署,能跑就行”,参数什么的…除了超常见的一概不识,训练/微调什么的更是没有接触过(财力也不允许就是了)
评论区
评论区加载中...
如果长时间无法显示,请尝试刷新页面。(如果仍然无法加载请尝试清理缓存并刷新)