聊聊一些我对于当前AI的使用选择和了解

脑抽写的大份,现在请你返回上一页,并当作什么都没看到哦(内容过时)

对于国内 AI 我的认知大约是幸存者偏差了(llm 模型)

由于我所在的情况和我所接触到的人(主要指网友)，大多都是使用国外御三家(Gemini，Claude(也会叫克劳德)，GPT)，我不论电脑/手机都是国外御三家(曾经是DeepSeek/通义千问)；

国内的豆包/元宝都是 C 端宣传做的很好，豆包网页端用过几次，也仅仅是因为其 AI 编程模式能引用 GitHub 仓库，元宝完全没用过，相比之下，我使用 DeepSeek/Kimi/通义千问 的次数多得多了，而这三的使用人数应该远少于豆包(大概)

为什么我不使用豆包?除了模型本身能力外是因为图标,我极其讨厌豆包的图标,这啥逆天…Gemini(之前的图标,不是现在黑黑一坨的),GPT,DeepSeek,通义千问,Kimi这些的图标我觉得都挺好(我讨厌的是具备明显或类似AI特征的图片内容,就豆包这个我都不知道是什么生物了,还不如搞个类似全棉时代那种的形象,我觉得还蛮好看的)

另: Gemini这名字我觉也挺好的

国内 AI 接触历程早期是通义千问，被别人推荐的(当时接触ShortX,写shell和mvel)，然后是 Kimi (因其宣传超长上下文, 用下来感觉也一般)，最后是 DeepSeek v3(24 年底)，不过我当时接触的认为是尚未达到预期(即就我使用的方面来看，相较于同时期其他模型，没有到断崖式领先的地步(可能是我当时还不够了解吧); 另一方面是当时升级到v3有人说很厉害,拉高了我的期待)，后来很火就是了(同时也展现出了国内丑陋的网络生态/短视频生态/…)

百度的文心一言说实话刚刚都没想起来，感觉纯小丑一样，我不是很喜欢百度；要知道他们 CEO(或者是创始人,忘了) 当时可是说 开源是智商税 的，后来 DeepSeek 火了，百度也去开源去了🤣

并且，我使用的更多场景是 API，国内对于 API …~~我把我想白嫖写脸上了~~(目前是用魔塔的API去使用DeepSeek和Qwen,国内这俩模型挺不错的)，而且国内模型大多日常用用很不错,但是到代码…；这就不得不提到我们的 Google 大善人了，对所有人(只要你能注册账户和处于支持的地区)提供免费 API 额度使用，网页端额度我不知道，算是接近无限？除了工具调用(例如搜索能力)有次数限制；Gemini 系列模型本身素质不差(代码)，且其拥有 1M(一百万)tokens上下文长度(例如Gemini 2.5 Pro)

除此之外还有思想钢印(道德限制) (以下内容均在未破限/微调的情况下)，这亦是我的翻译模型都不使用国内模型的原因: 会出现例如从英文翻译到中文，以 Qwen (通义千问) 开源本地部署模型为例，如果需要翻译的内容包含粗口，可能会出现直接开始教你不要说脏话，不翻译了(NSFW 内容同理)；第二个大致能算政治方面？例如你在接近高考期间，各大 APP/游戏禁止改名/修改头像的时候，问 DeepSeek 最近(今天)是什么日子，基本是不会回答(正确内容)的

最后一个是我认为最重要的，原生多模态，例如 DeepSeek 是不具备图像识别能力的，你发给它图片是看不懂的，实际上是经过 OCR 后变为文字输入(官方网页/APP应该只是OCR,我之前用API的时候是本地部署了一个视觉模型去代替缺失的视觉,效果挺不错的)，而 Gemini(Claude 等)是支持图片输入的，即模型看得懂图片，甚至能去当 OCR 工具使用，毕竟使用得当(prompt 写好)的情况下其文字提取能力远超 OCR 模型，能应对各种文字不清/不全(拍摄不清晰)，多语言，排版(包括提取数学公式之类的)

当然，或许还有一个强限制原因：GFW (来自东方的神秘力量)，毕竟不是人人都可以绕过这股神秘力量，大概只能使用各种中转出来的付费服务了…?

接触 AI 学到了不少内容，但对于真正的内容，这或许只是沧海一粟…毕竟我的了解较为浅显，写不出来优秀的 prompt，本地部署也仅仅停留在了”会部署，能跑就行”，参数什么的…除了超常见的一概不识，训练/微调什么的更是没有接触过(财力也不允许就是了)

聊聊一些我对于当前AI的使用选择和了解

赞助支持

评论区

目录