1289 字
6 分钟
浅谈一下我现在正在使用的AI服务
2025-03-21
无标签

作为一个从2022年12月就开始折腾ChatGPT等ai模型工具的老玩家,今天我想分享一下我目前正在使用的AI服务和一些感受。

首先,我们都会在哪些场景下使用AI模型?

对于我自己,主要是Coding写代码、写作(包含专业论文和非专业的博客、文案等)、日常闲聊三个场景,除此之外的其他场景实际上也超出了目前大模型+相关工具的能力上限。

Coding编程场景#

这部分任务我主要使用Windsurf。

Windsurf相较于Cursor和Copilot的优势:

  • 订阅便宜。Windsurf标准pro订阅是15美刀,如果你是最早就开始用Windsurf的那一批,pro订阅的价格会永久定为10美刀,爽到。
  • 系统设计更科学,Agent模式表现更好。这点我和群友均有同样感受,cursor经常会出现“很忙,但不知道在忙什么”的感觉,令人忍俊不禁。Windsurf的系统架构设计非常有含金量。
  • 非常拟人通人性的Tab补全功能:这个谁用谁爽。

当然,Windsurf也并非没有缺点:

  • Pro订阅下包含两个计量服务:其中高级模型对话额度为每月500次,Agent的Flow额度为每月1500次。Flow额度通常会消耗的比高级模型对话额度快很多,1500次很不够用,如果用完的话要么只能等下个月订阅刷新,或者花费十美刀购买500个灵活额度。
  • 与之相对的,如果你购买了cursor的pro会员,那么你每个月付费额度用完之后还可以继续用慢速高级模型,起码对于非紧急需求也能凑合着用用(似乎近期慢速高级模型真的变龟速了)
  • 没了,我认为这就是Windsurf仅存的缺点,考虑到10刀每月的订阅价格甚至这都不能算缺点

如果你囊中羞涩或者缺乏支付渠道或者只是单纯的不想为这个场景付费,你也可以直接选择字节的Trea,可以白嫖Claude 3.7,非常之香。

写作场景#

这部分任务我通常会将 DeepSeek R1 + Qwen max + chatgpt-4o-latest + Gemini 2.0 pro 四个模型来回用。

  • R1:还是谁用谁懂,最有文化水平和灵动的一集;但幻觉率同样居高不下+喜欢自己嗯凑高大上的科技名词,有时候很令人恼火
  • Qwen max:国产最强的旗舰通用非推理模型,万金油
  • chatgpt-4o-latest:代表Openai通用旗舰非推理模型的最新成果,动态更新,同样是各个领域的万金油六边形战士,发挥稳定,通常是最不坏的选择
  • Gemini 2.0 pro:在DeepSeek r1出现之前是中文写作最灵动的模型,出之后稍逊风骚

日常闲聊#

ChatGPT+豆包+R1

为什么呢?

首先是ChatGPT,我认为ChatGPT这个产品本身的设计是非常成功的,OpenAI很好的将旗舰级六边形战士模型+目前最完善最贴合使用需求的Tools+强大的语音对话功能集合在一起,形成了ChatGPT这个产品本身。

虽然我们常常说OpenAI拉了胯/close ai/邪恶男同奥特曼巴拉巴拉巴拉,但其本身的对齐能力仍然是无可置疑的黑科技,OpenAI的模型几乎在任何场景下都是「最不坏的选择」,如果你不知道某个场景下用什么模型更好,那就直接用4o吧。

豆包的主要优势则是全世界T0的中文语音对话能力,字节的TTS听起来非常舒服;让我们抛开doubao模型能力就那样不谈,豆包产品本身也是国内大模型C端产品里做的最完善最好的那个。

不愧是最会做产品的互联网大厂

R1则主要是本身模型能力太过于惊艳,这点无需多言。

总结#

说了这么多,其实每个人的使用习惯和偏好都不一样。AI工具的快速演进,也意味着没有哪个选择是“最优解”——只有“此时此刻对你最合适的工具”。就像我自己从最早折腾Prompt到现在更看重产品本身的稳定性、拟人化设计、以及模型背后的“气质”,一路下来也逐渐形成了属于自己的搭配组合。

我的建议是:别迷信单一模型,勇于尝试混搭策略;别被参数和bench吓住,多用用,多问问,多对比;AI的本质始终是“助手”,不是替你思考的机器,它能让你效率翻倍,也可能让你陷入幻觉的迷宫。保持清醒、保持怀疑,也保持好奇。

愿你我都能成为在AI时代里游刃有余的“使用者”,而不是“被使用者”。🌊

——写于风浪之中,Windsurf依然划得飞快。

浅谈一下我现在正在使用的AI服务
https://www.lapis.cafe/posts/essays/myaitools/
作者
时歌
发布于
2025-03-21
许可协议
CC BY-NC-SA 4.0