Synth Daily

AI 百日,恍若数年:我的 2025 上半年 AI 模型与产品清单推荐

这份清单盘点了2025年上半年值得推荐的AI模型与产品,涵盖大语言模型(LLM)、文生图/视频/音频工具,以及各类AI应用(如Agent、聊天、编程工具)。基于个人使用体验,清单对各产品进行了评选。最终总结出AI应用的两大核心趋势:一是垂直领域的Agent将围绕高质量数据和模型后训练展开竞争;二是AI记忆的有效利用和上下文构建将成为提升产品体验的关键。

大语言模型(LLM)

今年上半年,Gemini 2.5 Pro 成为最大黑马,凭借其强大的多模态能力、超长上下文和独特的推理过程,提供了卓越的使用体验。

  • 最常用:Gemini 2.5 Pro

    • 强大的多模态识别:能精准识别图像中的细节。
    • 超长上下文:在10万tokens后仍能准确回忆早期对话内容。
    • 独特的思考过程:分析用户输入时更全面、细致,类似金字塔思维。
    • 高情商:能从对话细节中捕捉用户未曾注意的情绪。
  • 惊喜时刻:DeepSeek R1

    • 在创造性和启发性任务(如文哲类)中表现极强,能提供意想不到的启发。
    • 缺点:模型表现不稳定,有时过于“癫狂”,指令遵循性差,不适合需要稳定输出的商业场景。
  • 有印象:o3、QVQ-Max

    • 代表了顶级的多模态视觉能力。在“网络迷踪 GeoGuessr”测试中,这两个模型能识别出图像中非常微小的Logo,展现了超强的视觉识别力。

当下推荐的 LLM

除了Gemini 2.5 Pro,以下模型也值得关注:

  • 豆包 Seed 1.6:国内场景的均衡选择,在输出速度、质量和价格方面表现出色,适合商业应用。
  • Qwen 3 (8B):开源模型的首选,尤其适合本地部署。其8B模型在性能上有显著进步,有效降低了推理和训练成本。
  • Claude 4 sonnet代码生成和工具调用的无可争议的第一名。无论是开发AI应用还是生成前端代码,它都是首选,并且审美表现最佳。

Claude 是所有代码相关场景的 Top 1。模型们其实是偏科的,如果侧重某方面能力提升,会导致其他方面的能力下降。例如,Claude 为了确保代码生成的能力,会牺牲一些对话、文学的体验。

文生图与文生视频

AIGC技术已走进大众消费领域,无论是文章配图还是社交媒体,AI生成内容随处可见。

  • 豆包生图:日常使用的首选,免费、快速且效果好。支持自然语言改图,对图片内文字的生成效果也很好。

  • Imagen:被低估的偏科模型,在产品设计图的质感上无出其右。生成速度快、质量高且免费。

  • 可灵 (Kylin):快手出品的AI视频模型,画面稳定、物理效果逼真,支持文生视频和图生视频。

  • Veo 3:效果最惊艳的视频模型,其对真实物理规律的模拟达到了“头皮发麻”的程度,甚至能同步生成匹配的音效。

  • ChatGPT-4o:上半年最火的文生图模型,凭一己之力让“自然语言改图”成为用户共识。缺点是免费用户生成速度较慢

  • Midjourney:以极高的画面精细度、光感和艺术表达著称,适合有高质量作图需求的用户。

  • 偏门用法:Claude 4:通过AI编程生成前端代码,将网页直接作为图片使用。这种方法非常适合制作信息图或文章配图。

朋友 #歸藏的AI工具箱 有写过一篇类似的教程分享:《用提示词,让长网页秒变封面》。

文生音频

  • MiniMax speech-02:能克隆声音,音色模拟尚可,但情感和语调与真人仍有差距。
  • 豆包的语音模型:声音复刻和语音识别能力不错,其APP中的AI语音通话表现优异。

AI 产品:Agent、聊天与编程

Agent:2025年最火的赛道

通用Agent的竞赛热潮已经兴起,Deep Research(深度研究)作为其子集,也一并讨论。

  • Manus:目前唯一的真·通用Agent。它为AI配备了一台完整的云电脑,使其不仅能完成信息搜集,还能直接搭建有后端的网站服务。

    AI + 云电脑 = Create everything,这点会有质变的体验。

  • Kimi-Researcher:将深度研究能力内训到模型中,使其在处理复杂的中文信息时表现出色,幻觉率较低。

  • 夸克高考志愿 Agent:首个千万级用户的垂直Agent,标志着AI应用进入解决复杂、高价值问题的“深度落地”阶段。

    • 成功核心:高质量垂直知识源 + 经过深度对齐的垂类大模型。这套“垂直数据+垂直模型训练”的模式将成为下半年AI Agent落地的标配。

AI 聊天

  • PC端:高频使用 Gemini 2.5 Pro,文哲类任务偶尔用 DeepSeek
  • 移动端:主用 豆包 APP,其交互便捷,响应快速,语音和视频通话功能是一大亮点。学生群体也可考虑功能更全的夸克APP。

AI 搜索?

从2025年上半年的发展趋势来看,纯AI搜索形态的产品,正在被AI Chat和Deep Research挤压生存空间。长期来看,其存在的必要性存疑。

简单问题用AI聊天,复杂问题用深度研究,AI搜索的定位变得尴尬。像秘塔搜索夸克APP也都在摆脱纯粹的搜索形式,转向更综合的AI服务。

AI 编程:Vibe Design + Vibe Coding!

AI编程已能用于开发完成度很高的MVP产品,而非仅限于小玩具。以个人项目Chat Memo为例,在不懂编程的情况下,一周半就写出了功能完善的Chrome插件。

  • Cursor:AI编程界的一致选择。
  • Trae:适合简单项目,订阅价格便宜。
  • Code Rabbit:推荐用于AI代码审查(Code Review)。

其他值得关注的产品

  • Flomo:个人笔记软件中AI功能做得最爽的产品。其AI功能(如相关笔记、AI洞察)与用户需求结合得非常自然,旨在提供主动的启发。
  • Cherry Studio:本地AI对话与调试工具,方便一次性对比多个AI模型的回应质量,并支持本地知识库。
  • Prompt Pilot:字节出品的提示词工程工具,尤其适合针对国内模型进行批量测试、评分和版本管理。
  • Chat Memo:跨平台无感保存、导出各AI平台对话的工具。它能解决AI对话散落各处、难以沉淀的问题,数据存储在本地,确保隐私。

附录:AI 日常推荐表

使用场景 主要推荐 备选推荐 一句话理由
大模型 API 豆包 Seed 1.6 Qwen 3(本地部署),Gemini 2.5(出海),智谱(免费) 豆包均衡,Qwen开源,Gemini出海,覆盖国内、本地和海外场景的高性价比之选。
日常聊天 & 问答 Gemini 2.5 Pro (PC), 豆包 APP (移动) DeepSeek R1 (文哲启发), 夸克 APP (学生党) Gemini智力超群;豆包在移动端交互便捷,语音/视频通话是绝活。
生成图片 豆包生图 Imagen (产品图), Midjourney (艺术/专业), Claude4 (可视化信息) 豆包免费易用;Imagen产品图质感无敌;Midjourney艺术性最强;Claude用代码做图。
生成视频 可灵 Veo 3 (高上限) 可灵综合体验优秀,国内可用;Veo 3物理效果惊人但暂未大规模开放。
生成音频 Minimax、豆包 - 支持声音克隆,满足基础配音需求,价格是关键因素。
通用 Agent & 深度研究 Manus (通用), Kimi-Researcher (中文), Gemini DR (海外) ChatGPT Deep Research (预算充足) Manus能操作电脑;Kimi与Gemini分别是中、英文信息调研的优选。
写代码/编程 Cursor (配合 Claude) Trae (简单项目), Augment (新晋选择), Code Rabbit (代码审查) Claude是代码能力之王,无可争议;Cursor是目前最主流的AI Coding IDE。
个人笔记管理 Flomo - AI功能与笔记需求结合得最“爽”的产品,自然不打扰。
本地 AI 对话 Cherry Studio - 方便在本地对比测试多款模型,支持本地知识库。
提示词工程工具 Prompt Pilot - 面向国内模型的Prompt批量测试与版本管理利器。
保存 AI 对话 Chat Memo - 无感自动保存所有平台的AI对话,数据本地化,方便检索。

总结:令人晕眩的上半年与两大趋势

2025年上半年,AI领域的变化速度惊人,可谓“AI百日,恍若数年”。展望下半年,应用侧将出现两大趋势:

  1. Agent在垂直领域卷数据、卷后训练:为了获得更稳定、可用的效果,AI应用将深入垂直场景,通过优化模型层来提升整体表现。现在已到了比拼数据质量和模型训练能力的时刻。

  2. AI记忆利用与Context构造:当前AI体验不佳的最大瓶颈并非智力,而是它不够懂用户意图,需要反复陈述上下文。当模型发展遇阻,应用层最终必须回归到上下文工程,这是打造优秀AI产品无法回避的任务。

潮水仍在奔涌,探索永无止境。