AI 百日，恍若数年：我的 2025 上半年 AI 模型与产品清单推荐

这份清单盘点了2025年上半年值得推荐的AI模型与产品，涵盖大语言模型（LLM）、文生图/视频/音频工具，以及各类AI应用（如Agent、聊天、编程工具）。基于个人使用体验，清单对各产品进行了评选。最终总结出AI应用的两大核心趋势：一是垂直领域的Agent将围绕高质量数据和模型后训练展开竞争；二是AI记忆的有效利用和上下文构建将成为提升产品体验的关键。

大语言模型（LLM）

今年上半年，Gemini 2.5 Pro 成为最大黑马，凭借其强大的多模态能力、超长上下文和独特的推理过程，提供了卓越的使用体验。

最常用：Gemini 2.5 Pro
- 强大的多模态识别：能精准识别图像中的细节。
- 超长上下文：在10万tokens后仍能准确回忆早期对话内容。
- 独特的思考过程：分析用户输入时更全面、细致，类似金字塔思维。
- 高情商：能从对话细节中捕捉用户未曾注意的情绪。
惊喜时刻：DeepSeek R1
- 在创造性和启发性任务（如文哲类）中表现极强，能提供意想不到的启发。
- 缺点：模型表现不稳定，有时过于“癫狂”，指令遵循性差，不适合需要稳定输出的商业场景。
有印象：o3、QVQ-Max
- 代表了顶级的多模态视觉能力。在“网络迷踪 GeoGuessr”测试中，这两个模型能识别出图像中非常微小的Logo，展现了超强的视觉识别力。

当下推荐的 LLM

除了Gemini 2.5 Pro，以下模型也值得关注：

豆包 Seed 1.6：国内场景的均衡选择，在输出速度、质量和价格方面表现出色，适合商业应用。
Qwen 3 (8B)：开源模型的首选，尤其适合本地部署。其8B模型在性能上有显著进步，有效降低了推理和训练成本。
Claude 4 sonnet：代码生成和工具调用的无可争议的第一名。无论是开发AI应用还是生成前端代码，它都是首选，并且审美表现最佳。

Claude 是所有代码相关场景的 Top 1。模型们其实是偏科的，如果侧重某方面能力提升，会导致其他方面的能力下降。例如，Claude 为了确保代码生成的能力，会牺牲一些对话、文学的体验。

文生图与文生视频

AIGC技术已走进大众消费领域，无论是文章配图还是社交媒体，AI生成内容随处可见。

豆包生图：日常使用的首选，免费、快速且效果好。支持自然语言改图，对图片内文字的生成效果也很好。
Imagen：被低估的偏科模型，在产品设计图的质感上无出其右。生成速度快、质量高且免费。
可灵 (Kylin)：快手出品的AI视频模型，画面稳定、物理效果逼真，支持文生视频和图生视频。
Veo 3：效果最惊艳的视频模型，其对真实物理规律的模拟达到了“头皮发麻”的程度，甚至能同步生成匹配的音效。
ChatGPT-4o：上半年最火的文生图模型，凭一己之力让“自然语言改图”成为用户共识。缺点是免费用户生成速度较慢。
Midjourney：以极高的画面精细度、光感和艺术表达著称，适合有高质量作图需求的用户。
偏门用法：Claude 4：通过AI编程生成前端代码，将网页直接作为图片使用。这种方法非常适合制作信息图或文章配图。

朋友 #歸藏的AI工具箱有写过一篇类似的教程分享：《用提示词，让长网页秒变封面》。

文生音频

MiniMax speech-02：能克隆声音，音色模拟尚可，但情感和语调与真人仍有差距。
豆包的语音模型：声音复刻和语音识别能力不错，其APP中的AI语音通话表现优异。

AI 产品：Agent、聊天与编程

Agent：2025年最火的赛道

通用Agent的竞赛热潮已经兴起，Deep Research（深度研究）作为其子集，也一并讨论。

Manus：目前唯一的真·通用Agent。它为AI配备了一台完整的云电脑，使其不仅能完成信息搜集，还能直接搭建有后端的网站服务。

AI + 云电脑 = Create everything，这点会有质变的体验。
Kimi-Researcher：将深度研究能力内训到模型中，使其在处理复杂的中文信息时表现出色，幻觉率较低。
夸克高考志愿 Agent：首个千万级用户的垂直Agent，标志着AI应用进入解决复杂、高价值问题的“深度落地”阶段。
- 成功核心：高质量垂直知识源 + 经过深度对齐的垂类大模型。这套“垂直数据+垂直模型训练”的模式将成为下半年AI Agent落地的标配。

AI 聊天

PC端：高频使用 Gemini 2.5 Pro，文哲类任务偶尔用 DeepSeek。
移动端：主用 豆包 APP，其交互便捷，响应快速，语音和视频通话功能是一大亮点。学生群体也可考虑功能更全的夸克APP。

AI 搜索？

从2025年上半年的发展趋势来看，纯AI搜索形态的产品，正在被AI Chat和Deep Research挤压生存空间。长期来看，其存在的必要性存疑。

简单问题用AI聊天，复杂问题用深度研究，AI搜索的定位变得尴尬。像秘塔搜索和夸克APP也都在摆脱纯粹的搜索形式，转向更综合的AI服务。

AI 编程：Vibe Design + Vibe Coding！

AI编程已能用于开发完成度很高的MVP产品，而非仅限于小玩具。以个人项目Chat Memo为例，在不懂编程的情况下，一周半就写出了功能完善的Chrome插件。

Cursor：AI编程界的一致选择。
Trae：适合简单项目，订阅价格便宜。
Code Rabbit：推荐用于AI代码审查（Code Review）。

其他值得关注的产品

Flomo：个人笔记软件中AI功能做得最爽的产品。其AI功能（如相关笔记、AI洞察）与用户需求结合得非常自然，旨在提供主动的启发。
Cherry Studio：本地AI对话与调试工具，方便一次性对比多个AI模型的回应质量，并支持本地知识库。
Prompt Pilot：字节出品的提示词工程工具，尤其适合针对国内模型进行批量测试、评分和版本管理。
Chat Memo：跨平台无感保存、导出各AI平台对话的工具。它能解决AI对话散落各处、难以沉淀的问题，数据存储在本地，确保隐私。

附录：AI 日常推荐表

使用场景	主要推荐	备选推荐	一句话理由
大模型 API	豆包 Seed 1.6	Qwen 3（本地部署），Gemini 2.5（出海），智谱（免费）	豆包均衡，Qwen开源，Gemini出海，覆盖国内、本地和海外场景的高性价比之选。
日常聊天 & 问答	Gemini 2.5 Pro (PC), 豆包 APP (移动)	DeepSeek R1 (文哲启发), 夸克 APP (学生党)	Gemini智力超群；豆包在移动端交互便捷，语音/视频通话是绝活。
生成图片	豆包生图	Imagen (产品图), Midjourney (艺术/专业), Claude4 (可视化信息)	豆包免费易用；Imagen产品图质感无敌；Midjourney艺术性最强；Claude用代码做图。
生成视频	可灵	Veo 3 (高上限)	可灵综合体验优秀，国内可用；Veo 3物理效果惊人但暂未大规模开放。
生成音频	Minimax、豆包	-	支持声音克隆，满足基础配音需求，价格是关键因素。
通用 Agent & 深度研究	Manus (通用), Kimi-Researcher (中文), Gemini DR (海外)	ChatGPT Deep Research (预算充足)	Manus能操作电脑；Kimi与Gemini分别是中、英文信息调研的优选。
写代码/编程	Cursor (配合 Claude)	Trae (简单项目), Augment (新晋选择), Code Rabbit (代码审查)	Claude是代码能力之王，无可争议；Cursor是目前最主流的AI Coding IDE。
个人笔记管理	Flomo	-	AI功能与笔记需求结合得最“爽”的产品，自然不打扰。
本地 AI 对话	Cherry Studio	-	方便在本地对比测试多款模型，支持本地知识库。
提示词工程工具	Prompt Pilot	-	面向国内模型的Prompt批量测试与版本管理利器。
保存 AI 对话	Chat Memo	-	无感自动保存所有平台的AI对话，数据本地化，方便检索。

总结：令人晕眩的上半年与两大趋势

2025年上半年，AI领域的变化速度惊人，可谓“AI百日，恍若数年”。展望下半年，应用侧将出现两大趋势：

Agent在垂直领域卷数据、卷后训练：为了获得更稳定、可用的效果，AI应用将深入垂直场景，通过优化模型层来提升整体表现。现在已到了比拼数据质量和模型训练能力的时刻。
AI记忆利用与Context构造：当前AI体验不佳的最大瓶颈并非智力，而是它不够懂用户意图，需要反复陈述上下文。当模型发展遇阻，应用层最终必须回归到上下文工程，这是打造优秀AI产品无法回避的任务。

潮水仍在奔涌，探索永无止境。