什么是AI智能体(Agent)?
AI智能体(Agent)不是某个具体的大模型(如豆包、通义千问或Claude),而是一套能调用大模型接口并与本地系统交互的软件系统。它让AI不仅能“说话”,还能“做事”——比如操作文件、打开浏览器、查询天气等。

Agent vs. 大模型:关键区别
大模型本身是“静态”的,只能处理文本、图像等输入输出,无法直接访问外部系统。而Agent作为中间层,负责将用户指令传递给大模型,并根据大模型的决策调用本地工具或API,再将结果反馈回去,形成闭环。

一个简单例子:写诗并保存到文件
- 在项目目录(如
AIdemo)中,使用Agent工具(如Claude Code)可直接创建文件并写入内容。 - 普通大模型聊天界面虽能生成诗歌,但无法自动保存到本地文件;而Agent能通过执行系统命令(如
echo "诗" > B.txt)完成此操作。

Agent如何工作?以查询天气为例
当用户说“查北京天气”时,流程如下:
- Agent接收指令,并附上可用函数列表(如
get_weather(location))发送给大模型。 - 大模型判断需调用函数,返回“请调用
get_weather("北京")”而非直接回答。 - Agent执行该函数,获取真实天气数据,再传回大模型。
- 大模型整合信息,生成最终自然语言回复。
整个过程涉及三轮交互,体现了Agent的“工具调用”能力。

为什么测试人员需要理解Agent?
在自动化测试中,仅靠丢需求文档给AI无法生成有效用例——多数需求文档结构混乱、信息不全。正确做法是:
- 打点教学:引导AI“看”页面,标注关键模块(如登录页、作家专区、小说管理)。
- 提供上下文:告知数据库位置、接口规范等系统信息。
- 构建多Agent协作:主Agent协调子Agent(Sub-agent)完成不同测试任务。

实战成果:自动生成测试报告
基于上述方法,AI可自动执行测试用例,并生成包含截图、步骤和结果的完整测试报告。例如,在贝壳找房项目中,Agent已能独立完成端到端测试并输出可视化报告。

