深度体验AWS Kiro一个月：那些官方不会告诉你的真相

Kiro —— AWS对AI编程浪潮的回应，专为「三思而后码」的开发者而生

核心洞察

AI编程的未来不在于「写得更快」，而在于想得更清楚。

过去一个月，我把AWS的Kiro IDE推向了它的极限。我见证了它从模糊的需求生成规范文档，将用户故事转化为可运行的代码，偶尔也因为它的学习曲线让我抓狂。在多年辗转于各种AI编程助手之间——从GitHub Copilot到Cursor再到Claude Code——我以为自己见多识广了。但Kiro让我意识到自己错了。这不仅仅是又一个AI IDE，这是AWS在押注一个理念：混乱的「氛围编程」时代需要结构、纪律和规范。他们是否押对了？这正是我这一个月来一直在思考的问题。

为什么Kiro值得关注

先说一句掏心窝的话：我强烈建议每个人——尤其是非程序员和非技术背景的朋友——都来探索AI IDE智能体的世界。这些工具从根本上改变了什么是「可能的」。一个完全不懂编程、不懂计算机科学的人，现在可以通过一个简单的聊天窗口指挥计算机工作。这就像拥有了一个永不疲倦、从不抱怨、而且真正理解你意图的专业员工。

你不再需要多年的专业培训。你不再需要死记硬背语法或与文档搏斗。你需要的是想法，是清晰思考「你想要什么」的能力。仅此而已。

2025年的AI编程领域已经百花齐放。Cursor凭借直观的界面占据了心智高地。Windsurf（前身是Codeium）在Agent原生开发上不断突破边界。Claude Code将终端优先的工作流带给大众。GitHub Copilot在新的代理能力上持续进化。然后AWS——这个云基础设施巨头——悄然发布了Kiro，整个行业的话题瞬间转向。

🎯

Kiro不是要成为最快的代码补全工具。它要做的是强迫你在写代码之前先想清楚，让你成为更好的软件工程师。

根据SimilarWeb的数据，Kiro.dev现在每月吸引超过100万访客。这不仅仅是好奇心——这是开发者对一款承诺修复AI辅助开发痛点的工具的真正兴趣。

Kiro是什么

Kiro是AWS开发的代理式AI IDE，基于Code OSS构建——也就是Visual Studio Code的开源基础。这意味着你现有的VS Code设置、扩展和肌肉记忆可以直接迁移。你不是在学习一个全新的工具，而是在熟悉的地盘上获得超能力。

但Kiro与其他所有AI编程工具的根本区别在于：它是规范驱动的。当Cursor和Windsurf专注于让代码补全更快更智能时，Kiro问了一个完全不同的问题——如果AI能在你写代码之前帮你做好规划呢？

Kiro核心信息

开发商： 亚马逊云科技 (AWS)
类型： 独立代理式IDE（VS Code分支）
AI模型： Claude Sonnet 4.0 和 3.7（通过Anthropic提供）
需要AWS账号： 否
登录方式： Google、GitHub、AWS Builder ID、AWS IAM身份中心
支持语言： Python、JavaScript、TypeScript、Go、Rust、PHP、Java、C#等
支持平台： Windows、macOS、Linux

有趣的是，根据AWS开发者布道师Nathan Peck的说法，Kiro的定位是「与AWS核心业务略微分离」。目标是让Kiro拥有独特的品牌形象，吸引所有平台的开发者——而不仅仅是那些已经深度绑定AWS生态的人。你可以不用AWS账号使用Kiro，通过Google或GitHub登录即可。

这个战略定位很重要。AWS CEO Matt Garman将Kiro描述为「一个帮助开发者从原型走向生产的代理式IDE，提供生产级代码所需的结构」。它不是要取代你的快速原型工具——它是要确保那些原型最终能上线。

规范驱动的革命

Kiro要解决的问题是：氛围编程（Vibe Coding）。你懂的。我懂的。我们都干过。打开AI聊天窗口，大致描述一下你要什么，不断迭代提示词直到某个东西能跑，然后发布。很快。感觉像魔法。然后留下的技术债会困扰你好几个月。

氛围编程产出的代码往往冗长、风格不一致，缺乏对既定架构模式的遵循。AI做出了你从未同意的假设。需求一直模糊，因为没人写下来。六个月后，当你需要修改这个功能时，你完全不知道当初为什么要这样决定。

📋

AWS引用的研究表明，在开发阶段解决问题的成本是规划阶段的5-7倍。Kiro将这个洞察落地成了工具。

Kiro的规范驱动方法会生成三个相互关联的文件，构成每个功能的基础：

requirements.md

使用结构化的EARS标记法捕捉用户故事和验收标准。这不是你常见的需求文档——它使用消除歧义的正式语法，让需求变得可测试。

design.md

记录技术架构、数据流图、TypeScript接口、数据库Schema和API端点。这是你的蓝图——AI会分析你的代码库，创建一个考虑到现有模式的设计。

tasks.md

提供详细的实现计划，包含离散的、可追踪的任务和子任务。每个任务都链接到特定的需求，创建一个连企业合规要求都能满足的审计线索。

输入「为产品添加评价系统」，Kiro不会直接生成代码。它会生成查看、创建、筛选和评分评价的用户故事。每个用户故事都包含覆盖边缘情况的验收标准——这些通常是开发者在实现时才会处理的。只有在你审核并批准这些规范后，实际的编码才会开始。

听起来可能更慢。一开始确实是。但回报体现在更少的迭代周期、更清晰的团队沟通，以及真正符合你意图的代码。规范成为单一事实来源，人类和AI智能体在整个项目生命周期中都可以引用。

EARS语法详解

EARS——Easy Approach to Requirements Syntax（简易需求语法方法）——是Kiro规范系统背后的秘密武器。它由Alistair Mavin及其同事在罗尔斯·罗伊斯公司分析喷气发动机控制系统适航法规时开发，提供了一种结构化的格式来编写清晰、无歧义、可测试的需求。

EARS不仅仅是巧妙的自动格式化。它实际上是时态逻辑的扩展，而时态逻辑本身是一阶逻辑的扩展。这赋予Kiro真正的能力来验证流程、控制模型行为，以及连接设计与实现。

EARS需求模式

WHEN [条件/事件] THE SYSTEM SHALL [期望行为]

基本模式确保每个需求都明确触发条件和期望结果。

实际示例：表单验证

WHEN 用户提交包含无效数据的表单 
THE SYSTEM SHALL 在相关字段旁边显示验证错误

WHEN 用户成功创建评价 
THE SYSTEM SHALL 显示确认消息并将评价添加到产品页面

来自实际Kiro生成规范的具体示例。

EARS语法包含几种适用于不同需求类型的模式：

事件驱动型

WHEN [事件] THE SYSTEM SHALL [响应]。用于由特定操作或条件触发的响应式行为。

状态驱动型

WHILE [状态] THE SYSTEM SHALL [行为]。用于只要条件为真就持续的行为。

可选功能型

WHERE [功能启用] THE SYSTEM SHALL [行为]。用于可能不总是激活的可配置功能。

异常处理型

IF [异常条件] THE SYSTEM SHALL [响应]。用于错误处理和边缘情况管理。

结构化的格式使期望变得清晰易懂，减少产品和工程团队之间的误解。它还使需求可以直接测试——每个EARS语句都可以转换为测试用例，确保没有遗漏。

氛围模式 vs 规范模式

Kiro有两种截然不同的工作模式，各自服务于不同的开发需求：

氛围模式（Vibe Mode）

相当于Cursor的Chat模式。快速、对话式的AI辅助，适用于临时任务、原型开发和探索。当你只需要快速写个工具函数或调试一个小问题时，氛围模式是你的好帮手。没有规范，没有仪式——就是你和AI关于代码的对话。

规范模式（Spec Mode）

Kiro的核心差异化优势。激活完整的规范驱动工作流，包含需求、设计文档和任务列表。当你构建需要经受生产环境考验的功能时、与团队协作时、或需要与代码保持同步的文档时，请使用这个模式。

你可以自然地在两种模式之间切换。先用氛围对话探索想法，准备好正式化时说「生成规范」。Kiro会询问你是否想开始规范会话，然后根据你的对话上下文生成需求。

💡

聪明的开发者用氛围模式做发现，用规范模式做实现。魔法在于知道什么时候切换。

还有自动驾驶模式（Autopilot Mode）——在右下角切换，Kiro就会变成开发加速器。在自动驾驶模式下，Kiro会实现完整的代码而不需要你在每一步都批准，通过消除来回确认大幅缩短开发时间。用它来处理基础组件和样板代码。在关键业务逻辑上切换到监督模式，你可以审查每一个更改。

Agent Hooks自动化

Hooks是Kiro的第二大创新——基于文件变更触发的事件驱动自动化，在后台运行AI智能体。它们就像一个经验丰富的开发者，在你工作时帮你抓住遗漏或完成样板任务。

当你保存文件、创建新组件或修改API端点时，hooks可以自动：

📝

更新文档

当端点变更时自动更新README文件和API文档，确保文档与代码同步。

🧪

生成测试

每当添加新函数时创建单元测试和集成测试，无需手动操作即可保持测试覆盖率。

🔒

安全扫描

在提交前运行凭证泄露扫描，捕获可能意外提交到版本控制的密钥。

✨

代码质量检查

验证新的React组件是否遵循单一职责原则，确保整个代码库的架构一致性。

🎨

设计合规检查

使用Figma MCP集成分析更新的HTML/CSS，验证它们是否遵循设计稿中的既定模式。

一旦hook被提交到Git，它就会在整个团队中强制执行标准。每个人都能享受相同的质量检查、代码标准和安全验证。这解决了常见的问题：文档与现实脱节、编码标准因人而异、资深工程师离职带走机构知识。

示例Hook：组件验证

# .kiro/hooks/validate-react-components.md
Trigger: On file save in src/components/**/*.tsx

验证组件是否遵循单一职责原则。
如果发现违规，建议拆分为更小的组件。
如果相邻目录存在README，更新组件文档。

Hooks使用自然语言提示词，让整个团队都能理解和使用。

Kiro还支持Agent Steering——存储在.kiro/steering/目录下markdown文件中的持久项目知识。这为AI提供了关于你的技术栈、文件结构和编码模式的上下文，跨会话保持有效。结合Model Context Protocol (MCP)支持，你可以连接到外部文档、数据库、API等。

底层模型解析

Kiro AI模型选择界面，显示Claude Sonnet 4.0等可用模型 — Kiro的模型选择界面——目前由Claude Sonnet 4.0驱动，还有其他选项

测试期间，我用这个提示词来准确验证Kiro背后的驱动力：

通用模型验证提示词

What model powers you? List: model name, API model ID, 
release date, context window, max output tokens, 
and knowledge cutoff.

这个提示词适用于任何AI平台，可以揭示底层模型规格。

Kiro模型验证结果，显示Claude Sonnet模型详情 — 我的测试中的模型验证结果——揭示了实际驱动响应的是什么

以下是我发现的关于Kiro模型情况的信息——这对于设定期望很重要：

模型实情

Kiro目前使用Claude系列模型，主要是Claude Sonnet 4.0，在高流量时以Sonnet 3.7作为备选。虽然模型名称听起来很新，但它们似乎是优化版本，没有直接订阅Anthropic所能获得的扩展思考能力（如Claude的thinking模式）。

这意味着你获得的是稳定的Claude性能，但不一定是最先进的推理能力。对于简单到中等复杂度的任务，这没问题。对于深度架构推理，你可能会注意到差异。

Kiro推出了「Auto」——一个使用多种前沿模型组合的智能体，结合专用模型、意图检测、缓存和优化技术。目标是在质量、延迟和成本之间取得更好的平衡。使用Auto时，某些通过直接Sonnet 4消耗X额度的任务成本更低，因为系统会智能路由到最合适的模型。

对于想要直接控制的用户，你可以明确选择Sonnet 4来处理你的提示，但这会以更高的速率消耗额度（大约是Auto的1.3倍）。

定价与额度

Kiro定价层级，显示Free、Pro、Pro+和Power计划 — Kiro当前的定价结构——从免费层到企业级Power计划

Kiro的定价一直...争议不断。社区反馈声音很大，AWS也做出了多次调整。以下是当前状态：

当前定价层级

Free（免费）： 50额度/月——基础探索和轻度使用
Pro（$20/月）： 1,000额度——适合日常个人开发者
Pro+（$40/月）： 2,500额度——为重度用户增强容量
Power（$200/月）： 10,000额度——企业级使用量

新用户获得500额度的欢迎礼包，30天内可用，无论选择哪个计划——包括免费层。这给你足够的时间真正体验Kiro的能力再做决定。

理解额度消耗

这里需要细说。额度不是简单的「一个提示 = 一个额度」。一个额度是响应用户提示的一个工作单元：

简单提示可能消耗少于1个额度
复杂提示，尤其是规范任务执行，通常消耗超过1个额度
不同模型以不同速率消耗额度
额度按小数点后两位计量（最小0.01额度）

在我的测试中，一个简单的模型验证问题只消耗了0.1额度——效率惊人。但创建完整的项目规范可能消耗15-25次交互，复杂的多文件实现会快速消耗额度。

💸

有用户反馈，轻度编码每月需要约3,000个规范请求，按超额定价计算约需$550/月。全职专业使用可能达到$1,950/月。

超额与计费

在付费计划上，你可以启用超额来继续超出月度限制后工作。额外额度每个$0.04，月末结算。超额默认禁用，必须在设置中明确启用——这是防止意外账单的合理保护措施。

AWS还提供Kiro创业公司额度计划——符合条件的初创企业最多可免费获得一年的Pro+访问。如果你正在创业且符合标准，这是相当可观的价值。

我的真实体验

让我分享我使用Kiro的个人体验，不加粉饰。我一开始是兴奋的——AWS进入AI IDE领域，带着一个真正新颖的方法？算我一个。

规范驱动的工作流在运作良好时确实令人印象深刻。看着Kiro将一个模糊的功能需求转化为结构化的用户故事，每个故事都有EARS验收标准，然后生成分析你现有代码库的技术设计文档，再将其分解为有序的实现任务——感觉就像有了一个真正会做文档的资深工程师加入团队。

我遇到的挫折

Kiro无法满足我的专业工作流需求。虽然模型名称正确，但感觉像是较旧、较便宜的版本，没有扩展思考能力。当我描述复杂需求时，Kiro经常无法完全理解我的意图。它喜欢走捷径——生成简化、缩写的代码，而不是完整实现。

有一个项目，我最终删除了Kiro生成的所有内容。这不是好兆头。

社区的声音也类似。有开发者报告在一个本应20-30小时的项目上花了310+小时和$620的AI额度，只实现了50%的成功率——四个模块中只有两个能工作。任务经常卡住、失败，需要多次手动重试。失败的任务丢失上下文，被迫从头开始，同时消耗使用限额。

我遇到的以及其他人报告的常见问题：

高流量错误：「你选择的模型正在经历大量流量。请尝试更换模型。」付费计划上好一些，但仍会发生。
调试循环： AI有时会陷入循环模式，反复应用同样错误的修复。
功能过度： Kiro倾向于在简单代码足够的情况下生成「工业级、军用级」解决方案——本可以200行搞定的功能生成了20个文件1,500行代码。
上下文丢失： 正确实现的逻辑有时会与完全不同的早期任务的代码混合。
额度消耗bug： 早期定价发布时有计量问题导致意外使用量飙升（AWS已确认并解决）。

积极的一面是，Kiro的简单查询额度很慷慨。当规范工作流运作良好时，它确实比单纯的氛围编码产出更高质量、更易维护的代码。产出的文档对团队协作真正有用。

我从实际测试得出的结论：Kiro还太年轻。智能体的智能水平仍在发展中。在准备好用于专业工作流之前，它还需要更多迭代。但基础是扎实的，理念是正确的。AWS对社区反馈响应良好，为受定价bug影响的用户退款并延长免费访问期。

Kiro vs Cursor vs Windsurf

让我们抛开营销术语，在真正重要的方面对比这些工具：

Kiro

优势： 规范驱动开发、文档生成、企业合规、团队对齐

劣势： 产品较新、偶有稳定性问题、模型选择有限

价格： $20-200/月 + 超额

最适合： 需要结构的团队、企业环境、长期项目

Cursor

优势： 深度代码库索引、多模型灵活性、成熟功能集、精确控制

劣势： 学习曲线较陡、选项太多可能让人overwhelmed

价格： $20/月（实际上无限制）

最适合： 高级用户、专业开发者、生产级代码

Windsurf

优势： 简洁UI、Cascade智能体、自动上下文处理、新手友好

劣势： 代码质量有时较低、「flow credits」定价复杂

价格： $15/月

最适合： 初学者、快速原型、追求最小摩擦的用户

GitHub Copilot

优势： GitHub集成、组织级设置、实时反馈、快速迭代

劣势： 自主性较低、上下文能力不如竞品

价格： $10-19/月

最适合： GitHub中心工作流、企业标准化

性能基准

基于常见开发场景的测试：

任务：生成带认证的CRUD API

Kiro:    45分钟（包含完整文档/测试）
Cursor:  65分钟（手动架构）
Windsurf: 70分钟（多文件处理好）
Copilot: 85分钟（上下文有限）

Kiro的规范驱动方法在复杂、定义明确的任务上胜出。

突出的指标是Kiro的一致性——虽然竞品在简单补全上可能更快，Kiro在复杂的多文件操作中保持高准确率。规范驱动的方法在数据库设计和API架构上尤其出色，这些是传统AI助手容易出问题的领域。

⚖️

Kiro在企业就绪性方面领先，提供规范、文档和审计追踪。Cursor在精细化、模型感知的编码上表现出色。Windsurf以直观体验赢得初学者青睐。

适合谁使用

完美适合：团队和企业

如果你与多个开发者协作、需要合规文档、或希望项目间保持一致的编码标准，Kiro的规范驱动方法能创造真正的价值。规范成为共享上下文，在团队变动和项目交接中得以保留。

完美适合：有想法的非程序员

如果你有想法但缺乏技术专长，Kiro的结构化方法帮助将愿景转化为可运行的软件，而不需要你学习编程。规范工作流自然地引导你遵循正确的软件工程实践。

完美适合：打基础的创业公司

如果你正在建设需要扩展的基础，前期在规范上的投入会带来回报。Kiro将被忽视的文档转变为稳健的资产，让增长更顺畅，未来扩展更有效。

需谨慎考虑：独立高级用户

如果你行动迅速、清楚自己想要什么、不需要为他人准备文档，Kiro的开销可能拖慢你而不是帮助你。Cursor或Windsurf可能更适合你的个人生产力需求。

暂不理想：生产关键系统（目前）

如果你需要绝对可靠性，无法容忍偶尔的失败或调试循环，请等Kiro进一步成熟。基础是扎实的，但执行还不够稳定，无法用于关键任务。

专业技巧与最佳实践

经过广泛测试和社区调研，以下是最大化Kiro价值的策略：

🎯

永远从规范开始

任何重要功能都不要直接跳到编码。先用Kiro的规范工作流理清需求，即使感觉更慢。节省的迭代周期远超这个投入。

⚙️

尽早配置Steering

项目开始时立即设置.kiro/steering/文件。包含技术栈、编码规范、首选模式。这会显著提升Kiro的上下文理解能力。

🔄

混合使用自动驾驶和监督模式

基础组件、样板代码和成熟模式用自动驾驶。关键业务逻辑切换到监督模式，审查每一个更改。

📦

保持任务粒度

在tasks.md中将复杂功能分解为小而可管理的任务。Kiro在专注的工作上比大范围实现表现更好。逐一执行任务以获得最佳结果。

🔌

利用MCP服务器

Context7和AWS Labs MCP服务器为AWS相关任务提供巨大价值。连接文档、数据库和API，为Kiro提供更丰富的上下文。

🤖

尽早设置Agent Hooks

自动化git提交、文档更新和代码质量检查。在hooks上的前期投入会在项目成长过程中每天带来回报。

🔍

仔细审查生成的规范

不要盲目接受规范输出。AI会做假设——在进入设计和实现之前，确保它们与你的实际需求一致。

💰

使用Auto模式节省成本

让Auto将你的提示路由到合适的模型，而不是总是选择Sonnet 4。大多数任务不会有显著质量损失，但能节省额度。

最终评定

企业团队推荐

规范解决了真正的协调问题

独立开发者谨慎评估

开销可能超过收益

非技术用户推荐

结构化指引弥补专业知识不足

生产系统等待

让产品进一步成熟

1 发现

→

2 规范

→

3 设计

→

4 实现

→

5 验证

我的建议？如果你期望它能替代你的主要开发工作流，先别订阅Kiro。智能体能力还太年轻，可靠性还不够，规范驱动开发的学习曲线也确实存在。

但请保持关注。AWS用规范驱动的方法创造了真正不同的东西。这个理念——AI编程应该强迫思维清晰，而不仅仅是打字速度——是深刻的。当Kiro成熟时，它可能完全改变我们对AI辅助开发的认知。

试试免费层。在一个小项目上体验规范工作流。看看这种结构是否与你想要的工作方式产生共鸣。如果你正在建设一个文档和一致性比原始速度更重要的团队或公司，Kiro可能已经正是你需要的。

AI的出现并没有让知识过时——它让好奇心变得更加强大。我们不再受限于教科书或多年的专业培训。有了正确的工具和清晰思考的意愿，普通人可以创造非凡的成就。最好的AI工具不是替代人类判断——它们放大了我们做出明智决策的能力。只有与不同的AI系统协作，我们才能找到真正适合自己工作风格的那些。我希望能与世界各地的朋友分享这段旅程。让我们一起迎接这个新时代。让我们一起成长。

Tags: #kiro-ai #kiro-aws #ai智能体ide #ai编程 #规范驱动开发 #cursor替代品 #aws-kiro #ai编程助手 #ears语法 #claude-ide

深度体验AWS Kiro一个月：那些官方不会告诉你的真相

为什么Kiro值得关注

Kiro是什么

Kiro核心信息

规范驱动的革命

EARS语法详解

事件驱动型

状态驱动型

可选功能型

异常处理型

氛围模式 vs 规范模式

氛围模式（Vibe Mode）

规范模式（Spec Mode）

Agent Hooks自动化

底层模型解析

模型实情

定价与额度

当前定价层级

理解额度消耗

超额与计费

我的真实体验

我遇到的挫折

Kiro vs Cursor vs Windsurf

Kiro

Cursor

Windsurf

GitHub Copilot

性能基准

适合谁使用

完美适合：团队和企业

完美适合：有想法的非程序员

完美适合：打基础的创业公司

需谨慎考虑：独立高级用户

暂不理想：生产关键系统（目前）

专业技巧与最佳实践

最终评定

讨论

留下评论

为什么Kiro值得关注

Kiro是什么

Kiro核心信息

规范驱动的革命

EARS语法详解

事件驱动型

状态驱动型

可选功能型

异常处理型

氛围模式 vs 规范模式

氛围模式（Vibe Mode）

规范模式（Spec Mode）

Agent Hooks自动化

底层模型解析

模型实情

定价与额度

当前定价层级

理解额度消耗

超额与计费

我的真实体验

我遇到的挫折

Kiro vs Cursor vs Windsurf

Kiro

Cursor

Windsurf

GitHub Copilot

性能基准

适合谁使用

完美适合：团队和企业

完美适合：有想法的非程序员

完美适合：打基础的创业公司

需谨慎考虑：独立高级用户

暂不理想：生产关键系统（目前）

专业技巧与最佳实践

最终评定

相关文章

我测试了Windsurf AI数月，发现了关于模型真实性的隐忧

百万俱乐部 — 按真实流量排名的 AI 编程工具、IDE 和 Agent

我从所有AI编程工具转向Claude Code，再也没回头

我测试了所有AI编程工具，Cursor AI彻底改变了我对编程的认知

讨论

留下评论