AI编程的未来不在于「写得更快」,而在于想得更清楚。
过去一个月,我把AWS的Kiro IDE推向了它的极限。我见证了它从模糊的需求生成规范文档,将用户故事转化为可运行的代码,偶尔也因为它的学习曲线让我抓狂。在多年辗转于各种AI编程助手之间——从GitHub Copilot到Cursor再到Claude Code——我以为自己见多识广了。但Kiro让我意识到自己错了。这不仅仅是又一个AI IDE,这是AWS在押注一个理念:混乱的「氛围编程」时代需要结构、纪律和规范。他们是否押对了?这正是我这一个月来一直在思考的问题。
为什么Kiro值得关注
先说一句掏心窝的话:我强烈建议每个人——尤其是非程序员和非技术背景的朋友——都来探索AI IDE智能体的世界。这些工具从根本上改变了什么是「可能的」。一个完全不懂编程、不懂计算机科学的人,现在可以通过一个简单的聊天窗口指挥计算机工作。这就像拥有了一个永不疲倦、从不抱怨、而且真正理解你意图的专业员工。
你不再需要多年的专业培训。你不再需要死记硬背语法或与文档搏斗。你需要的是想法,是清晰思考「你想要什么」的能力。仅此而已。
2025年的AI编程领域已经百花齐放。Cursor凭借直观的界面占据了心智高地。Windsurf(前身是Codeium)在Agent原生开发上不断突破边界。Claude Code将终端优先的工作流带给大众。GitHub Copilot在新的代理能力上持续进化。然后AWS——这个云基础设施巨头——悄然发布了Kiro,整个行业的话题瞬间转向。
Kiro不是要成为最快的代码补全工具。它要做的是强迫你在写代码之前先想清楚,让你成为更好的软件工程师。
根据SimilarWeb的数据,Kiro.dev现在每月吸引超过100万访客。这不仅仅是好奇心——这是开发者对一款承诺修复AI辅助开发痛点的工具的真正兴趣。
Kiro是什么
Kiro是AWS开发的代理式AI IDE,基于Code OSS构建——也就是Visual Studio Code的开源基础。这意味着你现有的VS Code设置、扩展和肌肉记忆可以直接迁移。你不是在学习一个全新的工具,而是在熟悉的地盘上获得超能力。
但Kiro与其他所有AI编程工具的根本区别在于:它是规范驱动的。当Cursor和Windsurf专注于让代码补全更快更智能时,Kiro问了一个完全不同的问题——如果AI能在你写代码之前帮你做好规划呢?
Kiro核心信息
- 开发商: 亚马逊云科技 (AWS)
- 类型: 独立代理式IDE(VS Code分支)
- AI模型: Claude Sonnet 4.0 和 3.7(通过Anthropic提供)
- 需要AWS账号: 否
- 登录方式: Google、GitHub、AWS Builder ID、AWS IAM身份中心
- 支持语言: Python、JavaScript、TypeScript、Go、Rust、PHP、Java、C#等
- 支持平台: Windows、macOS、Linux
有趣的是,根据AWS开发者布道师Nathan Peck的说法,Kiro的定位是「与AWS核心业务略微分离」。目标是让Kiro拥有独特的品牌形象,吸引所有平台的开发者——而不仅仅是那些已经深度绑定AWS生态的人。你可以不用AWS账号使用Kiro,通过Google或GitHub登录即可。
这个战略定位很重要。AWS CEO Matt Garman将Kiro描述为「一个帮助开发者从原型走向生产的代理式IDE,提供生产级代码所需的结构」。它不是要取代你的快速原型工具——它是要确保那些原型最终能上线。
规范驱动的革命
Kiro要解决的问题是:氛围编程(Vibe Coding)。你懂的。我懂的。我们都干过。打开AI聊天窗口,大致描述一下你要什么,不断迭代提示词直到某个东西能跑,然后发布。很快。感觉像魔法。然后留下的技术债会困扰你好几个月。
氛围编程产出的代码往往冗长、风格不一致,缺乏对既定架构模式的遵循。AI做出了你从未同意的假设。需求一直模糊,因为没人写下来。六个月后,当你需要修改这个功能时,你完全不知道当初为什么要这样决定。
AWS引用的研究表明,在开发阶段解决问题的成本是规划阶段的5-7倍。Kiro将这个洞察落地成了工具。
Kiro的规范驱动方法会生成三个相互关联的文件,构成每个功能的基础:
使用结构化的EARS标记法捕捉用户故事和验收标准。这不是你常见的需求文档——它使用消除歧义的正式语法,让需求变得可测试。
记录技术架构、数据流图、TypeScript接口、数据库Schema和API端点。这是你的蓝图——AI会分析你的代码库,创建一个考虑到现有模式的设计。
提供详细的实现计划,包含离散的、可追踪的任务和子任务。每个任务都链接到特定的需求,创建一个连企业合规要求都能满足的审计线索。
输入「为产品添加评价系统」,Kiro不会直接生成代码。它会生成查看、创建、筛选和评分评价的用户故事。每个用户故事都包含覆盖边缘情况的验收标准——这些通常是开发者在实现时才会处理的。只有在你审核并批准这些规范后,实际的编码才会开始。
听起来可能更慢。一开始确实是。但回报体现在更少的迭代周期、更清晰的团队沟通,以及真正符合你意图的代码。规范成为单一事实来源,人类和AI智能体在整个项目生命周期中都可以引用。
EARS语法详解
EARS——Easy Approach to Requirements Syntax(简易需求语法方法)——是Kiro规范系统背后的秘密武器。它由Alistair Mavin及其同事在罗尔斯·罗伊斯公司分析喷气发动机控制系统适航法规时开发,提供了一种结构化的格式来编写清晰、无歧义、可测试的需求。
EARS不仅仅是巧妙的自动格式化。它实际上是时态逻辑的扩展,而时态逻辑本身是一阶逻辑的扩展。这赋予Kiro真正的能力来验证流程、控制模型行为,以及连接设计与实现。
WHEN [条件/事件] THE SYSTEM SHALL [期望行为]
基本模式确保每个需求都明确触发条件和期望结果。
WHEN 用户提交包含无效数据的表单
THE SYSTEM SHALL 在相关字段旁边显示验证错误
WHEN 用户成功创建评价
THE SYSTEM SHALL 显示确认消息并将评价添加到产品页面
来自实际Kiro生成规范的具体示例。
EARS语法包含几种适用于不同需求类型的模式:
事件驱动型
WHEN [事件] THE SYSTEM SHALL [响应]。用于由特定操作或条件触发的响应式行为。
状态驱动型
WHILE [状态] THE SYSTEM SHALL [行为]。用于只要条件为真就持续的行为。
可选功能型
WHERE [功能启用] THE SYSTEM SHALL [行为]。用于可能不总是激活的可配置功能。
异常处理型
IF [异常条件] THE SYSTEM SHALL [响应]。用于错误处理和边缘情况管理。
结构化的格式使期望变得清晰易懂,减少产品和工程团队之间的误解。它还使需求可以直接测试——每个EARS语句都可以转换为测试用例,确保没有遗漏。
氛围模式 vs 规范模式
Kiro有两种截然不同的工作模式,各自服务于不同的开发需求:
氛围模式(Vibe Mode)
相当于Cursor的Chat模式。快速、对话式的AI辅助,适用于临时任务、原型开发和探索。当你只需要快速写个工具函数或调试一个小问题时,氛围模式是你的好帮手。没有规范,没有仪式——就是你和AI关于代码的对话。
规范模式(Spec Mode)
Kiro的核心差异化优势。激活完整的规范驱动工作流,包含需求、设计文档和任务列表。当你构建需要经受生产环境考验的功能时、与团队协作时、或需要与代码保持同步的文档时,请使用这个模式。
你可以自然地在两种模式之间切换。先用氛围对话探索想法,准备好正式化时说「生成规范」。Kiro会询问你是否想开始规范会话,然后根据你的对话上下文生成需求。
聪明的开发者用氛围模式做发现,用规范模式做实现。魔法在于知道什么时候切换。
还有自动驾驶模式(Autopilot Mode)——在右下角切换,Kiro就会变成开发加速器。在自动驾驶模式下,Kiro会实现完整的代码而不需要你在每一步都批准,通过消除来回确认大幅缩短开发时间。用它来处理基础组件和样板代码。在关键业务逻辑上切换到监督模式,你可以审查每一个更改。
Agent Hooks自动化
Hooks是Kiro的第二大创新——基于文件变更触发的事件驱动自动化,在后台运行AI智能体。它们就像一个经验丰富的开发者,在你工作时帮你抓住遗漏或完成样板任务。
当你保存文件、创建新组件或修改API端点时,hooks可以自动:
当端点变更时自动更新README文件和API文档,确保文档与代码同步。
每当添加新函数时创建单元测试和集成测试,无需手动操作即可保持测试覆盖率。
在提交前运行凭证泄露扫描,捕获可能意外提交到版本控制的密钥。
验证新的React组件是否遵循单一职责原则,确保整个代码库的架构一致性。
使用Figma MCP集成分析更新的HTML/CSS,验证它们是否遵循设计稿中的既定模式。
一旦hook被提交到Git,它就会在整个团队中强制执行标准。每个人都能享受相同的质量检查、代码标准和安全验证。这解决了常见的问题:文档与现实脱节、编码标准因人而异、资深工程师离职带走机构知识。
# .kiro/hooks/validate-react-components.md
Trigger: On file save in src/components/**/*.tsx
验证组件是否遵循单一职责原则。
如果发现违规,建议拆分为更小的组件。
如果相邻目录存在README,更新组件文档。
Hooks使用自然语言提示词,让整个团队都能理解和使用。
Kiro还支持Agent Steering——存储在.kiro/steering/目录下markdown文件中的持久项目知识。这为AI提供了关于你的技术栈、文件结构和编码模式的上下文,跨会话保持有效。结合Model Context Protocol (MCP)支持,你可以连接到外部文档、数据库、API等。
底层模型解析
测试期间,我用这个提示词来准确验证Kiro背后的驱动力:
What model powers you? List: model name, API model ID,
release date, context window, max output tokens,
and knowledge cutoff.
这个提示词适用于任何AI平台,可以揭示底层模型规格。
以下是我发现的关于Kiro模型情况的信息——这对于设定期望很重要:
模型实情
Kiro目前使用Claude系列模型,主要是Claude Sonnet 4.0,在高流量时以Sonnet 3.7作为备选。虽然模型名称听起来很新,但它们似乎是优化版本,没有直接订阅Anthropic所能获得的扩展思考能力(如Claude的thinking模式)。
这意味着你获得的是稳定的Claude性能,但不一定是最先进的推理能力。对于简单到中等复杂度的任务,这没问题。对于深度架构推理,你可能会注意到差异。
Kiro推出了「Auto」——一个使用多种前沿模型组合的智能体,结合专用模型、意图检测、缓存和优化技术。目标是在质量、延迟和成本之间取得更好的平衡。使用Auto时,某些通过直接Sonnet 4消耗X额度的任务成本更低,因为系统会智能路由到最合适的模型。
对于想要直接控制的用户,你可以明确选择Sonnet 4来处理你的提示,但这会以更高的速率消耗额度(大约是Auto的1.3倍)。
定价与额度
Kiro的定价一直...争议不断。社区反馈声音很大,AWS也做出了多次调整。以下是当前状态:
当前定价层级
- Free(免费): 50额度/月——基础探索和轻度使用
- Pro($20/月): 1,000额度——适合日常个人开发者
- Pro+($40/月): 2,500额度——为重度用户增强容量
- Power($200/月): 10,000额度——企业级使用量
新用户获得500额度的欢迎礼包,30天内可用,无论选择哪个计划——包括免费层。这给你足够的时间真正体验Kiro的能力再做决定。
理解额度消耗
这里需要细说。额度不是简单的「一个提示 = 一个额度」。一个额度是响应用户提示的一个工作单元:
- 简单提示可能消耗少于1个额度
- 复杂提示,尤其是规范任务执行,通常消耗超过1个额度
- 不同模型以不同速率消耗额度
- 额度按小数点后两位计量(最小0.01额度)
在我的测试中,一个简单的模型验证问题只消耗了0.1额度——效率惊人。但创建完整的项目规范可能消耗15-25次交互,复杂的多文件实现会快速消耗额度。
有用户反馈,轻度编码每月需要约3,000个规范请求,按超额定价计算约需$550/月。全职专业使用可能达到$1,950/月。
超额与计费
在付费计划上,你可以启用超额来继续超出月度限制后工作。额外额度每个$0.04,月末结算。超额默认禁用,必须在设置中明确启用——这是防止意外账单的合理保护措施。
AWS还提供Kiro创业公司额度计划——符合条件的初创企业最多可免费获得一年的Pro+访问。如果你正在创业且符合标准,这是相当可观的价值。
我的真实体验
让我分享我使用Kiro的个人体验,不加粉饰。我一开始是兴奋的——AWS进入AI IDE领域,带着一个真正新颖的方法?算我一个。
规范驱动的工作流在运作良好时确实令人印象深刻。看着Kiro将一个模糊的功能需求转化为结构化的用户故事,每个故事都有EARS验收标准,然后生成分析你现有代码库的技术设计文档,再将其分解为有序的实现任务——感觉就像有了一个真正会做文档的资深工程师加入团队。
我遇到的挫折
Kiro无法满足我的专业工作流需求。虽然模型名称正确,但感觉像是较旧、较便宜的版本,没有扩展思考能力。当我描述复杂需求时,Kiro经常无法完全理解我的意图。它喜欢走捷径——生成简化、缩写的代码,而不是完整实现。
有一个项目,我最终删除了Kiro生成的所有内容。这不是好兆头。
社区的声音也类似。有开发者报告在一个本应20-30小时的项目上花了310+小时和$620的AI额度,只实现了50%的成功率——四个模块中只有两个能工作。任务经常卡住、失败,需要多次手动重试。失败的任务丢失上下文,被迫从头开始,同时消耗使用限额。
我遇到的以及其他人报告的常见问题:
- 高流量错误:「你选择的模型正在经历大量流量。请尝试更换模型。」付费计划上好一些,但仍会发生。
- 调试循环: AI有时会陷入循环模式,反复应用同样错误的修复。
- 功能过度: Kiro倾向于在简单代码足够的情况下生成「工业级、军用级」解决方案——本可以200行搞定的功能生成了20个文件1,500行代码。
- 上下文丢失: 正确实现的逻辑有时会与完全不同的早期任务的代码混合。
- 额度消耗bug: 早期定价发布时有计量问题导致意外使用量飙升(AWS已确认并解决)。
积极的一面是,Kiro的简单查询额度很慷慨。当规范工作流运作良好时,它确实比单纯的氛围编码产出更高质量、更易维护的代码。产出的文档对团队协作真正有用。
我从实际测试得出的结论:Kiro还太年轻。智能体的智能水平仍在发展中。在准备好用于专业工作流之前,它还需要更多迭代。但基础是扎实的,理念是正确的。AWS对社区反馈响应良好,为受定价bug影响的用户退款并延长免费访问期。
Kiro vs Cursor vs Windsurf
让我们抛开营销术语,在真正重要的方面对比这些工具:
Kiro
优势: 规范驱动开发、文档生成、企业合规、团队对齐
劣势: 产品较新、偶有稳定性问题、模型选择有限
价格: $20-200/月 + 超额
最适合: 需要结构的团队、企业环境、长期项目
Cursor
优势: 深度代码库索引、多模型灵活性、成熟功能集、精确控制
劣势: 学习曲线较陡、选项太多可能让人overwhelmed
价格: $20/月(实际上无限制)
最适合: 高级用户、专业开发者、生产级代码
Windsurf
优势: 简洁UI、Cascade智能体、自动上下文处理、新手友好
劣势: 代码质量有时较低、「flow credits」定价复杂
价格: $15/月
最适合: 初学者、快速原型、追求最小摩擦的用户
GitHub Copilot
优势: GitHub集成、组织级设置、实时反馈、快速迭代
劣势: 自主性较低、上下文能力不如竞品
价格: $10-19/月
最适合: GitHub中心工作流、企业标准化
性能基准
基于常见开发场景的测试:
Kiro: 45分钟(包含完整文档/测试)
Cursor: 65分钟(手动架构)
Windsurf: 70分钟(多文件处理好)
Copilot: 85分钟(上下文有限)
Kiro的规范驱动方法在复杂、定义明确的任务上胜出。
突出的指标是Kiro的一致性——虽然竞品在简单补全上可能更快,Kiro在复杂的多文件操作中保持高准确率。规范驱动的方法在数据库设计和API架构上尤其出色,这些是传统AI助手容易出问题的领域。
Kiro在企业就绪性方面领先,提供规范、文档和审计追踪。Cursor在精细化、模型感知的编码上表现出色。Windsurf以直观体验赢得初学者青睐。
适合谁使用
完美适合:团队和企业
如果你与多个开发者协作、需要合规文档、或希望项目间保持一致的编码标准,Kiro的规范驱动方法能创造真正的价值。规范成为共享上下文,在团队变动和项目交接中得以保留。
完美适合:有想法的非程序员
如果你有想法但缺乏技术专长,Kiro的结构化方法帮助将愿景转化为可运行的软件,而不需要你学习编程。规范工作流自然地引导你遵循正确的软件工程实践。
完美适合:打基础的创业公司
如果你正在建设需要扩展的基础,前期在规范上的投入会带来回报。Kiro将被忽视的文档转变为稳健的资产,让增长更顺畅,未来扩展更有效。
需谨慎考虑:独立高级用户
如果你行动迅速、清楚自己想要什么、不需要为他人准备文档,Kiro的开销可能拖慢你而不是帮助你。Cursor或Windsurf可能更适合你的个人生产力需求。
暂不理想:生产关键系统(目前)
如果你需要绝对可靠性,无法容忍偶尔的失败或调试循环,请等Kiro进一步成熟。基础是扎实的,但执行还不够稳定,无法用于关键任务。
专业技巧与最佳实践
经过广泛测试和社区调研,以下是最大化Kiro价值的策略:
任何重要功能都不要直接跳到编码。先用Kiro的规范工作流理清需求,即使感觉更慢。节省的迭代周期远超这个投入。
项目开始时立即设置.kiro/steering/文件。包含技术栈、编码规范、首选模式。这会显著提升Kiro的上下文理解能力。
基础组件、样板代码和成熟模式用自动驾驶。关键业务逻辑切换到监督模式,审查每一个更改。
在tasks.md中将复杂功能分解为小而可管理的任务。Kiro在专注的工作上比大范围实现表现更好。逐一执行任务以获得最佳结果。
Context7和AWS Labs MCP服务器为AWS相关任务提供巨大价值。连接文档、数据库和API,为Kiro提供更丰富的上下文。
自动化git提交、文档更新和代码质量检查。在hooks上的前期投入会在项目成长过程中每天带来回报。
不要盲目接受规范输出。AI会做假设——在进入设计和实现之前,确保它们与你的实际需求一致。
让Auto将你的提示路由到合适的模型,而不是总是选择Sonnet 4。大多数任务不会有显著质量损失,但能节省额度。
最终评定
规范解决了真正的协调问题
开销可能超过收益
结构化指引弥补专业知识不足
让产品进一步成熟
我的建议?如果你期望它能替代你的主要开发工作流,先别订阅Kiro。智能体能力还太年轻,可靠性还不够,规范驱动开发的学习曲线也确实存在。
但请保持关注。AWS用规范驱动的方法创造了真正不同的东西。这个理念——AI编程应该强迫思维清晰,而不仅仅是打字速度——是深刻的。当Kiro成熟时,它可能完全改变我们对AI辅助开发的认知。
试试免费层。在一个小项目上体验规范工作流。看看这种结构是否与你想要的工作方式产生共鸣。如果你正在建设一个文档和一致性比原始速度更重要的团队或公司,Kiro可能已经正是你需要的。
AI的出现并没有让知识过时——它让好奇心变得更加强大。我们不再受限于教科书或多年的专业培训。有了正确的工具和清晰思考的意愿,普通人可以创造非凡的成就。最好的AI工具不是替代人类判断——它们放大了我们做出明智决策的能力。只有与不同的AI系统协作,我们才能找到真正适合自己工作风格的那些。我希望能与世界各地的朋友分享这段旅程。让我们一起迎接这个新时代。让我们一起成长。
讨论
0 条评论留下评论
成为第一个分享您想法的人!