想象一下,一本900页的法律文书扔在你面前,没目录、没标准格式,甚至连官方解释都没有。
更变态的是,你必须在几天内把它变成几千万用户赖以生存的软件代码,而且准确率必须接近100%。
这不是什么职场整蛊综艺,这是Intuit(TurboTax母公司)税务团队面对“One Big Beautiful Bill”(OBBB)法案时的真实处境。结果呢?他们把以前需要几个月才能啃完的硬骨头,压缩到了几小时。这不仅是税务行业的效率革命,更是给所有受监管行业打了个样:在高压线旁跳舞,AI不仅能跳,还能跳得漂亮。
一场不可能完成的任务
说实话,这对任何团队都是噩梦。
当OBBB法案在国会推进时,Intuit的团队就已经坐不住了。Joy Shaw,Intuit的税务总监,在这行干了30多年,什么大风大浪没见过?2017年《减税和就业法案》(TCJA)通过时,她和团队那是真刀真枪地干——人工阅读、人工比对、人工编码。
那是真正的“人肉解析”。
“以前我们得通读法律,找到引用其他条款的部分,然后自己想办法弄明白,”Shaw回忆道。那种痛苦,懂的都懂。
但这次不一样。OBBB不仅厚达900多页,而且结构混乱,众议院和参议院的版本甚至用词都不统一。最要命的是,IRS(美国国税局)还没发布官方表格和指引,开发工作就必须开始。
以前没AI,硬着头皮上;现在有了AI,能不能在不把事情搞砸的前提下,把速度提上去?这是一个关乎生死的赌注。
AI不是神,但它是最好的副驾驶
Intuit的解题思路很清晰,也很务实:别指望一个模型干完所有事。
他们把任务拆解了。首先是“读法条”。
面对众议院和参议院两个打架的版本,团队直接祭出了ChatGPT等通用大模型。这帮AI“实习生”不仅迅速总结了两版摘要,还像个不知疲倦的书记员一样,把两者的差异给对出来了。
这就好比把几周的法务比对工作,压缩成了几小时的机器阅读。Shaw对此很满意:“法律里有很多噪音,我们利用工具迅速提炼出税务影响,缩小到具体条款,甚至能在拿到正式表格前就开始编码。”
但这只是第一步。
一旦进入“写代码”环节,通用模型就抓瞎了。TurboTax的税务计算引擎不是用Python或Java写的,而是基于Intuit内部维护的一套专有领域特定语言(DSL)。
这就很尴尬了。你让GPT写个网页没问题,但让它写一种教科书上都没有的“方言”?它只能给你一本正经地胡说八道。
这时候,Claude登场了。
Intuit发现,Claude在处理这种特定翻译和依赖关系映射时,表现出了惊人的能力。它能精准识别哪些代码变了,哪些没变,让开发者只关注增量部分。
“它能整合那些不变的部分,并识别出变化部分的依赖关系,这大大加速了开发过程。”Shaw解释道。
说实话,这种“模型组合拳”打得挺漂亮。通用模型做分析,特定模型写代码,各司其职。
为了不坐牢,他们造了两个“怪物”
光快没用,税务软件要是算错了数,那是真金白银的损失,甚至可能惹上官司。
在税务领域,准确率必须是100%,或者无限接近这个数字。 这一点没得商量。
通用大模型能生成代码,但那是“能跑”的代码,离“能发版”还差了十万八千里。为了填补这个巨大的信任鸿沟,Intuit在OBBB周期内紧急自研了两套工具。
第一套工具,直接把法律变更自动生成了TurboTax的产品界面。以前这活儿得开发者一个个手动配,现在大部分自动搞定,只有极少数需要人工微调。
第二套工具更有意思,这是一个定制化的单元测试框架。
以前做测试,系统只会冷冰冰地告诉你“Pass”或“Fail”。如果挂了,开发者得像侦探一样,手动打开税务数据文件去查原因。
现在呢?新框架不仅能报错,还能直接定位到具体的代码段,生成解释,甚至允许你在框架内直接修正。
这就像是给修车工配了一个不仅能听出引擎异响,还能直接指出“第三缸火花塞松了”的智能听诊器。
技术副总裁Sarah Aerni对此很自信:“这种确定性和可验证正确性的能力,正是我们信心的来源。”
这不仅仅是税务故事
很多人觉得这就是个TurboTax的迭代故事,个人觉得,这格局小了。
Intuit这次的操作,其实是给所有受监管行业(金融、医疗、法律、政府合同)提供了一套可复制的“AI落地模板”。
你看,这些行业都有共同点:文档复杂、死线死板、代码库老旧且专有、容错率极低。Intuit的这套“组合拳”给出了四个非常实在的启示:
- 通用模型做分析,专用工具做实施。 别让不懂你业务逻辑的模型去写核心代码,那是找死。
- 测试基建要先行。 别等到冲刺阶段才想起来搞测试框架,那是救命稻草。
- 评估体系得跟上。 就算AI生成了结果,最后还得靠人类专家来拍板。Intuit甚至用了基于LLM的评估工具来验证AI的输出,这叫“魔高一尺,道高一丈”。
- 全员AI化。 别光让工程师玩,全公司都得懂。
Aerni说得挺对,他们是在“利用AI和人类智慧的机会,让客户获得所需”。
在这个AI狂飙突进的时代,我们听多了“AI将取代程序员”的恐慌论调。但Intuit的案例告诉我们,在那些容错率为零的高精尖领域,AI更像是一个超级加速器,而人类依然是那个握着方向盘的守门人。
毕竟,有些错,AI犯不起,人也犯不起。
【锐评】:把几个月的苦活压缩成几小时,Intuit证明了AI不是只会写诗画画的玩具,而是敢在监管红线边缘疯狂试探又精准刹车的工程利器。
参考链接:
https://venturebeat.com/data/intuit-compressed-months-of-tax-code-implementation-into-hours-and-built-a