可能博客的读者还不知道我其实是个开发者。最近做了一个英语词根查询工具 JarFire,也是第一次尝试 AI 套壳类的应用开发。如果你也对这方面感兴趣,并且从未做过相关工作,这篇文章可能就适合你;如果你已经有相关知识,那么这篇文章而言对你就太简单了。
第一次听说这种学习方式还是看了《旋元佑英文字彙》。
举个例子,单词 unabridged
含义是“未删节的”,它可以拆分成: un
/ abridge
/ ed
三部分
拆词后,对原词理解更深刻,而且还附赠了一个单词 abridge。 因此每次想要对新单词加深印象时,会用 ChatGPT 拆词,GPT-4o 之后它的效果很理想。 然而每次打开 ChatGPT,输入相同的提示词,总没有那么方便。于是突发奇想:我能不能用 API 尽快做一个英语单词词根词缀的查询工具?
最后花了一天时间完成原型,不得不感叹 AI 之强大。 以前创业也做过英语教育相关的产品,在没有 AI 的时代,这类工具需要大量人力、心力在数据整理、纠错、版权上。
本文分享下遇到的难点和解决方式。如果你在这方面有更好的实践方式,请分享给我补充。
PS,文章中的示例是:
词根词缀学单词 https://jarfire.org/zh-CN
总所周知,默认情况下 AI 会输出一堆废话。如何才能让程序也可以解析其中的内容?
这样得到的文本结果可 JSON.parse。
有了 JSON 格式数据后,还有另一个问题:异常数据怎么办?例如拆词工具可能会遇到的两个情况:
预处理
单复数和单词不存在可以尽量通过非 AI 的形式格式化单词,提升查询速度,降低 API 调用次数。
或者可以用词典提前筛选出不可拆解单词并入库。
条件分支
还要为输出格式列举 case,并要求按情况返回不同格式数据。
上线一天后,看 Azure 的费用清单,才测试了几十个单词,开销就达到了 $0.5,要是覆盖常见词汇和不同语种解释,估计费用能上万。 因此做了一些优化。
要保证在尽量少的 token 下实现效果,有一些技巧可以使用。 对于初学者,最简单的方式:
可能还有一些更高级的做法,我还没有掌握。
如果有人想要刷爆你的账单,他只要反复构造请求就可以了。因此还需要做一些风控。常见的控制方式:
还可以测试不同模型的效果。目前看 GPT-4o、Claude 和国内一些模型效果均不错。 这是常见几个模型的价格参考:
一百万 token 基本都在几十元到上百元人民币左右。最便宜是 Deepseek,效果也不差,百万 token 才 1~2 元,因此我又更换到了 deepseek。
兼容性提示
同样的 prompt 在不同的模型里效果也不一样,直接替换可能会出现问题。新一代的模型通常效果更理想,不过价格也更贵。
这个挑战并不是 AI 套壳类应用所特有的。需要充分打磨自己的技术栈,采用成熟、生态完整的方案。我这次使用的是:
名称 | 类型 | 网址 |
---|---|---|
NextJS | TS 框架 | https://nextjs.org |
Tailwind | CSS 框架 | https://tailwindcss.com |
shadcn/ui | UI 组件 | https://ui.shadcn.com |
next-intl | 多语言组件 | https://next-intl-docs.vercel.app |
drizzle | 数据库 ORM | https://orm.drizzle.team |
neon | PostgreSQL 数据库托管 | https://neon.tech |
vercel | 应用托管 | https://vercel.com |
如果访问量足够小的话,前期不产生费用;如果有一定访问量,也可以切到自建。 上面提到的也有一些替代方案,例如 netlify、cloudflare worker、fly.io 代替 vercel。 如果打算面向国内的用户,这方面就会有一些更难的挑战:
由于使用的 API 是一次性完整返回全部内容,因此从查询到解析完成通常会卡数十秒的时间。需要考虑:
如果是 nextjs 部署到应用平台,需要设置好 maxDuration.