使用 [[Pydantic]] AI 将 [[FastAPI]] 的文档翻译为西班牙语。看上去使用起来很方便。[[piglei]]的 https://github.com/piglei/ai-vocabulary-builder 也在用 [[Pydantic]] AI。
落地的最大问题: 人力 链接到标题
遇到效果问题,很多客户都会提“微调行不行”,可以,但是得加钱。 我只调过 Ranking 模型和 LLM,都需要高质量的标注数据。但一般产出这些数据需要对应的业务专家,尤其是 LLM 的 SFT 数据,还需要提供结果的回答。我们见到的很多客户,连知识库的数据预期从哪来,哪些合适放在知识库都回答不了,更别说调动资源来准备这些数据了。 也因此,ToB 的 RAG 项目很难落地,无监督的各种方法很快就会达到上限,而后续的数据治理又没法推进,于是死局。
我司的内部工具中,只包含了 KB,没有所有的对外文档,导致 KB 的信息明显过于细节,割裂感严重,作为研发了解还可以,对于最终客户是否好用很难说。
Parkinson’s Law: It’s Real, So Use It
帕金森定律:指工作必须占用所有预先分配的时间才能完成。工作内容是会膨胀的。
如果一项工具没有 deadline,那么这项工作很有可能会无限的持续下去。无论是工作还是生活,从个人体感上说都是如此,所以需要给所有的事项都设置一个 deadline。下一个问题是如何设置一个“合理的” deadline?
备份一定需要做; 验证不同规模下数据恢复的时间,在事故发生后对于恢复周期有个预期。
对于数据备份的场景,我的经验是,即使有周期性的备份,优先选择重建,在前端进行流量切换,如果只能回滚,在时间允许的情况下,尽量把当前状态也备份一下。因为:
对于产品经理来说,第一要考虑是,到底要解决什么问题,解决这个问题是否会产生价值。而这个过程中,最痛苦的就是要持续不断的审视自己在做的事情到底是不是创造了价值,创造了多大的价值,是否有更大的价值被忽略掉了,真的为客户着迷了吗,足够着迷了吗。同时感叹中国 ToB 领域真的缺少优秀的产品经理,我们之前决定要自己来培养产品经理的思路还是非常明智的。
老板的年终总结。最近由于一些原因,也需要写一个工具类产品的需求文档,发现产品经理的活很难做,找到明确的用户很难,从明确的用户中找到共性,尽可能的均衡很难,从共性转换到功能需求也很难。
新疆二十日(上):雪域沙海,我的北疆探索之旅 - Simon’s Blog
[[新疆]] [[游记]]。我对冬天和大雪很熟悉,对冬天的雪山一无所知,这种地貌特征,太美了。 可惜我不会开车,不知道什么时候有机会去新疆。
《一往无前》,趁着元旦假期把这本读完了。顺势而为,在顺势的前提下要有做事的能力。
《生活大爆炸》,B 站最近有了版权,又重新开始看,真好看啊,放佛回到了大学时期。
元旦期间对自己的 2024 进行了一些总结,记录一些数据。
按照惯例,回答了 40 个问题,其中关于作品的:
Wakatime 的编码统计:
Last.fm: Top Artist: New Jeans Top Album: How Sweet
豆瓣:
小宇宙:
小红书:
Bilibili:
滴滴: