今年S1在公司全职做过一段时间大模型,后来觉得落地成本实在太高,从算力到基建到研发范式都不成熟,恰逢组织架构调整,于是快刀斩乱麻,停止了对大模型落地的研究。
神龙漏洞库是我一直在维护的一个开放的漏洞平台(应该是国内的为数不多的提供API的漏洞库),其中就用到了一些大模型来辅助提供漏洞的信息,例如在漏洞描述信息里的翻译信息就是通过大模型提供的。
如果你观察足够仔细的话,你会发现国家漏洞信息库CNNVD,有自己的一套翻译逻辑。使用基座大模型进行一些微调之后,神龙大模型学习了CNNVD的漏洞翻译方式,从技术上我们可以实现和CNNVD非常接近的翻译效果。
技术原理也不复杂, 如果你感兴趣的话,可以在文章下面留言,有时间我会再分享一下技术原理。
神龙大模型现在还没有上线,是CNNVD的翻译格式好还是用原生的英文翻译,这个我还没有想好。
不知道是公司的原因还是成长阶段的原因,最近没有想清楚的事情有很多。和同事交流也常常是,这个我还没有想好,我们先不做。没有想好的一个原因是脑力不够用,另外一个原因是注意力不够集中,想得太多用来做事的时间就少了。
国内一直缺少类似Exploit-DB这样的公开网站,如果有的话也一般留在了企业内部,因为乙方企业把POC数量作为安全能力建设的一个指标。
在收集漏洞信息的同时,我把一些情报和POC数据在本地也存了一份。
所以你可以在POC页面去查看到POC的信息,例如 CVE-2024-42642 的一个POC,漏洞库在本地保存了一份POC的快照。
神龙也缓存了一份引用链接的信息,图片和PDF各保存了一份,你可以在漏洞详情的页面看到这个信息。
也应该花一些时间统计一下平台访问量的情况,或许会在下一个帖子里更新。