IT博客汇
  • 首页
  • 精华
  • 技术
  • 设计
  • 资讯
  • 扯淡
  • 权利声明
  • 登录 注册

    科技爱好者周刊(第 332 期):西蒙·威利森的年终总结,梁文锋的访谈

    阮一峰发表于 2025-01-03 03:05:51
    love 0

    这里记录每周值得分享的科技内容,周五发布。

    本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

    封面图

    世界最长的高速公路隧道"天山胜利隧道"本周贯通,长达22.13公里,汽车要在里面开20分钟。它连接了被天山隔断的南疆和北疆。(via)

    西蒙·威利森的年终总结,梁文锋的访谈

    英国程序员西蒙·威利森(Simon Willison)最近两年非常出名,他的个人网站有很多文章,介绍 AI 的最新进展。

    本周,他发表了很长一篇的2024年大模型回顾(非官方的中译),非常精彩。

    他提到,AI 的发展速度快得难以想象。

    一年前的2023年底,排名第一的 AI 模型是 OpenAI 公司的 GPT-4,没有其他模型能超过它。

    一年过去了,大家猜猜,GPT-4 现在排名多少?

    答案是第69位(上图),已经有18家公司的大模型超过了它。其中的一些模型,甚至可以在笔记本电脑运行。

    短短一年,榜首模型就被大量竞争者轻松超过,家用硬件就能达到它的运行效果。AI 的进化速度就是这么惊人。

    西蒙·威利森特别提到了来自中国的大模型 DeepSeek V3。

    DeepSeek V3 是2024年12月25日发布的,来自杭州的量化基金公司幻方量化。一经发布,它就引起了国际范围的轰动。

    它在多个参数上,击败了 OpenAI 公司最新的 o1 模型。目前,它在大模型排行榜上排名第7,要知道前十名里面,只有它是开源模型,而且是最少限制的 MIT 许可证,其他都是大公司的专有模型。

    而且,它的运行效率很高,训练成本估计只有 Meta 公司的 Llama 3.1 405B 模型的11分之一,而后者的效果还不如它。这就是说,DeepSeek 找到了高效使用硬件、提高模型效果的方法。

    西蒙·威利斯说:"DeepSeek V3 的训练成本不足600万美元,是一个极好的迹象,表明 AI 模型的训练成本可以而且应该会继续下降。"

    西方媒体就非常好奇,DeepSeek 是怎么做到的?

    幻方量化创始人梁文锋,跟其他 AI 模型的研究者不同,没有海外经历,毕业于浙江大学电子工程系人工智能方向。

    西方媒体对他充满了好奇,专门将他以前的访谈译成了英文。

    我觉得,原始的中文访谈( Part 1,Part 2)很值得一读,我分享他说的几段话,展示了中国顶级研究者的视野和抱负。

    (1)我们要做的不是生成式 AI,而是通用人工智能 AGI。前者只是后者的必经之路,AGI 会在我们有生之年实现。

    (2)任何 AI 公司(短期内)都没有碾压对手的技术优势,因为有 OpenAI 指路,又都基于公开论文和代码,大厂和创业公司都会做出自己的大语言模型。

    (3)在颠覆性的技术面前,闭源形成的护城河是短暂的。即使 OpenAI 闭源,也无法阻止被别人赶超。我们把价值沉淀在团队上,我们的同事在这个过程中得到成长,积累很多know-how,形成可以创新的组织和文化,就是我们的护城河。

    (4)我们不会闭源。我们认为先有一个强大的技术生态更重要。

    (5)当前阶段是技术创新的爆发期,而不是应用的爆发期。大模型应用门槛会越来越低,创业公司在未来20年任何时候下场,也都有机会。

    (6)过去很多年,很多的中国公司习惯了别人做技术创新,拿过来做应用变现,自己等着摩尔定律从天而降,躺在家里18个月就会出来更好的硬件和软件。我们的出发点,就不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展。中国也要逐步成为贡献者,而不是一直搭便车。

    (7)大部分中国公司习惯 follow,而不是创新。中国创新缺的不是资本,而是缺乏信心以及不知道怎么组织高密度的人才。我们没有海外回来的人,都是本土的。前50名顶尖人才可能不在中国,但也许我们能自己打造这样的人。

    (8)我们每个人对于卡和人的调动是不设上限的。如果有想法,每个人随时可以调用训练集群的卡无需审批。同时因为不存在层级和跨部门,也可以灵活调用所有人,只要对方也有兴趣。

    (9)我们选人的标准一直都是热爱和好奇心,所以很多人会有一些奇特的经历,很有意思。很多人对做研究的渴望,远超对钱的在意。

    (10)我们在做最难的事。对顶级人才吸引最大的,肯定是去解决世界上最难的问题。其实,顶尖人才在中国是被低估的。因为整个社会层面的硬核创新太少了,使得他们没有机会被识别出来。我们在做最难的事,对他们就是有吸引力的。

    (11)中国产业结构的调整,会更依赖硬核技术的创新。很多人发现过去赚快钱很可能来自时代运气,现在赚不到了,就会更愿意俯身去做真正的创新。

    (12)我是八十年代在广东一个五线城市长大的。我的父亲是小学老师,九十年代,广东赚钱机会很多,当时有不少家长觉得读书没用。但现在回去看,观念都变了。因为钱不好赚了,连开出租车的机会可能都没了。一代人的时间就变了。以后硬核创新会越来越多,因为整个社会群体需要被事实教育。当这个社会让硬核创新的人功成名就,群体性想法就会改变。我们只是还需要一堆事实和一个过程。

    科技动态

    1、AirTag 充电盒

    苹果公司的 AirTag 可以追踪物品,但如果没电,就无法追踪了。

    一位国外程序员就遇到了这个问题。他的1万美元装备的相机包放在车后座被偷了,当他打开追踪时,才发现里面的 AirTag 忘了换电池,已经无法追踪了。

    他痛定思痛,发明了一个 AirTag 充电盒,把两节五号电池跟 AirTag 封装在一起,为后者充电。

    据他说,这个充电盒可以持续工作10年,完全不用担心没电。

    只要把这个小盒子跟你要追踪的物品,放在一起,就不用管它了,一直可以追踪。

    2、无护照过海关

    从2024年9月30日开始,新加坡公民通过樟宜机场出入境,不再需要护照了。

    机场会使用人脸识别和虹膜识别,来代替护照。这样更省时、成本更低。

    纸制护照已经过时了,也许不久将来就会消失。

    3、世界最大 3D 打印社区

    美国得克萨斯州即将完工世界最大的 3D 打印社区,共有100幢住宅。

    这些房子都是一个巨大的 3D 打印机生成的。

    房屋的打印材料是混凝土粉末、水、沙子、添加剂的混合物,喷嘴将混合物像牙膏一样挤出,沿着预先编程的路径层层堆叠,形成墙壁。

    建筑公司表示,3D 打印房屋更快、更便宜,现场只需要一个操作员,并且最大限度地减少了建筑材料浪费。

    单层的三居室或四居室住宅,大约需要三周才能打印好所有墙壁,然后再用传统方式加固地基和安装屋顶。

    4、其他

    (1)网友发现,Spotify 歌单里面,有些音乐家根本不存在,他们的作品很可能是 AI 生成的,Spotify 以此减少付出的版权费。

    (2)百度推出"Ai 搜",汇集了各种 AI 相关功能。

    文章

    1、2024年 Linux 发行版推荐(英文)

    作者介绍他心目中,各种用途最佳的 Linux 发行版。

    2、中美工作感想(中文)

    "过去四年五个月,我随着工作从 SF 搬到北京,再搬到上海,后来搬回美国在洛杉矶住了一年半。"本文是国内做工程师和美国做工程师的对比。(@wukan 投稿)

    3、开发者应该知道的10个终端命令(英文)

    本文简单介绍10个终端命令,比如 grep、awk、sed、find 等。

    4、Meta 四次面试经历(中文)

    "这些年,我一共面试了四次 Facebook/Meta。虽然都未成功,但收获颇多。"(@DoctorLai 投稿)

    5、算法面试心得(中文)

    本文是作者对如何应付一般的算法面试的知识总结和心得。(@javayhu 投稿)

    6、我们用 React 取代了 Next.js(英文)

    作者难以忍受 Next.js 的庞杂和性能,改为直接使用 React,不再用基于它的框架了。

    7、Windows 的增强剪贴板(英文)

    我很少用 Windows,现在才知道它的剪贴板有同步功能,还能永久保存。

    工具

    1、Ghostty

    一个终端模拟器,使用 GPU 渲染 UI,支持 mac 和 Linux。作者是 HashiCorp 公司创始人,参见介绍文章。

    2、Black Candy

    一个自搭建的音乐流媒体服务器,自带手机和 Web 客户端,相当于自己的云音乐平台。

    3、curl-impersonate

    一个 curl 的改写版,使其发出的 HTTP 请求就像 Chrome/Firefox 发出的。

    4、RSS.Beauty

    将普通的 RSS/Atom 订阅源转换成美观的阅读界面,代码开源。(@ccbikai 投稿)

    5、AI Shadcn 主题生成器

    输入关键词,就可以免费生成 Shadcn 主题。(@meetqy 投稿)

    6、懒猫书签

    开源的 Chrome 插件,一键清理失效链接和空文件夹。(@Alanrk 投稿)

    类似插件还有 Bookmark Pro。(@wincatcher 投稿)

    7、Nping

    Rust 语言开发的 Ping 工具,支持多个地址并发 Ping,并附带实时折线图展示。(@hanshuaikang 投稿)

    8、peepDB

    一个命令行工具,连接各种主流的关系型数据库,查看表内容。

    9、File Pilot

    非官方的 Windows 文件管理器,号称可以取代官方的资源管理器。

    10、Doggo

    一个易用的 DNS 命令行查询工具。

    它的官网首页还提供 DNS 在线查询。

    AI 相关

    1、DeepSeek Coder

    根据提示生成 App,基于 DeepSeek V3 模型。(@sing1ee 投稿)

    2、GodView

    语义化地图,用自然语言查询地图,比如输入"请展示上海的前10大图书馆"。

    3、对话 CEO

    与马斯克、张一鸣、任正非对话,效果还可以。(@5A59 投稿)

    4、ithy

    AI 模型聚合网站,输入关键词,同时返回 Lllma 3.1、o1-mini、Sonnet 3.5、Grok 2、Gemini 1.5 pro 的生成结果。

    5、AutoMouser

    开源的 Chrome 浏览器插件,将鼠标操作通过 AI 转为 Selenium Python 脚本,需要 OpenAI key。(@guoriyue 投稿)

    资源

    1、search the arXiv

    arXiv 论文库的搜素引擎,使用自然语言搜索。

    2、《算法(第4版)》的 C++ 实现

    这个仓库包含《算法(第4版)》教科书介绍的算法的 C++ 语言实现,与原书的 Java 实现相对应,(@landerrosette 投稿)

    3、EmojiClick

    使用自然语言搜索 Emoji 符号。(@yijianbo 投稿)

    4、独立开发者工具

    该仓库收集独立开发者出海技术栈和工具。(@yaolifeng0629 投稿)

    图片

    1、世界最美钞票

    2023年,国际钞票协会评选当年的"世界最美钞票"。得奖者是东加勒比中央银行发行的2元纸币。

    这张钞票色彩缤纷,确实非常漂亮。正面是当地板球明星,以及银行标志、乌龟和鱼。

    背面是鱼、珊瑚、海龟、蓝色岛屿地图。

    2、行业圣诞树

    上周圣诞节,美国媒体贴出了,各行各业搭建自己圣诞树的照片。

    披萨店的外卖盒圣诞树。

    家装店的玻璃圣诞树。

    修路队的交通锥圣诞树。

    书店的圣诞树。

    电脑店的圣诞树

    超市的香蕉圣诞树

    文摘

    1、亚马逊河为什么没有桥?

    南美洲的亚马逊河是世界第二长的河流,仅次于非洲的尼罗河。

    但是,这条河没有一座桥,是唯一一条没有任何桥梁的世界主要河流。这是为什么呢?

    首先,每年的雨季,亚马逊河都会泛滥,河流的宽度会从旱季的5公里变成50公里,就像下图那样,很难造桥。

    其次,亚马逊河沿岸人烟稀少,只有很少几个城镇。最大一个城市的人口只有50万,不存在前往河对岸的强烈需求。

    最后,亚马逊河两岸都是原始森林,并没有现成道路。如果造桥就需要砍伐大量森林,修建引桥和公路,环境代价很大。近年来,环保意识逐渐高涨,反对造桥的呼声也就越来越大。

    言论

    1、

    由于 AI 的出现,英语正在成为最热门的新编程语言。

    -- Andrej Karpathy,著名的 AI 科学家

    2、

    除非手机可以当成电脑使用,否则我不打算再为性能升级手机了,不再为越来越快的 CPU 买单了。

    -- Android Authority 专栏作家

    3、

    保护海底光缆不出事是不可能的,你唯一能做的就是建立大量冗余,在不同位置铺设数十根光缆可能比保护它们更便宜。

    -- Hacker News 读者

    4、

    强大的工程师不在于速度快或产出高,而在于能够完成其他工程师无法完成的任务。弱小的工程师几乎任何任务都完成不了。

    如果你和一个弱小的工程师一起工作,你可以帮他,但一定要保护好你的时间,防止他把你的时间都消耗光。

    -- 《强大的工程师与弱小的工程师》

    5、

    人工智能并不是释放我们的想象力,而是外包它们。

    -- 英国《卫报》

    往年回顾

    为什么 PPT 不如备忘录(#285)

    青年失业率与选择创业(#235)

    美国宪法拍卖,一个区块链案例(#185)

    什么行业适合创业?(#135)

    (完)

    文档信息

    • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证)
    • 发表日期: 2025年1月 3日


沪ICP备19023445号-2号
友情链接