IT博客汇
  • 首页
  • 精华
  • 技术
  • 设计
  • 资讯
  • 扯淡
  • 权利声明
  • 登录 注册

    love 0
    Xin LI
    发表于
    2025-04-26 05:51:36

    购买二手硬件的一些人生经验

    以往我是不直接在 eBay 上购买二手硬件(这不包括美国比较常见的「翻新refurbished」硬件, 这类卖家往往是比较专业的回收处理机构)的,原因是购买此类硬件多少有点像拆盲盒: 二手硬件的质量往往缺乏统一且一致的标准,并且通常只提供较短的退货窗口。不过上回书说到我收了一台二手的 Dell R740 服务器,既然选择了消费降级索性一降到底试试看买二手内存和存储。这次总共购买了:2.5寸SAS硬盘9块HGST Ultrastar DC SN200 一块内存12条以及与这些存储配套的硬盘托架。简而言之,我最终只保留了机械硬盘及其托架,Western Digital SN200 和内存都退货了。硬盘硬盘的部分属于耗材,卖家对硬盘的说明是这些硬盘原本属于备件,除了他测试其好坏之外基本上没有正经使用过。 拿到硬盘之后发现这些硬盘是和原来的2.5寸转3.5寸托架一起送来的,我这台机器上只有2.5寸的槽并且规格不一样, 因此需要逐个拆下来装到新的2.5寸托架中再插到机器上。测试方面,我主要观察以下几个指标:硬盘固件。将硬盘固件刷成厂商提供的最新版本固件,有些品牌或型号的硬盘在出厂后可能会修正过一些可靠性或兼容性问题,更新固件有助于避免这些已知问题。硬盘本身的 S.M.A.R.T. 数据。与卖家描述相符,硬盘的上电时间普遍不超过100小时,基本没怎么写过数据。向硬盘做全盘写0、随机数、读出过程 ...继续阅读 (10)


    love 0
    YY.K
    发表于
    2025-04-26 05:34:19

    OpenAI&DeekSeek使用感想

    ChatGPT刚出来的时候火热的一批, 正值我抑郁阶段, 一点想去看看的欲望都有。后面快 2年了热度降了很多,找咩咩蹭海外手机号注册了 GPT 账号。然后今年年初爆火的 DeekSeek也跟着注册账号玩了一下。也拿MacMini M4 16G内存的机器本地部署ollama 跑大模型。MacMini-M4:~$ ollama list NAME ID SIZE MODIFIED deepseek-coder-v2:latest 63fb193b3a9b 8.9 GB 3 days ago llama3.2:latest a80c4f17acd5 2.0 GB 3 days ago整体来说写代码 GPT 更好用些,deekseek用来写代码还是比较弱, 本地部署没有硬件资源支撑又慢又卡效率又低。cursor 开始用觉得还行,后面发现一些模型会偷懒。amazon q 也比较一般,用的比较少。Copilot要钱,错过白嫖期没能体验上。bolt.new 拿来写前端顺道写后端还不错。 整体一圈下来这些 AI模型只能当搜索引擎平替使用,只能拿他们当顾问或者知识库老炮当指导用(可以不厌其烦的从天文地理不限时间不限地点的给你回复), 想拿AI模型当牛当马用还是差得 ...继续阅读 (125)


    love 0
    admin
    发表于
    2025-04-26 03:28:25

    一文了解思维链

    对于CoT已经有很多的研究,本文将梳理思维链(CoT)相关的高价值论文,并发布时间顺序排列进行逐个说明,重点进行的分析对比。思维链(Chain of Thought,CoT)是一种推动人工智能模型进行复杂问题解决的方法。它通过引导模型逐步分解任务,像人类思考一样,进行逻辑推理和分析。传统的AI模型往往直接从输入得出输出,而思维链则鼓励模型在得出结论前,先列出一系列中间步骤或推理过程。这种方法不仅提高了模型的准确性,还增强了其对复杂问题的理解能力。例如,在解决数学问题时,思维链会让模型逐步展示计算步骤,而不是直接给出答案。这种方式类似于人类解决问题时的思维过程,有助于提高AI的透明度和可解释性。即使当前的大模型能力已经非常强大,思维链(Chain of Thought, CoT)仍然是一个重要的工具,原因如下:处理复杂任务:尽管大模型有强大的生成和理解能力,但在处理需要多步骤推理的复杂任务时,思维链可以帮助模型更系统地组织和解决问题。当然,workflow能也在一定程度上可满足该要求。提高准确性:思维链通过引导模型逐步分析和推理,有助于减少错误,特别是在涉及逻辑推理或多步骤计算的问题上。增强可解释性:思维链使得模型的决策过程更加透明,用户可以看到模型是如何一步步得出结论的,这对于提高用户对AI系统的信任至关重要。支持人机交互:在需要人机协作的场景中,思维链可以帮助人类理解模型的思维过 ...继续阅读 (55)


    love 0
    admin
    发表于
    2025-04-26 01:31:04

    解构 Google 的 A2A 协议及其和 MCP 的关系

    Google 在 2025 年 4 月 9 日发布了的一个重磅项目——Agent2Agent (A2A) 协议。这个协议旨在解决当前 AI Agent 生态中的一个核心痛点:不同厂商、不同框架下的智能体如何有效沟通与协作?让我们深入 A2A 的 GitHub 仓库,从代码和文档中一探究竟,并看看它与另一个备受关注的协议 MCP 有何异同。GitHub 地址:https://github.com/google/A2A首先,我们看看项目的代码结构(如下图所示):项目中有一个值得关注的文件:llms.txt。这是一种新兴的规范,我们先从它说起。llms.txt- 让大模型读懂你的项目根据llmstxt.org的定义,llms.txt文件是一种标准化的文本文件,旨在帮助大型语言模型(LLM)在推理时更好地理解和使用网站或项目的信息。它提供了一种机器可读且易于维护的方式,来声明服务的能力、接口规范、元数据等关键信息,有点像专为 LLM 设计的sitemap.xml,但内容更丰富、更聚焦。在 Google A2A 项目中,llms.txt文件扮演了以下角色:能力声明与接口说明书:详细描述了 A2A 协议的目标、核心功能、支持的接口、数据结构(如 AgentCard, Task, Message, Artifact)和交互方式。为开发者和自动化工具提供了权威、结构化的参考。示例与文档索引:指向项 ...继续阅读 (106)


    love 0
    bigwhite
    发表于
    2025-04-26 00:06:47

    【规律之手】资深码农都懂?软件工程中的13条“潜规则”定律

    本文永久链接– https://tonybai.com/2025/04/26/13-laws-of-software-engineering大家好,我是Tony Bai。做软件开发时间越长,越觉得背后似乎有只“无形的手”在影响着项目进度、团队协作、系统架构甚至技术决策。有些现象反复出现,从早期的一头雾水,到后来的似曾相识,再到最后的会心一笑(或许是苦笑),让人不得不感慨其中蕴含的某些“规律”。最近看到国外一位开发者ANTON ZAIDES总结了软件工程领域的13条“定律”。它们中有些广为人知,有些则相对小众,但都非常实用。它们虽然不像物理定律那样严格精确,但确实精准地捕捉到了我们日常工作中经常遇到的挑战和现象,堪称是工程师和管理者都应该了解的宝贵“经验法则”或“心智模型”。今天,就让我们一起来了解和学习一下这13条定律,看看它们是如何在我们身边运作的。注:下面文中各条定律的配图也借自ANTON ZAIDES的原文章。1. 帕金森定律 (Parkinson’s law)定律:工作会不断扩展,填满所有可用的时间 (Work expands to fill the available time.)(任务总能拖到最后期限前完成?)这是最著名的定律之一。简单说,如果你给一个任务设定了1周的期限,它很可能就会花掉1周;如果设定了2周,它就可能花掉2周。这常常被用来解释为 ...继续阅读 (78)


    love 0
    豌豆花下猫
    发表于
    2025-04-26 00:00:00

    Python 潮流周刊#99:如何在生产环境中运行 Python?

    本周刊由 Python猫 出品,精心筛选国内外的 250+ 信息源,为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景:帮助所有读者精进 Python 技术,并增长职业和副业的收入。分享了 12 篇文章,12 个开源项目,2 则音视频,2 则热门话题重要提示:本周刊即将迎来第 100 期,即日起续订或新订阅,可享受八折优惠,欢迎领取优惠券 —>https://www.xiaobot.net/coupon/d2c69b05-91b8-4e2b-b346-e7bc4dbc141a以下是本期摘要:🦄文章&教程① 如何在生产环境中运行 Python?② Browser Use 原理解析—为何一个小项目能融1700万美元?③ 2025 年 Django Admin 主题汇总④ 15,000 行验证过的密码学代码已合入 Python⑤ 不符合常规的__init__用法⑥ 先睹为快:Python 全新的 ASN.1 API⑦ 巧用 Python 正则表达式⑧ Python 的下一个重大事件⑨ 使用 copier 快速初始化 Python 项目⑩ ProcessThreadPoolExecutor:当 I/O 成为 CPU 密集型时⑪ 小白教程:LLM agent 实际就是图⑫ 万字长文:深度对话50位谷歌高管,揭秘谷歌的“AI追赶之路”🐿️项目&资源① dia: ...继续阅读 (92)


    love 0
    est
    发表于
    2025-04-25 23:49:00

    Windows 自动设置开机锁屏壁纸 V3

    之前也写过,Windows下自动设置墙纸V1,V2,今天发现两种方法都失效了。于是一气之下搞了个 Bing Image of the Day 版本的。保存为 change_wallpaper.bat 双击执行。加入自启动或者定时触发。@if (@X)==(@Y) @end /* set Win10 wallpaper to Bing Image of The Day. By est.im @echo off cscript //Nologo //U //E:JScript "%~F0" exit /b %errorlevel% */ function http_get(url){ var xhr = new ActiveXObject("MSXML2.XMLHTTP") xhr.open("GET", url, false) xhr.setRequestHeader("Accept-Encoding", "identity") xhr.send() return xhr } var rss_req = http_get('https://www.bing.com/HPImageArchive.aspx?format=rss&idx;=0&n;=1&mkt;=en-US') // WScript.Echo(rss_req.getAllResponseHeade ...继续阅读 (45)


    love 0
    lincyang
    发表于
    2025-04-25 21:30:00

    RK3588芯片NPU的使用:yolov8-pose例子图片检测在安卓系统部署与源码深度解析(rknn api)

    该方法对检测模型的输出进行后处理,包括 检测框解码、置信度过滤、非极大值抑制(NMS)以及关键点坐标映射,最终输出人体检测框和对应的关键点信息,封装在object_detect_result_list中。SDK支持的查询命令很多,具体参考官方文档:04_Rockchip_RKNPU_API_Reference_RKNNRT_V2.3.0_CN.pdf。:用于 RKNN_QUERY_IN_OUT_NUM 命令的返回结果,存储模型的输入/输出张量数量。没什么好说的,输入设置完毕后,执行模型推理。 ...继续阅读 (49)


    love 0
    Allen Hua
    发表于
    2025-04-25 17:18:00

    Windows 电脑使用 Obs Studio 录制各个网站视频/桌面画面教程

    我分享这个 flow 是因为我有分享视频中片段的需求,但是又不想用相机拍摄,相机拍摄效果可能也不好。下载下来再裁剪又太麻烦。尤其是我喜欢看车祸警示录,有时候看到某些事故非常搞笑,我就用这个手段录制下来,视频可能就10s,30s,然后再微信分享,就很 nice 了。如果是分享10min的完整视频那种,就不如直接贴链接,或者直接下载下来再分享,不需要使用本文方案进行录制。前言你是否会因为难以下载 YouTube, X(Twitter), 小红书, Instagram, 微博 之类的网站上的视频而发愁呢……虽然下载这些网站的视频大多都有在线工具或者命令行工具,可以在 GitHub 寻找。但是目前经过我的日常使用,小红书和微博上的视频资源不是很轻松就能下载下来,或者下载用时很久,还可能下载下来文件太大(比如下载时无法执行码率和分辨率),不利于再次分享。我为了解决这个问题,一开始使用了 NVIDIA Geforce Experience,但是这个只能录制屏幕的完整内容,如果想要录制屏幕当中的某一块区域,英伟达这个软件就不行了。于是转而使用 Obs Studio。下面这段介绍来自 DeepSeek V3OBS Studio(Open Broadcaster Software)是一款免费开源的跨平台直播和录屏软件,广泛用于游戏直播、教学演示、视频创作等场景。以下是其核心特点:1. 核心功能多场景 ...继续阅读 (52)


    love 0
    iefreer
    发表于
    2025-04-25 15:13:41

    stone 3d v3.3.0版本发布,含时间线和连接器等新功能

    新加了连接器(connects)系统,打开connector模块时,通过ctrl+click来连接场景实体,这使得在stone 3d中构建网络拓扑和仿真数据流变得容易。2.新加了度量(metrics)系统,通过scene对象检测器中的useMetrics属性来启用或禁用,启用时所选物体将显示三维度量数据。1.新加了时间线(timeline)编辑器,可以类似blender一样给对象制作动画。4.标签(Label)和注解(Annotation)组件重构和问题修复。5.添加了新的爆炸(explosion)组件。 ...继续阅读 (59)


    love 0
    青山
    发表于
    2025-04-25 14:56:45

    未曾踏足的小径

    今年除了入坑摄影圈,在此之前还入坑了骑行圈,虽然最初目的是将其作为上班的通勤工具,但在下班之余 RC100 便是放松自我的奇妙之物。下班稍早,天气正好,骑车前往公司附近的艾溪湖湿地公园,这里是众多跑步、骑行、摄影爱好者的聚集地,今天不是休息日,只有少数下班来此散步的人。穿的裤子比较宽大,为了防止裤脚卡到自行车,特意买了两条束脚绑带将裤脚固定住,这样骑行起来就方便许多,没有追求速度,我喜欢的是一边骑行一边欣赏两边的风景,观察路上的人。来过艾溪湖很多次,每次都有不同的目的,比如公司组织徒步,和女朋友散步,带着相机来记录风景,再或者像今天这样下班之后骑一会儿车,原本以为一样的风景来几次之后会变得乏味和无聊,但今天骑行时误入一条未曾踏足的小径,欣赏到从没见过的风景,对我来说也是一次有趣的体验。它始于一个分岔路口,一直往前延伸,便到了艾溪湖大桥底下,骑过去时看到许多在这里拍照的女生,因为在这个角度下和艾溪湖大桥拍照,正好可以将桥拱作为兔子耳朵,显得十分可爱,这里也成了一个著名的打卡点,匆匆骑过,在巨大的桥墩下面,十分开阔和安静,也是一处值得拍照的好地方,因为骑着车便没有停下来,继续往前,湖面上架起延绵不绝的木桥,与远处的夕阳交相辉映,很遗憾,又没有拍下来。从那条小径出来之后就是公路,沿着路往住的地方继续骑行,路上仍然在回忆刚刚看到的景色,如果当时没有选择右边的小径,还会不会有让人眼前一亮的风 ...继续阅读 (86)


    love 0
    Bruce
    发表于
    2025-04-25 14:56:45

    未曾踏足的小径

    今年除了入坑摄影圈,在此之前还入坑了骑行圈,虽然最初目的是将其作为上班的通勤工具,但在下班之余 RC100 便是放松自我的奇妙之物。下班稍早,天气正好,骑车前往公& ...继续阅读 (2)


    love 0
    Bruce
    发表于
    2025-04-25 14:56:45

    未曾踏足的小径

    今年除了入坑摄影圈,在此之前还入坑了骑行圈,虽然最初目的是将其作为上班的通勤工具,但在下班之余 RC100 便是放松自我的奇妙之物。下班稍早,天气正好,骑车前往公& ...继续阅读 (2)


    love 0
    青山
    发表于
    2025-04-25 14:56:45

    未曾踏足的小径

    今年除了入坑摄影圈,在此之前还入坑了骑行圈,虽然最初目的是将其作为上班的通勤工具,但在下班之余 RC100 便是放松自我的奇妙之物。下班稍早,天气正好,骑车前往公司附近的艾溪湖湿地公园,这里是众多跑步、骑行、摄影爱好者的聚集地,今天不是休息日,只有少数下班来此散步的人。穿的裤子比较宽大,为了防止裤脚卡到自行车,特意买了两条束脚绑带将裤脚固定住,这样骑行起来就方便许多,没有追求速度,我喜欢的是一边骑行一边欣赏两边的风景,观察路上的人。来过艾溪湖很多次,每次都有不同的目的,比如公司组织徒步,和女朋友散步,带着相机来记录风景,再或者像今天这样下班之后骑一会儿车,原本以为一样的风景来几次之后会变得乏味和无聊,但今天骑行时误入一条未曾踏足的小径,欣赏到从没见过的风景,对我来说也是一次有趣的体验。它始于一个分岔路口,一直往前延伸,便到了艾溪湖大桥底下,骑过去时看到许多在这里拍照的女生,因为在这个角度下和艾溪湖大桥拍照,正好可以将桥拱作为兔子耳朵,显得十分可爱,这里也成了一个著名的打卡点,匆匆骑过,在巨大的桥墩下面,十分开阔和安静,也是一处值得拍照的好地方,因为骑着车便没有停下来,继续往前,湖面上架起延绵不绝的木桥,与远处的夕阳交相辉映,很遗憾,又没有拍下来。从那条小径出来之后就是公路,沿着路往住的地方继续骑行,路上仍然在回忆刚刚看到的景色,如果当时没有选择右边的小径,还会不会有让人眼前一亮的风 ...继续阅读 (1)


    love 0
    青山
    发表于
    2025-04-25 14:56:45

    未曾踏足的小径

    今年除了入坑摄影圈,在此之前还入坑了骑行圈,虽然最初目的是将其作为上班的通勤工具,但在下班之余 RC100 便是放松自我的奇妙之物。下班稍早,天气正好,骑车前往公司附近的艾溪湖湿地公园,这里是众多跑步、骑行、摄影爱好者的聚集地,今天不是休息日,只有少数下班来此散步的人。穿的裤子比较宽大,为了防止裤脚卡到自行车,特意买了两条束脚绑带将裤脚固定住,这样骑行起来就方便许多,没有追求速度,我喜欢的是一边骑行一边欣赏两边的风景,观察路上的人。来过艾溪湖很多次,每次都有不同的目的,比如公司组织徒步,和女朋友散步,带着相机来记录风景,再或者像今天这样下班之后骑一会儿车,原本以为一样的风景来几次之后会变得乏味和无聊,但今天骑行时误入一条未曾踏足的小径,欣赏到从没见过的风景,对我来说也是一次有趣的体验。它始于一个分岔路口,一直往前延伸,便到了艾溪湖大桥底下,骑过去时看到许多在这里拍照的女生,因为在这个角度下和艾溪湖大桥拍照,正好可以将桥拱作为兔子耳朵,显得十分可爱,这里也成了一个著名的打卡点,匆匆骑过,在巨大的桥墩下面,十分开阔和安静,也是一处值得拍照的好地方,因为骑着车便没有停下来,继续往前,湖面上架起延绵不绝的木桥,与远处的夕阳交相辉映,很遗憾,又没有拍下来。从那条小径出来之后就是公路,沿着路往住的地方继续骑行,路上仍然在回忆刚刚看到的景色,如果当时没有选择右边的小径,还会不会有让人眼前一亮的风 ...继续阅读 (1)


    love 0
    Allen Hua
    发表于
    2025-04-25 13:40:00

    为typecho博客添加latex支持

    使用了这个插件:https://github.com/zyuzhi/MarkdownKatex-typecho,下载了v1.0.1,但是点击创建文章之后无法返回所有文章页面。另外博客首页也无法加载,禁用插件即恢复正常。懒的去追究原因了,索性不用插件改用其他方法。我家里的一台机器也部署了 typecho,同样都是 docker compose 部署的,和当前 typecho 实例的区别大概就是v1.2.0vsv1.2.1。家里机器上的 typecho 是 1.2.0,当前实例是 1.2.1,有可能是版本升级导致的原有插件失效,因为上述插件 GitHub 源代码是2018年左右最终打包到 release 发行的。在 typechov1.2.1实例上测试如下方法可以为 typecho 博客添加 latex 支持。方法参考:https://www.xrgzs.top/posts/typecho-use-mathjax-add-latex-support修改当前主题的 footer.php将以下代码添加到 footer.php关闭标签之前。我这个主题这个文件在components/footer.php。我上面参考的博客将这段脚本引用放在了 index.php,可能会引起 DOM 渲染紊乱,比如图片被拉长,主页 footer 在页面中间渲染。放在footer.php的前,此时 DOM 已解析完 ...继续阅读 (50)


    love 0
    宋星
    发表于
    2025-04-25 13:28:28

    破解B2B营销困局:2025年9大创新方法精准狙击目标客群

    在我的历次大课堂中,有不少B2B营销从业者,他们对于数字营销的困惑几乎都是相同的: 如何找到极为分散,而且身份各异的目标客群进行营销。 这就是B2B营销中的最难点。但,如果能够攻克这一步,找到这些人,剩下要做的,反而有很多办法了。 因此,这 […] ...继续阅读 (59)


    love 0
    Allen Hua
    发表于
    2025-04-25 13:15:11

    新能源汽车之纯电车使用交流慢充和直流快充的充电损耗对比

    以下是我和DeepSeek R1的对话USER新能源汽车使用7kW 交流慢充和外面的直流快充,哪个充电时损耗更高?7kW 交流慢充的电流大概30A,44度电池大概需要7个小时;使用外面直流快充桩,假如功率是70kW,充满需要1小时,但是充电电流最大180A左右。请计算一下哪种充电方式电损耗更多?ASSISTANT嗯,用户问的是新能源汽车用7kW的交流慢充和外面的直流快充,哪个充电时的损耗更高。需要比较两种充电方式的电损耗。首先,我得理清楚问题的各个参数和可能的损耗来源。 用户给出的数据是,7kW慢充电流约30A,44度电池需要7小时充满。而直流快充功率70kW,充满需要1小时,电流最大180A。用户希望计算哪种方式损耗更多。 首先,我需要明确充电损耗主要包括哪些部分。通常来说,充电损耗可能来自几个方面:充电桩本身的效率、线缆的电阻损耗、电池在充电过程中的热损耗,以及可能的转换损耗(比如交流转直流时的损耗)。 但这里可能需要简化问题,因为用户可能只关注其中一部分损耗,比如线损或者充电效率差异。但用户没有明确说明,可能需要自己做一些合理的假设。 首先,对于交流慢充,7kW的功率,电流30A,电压应该是220V左右(因为功率=电压×电流,7kW=7000W,7000/220≈31.8A,接近30A,可能实际电压更高或者电流略高)。而直流快充的话,70kW功率,电流180A,那电压 ...继续阅读 (54)


    love 0
    Oilbeater
    发表于
    2025-04-25 12:53:22

    如何超越 OpenShift

    OpenShift 作为容器平台的标杆产品,同时也是开源商业化的标杆,一直是被人试图追赶或者超越的对象。但是如果只是照着 OpenShift 的产品模仿,那么当追上 OpenShift 时只可能有一种情况,那就是 OpenShift 停止发展,过了一年后你终于追上了,然后会因同样原因被淘汰。那么有没有什么方法能够追上甚至超越 OpenShift 呢?我认为要从 OpenShift 本身商业模式的选择和技术路线上的选择入手,从他们在这种选择下不可避免的缺点入手,做出差异化,才有超越的可能。OpenShift 并不 OpenOpenShift 里的 Open 可能和 OpenAI 里的 Open 是同一个 Open。如果你尝试不通过 RedHat 的销售自己去部署一套 OpenShift 就会知道我在说什么了。OpenShift 的所有组件确实是开源的,但如果你是一个纯粹的社区用户会步步受挫。一个功能你可能找不到对应组件,找到组件可能找不到对应源码,找到源码又没有文档指导如何编译使用。这些现象在那些完全是 OpenShift 自己使用的组件里已经见怪不怪了。大概 OpenShift 这部分的社区只是对客户和合作伙伴开放的。而对于那些非 OpenShift 专属的组件,OpenShift 采取的策略会是一旦选择就大举投入,争取到对应组件的社区的主导权。所以会看到的一个现象是有些社区很出名 ...继续阅读 (58)


    love 0
    Oilbeater
    发表于
    2025-04-25 12:53:22

    DeepSeek MLA -- 为成本优化而生的注意力机制

    DeepSeek 第一次出名是因为 DeepSeek V2 做到了一百万 Token 只要 0.14 美元。同期的 GPT-4 是 30 美元,当时被认为极具性价比的 GPT-3.5 也要 1.5 美元。这个突破性价格的出现在国内引发了一轮价格战,大批大厂模型大幅降价甚至免费。然而和其他大厂烧钱补贴的逻辑不同,DeepSeek 是通过一系列的技术创新实现了成本数量级的下降。这篇文章就来介绍一下这背后最关键的一个技术创新 —— MLA(Multi-Head Latent Attention)。MLA 最本质的数学技巧并不复杂,论文里也是一段话就说完了,看完让人感叹竟然还有如此精妙的解法。但是由于和整个 Transformer 架构耦合会导致理解起来有些困难,我这里会尽量简化描述,哪怕你之前完全不了解 Transformer 应该也可以领会到这个方法的精妙。当然还是需要有一些线性代数的基础,如果你还记的一个形状为 5*4 的矩阵乘形状为 4*3 的矩阵,结果是一个形状为 5 * 3 的矩阵就可以继续了。KVCache大模型推理的成本的瓶颈在哪里?答案可能会出乎意料 —— 是显存。显卡有大量计算单元,而推理任务又是线性的一次只能出一个 Token,为了充分利用显卡的计算资源达到最大的吞吐,一般会同时运行尽可能多的生成任务。而每个任务在推理过程中都会占用大量显存,如果想运行尽可能多的任务就 ...继续阅读 (58)


    love 0
    Oilbeater
    发表于
    2025-04-25 12:53:22

    混乱的 Llama 4

    前段时间 Meta AI 的负责人离职让人怀疑 Llama 4 的进度出现了问题,结果没过两天 Meta 就发布了 Llama 4,似乎是为了打破传言。然而看完了现在已经公布的模型基础信息,我反而更觉得 Llama 项目内部已经极度混乱了。下面是我根据已有信息的分析,欢迎指正。模型基础信息Llama 这次正式发布了一个 109B 和 一个 400B 参数量的模型,以及一个未发布的 2T 参数量模型的信息,我把关键的架构信息汇总如下,以下信息均来自 Llama 自己的博客和 huggingface 模型页面:名称参数量激活参数量专家数上下文语料量GPU 时间Scout109B17B1610M40T5.0MMaverick400B17B128+11M22T2.38MBehemoth2T288B16---这里都不用再看模型的评分表现了,这几个模型架构方面的对比就能看出很多问题了。奇怪的 MoE 架构Llama 4 这次从 Dense 模型全面转向了 MoE,但是诡异的点在于他们三个模型采用了两套 MoE 架构。最大的 Behemoth 和最小的 Scout 采用的是传统的 MoE,专家数也是 16 这个传统认为比较常规的一个专家数量,而中间的那个 Maverick 采用的却是 DeepSeek MoE 提出的一个新的细粒度专家加共享专家的模型是个 128 专家加 1 共享专家的架构。一般 ...继续阅读 (60)


    love 0
    Oilbeater
    发表于
    2025-04-25 12:53:22

    DeepSeek MoE -- 创新型的 MoE 架构

    从 DeepSeek V3/R1 开始关注 DeepSeek 工作的人很容易认为 DeepSeek 大量的工作都是在工程上优化效率,但是回看 DeepSeek 过去一年的论文才会发现他们其实一直在模型架构和训练方法上做各种创新,而 V3 和 R1 只是在之前架构创新的基础上进行 Scale。DeepSeek MoE 这篇论文就介绍了 DeepSeek 在 MoE 架构上的主要创新,现在看上去也很有希望成为未来 MoE 架构的标准。MoE vs Dense先说一下 MoE 和传统的 Dense 架构的区别。早期的 LLM 基本都是 Dense 架构,也就是每生成一个 Token 需要激活所有的神经元参与计算,这种方式其实和人脑的思考方式是有很大区别的,人脑是不会任何问题都需要调动所有脑细胞的,如果这样的话人早就累死了。所以很自然的一个想法就是生成 Token 的时候不要再激活所有的神经元了,每次只激活和当前任务最相关的神经元,于是就有了 MoE(Mixture of Experts) 架构,把 LLM 里每一层的神经元分割成 N 个 Expert,通过 Router 去选择 K 个最相关的 Expert 激活。这个架构的好处就是在推理的时候不需要激活所有的神经元,计算量会大幅下降。在 DeepSeek MoE 前最常见的 8 选 2 模式下计算量可以下降到接近 Dense ...继续阅读 (60)


    love 0
    Oilbeater
    发表于
    2025-04-25 12:53:22

    从 DeepSeek LLM 到 DeepSeek R1 —— DeepSeek LLM

    最近找到了 DeepSeek 发表过的论文合集,包含了从 DeepSeek 第一版的 LLM 到最新的 R1 的演变过程。从当下的角度我们当然知道 DeepSeek R1 在模型能力上已经接近了业界最领先的水平,但他是如何一步步从一个在中国一开始都没有被重视的量化公司走到这里的其实更吸引我的注意。这个系列的博客我会从论文阅读的角度,试图去寻找他们一步步探索的轨迹,从论文的路径上来看就是 DeepSeek LLM -> DeepSeek MoE -> DeepSeek V2 -> DeepSeek V3 -> DeepSeek R1。在整理论文时我才发现,DeepSeek 第一篇对外发布的论文是在 2024 年的 1 月,当时他们刚发布第一版模型,即使在 AI 行业内也不被认为是个主要竞争者。然而仅仅一年后的 2025 年 1 月,就已经进化到了 R1 这种业界领先水平。都说 AI 一天,人间一年,但是当真看到人间一年的进展时,还是深深的被 DeepSeek 的速度所震撼。背景DeepSeek LLM 是 DeepSeek 开源的第一个 LLM,当时开源 LLM 里最受关注的是 LLaMA-2,很多模型也是基于它的架构和基础进行的。现在从后视的角度我们知道 DeepSeek 最终选择了和 LLaMA 这类 Dense 架构不同的 MoE 架构,但是在当时第一版的时候还是基本上照搬了 ...继续阅读 (54)


    love 0
    joomaen
    发表于
    2025-04-25 12:10:01

    为 Technitium DNS Server 开启 DoH3 和 DoQ 支持

    本文介绍了如何在Technitium DNS Server上启用DNS-over-QUIC协议,指出该协议在不同平台上的支持情况。Windows系统仅在Windows 11及Windows Server 2022上可用,而Linux系统需要安装libmsquic。对于Ubuntu 20.04用户,无法通过apt直接安装libmsquic,因此需从源码构建。文中提供了从微软软件存储库安装libmsquic的简便方法及其详细构建过程,包括克隆源码、安装依赖、构建及安装libmsquic的步骤。最后,用户需重启DNS服务并配置相关设置以启用必要功能。 ...继续阅读 (104)


    love 0
    春秋十二月
    发表于
    2025-04-25 11:05:00

    二元二次型的相似变换与正定性

    本文主要阐述用两种方法判断给定两个二元二次型是否相似,相似情况下的具体变换。相似变换如果确定了,也利于判断正定性,因为相似二次型的正定性相同基本定义 下述定义来自文献[1] 12.1节,有所扩展 变换求解 先来看运用解方程的方法 再来看用矩阵的观点方法,求解变换。这种方法更适合求解到对角型的变换 参考文献 [1] 华罗庚文集数论卷2 [2] 高等代数 丘维声春秋十二月2025-04-25 19:05发表评论 ...继续阅读 (56)


    love 0
    YY.K
    发表于
    2025-04-25 10:30:00

    Cloudpanel typecho nginx vhost 模板

    主要对usr和var目录的 php 和 sqlite 文件保护。把内容保存为/tmp/template.tpl 然后用clpctl 添加。 clpctl vhost-template:add --name='typecho' --file=/tmp/template.tpl#{"rootDirectory":"","phpVersion":"8.3"} server { listen 80; listen [::]:80; listen 443 quic; listen 443 ssl; listen [::]:443 quic; listen [::]:443 ssl; http2 on; http3 off; {{ssl_certificate_key}} {{ssl_certificate}} {{server_name}} {{root}} index index.php index.html; {{nginx_access_log}} {{nginx_error_log}} {{settings}} if ($scheme != "https") { rewrite ^ https://$host$request_uri permanent; } location ~ /.well-k ...继续阅读 (91)


    love 0
    xiaoz
    发表于
    2025-04-25 09:22:49

    用飞牛自建OneNav导航页,简单又高效的管理浏览器书签

    OneNav是由xiaoz开发的一款高效浏览器书签管理工具,可以将浏览器书签集中式管理,完美解决跨设备、跨平台、跨浏览器的同步与访问难题,一处部署、随处访问。OneNav提供多种安装方法,最常见的就是Docker部署,这篇文章分享下如何在飞牛NAS系统上搭建OneNav导航页,帮助你高效管理浏览器书 ...继续阅读 (77)


    love 0
    xiaoz
    发表于
    2025-04-25 08:24:54

    星际放映厅——靠谱稳定的ChatGPT Plus代充平台

    随着人工智能技术的飞速发展,ChatGPT已成为全球最受欢迎的AI工具。然而,国内用户在订阅ChatGPT Plus时,往往面临一个关键问题:如何支付ChatGPT Plus的订阅费用?特别是对于没有海外信用卡的用户来说,直接订阅ChatGPT Plus并不容易。许多国内用户正是因为缺乏海外信用卡, ...继续阅读 (64)


    love 0
    YY.K
    发表于
    2025-04-25 07:54:03

    新的时间同步方案

    deb系列apt update apt install systemd-timesyncd -y systemctl enable systemd-timesyncd.service --now systemctl status systemd-timesyncd.serviceRHEL系列dnf -y update dnf -y install systemd-timesyncd -y systemctl enable systemd-timesyncd.service --now systemctl status systemd-timesyncd.service ...继续阅读 (71)


    love 0
    清夏
    发表于
    2025-04-25 05:37:56

    1panel反向代理除白名单域名外禁止任何形式的加载-配置文件

    反向代理除白名单域名外禁止任何形式的加载-配置文件.设置好反向代理后,按照自己的情况修改如下代码,替换掉配置文件中反向代理防盗链的部分即可# 防盗链:只允许指定域名(a.com, b.com, c.com)加载资源,其他都返回 403 set $deny_hotlink 0; # 如果是静态资源,默认拒绝 if ($request_uri ~* "\.(js|css|png|jpg|jpeg|gif|ico|bmp|swf|eot|svg|ttf|woff|woff2)$") { set $deny_hotlink 1; } # 如果 Referer 是合法域名之一,则允许 if ($http_referer ~* "(a\.com|b\.com|c\.com)") { set $deny_hotlink 0; } # 如果没有 Referer,则拒绝 if ($http_referer = "") { set $deny_hotlink 1; } # 最后判断是否拒绝 if ($deny_hotlink = 1) { return 403; } ...继续阅读 (53)

上一页 87/4361 下一页
沪ICP备19023445号-2号
友情链接