IT博客汇
  • 首页
  • 精华
  • 技术
  • 设计
  • 资讯
  • 扯淡
  • 权利声明
  • 登录 注册

    love 0
    coder4
    发表于
    2025-07-04 09:49:58

    OpenWrt之虚拟机安装篇

    因为验证技术方案,需要用openwrt,记录下,部分参考自官方指南《OpenWrt on VirtualBox HowTo》 1 下载 官网下载固件,选择x64架构的ext4-combined,其他几个选项什么意思可以自己搜下,不再这里重复了 当前最新版本的链接是:https://downloads.openwrt.org/releases/24.10.2/targets/x86/64/openwrt-24.10.2-x86-64-generic-ext4-combined.img.gz 2 解压缩、扩容 解压缩 gunzip ./openwrt-24.10.2-x86-64-generic-ext4-combined.img.gz cp openwrt-24.10.2-x86-64-generic-ext4-combined.img openwrt.img 镜像文件扩容镜像文件 dd if=/dev/zero bs=1M count=1024 >> openwrt.img 扩容ext4分区,主要参考了这篇文章 sudo losetup -fP openwrt.img # find the loop path losetup .... /dev/loop39 0 0 0 0 /your_path/openwrt.img 0 512 # part fdisk /dev ...继续阅读 (26)


    love 0
    1link
    发表于
    2025-07-04 09:48:32

    2010 年写的 233 行 PHP 图床应用已经运行了 15 年 | a real programmer php imagebin

    文章作者从朋友手里接手了一个 233 行 PHP 代码的图床应用 imagebin(上传,缩略图,还带密码保护),实际上这 233 行还包括了 47 行的 changelog 注释,剩下的代码里包括了所有的业务逻辑,HTML / CSS 页面。 接手之后,作者尝试用 Go 重新编写,并且比较了 2... ...继续阅读 (32)


    love 0
    heiyeshuwu
    发表于
    2025-07-04 08:30:00

    不开会员,使用桌面软件访问全球顶级大模型!

    国内能够非常方便的使用国内的各个大模型产品(豆包、Deepseek等),但是受限于开通会员等因素,没办法直接体验测评海外各类优秀大模型(如ChatGPT/Gemini/Claude/Grok等),为了方便快速体验海外大模型,撰写本文。 ...继续阅读 (29)


    love 0
    qihang01
    发表于
    2025-07-04 07:16:44

    Linux系统下可视化管理工具Cockpit安装使用

    简单介绍 Cockpit是一款由红帽(Red Hat)开发的开源Linux服务器Web管理工具,通过可视化界面简化系统监控与管理操作,支持实时资源监控、服务管理、容器控制等功能,Cockpit设计为轻量级工具,适用于基础运维,适合单台主机使用。 官方网站 https://cockpit-project.org/ Cockpit的核心功能与特点‌‌ ‌1、系统监控‌ 实时查看CPU、内存、磁盘I/O及网络流量图表化数据 硬件信息展示(如PCI设备、存储分区详情) ‌2、管理工具‌ ‌服务管理‌:启停系统服务(如SSH、防火墙),查看日志 ‌用户与权限‌:管理账户、SSH密钥授权 ‌存储配置‌:支持LVM、文件系统挂载,磁盘空间可视化 ‌网络设置‌:配置网卡、防火墙规则(firewalld集成) ‌3、扩展支持‌ ‌容器管理‌:集成Podman/Docker(需安装cockpit-docker插件)‌ ‌虚拟机管理‌:通过cockpit-machines管理KVM虚拟机‌ ‌第三方插件‌:如存储管理(cockpit-storaged)、软件包更新(cockpit-packagekit) 4、Cockpit支持的操作系统: Red Hat 系列‌ CentOS 7 及更高版本 RHEL (Red Hat Enterprise Linux) 7 及更高版本 Fedora 21 及更高版本 ...继续阅读 (31)


    love 0
    xiaoz
    发表于
    2025-07-04 07:08:40

    英国公司注销流程

    2024年初,xiaoz分享了《关于注册英国公司那点事》,最开始我满心期待,以为可以在海外市场搞点事,也试着做了一些推广,结果搞了一年多毫无起色,最后不得不注销公司,也算是行成闭环了。为什么要注销英国公司下方整理了下我个人要注销英国公司的原因。目前海外业务未能成功开展每年需要承担英国公司地址费用每年 ...继续阅读 (30)


    love 0
    guntur
    发表于
    2025-07-04 07:07:23

    Software Defined Networking: Masa Depan Infrastruktur Jaringan

    Jakarta, cssmayo.com– Waktu saya pertama kali mendengar istilah “Software Defined Networking” beberapa tahun lalu, kesan pertama saya adalah: ini pasti cuma jargon marketing dari vendor besar. Tapi setelah ngobrol panjang dengan salah satu arsitek jaringan di pusat data pemerintah, saya sadar—SDN bukan gimmick. Ini revolusi.Software Defined Networking (SDN) adalah pendekatan baru dalam pengelolaan jaringan komputer yang memisahkancontrol planedandata plane. Kedengarannya teknis, ya? Mari saya bantu sederhanakan: control plane itu otaknya jaringan—bagian yang berpikir, memutuskan ke mana ...继续阅读 (27)


    love 0
    henryhu
    发表于
    2025-07-04 04:50:04

    尼亚加拉瀑布游记 – 第一天

    虽然我在纽约呆了那么些年,尼亚加拉瀑布倒是一直没去过……这次国庆假期,考虑去哪儿玩的时候太晚了…… 于是只能靠考虑考虑周围的地方,就盯上了大瀑布。这次到大瀑布是坐 JetBlue 的2902,抵达 BUF 之后就直接 Uber 到酒店了。到的时候已经十二点多了,所以接下来先找了个附近的饭店吃饭。这个叫 Donatello’s 的披萨店还不错,就是速度慢了点…… 价钱按景区来说也不算很离谱。随后就跑去了 Welcome Center。这里很坑的是有另一个也叫 Welcome Center 的地方,但其实是个第三方的(大瀑布是首个国家公园,当然是有官方的 Welcome Center 的……),幸好也没被坑,只是买了个冰箱贴而已。官方的 Welcome Center 给了个地图,顺便买了 Trolley 和风之洞穴的票。鉴于我买票的时候已经两点三刻,而那个洞穴看上去是很远的,于是我们决定改变原计划,直接坐 Trolley 去岛上,赶去洞穴(买的票是三点半的)。结果这个景区远比我想象的小…… Trolley 开了10分钟就到了洞穴,那时候才刚过三点……反正也知道了这个地方不大,我们就在到时间之前先去附近的瞭望台看了眼,后来才发现那其实就是 Luna Island。当面看大瀑布果然不一样…… 另外看的时候不知道为啥想到了黄果树瀑布,以及哪个大之类的问题…… 大瀑布水汽一直拍过来 ...继续阅读 (27)


    love 0
    csslayer
    发表于
    2025-07-04 04:42:07

    fcitx.org 的归乡记

    虽然本身是个让我开心的事情,这个故事本身其实回过头来想,有着诸多地欠缺考虑头脑一热的决定。因此主要的目的是给来者记录一些关于域名方面的教训。文中有一些相关人名隐去。Fcitx 3 和 4 的时代最早,这个域名是 Fcitx 最早的作者所有的,他把它也当作自己的 blog 来使用。后来我逐渐接手 Fcitx 的开发之后,约于 2012 年,我创建了自己的域名 fcitx-im.org,主要是 Fcitx 增加了很多国际化/可扩展相关的功能,因此想要维护一个 Wiki 的网站,然而我也不好意思直接向 Yuking 要求把域名拿过来,所以才选择自己管理一个域名。但是由于 DBus 相关的事情实现得更早,DBus 服务本身采用的是基于 fcitx.org 的Reverse DNS。这也一定程度挖下了个坑。在 2012 年 fcitx.org 也更改为重定向到 fcitx-im.org,当然此时域名的所有权并没改变。现在想来脸皮还是应该厚一些把域名要过来,对项目本身更加有利。没有什么是永恒的2017 年,fcitx.org 变成了一个澳门赌场网站…可能是因为没有续费或者什么原因,但总之 fcitx.org 和 fcitx 项目本身分道扬镳了。https://web.archive.org/web/20171102052851/http://www.fcitx.org域名这种东西就是这样,如果 ...继续阅读 (36)


    love 0
    Hendra Brown
    发表于
    2025-07-04 04:40:14

    Reinforcement Learning: Teknologi AI yang Cara Industri Bekerja

    Jakarta,cssmayo.com– Bayangkan kamu sedang belajar naik sepeda. Di awal, kamu mungkin jatuh. Tapi setelah beberapa kali mencoba, kamu tahu kapan harus mengayuh, kapan harus menyeimbangkan tubuh. Kamu belajar—bukan dari teori, tapi dari pengalaman.Nah, prinsip itulah yang menjadi dasar dariReinforcement Learning(RL).RL adalah salah satu cabang dari kecerdasan buatan (AI) yang memungkinkan mesin atau agen untuk belajar lewat percobaan dan kesalahan. Jadi, alih-alih diberi tahu apa yang harus dilakukan (seperti pada supervised learning), agen dalam RL belajar dengan cara bereksperimen langs ...继续阅读 (26)


    love 0
    张 鑫旭
    发表于
    2025-07-04 03:03:45

    好诶,select下拉框元素支持样式完全自定义啦!

    byzhangxinxufromhttps://www.zhangxinxu.com/wordpress/?p=11746本文可全文转载,但需要保留原作者、出处以及文中链接,AI抓取保留原文地址,任何网站均可摘要聚合,商用请联系授权。Tips:演示页面在本文最后。一、appearance:base-select下拉框元素现在已经支持完全自定义了,太不容易了,太感动了。LuLu UI的Edge主题的Select组件现在已经接入了这个新特性。如果你的浏览器是Chrome 135+,可以访问这里体验一下。如何实现?为了不影响之前的Web效果,select下拉框的自定义需要设置新的属性值才可以。下拉框元素分为两部分,一个是按钮部分,一个是下拉部分。这两部分的自定义都需要额外的设置。其中按钮部分若想完全自定义,使用下面的CSS代码:select { appearance: base-select; }若想下拉部分的样式可以自定义,则需要使用::picker()伪元素函数设置:::picker(select) { appearance: base-select; }如果希望通过类名设置,例如:则:.ui-select, .ui-select::picker(select) { appearance: base-select; }实时渲染效果如下所示:请选择:选项1选项2选项3选项4 ...继续阅读 (29)


    love 0
    admin
    发表于
    2025-07-04 01:19:31

    云数据库行业动态@2025-07-04

    标题:华为云HDC发布TaurusDB PostgreSQL版;IDC报告发布阿里云数据库第一,华为云本地部署第一;OceanBase发布中文名“海扬数据库”重要更新华为云HDC大会,数据库发布:GaussDB Doer 基于AI的智能助手; TaurusDB for PostgreSQL 全新引擎于正式发布; GaussDB 透明多写功能发布[31]。IvorySQL 2025 生态大会暨 PostgreSQL 高峰论坛于6月27日—28日在济南成功举办。本次盛会汇聚了包括开源基金会/社区负责人、PostgreSQL国内外资深开发者、企业代表及资深开发者。[1]OceanBase CEO 杨冰全新发布 OceanBase 品牌中文名——“海扬数据库”。[2]IDC 2024下半年中国关系型数据库市场报告:阿里云数据库整体、公共云第一[15];华为云数据库本地部署市场份额第一![3];腾讯云增速第一[11]。今日,SIGMOD行业学术会议上:阿里云PolarDB数据库蝉联SIGMOD最佳论文奖[12];华为多篇论文成功入选,GaussDB同步亮相[19]。PingCAP 荣登 2025 AI Cloud 100 China 榜单,排名第四![22]更新详情RDS PostgreSQL Serverless极致弹性免费体验功能发布,在瑶池数据库解决方案体验馆中,您无需购买任何资源,即 ...继续阅读 (31)


    love 0
    阮一峰
    发表于
    2025-07-04 01:08:44

    科技爱好者周刊(第 355 期):两本《芯片战争》

    这里记录每周值得分享的科技内容,周五发布。本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。封面图重庆某消防站,改造成赛博朋克风格,霓虹灯都是一些防火标语。网上走红以后,该装饰现已被拆。(via)两本《芯片战争》前些日子,我想找芯片知识的书籍,想起有一本很有名的畅销书,叫做《芯片战争》。搜索发现,《芯片战争》居然不止一本,而有两本书都叫这个名字。《芯片战争》,余盛(华中科技大学出版社,2022)《芯片战争》,[美]克里斯·米勒(浙江人民出版社,2023)一本是中国人写的,另一本是美国人写的。我都读了,下面就是简单的读后感。为了便于区分,我把中国人写的那本称为"国人版",美国人那本称为"老美版"。这两本书的内容,都是芯片行业的发展史。读完以后,我的最大感受是,它们可以帮你了解芯片历史,但是帮不了你了解芯片知识。因为它们不是科普图书,更不是技术图书,而是经管图书。我有点后悔,没查一下作者背景。读了才发现,这两个作者,都不是芯片行业人士,甚至不是科技从业者。国人版的作者是会计系毕业,后来在食品公司工作,他的上一本书写的是粮油贸易。老美版的作者是政治系毕业,现在是大学教授,专门研究地缘政治,上一本书写的是俄罗斯历史。可想而知,这样的作者写芯片行业,不会有深入浅出的技术分析,只会关注商业经营层面。事实上,国人版的内容 ...继续阅读 (29)


    love 0
    bigwhite
    发表于
    2025-07-04 00:14:09

    Twitch工程师的Go进阶之路:为何你写的Go代码,总感觉“不对劲”?

    本文永久链接– https://tonybai.com/2025/07/04/everything-i-did-to-become-an-expert-in-golang大家好,我是Tony Bai。你是否也有过这样的时刻?你已经用 Go 写了不少代码,项目也能跑起来,但内心深处总有一种挥之不去的“别扭感”。你写的 Go 代码,看起来更像是“带有 Go 语法的 Java/Python”,充斥着你从旧语言带来的思维习惯。代码或许能工作,但它不优雅,不简洁,总感觉“不对劲”。最近,Twitch 的一位资深机器学习工程师 Melkey 分享了他从 Go 小白成长为生产级系统开发者的心路历程。他的故事,完美地诠释了如何突破这个瓶颈,完成从“会写”到“写好”Go 的关键一跃。在这篇文章中,我们就来解读一下这位工程师的Go专家之路,看看从中可以借鉴到哪些有意义的方法。从“被迫营业”到“感觉不对”的困境和许多人一样,Melkey 开始学习 Go 并非出于热爱,而是因为工作的“逼迫”。2021年,当他以初级工程师的身份加入 Twitch 时,他还是一个习惯于用 Python 写脚本的“简单小子”,对 Go 一无所知。为了保住这份改变人生的工作,他别无选择,只能硬着头皮学下去。很快,他熟悉了指针、静态类型和 Go 的基本语法。但问题也随之而来:他感觉自己的 Go 水平停滞不前,写出的代码 ...继续阅读 (34)


    love 0
    Andre Lewis
    发表于
    2025-07-03 23:40:20

    Chip Neural AI: Revolusi Otak Buatan di Era Digital

    JAKARTA, cssmayo.com–Chip Neural AImerupakan sebuah terobosan teknologi yang menggabungkan kekuatan kecerdasan buatan (AI) dengan desain sirkuit otak manusia. Sederhananya, chip ini berfungsi sebagai “otak buatan” yang dirancang untuk meniru cara kerja neuron biologis. Oleh karena itu, teknologi ini sangat menjanjikan di berbagai bidang, mulai dari kesehatan, komunikasi, hingga pertahanan.Perkembangan Teknologi Chip AITechnoDalam beberapa tahun terakhir, perkembangan teknologi chip AI meningkat sangat pesat. Banyak perusahaan raksasa sepertiTesla,IBM,Intel, hinggaNeuralinkyang berlomba-l ...继续阅读 (28)


    love 0
    cheungmine
    发表于
    2025-07-03 23:22:25

    Windows 上使用 vscode + mingw 调试 python 程序

    假设要激活的虚拟环境为:pytorch_env。安装到:C:\DEVPACK\msys64。创建py虚拟环境:pytorch_env。launch.json 完整内容。 ...继续阅读 (5)


    love 0
    二丫讲梵
    发表于
    2025-07-03 22:03:48

    学习周刊-总第218期-2025年第27周

    如要阅读全文,点击标题跳转。 学习周刊 - 总第 218 期 | wordZero | kargo | kruise | billd-desk | subway | go-rag | Paper ...继续阅读 (41)


    love 0
    Putri Siapah
    发表于
    2025-07-03 21:24:56

    Drawing Tablet: Kreativitas Bebas Tanpa Batas!

    cssmayo.com–   Dalam dunia digital yang terus berkembang,Drawing Tablettelah menjadi alat revolusioner bagi para seniman, desainer grafis, dan profesional kreatif lainnya. Teknologi ini menawarkan cara yang lebih natural dan efisien untuk menuangkan ide ke dalam bentuk visual.Apa Itu Drawing Tablet?Drawing Tablet, atau yang juga dikenal sebagai pen tablet, adalah perangkat input yang memungkinkan pengguna menggambar langsung ke dalam komputer menggunakan stylus. Tidak seperti mouse biasa, stylus ini memberikan kontrol yang lebih presisi dan responsif terhadap tekanan.Manfaat Utama Bagi K ...继续阅读 (27)


    love 0
    siti
    发表于
    2025-07-03 18:18:43

    Pemanas Air: Pengalaman & Tips Pilih Water Heater

    JAKARTA, cssmayo.com –Halo, guys! Gue mau cerita soalpemanas air– masalah klasik tapi penting banget buat kehidupan sehari-hari. Punya water heater di rumah tuh kayak upgrade ke Technolife: bangun pagi nggak lagi drama kedinginan, mandi jadi mood booster. Tapi… pernah nggak sih loe ngalamin salah beli atau pasang pemanas air? Percaya deh, dampaknya itu nggak main-main. Gue sendiri udah pernah ngerasain, dan di blog kali ini, gue bakal sharing pengalaman, tips beneran, sampe ‘dosa-dosa’ gue waktu awal pake pemanas air. Yuk, simak sampe habis!Kenapa Pemanas Air Itu Game Changer Bange ...继续阅读 (28)


    love 0
    Denis | 邓鸿华
    发表于
    2025-07-03 15:48:47

    WPJAM「分类管理」:全能 WordPress 分类管理插件

    WordPress 默认的分类管理只能设置父级和修改描述,然后好像基本没有什么别的功能了,对了 WPJAM Basic 可以在「缩略图设置」中可以设置分类缩略图:然后其他的分类层级,排序,首页的文章是否可以设置哪些分类的文章啊等,这些常用的功能,通通都没有。所以我基于给客户做项目的这些年的积累,把分类相关的功能统一整个到一个插件,名字也是简单的叫做 WPJAM「分类管理」,总之这是一个全能的分类管理插件,以后如果还有分类相关的功能也会整合到该插件中。插件设置插件安装激活之后,在后台「WPJAM」主菜单下就会出现「分类管理」子菜单,点击进去就是该插件的设置页面:从设置界面也可以看出该插件的主要功能有分类层级,拖动排序,后台列表分类过滤,设置分类的链接为数字固定链接,最后可以设置首页的文章通过哪些分类过滤。设置界面也提供了让你开启或者关闭某个功能的能力。😊所以记得如果下面的任何功能,你没有的话,可能就是某个功能你没有开启,记得来这里看一下,然后开启即可。一、层式管理分类WordPress 默认对分类的排序真的是太弱了,仅支持通过代码的方式使用 ID,使用数量(count),名称(name),别名(slug)等字段进行排序,都没有提供自定义分类的方法,更别提拖动排序。另外由于 WordPress 的分类是层级的,在多层情况下怎么实现拖动排序?在分类层级非常复杂的情况下,怎么方便管理和排序 ...继续阅读 (29)


    love 0
    Conan Zhang
    发表于
    2025-07-03 13:26:30

    用R语言实现方差分析ANOVA

    R的极客理想系列文章,涵盖了R的思想,使用,工具,创新等的一系列要点,以我个人的学习和体验去诠释R的强大。 R语言作为统计学一门语言,一直在小众领域闪耀着光芒。直到大数据的爆发,R语言变成了一门炙手可热的数据分析的利器。随着越来越多的工程背景的人的加入,R语言的社区在迅速扩大成长。现在已不仅仅是统计领域,教育,银行,电商,互联网….都在使用R语言。 要成为有理想的极客,我们不能停留在语法上,要掌握牢固的数学,概率,统计知识,同时还要有创新精神,把R语言发挥到各个领域。让我们一起动起来吧,开始R的极客理想。 关于作者: 张丹,分析师/程序员/Quant: R,Java,Nodejs blog: http://blog.fens.me email: bsspirit@gmail.com 转载请注明出处: http://blog.fens.me/r-stat-anova/ 前言 方差分析是一种基本统计学方法,在众多领域都有非常广泛的应用,比如评估不同药物的疗效,不同的广告策略的效果。 大模型的时代,是否能用方差分析,判断大模型结论与实际结论,是否有显著性差异,那么就能够快速验证大模型的是否产生了幻觉,以此来对大模型进行改进。 目录 方差分析介绍 用R语言方差分析aov()函数 用R语言方进行方差分析 1. 方差分析介绍 方差分析(Analysis of Variance,简称ANOVA) ...继续阅读 (33)


    love 0
    1link
    发表于
    2025-07-03 12:36:48

    这个工具可以帮你打击技术面试作弊 | beat cluely beat cheating in tech interview

    Cluely 是一个设计用来帮你作弊的 AI,我在公众号上写了一篇文章来专门介绍它,你可以移步观看。 而这个工具起名叫做 beatcluely 就是为了防止有人用 Cluely 等类似 AI 在技术面试中作弊。 它的原理是基于目标职位和你真正想问的问题,让 AI 进行加工,生成一个新问题,这个新... ...继续阅读 (31)


    love 0
    nokiaguy
    发表于
    2025-07-03 11:03:51

    【人工智能】DeepSeek的AI实验室:解锁大语言模型的未来

    DeepSeek作为中国AI领域的先锋,以其开源大语言模型(LLM)DeepSeek-V3和DeepSeek-R1在全球AI研究中掀起波澜。本文深入探讨DeepSeek AI实验室在模型架构、训练策略、硬件优化及开源生态方面的创新,揭示其如何以低成本实现媲美顶级闭源模型的性能。文章结合代码示例和数学公式,详细分析DeepSeek的混合专家模型(MoE)、多头潜在注意力(MLA)、多标记预测(MTP)等技术,辅以强化学习(RL)和监督微调(SFT)的实现细节。通过对DeepSeek-V3和R1的性能评估与实际 ...继续阅读 (7)


    love 0
    张善友
    发表于
    2025-07-03 09:53:00

    C# 的深度强化学习框架RL_Matrix - 张善友

    【摘要】一、RL_Matrix 项目概述RL_Matrix 是一个专为 .NET 开发者设计的强化学习框架,使用 TorchSharp(.NET 版的 PyTorch)作为后端,提供类型安全、高性能的环境,支持开发和部署强化学习解决方案。核心特点包括: 算法支持:涵盖 DQN、PPO 及其变体(如 1D 全阅读全文 ...继续阅读 (28)


    love 0
    nokiaguy
    发表于
    2025-07-03 09:34:29

    【人工智能】 AI的进化之路:大模型如何重塑技术格局

    本文深入探讨了人工智能大模型的进化历程及其对技术格局的深远影响。从早期神经网络到现代大模型的突破,文章分析了关键技术进步,如Transformer架构、预训练机制和分布式计算。结合数学公式和代码示例,详细阐述了大模型的训练原理、优化方法及实际应用场景。文章还展示了如何使用Python和PyTorch实现简单的大模型组件,并展望了AI未来的发展方向。本文旨在为技术爱好者和开发者提供全面的参考,揭示大模型如何改变游戏规则。 ...继续阅读 (7)


    love 0
    52nlp
    发表于
    2025-07-03 09:14:03

    MiniMax-M1:闪电注意力重塑大模型推理效率,百万上下文时代来临,附技术报告英中对照版

    一、核心创新:闪电注意力 + 混合架构1. 闪电注意力(Lightning Attention)问题根源:传统Transformer的Softmax注意力存在O(n²)计算复杂度,限制长文本处理能力(如DeepSeek-R1仅支持128K上下文)。解决方案:采用线性注意力变体(Qin et al.),通过核函数近似Softmax,将复杂度降至O(n)。I/O感知优化:减少GPU内存读写次数,实测生成100K token的FLOPs仅为DeepSeek-R1的25%。效果:原生支持1M token输入(8倍于DeepSeek-R1)输出长度扩展至80K token(超越Gemini 2.5 Pro的64K)2. 混合专家架构(MoE-Hybrid)设计:每7个闪电注意力层 + 1个Softmax注意力层(共456B参数,激活45.9B/Token)优势:保留局部感知能力(Softmax层)的同时,实现长序列高效处理。通过四阶段平滑扩展策略(32K→1M),解决训练中梯度爆炸问题。二、训练革命:CISPO算法 + 高效RL框架1. CISPO:重新定义RL训练稳定性传统RL痛点:PPO/GRPO裁剪Token更新会抑制关键推理Token(如“However”、“Recheck”),阻碍复杂推理行为涌现。创新方案:裁剪重要性采样权重而非Token更新(公式4-5),保留所有Token的梯 ...继续阅读 (27)


    love 0
    autopost
    发表于
    2025-07-03 05:00:03

    65亿美元豪赌,OpenAI掀起掌心智能革命

    你对AI的认知是否还停留在云端的“隔空对话”?事实上一场将智能攥在掌心的革命在OpenAI豪掷65亿美元收购苹果传奇设计师Jony lve的io公司之后已悄然爆发。关于“智能设备该如何存在”的认知颠覆也在席卷整个AI行业,今天就来聊聊这场从“云上”到“掌心”的AI革命。下载虎嗅APP,第一时间获取深度独到的商业科技资讯,连接更多创新人群与线下活动本文转载自http://www.huxiu.com/article/4512291.html?f=wangzhan文章评分1次,平均分5.0:★★★★★ ...继续阅读 (26)


    love 0
    bigwhite
    发表于
    2025-07-03 04:06:39

    Go考古:创始人亲述Go语言的“创世纪”

    本文永久链接– https://tonybai.com/2025/07/03/meet-the-go-team-2012大家好,我是Tony Bai。2012 年,Google I/O 大会的舞台上,一个刚刚发布 1.0 版本的编程语言团队,正襟危坐。他们面对着全球开发者的审视和提问,这其中,就有三位图灵奖得主级别的传奇人物:Ken Thompson、Rob Pike 和 Robert Griesemer。那一年,Go 1.0 的发布,是一个历史性的里程碑。它意味着一个承诺“向后兼容、稳定可靠”的 Go 语言,正式诞生。今天,就让我们扮演一次“Go 语言考古学家”,拂去时间的尘埃,回到那个被称为“创世纪”的时刻,重温 Go Team 核心成员们的亲口讲述,探寻这门语言最纯粹的初心和设计哲学。我们为何创造 Go?—— “厌倦了等待 C++ 编译”在访谈中,当被问及创造 Go 的初衷时,Rob Pike 给出了一个近乎“玩笑”却又无比真实的答案:“我们厌倦了等待 C++ 的编译。”他生动地描绘了当时在 Google 内部的日常:为了构建一个巨大的 C++ 二进制文件,团队成员不得不在庞大的计算集群上等待超过一个小时。更令人抓狂的是失控的依赖管理。Rob Pike 提到,他的同事 Mike Burrows(Chubby 的作者)在一次漫长的编译中发现,一个他从未听说过的、与项 ...继续阅读 (28)


    love 0
    1link
    发表于
    2025-07-03 02:13:34

    用 Asciiart 画出今天的月相 | arsciiart moon calendar

    这个网站用 Ascii art 来画出今天的月相,代码开源。 你还可以切换日期,来看之前和之后的日期对应的 asciiart 的月相。 此外还发现一个更加详细专业的月相网站,提供了更多关于月相的信息以及一个月相日历。 ascii art 月相网站:https://asciimoon.com/ ... ...继续阅读 (32)


    love 0
    admin
    发表于
    2025-07-03 01:50:30

    为什么90%的空降技术管理者都在做同一件事?

    最近和几个做技术管理的朋友小聚,聊到曾经各自入职后的第一个月在干什么,答案出奇的一致。「盘家底。」「梳理资产。」「摸排现状。」说法不同,但干的都是同一件事——技术资产盘点。这些朋友有从大厂跳到创业公司的,有从创业公司到大厂的,有接手十几人团队的,也有管上百号人的。按理说,不同规模、不同阶段的公司,管理重点应该不一样吧?但为什么大家不约而同都在做技术资产盘点?这事儿其实跟公司大小没关系,跟一个更本质的东西有关——手感。什么是手感做技术管理,手感是个很玄妙的东西。举个例子: 团队和你汇报一个系统改造方案,说要花 3 个月,投入 10 个人。你如果此时心里犯嘀咕:这个时间是长还是短?人力是多还是少?如果你没有手感,你大概率会说:”方案不错,但能不能再优化一下时间?”如果团队回复:”已经是最优方案了。”然后呢?然后就只能批准了。或者再想其它办法来核实,但心里始终不踏实或者耗费时间。这就是没有手感的典型表现。手感是什么?是一种基于深度理解的直觉判断力。有手感的状态大概这样的:听到「数据库 CPU 占用 80%」,马上能判断是 SQL 问题还是数据量问题看到「服务器 500 台」,立刻知道是不是合理规模团队说「这个需求要一个月」,心里有数是真需要还是在放水出现故障时,能快速圈定问题范围,而不是干着急而没有手感的管理者呢?就像在迷雾中开车,处处都是 ...继续阅读 (39)


    love 0
    xiaoz
    发表于
    2025-07-03 01:22:43

    多功能文件分享程序Zdir 4.6.0发布,新增网盘挂载

    Zdir是一款使用Golang + Vue3开发的多功能私有存储程序,集成了文件索引、在线预览和分享功能,支持WebDAV和离线下载,非常适合安装在NAS设备或大容量VPS上,是个人、工作室和小团队分享文件的理想选择。演示演示地址:https://demo.zdir.pro/ (国外服务器)用户名: ...继续阅读 (27)

上一页 45/4360 下一页
沪ICP备19023445号-2号
友情链接