IT博客汇
  • 首页
  • 精华
  • 技术
  • 设计
  • 资讯
  • 扯淡
  • 权利声明
  • 登录 注册

    love 0
    于良永(良缘)
    发表于
    2025-02-02 00:00:00

    Range-Prefix Skip Scan介绍

    背景在 MySQL 中,当我们访问一个表时,有两种主要的数据访问方式:全表扫描(Full Table Scan)和索引扫描。索引扫描又可以分为全索引扫描(Index Scan)和范围索引扫描(Range Scan)。一般而言,范围索引扫描的效率高于全索引扫描,而全索引扫描的效率又高于全表扫描。当查询的 WHERE 条件中包含索引列的范围条件时,我们可以利用这些条件进行范围扫描,从而减少扫描次数。然而,并不是所有索引列的范围条件都能有效地利用范围扫描,尤其是在复合索引的情况下。示例分析:我们创建了一个表,有6列数据(为a, b, c, d, e, f),其中前5列组成一个复合索引。Case 1: Full Table Scan对上述table进行如下查询:select a,b,c,d,e,f from ss limit 10;得到的EXPLAIN计划如下:这个例子中我们访问了所有列,因此Mysql优化器选择了Full Table Scan的方式进行查询。Case 2: Index Scan将查询换成如下形式:select a,b,c,d,e from ss limit 10;得到的EXPLAIN计划如下:由于我们没有扫描f列,直接扫描索引即可获得查询所需的全部数据。因此优化器选择了index scan,即全索引扫描。Case 3: Range Scan将查询继续换成如下形式:sele ...继续阅读 (34)


    love 0
    Tw93 Blog
    发表于
    2025-02-02 00:00:00

    2024 年总结 - 持续迭代

    又是一年时间过起来真快,转眼就大年初五了,习惯在春节不忙的日子来记录下过去一年发生的事情,这一年的关键词我想应该是「持续迭代」。越来越发觉每个人最重要的作品其实是自己,你的人生经历、性格三观、做事技能构成了这个作品本身,作品需要持续迭代着,打算用这个总结来备份一下 2024,开启 2025 新版本。生命的迭代有了女儿之后,你不知道我每天有多幸福 ❤️。今年最大的幸福就是有了一个香香的女儿,取名汤明悦,希望她做个光明快乐的人。10 月 2 日出生,到现在 4 个月的样子了,不哭闹,很是乖巧爱笑,陪伴着一天天长大,让我的生活多彩了许多,期间我也学会了哄娃、换尿布、泡奶喂奶,甚至独立给宝宝洗澡,有时虽然累困,不过每次她对我一笑,我那鸡血就被打得满满的。育儿观上,尽可能给宝宝提供一个安全/健康/不卷的生活环境,给到她无条件的爱、让她有自我认同感,有自己的价值观和信仰,鼓励她学习各种知识和保持好奇的心态。今年最应该感谢我的爱人,从怀胎十月的辛苦到养娃过程中无条件的付出,很是细心和耐心。生活的迭代让生活保持新鲜感的秘诀就是,多去做没有做过的事情 🤹 。有没有发现,在疫情后这几年日子过得越来越快了,或许也不是疫情的缘故。我想是随着年龄的增大,经历的东西多了,一年的相对长度会逐步变短,好比 5 岁时候的一年经历的是人生的 1/5,到处都是新鲜好奇的玩意,但是到了 30 岁的时候,一年相当于是人生的 ...继续阅读 (44)


    love 0
    Yiran\'s Blog
    发表于
    2025-02-02 00:00:00

    Weekly Issue-喜迎春节

    文章链接到标题技术链接到标题Avoiding complexity with systemd | Michael Macleansystemd socket activation | Michael Maclean关于 [[systemd]] socket activation 的一些说明。2025 年了,很多服务默认都不需要(应该)enable service 了,比如sshd.service,docker.service,而是应该 enable socket:sshd.socket,docker.socket,可以保证只有在请求真正到达时才会启动服务,可以减少系统启动时间。deepseek 600 万美元的训练成本到底是啥?真相已经不再重要,屁股决定脑袋舆论演化到 c 之后,各种人士都下场了,从地缘政治到两国教育、产业发展路线、企业管理思路,啥人都可以来就这个话题说两句。但已经没人关心 deepseek 最初始的表达到底是什么了,他们在辩论的是自己心中的那个靶子。AI 学术界和产业界的领袖在这个阶段还在试图给公众舆论解释,但缺乏有力的表达,并且后期明显泄气以及参杂进各自的利益考虑,甚至有的人开始迎合这种叙事去达成自己的目的。How I Use AI: Meet My Promptly Hired Model Intern | Armin Ronacher’s Tho ...继续阅读 (55)


    love 0
    est
    发表于
    2025-02-01 22:30:49

    为什么要学习英语

    HN上看到一个ISBN可视化项目:https://phiresky.github.io/blog/2025/visualizing-all-books-in-isbn-space/截图:这,可能就是为啥要学习英语吧。第一排左1、左2,第二排右2是出版的英语书籍,右三是简中。人类的大部分知识还是英语写的。这优势还是太大了。这个可视化的发起者是 Anna’s Archive,优胜者获奖 $10,000,截止日期2025-01-31,旨在收集整理全人类有ISBN编号的书籍。 ...继续阅读 (41)


    love 0
    smallnest
    发表于
    2025-02-01 15:45:58

    啥时候等到Go官方支持SIMD?

    单指令多数据流(SIMD,Single Instruction Multiple Data)是一种并行计算技术,允许一条指令同时处理多个数据点。SIMD在现代CPU中广泛应用,能够显著提升计算密集型任务的性能,如图像处理、机器学习、科学计算等。随着Go语言在高性能计算领域的应用逐渐增多,SIMD支持成为了开发者关注的焦点。当前很多主流和新型的语言都有相应的simd库了,比如C++、Rust、Zig等,但Go语言的simd官方支持还一直在讨论中(issue#67520)。Go语言的设计目标是简单性和可移植性,而SIMD的实现通常需要针对不同的硬件架构进行优化,这与Go的设计目标存在一定冲突。因此,Go语言对SIMD的支持一直备受争议。最近几周这个issue的讨论有活跃起来, 希望能快点支持。1. Go语言与SIMD的背景1.1 Go语言的性能追求Go语言以其简洁的语法、高效的并发模型和快速的编译速度赢得了广泛的应用。然而,Go在性能优化方面一直面临挑战,尤其是在需要处理大量数据的场景下。SIMD作为一种高效的并行计算技术,能够显著提升计算性能,因此Go社区对SIMD的支持呼声日益高涨。如果没有 SIMD,我们就会错过很多潜在的优化。以下是可以提高日常生活场景中性能的具体事项的非详尽列表:simdjson通过矢量化每秒解码数十亿个整数矢量化和性能可移植的快速排序Hyperscan 简介 ...继续阅读 (37)


    love 0
    二丫讲梵
    发表于
    2025-02-01 15:22:44

    我的2024年

    如要阅读全文,点击标题跳转。我的2024年年终总结。时光荏苒,眨眼之间,人间的 2024 年就已过去,我也走过了个人在二十这个阶段的最后一年,到达 2025 年,我就将进入而立之年,已不再是,十七八岁的黄金年龄了。这一年如此平淡,没有太多的波澜,即便是购入了我们人生的第一套房,她(老婆)和我也一样,似乎内心都是非常平静的。哈哈,如此也好,不要以新的生活境遇作为二人关系的刺激,也不要以老的生活环境作为二人关系的囹圄。接下来,按照惯例,我将按照几个方面,来对自己的 24 年做一个全面概括。 ...继续阅读 (54)


    love 0
    admin
    发表于
    2025-02-01 14:08:24

    AI 时代研发同学的必备软技能:从「写好代码」到「终结问题」的进化指南

    当 Cursor/Windsurf 为你生成代码片段,ChatGPT/DeepSeek 为你优化技术文档,Midjourney 为你绘制精美草图,你是否也曾思考过:「在这个 AI 时代,你工作的核心竞争力究竟是什么?」过去,技术硬实力是研发同学的核心武器,但今天,AI 工具正在以惊人的速度让这些技能「平民化」:代码量产:AI 几秒钟生成数百行代码;自动调优:AI 自主优化算法参数,超越人类水平;全栈覆盖:从前端到后端,从 DevOps 到数据分析,AI 工具无处不在。然而,AI 的快速普及并不是威胁,而是机会。未来最优秀的研发,不再只是写代码的人,而是能够驾驭 AI,解决复杂问题、创造价值的人。而这一切的基础,就在于软技能的升级。1. AI 时代的「新研发」画像:从执行到创造的转型AI 时代对研发同学的要求正在发生质的变化。你需要的不仅是工具使用能力,更是掌握以下三大能力的思维跃迁:1.1 问题定义力:从「如何做」到「做什么」AI 工具可以为你提供实现方案,但它无法回答「我们到底要解决什么问题」。能精准定义问题的人,才能引领 AI 高效运转。举例:用户反馈「系统太慢」,真正的瓶颈可能并不是代码性能,而是业务逻辑过于复杂,或者数据库架构不合理。关键问题:AI 可以帮你解决「已知问题」,但只有你能找到「未知问题」。建议实践:在接到需求时,不急于动手写代码,而是花 30% 的时间明确核心 ...继续阅读 (53)


    love 0
    Wincer
    发表于
    2025-02-01 13:28:33

    我是如何看待 DeepSeek R1 的

    最近 DeepSeek 可谓是出尽了风头。从 1 月 20 日发布了 R1 开始,DeepSeek 这家公司就逐步迈上了舆论的「风口浪尖」,几天时间冲上 App Store 与 Play Store 多地区榜单第一,各大平台热搜也是不断。加上最近正好属于过年放假期间,大家都有时间去体验、探讨这样一款国产的 AI 大语言模型。我使用 AI 了多久自从 OpenAI 在 22 年底的时候发布了 ChatGPT 3.5 开始,我便一直在使用。后面出了 Plus 之后,我也一直在续费使用到现在。中间我也尝试过 Anthropic 出品的 Claude 以及 Google 出品的 Gemini,其中 Claude 在写代码层面应该是最好的,但是在产品等方面并不如 ChatGPT,因此我在好好体验了几个月的 Claude Pro 之后,还是放弃了续费 Claude。24 年 11 月,我也在本地跑过 qwen,phi,DeepSeek v2 等模型,因为电脑是笔记本加上我本来也只想用它来当个 LLM 翻译后端,所以参数选择的 7b 的也够用。整体测试来看,DeepSeek v2 算还不错的(V3,R1 那时候还没发布)。自 ChatGPT 3.5 → GPT 4(更智能) → GPT 4o(多模态) → ChatGPT o1(强化推理能力),每一个新版本的发布都意味着 ChatGPT 更加聪明 ...继续阅读 (49)


    love 0
    邑雄
    发表于
    2025-02-01 00:00:00

    PolarDB MySQL跨可用区强一致解决方案

    背景PolarDB MySQL在单个可用区部署时,采用分布式存储架构,数据具有三副本。这种设计确保了即使单个存储节点发生故障,系统的可用性和数据一致性也不会受到影响。与单可用区部署相比,双可用区部署在另一个可用区中额外部署了一套实例,并通过异步复制或半同步复制在可用区之间同步数据,从而提供了更高的容灾能力。然而,这种配置不能完全保证两个可用区之间的数据一致性。为了应对机房故障,保证多个可用区之间数据强一致,我们提出了新的PolarDB MySQL跨可用区强一致解决方案:三可用区部署模式。下面从架构,高可用,性能3个方面介绍一下三可用模式。架构首先来看一下整体的架构图与半同步和异步复制方式相比,采用一主一备一日志的三节点架构通过结合物理复制和X-Paxos协议来实现数据同步,提供了更可靠的数据一致性保障。在主节点上,写操作必须等待对应的Redo日志发送给备节点,并且达成多数派后才会客户端返回成功,从而确保数据的强一致性。主节点和备节点都存储完整数据和完整日志,而日志节点仅存储Redo日志。与双可用区部署相比,这种架构只是多了一个日志节点,存储成本增加很少。由于日志节点不包含数据,因此它不对外提供读写服务。MySQL官方也提供了一种强一致性的方案:MySQL Group Replication (MGR)。然而,MGR模式的一些缺点导致其在实际生产环境中的使用体验不尽如人意:Binlo ...继续阅读 (34)


    love 0
    whrss (whrss9527@gmail.com)
    发表于
    2025-01-31 11:48:07

    “该省省,该花花”

    春节假期,我终于完成了两件大事:见了未来的岳父岳母,还带奶奶游览了北京。忙里偷闲,我决定总结一下这几天的经历,顺便分享一些“花钱”与“省钱”的小感悟。作为一名农村出身的人,我的消费观念一直是:钱能不花,就不花。例如:• 旅游?自己带矿泉水,自己带干粮,景区里一瓶水8块?不可能!• 门票?买最低门槛的,能溜进去的坚决不多花一分钱!• 遇到导游、摄影师、纪念品摊贩?避之如洪水猛兽,仿佛他们会瞬间吸干我的钱包。但这些年,尤其是这个假期的几件事,让我逐渐意识到:有些钱,省下来是亏的,花出去才是赚的。游泳:花钱买经验,少走弯路大学时,我决定学游泳。(ps: 一个月1000生活费,拮据~)当时面临两个选择:办游泳年卡(500块),自学成才!请游泳教练(20节课500块),专业入门!作为精打细算的学生党,我毫不犹豫地选择了年卡,心想:天天泡在泳池里,还能游不会?结局是,我的年卡被用得相当充分,但整整一年下来,只学会了蛙泳。自由泳换气?不行。打腿节奏?不对。游过去还能游回来?不存在的。两年后,喝了无数口泳池水,我终于磕磕绊绊学会了自由泳,蝶泳只学了个“皮毛”。但即便如此,每次游完我脖子都酸,说明动作仍然有问题。回头一想,当年如果花钱请教练,可能两个月就能达到现在的水平,少喝多少水啊!(而且,大学时候的教练费是真的便宜啊~~)但当时的我,非要靠自己摸索,结果就是走了很多弯路,还差点呛成“水鬼”。滑雪 ...继续阅读 (18)


    love 0
    Yuxin Wu (ppwwyyxxc@gmail.com)
    发表于
    2025-01-31 08:00:00

    写在 wechat-dump 项目的第十年

    在过年的这几天, 为了从焦虑的工作中换一个心情, 我给我的wechat-dump项目添加了几个当年没做出来的功能, 解决了一些遗留问题. 意外的发现这个项目始于 2014 年末, 到今天已经超过十^ ...继续阅读 (14)


    love 0
    RobinDong
    发表于
    2025-01-31 05:32:53

    Experiments about ‘torchao’

    ...继续阅读 (28)


    love 0
    smallnest
    发表于
    2025-01-31 04:04:53

    DeepSeek数据库暴露?扫描一下,应该不止此一家吧!

    DeepSeek出街老火了,整个AI界都在热火朝天的讨论它。同时,安全界也没闲着,来自美国的攻击使它不得不通知中国大陆以外的手机号的注册,同时大家也对它的网站和服务安全性进行了审视,这不Wiz Research就发现它们的数据库面向公网暴露并且无需任何身份即可访问。这两个域名oauth2callback.deepseek.com:9000和dev.deepseek.com:9000。AI的核心技术既需要这些清北的天才去研究,产品也需要专业的人才去打磨。像DeepSeek这么专业的公司都可能出现这样的漏洞,相信互联网上这么数据库无密码暴露的实例也应该不在少数(实际只找到了2个)。基于上一篇《扫描全国的公网IP要多久》,我们改造一下代码,让它使用tcp_syn的方式探测clickhopuse的9000端口。首先声明,所有的技术都是为了给大家介绍使用Go语言开发底层的网络程序所做的演示,不是为了介绍安全和攻击方面的内容,所以也不会使用已经成熟的端口和IP扫描工具如zmap、rustscan、nmap、masscan、Advanced IP Scanner、Angry IP Scanner、unicornscan等工具。同时,也不会追求快速,我仅仅在家中的100M的网络中,使用一台10多年前的4核Linux机器进行测试,尽可能让它能出结果。我一般晚上启动它,早上吃过早餐后来查看结果。我想把 ...继续阅读 (26)


    love 0
    吴奕茗 (chengdulittlea@outlook.com)
    发表于
    2025-01-29 19:27:44

    @到了

    Shitkickershttps://globalcomix.com/c/shitkickers↗2025/01/29 19:27:37 - 2025/01/29 19:27:44 ...继续阅读 (29)


    love 0
    二丫讲梵
    发表于
    2025-01-29 19:07:03

    学习周刊-总第196期-2025年第05周

    如要阅读全文,点击标题跳转。 学习周刊-总第196期 | SamWaf | many-notes | dnd-resume | self-consistent-coder | VideoCaptioner ...继续阅读 (51)


    love 0
    smallnest
    发表于
    2025-01-29 17:30:00

    趁着假期, 快速了解 Go io/fs 包

    ...继续阅读 (31)


    love 0
    青南
    发表于
    2025-01-29 15:12:49

    一日一技:如何使用Cursor学习开源项目

    ...继续阅读 (47)


    love 0
    青南
    发表于
    2025-01-29 15:12:49

    一日一技:如何用编程的方式来编排工作流

    ...继续阅读 (43)


    love 0
    青南
    发表于
    2025-01-29 15:12:49

    一日一技:如何使用大模型提取结构化数据

    ...继续阅读 (49)


    love 0
    RobinDong
    发表于
    2025-01-29 05:17:09

    Try to understand Variational Autoencoders

    ...继续阅读 (32)


    love 0
    zwwooooo
    发表于
    2025-01-28 17:12:45

    2025 新春快乐!

    ...继续阅读 (37)


    love 0
    zwwooooo
    发表于
    2025-01-28 09:05:44

    ja2_7609+AI 中文版更新:r2942 fix50 和 r3023

    ...继续阅读 (33)


    love 0
    虫师
    发表于
    2025-01-28 02:33:00

    auto-wing将AI应用于自动化项目 - 虫师

    【摘要】GitHub: https://github.com/SeldomQA/auto-wing 背景:我们之前介绍过 midsence.js AI自动化测试辅助工具,midsence.js的思路我个人是比较认可的。然而,因为它是基于TS语言实现的,更多的软件测试工程师使用Python语言!我来用Pyth阅读全文 ...继续阅读 (39)


    love 0
    惜分飞
    发表于
    2025-01-27 13:55:36

    中文环境显示AR8MSWIN1256(阿拉伯语字符集)

    ...继续阅读 (39)


    love 0
    Daisy Hunt
    发表于
    2025-01-27 12:45:20

    Comment les due diligences assurent le succès des transactions M&A ?

    ...继续阅读 (20)


    love 0
    Daisy Hunt
    发表于
    2025-01-27 12:39:39

    Les droits des clients en matière de prêts étudiants

    ...继续阅读 (20)


    love 0
    wireless_com
    发表于
    2025-01-27 04:06:38

    大模型应用的10个架构挑战

    [引] 在英国,时差有点乱。拾起年初的文字,迎接新春大吉!ChatGPT从正式发布到拥有1亿用户仅仅用了5天的时间,基于大型语言模型(简称大模型,或基础模型)的应用给软件行业乃至整个社会带来巨大的影响。作为一名软件系统的架构师,除了传统的软件系统质量属性约束之外,还要面对由于大模型应用的自身特点所带来的新约束,面对更多的权衡,也面临着更多的挑战。基于笔者近年来的探索与实践,这里列举了面向大模型应用... ...继续阅读 (53)


    love 0
    smallnest
    发表于
    2025-01-26 16:42:07

    扫描全国的公网IP需要多久?

    ...继续阅读 (46)


    love 0
    zwwooooo
    发表于
    2025-01-26 13:10:39

    Goodbye, My Guitar?

    ...继续阅读 (39)


    love 0
    Nicksxs
    发表于
    2025-01-26 11:53:38

    systemtap学习记录一

    前两天拜读了章亦春大佬的关于Dynamic Tracing的文章,觉得对现在碰到的一些问题有了一些新的思考,为了能有所产出就先写一点简单的学习记录首先这个systemtap类似于一个linux系统层面的探针工具,可以让用户去监控系统的各种活动以阿里云的 ...继续阅读 (60)

上一页 114/4362 下一页
沪ICP备19023445号-2号
友情链接