IT博客汇
  • 首页
  • 精华
  • 技术
  • 设计
  • 资讯
  • 扯淡
  • 权利声明
  • 登录 注册

    love 0
    superadmin
    发表于
    2025-03-04 08:31:42

    Java:解压jar后反编译,修改后重新打包更新jar

    mkdir tmp cd tmp # 解压jar主包 jar xf ../main.jar # 编译lib文件夹下某子jar依赖包, 生成class文件,使用classpath加载依赖包 javac -cp "../*:." com/budwk/Demo.java # 将class文件打包到jar包中 jar uf demo.jar com/budwk/Demo.class # 手动覆盖新的 demo.jar 包 # 不能使用这个更新命令,会导致jar包被二次压缩 # jar uf ../main.jar lib/demo.jar # 使用0这个参数,将解压文件打包到jar包中 jar cfM0 ../main.jar * ...继续阅读 (72)


    love 0
    x359981514
    发表于
    2025-03-04 08:30:18

    揭开Flutter Slider中Shapes的神秘面纱

    点击上方蓝字关注我,知识会给你力量Slider是Flutter中使用非常多的一个组件,通常设计师都会对Slider做很多的自定义设计,在Android中,我们其实是很难通过配置xml来改变Slider的外观的,而在Flutter中,我们可以很方便的组合整个实现,当然,前提是你需要对Slider的整体概念有个清晰的认识。下面这张图是Slider的一个基本组成,这里已经融合了一些基础的设计元素,所以,... ...继续阅读 (44)


    love 0
    一线码农
    发表于
    2025-03-04 06:45:00

    Linux系列:如何调试 malloc 的底层源码 - 一线码农

    【摘要】一:背景 1. 讲故事 上一篇我们聊过 C# 调用 C 的 malloc 代码来演示heap的内存泄露问题,但要想深入研究得必须把 malloc 的实现库 libc.so 给调试起来,大家都知道在Linux 上 libc 和 Windows 的 Win32 API 是一个层级的,由于 Linux 重阅读全文 ...继续阅读 (71)


    love 0
    C1G
    发表于
    2025-03-04 05:31:38

    火山方舟引擎限时免费注册送3000万DeepSeek R1满血版tokens

    火山引擎介绍‌火山引擎是字节跳动旗下的云服务平台‌。豆包大模型-字节跳动自研大模型火山方舟-一站式大模型服务平台扣子-专业版AI应用开发平台火山方舟免登录体验满血版671B打开火山引擎官网的火山方舟,不用注册、不用填手机号,直接就能使用DeepSeek-R1 满血版 671B参数和豆包-1.5-pro免登录体验3/3次,登录后后免费赠送每个模型50万tokens推理额度。https://www.volcengine.com/experience/ark邀请注册送代金券每成功邀请1位新用户,最高双方可得145元代金券,可抵扣3625万tokens(相当于免费问 15 万次问题)。具体玩法:1、登录活动页面,生成你的专属邀请码:DXRHABFP2、分享邀请链接给好友,对方注册时填写你的邀请码。不限邀请次数,成功邀请后均可依据规则获得奖励。邀请链接:https://www.volcengine.com/experience/ark?utm_term=202502dsinvite&ac=DSASUQY5&rc=DXRHABFP3、实名认证后,双方立即到账代金券:你拿 30 元(750 万 Tokens),好友拿 15 元(375 万Tokens)。如果好友后续付费,你还能再得 100 元代金券(2000 万 Tokens)!如账号已实名认证,代金券将在邀请成功后1小时内 ...继续阅读 (40)


    love 0
    白宦成
    发表于
    2025-03-04 05:20:59

    Github Stars 没啥用,但也不是没啥用

    我之前曾经在 Twitter 上说过,开源的本质是一个 Reputation(声誉)的游戏,你拥有越多的声誉,在和开源社区的协作就会越容易,大家就会愈发的相信你,与你共同协作。和@willemjiang聊天,我们都认可一个观点:开源本质是一个 Reputation 的游戏。你的所作所为在社区都是公开的,这也是开源的魅力。你可能在公司籍籍无名,但你因开源广为人知。当然,一体两面。社区是公开的、透明的。你的好与坏都将被传唱。就像每逢开发者活动,我们都要调侃 OB 刷 Star。— Bestony | 白宦成 (@xiqingongzi)September 8, 2023而这个 Reputation 的一个具象的表现 ,便是你在 Github 上拿到的 Star 或 Follower。我们普遍会认为,Star 更多的人、Follow 更多的人,是更有价值的 —— 你的 Follower / Star 更多,至少证明了你在开源这个领域的成绩。我的 Github Profile 页面坦诚的讲,我很以自己的 Star 为荣,超过 1W Star 和 1.4k 的 Follower,至少证明了我在开源上曾经做过一些事情。这些 Star & Project 可以证明我的能力,证明我能够做一些事情。这些信息帮助我更好的求职。但另一方面,我也认为,star 本身的意义并没有那么大 —— 特 ...继续阅读 (48)


    love 0
    WuSiYu
    发表于
    2025-03-04 03:23:37

    群晖ddrescue与暂时禁用USB外接硬盘自动挂载

    来自每天一个没用的小知识对一个挂掉SATA固态做数据恢复,症状大概是可以读,但一旦进行写入就会掉盘。在对数据做镜像时,直接通过USB3.0转SATA线插在群晖NAS机器上,并将镜像保存在其中的大容量硬盘上是个方便的做法。首先安装ddrescue,添加SynoCommunity软件源,并安装SynoCli Disk Tools软件包即可。(如果你的网不是很好,也可以从这里手动下载:https://synocommunity.com/package/synocli-disk)接下来,由于群晖会自动挂载USB外接硬盘等设备,会对其产生写入,这是我们不希望发生的。群晖没有选项可以关闭自动挂载功能,但经过一些尝试发现,我们可以通过暂停(SIGSTOP)/usr/syno/sbin/hotplugd进程的方法暂时阻止其自动挂载的行为。登入SSH后执行:sudo pkill -STOP -f /usr/syno/sbin/hotplugd注意不要直接将其杀死,否则其会自动重启。若再去阻止其自启就太过麻烦了,我们只需要暂时用SIGSTOP信号暂停其执行,让其失去功能即可。之后使用sudo pkill -CONT ...或直接重启机器后便可恢复。而后便可以接入硬盘并使用ddrescue进行数据恢复。群晖ddrescue与暂时禁用USB外接硬盘自动挂载最先出现在WuSiYu Blog。 ...继续阅读 (35)


    love 0
    Insus.NET
    发表于
    2025-03-04 00:57:00

    使用Acronis True Image恢复系统 - Insus.NET

    【摘要】在U深度PE环境中,使用Acronis True Image恢复系统。只要平常时,做好服务器或是工作端的系统备份,遇上系统崩溃或是某种原因,需要恢复时,可以参考下面方法来恢复。准备好备份xxx.tib....U深度U盘启动,进入维护环境,运行傲梅开区助手(1),查看硬盘分区情部分,如磁盘1,未分配空阅读全文 ...继续阅读 (57)


    love 0
    蛰语
    发表于
    2025-03-04 00:00:00

    再演进,更全面、更极致的 PolarIndex 2.0

    索引模块是数据库管理系统的核心组件,其设计直接决定了数据库数据操作的性能与效率。如何构建高效高并发的索引结构,始终是数据库领域的研究重点。作为一款先进的云原生数据库,阿里云PolarDB也不断的在索引高并发优化技术上深耕。基于Latching coupling的设计理念,PolarDB实现了PolarIndex 1.0版本:将 SMO 操作分成两个阶段并引入Latching-coupling,消除InnoDB btree 索引结构变更(SMO)过程中的全局索引锁(Index Latch),并保证每次结构修改都只需在btree 的一层加锁, 从而减少了latch 粒度并,使得索引结构变更可以高度并发。PolarIndex 1.0的相关介绍可以参考PolarDB这一篇月报文章。这一技术极大的提升InnoDB Btree的写入能力,以TPCC单表测试场景为例,开启PolarIndex后峰值性能能有近3倍的提升。虽然PolarIndex 1.0版本消除了InnoDB btree SMO的全局Index latch使得SMO操作可以并发,但是仍有许多优化尚未触及的地方:1)PolarDB 在btree cursor下降过程使用 latch coupling 最多同时持有两层次 page latch,仍存在(parent)page锁的瓶颈;2)InnoDB BLOB、TEXT等可变长度列格式, ...继续阅读 (43)


    love 0
    蛰语
    发表于
    2025-03-04 00:00:00

    再演进,更全面、更极致的 PolarIndex 2.0

    索引模块是数据库管理系统的核心组件,其设计直接决定了数据库数据操作的性能与效率。如何构建高效高并发的索引结构,始终是数据库领域的研究重点。作为一款先进的云原生数据库,阿里云PolarDB也不断的在索引高并发优化技术上深耕。基于Latching coupling的设计理念,PolarDB实现了PolarIndex 1.0版本:将 SMO 操作分成两个阶段并引入Latching-coupling,消除InnoDB btree 索引结构变更(SMO)过程中的全局索引锁(Index Latch),并保证每次结构修改都只需在btree 的一层加锁, 从而减少了latch 粒度并,使得索引结构变更可以高度并发。PolarIndex 1.0的相关介绍可以参考PolarDB这一篇月报文章。这一技术极大的提升InnoDB Btree的写入能力,以TPCC单表测试场景为例,开启PolarIndex后峰值性能能有近3倍的提升。虽然PolarIndex 1.0版本消除了InnoDB btree SMO的全局Index latch使得SMO操作可以并发,但是仍有许多优化尚未触及的地方:1)PolarDB 在btree cursor下降过程使用 latch coupling 最多同时持有两层次 page latch,仍存在(parent)page锁的瓶颈;2)InnoDB BLOB、TEXT等可变长度列格式, ...继续阅读 (2)


    love 0
    Windfarer
    发表于
    2025-03-03 16:07:56

    捡垃圾,折腾一下HP 544+ FLR

    从围城哥哥那里领养代替购买了一套闲置的HP 544+ FLR网卡(就是ConnectX-3 Pro),在家折腾RDMA网卡玩(涛哥有云:班没上够,回家还搞?)。在经历了发现一张卡凉凉,又50块捡了一张,以& ...继续阅读 (34)


    love 0
    haofly
    发表于
    2025-03-03 14:44:04

    2025年2月回顾

    开始使用豆包2月份尝试了几次 DeepSeek,整体质量已经和 ChatGPT 相差不大。但考虑到敏感信息和响应速度,日常开发还是更依赖 ChatGPT。不过,ChatGPT 在非技术场景下有时会受限,比如查询旅游攻略、拍照翻译、识别图片信息,甚至是快速分享内容时,使用体验就不太理想。而豆包在这方面表现得非常优秀,体验丝滑,效率极高。更有意思的是,身边不少非技术朋友也开始用豆包,这种全民 AI 的趋势已经悄然展开。不过,对我来说,AI 仍然只是工具,目前来说还只停留在调用API上,仍然需要挖掘更多的使用场景。不完整的 2 月今年 2 月,最后两个周末都被夜班占据,和去年一样,累到怀疑人生。更郁闷的是,上完夜班后,本来打算好好休息,结果接下来的几个周末天气都不太给力,白白浪费了难得的周末时光。其实一直想趁天气好的时候去露营,可每次一看天气好,重庆的露营地就已经是人挤人了,瞬间没了兴致。或许以后可以考虑收费营地,至少人少、环境好、设施齐全。另一方面,露营还是得配电车,充电、储能都方便,连车型都选好了。可惜手里的油车才开 6 年,还有十几万的贷款没还完,只能再等等了。中年男人的无奈,这才刚刚开始。家庭生活今年过年虽然没有怎么回老家,但过得还是挺开心的,尤其是和兄弟姐妹们聚在一起,玩得很尽兴。新的一年,希望大家都能发财!大家还计划暑假去云南租个院子避暑,但现实可能没那么理想——毕竟还不知道 ...继续阅读 (55)


    love 0
    admin
    发表于
    2025-03-03 13:26:55

    Ollama 未授权访问漏洞,原理、防护和洞察

    1. 发生了什么 / What Happens?Ollama 是一个大模型的服务端软件,默认启动会绑定127.0.0.1:11434端口,在这种绑定模式下,只有本机能够访问ollama。Ollama is a server-side software for large language models. By default, it binds to 127.0.0.1:11434 upon startup. allow access only from the local machine.如果想把ollama服务暴露给其他机器使用,根据官网文档,管理员可以通过配置OLLAMA_HOST=http://0.0.0.0:11434实现。If you want to expose the ollama service to other machines, according to the offical document, you can configure OLLAMA_HOST=http://0.0.0.0:11434 to achieve this.但这个操作将使ollama服务暴露在所有的地址里,任何用户无需权限验证即可访问这个部署好的ollama服务。However, this operation will expose the Ollama service to the a ...继续阅读 (50)


    love 0
    查利鹏
    发表于
    2025-03-03 13:12:55

    极致优化UE Android APK的大小

    在游戏项目中,当我们在打包各个平台时,总希望每个平台的包能够最小化便于分发,而且上架某些平台还有明确的大小要求。对于UE而言,它包含了巨量代码以及大量的插件,Build阶段还将生成反射的胶水代码,在编译时产生了大量的代码段。以Android平台为例,将导致libUE4.so的大小急剧增长,对于包体和运行时内存都造成了压力。再加上一些引擎必要和额外带入的资源也能占据上百M,空APK的大小很容易达到数百M的规模!不仅仅为了符合上架平台的要求,从包体和内存优化的角度,也有必要对UE包的大小进行裁剪。本篇文章会以Android为例,从各个方面介绍UE包中的可裁剪部分的优化思路与实践,同时优化APK大小和Native库的运行时内存占用,其中的策略也可以复用在其他平台。 ...继续阅读 (40)


    love 0
    白宦成
    发表于
    2025-03-03 13:07:46

    我在字节拍过的那些视频

    下面这些视频都是我在字节跳动期间为字节跳动公司宣传提供的视频素材,出于流量考虑,下面的这些视频都发布在 Youtube,因此如果你看不到,需要开梯子来查看。2025 年 字节跳动 All Hands 片段2024 年 MarsCode 片段2024 年,飞书 AI 片段 ...继续阅读 (51)


    love 0
    Yinong, Zhang
    发表于
    2025-03-03 12:45:52

    私域流量正在被公域化:在微信中拦截竞品流量!

    作者张依侬,系纷析咨询高级咨询顾问 01 如何在微信中拦截竞品流量? 我们都知道,微信豆加热功能可以提升视频号短视频或直播的曝光度、互动量和粉丝增长,基本功能类似dou+。但微信豆还有一个隐藏功能,能帮你拦截竞品或同行的精准流量。 操作也很 […] ...继续阅读 (62)


    love 0
    C1G
    发表于
    2025-03-03 11:45:17

    字节跳动于3月3日发布AI 集成开发环境工具Trae CN

    字节跳动于3月3日发布国内首款 AI 原生集成开发环境工具(AI IDE)——Trae 国内版,搭载 doubao-1.5-pro 模型(目前还不能用),并支持切换 DeepSeek R1&V3;。帮助开发者高效协作 AI,提升编程效率和质量。国际版 Trae, 国内版为 Trae CN国际版 Trae支持 Claude 3.7 Sonnet国际版官网:https://www.trae.ai/国内版官网地址:https://www.trae.com.cn/home安装包大概150M左右。国内版集成了DeepSeek R1&V3;,提供AI问答、智能代码生成、智能代码补全,多模态输入等功能。支持界面全中文化,为中文开发者提供了高效的开发体验,关键现在限时免费。使用手机号注册登录后就可以使用。魔改vscode,可以导入VS Code或Cursor的插件和设置。The post字节跳动于3月3日发布AI 集成开发环境工具Trae CNfirst appeared onC1G军火库. ...继续阅读 (54)


    love 0
    张善友
    发表于
    2025-03-03 09:07:00

    .NET MCP项目对比分析:MCPSharp、mcpdotnet与ModelContextProtocol.NET - 张善友

    【摘要】MCP(Model Context Protocol)协议是一种由Anthropic推出的开放协议,旨在实现大型语言模型(LLM)与外部数据源和工具之间的无缝集成。简要对比分析三个.NET的MCP项目(MCPSharp、mcpdotnet、ModelContextProtocol.NET)如下: 1阅读全文 ...继续阅读 (68)


    love 0
    Kimi
    发表于
    2025-03-03 07:59:47

    前置机iptable转发规则设置

    最近出了不少需要云厂商服务器作为前置机来连接的IEPL,要求说明:该产品仅允许云厂BGP网络连入,需要云厂BGP网络作为前置搭配使用。阿里云国内全网、腾讯云国内全网、华为云华南等云厂可用。前置机的配置用iptable转发即可,先下载脚本。wget http://kimi.pub/wp-content/uploads/iptables-pf.sh #然后执行脚本 ./iptables-pf.sh初次使用前请请务必执行 1. 安装 iptables(不仅仅是安装)按照脚本提醒操作即可 ...继续阅读 (48)


    love 0
    一线码农
    发表于
    2025-03-03 06:07:00

    Linux系列:如何用 C#调用 C方法造成内存泄露 - 一线码农

    【摘要】一:背景 1. 讲故事 好久没写文章了,还是来写一点吧,今年准备多写一点 Linux平台上的东西,这篇从 C# 调用 C 这个例子开始。在 windows 平台上,我们常常在 C++ 代码中用 extern "C" 导出 C风格 的函数,然后在 C# 中用 DllImport 的方式引入,那在 Li阅读全文 ...继续阅读 (76)


    love 0
    C1G
    发表于
    2025-03-03 05:52:17

    Ollama 未授权访问漏洞,攻击者可以下载或删除私有模型文件

    Ollama 是一个开源的大语言模型(LLM)运行环境和工具集,旨在帮助开发者轻松部署、管理和使用模型(如 DeepSeek 等)。Ollama 存在未授权访问漏洞,攻击者可以直接访问敏感接口进行读取、下载或删除私有模型文件,或滥用模型推理资源等高危操作。攻击者只需访问服务端口(默认 11434)即可调用敏感功能接口,进而读取、下载或删除私有模型文件,或滥用模型推理资源等。直接请求api路径即可,这里查看都有哪些模型curlhttp://127.0.0.1:11434/api/tags这个接口列出 Ollama 提供的 LLM 模型。该接口对应的处理函数是ListHandler,可以看到,未进行任何权限,直接返回模型。func (s \*Server) ListHandler(c \*gin.Context) { ms, err :\\= Manifests(true) if err != nil { c.JSON(http.StatusInternalServerError, gin.H{"error": err.Error()}) return } ​ models :\\= \[\]api.ListModelResponse{} for n, m :\\= range ms { var cf ConfigV2 ​ if m.Conf ...继续阅读 (41)


    love 0
    C1G
    发表于
    2025-03-03 05:11:41

    linux 本地部署ollama和docker版openwebui+deepseek

    windows 本地部署ollama+deepseek 可见前面文章.linux 安装ollama这里使用virtualbox 安装了rocky9.3cat /etc/redhat-releaseRocky Linux release 9.3 (Blue Onyx)一健安装curl -fsSLhttps://ollama.com/install.sh| sh自动化安装,但可能下载不了注意:应该至少有8GB的可用内存来运行7B模型,16GB的可用内存来运行13B模型,以及32GB的内存来运行33B模型。手动安装https://github.com/ollama/ollama/blob/main/docs/linux.mdsudo rm -rf /usr/lib/ollama1.8g左右curl -Lhttps://ollama.com/download/ollama-linux-amd64.tgz-o ollama-linux-amd64.tgzsudo tar -C /usr -xzf ollama-linux-amd64.tgzStart Ollama:ollama serveIn another terminal, verify that Ollama is running:验证安装:ollama -vollama version is 0.5.1添加用户限配置useradd ...继续阅读 (43)


    love 0
    wxy
    发表于
    2025-03-03 03:14:15

    百度网盘免费领取1T空间,每月都可以领取 百度网盘扩容

    2025-03-18 活动已过期 百度网盘现在新注册用户只有100G左右,空间不够,但是一般情况下有活动,可以免费领取空间。 点击下面两个链接就可以免费领取500G空间,总共1T,有效期为1个月,但是每个月都可以过来领取活动时间有限,先到先得。 注意,需要用手机打开链接,然后跳转到百度网盘APP领取 ...继续阅读 (47)


    love 0
    桦仔
    发表于
    2025-03-03 00:01:00

    MongoDB 8.0这个新功能碉堡了,比商业数据库还牛 - 桦仔

    【摘要】MongoDB 8.0这个新功能碉堡了,比商业数据库还牛 引言 MongoDB 8.0已经推出有一段时间了,相比之前的版本推出的新功能,8.0版本的新功能集中在提升性能和可维护性上面,可以说是目前性能最好的一个版本。 具体来说,按照官方说法通过基准测试工具YCSB(通用数据库基准测试工具)验证,Mo阅读全文 ...继续阅读 (47)


    love 0
    王康
    发表于
    2025-03-03 00:00:00

    庖丁解InnoDB之B+Tree

    InnoDB采用B+Tree来维护数据,处于非常核心的位置,可以说InnoDB中最重要的并发控制及故障恢复都是围绕着B+Tree来实现的。B+Tree本身是非常基础且成熟的数据结构,但在InnoDB这样一个成熟的工业产品里,面对的是复杂的用户场景,多样的需求,高性能高稳定的要求,以及长达几十年的代码积累,除此之外,InnoDB中的B+Tree在实现上并没有一个清晰的接口分层,这些都让这部分的代码显得复杂晦涩。本文希望从中剥茧抽丝,聚焦B+Tree本身的结构和访问来进行介绍,首先会简要介绍什么是B+Tree,之后介绍InnoDB中的B+Tree所处的位置和作用,然后介绍其数据组织方式,访问方式,以及并发控制。其余的,代码中交织在一起的诸如AHI (Adaptive Hash Index)、Change Buffer、RTree索引、Blob、代价估计等内容会先忽略掉。B+Tree对MySQL这种磁盘数据库来说,当要访问的数据不在内存中的时候,就需要从磁盘中进行加载。而内存和磁盘的访问速度是有几千甚至上万的差距的,那么作为磁盘数据库的索引,能不能有效的降低从磁盘中加载数据的次数就变得非常重要。1970年,Rudolf Bayer《Organization and Maintenance of Large Ordered Indices》一文中提出了BTree[1],之后在这个基础上演化 ...继续阅读 (24)


    love 0
    wireless_com
    发表于
    2025-03-02 20:25:41

    架构设计过程中的10点体会

    在软件工程领域,任何脱离实际业务需求的架构设计都是一种不负责任的行为,甚至可以称之为"技术层面的形式主义"。这种设计倾向往往表现为过度追求技术新颖性、盲目采用复杂架构模式,或者为了架构而架构的设计理念。很多技术债务也是由于架构设计与业务需求脱节造成的。多年的实践,经历了很多的项目和工程架构实现,整理了10点体会,可能不对,可能片面,都来自于过去的经验。1.每个人都是凡人,无关职位许多人从小就被灌输... ...继续阅读 (49)


    love 0
    testcs_dn
    发表于
    2025-03-02 18:33:49

    UEditor集成Markdown编辑功能完整方案,支持Markdown与HTML的双向转换

    上一篇,实现的思路是支持Markdown格式的内容插入功能,后来一想,既然可以将Markdown格式转换为HTML格式,为什么不同时支持HTML格式转Markdown格式呢!同时对界面也做了样式上的美化;点击 Ueditor 工具栏上的 markdown 图标,如果 编辑器内有内容,就直接转换为 Markdown 格式,显示在Markdown 格式编辑器的编辑框内,这样就实现的双向的编辑与转换。 ...继续阅读 (44)


    love 0
    四十九C-137
    发表于
    2025-03-02 16:59:00

    我用 Cursor AI 开发了一个在线加密工具网站

    最近接触了一个新的AI辅助开发工具Cursor AI,为新用户提供了免费额度,我用它代替了 Github Copilot 工作了一段时间,用来辅助开发我的 Unity 项目。在使用期间,我逐渐摸索了 Cursor 的使用方式,以及它的强大功能,效率高到吓人,并且能够非常清晰地理解我的开发需求,为我提供解决方案。more其中,它有一个优点是对整个项目的整理与梳理,并且能够根据我的需求,能够一次修改多个文件。于是我想,是否可以挑战一下使用 cursor 完整地构建一个项目,我不参与修改任何代码,只负责提出需求,看看 cursor 是否能够完成这个任务。结果让我非常惊喜,cursor 不仅能够完成任务,而且完成得非常好。项目实现我挑选了一个比较简单的项目,一个在线加密工具网站,包含以下功能:AES 加密/解密SHA256/MD5 哈希计算Base64 编码/解码随机密码生成器中英文双语支持首先,我给它的第一个指令是:本项目将会构建一个静态网页,部署在vercel 上,提供简单的加密服务。 encryption-tool/ │── public/ # 静态资源(可选) │ ├── favicon.ico # 网站图标 │ ├── logo.png # 站点 Logo │── src/ # 源代码 │ ...继续阅读 (27)


    love 0
    Nicksxs
    发表于
    2025-03-02 14:12:20

    结合本地部署的蒸馏 deepseek 大模型和 Anything LLM 来实现rag功能

    之前我们用LM Studio 本地部署了 deepseek的蒸馏大模型,虽然肯定无法跟满血版比,但是对于本地的一些小应用还是可以尝试的这边我们就不自己实现了,借助于 Anything LLM来做个尝试首先可以在 ...继续阅读 (79)


    love 0
    张善友
    发表于
    2025-03-02 13:17:00

    白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了 - 张善友

    【摘要】大家好!今天给大家带来一个好消息,Dapr(Distributed Application Runtime)1.15版本正式发布啦!对于不熟悉Dapr的朋友来说,Dapr是一个开源的、跨平台的运行时,它简化了微服务架构中的许多复杂问题,比如服务发现、配置管理、状态管理等。那么,Dapr 1.15版本阅读全文 ...继续阅读 (68)


    love 0
    edony
    发表于
    2025-03-02 11:30:04

    关于DeepSeek我是怎么研究的(4)

    经历了3篇长文的先验知识的准备:关于DeepSeek我是怎么研究的(1):通识RLM推理模型;关于DeepSeek我是怎么研究的(2):了解推理模型背后的模仿人类的背景知识,system 1 & system 2 thinking;关于DeepSeek我是怎么研究的(3):RLM推理机制的详细拆解;终于来到正主DeepSeek了。DeepSeek能够引起轰动甚至能把OpenAI等领跑者吓出一身冷汗,除了它的模型性能、成本优势之外,我个人更多的觉得是它的毫无保留和开源贡献,这让绝大多数没有足够资金支持的学术机构、中小企业看到了自己拥有自己大模型的可能性且有非常高的性价比。同时DeepSeek的论文事无巨细,毫无保留一步一步的介绍了自己的如何训练DeepSeek的,这样的开源精神远远超越了OpenAI论文中暧昧与含糊其辞。2024年春节期间引起全员关注的DeepSeek主要有两个模型:DeepSeek-V3以及DeepSeek-R1,这两个模型均有对应的论文、测试数据、开源模型等原始资料可以支撑。这篇文章我先来研究一下DeepSeek-V3模型:DeepSeek-V3 架构DeepSeek-V3 基于 Transformer 框架,采用 MLA 和 DeepSeekMoE 架构。MLA 通过低秩联合压缩注意力键和值,减少推理过程中的 KV 缓存。DeepSeekMoE 使用更细粒度的专 ...继续阅读 (83)

上一页 105/4362 下一页
沪ICP备19023445号-2号
友情链接