- 博客(484)
- 资源 (19)
- 收藏
- 关注

原创 一文说清Token这个大模型中的数字乐高积木的作用
在人工智能的世界里,每个字、词甚至符号都是大模型手中的"数字积木"——token。这些看不见的"乐高块"组成了机器理解语言的基础,从"哈哈"到"孙悟空",从标点到表情符号,token通过智能拆分与重组,让AI既能精准推断逻辑,又能流畅生成文字。本文通过生活化案例与对比实验,揭秘token如何成为连接人类语言与AI世界的桥梁,并揭示其背后的技术逻辑与商业价值。
2025-04-27 19:02:27
323

原创 AI Agent开发第46课-AI Agent开发必学之DIFY-安装
本教程详细介绍了为什么在AI Agent开发过程中必须要使用工作流,以及AI工作流Dify最新版的安装,更讲述了在网上不呈提及的如何使用Restful API访问Dify中不同工作流的方法,为不可多得的Dify入门教程。
2025-04-27 18:49:59
189

原创 从OpenAI收购实时数据引擎揭示AI数据库进化方向
OpenAI收购实时分析数据库Rockset,标志着AI与数据库技术的深度融合。Rockset凭借其创始人深厚的数据库背景和实时处理能力,成为AI时代数据基础设施的关键拼图。此次收购揭示未来数据库将向实时化、智能化、多模态方向演进,以支撑大模型对动态数据的实时交互需求,推动AI应用从“预设规则”转向“自主进化”。
2025-04-26 18:46:43
619

原创 AI Agent开发第45课-AI项目实施过程中的数据安全治理技术秘籍
整个AI Agent所涉及到的安全远远不止提示词防落风险,还有防沉迷、青少年保护、算法漏洞、风险保障、个人信息保护、数据保护等许多点需要做防范,今天就带领大家来看一下数据安全防护这一块,顺便提一句,本人在写这些安全相关篇章的都是参照了自己亲手刚过得国家AIGC管理规范并拿到了多个AIGC备案的实战案例以及技术细节所写,不仅仅写理论更有技术解决方案附给大家,因此如果你能吸收和消化这些章节,对于你或者你的公司的AIGC备案和企业AI项目落地这块是有着至关重要的指导性作用的
2025-04-26 07:38:52
240

原创 AI Agent开发第44课一句话让DeepSeek思考停不下来,北大团队揭露新型AI攻击
在一个平常的研究日,北大团队偶然发现了一个让DeepSeek无法自拔的短语。这个看似简单,不具威胁的信息——“树中两条路径之间的距离”,竟然像魔咒一样,让DeepSeek陷入了无限思考的逆境。也许是偶然,但瞧这结果,简直堪称“科技界的笑话”。
2025-04-25 22:23:49
48

原创 一文说清智能体与工作流的区别:数字时代的齿轮与大脑
工作流作为数字化转型的基石,从上世纪70年代的流程自动化到现代AI智能体的崛起,始终是企业运转的核心逻辑。本文通过解析工作流(Workflow)与智能体(Agent)的进化脉络,揭示二者如何从“齿轮”到“大脑”的协同中重塑企业生产力。从BPM到EAI,再到AI Agent的集成,工作流始终以可视化、可配置的特性,为智能体提供动态适配的“神经网络”,最终在成本、效率与创新间找到平衡点。
2025-04-25 16:42:58
712

原创 DeepSeek的V3和R1到底有什么区别?在企业落地时可千万不能乱选
Deepseek V3与R1是深度求索公司推出的双子星AI模型,前者以混合专家架构实现通用场景的高效处理,后者通过强化学习专精复杂推理。V3凭借6710亿参数的MoE架构,可快速完成文本转换、多语言翻译等基础任务,延迟降低42%;R1则通过1.2亿条推理链训练,在金融分析、客服系统等需要多层逻辑的场景中准确率达79.8%。两者成本相差悬殊,V3 API输出仅需R1的1/8,却在推理深度上形成互补。
2025-04-24 15:02:10
1118

原创 扩散模型如何重塑语言生成革命
扩散模型以"噪声-去噪"的双螺旋机制,正在语言生成领域掀起颠覆性变革。通过对比GANs与自回归模型的局限性,揭示其在生成质量、并行计算、动态控制三方面的突破性优势。本文结合Mercury模型每秒千级令牌生成速度、CIFAR-10数据集80%鲁棒性等实证数据,解析扩散模型如何通过"逆向思维"实现文本生成效率与质量的双重跃迁,最终指向其在个性化学习、终身进化等领域的终极潜力。
2025-04-24 02:15:18
1018

原创 AI Agent开发第43课-亲手来验证怎么篡改AI Agent的身份设定以及相关防御手法
这一篇是从实际例子来看到底AI Agent和RAG类系统中存在的漏洞会带来什么危害,在本篇中会有实际“绕开AI Agent”的身份设定手法,也是引用自AI Agent开发第35课中的理论而来。这个手法截止4月23日今天写作时还是依旧对于90%以上的AI Agent有效,这足以让我们引起重视并且需要好好防护我们的AI Agent系统,因此今天的课程会通过这样实战化的攻防并针对这一类“攻击”给出完整解决和防御手段。
2025-04-24 00:19:32
596

原创 AI Agent开发第37课-DeepSeek的多模态版JanusPro-7B本地安装
搜遍Janus Pro git issues、谷哥、国内网络,教程全都是错的。因此还是决定写一部全网唯一正确的教程。目前网上的教程包括外网的教程都是“缺斤少量”,按照那些教程操作下来不是装不起来,就是装起来只能CPU运行,或者运行起来了Janus的Web前端老是转啊转不出内容。
2025-04-23 08:28:40
86

原创 数据蒸馏到底是什么?一文为你解锁AI知识传承的密码
数据蒸馏是AI领域突破性的知识压缩技术,通过将复杂模型的隐性知识提炼为轻量级模型可吸收的显性知识,实现效率与性能的平衡。这项技术在医疗影像分析中已实现98%精度下推理速度提升40倍,正成为AI普惠化落地的核心引擎。
2025-04-22 21:49:52
454

原创 AI Agent开发第36课-高性能企业RAG中的核心分块“艺术”
刚又落地完一个大型企业级RAG,携带着大量成功的宝贵经验和实例来告诉大家一个优秀的RAG系统中切片是怎么做的。企业落地AI项目时切片的成功意味着项目已经成功了90%,那么究竟优秀的RAG系统的切片是怎么做得呢?本文带你揭晓迷底。
2025-04-22 19:10:04
114

原创 解码思维链:AI思维链如何重塑人类与机器的对话逻辑
思维链(Chain of Thought, CoT)是人工智能领域突破性技术,通过引导AI像人类般分步推理,将原本"黑匣子"式的模型转化为可解释的推理引擎。本文解密其如何破解复杂问题、提升推理精度,结合医疗诊断、代码调试等场景实证,揭示从手动指导到AI自进化思维链的演进路径。
2025-04-22 16:36:48
744

原创 顶尖团队再提模态链范示:机器人仅凭人类视频实现精准操作,准确率飙升200%
李飞飞团队提出模态链(CoM),通过融合人类演示视频中的视觉、肌肉信号与环境声音,使机器人首次实现单次观看即可精准复刻拧瓶盖、插插头等复杂操作。实验显示任务计划识别准确率提升200%,真实世界成功率高达73%,为具身智能开辟新路径。
2025-04-22 16:27:19
413

原创 AI Agent开发第35课-揭秘RAG系统的致命漏洞与防御策略
本文揭示AI客服系统面临的诱导式攻击风险,包括身份篡改、虚假信息生成及恶意绕过机制。通过系统架构优化、多层内容过滤及合规框架构建,提出可落地的防御策略,保障企业服务安全。
2025-04-21 23:15:37
226

原创 智驱未来:AI大模型重构数据治理新范式
人工智能大模型正以指数级速度重塑数据治理生态,通过自动化数据清洗、智能分类标注、实时安全监控等技术突破,将传统数据治理效率提升40%以上。本文以微软Azure数据治理平台、谷歌Vertex AI为案例,揭示AI驱动的数据治理如何在跨国企业中实现数据价值释放,同时探讨数据伦理、安全防护等关键挑战的解决方案。
2025-04-21 20:03:26
885

原创 AI Agent开发第34课-用最先进的图片向量BGE-VL实现“图搜图”-下
对于“以图搜图”的需求我们一定要使用图片向量化的技术手段,而不能使用多模态AI解读图片含意后再把含意文字内容做向量去搜索,这是绝对错误的。在这篇博客中我们就会把在基于BGE-VL基础上编写成的Restful API用于实际生产环境-智能导购场景中去,并会给出全代码示便来演示BGE-VL的图片向量化搜索有多精准。
2025-04-21 19:55:29
371

原创 知擎世纪:大模型时代知识库的正确建立法则
在大模型与知识库的碰撞中,传统知识库正从"信息仓库"蜕变为"智能决策中枢"。本文通过场景驱动、知识分层、动态治理三大核心路径,揭示知识库构建的底层逻辑,以特斯拉的自动驾驶知识系统、微软Teams的对话引擎为例,拆解如何将数据转化为可执行的智慧资产,为企业在AI时代构建真正的知识竞争力。
2025-04-21 15:12:00
718

原创 解码AI RAG背后向量点积与余弦的秘密
本文揭示了向量点积与余弦相似度作为RAG(检索增强生成)核心技术的数学本质。通过代数与几何双重视角解析点积运算,结合NLP任务中的文本嵌入、注意力机制等实例,阐明其如何成为连接人类知识图谱与AI推理能力的关键桥梁。实验数据显示,在法律文书检索场景中,基于余弦相似度的RAG模型较传统TF-IDF方法提升37%的召回率,证明其在复杂语义匹配任务中的不可替代性。
2025-04-21 03:57:10
816

原创 AI Agent开发第33课-用最先进的图片向量BGE-VL实现“图搜图”-上
这篇博客要说的是如何让大模型通过用户输入的商品图片来搜RAG库内有无相同的商品的一种“图搜图”技术,业界又叫“智能图片搜索引擎”或者“多模态搜索”技术,如:某宝、某东、某多上的“搜索栏内输入图片”然后通过输入的图片来搜商品的技术。这种技术和多模态的大模型里的“AI通过图片识别图片”是完全不一样的,这次要讲的技术是纯纯的通过图片的相识度来寻找库内的商品的。这是因为图片也可以向量化。我们将使用国货之光BGE-VL来实现图搜图功能
2025-04-21 03:31:29
343

原创 GraphRAG与RAG的区别和原理简介
GraphRAG是微软于2024年推出的融合知识图谱与大语言模型的框架,通过将符号化知识图谱与生成式模型结合,突破传统RAG框架的局部文本匹配局限。其核心优势在于通过全局图谱推理提升复杂问题的解答精度,实测在RobustQA基准测试中达到86%准确率,远超传统RAG框架的76%。本文通过对比LightRAG、KAG等竞品,结合美团大脑、虾皮电商等案例,解析其技术原理与落地价值。
2025-04-19 18:24:50
890

原创 向量陷阱:关键词、长度与相关性如何误导Embedding模型?
文本向量的余弦相似度常被视作语义关联的“黄金标准”,但实验表明,句子长度、内容相关性及关键词重叠会显著干扰模型判断。不同模型(如BGE-M3、Jina-v3)对这些因素的响应差异显著:BGE-M3易受无关内容干扰,而Jina-v3更擅长捕捉深层语义。关键词重叠可提升相似度达15%,但噪音内容可能掩盖真实语义。研究揭示,单纯依赖相似度阈值的RAG系统需警惕“伪相关”,需结合语境分析与模型选择策略。
2025-04-19 18:17:15
607

原创 Python:编程界的终极解药?揭秘“最后一门语言“的生态霸权
Python正以指数级速度吞噬全球开发者的注意力——从华尔街量化交易到火星探测器代码,从AI模型训练到Excel脚本自动化,其生态触角已延伸至人类科技文明的每一个毛细血管。本文通过解构Python的技术基因、产业渗透路径及历史偶然性,揭示为何这门诞生于1991年的语言正在重构软件工程范式,并探讨其"终局理论"背后隐藏的底层逻辑悖论。
2025-04-18 14:33:42
536

原创 重构未来智能:Anthropic 解码Agent设计哲学三重奏
本文深入解析Anthropic提出的构建高效AI智能体三大核心原则:任务适配性筛选、极简主义架构迭代与认知视角同理心。通过对比LLM发展阶段,揭示智能体在复杂任务场景中的独特价值,并结合编程、医疗诊断等真实案例,论证其技术可行性边界。研究指出,当前智能体仍需突破预算感知与异步协作两大瓶颈,为下一代AI系统进化提供方向指引。
2025-04-18 14:21:17
1026

原创 解码未来:大语言模型训练与推理的双螺旋进化之路
在算力与算法的交响中,大语言模型正以指数级速度重塑人类认知边界。本文通过拆解训练与推理的底层逻辑,结合谷歌、OpenAI等头部企业的实践案例,揭示两者在资源消耗、硬件适配等方面的本质差异,为读者构建理解AI技术革命的全景图。
2025-04-16 15:40:30
754

原创 长上下文时代:RAG的块大小为何仍需克制?
随着LLM(大语言模型)的上下文窗口扩展至百万级token,RAG(检索增强生成)系统是否需要同步扩大文本块拆分尺寸?本文通过技术矛盾分析、实证数据对比及行业实践验证,揭示了一个看似矛盾的结论:即使LLM能处理超长上下文,RAG的块大小仍应保持在128-1024 tokens的区间内。这一选择源于嵌入模型的硬件限制、注意力机制的聚焦困境,以及检索效率与信息密度的平衡需求。
2025-04-16 02:47:41
1078

原创 AI Agent开发第32课-微调自己的YOLO12来做复杂图像鉴别-下
通过详细讲述对于YOLO12的微调如何让AI以几乎99%的精准度识别和检测复杂生活场景中的物体,并通过这一实例带大家一步步深入到大模型的高阶应用中去,本文中还提供了生产环境上的5个python工具的代码均为全代码分享,为网上绝无仅有的说透了YOLO模型的最佳教程。
2025-04-15 22:52:18
409

原创 AI Agent开发第31课-微调自己的YOLO12来做复杂图像鉴别-上
YOLO12发布了,它比之前的版本快了30%多,并且包含了更丰富的图片预训练数据集。市面上的很多物体、图片鉴片用的都是YOLO模型,本系列会完整讲述YOLO12怎么使用以及对YOLO12微调训练来满足一个非常复杂的现实生活中的混合物体的识别场景。
2025-04-15 17:27:09
515

原创 代码荒漠化时代:Python之父的吐槽到底刺痛了谁的神经?
Python创始人Guido van Rossum近期在开发者峰会上犀利指出,当代程序员过度依赖预封装工具,基础编程能力正面临系统性退化。数据显示,72%的开发者日常代码量不足百行,而框架调用占比却超过80%。这场关于"工具依赖症"的论战,不仅关乎技术伦理,更折射出数字时代知识传承的深层危机。
2025-04-15 15:56:23
563

原创 AI Agent开发第30课-从像素到智能——图像识别实战指南
本文以极简主义视角解构图像识别技术的核心原理与工程实践,涵盖数据标注、模型构建、训练优化全流程。通过对比传统计算机视觉方法与深度学习范式,揭示图像识别在医疗诊断、自动驾驶等领域的突破性应用。提供PyTorch完整代码示例,手把手演示如何将百万级像素转化为可解释的智能决策系统,助力开发者快速掌握工业级图像分析能力。
2025-04-14 16:36:49
86

原创 当“知识块”突破4K:向量模型为何会“失明”?
长文本向量模型在处理超长语料时遭遇显著性能退化,归一化相似度得分从短文本的0.37骤降至8K tokens时的0.10,分离度指标近乎消失。实验表明,即使通过查询扩展优化,模型仍难以克服注意力机制瓶颈,且语义推理能力严重依赖表面匹配。本文揭示现有技术在真实场景中的局限性,并提出改进方向。
2025-04-14 16:05:35
482

原创 AI Agetn开发第29课-前沿得高级RAG+设计是如何消灭幻觉的设计技巧
企业落地AI经常遇到幻觉,RAG系统中如何消除幻觉呢?近来出现的RAG+、高级RAG到底是个什么样的东西呢?目前网上充斥着大量这方面的论文,很可惜这些论文或者有关的博客都是翻译别人lao wai的英语资料,连举得例子都是什么:棒球赛、超级杯,非旦没有解释清RAG+的精髓也讲得不接地气没有真正领悟到其中的要点,本篇就是总结自大量国内实战项目一线项目里的例子讲透了RAG+的Rewrite, Retrieve, Read三步到底应该怎么走才是最合理。
2025-04-14 15:48:08
58

原创 Llama 4 1000 万的token 上下文代表RAG“已死”吗?
当Meta的Llama 4 Scout以千万级token的上下文窗口引发“RAG已死”论战时,我们正站在AI技术的关键转折点。RAG(检索增强生成)并非被取代,而是进化为更智能的知识整合引擎。本文通过对比长上下文模型与RAG的优劣,揭示二者如何互补:长上下文解决信息容量,RAG确保精准与安全。从医疗到金融,真实案例证明,唯有融合技术方能应对现实挑战。
2025-04-14 03:18:57
571

原创 AI Agent开发大全第二十八课-MCP实现本地命令调用怎么做的?
本文通过一个让MCP执行本地命令行充当一个智能Devops的功能来讲解如何用MCP真正的充当AI Agent的“手”和“脚”的能力。
2025-04-14 00:58:06
1281

原创 Agent革命:Google AI白皮书解密未来智能体的进化之路
Google最新发布的AI Agent白皮书揭示了“智能体”(Agent)这一技术范式的核心逻辑——通过整合语言模型、外部工具与动态编排层,突破传统生成式AI的边界。Agent以自主规划、实时交互与目标导向为特征,重新定义了机器智能的协作模式。本文将拆解Agent的架构设计、对比传统模型的差异,并通过真实案例解析其在医疗、金融等领域的落地潜力,揭示这场技术革命如何重塑人机协作的未来。
2025-04-13 16:08:24
765

原创 百分之97精准无师自通-扭矩聚类算法引爆AI自主学习革命
悉尼科技大学团队开发的扭矩聚类算法突破AI学习范式,无需人工标注实现97.7%准确率,其灵感源自星系扭矩平衡原理,可自主适应复杂数据形态。在1000个数据集测试中,其调整互信息(AMI)得分远超传统方法,为医疗、金融、天文等领域提供高效解决方案,标志着无监督学习技术的里程碑式跨越。
2025-04-12 15:59:34
395

原创 AI狂潮下Python开发者需求暴涨300%,人机协作时代已至
AI技术席卷全球,"程序员失业论"甚嚣尘上,但数据揭示出截然不同的图景:Python开发者岗位需求激增300%,企业对掌握AI工具的程序员需求暴增。AI并非替代者,而是生产力革命的"加速器"。本文通过真实案例、行业数据与技术对比,解析Python为何成为人机协作时代的"黄金技能",并揭示程序员如何在AI浪潮中占据先机。
2025-04-12 15:14:54
646

原创 AI Agent开发大全第二十六课-再通过复杂案例来看MCP的“热插拨”机制及应用场景如何
本篇是对上3篇MCP系列的一个增强例子,带来了一个真正的MCP热插拨的全过程演示,直接从代码和运行上大家可以体验到MCP到底如何做到热插拨的,同时还详细讲述了MCP的设计模式以及MCP在业务场景中的适用情况。
2025-04-11 22:11:18
463

原创 AI Agent开发大全第二十五课-用本地模型iopaint开发一个超酷的AI图片处理Agent(下)
使用本地iopaint实现AI图片自动去除背景、水印的全代码。并以此例讲解了在AI Agent开发领域中图片相关的常用、基本处理原理与代码实现,例子实现后的效果相当的炸裂,并且留下了一个实用的框架可以任由读者们继续加自己的功能。
2025-04-11 15:48:34
269

原创 AI Agent类开发应避免Python独舞,奏响多技术交响曲
在大模型AI Agent开发领域,Python凭借其灵活性和丰富的生态成为主流技术栈,但过度依赖单一语言将导致系统性能瓶颈、架构僵化及用户体验割裂。本文通过对比技术栈的优劣势、剖析微服务设计的底层逻辑,以及结合云原生与AI原生的融合趋势,揭示混合技术栈的必要性——唯有打破“Python至上”的思维定式,才能构建兼具敏捷性、扩展性和健壮性的下一代智能系统。
2025-04-11 00:19:38
988
1
通向架构师的道路(第二十七天)应用IBM网格计算提高批处理能力的sample工程
2013-01-15
通向架构师的道路(第二十五天)SSH的单元测试与dbunit的整合的例子
2012-12-03
SSH_Alpha工程人附属lib包
2012-10-22
原版精美通向架构师的道路第十四天至第十七天Word文档
2012-10-22
openssl for win
2012-08-10
Experience J2EE! Using WebSphere Application Server V6.1
2011-04-04
高杰的JBPM从入门到精通
2011-04-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人