TGITCIC-优快云博客

原创一文说清Token这个大模型中的数字乐高积木的作用

在人工智能的世界里，每个字、词甚至符号都是大模型手中的"数字积木"——token。这些看不见的"乐高块"组成了机器理解语言的基础，从"哈哈"到"孙悟空"，从标点到表情符号，token通过智能拆分与重组，让AI既能精准推断逻辑，又能流畅生成文字。本文通过生活化案例与对比实验，揭秘token如何成为连接人类语言与AI世界的桥梁，并揭示其背后的技术逻辑与商业价值。

2025-04-27 19:02:27 323

原创 AI Agent开发第46课-AI Agent开发必学之DIFY-安装

本教程详细介绍了为什么在AI Agent开发过程中必须要使用工作流，以及AI工作流Dify最新版的安装，更讲述了在网上不呈提及的如何使用Restful API访问Dify中不同工作流的方法，为不可多得的Dify入门教程。

2025-04-27 18:49:59 189

原创从OpenAI收购实时数据引擎揭示AI数据库进化方向

OpenAI收购实时分析数据库Rockset，标志着AI与数据库技术的深度融合。Rockset凭借其创始人深厚的数据库背景和实时处理能力，成为AI时代数据基础设施的关键拼图。此次收购揭示未来数据库将向实时化、智能化、多模态方向演进，以支撑大模型对动态数据的实时交互需求，推动AI应用从“预设规则”转向“自主进化”。

2025-04-26 18:46:43 619

原创 AI Agent开发第45课-AI项目实施过程中的数据安全治理技术秘籍

整个AI Agent所涉及到的安全远远不止提示词防落风险，还有防沉迷、青少年保护、算法漏洞、风险保障、个人信息保护、数据保护等许多点需要做防范，今天就带领大家来看一下数据安全防护这一块，顺便提一句，本人在写这些安全相关篇章的都是参照了自己亲手刚过得国家AIGC管理规范并拿到了多个AIGC备案的实战案例以及技术细节所写，不仅仅写理论更有技术解决方案附给大家，因此如果你能吸收和消化这些章节，对于你或者你的公司的AIGC备案和企业AI项目落地这块是有着至关重要的指导性作用的

2025-04-26 07:38:52 240

原创 AI Agent开发第44课一句话让DeepSeek思考停不下来，北大团队揭露新型AI攻击

在一个平常的研究日，北大团队偶然发现了一个让DeepSeek无法自拔的短语。这个看似简单，不具威胁的信息——“树中两条路径之间的距离”，竟然像魔咒一样，让DeepSeek陷入了无限思考的逆境。也许是偶然，但瞧这结果，简直堪称“科技界的笑话”。

2025-04-25 22:23:49 48

原创一文说清智能体与工作流的区别：数字时代的齿轮与大脑

工作流作为数字化转型的基石，从上世纪70年代的流程自动化到现代AI智能体的崛起，始终是企业运转的核心逻辑。本文通过解析工作流（Workflow）与智能体（Agent）的进化脉络，揭示二者如何从“齿轮”到“大脑”的协同中重塑企业生产力。从BPM到EAI，再到AI Agent的集成，工作流始终以可视化、可配置的特性，为智能体提供动态适配的“神经网络”，最终在成本、效率与创新间找到平衡点。

2025-04-25 16:42:58 712

原创 DeepSeek的V3和R1到底有什么区别？在企业落地时可千万不能乱选

Deepseek V3与R1是深度求索公司推出的双子星AI模型，前者以混合专家架构实现通用场景的高效处理，后者通过强化学习专精复杂推理。V3凭借6710亿参数的MoE架构，可快速完成文本转换、多语言翻译等基础任务，延迟降低42%；R1则通过1.2亿条推理链训练，在金融分析、客服系统等需要多层逻辑的场景中准确率达79.8%。两者成本相差悬殊，V3 API输出仅需R1的1/8，却在推理深度上形成互补。

2025-04-24 15:02:10 1118

原创扩散模型如何重塑语言生成革命

扩散模型以"噪声-去噪"的双螺旋机制，正在语言生成领域掀起颠覆性变革。通过对比GANs与自回归模型的局限性，揭示其在生成质量、并行计算、动态控制三方面的突破性优势。本文结合Mercury模型每秒千级令牌生成速度、CIFAR-10数据集80%鲁棒性等实证数据，解析扩散模型如何通过"逆向思维"实现文本生成效率与质量的双重跃迁，最终指向其在个性化学习、终身进化等领域的终极潜力。

2025-04-24 02:15:18 1018

原创 AI Agent开发第43课-亲手来验证怎么篡改AI Agent的身份设定以及相关防御手法

这一篇是从实际例子来看到底AI Agent和RAG类系统中存在的漏洞会带来什么危害，在本篇中会有实际“绕开AI Agent”的身份设定手法，也是引用自AI Agent开发第35课中的理论而来。这个手法截止4月23日今天写作时还是依旧对于90%以上的AI Agent有效，这足以让我们引起重视并且需要好好防护我们的AI Agent系统，因此今天的课程会通过这样实战化的攻防并针对这一类“攻击”给出完整解决和防御手段。

2025-04-24 00:19:32 596

原创 AI Agent开发第37课-DeepSeek的多模态版JanusPro-7B本地安装

搜遍Janus Pro git issues、谷哥、国内网络，教程全都是错的。因此还是决定写一部全网唯一正确的教程。目前网上的教程包括外网的教程都是“缺斤少量”，按照那些教程操作下来不是装不起来，就是装起来只能CPU运行，或者运行起来了Janus的Web前端老是转啊转不出内容。

2025-04-23 08:28:40 86

原创数据蒸馏到底是什么？一文为你解锁AI知识传承的密码

数据蒸馏是AI领域突破性的知识压缩技术，通过将复杂模型的隐性知识提炼为轻量级模型可吸收的显性知识，实现效率与性能的平衡。这项技术在医疗影像分析中已实现98%精度下推理速度提升40倍，正成为AI普惠化落地的核心引擎。

2025-04-22 21:49:52 454

原创 AI Agent开发第36课-高性能企业RAG中的核心分块“艺术”

刚又落地完一个大型企业级RAG，携带着大量成功的宝贵经验和实例来告诉大家一个优秀的RAG系统中切片是怎么做的。企业落地AI项目时切片的成功意味着项目已经成功了90%，那么究竟优秀的RAG系统的切片是怎么做得呢？本文带你揭晓迷底。

2025-04-22 19:10:04 114

原创解码思维链：AI思维链如何重塑人类与机器的对话逻辑

思维链（Chain of Thought, CoT）是人工智能领域突破性技术，通过引导AI像人类般分步推理，将原本"黑匣子"式的模型转化为可解释的推理引擎。本文解密其如何破解复杂问题、提升推理精度，结合医疗诊断、代码调试等场景实证，揭示从手动指导到AI自进化思维链的演进路径。

2025-04-22 16:36:48 744

原创顶尖团队再提模态链范示：机器人仅凭人类视频实现精准操作，准确率飙升200%

李飞飞团队提出模态链（CoM），通过融合人类演示视频中的视觉、肌肉信号与环境声音，使机器人首次实现单次观看即可精准复刻拧瓶盖、插插头等复杂操作。实验显示任务计划识别准确率提升200%，真实世界成功率高达73%，为具身智能开辟新路径。

2025-04-22 16:27:19 413

原创 AI Agent开发第35课-揭秘RAG系统的致命漏洞与防御策略

本文揭示AI客服系统面临的诱导式攻击风险，包括身份篡改、虚假信息生成及恶意绕过机制。通过系统架构优化、多层内容过滤及合规框架构建，提出可落地的防御策略，保障企业服务安全。

2025-04-21 23:15:37 226

原创智驱未来：AI大模型重构数据治理新范式

人工智能大模型正以指数级速度重塑数据治理生态，通过自动化数据清洗、智能分类标注、实时安全监控等技术突破，将传统数据治理效率提升40%以上。本文以微软Azure数据治理平台、谷歌Vertex AI为案例，揭示AI驱动的数据治理如何在跨国企业中实现数据价值释放，同时探讨数据伦理、安全防护等关键挑战的解决方案。

2025-04-21 20:03:26 885

原创 AI Agent开发第34课-用最先进的图片向量BGE-VL实现“图搜图”-下

对于“以图搜图”的需求我们一定要使用图片向量化的技术手段，而不能使用多模态AI解读图片含意后再把含意文字内容做向量去搜索，这是绝对错误的。在这篇博客中我们就会把在基于BGE-VL基础上编写成的Restful API用于实际生产环境-智能导购场景中去，并会给出全代码示便来演示BGE-VL的图片向量化搜索有多精准。

2025-04-21 19:55:29 371

原创知擎世纪：大模型时代知识库的正确建立法则

在大模型与知识库的碰撞中，传统知识库正从"信息仓库"蜕变为"智能决策中枢"。本文通过场景驱动、知识分层、动态治理三大核心路径，揭示知识库构建的底层逻辑，以特斯拉的自动驾驶知识系统、微软Teams的对话引擎为例，拆解如何将数据转化为可执行的智慧资产，为企业在AI时代构建真正的知识竞争力。

2025-04-21 15:12:00 718

原创解码AI RAG背后向量点积与余弦的秘密

本文揭示了向量点积与余弦相似度作为RAG（检索增强生成）核心技术的数学本质。通过代数与几何双重视角解析点积运算，结合NLP任务中的文本嵌入、注意力机制等实例，阐明其如何成为连接人类知识图谱与AI推理能力的关键桥梁。实验数据显示，在法律文书检索场景中，基于余弦相似度的RAG模型较传统TF-IDF方法提升37%的召回率，证明其在复杂语义匹配任务中的不可替代性。

2025-04-21 03:57:10 816

原创 AI Agent开发第33课-用最先进的图片向量BGE-VL实现“图搜图”-上

这篇博客要说的是如何让大模型通过用户输入的商品图片来搜RAG库内有无相同的商品的一种“图搜图”技术，业界又叫“智能图片搜索引擎”或者“多模态搜索”技术，如：某宝、某东、某多上的“搜索栏内输入图片”然后通过输入的图片来搜商品的技术。这种技术和多模态的大模型里的“AI通过图片识别图片”是完全不一样的，这次要讲的技术是纯纯的通过图片的相识度来寻找库内的商品的。这是因为图片也可以向量化。我们将使用国货之光BGE-VL来实现图搜图功能

2025-04-21 03:31:29 343

原创 GraphRAG与RAG的区别和原理简介

GraphRAG是微软于2024年推出的融合知识图谱与大语言模型的框架，通过将符号化知识图谱与生成式模型结合，突破传统RAG框架的局部文本匹配局限。其核心优势在于通过全局图谱推理提升复杂问题的解答精度，实测在RobustQA基准测试中达到86%准确率，远超传统RAG框架的76%。本文通过对比LightRAG、KAG等竞品，结合美团大脑、虾皮电商等案例，解析其技术原理与落地价值。

2025-04-19 18:24:50 890

原创向量陷阱：关键词、长度与相关性如何误导Embedding模型？

文本向量的余弦相似度常被视作语义关联的“黄金标准”，但实验表明，句子长度、内容相关性及关键词重叠会显著干扰模型判断。不同模型（如BGE-M3、Jina-v3）对这些因素的响应差异显著：BGE-M3易受无关内容干扰，而Jina-v3更擅长捕捉深层语义。关键词重叠可提升相似度达15%，但噪音内容可能掩盖真实语义。研究揭示，单纯依赖相似度阈值的RAG系统需警惕“伪相关”，需结合语境分析与模型选择策略。

2025-04-19 18:17:15 607

原创 Python：编程界的终极解药？揭秘“最后一门语言“的生态霸权

Python正以指数级速度吞噬全球开发者的注意力——从华尔街量化交易到火星探测器代码，从AI模型训练到Excel脚本自动化，其生态触角已延伸至人类科技文明的每一个毛细血管。本文通过解构Python的技术基因、产业渗透路径及历史偶然性，揭示为何这门诞生于1991年的语言正在重构软件工程范式，并探讨其"终局理论"背后隐藏的底层逻辑悖论。

2025-04-18 14:33:42 536

原创重构未来智能：Anthropic 解码Agent设计哲学三重奏

本文深入解析Anthropic提出的构建高效AI智能体三大核心原则：任务适配性筛选、极简主义架构迭代与认知视角同理心。通过对比LLM发展阶段，揭示智能体在复杂任务场景中的独特价值，并结合编程、医疗诊断等真实案例，论证其技术可行性边界。研究指出，当前智能体仍需突破预算感知与异步协作两大瓶颈，为下一代AI系统进化提供方向指引。

2025-04-18 14:21:17 1026

原创解码未来：大语言模型训练与推理的双螺旋进化之路

在算力与算法的交响中，大语言模型正以指数级速度重塑人类认知边界。本文通过拆解训练与推理的底层逻辑，结合谷歌、OpenAI等头部企业的实践案例，揭示两者在资源消耗、硬件适配等方面的本质差异，为读者构建理解AI技术革命的全景图。

2025-04-16 15:40:30 754

原创长上下文时代：RAG的块大小为何仍需克制？

随着LLM（大语言模型）的上下文窗口扩展至百万级token，RAG（检索增强生成）系统是否需要同步扩大文本块拆分尺寸？本文通过技术矛盾分析、实证数据对比及行业实践验证，揭示了一个看似矛盾的结论：即使LLM能处理超长上下文，RAG的块大小仍应保持在128-1024 tokens的区间内。这一选择源于嵌入模型的硬件限制、注意力机制的聚焦困境，以及检索效率与信息密度的平衡需求。

2025-04-16 02:47:41 1078

原创 AI Agent开发第32课-微调自己的YOLO12来做复杂图像鉴别-下

通过详细讲述对于YOLO12的微调如何让AI以几乎99%的精准度识别和检测复杂生活场景中的物体，并通过这一实例带大家一步步深入到大模型的高阶应用中去，本文中还提供了生产环境上的5个python工具的代码均为全代码分享，为网上绝无仅有的说透了YOLO模型的最佳教程。

2025-04-15 22:52:18 409

原创 AI Agent开发第31课-微调自己的YOLO12来做复杂图像鉴别-上

YOLO12发布了，它比之前的版本快了30%多，并且包含了更丰富的图片预训练数据集。市面上的很多物体、图片鉴片用的都是YOLO模型，本系列会完整讲述YOLO12怎么使用以及对YOLO12微调训练来满足一个非常复杂的现实生活中的混合物体的识别场景。

2025-04-15 17:27:09 515

原创代码荒漠化时代：Python之父的吐槽到底刺痛了谁的神经？

Python创始人Guido van Rossum近期在开发者峰会上犀利指出，当代程序员过度依赖预封装工具，基础编程能力正面临系统性退化。数据显示，72%的开发者日常代码量不足百行，而框架调用占比却超过80%。这场关于"工具依赖症"的论战，不仅关乎技术伦理，更折射出数字时代知识传承的深层危机。

2025-04-15 15:56:23 563

原创 AI Agent开发第30课-从像素到智能——图像识别实战指南

本文以极简主义视角解构图像识别技术的核心原理与工程实践，涵盖数据标注、模型构建、训练优化全流程。通过对比传统计算机视觉方法与深度学习范式，揭示图像识别在医疗诊断、自动驾驶等领域的突破性应用。提供PyTorch完整代码示例，手把手演示如何将百万级像素转化为可解释的智能决策系统，助力开发者快速掌握工业级图像分析能力。

2025-04-14 16:36:49 86

原创当“知识块”突破4K：向量模型为何会“失明”？

长文本向量模型在处理超长语料时遭遇显著性能退化，归一化相似度得分从短文本的0.37骤降至8K tokens时的0.10，分离度指标近乎消失。实验表明，即使通过查询扩展优化，模型仍难以克服注意力机制瓶颈，且语义推理能力严重依赖表面匹配。本文揭示现有技术在真实场景中的局限性，并提出改进方向。

2025-04-14 16:05:35 482

原创 AI Agetn开发第29课-前沿得高级RAG+设计是如何消灭幻觉的设计技巧

企业落地AI经常遇到幻觉，RAG系统中如何消除幻觉呢？近来出现的RAG+、高级RAG到底是个什么样的东西呢？目前网上充斥着大量这方面的论文，很可惜这些论文或者有关的博客都是翻译别人lao wai的英语资料，连举得例子都是什么：棒球赛、超级杯，非旦没有解释清RAG+的精髓也讲得不接地气没有真正领悟到其中的要点，本篇就是总结自大量国内实战项目一线项目里的例子讲透了RAG+的Rewrite, Retrieve, Read三步到底应该怎么走才是最合理。

2025-04-14 15:48:08 58

原创 Llama 4 1000 万的token 上下文代表RAG“已死”吗？

当Meta的Llama 4 Scout以千万级token的上下文窗口引发“RAG已死”论战时，我们正站在AI技术的关键转折点。RAG（检索增强生成）并非被取代，而是进化为更智能的知识整合引擎。本文通过对比长上下文模型与RAG的优劣，揭示二者如何互补：长上下文解决信息容量，RAG确保精准与安全。从医疗到金融，真实案例证明，唯有融合技术方能应对现实挑战。

2025-04-14 03:18:57 571

原创 AI Agent开发大全第二十八课-MCP实现本地命令调用怎么做的？

本文通过一个让MCP执行本地命令行充当一个智能Devops的功能来讲解如何用MCP真正的充当AI Agent的“手”和“脚”的能力。

2025-04-14 00:58:06 1281

原创 Agent革命：Google AI白皮书解密未来智能体的进化之路

Google最新发布的AI Agent白皮书揭示了“智能体”（Agent）这一技术范式的核心逻辑——通过整合语言模型、外部工具与动态编排层，突破传统生成式AI的边界。Agent以自主规划、实时交互与目标导向为特征，重新定义了机器智能的协作模式。本文将拆解Agent的架构设计、对比传统模型的差异，并通过真实案例解析其在医疗、金融等领域的落地潜力，揭示这场技术革命如何重塑人机协作的未来。

2025-04-13 16:08:24 765

原创百分之97精准无师自通-扭矩聚类算法引爆AI自主学习革命

悉尼科技大学团队开发的扭矩聚类算法突破AI学习范式，无需人工标注实现97.7%准确率，其灵感源自星系扭矩平衡原理，可自主适应复杂数据形态。在1000个数据集测试中，其调整互信息（AMI）得分远超传统方法，为医疗、金融、天文等领域提供高效解决方案，标志着无监督学习技术的里程碑式跨越。

2025-04-12 15:59:34 395

原创 AI狂潮下Python开发者需求暴涨300%，人机协作时代已至

AI技术席卷全球，"程序员失业论"甚嚣尘上，但数据揭示出截然不同的图景：Python开发者岗位需求激增300%，企业对掌握AI工具的程序员需求暴增。AI并非替代者，而是生产力革命的"加速器"。本文通过真实案例、行业数据与技术对比，解析Python为何成为人机协作时代的"黄金技能"，并揭示程序员如何在AI浪潮中占据先机。

2025-04-12 15:14:54 646

原创 AI Agent开发大全第二十六课-再通过复杂案例来看MCP的“热插拨”机制及应用场景如何

本篇是对上3篇MCP系列的一个增强例子，带来了一个真正的MCP热插拨的全过程演示，直接从代码和运行上大家可以体验到MCP到底如何做到热插拨的，同时还详细讲述了MCP的设计模式以及MCP在业务场景中的适用情况。

2025-04-11 22:11:18 463

原创 AI Agent开发大全第二十五课-用本地模型iopaint开发一个超酷的AI图片处理Agent(下)

使用本地iopaint实现AI图片自动去除背景、水印的全代码。并以此例讲解了在AI Agent开发领域中图片相关的常用、基本处理原理与代码实现，例子实现后的效果相当的炸裂，并且留下了一个实用的框架可以任由读者们继续加自己的功能。

2025-04-11 15:48:34 269

原创 AI Agent类开发应避免Python独舞，奏响多技术交响曲

在大模型AI Agent开发领域，Python凭借其灵活性和丰富的生态成为主流技术栈，但过度依赖单一语言将导致系统性能瓶颈、架构僵化及用户体验割裂。本文通过对比技术栈的优劣势、剖析微服务设计的底层逻辑，以及结合云原生与AI原生的融合趋势，揭示混合技术栈的必要性——唯有打破“Python至上”的思维定式，才能构建兼具敏捷性、扩展性和健壮性的下一代智能系统。

2025-04-11 00:19:38 988 1

通向架构师的道路（第二十七天）应用IBM网格计算提高批处理能力的sample工程

该Sample工程为通向架构师的道路（第二十七天）应用IBM网格计算提高批处理能力一文中所用的例子。它是基于ibm compute grid的批处理开发框架v.6.1.1.1.1基础上来开发的。包含有用于读的样本文本文件、源代码与相关配置。

2013-01-15

通向架构师的道路（第二十五天）SSH的单元测试与dbunit的整合的例子

通向架构师的道路（第二十五天）SSH的单元测试与dbunit的整合的例子，内含maven的pom.xml文件与build.xml

2012-12-03

通向架构师的道路第十八到第二十三天的例子

2012-12-02

maven-ant-tasks-2.1.3.jar

2012-11-19

SSH_Alpha工程人附属lib包

通向架构师的道路（第十八天）万能框架Spring(一）教程所属相关工程，大家可以下载下来后导入eclipse用，相关的lib目录下的jar文件已经删了，大家可以自行去下载spring3, struts1.3, hibernate3与jasypt，这些网上都是公开和免费的。我也上传了一份，我本意是大家自己去把这些包整合起来因为我已经发了jar list，不过因为是我整合的，因此收资源分1分

2012-10-22

原版精美通向架构师的道路第十四天至第十七天Word文档

此为本人原版word文档，用于在公司内部作技术强化用，原名为“通向八段的道路”，因为本系列计划想写365天，研读完365天的人应该达到或者超过一个5年-6年的左右的高级J2EE工程师，自己曾经研究过IBM上海GDCC以及IBM上海Innovation觉得该365天内容学完可以初步达到IBM内部八段的水平及相当于一个架构师的水平。本人在公司内部发布该套教程时同时在网上也进行发布起名为“通向架构师的道路”，而此次上传的为原版精排版word文档，带有目录和完整正确格式的文档，希望能以此给更多的读者在今后的工作和学习中带来帮助

2012-10-22

mod_jk for apache 2.2.x

2012-08-18

openssl for win

网上下载的openssl for win虽然是.exe文件和dll的组合，但是由于其是从linux/unix下编译过来的，因此它的一些目录与配置文件尚保留着linux/unix下的格式，比如说你装在d:\openssl目录下，它的conf文件内对于内带ca的引用还是/home/democa这样的格式，因此这些目录与资源的引用需要改成windows下的目录和路径相关。为方便大家使用，我已经进行了相关的修改，大家下载此openssl for win后解压后直接在windows环境变量设置相关的： OPENSSL_HOME与openssl_conf 即可使用，为此我收取资源分1点！

2012-08-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

通向架构师的道路（第二十七天）应用IBM网格计算提高批处理能力的sample工程

通向架构师的道路（第二十五天）SSH的单元测试与dbunit的整合的例子

通向架构师的道路第十八到第二十三天的例子

maven-ant-tasks-2.1.3.jar

SSH_Alpha工程人附属lib包

原版精美通向架构师的道路第十四天至第十七天Word文档

mod_jk for apache 2.2.x

openssl for win

IBM RAD7.5开发指南part3(全图文教程,超灵)

IBM RAD7.5开发指南part2(全图文教程,超灵)

IBM RAD7.5开发指南part1(全图文教程,超灵)

Experience J2EE! Using WebSphere Application Server V6.1

高杰的JBPM从入门到精通

fox999_workflow_features_2004A

ibatis 开发指南

jbossgettingstart

hypersonic

spring in action

空空如也