[{"data":1,"prerenderedAt":3429},["ShallowReactive",2],{"search-docs":3,"doc-\u002Fai\u002Frag\u002Fembedding":886},[4,8,12,16,20,24,28,32,36,40,44,48,52,56,60,64,68,72,76,80,84,88,92,96,100,104,108,112,116,120,124,128,132,136,140,144,148,152,156,159,162,165,169,172,175,178,182,186,190,194,198,202,206,210,214,218,222,226,230,234,238,242,246,250,254,258,262,266,269,273,277,281,285,288,291,294,298,301,304,307,310,313,316,319,322,325,329,332,336,340,344,348,352,356,359,362,365,368,371,374,377,380,383,386,389,393,396,399,402,405,408,411,414,417,420,424,428,432,435,438,442,446,450,454,458,462,466,470,474,477,480,483,487,491,494,497,500,504,507,511,515,518,521,524,527,530,533,536,539,542,545,548,551,554,557,560,563,566,569,572,575,579,583,587,591,595,599,603,606,610,614,617,620,623,626,629,633,637,640,643,646,649,652,655,658,661,664,667,670,673,676,679,682,685,688,691,694,697,700,703,706,709,712,716,720,724,728,732,736,740,744,748,752,756,760,764,768,772,775,779,783,787,790,793,796,799,802,805,808,811,814,818,822,825,829,832,835,838,841,844,848,851,854,858,862,865,869,873,876,879,882],{"path":5,"title":6,"description":7},"\u002Fabout\u002Fauthor","作者相关","只想纯粹的做一个程序员...",{"path":9,"title":10,"description":11},"\u002Fabout\u002Fjourney","心路历程","",{"path":13,"title":14,"description":15},"\u002Fai\u002Fagent\u002Fframeworks","Agent 框架","主流 Agent 框架：LangChain、LlamaIndex、AutoGen、CrewAI",{"path":17,"title":18,"description":19},"\u002Fai\u002Fagent\u002Fhooks","Agent Hooks 与自动化","Claude Agent 的 Hooks 生命周期、事件类型、典型自动化场景",{"path":21,"title":22,"description":23},"\u002Fai\u002Fagent\u002Fintroduction","AI Agent 概述","AI Agent 核心概念：感知、规划、执行、记忆",{"path":25,"title":26,"description":27},"\u002Fai\u002Fagent\u002Fpractice","Agent 实战","AI Agent 实战：构建自主任务执行系统",{"path":29,"title":30,"description":31},"\u002Fai\u002Fagent\u002Fsdk","Claude Agent SDK 开发","使用 Claude Agent SDK 构建自定义 AI Agent：架构、API、生命周期",{"path":33,"title":34,"description":35},"\u002Fai\u002Fagent\u002Fsubagents","Subagents 子代理","用 Subagents 分解复杂任务、并发执行、隔离上下文",{"path":37,"title":38,"description":39},"\u002Fai\u002Fagent\u002Ftool-use","工具调用","AI Agent 工具调用：Function Calling、Tool Use 原理与实践",{"path":41,"title":42,"description":43},"\u002Fai\u002Ffundamentals\u002Fdeep-learning","深度学习入门","深度学习基础知识：前向传播、反向传播、损失函数、优化器",{"path":45,"title":46,"description":47},"\u002Fai\u002Ffundamentals\u002Fml-basics","机器学习基础","机器学习核心概念：监督学习、无监督学习、强化学习",{"path":49,"title":50,"description":51},"\u002Fai\u002Ffundamentals\u002Fneural-networks","神经网络原理","神经网络架构：CNN、RNN、注意力机制",{"path":53,"title":54,"description":55},"\u002Fai\u002Fgetting-started","AI 学习路线","AI 技术学习路线图，从基础到实战的完整指南",{"path":57,"title":58,"description":59},"\u002Fai\u002Fllm\u002Ffine-tuning","模型微调","大模型微调技术：LoRA、QLoRA、全量微调、RLHF",{"path":61,"title":62,"description":63},"\u002Fai\u002Fllm\u002Fintroduction","大模型概述","大语言模型发展历程、核心能力与主流模型对比",{"path":65,"title":66,"description":67},"\u002Fai\u002Fllm\u002Flocal-deploy","本地部署","大模型本地部署：Ollama、vLLM、llama.cpp",{"path":69,"title":70,"description":71},"\u002Fai\u002Fllm\u002Ftransformer","Transformer 架构","Transformer 架构详解：自注意力机制、位置编码、多头注意力",{"path":73,"title":74,"description":75},"\u002Fai\u002Fmcp\u002Fclient","MCP Client 开发","MCP Client 开发指南：连接、调用、集成",{"path":77,"title":78,"description":79},"\u002Fai\u002Fmcp\u002Fdebugging","MCP 调试与排错","MCP Server 开发与集成过程中的常见问题、日志分析、诊断工具",{"path":81,"title":82,"description":83},"\u002Fai\u002Fmcp\u002Fintroduction","MCP 概述","Model Context Protocol 协议概述：架构、核心概念、应用场景",{"path":85,"title":86,"description":87},"\u002Fai\u002Fmcp\u002Fserver","MCP Server 开发","MCP Server 开发指南：资源、工具、提示词的实现",{"path":89,"title":90,"description":91},"\u002Fai\u002Fmcp\u002Ftools","MCP Tools 深入","深入理解 MCP Tools：与 Resources\u002FPrompts 的差异、Schema 设计、Annotations 与权限控制",{"path":93,"title":94,"description":95},"\u002Fai\u002Fprompt\u002Fadvanced","高级 Prompt 模式","高级 Prompt 设计模式：Tree-of-Thought、自我反思、多轮对话策略",{"path":97,"title":98,"description":99},"\u002Fai\u002Fprompt\u002Fbasics","Prompt 基础","Prompt Engineering 入门：基本概念、角色设定、输出格式控制",{"path":101,"title":102,"description":103},"\u002Fai\u002Fprompt\u002Ftechniques","提示词技巧","常用提示词技巧：Few-shot、Chain-of-Thought、ReAct",{"path":105,"title":106,"description":107},"\u002Fai\u002Frag\u002Fembedding","文本嵌入","文本嵌入模型：Embedding 原理、模型选择、相似度计算",{"path":109,"title":110,"description":111},"\u002Fai\u002Frag\u002Fintroduction","RAG 概述","检索增强生成（RAG）架构原理、优势与应用场景",{"path":113,"title":114,"description":115},"\u002Fai\u002Frag\u002Fpractice","RAG 实战","RAG 应用实战：文档问答系统、知识库搭建",{"path":117,"title":118,"description":119},"\u002Fai\u002Frag\u002Fvector-database","向量数据库","主流向量数据库对比：Milvus、Pinecone、Chroma、Weaviate",{"path":121,"title":122,"description":123},"\u002Fai\u002Fskills\u002Fbest-practices","Skill 最佳实践","编写高质量 Skill 的设计原则、常见陷阱与优化技巧",{"path":125,"title":126,"description":127},"\u002Fai\u002Fskills\u002Fcreating","创建自定义 Skill","从零编写一个可被 Agent 自动发现和调用的 Skill",{"path":129,"title":130,"description":131},"\u002Fai\u002Fskills\u002Fintroduction","Agent Skills 概述","Claude Agent Skills 概念、工作原理、与 Tools\u002FMCP 的区别",{"path":133,"title":134,"description":135},"\u002Fgolang\u002Fadvanced\u002Fconcurrency","Go - 并发深入","深入理解 Go 并发编程的核心机制。",{"path":137,"title":138,"description":139},"\u002Fgolang\u002Fadvanced\u002Fgc","Go - 垃圾回收","理解 Go 的垃圾回收机制，掌握 GC 调优方法。",{"path":141,"title":142,"description":143},"\u002Fgolang\u002Fadvanced\u002Fgmp","Go - GMP 调度模型","GMP 是 Go 运行时调度器的核心模型，理解它对于编写高性能 Go 程序至关重要。",{"path":145,"title":146,"description":147},"\u002Fgolang\u002Fadvanced\u002Fgo-concurrency","Go - 并发编程","Go 的并发是其核心特性之一，通过 Goroutine 和 Channel 实现。",{"path":149,"title":150,"description":151},"\u002Fgolang\u002Fadvanced\u002Fmemory","Go - 内存模型","理解 Go 的内存分配机制和内存模型。",{"path":153,"title":154,"description":155},"\u002Fgolang\u002Fadvanced\u002Fprofiling","Go - 性能分析","掌握 Go 的性能分析工具：pprof、trace、benchmark。",{"path":157,"title":158,"description":11},"\u002Fgolang\u002Fcore\u002Fgo-basic","Go - 基础语法",{"path":160,"title":161,"description":11},"\u002Fgolang\u002Fcore\u002Fgo-composite","Go - 复合类型",{"path":163,"title":164,"description":11},"\u002Fgolang\u002Fcore\u002Fgo-control","Go - 流程控制",{"path":166,"title":167,"description":168},"\u002Fgolang\u002Fcore\u002Fgo-error","Go - 错误处理","Go 使用显式的错误返回值来处理错误，而不是异常机制。",{"path":170,"title":171,"description":11},"\u002Fgolang\u002Fcore\u002Fgo-function","Go - 函数",{"path":173,"title":174,"description":11},"\u002Fgolang\u002Fcore\u002Fgo-install","Go - 环境搭建",{"path":176,"title":177,"description":11},"\u002Fgolang\u002Fcore\u002Fgo-interface","Go - 接口",{"path":179,"title":180,"description":181},"\u002Fgolang\u002Fcore\u002Fgo-module","Go - 包管理","Go Modules 是 Go 1.11 引入的官方依赖管理方案，Go 1.16 后成为默认模式。",{"path":183,"title":184,"description":185},"\u002Fgolang\u002Fdistributed\u002Fgrpc","Go - gRPC","gRPC 是 Google 开发的高性能 RPC 框架，使用 Protocol Buffers 作为序列化协议。",{"path":187,"title":188,"description":189},"\u002Fgolang\u002Fdistributed\u002Fmicroservice","Go - 微服务","微服务架构的核心组件：服务发现、负载均衡、熔断降级。",{"path":191,"title":192,"description":193},"\u002Fgolang\u002Fdistributed\u002Fmq","Go - 消息队列","使用 Go 操作 Kafka 和 RabbitMQ。",{"path":195,"title":196,"description":197},"\u002Fgolang\u002Fdistributed\u002Fredis","Go - Redis","使用 go-redis 操作 Redis，实现缓存、分布式锁等功能。",{"path":199,"title":200,"description":201},"\u002Fgolang\u002Fengineering\u002Fconfig","Go - 配置管理","使用 viper 进行配置管理，支持多种配置格式和配置中心。",{"path":203,"title":204,"description":205},"\u002Fgolang\u002Fengineering\u002Fdocker","Go - Docker 部署","使用 Docker 容器化部署 Go 应用。",{"path":207,"title":208,"description":209},"\u002Fgolang\u002Fengineering\u002Fkubernetes","Go - Kubernetes 部署","在 Kubernetes 上部署和管理 Go 应用。",{"path":211,"title":212,"description":213},"\u002Fgolang\u002Fengineering\u002Flogging","Go - 日志系统","使用 zap 和 logrus 构建高性能结构化日志系统。",{"path":215,"title":216,"description":217},"\u002Fgolang\u002Fengineering\u002Ftesting","Go - 单元测试","Go 内置了强大的测试框架，掌握测试是编写高质量代码的基础。",{"path":219,"title":220,"description":221},"\u002Fgolang\u002Fstdlib\u002Fbufio","bufio","在 Go 语言中，bufio 包提供了带缓冲的 I\u002FO 操作，能够提高读写性能。以下是一些常用的 bufio 包 API 及其详细说明：",{"path":223,"title":224,"description":225},"\u002Fgolang\u002Fstdlib\u002Fcontainer","container","在Go语言标准库中，container 包提供了几种常用的数据结构实现，这些数据结构对于高效地管理和操作数据非常有用。以下是 container 包中主要的数据结构：",{"path":227,"title":228,"description":229},"\u002Fgolang\u002Fstdlib\u002Fcrypto","crypto","在 Go 语言中，crypto 包提供了一组用于加密和解密的功能。以下是一些常用的 crypto 包及其子包的 API 及其详细说明：",{"path":231,"title":232,"description":233},"\u002Fgolang\u002Fstdlib\u002Fencoding-csv","encoding\u002Fcsv","在 Go 语言中，encoding\u002Fcsv 包提供了对 CSV（逗号分隔值）文件进行读写的功能。以下是一些常用的 encoding\u002Fcsv 包的 API 及其详细说明：",{"path":235,"title":236,"description":237},"\u002Fgolang\u002Fstdlib\u002Fencoding-json","encoding\u002Fjson","在 Go 语言中，encoding\u002Fjson 包提供了对 JSON 数据进行编码和解码的功能。以下是一些常用的 encoding\u002Fjson 包的 API 及其详细说明：",{"path":239,"title":240,"description":241},"\u002Fgolang\u002Fstdlib\u002Fencoding-xml","encoding\u002Fxml","在 Go 语言中，encoding\u002Fxml 包提供了对 XML 数据进行编码和解码的功能。以下是一些常用的 encoding\u002Fxml 包的 API 及其详细说明：",{"path":243,"title":244,"description":245},"\u002Fgolang\u002Fstdlib\u002Fflag","flag","在Go语言中，flag 包是用于处理命令行参数的标准库，它提供了一种简单而直接的方式来解析和使用命令行参数。下面是关于 flag 包的一些基本介绍和常用功能：",{"path":247,"title":248,"description":249},"\u002Fgolang\u002Fstdlib\u002Ffmt","fmt","在 Go 语言的标准库中，fmt 包是非常重要的，它提供了处理格式化输入和输出的基本工具。以下是一些 fmt 包内常用的API：",{"path":251,"title":252,"description":253},"\u002Fgolang\u002Fstdlib\u002Fhttp","net\u002Fhttp","在 Go 语言中，net\u002Fhttp 包提供了用于构建 HTTP 客户端和服务器的强大工具。以下是一些常用的 net\u002Fhttp 包的 API 及其详细说明：",{"path":255,"title":256,"description":257},"\u002Fgolang\u002Fstdlib\u002Fio","io","在 Go 语言中，io 包提供了基本的输入输出功能。以下是一些常用的 io 包的 API 及其详细说明：",{"path":259,"title":260,"description":261},"\u002Fgolang\u002Fstdlib\u002Flog","log","在 Go 语言中，log 包提供了简单的日志记录功能。以下是一些常用的 log 包的 API 及其详细说明：",{"path":263,"title":264,"description":265},"\u002Fgolang\u002Fstdlib\u002Fmath","math","在 Go 语言中，math 包提供了基本的数学函数和常量。以下是一些常用的 math 包的 API 及其详细说明：",{"path":267,"title":268,"description":11},"\u002Fgolang\u002Fstdlib\u002Fnet","net",{"path":270,"title":271,"description":272},"\u002Fgolang\u002Fstdlib\u002Fos","os","在Go语言中，os 包是一个非常重要且常用的标准库，它提供了与操作系统交互的功能，包括文件操作、环境变量管理、进程管理等。下面是一些 os 包中常用的功能和API：",{"path":274,"title":275,"description":276},"\u002Fgolang\u002Fstdlib\u002Fsort","order","在 Go 语言中，sort 包提供了对切片和用户定义的集合进行排序的函数。它实现了常见的排序算法，如快速排序（Quicksort）和堆排序（Heapsort），并且为自定义集合提供了接口，使得用户可以根据特定的需求进行排序。",{"path":278,"title":279,"description":280},"\u002Fgolang\u002Fstdlib\u002Fstrconv","strconv","在 Go 语言中，strconv 包提供了字符串和基本数据类型之间的转换函数，例如将整数转换为字符串、字符串转换为整数，以及其他类型之间的转换。这些功能非常有用，特别是在处理用户输入或从外部数据源读取数据时。",{"path":282,"title":283,"description":284},"\u002Fgolang\u002Fstdlib\u002Ftime","time","在 Go 语言中，time 包提供了处理时间和日期的功能。以下是一些常用的 time 包的 API 及其详细说明：",{"path":286,"title":287,"description":11},"\u002Fgolang\u002Fweb\u002Fgin\u002Ferror","Gin - 错误处理",{"path":289,"title":290,"description":11},"\u002Fgolang\u002Fweb\u002Fgin\u002Ffile","Gin - 文件处理",{"path":292,"title":293,"description":11},"\u002Fgolang\u002Fweb\u002Fgin\u002Fmiddleware","Gin - 中间件",{"path":295,"title":296,"description":297},"\u002Fgolang\u002Fweb\u002Fgin\u002Fquickstart","Gin - 快速开始","Gin 是目前最流行的 Go Web 框架，以高性能和简洁 API 著称。",{"path":299,"title":300,"description":11},"\u002Fgolang\u002Fweb\u002Fgin\u002Frequest","Gin - 请求处理",{"path":302,"title":303,"description":11},"\u002Fgolang\u002Fweb\u002Fgin\u002Fresponse","Gin - 响应处理",{"path":305,"title":306,"description":11},"\u002Fgolang\u002Fweb\u002Fgin\u002Frouter","Gin - 路由",{"path":308,"title":309,"description":11},"\u002Fgolang\u002Fweb\u002Fgin\u002Fvalidation","Gin - 参数校验",{"path":311,"title":312,"description":11},"\u002Fgolang\u002Fweb\u002Fgorm\u002Fassociation","GORM - 关联关系",{"path":314,"title":315,"description":11},"\u002Fgolang\u002Fweb\u002Fgorm\u002Fcrud","GORM - CRUD 操作",{"path":317,"title":318,"description":11},"\u002Fgolang\u002Fweb\u002Fgorm\u002Fmodel","GORM - 模型定义",{"path":320,"title":321,"description":11},"\u002Fgolang\u002Fweb\u002Fgorm\u002Fperformance","GORM - 日志与性能",{"path":323,"title":324,"description":11},"\u002Fgolang\u002Fweb\u002Fgorm\u002Fquery","GORM - 高级查询",{"path":326,"title":327,"description":328},"\u002Fgolang\u002Fweb\u002Fgorm\u002Fquickstart","GORM - 快速开始","GORM 是 Go 语言最流行的 ORM 库，功能强大，使用简单。",{"path":330,"title":331,"description":11},"\u002Fgolang\u002Fweb\u002Fgorm\u002Ftransaction","GORM - 事务与 Hook",{"path":333,"title":334,"description":335},"\u002Finterview\u002Fbasic","计算机基础面经","本章节汇总了面试中常见的通用技术概念，不局限于特定语言或数据库，是考察技术内功的关键考点。",{"path":337,"title":338,"description":339},"\u002Finterview\u002Fgolang","Golang 面试题","Go 语言面试高频考点，覆盖基础语法、数据结构、并发编程、内存管理、GC、调度器等核心知识。",{"path":341,"title":342,"description":343},"\u002Finterview\u002Fk8s","Kubernetes 面试题","Kubernetes（K8s）面试高频考点，覆盖架构原理、核心资源、网络存储、调度策略、运维监控等核心知识。",{"path":345,"title":346,"description":347},"\u002Finterview\u002Fmysql","MySQL 面试题","MySQL 数据库面试高频考点，覆盖索引、事务、锁、优化、主从复制等核心知识。",{"path":349,"title":350,"description":351},"\u002Finterview\u002Fredis","Redis 面试题","Redis 面试高频考点，覆盖数据结构、持久化、集群、缓存一致性、性能优化等核心知识。",{"path":353,"title":354,"description":355},"\u002Finterview\u002Frocketmq","RocketMQ 面试题","RocketMQ 面试高频考点，覆盖消息模型、可靠性、顺序消息、事务消息、存储与高可用等核心知识。",{"path":357,"title":358,"description":11},"\u002Fother\u002Fjava\u002Fcollection\u002Flist-arraylist","List - ArrayList 源码解析",{"path":360,"title":361,"description":11},"\u002Fother\u002Fjava\u002Fcollection\u002Flist-linkedlist","List - LinkedList 源码解析",{"path":363,"title":364,"description":11},"\u002Fother\u002Fjava\u002Fcollection\u002Flist-stack","List - Satck源码解析",{"path":366,"title":367,"description":11},"\u002Fother\u002Fjava\u002Fcollection\u002Flist-vectore","List - Vector 源码解析",{"path":369,"title":370,"description":11},"\u002Fother\u002Fjava\u002Fcollection\u002Fmap-hashmap","Map - HashMap 源码解析",{"path":372,"title":373,"description":11},"\u002Fother\u002Fjava\u002Fcollection\u002Fmap-linkedhashmap","Map - LinkedHashMap 源码解析",{"path":375,"title":376,"description":11},"\u002Fother\u002Fjava\u002Fcollection\u002Fmap-treemap","Map - TreeMap 源码解析",{"path":378,"title":379,"description":11},"\u002Fother\u002Fjava\u002Fcollection\u002Fqueue-deque","Queue - Deque 接口解析",{"path":381,"title":382,"description":11},"\u002Fother\u002Fjava\u002Fcollection\u002Fqueue-queue","Queue - Queue 接口解析",{"path":384,"title":385,"description":11},"\u002Fother\u002Fjava\u002Fcollection\u002Fset-hashset","Set - HashSet源码解析",{"path":387,"title":388,"description":11},"\u002Fother\u002Fjava\u002Fcollection\u002Fset-linkedhashset","Set - LinkedHashSet 源码解析",{"path":390,"title":391,"description":392},"\u002Fother\u002Fjava\u002Fcollection\u002Fset-treeset","Set - TreeSet源码解析","TreeSet 是一个 Set 集合接口的实现类，与 HashSet 类似，其底层也是通过维护了一个 TreeMap 对象来封装了一些实现方法，故本篇不再对 TreeSet 的底层原理进行详细说明，仅对常用 API 做简单介绍，如需了解 TreeMap 的底层实现原理，请移步 Map - HashMap 源码解析",{"path":394,"title":395,"description":11},"\u002Fother\u002Fjava\u002Fcore\u002Fannotation","Java核心 - 注解",{"path":397,"title":398,"description":11},"\u002Fother\u002Fjava\u002Fcore\u002Fbasic-grammar","Java核心 - 基础语法",{"path":400,"title":401,"description":11},"\u002Fother\u002Fjava\u002Fcore\u002Fclass-and-object","Java核心 - 面向对象",{"path":403,"title":404,"description":11},"\u002Fother\u002Fjava\u002Fcore\u002Fcommon-classes","Java核心 - 常用类",{"path":406,"title":407,"description":11},"\u002Fother\u002Fjava\u002Fcore\u002Fexception","Java核心 - 异常处理",{"path":409,"title":410,"description":11},"\u002Fother\u002Fjava\u002Fcore\u002Fgenerics","Java核心 - 泛型",{"path":412,"title":413,"description":11},"\u002Fother\u002Fjava\u002Fcore\u002Fjdk-env-path","Java核心 - 环境搭建",{"path":415,"title":416,"description":11},"\u002Fother\u002Fjava\u002Fcore\u002Freflection","Java核心 - 反射",{"path":418,"title":419,"description":11},"\u002Fother\u002Fjava\u002Fcore\u002Fstring","Java核心 - String 字符串",{"path":421,"title":422,"description":423},"\u002Fother\u002Fjava\u002Fio\u002Fbuffer-stream","Java IO - 缓冲流","缓冲流是对基本流的包装，通过内置缓冲区减少系统调用次数，大幅提升读写效率。",{"path":425,"title":426,"description":427},"\u002Fother\u002Fjava\u002Fio\u002Fbyte-stream","Java IO - 字节流","字节流是 Java IO 中最基本的流类型，以字节（byte）为单位进行数据读写，可以处理任意类型的文件。",{"path":429,"title":430,"description":431},"\u002Fother\u002Fjava\u002Fio\u002Fchar-stream","Java IO - 字符流","字符流以字符为单位进行读写，专门用于处理文本文件。相比字节流，字符流能够正确处理字符编码，避免中文乱码问题。",{"path":433,"title":434,"description":11},"\u002Fother\u002Fjava\u002Fio\u002Ffile","Java IO - File 类",{"path":436,"title":437,"description":11},"\u002Fother\u002Fjava\u002Fio\u002Fio-stream-system","Java IO - IO流概述",{"path":439,"title":440,"description":441},"\u002Fother\u002Fjava\u002Fio\u002Fnio","Java IO - NIO","NIO（New IO）是 JDK 1.4 引入的新 IO 模型，提供了更高效的 IO 操作方式，支持非阻塞 IO 和多路复用。",{"path":443,"title":444,"description":445},"\u002Fother\u002Fjava\u002Fjvm\u002Fclass-loading","类加载机制","类加载机制是 JVM 将 .class 文件加载到内存，并对数据进行校验、转换解析和初始化，最终形成可被 JVM 直接使用的 Java 类型的过程。",{"path":447,"title":448,"description":449},"\u002Fother\u002Fjava\u002Fjvm\u002Fgarbage-collection","垃圾回收","垃圾回收（Garbage Collection，GC）是 JVM 自动管理内存的机制，负责回收不再使用的对象所占用的内存。",{"path":451,"title":452,"description":453},"\u002Fother\u002Fjava\u002Fjvm\u002Fjvm-memory","JVM 内存结构","JVM 在执行 Java 程序时，会把它管理的内存划分为若干个不同的数据区域。这些区域有各自的用途、创建和销毁时间。",{"path":455,"title":456,"description":457},"\u002Fother\u002Fjava\u002Fjvm\u002Fjvm-tuning","JVM 调优","JVM 调优是优化 Java 应用性能的重要手段，主要包括参数配置、性能监控和问题排查。",{"path":459,"title":460,"description":461},"\u002Fother\u002Fjava\u002Fthread\u002Fatomic","原子类","Java 原子类（Atomic Classes）提供了一种无锁的线程安全方式，基于 CAS（Compare-And-Swap）操作实现。",{"path":463,"title":464,"description":465},"\u002Fother\u002Fjava\u002Fthread\u002Fcompletable-future","CompletableFuture","CompletableFuture 是 JDK 8 引入的异步编程工具，实现了 Future 和 CompletionStage 接口，支持函数式编程和链式调用。",{"path":467,"title":468,"description":469},"\u002Fother\u002Fjava\u002Fthread\u002Fconcurrent-collections","并发集合","Java 并发包提供了多种线程安全的集合类，用于替代传统的同步集合（如 Collections.synchronizedList）。",{"path":471,"title":472,"description":473},"\u002Fother\u002Fjava\u002Fthread\u002Fconcurrent-utils","并发工具类","Java 并发包提供了多种实用的并发工具类，用于控制线程之间的协调与同步。",{"path":475,"title":476,"description":11},"\u002Fother\u002Fjava\u002Fthread\u002Fsynchronized-lock","同步机制",{"path":478,"title":479,"description":11},"\u002Fother\u002Fjava\u002Fthread\u002Fthread-basic","线程基础",{"path":481,"title":482,"description":11},"\u002Fother\u002Fjava\u002Fthread\u002Fthread-pool","线程池",{"path":484,"title":485,"description":486},"\u002Fother\u002Fspring-series\u002Fspring\u002Fannotations-beans","Spring - 基于注解管理Bean","从 Java 5 开始，Java 增加了对注解（Annotation）的支持，它是代码中的一种特殊标记，可以在编译、类加载和运行时被读取，执行相应的处理。开发人员可以通过注解在不改变原有代码和逻辑的情况下，在源代码中嵌入补充信息。",{"path":488,"title":489,"description":490},"\u002Fother\u002Fspring-series\u002Fspring\u002Fimplement-ioc","Spring - 原理手写IoC","Spring 框架的 IOC 是基于 Java 反射机制实现的，在学习手写 IoC 之前，你需要具备一定的 Java 反射相关的知识，参考本站内的 Java 教程。",{"path":492,"title":493,"description":11},"\u002Fother\u002Fspring-series\u002Fspring\u002Fintroduction-case","Spring - 入门案例",{"path":495,"title":496,"description":11},"\u002Fother\u002Fspring-series\u002Fspring\u002Fspring-aop","Spring - 面向切面AOP",{"path":498,"title":499,"description":11},"\u002Fother\u002Fspring-series\u002Fspring\u002Fspring-aot","Spring - AOT提前编译",{"path":501,"title":502,"description":503},"\u002Fother\u002Fspring-series\u002Fspring\u002Fspring-data-validation","Spring - 数据校验","在开发中，我们经常遇到参数校验的需求，比如用户注册的时候，要校验用户名不能为空、用户名长度不超过20个字符、手机号是合法的手机号格式等等。如果使用普通方式，我们会把校验的代码和真正的业务处理逻辑耦合在一起，而且如果未来要新增一种校验逻辑也需要在修改多个地方。而spring validation允许通过注解的方式来定义对象校验规则，把校验和业务逻辑分离开，让代码编写更加方便。Spring Validation其实就是对Hibernate Validator进一步的封装，方便在Spring中使用。",{"path":505,"title":506,"description":11},"\u002Fother\u002Fspring-series\u002Fspring\u002Fspring-i18n","Spring - 国际化i18n",{"path":508,"title":509,"description":510},"\u002Fother\u002Fspring-series\u002Fspring\u002Fspring-ioc","Spring - IOC容器","IoC 是 Inversion of Control 的简写，译为“控制反转”，它不是一门技术，而是一种设计思想，是一个重要的面向对象编程法则，能够指导我们如何设计出松耦合、更优良的程序。",{"path":512,"title":513,"description":514},"\u002Fother\u002Fspring-series\u002Fspring\u002Fspring-junit","Spring - 单元测试JUnit","在之前的测试方法中，几乎都能看到以下的两行代码：",{"path":516,"title":517,"description":11},"\u002Fother\u002Fspring-series\u002Fspring\u002Fspring-resources","Spring - 资源操作",{"path":519,"title":520,"description":11},"\u002Fother\u002Fspring-series\u002Fspring\u002Fspring-summarize","Spring - Spring概述",{"path":522,"title":523,"description":11},"\u002Fother\u002Fspring-series\u002Fspring\u002Fspring-transaction","Spring - 事务",{"path":525,"title":526,"description":11},"\u002Fother\u002Fspring-series\u002Fspring\u002Fxml-beans","Spring - 基于XML管理Bean",{"path":528,"title":529,"description":11},"\u002Fother\u002Fspring-series\u002Fspringboot\u002Fspringboot-config","SpringBoot - 配置详解",{"path":531,"title":532,"description":11},"\u002Fother\u002Fspring-series\u002Fspringboot\u002Fspringboot-data","SpringBoot - 数据访问",{"path":534,"title":535,"description":11},"\u002Fother\u002Fspring-series\u002Fspringboot\u002Fspringboot-quickstart","SpringBoot - 快速入门",{"path":537,"title":538,"description":11},"\u002Fother\u002Fspring-series\u002Fspringboot\u002Fspringboot-web","SpringBoot - Web 开发",{"path":540,"title":541,"description":11},"\u002Fother\u002Fspring-series\u002Fspringcloud\u002Fspringcloud-config","SpringCloud - 配置中心",{"path":543,"title":544,"description":11},"\u002Fother\u002Fspring-series\u002Fspringcloud\u002Fspringcloud-discovery","SpringCloud - 服务注册与发现",{"path":546,"title":547,"description":11},"\u002Fother\u002Fspring-series\u002Fspringcloud\u002Fspringcloud-feign","SpringCloud - 服务调用",{"path":549,"title":550,"description":11},"\u002Fother\u002Fspring-series\u002Fspringcloud\u002Fspringcloud-gateway","SpringCloud - 服务网关",{"path":552,"title":553,"description":11},"\u002Fother\u002Fspring-series\u002Fspringcloud\u002Fspringcloud-introduction","SpringCloud - 微服务概述",{"path":555,"title":556,"description":11},"\u002Fother\u002Fspring-series\u002Fspringcloud\u002Fspringcloud-sentinel","SpringCloud - 服务保护",{"path":558,"title":559,"description":11},"\u002Fother\u002Fspring-series\u002Fspringmvc\u002Fspringmvc-databind","SpringMVC - 数据绑定与转换",{"path":561,"title":562,"description":11},"\u002Fother\u002Fspring-series\u002Fspringmvc\u002Fspringmvc-exception","SpringMVC - 异常处理",{"path":564,"title":565,"description":11},"\u002Fother\u002Fspring-series\u002Fspringmvc\u002Fspringmvc-interceptor","SpringMVC - 拦截器",{"path":567,"title":568,"description":11},"\u002Fother\u002Fspring-series\u002Fspringmvc\u002Fspringmvc-introduction","SpringMVC - 简介与环境搭建",{"path":570,"title":571,"description":11},"\u002Fother\u002Fspring-series\u002Fspringmvc\u002Fspringmvc-request","SpringMVC - 请求处理",{"path":573,"title":574,"description":11},"\u002Fother\u002Fspring-series\u002Fspringmvc\u002Fspringmvc-response","SpringMVC - 响应处理",{"path":576,"title":577,"description":578},"\u002Fproject\u002Frocket-leaf\u002Farchitecture","项目架构","Rocket-Leaf 的目录结构、模块划分、数据流向，以及各层之间的依赖关系。",{"path":580,"title":581,"description":582},"\u002Fproject\u002Frocket-leaf\u002Fbackend-layers","后端分层设计","Rocket-Leaf 的 model \u002F rocketmq \u002F service 三层结构，以及服务之间的依赖关系与设计取舍。",{"path":584,"title":585,"description":586},"\u002Fproject\u002Frocket-leaf\u002Fclient-manager","RocketMQ 客户端管理器","AdminClientManager 的多客户端池、默认连接懒加载、自动重连重试的设计与实现。",{"path":588,"title":589,"description":590},"\u002Fproject\u002Frocket-leaf\u002Fencryption","连接信息加密存储","AES-256-GCM + SHA-256 字段级派生密钥的实现，以及如何在不破坏兼容性的前提下为历史明文数据做透明迁移。",{"path":592,"title":593,"description":594},"\u002Fproject\u002Frocket-leaf\u002Ffrontend","前端结构与类型绑定","React + Vite 目录组织、自动生成的 Wails 绑定、api 薄封装与自定义 hooks 的职责划分。",{"path":596,"title":597,"description":598},"\u002Fproject\u002Frocket-leaf","项目简介","Rocket-Leaf 是一款基于 Wails v3 构建的跨平台 RocketMQ 桌面管理客户端，Go 后端 + React 前端。本文档系列拆解它的架构与关键实现。",{"path":600,"title":601,"description":602},"\u002Fproject\u002Frocket-leaf\u002Fwails-v3","Wails v3 入门","Wails v3 的核心概念、Service 绑定机制，以及 Rocket-Leaf 是如何用它把 Go 后端和 React 前端打通的。",{"path":604,"title":605,"description":11},"\u002Ftutorials\u002Fcloud\u002Fdocker\u002Fdocker-basic","Docker - 入门基础",{"path":607,"title":608,"description":609},"\u002Ftutorials\u002Fcloud\u002Fdocker\u002Fdocker-compose","Docker - Compose","在部署应用时，常常使用到不止一个容器，那么在部署容器的时候就需要一个一个进行部署，这样的部署过程也相对来说比较繁琐复杂，也容易出问题，那么有没有一种更为简单的方法呢？",{"path":611,"title":612,"description":613},"\u002Ftutorials\u002Fcloud\u002Fdocker\u002Fdocker-container-connection","Docker - 容器互联","在上一个章节中我们学习了 Docker 容器的端口映射，可以将 Docker 容器和本地以及网络中的端口进行连接起来。",{"path":615,"title":616,"description":11},"\u002Ftutorials\u002Fcloud\u002Fdocker\u002Fdocker-dockerfile","Docker - Dockerfile",{"path":618,"title":619,"description":11},"\u002Ftutorials\u002Fcloud\u002Fdocker\u002Fdocker-helloworld","Docker - HelloWorld",{"path":621,"title":622,"description":11},"\u002Ftutorials\u002Fcloud\u002Fdocker\u002Fdocker-install","Docker - 安装",{"path":624,"title":625,"description":11},"\u002Ftutorials\u002Fcloud\u002Fdocker\u002Fdocker-introduce","Docker - 简介",{"path":627,"title":628,"description":11},"\u002Ftutorials\u002Fcloud\u002Fdocker\u002Fdocker-object","Docker - 镜像、容器、仓库",{"path":630,"title":631,"description":632},"\u002Ftutorials\u002Fcloud\u002Fdocker\u002Fdocker-warehouse","Docker - 仓库管理","仓库是集中存放资源的地方，代码仓库是存放代码的，那么Docker 中的仓库就是存放 Docker 镜像的。",{"path":634,"title":635,"description":636},"\u002Ftutorials\u002Fcloud\u002Fdocker\u002Fdocker-web-containers","Docker - WEB应用实例","在之前的章节中，仅对普通容器进行了演示，但在实际中常常使用到 Docker 容器中的 WEB 应用程序。",{"path":638,"title":639,"description":11},"\u002Ftutorials\u002Fcloud\u002Fkubernetes\u002Fk8s-config","Kubernetes - ConfigMap 与 Secret",{"path":641,"title":642,"description":11},"\u002Ftutorials\u002Fcloud\u002Fkubernetes\u002Fk8s-helm","Kubernetes - Helm 包管理",{"path":644,"title":645,"description":11},"\u002Ftutorials\u002Fcloud\u002Fkubernetes\u002Fk8s-install","Kubernetes - 集群安装",{"path":647,"title":648,"description":11},"\u002Ftutorials\u002Fcloud\u002Fkubernetes\u002Fk8s-introduction","Kubernetes - 简介与架构",{"path":650,"title":651,"description":11},"\u002Ftutorials\u002Fcloud\u002Fkubernetes\u002Fk8s-kubectl","Kubernetes - kubectl 命令行工具",{"path":653,"title":654,"description":11},"\u002Ftutorials\u002Fcloud\u002Fkubernetes\u002Fk8s-monitoring","Kubernetes - 监控与日志",{"path":656,"title":657,"description":11},"\u002Ftutorials\u002Fcloud\u002Fkubernetes\u002Fk8s-network-security","Kubernetes - 网络与安全",{"path":659,"title":660,"description":11},"\u002Ftutorials\u002Fcloud\u002Fkubernetes\u002Fk8s-service","Kubernetes - Service 与 Ingress",{"path":662,"title":663,"description":11},"\u002Ftutorials\u002Fcloud\u002Fkubernetes\u002Fk8s-storage","Kubernetes - 持久化存储",{"path":665,"title":666,"description":11},"\u002Ftutorials\u002Fcloud\u002Fkubernetes\u002Fk8s-workload","Kubernetes - 工作负载资源",{"path":668,"title":669,"description":11},"\u002Ftutorials\u002Fcloud\u002Flinux\u002Flinux-bash","Linux - Bash 基础语法",{"path":671,"title":672,"description":11},"\u002Ftutorials\u002Fcloud\u002Flinux\u002Flinux-file-directory","Linux - 文件与目录操作",{"path":674,"title":675,"description":11},"\u002Ftutorials\u002Fcloud\u002Flinux\u002Flinux-network","Linux - 网络配置",{"path":677,"title":678,"description":11},"\u002Ftutorials\u002Fcloud\u002Flinux\u002Flinux-package","Linux - 软件包管理",{"path":680,"title":681,"description":11},"\u002Ftutorials\u002Fcloud\u002Flinux\u002Flinux-process","Linux - 进程管理",{"path":683,"title":684,"description":11},"\u002Ftutorials\u002Fcloud\u002Flinux\u002Flinux-scripts","Linux - 常用脚本示例",{"path":686,"title":687,"description":11},"\u002Ftutorials\u002Fcloud\u002Flinux\u002Flinux-service","Linux - 服务管理",{"path":689,"title":690,"description":11},"\u002Ftutorials\u002Fcloud\u002Flinux\u002Flinux-user-permission","Linux - 用户与权限管理",{"path":692,"title":693,"description":11},"\u002Ftutorials\u002Fcloud\u002Fnginx\u002Fnginx-https","Nginx - HTTPS 配置",{"path":695,"title":696,"description":11},"\u002Ftutorials\u002Fcloud\u002Fnginx\u002Fnginx-install","Nginx - 安装与配置",{"path":698,"title":699,"description":11},"\u002Ftutorials\u002Fcloud\u002Fnginx\u002Fnginx-loadbalance","Nginx - 负载均衡",{"path":701,"title":702,"description":11},"\u002Ftutorials\u002Fcloud\u002Fnginx\u002Fnginx-optimization","Nginx - 性能优化",{"path":704,"title":705,"description":11},"\u002Ftutorials\u002Fcloud\u002Fnginx\u002Fnginx-proxy","Nginx - 反向代理",{"path":707,"title":708,"description":11},"\u002Ftutorials\u002Fcloud\u002Fnginx\u002Fnginx-static","Nginx - 静态资源服务",{"path":710,"title":711,"description":11},"\u002Ftutorials\u002Fcloud\u002Fnginx\u002Fnginx-vhost","Nginx - 虚拟主机配置",{"path":713,"title":714,"description":715},"\u002Ftutorials\u002Fdatabase\u002Fmysql\u002Fmysql-architecture","MySQL 高可用架构","主从复制、读写分离、分库分表。",{"path":717,"title":718,"description":719},"\u002Ftutorials\u002Fdatabase\u002Fmysql\u002Fmysql-index","MySQL 索引","索引是帮助 MySQL 高效获取数据的有序数据结构。",{"path":721,"title":722,"description":723},"\u002Ftutorials\u002Fdatabase\u002Fmysql\u002Fmysql-lock","MySQL 锁","锁用于解决并发访问时的数据一致性问题。",{"path":725,"title":726,"description":727},"\u002Ftutorials\u002Fdatabase\u002Fmysql\u002Fmysql-optimize","MySQL 性能优化","SQL 优化是后端开发必备技能。",{"path":729,"title":730,"description":731},"\u002Ftutorials\u002Fdatabase\u002Fmysql\u002Fmysql-transaction","MySQL 事务","事务是一组不可分割的操作，要么全部成功，要么全部失败。",{"path":733,"title":734,"description":735},"\u002Ftutorials\u002Fdatabase\u002Fmysql\u002Fsql-advanced","SQL 进阶","多表查询、子查询、函数、视图、存储过程。",{"path":737,"title":738,"description":739},"\u002Ftutorials\u002Fdatabase\u002Fmysql\u002Fsql-basic","SQL 基础","SQL（Structured Query Language）是操作关系型数据库的标准语言。",{"path":741,"title":742,"description":743},"\u002Ftutorials\u002Fdatabase\u002Fredis\u002Fredis-advanced","Redis 进阶功能","事务、发布订阅、Lua 脚本、Pipeline。",{"path":745,"title":746,"description":747},"\u002Ftutorials\u002Fdatabase\u002Fredis\u002Fredis-basic","Redis 基础","Redis 安装配置与基本命令。",{"path":749,"title":750,"description":751},"\u002Ftutorials\u002Fdatabase\u002Fredis\u002Fredis-cluster","Redis 高可用","主从复制、哨兵、Cluster 集群。",{"path":753,"title":754,"description":755},"\u002Ftutorials\u002Fdatabase\u002Fredis\u002Fredis-datatype","Redis 数据类型","Redis 5 种基本数据类型 + 4 种特殊类型。",{"path":757,"title":758,"description":759},"\u002Ftutorials\u002Fdatabase\u002Fredis\u002Fredis-optimize","Redis 性能优化","内存优化、缓存问题、最佳实践。",{"path":761,"title":762,"description":763},"\u002Ftutorials\u002Fdatabase\u002Fredis\u002Fredis-persistence","Redis 持久化","Redis 提供 RDB 和 AOF 两种持久化方式。",{"path":765,"title":766,"description":767},"\u002Ftutorials\u002Fdatabase\u002Fredis\u002Fredis-principle","Redis 底层原理","数据结构、线程模型、网络模型。",{"path":769,"title":770,"description":771},"\u002Ftutorials\u002Fdev-idea\u002Fdesign-patterns\u002Fbehaiver-patterns\u002Fobserver-pattern","观察者模式","观察者模式属于行为型模式，定义了对象之间的一对多的依赖关系，在这种模式中，当一个对象的状态发生变化时，所有依赖于它的对象都会得到通知，并且执行相关操作。观察者模式又被成为“发布—订阅模式”，即发布者发生改变后，会通知所有订阅者。",{"path":773,"title":774,"description":11},"\u002Ftutorials\u002Fdev-idea\u002Fdesign-patterns\u002Fcreate-patterns\u002Ffactory-pattern","工厂模式",{"path":776,"title":777,"description":778},"\u002Ftutorials\u002Fdev-idea\u002Fdesign-patterns\u002Fcreate-patterns\u002Fsingleton-pattern","单例模式","单例模式是最常用的设计模式之一，他可以保证在整个应用中，某个类只存在一个实例化对象，即全局使用到该类的只有一个对象，这种模式在需要限制某些类的实例数量时非常有用，通常全局只需要一个该对象即可，如一些配置文件映射对象、数据库连接对象等。",{"path":780,"title":781,"description":782},"\u002Ftutorials\u002Fdev-idea\u002Fdesign-patterns\u002Fstructural-patterns\u002Fadapter-pattern","适配器模式","适配器模式是一种结构型模式，可以将一个类的接口转换成客户端所期望的另一种接口，适配器模式可以帮助开发人员在不修改现有代码的情况下，将不兼容的类组合在一起。",{"path":784,"title":785,"description":786},"\u002Ftutorials\u002Fdev-tools\u002Fgit\u002Fgit-basic-operations","Git 创建版本库","在 Git 上创建版本库有两种方式，一种是直接拷贝远程 Git 仓库到本地，另外一种是我们自己创建本地的版本库。",{"path":788,"title":789,"description":11},"\u002Ftutorials\u002Fdev-tools\u002Fgit\u002Fgit-branch-manage","Git 分支管理",{"path":791,"title":792,"description":11},"\u002Ftutorials\u002Fdev-tools\u002Fgit\u002Fgit-content-operations","Git 仓库内容操作",{"path":794,"title":795,"description":11},"\u002Ftutorials\u002Fdev-tools\u002Fgit\u002Fgit-introduce-install","Git 介绍和安装",{"path":797,"title":798,"description":11},"\u002Ftutorials\u002Fdev-tools\u002Fgit\u002Fgit-remote-manage","Git 远程管理",{"path":800,"title":801,"description":11},"\u002Ftutorials\u002Fdev-tools\u002Fgit\u002Fgit-workspace-index-repo","Git 工作原理",{"path":803,"title":804,"description":11},"\u002Ftutorials\u002Fdev-tools\u002Fhomebrew","HomeBrew 教程",{"path":806,"title":807,"description":11},"\u002Ftutorials\u002Fdev-tools\u002Fidea\u002Fshortcuts","快捷键",{"path":809,"title":810,"description":11},"\u002Ftutorials\u002Fdev-tools\u002Fmaven\u002Fintroduce-install-config","Maven - 介绍、安装、配置",{"path":812,"title":813,"description":11},"\u002Ftutorials\u002Ffront-end\u002Fvue3\u002Fbasic-knowledge","2. 基础知识",{"path":815,"title":816,"description":817},"\u002Ftutorials\u002Ffront-end\u002Fvue3\u002Fcomponent-communication","9. 组件通信","在前面的章节内，介绍了 Vue 中最核心的内容——组件的介绍和使用，和 Java 等编程语言相反，组件并不近似于这些变成语言中的类，类可以通过类或者其实例化的对象来相互交互，但 Vue 组件之间的作用域是相互独立的，这就意味着不同组件之间的数据无法相互引用。",{"path":819,"title":820,"description":821},"\u002Ftutorials\u002Ffront-end\u002Fvue3\u002Fcomputed","4. 计算属性","虽然直接在模板中使用表达式方便，但是如果在模板中添加很多逻辑，会让模板变的臃肿且难维护，耦合度较高。有没有一种简单的方式来实现呢？答案是有的。",{"path":823,"title":824,"description":11},"\u002Ftutorials\u002Ffront-end\u002Fvue3\u002Fcreate-vue-project","1. 环境搭建及安装",{"path":826,"title":827,"description":828},"\u002Ftutorials\u002Ffront-end\u002Fvue3\u002Flife-cycle","6. 生命周期","生命周期是指组件从创建、挂载、更新到销毁的整个过程中所经历的一系列阶段。在 Vue 中，每个组件都有自己的生命周期，可以通过生命周期钩子函数来监听和处理组件在不同阶段的行为和状态。",{"path":830,"title":831,"description":11},"\u002Ftutorials\u002Ffront-end\u002Fvue3\u002Fother-api","10. 其他 API",{"path":833,"title":834,"description":11},"\u002Ftutorials\u002Ffront-end\u002Fvue3\u002Fpinia","8. Pinia",{"path":836,"title":837,"description":11},"\u002Ftutorials\u002Ffront-end\u002Fvue3\u002Frouter","7. 路由",{"path":839,"title":840,"description":11},"\u002Ftutorials\u002Ffront-end\u002Fvue3\u002Ftemplate-grammar","3. 指令及模板语法",{"path":842,"title":843,"description":11},"\u002Ftutorials\u002Ffront-end\u002Fvue3\u002Fvue3-new-component","11. Vue3 新组件",{"path":845,"title":846,"description":847},"\u002Ftutorials\u002Ffront-end\u002Fvue3\u002Fwatch","5. 监视","Watch 是 Vue 提供的一个用于监视响应式数据变化并执行相应操作的 API，能够对响应式数据的变化做出一些操作的功能。Vue3 中的 Watch 支持多种用法，包括监视响应式对象、ref 对象、数组、函数等。",{"path":849,"title":850,"description":11},"\u002Ftutorials\u002Fmq\u002Fkafka\u002Fkafka-introduction","Kafka 简介与安装",{"path":852,"title":853,"description":11},"\u002Ftutorials\u002Fmq\u002Fkafka\u002Fkafka-producer-consumer","Kafka 生产者与消费者",{"path":855,"title":856,"description":857},"\u002Ftutorials\u002Fmq\u002Fkafka\u002Fkafka-springboot","Spring Boot 整合 Kafka","Spring Kafka 提供了对 Apache Kafka 的便捷集成。",{"path":859,"title":860,"description":861},"\u002Ftutorials\u002Fmq\u002Frabbitmq\u002Frabbitmq-exchange","RabbitMQ Exchange 详解","Exchange（交换机）是 RabbitMQ 的核心组件，负责接收生产者发送的消息，并根据规则将消息路由到一个或多个队列。",{"path":863,"title":864,"description":11},"\u002Ftutorials\u002Fmq\u002Frabbitmq\u002Frabbitmq-introduction","RabbitMQ 简介与安装",{"path":866,"title":867,"description":868},"\u002Ftutorials\u002Fmq\u002Frabbitmq\u002Frabbitmq-reliability","RabbitMQ 消息可靠性","消息可靠性是消息队列的核心要求，RabbitMQ 提供了多种机制来保证消息不丢失。",{"path":870,"title":871,"description":872},"\u002Ftutorials\u002Fmq\u002Frabbitmq\u002Frabbitmq-springboot","Spring Boot 整合 RabbitMQ","Spring AMQP 提供了对 RabbitMQ 的便捷集成，大大简化了开发工作。",{"path":874,"title":875,"description":11},"\u002Ftutorials\u002Fmq\u002Frocketmq\u002Frocketmq-client","RocketMQ 客户端使用",{"path":877,"title":878,"description":11},"\u002Ftutorials\u002Fmq\u002Frocketmq\u002Frocketmq-concepts","RocketMQ 核心概念",{"path":880,"title":881,"description":11},"\u002Ftutorials\u002Fmq\u002Frocketmq\u002Frocketmq-installation","RocketMQ 安装部署",{"path":883,"title":884,"description":885},"\u002Ftutorials\u002Fmq\u002Frocketmq\u002Frocketmq-message-type","RocketMQ 消息类型","RocketMQ 支持多种消息类型，满足不同业务场景需求。",{"id":887,"title":106,"body":888,"description":107,"extension":3424,"meta":3425,"navigation":1332,"path":105,"seo":3426,"stem":3427,"__hash__":3428},"docs\u002Fai\u002Frag\u002Fembedding.md",{"type":889,"value":890,"toc":3395},"minimark",[891,895,904,914,921,924,928,931,959,962,969,976,982,1010,1014,1017,1020,1216,1220,1227,1237,1241,1247,1255,1259,1262,1270,1274,1277,1281,1284,1288,1837,1841,1936,1940,2153,2157,2345,2349,2353,2356,2360,2363,2565,2573,2577,2580,2803,2811,2815,2818,3126,3134,3137,3211,3214,3234,3237,3240,3243,3356,3359,3362,3365,3391],[892,893,894],"h2",{"id":894},"什么是文本嵌入",[896,897,898,899,903],"p",{},"文本嵌入（Text Embedding）是将文本（词、句子、段落或文档）转换为",[900,901,902],"strong",{},"固定维度的稠密向量","的技术。这些向量能够在数学空间中捕捉文本的语义信息——语义相似的文本在向量空间中距离更近，语义不同的文本距离更远。",[905,906,911],"pre",{"className":907,"code":909,"language":910},[908],"language-text","\"Go 语言的并发模型\"  →  [0.12, -0.34, 0.56, ..., 0.78]  (1536维)\n\"Golang 的 goroutine\" →  [0.11, -0.32, 0.58, ..., 0.75]  (1536维)\n\"今天天气不错\"        →  [0.89, 0.23, -0.45, ..., -0.12]  (1536维)\n\n前两个向量距离很近（语义相关），第三个向量距离较远（语义无关）\n","text",[912,913,909],"code",{"__ignoreMap":11},[896,915,916,917,920],{},"文本嵌入是 RAG 系统的",[900,918,919],{},"关键桥梁","——它将人类可读的文本转换为机器可计算的数值表示，使得语义级别的相似度搜索成为可能。",[892,922,923],{"id":923},"嵌入模型的工作原理",[925,926,927],"h3",{"id":927},"从词嵌入到句子嵌入",[896,929,930],{},"文本嵌入技术经历了几个重要的发展阶段：",[932,933,934,941,947,953],"ol",{},[935,936,937,940],"li",{},[900,938,939],{},"Word2Vec \u002F GloVe（2013-2014）","：为每个词生成一个固定向量，但无法处理一词多义",[935,942,943,946],{},[900,944,945],{},"ELMo（2018）","：基于上下文的词嵌入，同一个词在不同语境中有不同的向量表示",[935,948,949,952],{},[900,950,951],{},"BERT 及其变体（2018-2020）","：基于 Transformer 架构，生成高质量的上下文感知嵌入",[935,954,955,958],{},[900,956,957],{},"专用嵌入模型（2022-至今）","：如 E5、BGE、GTE 等，专门为检索任务优化的嵌入模型",[925,960,961],{"id":961},"现代嵌入模型的架构",[896,963,964,965,968],{},"当前主流的嵌入模型基于 ",[900,966,967],{},"Transformer 编码器","架构，其核心流程为：",[905,970,974],{"className":971,"code":972,"language":910,"meta":973},[908],"flowchart LR\n    A[\"输入文本\"] --> B[\"Tokenizer 分词\"] --> C[\"Transformer 编码器\"] --> D[\"Pooling 池化\"] --> E[\"归一化\"] --> F[\"嵌入向量\"]\n","mermaid",[912,975,972],{"__ignoreMap":11},[896,977,978,981],{},[900,979,980],{},"池化策略","决定了如何将 Transformer 输出的 token 级别向量聚合为一个句子级别的向量：",[983,984,985,998,1004],"ul",{},[935,986,987,994,995,997],{},[900,988,989,993],{},[990,991,992],"span",{},"CLS"," token 池化","：取特殊标记 ",[990,996,992],{}," 对应的输出向量",[935,999,1000,1003],{},[900,1001,1002],{},"平均池化（Mean Pooling）","：对所有 token 的输出向量取平均值（最常用）",[935,1005,1006,1009],{},[900,1007,1008],{},"最大池化（Max Pooling）","：对每个维度取所有 token 中的最大值",[1011,1012,1013],"note",{},"\n现代嵌入模型（如 BGE、E5）通常在训练时已经内置了最优的池化策略，使用者只需调用模型接口即可，无需手动处理池化逻辑。\n",[892,1015,1016],{"id":1016},"主流嵌入模型",[925,1018,1019],{"id":1019},"模型对比",[1021,1022,1023,1051],"table",{},[1024,1025,1026],"thead",{},[1027,1028,1029,1033,1036,1039,1042,1045,1048],"tr",{},[1030,1031,1032],"th",{},"模型",[1030,1034,1035],{},"提供方",[1030,1037,1038],{},"维度",[1030,1040,1041],{},"最大 Token",[1030,1043,1044],{},"中文支持",[1030,1046,1047],{},"类型",[1030,1049,1050],{},"MTEB 排名",[1052,1053,1054,1078,1097,1120,1139,1159,1178,1197],"tbody",{},[1027,1055,1056,1060,1063,1066,1069,1072,1075],{},[1057,1058,1059],"td",{},"text-embedding-3-large",[1057,1061,1062],{},"OpenAI",[1057,1064,1065],{},"3072",[1057,1067,1068],{},"8191",[1057,1070,1071],{},"良好",[1057,1073,1074],{},"API 服务",[1057,1076,1077],{},"前列",[1027,1079,1080,1083,1085,1088,1090,1092,1094],{},[1057,1081,1082],{},"text-embedding-3-small",[1057,1084,1062],{},[1057,1086,1087],{},"1536",[1057,1089,1068],{},[1057,1091,1071],{},[1057,1093,1074],{},[1057,1095,1096],{},"中上",[1027,1098,1099,1102,1105,1108,1111,1114,1117],{},[1057,1100,1101],{},"BGE-large-zh-v1.5",[1057,1103,1104],{},"BAAI(智源)",[1057,1106,1107],{},"1024",[1057,1109,1110],{},"512",[1057,1112,1113],{},"优秀",[1057,1115,1116],{},"开源模型",[1057,1118,1119],{},"中文前列",[1027,1121,1122,1125,1127,1129,1132,1134,1136],{},[1057,1123,1124],{},"BGE-M3",[1057,1126,1104],{},[1057,1128,1107],{},[1057,1130,1131],{},"8192",[1057,1133,1113],{},[1057,1135,1116],{},[1057,1137,1138],{},"多语言前列",[1027,1140,1141,1144,1147,1150,1152,1154,1156],{},[1057,1142,1143],{},"M3E-base",[1057,1145,1146],{},"Moka AI",[1057,1148,1149],{},"768",[1057,1151,1110],{},[1057,1153,1113],{},[1057,1155,1116],{},[1057,1157,1158],{},"中文中上",[1027,1160,1161,1164,1167,1169,1171,1173,1176],{},[1057,1162,1163],{},"Jina-embeddings-v3",[1057,1165,1166],{},"Jina AI",[1057,1168,1107],{},[1057,1170,1131],{},[1057,1172,1071],{},[1057,1174,1175],{},"开源\u002FAPI",[1057,1177,1077],{},[1027,1179,1180,1183,1186,1188,1191,1193,1195],{},[1057,1181,1182],{},"GTE-Qwen2",[1057,1184,1185],{},"阿里巴巴",[1057,1187,1087],{},[1057,1189,1190],{},"32768",[1057,1192,1113],{},[1057,1194,1116],{},[1057,1196,1077],{},[1027,1198,1199,1202,1205,1208,1210,1212,1214],{},[1057,1200,1201],{},"E5-mistral-7b",[1057,1203,1204],{},"微软",[1057,1206,1207],{},"4096",[1057,1209,1190],{},[1057,1211,1071],{},[1057,1213,1116],{},[1057,1215,1077],{},[925,1217,1219],{"id":1218},"openai-text-embedding-3","OpenAI text-embedding-3",[896,1221,1222,1223,1226],{},"OpenAI 的第三代嵌入模型，提供 small 和 large 两个规格。支持通过 ",[912,1224,1225],{},"dimensions"," 参数灵活调整输出维度，在性价比和质量之间取得了很好的平衡。",[896,1228,1229,1232,1233,1236],{},[900,1230,1231],{},"优点："," 使用简单、质量稳定、支持动态降维\n",[900,1234,1235],{},"缺点："," 需要网络调用、有费用、数据隐私考虑",[925,1238,1240],{"id":1239},"bge-系列baai-general-embedding","BGE 系列（BAAI General Embedding）",[896,1242,1243,1244,1246],{},"智源研究院开发的开源嵌入模型，尤其是 ",[900,1245,1124],{},"，支持多语言、多粒度、多功能（dense + sparse + colbert），是目前综合能力最强的开源嵌入模型之一。",[896,1248,1249,1251,1252,1254],{},[900,1250,1231],{}," 开源免费、中文效果好、支持本地部署\n",[900,1253,1235],{}," 需要 GPU 资源、需要自行部署",[925,1256,1258],{"id":1257},"m3e","M3E",[896,1260,1261],{},"Moka AI 开源的中文嵌入模型，针对中文语料进行了专门优化，在中文文本检索和语义匹配任务上表现优异。",[896,1263,1264,1266,1267,1269],{},[900,1265,1231],{}," 中文效果突出、模型轻量\n",[900,1268,1235],{}," 英文能力相对较弱、Token 限制较短",[925,1271,1273],{"id":1272},"jina-embeddings","Jina Embeddings",[896,1275,1276],{},"Jina AI 提供的嵌入模型，v3 版本支持 8192 token 的长文本输入和多任务优化。同时提供 API 服务和开源模型。",[1278,1279,1280],"tip",{},"\n选择嵌入模型时的关键考虑因素：如果你的数据以中文为主且需要本地部署，优先考虑 BGE 系列；如果追求快速集成且对费用不敏感，OpenAI 的 API 是最便捷的选择；如果需要处理超长文档，关注支持长上下文窗口的模型（如 BGE-M3、GTE-Qwen2）。\n",[892,1282,1283],{"id":1283},"代码示例",[925,1285,1287],{"id":1286},"使用-openai-嵌入模型","使用 OpenAI 嵌入模型",[905,1289,1293],{"className":1290,"code":1291,"language":1292,"meta":11,"style":11},"language-python shiki shiki-themes github-light github-light github-dark","from openai import OpenAI\nimport numpy as np\n\nclient = OpenAI(api_key=\"your-api-key\")\n\ndef get_embedding(text: str, model: str = \"text-embedding-3-small\") -> list[float]:\n    \"\"\"获取文本的嵌入向量\"\"\"\n    response = client.embeddings.create(\n        input=text,\n        model=model\n    )\n    return response.data[0].embedding\n\ndef get_embeddings_batch(texts: list[str], model: str = \"text-embedding-3-small\") -> list[list[float]]:\n    \"\"\"批量获取嵌入向量（效率更高）\"\"\"\n    response = client.embeddings.create(\n        input=texts,\n        model=model\n    )\n    return [item.embedding for item in response.data]\n\n# 单条文本嵌入\nembedding = get_embedding(\"RAG 是检索增强生成技术\")\nprint(f\"向量维度: {len(embedding)}\")  # 输出: 1536\n\n# 批量嵌入\ntexts = [\n    \"Docker 容器化部署\",\n    \"Kubernetes 集群管理\",\n    \"今天吃什么\",\n]\nembeddings = get_embeddings_batch(texts)\n\n# 计算相似度\ndef cosine_similarity(a, b):\n    a, b = np.array(a), np.array(b)\n    return np.dot(a, b) \u002F (np.linalg.norm(a) * np.linalg.norm(b))\n\nsim_01 = cosine_similarity(embeddings[0], embeddings[1])\nsim_02 = cosine_similarity(embeddings[0], embeddings[2])\nprint(f\"Docker vs Kubernetes 相似度: {sim_01:.4f}\")  # 较高\nprint(f\"Docker vs 今天吃什么 相似度: {sim_02:.4f}\")  # 较低\n","python",[912,1294,1295,1313,1327,1334,1359,1364,1401,1407,1418,1429,1440,1446,1461,1466,1496,1502,1511,1521,1530,1535,1555,1560,1567,1583,1616,1621,1627,1638,1647,1655,1663,1669,1680,1685,1691,1702,1713,1733,1738,1760,1779,1809],{"__ignoreMap":11},[990,1296,1299,1303,1307,1310],{"class":1297,"line":1298},"line",1,[990,1300,1302],{"class":1301},"s8jYJ","from",[990,1304,1306],{"class":1305},"sxrX7"," openai ",[990,1308,1309],{"class":1301},"import",[990,1311,1312],{"class":1305}," OpenAI\n",[990,1314,1316,1318,1321,1324],{"class":1297,"line":1315},2,[990,1317,1309],{"class":1301},[990,1319,1320],{"class":1305}," numpy ",[990,1322,1323],{"class":1301},"as",[990,1325,1326],{"class":1305}," np\n",[990,1328,1330],{"class":1297,"line":1329},3,[990,1331,1333],{"emptyLinePlaceholder":1332},true,"\n",[990,1335,1337,1340,1343,1346,1350,1352,1356],{"class":1297,"line":1336},4,[990,1338,1339],{"class":1305},"client ",[990,1341,1342],{"class":1301},"=",[990,1344,1345],{"class":1305}," OpenAI(",[990,1347,1349],{"class":1348},"sP4rz","api_key",[990,1351,1342],{"class":1301},[990,1353,1355],{"class":1354},"sIIMD","\"your-api-key\"",[990,1357,1358],{"class":1305},")\n",[990,1360,1362],{"class":1297,"line":1361},5,[990,1363,1333],{"emptyLinePlaceholder":1332},[990,1365,1367,1370,1374,1377,1381,1384,1386,1389,1392,1395,1398],{"class":1297,"line":1366},6,[990,1368,1369],{"class":1301},"def",[990,1371,1373],{"class":1372},"snPdu"," get_embedding",[990,1375,1376],{"class":1305},"(text: ",[990,1378,1380],{"class":1379},"sBjJW","str",[990,1382,1383],{"class":1305},", model: ",[990,1385,1380],{"class":1379},[990,1387,1388],{"class":1301}," =",[990,1390,1391],{"class":1354}," \"text-embedding-3-small\"",[990,1393,1394],{"class":1305},") -> list[",[990,1396,1397],{"class":1379},"float",[990,1399,1400],{"class":1305},"]:\n",[990,1402,1404],{"class":1297,"line":1403},7,[990,1405,1406],{"class":1354},"    \"\"\"获取文本的嵌入向量\"\"\"\n",[990,1408,1410,1413,1415],{"class":1297,"line":1409},8,[990,1411,1412],{"class":1305},"    response ",[990,1414,1342],{"class":1301},[990,1416,1417],{"class":1305}," client.embeddings.create(\n",[990,1419,1421,1424,1426],{"class":1297,"line":1420},9,[990,1422,1423],{"class":1348},"        input",[990,1425,1342],{"class":1301},[990,1427,1428],{"class":1305},"text,\n",[990,1430,1432,1435,1437],{"class":1297,"line":1431},10,[990,1433,1434],{"class":1348},"        model",[990,1436,1342],{"class":1301},[990,1438,1439],{"class":1305},"model\n",[990,1441,1443],{"class":1297,"line":1442},11,[990,1444,1445],{"class":1305},"    )\n",[990,1447,1449,1452,1455,1458],{"class":1297,"line":1448},12,[990,1450,1451],{"class":1301},"    return",[990,1453,1454],{"class":1305}," response.data[",[990,1456,1457],{"class":1379},"0",[990,1459,1460],{"class":1305},"].embedding\n",[990,1462,1464],{"class":1297,"line":1463},13,[990,1465,1333],{"emptyLinePlaceholder":1332},[990,1467,1469,1471,1474,1477,1479,1482,1484,1486,1488,1491,1493],{"class":1297,"line":1468},14,[990,1470,1369],{"class":1301},[990,1472,1473],{"class":1372}," get_embeddings_batch",[990,1475,1476],{"class":1305},"(texts: list[",[990,1478,1380],{"class":1379},[990,1480,1481],{"class":1305},"], model: ",[990,1483,1380],{"class":1379},[990,1485,1388],{"class":1301},[990,1487,1391],{"class":1354},[990,1489,1490],{"class":1305},") -> list[list[",[990,1492,1397],{"class":1379},[990,1494,1495],{"class":1305},"]]:\n",[990,1497,1499],{"class":1297,"line":1498},15,[990,1500,1501],{"class":1354},"    \"\"\"批量获取嵌入向量（效率更高）\"\"\"\n",[990,1503,1505,1507,1509],{"class":1297,"line":1504},16,[990,1506,1412],{"class":1305},[990,1508,1342],{"class":1301},[990,1510,1417],{"class":1305},[990,1512,1514,1516,1518],{"class":1297,"line":1513},17,[990,1515,1423],{"class":1348},[990,1517,1342],{"class":1301},[990,1519,1520],{"class":1305},"texts,\n",[990,1522,1524,1526,1528],{"class":1297,"line":1523},18,[990,1525,1434],{"class":1348},[990,1527,1342],{"class":1301},[990,1529,1439],{"class":1305},[990,1531,1533],{"class":1297,"line":1532},19,[990,1534,1445],{"class":1305},[990,1536,1538,1540,1543,1546,1549,1552],{"class":1297,"line":1537},20,[990,1539,1451],{"class":1301},[990,1541,1542],{"class":1305}," [item.embedding ",[990,1544,1545],{"class":1301},"for",[990,1547,1548],{"class":1305}," item ",[990,1550,1551],{"class":1301},"in",[990,1553,1554],{"class":1305}," response.data]\n",[990,1556,1558],{"class":1297,"line":1557},21,[990,1559,1333],{"emptyLinePlaceholder":1332},[990,1561,1563],{"class":1297,"line":1562},22,[990,1564,1566],{"class":1565},"sCsY4","# 单条文本嵌入\n",[990,1568,1570,1573,1575,1578,1581],{"class":1297,"line":1569},23,[990,1571,1572],{"class":1305},"embedding ",[990,1574,1342],{"class":1301},[990,1576,1577],{"class":1305}," get_embedding(",[990,1579,1580],{"class":1354},"\"RAG 是检索增强生成技术\"",[990,1582,1358],{"class":1305},[990,1584,1586,1589,1592,1595,1598,1601,1604,1607,1610,1613],{"class":1297,"line":1585},24,[990,1587,1588],{"class":1379},"print",[990,1590,1591],{"class":1305},"(",[990,1593,1594],{"class":1301},"f",[990,1596,1597],{"class":1354},"\"向量维度: ",[990,1599,1600],{"class":1379},"{len",[990,1602,1603],{"class":1305},"(embedding)",[990,1605,1606],{"class":1379},"}",[990,1608,1609],{"class":1354},"\"",[990,1611,1612],{"class":1305},")  ",[990,1614,1615],{"class":1565},"# 输出: 1536\n",[990,1617,1619],{"class":1297,"line":1618},25,[990,1620,1333],{"emptyLinePlaceholder":1332},[990,1622,1624],{"class":1297,"line":1623},26,[990,1625,1626],{"class":1565},"# 批量嵌入\n",[990,1628,1630,1633,1635],{"class":1297,"line":1629},27,[990,1631,1632],{"class":1305},"texts ",[990,1634,1342],{"class":1301},[990,1636,1637],{"class":1305}," [\n",[990,1639,1641,1644],{"class":1297,"line":1640},28,[990,1642,1643],{"class":1354},"    \"Docker 容器化部署\"",[990,1645,1646],{"class":1305},",\n",[990,1648,1650,1653],{"class":1297,"line":1649},29,[990,1651,1652],{"class":1354},"    \"Kubernetes 集群管理\"",[990,1654,1646],{"class":1305},[990,1656,1658,1661],{"class":1297,"line":1657},30,[990,1659,1660],{"class":1354},"    \"今天吃什么\"",[990,1662,1646],{"class":1305},[990,1664,1666],{"class":1297,"line":1665},31,[990,1667,1668],{"class":1305},"]\n",[990,1670,1672,1675,1677],{"class":1297,"line":1671},32,[990,1673,1674],{"class":1305},"embeddings ",[990,1676,1342],{"class":1301},[990,1678,1679],{"class":1305}," get_embeddings_batch(texts)\n",[990,1681,1683],{"class":1297,"line":1682},33,[990,1684,1333],{"emptyLinePlaceholder":1332},[990,1686,1688],{"class":1297,"line":1687},34,[990,1689,1690],{"class":1565},"# 计算相似度\n",[990,1692,1694,1696,1699],{"class":1297,"line":1693},35,[990,1695,1369],{"class":1301},[990,1697,1698],{"class":1372}," cosine_similarity",[990,1700,1701],{"class":1305},"(a, b):\n",[990,1703,1705,1708,1710],{"class":1297,"line":1704},36,[990,1706,1707],{"class":1305},"    a, b ",[990,1709,1342],{"class":1301},[990,1711,1712],{"class":1305}," np.array(a), np.array(b)\n",[990,1714,1716,1718,1721,1724,1727,1730],{"class":1297,"line":1715},37,[990,1717,1451],{"class":1301},[990,1719,1720],{"class":1305}," np.dot(a, b) ",[990,1722,1723],{"class":1301},"\u002F",[990,1725,1726],{"class":1305}," (np.linalg.norm(a) ",[990,1728,1729],{"class":1301},"*",[990,1731,1732],{"class":1305}," np.linalg.norm(b))\n",[990,1734,1736],{"class":1297,"line":1735},38,[990,1737,1333],{"emptyLinePlaceholder":1332},[990,1739,1741,1744,1746,1749,1751,1754,1757],{"class":1297,"line":1740},39,[990,1742,1743],{"class":1305},"sim_01 ",[990,1745,1342],{"class":1301},[990,1747,1748],{"class":1305}," cosine_similarity(embeddings[",[990,1750,1457],{"class":1379},[990,1752,1753],{"class":1305},"], embeddings[",[990,1755,1756],{"class":1379},"1",[990,1758,1759],{"class":1305},"])\n",[990,1761,1763,1766,1768,1770,1772,1774,1777],{"class":1297,"line":1762},40,[990,1764,1765],{"class":1305},"sim_02 ",[990,1767,1342],{"class":1301},[990,1769,1748],{"class":1305},[990,1771,1457],{"class":1379},[990,1773,1753],{"class":1305},[990,1775,1776],{"class":1379},"2",[990,1778,1759],{"class":1305},[990,1780,1782,1784,1786,1788,1791,1794,1797,1800,1802,1804,1806],{"class":1297,"line":1781},41,[990,1783,1588],{"class":1379},[990,1785,1591],{"class":1305},[990,1787,1594],{"class":1301},[990,1789,1790],{"class":1354},"\"Docker vs Kubernetes 相似度: ",[990,1792,1793],{"class":1379},"{",[990,1795,1796],{"class":1305},"sim_01",[990,1798,1799],{"class":1301},":.4f",[990,1801,1606],{"class":1379},[990,1803,1609],{"class":1354},[990,1805,1612],{"class":1305},[990,1807,1808],{"class":1565},"# 较高\n",[990,1810,1812,1814,1816,1818,1821,1823,1826,1828,1830,1832,1834],{"class":1297,"line":1811},42,[990,1813,1588],{"class":1379},[990,1815,1591],{"class":1305},[990,1817,1594],{"class":1301},[990,1819,1820],{"class":1354},"\"Docker vs 今天吃什么 相似度: ",[990,1822,1793],{"class":1379},[990,1824,1825],{"class":1305},"sim_02",[990,1827,1799],{"class":1301},[990,1829,1606],{"class":1379},[990,1831,1609],{"class":1354},[990,1833,1612],{"class":1305},[990,1835,1836],{"class":1565},"# 较低\n",[925,1838,1840],{"id":1839},"使用-openai-动态降维","使用 OpenAI 动态降维",[905,1842,1844],{"className":1290,"code":1843,"language":1292,"meta":11,"style":11},"# text-embedding-3 系列支持通过 dimensions 参数降维\nresponse = client.embeddings.create(\n    input=\"RAG 检索增强生成\",\n    model=\"text-embedding-3-large\",\n    dimensions=512  # 将 3072 维降到 512 维\n)\nembedding = response.data[0].embedding\nprint(f\"降维后向量维度: {len(embedding)}\")  # 输出: 512\n",[912,1845,1846,1851,1860,1872,1884,1896,1900,1912],{"__ignoreMap":11},[990,1847,1848],{"class":1297,"line":1298},[990,1849,1850],{"class":1565},"# text-embedding-3 系列支持通过 dimensions 参数降维\n",[990,1852,1853,1856,1858],{"class":1297,"line":1315},[990,1854,1855],{"class":1305},"response ",[990,1857,1342],{"class":1301},[990,1859,1417],{"class":1305},[990,1861,1862,1865,1867,1870],{"class":1297,"line":1329},[990,1863,1864],{"class":1348},"    input",[990,1866,1342],{"class":1301},[990,1868,1869],{"class":1354},"\"RAG 检索增强生成\"",[990,1871,1646],{"class":1305},[990,1873,1874,1877,1879,1882],{"class":1297,"line":1336},[990,1875,1876],{"class":1348},"    model",[990,1878,1342],{"class":1301},[990,1880,1881],{"class":1354},"\"text-embedding-3-large\"",[990,1883,1646],{"class":1305},[990,1885,1886,1889,1891,1893],{"class":1297,"line":1361},[990,1887,1888],{"class":1348},"    dimensions",[990,1890,1342],{"class":1301},[990,1892,1110],{"class":1379},[990,1894,1895],{"class":1565},"  # 将 3072 维降到 512 维\n",[990,1897,1898],{"class":1297,"line":1366},[990,1899,1358],{"class":1305},[990,1901,1902,1904,1906,1908,1910],{"class":1297,"line":1403},[990,1903,1572],{"class":1305},[990,1905,1342],{"class":1301},[990,1907,1454],{"class":1305},[990,1909,1457],{"class":1379},[990,1911,1460],{"class":1305},[990,1913,1914,1916,1918,1920,1923,1925,1927,1929,1931,1933],{"class":1297,"line":1409},[990,1915,1588],{"class":1379},[990,1917,1591],{"class":1305},[990,1919,1594],{"class":1301},[990,1921,1922],{"class":1354},"\"降维后向量维度: ",[990,1924,1600],{"class":1379},[990,1926,1603],{"class":1305},[990,1928,1606],{"class":1379},[990,1930,1609],{"class":1354},[990,1932,1612],{"class":1305},[990,1934,1935],{"class":1565},"# 输出: 512\n",[925,1937,1939],{"id":1938},"使用本地开源模型sentence-transformers","使用本地开源模型（sentence-transformers）",[905,1941,1943],{"className":1290,"code":1942,"language":1292,"meta":11,"style":11},"from sentence_transformers import SentenceTransformer\nimport numpy as np\n\n# 加载 BGE 中文模型（首次运行会自动下载）\nmodel = SentenceTransformer(\"BAAI\u002Fbge-base-zh-v1.5\")\n\n# 单条文本嵌入\ntext = \"什么是向量数据库？\"\nembedding = model.encode(text, normalize_embeddings=True)\nprint(f\"向量维度: {embedding.shape}\")  # 输出: (768,)\n\n# 批量嵌入\ntexts = [\n    \"向量数据库用于存储和检索高维向量\",\n    \"Redis 是一个内存键值数据库\",\n    \"Milvus 是开源的向量检索引擎\",\n]\nembeddings = model.encode(texts, normalize_embeddings=True)\n\n# 计算相似度矩阵\nsimilarity_matrix = np.inner(embeddings, embeddings)\nprint(\"相似度矩阵:\")\nprint(np.round(similarity_matrix, 3))\n",[912,1944,1945,1957,1967,1971,1976,1991,1995,1999,2009,2028,2052,2056,2060,2068,2075,2082,2089,2093,2110,2114,2119,2129,2140],{"__ignoreMap":11},[990,1946,1947,1949,1952,1954],{"class":1297,"line":1298},[990,1948,1302],{"class":1301},[990,1950,1951],{"class":1305}," sentence_transformers ",[990,1953,1309],{"class":1301},[990,1955,1956],{"class":1305}," SentenceTransformer\n",[990,1958,1959,1961,1963,1965],{"class":1297,"line":1315},[990,1960,1309],{"class":1301},[990,1962,1320],{"class":1305},[990,1964,1323],{"class":1301},[990,1966,1326],{"class":1305},[990,1968,1969],{"class":1297,"line":1329},[990,1970,1333],{"emptyLinePlaceholder":1332},[990,1972,1973],{"class":1297,"line":1336},[990,1974,1975],{"class":1565},"# 加载 BGE 中文模型（首次运行会自动下载）\n",[990,1977,1978,1981,1983,1986,1989],{"class":1297,"line":1361},[990,1979,1980],{"class":1305},"model ",[990,1982,1342],{"class":1301},[990,1984,1985],{"class":1305}," SentenceTransformer(",[990,1987,1988],{"class":1354},"\"BAAI\u002Fbge-base-zh-v1.5\"",[990,1990,1358],{"class":1305},[990,1992,1993],{"class":1297,"line":1366},[990,1994,1333],{"emptyLinePlaceholder":1332},[990,1996,1997],{"class":1297,"line":1403},[990,1998,1566],{"class":1565},[990,2000,2001,2004,2006],{"class":1297,"line":1409},[990,2002,2003],{"class":1305},"text ",[990,2005,1342],{"class":1301},[990,2007,2008],{"class":1354}," \"什么是向量数据库？\"\n",[990,2010,2011,2013,2015,2018,2021,2023,2026],{"class":1297,"line":1420},[990,2012,1572],{"class":1305},[990,2014,1342],{"class":1301},[990,2016,2017],{"class":1305}," model.encode(text, ",[990,2019,2020],{"class":1348},"normalize_embeddings",[990,2022,1342],{"class":1301},[990,2024,2025],{"class":1379},"True",[990,2027,1358],{"class":1305},[990,2029,2030,2032,2034,2036,2038,2040,2043,2045,2047,2049],{"class":1297,"line":1431},[990,2031,1588],{"class":1379},[990,2033,1591],{"class":1305},[990,2035,1594],{"class":1301},[990,2037,1597],{"class":1354},[990,2039,1793],{"class":1379},[990,2041,2042],{"class":1305},"embedding.shape",[990,2044,1606],{"class":1379},[990,2046,1609],{"class":1354},[990,2048,1612],{"class":1305},[990,2050,2051],{"class":1565},"# 输出: (768,)\n",[990,2053,2054],{"class":1297,"line":1442},[990,2055,1333],{"emptyLinePlaceholder":1332},[990,2057,2058],{"class":1297,"line":1448},[990,2059,1626],{"class":1565},[990,2061,2062,2064,2066],{"class":1297,"line":1463},[990,2063,1632],{"class":1305},[990,2065,1342],{"class":1301},[990,2067,1637],{"class":1305},[990,2069,2070,2073],{"class":1297,"line":1468},[990,2071,2072],{"class":1354},"    \"向量数据库用于存储和检索高维向量\"",[990,2074,1646],{"class":1305},[990,2076,2077,2080],{"class":1297,"line":1498},[990,2078,2079],{"class":1354},"    \"Redis 是一个内存键值数据库\"",[990,2081,1646],{"class":1305},[990,2083,2084,2087],{"class":1297,"line":1504},[990,2085,2086],{"class":1354},"    \"Milvus 是开源的向量检索引擎\"",[990,2088,1646],{"class":1305},[990,2090,2091],{"class":1297,"line":1513},[990,2092,1668],{"class":1305},[990,2094,2095,2097,2099,2102,2104,2106,2108],{"class":1297,"line":1523},[990,2096,1674],{"class":1305},[990,2098,1342],{"class":1301},[990,2100,2101],{"class":1305}," model.encode(texts, ",[990,2103,2020],{"class":1348},[990,2105,1342],{"class":1301},[990,2107,2025],{"class":1379},[990,2109,1358],{"class":1305},[990,2111,2112],{"class":1297,"line":1532},[990,2113,1333],{"emptyLinePlaceholder":1332},[990,2115,2116],{"class":1297,"line":1537},[990,2117,2118],{"class":1565},"# 计算相似度矩阵\n",[990,2120,2121,2124,2126],{"class":1297,"line":1557},[990,2122,2123],{"class":1305},"similarity_matrix ",[990,2125,1342],{"class":1301},[990,2127,2128],{"class":1305}," np.inner(embeddings, embeddings)\n",[990,2130,2131,2133,2135,2138],{"class":1297,"line":1562},[990,2132,1588],{"class":1379},[990,2134,1591],{"class":1305},[990,2136,2137],{"class":1354},"\"相似度矩阵:\"",[990,2139,1358],{"class":1305},[990,2141,2142,2144,2147,2150],{"class":1297,"line":1569},[990,2143,1588],{"class":1379},[990,2145,2146],{"class":1305},"(np.round(similarity_matrix, ",[990,2148,2149],{"class":1379},"3",[990,2151,2152],{"class":1305},"))\n",[925,2154,2156],{"id":2155},"使用-bge-m3-多功能嵌入","使用 BGE-M3 多功能嵌入",[905,2158,2160],{"className":1290,"code":2159,"language":1292,"meta":11,"style":11},"from FlagEmbedding import BGEM3FlagModel\n\n# 加载 BGE-M3 模型\nmodel = BGEM3FlagModel(\"BAAI\u002Fbge-m3\", use_fp16=True)\n\nsentences = [\n    \"什么是检索增强生成？\",\n    \"RAG 的基本原理是什么？\",\n    \"如何做红烧肉？\",\n]\n\n# 同时获取 dense 和 sparse 向量\nembeddings = model.encode(\n    sentences,\n    return_dense=True,\n    return_sparse=True,\n)\n\n# Dense 向量用于语义检索\ndense_vectors = embeddings[\"dense_vecs\"]  # shape: (3, 1024)\n\n# Sparse 向量用于关键词匹配（类似 BM25）\nsparse_vectors = embeddings[\"lexical_weights\"]\n",[912,2161,2162,2174,2178,2183,2207,2211,2220,2227,2234,2241,2245,2249,2254,2263,2268,2279,2290,2294,2298,2303,2322,2326,2331],{"__ignoreMap":11},[990,2163,2164,2166,2169,2171],{"class":1297,"line":1298},[990,2165,1302],{"class":1301},[990,2167,2168],{"class":1305}," FlagEmbedding ",[990,2170,1309],{"class":1301},[990,2172,2173],{"class":1305}," BGEM3FlagModel\n",[990,2175,2176],{"class":1297,"line":1315},[990,2177,1333],{"emptyLinePlaceholder":1332},[990,2179,2180],{"class":1297,"line":1329},[990,2181,2182],{"class":1565},"# 加载 BGE-M3 模型\n",[990,2184,2185,2187,2189,2192,2195,2198,2201,2203,2205],{"class":1297,"line":1336},[990,2186,1980],{"class":1305},[990,2188,1342],{"class":1301},[990,2190,2191],{"class":1305}," BGEM3FlagModel(",[990,2193,2194],{"class":1354},"\"BAAI\u002Fbge-m3\"",[990,2196,2197],{"class":1305},", ",[990,2199,2200],{"class":1348},"use_fp16",[990,2202,1342],{"class":1301},[990,2204,2025],{"class":1379},[990,2206,1358],{"class":1305},[990,2208,2209],{"class":1297,"line":1361},[990,2210,1333],{"emptyLinePlaceholder":1332},[990,2212,2213,2216,2218],{"class":1297,"line":1366},[990,2214,2215],{"class":1305},"sentences ",[990,2217,1342],{"class":1301},[990,2219,1637],{"class":1305},[990,2221,2222,2225],{"class":1297,"line":1403},[990,2223,2224],{"class":1354},"    \"什么是检索增强生成？\"",[990,2226,1646],{"class":1305},[990,2228,2229,2232],{"class":1297,"line":1409},[990,2230,2231],{"class":1354},"    \"RAG 的基本原理是什么？\"",[990,2233,1646],{"class":1305},[990,2235,2236,2239],{"class":1297,"line":1420},[990,2237,2238],{"class":1354},"    \"如何做红烧肉？\"",[990,2240,1646],{"class":1305},[990,2242,2243],{"class":1297,"line":1431},[990,2244,1668],{"class":1305},[990,2246,2247],{"class":1297,"line":1442},[990,2248,1333],{"emptyLinePlaceholder":1332},[990,2250,2251],{"class":1297,"line":1448},[990,2252,2253],{"class":1565},"# 同时获取 dense 和 sparse 向量\n",[990,2255,2256,2258,2260],{"class":1297,"line":1463},[990,2257,1674],{"class":1305},[990,2259,1342],{"class":1301},[990,2261,2262],{"class":1305}," model.encode(\n",[990,2264,2265],{"class":1297,"line":1468},[990,2266,2267],{"class":1305},"    sentences,\n",[990,2269,2270,2273,2275,2277],{"class":1297,"line":1498},[990,2271,2272],{"class":1348},"    return_dense",[990,2274,1342],{"class":1301},[990,2276,2025],{"class":1379},[990,2278,1646],{"class":1305},[990,2280,2281,2284,2286,2288],{"class":1297,"line":1504},[990,2282,2283],{"class":1348},"    return_sparse",[990,2285,1342],{"class":1301},[990,2287,2025],{"class":1379},[990,2289,1646],{"class":1305},[990,2291,2292],{"class":1297,"line":1513},[990,2293,1358],{"class":1305},[990,2295,2296],{"class":1297,"line":1523},[990,2297,1333],{"emptyLinePlaceholder":1332},[990,2299,2300],{"class":1297,"line":1532},[990,2301,2302],{"class":1565},"# Dense 向量用于语义检索\n",[990,2304,2305,2308,2310,2313,2316,2319],{"class":1297,"line":1537},[990,2306,2307],{"class":1305},"dense_vectors ",[990,2309,1342],{"class":1301},[990,2311,2312],{"class":1305}," embeddings[",[990,2314,2315],{"class":1354},"\"dense_vecs\"",[990,2317,2318],{"class":1305},"]  ",[990,2320,2321],{"class":1565},"# shape: (3, 1024)\n",[990,2323,2324],{"class":1297,"line":1557},[990,2325,1333],{"emptyLinePlaceholder":1332},[990,2327,2328],{"class":1297,"line":1562},[990,2329,2330],{"class":1565},"# Sparse 向量用于关键词匹配（类似 BM25）\n",[990,2332,2333,2336,2338,2340,2343],{"class":1297,"line":1569},[990,2334,2335],{"class":1305},"sparse_vectors ",[990,2337,1342],{"class":1301},[990,2339,2312],{"class":1305},[990,2341,2342],{"class":1354},"\"lexical_weights\"",[990,2344,1668],{"class":1305},[2346,2347,2348],"warning",{},"\n使用本地嵌入模型需要足够的计算资源。基础模型（如 `bge-base-zh`，约 110M 参数）可以在 CPU 上运行，但速度较慢；大模型（如 `bge-large-zh`，约 326M 参数）建议使用 GPU。对于 BGE-M3 等大规模模型，强烈建议使用 GPU 并开启 FP16 推理。\n",[892,2350,2352],{"id":2351},"文本分块策略chunking","文本分块策略（Chunking）",[896,2354,2355],{},"在将文档存入向量数据库之前，需要将长文档切分为较小的文本片段（chunks）。分块策略直接影响 RAG 系统的检索质量。",[925,2357,2359],{"id":2358},"固定大小分块fixed-size-chunking","固定大小分块（Fixed-size Chunking）",[896,2361,2362],{},"按固定字符数或 token 数切分文本，通常设置一定的重叠（overlap）以保持上下文连贯性。",[905,2364,2366],{"className":1290,"code":2365,"language":1292,"meta":11,"style":11},"def fixed_size_chunk(text: str, chunk_size: int = 500, overlap: int = 100) -> list[str]:\n    \"\"\"固定大小分块\"\"\"\n    chunks = []\n    start = 0\n    while start \u003C len(text):\n        end = start + chunk_size\n        chunks.append(text[start:end])\n        start = end - overlap  # 向前重叠\n    return chunks\n\ntext = \"这是一段很长的文档内容...\" * 100\nchunks = fixed_size_chunk(text, chunk_size=500, overlap=100)\nprint(f\"分块数量: {len(chunks)}\")\n",[912,2367,2368,2406,2411,2421,2431,2448,2463,2468,2487,2494,2498,2513,2543],{"__ignoreMap":11},[990,2369,2370,2372,2375,2377,2379,2382,2385,2387,2390,2393,2395,2397,2400,2402,2404],{"class":1297,"line":1298},[990,2371,1369],{"class":1301},[990,2373,2374],{"class":1372}," fixed_size_chunk",[990,2376,1376],{"class":1305},[990,2378,1380],{"class":1379},[990,2380,2381],{"class":1305},", chunk_size: ",[990,2383,2384],{"class":1379},"int",[990,2386,1388],{"class":1301},[990,2388,2389],{"class":1379}," 500",[990,2391,2392],{"class":1305},", overlap: ",[990,2394,2384],{"class":1379},[990,2396,1388],{"class":1301},[990,2398,2399],{"class":1379}," 100",[990,2401,1394],{"class":1305},[990,2403,1380],{"class":1379},[990,2405,1400],{"class":1305},[990,2407,2408],{"class":1297,"line":1315},[990,2409,2410],{"class":1354},"    \"\"\"固定大小分块\"\"\"\n",[990,2412,2413,2416,2418],{"class":1297,"line":1329},[990,2414,2415],{"class":1305},"    chunks ",[990,2417,1342],{"class":1301},[990,2419,2420],{"class":1305}," []\n",[990,2422,2423,2426,2428],{"class":1297,"line":1336},[990,2424,2425],{"class":1305},"    start ",[990,2427,1342],{"class":1301},[990,2429,2430],{"class":1379}," 0\n",[990,2432,2433,2436,2439,2442,2445],{"class":1297,"line":1361},[990,2434,2435],{"class":1301},"    while",[990,2437,2438],{"class":1305}," start ",[990,2440,2441],{"class":1301},"\u003C",[990,2443,2444],{"class":1379}," len",[990,2446,2447],{"class":1305},"(text):\n",[990,2449,2450,2453,2455,2457,2460],{"class":1297,"line":1366},[990,2451,2452],{"class":1305},"        end ",[990,2454,1342],{"class":1301},[990,2456,2438],{"class":1305},[990,2458,2459],{"class":1301},"+",[990,2461,2462],{"class":1305}," chunk_size\n",[990,2464,2465],{"class":1297,"line":1403},[990,2466,2467],{"class":1305},"        chunks.append(text[start:end])\n",[990,2469,2470,2473,2475,2478,2481,2484],{"class":1297,"line":1409},[990,2471,2472],{"class":1305},"        start ",[990,2474,1342],{"class":1301},[990,2476,2477],{"class":1305}," end ",[990,2479,2480],{"class":1301},"-",[990,2482,2483],{"class":1305}," overlap  ",[990,2485,2486],{"class":1565},"# 向前重叠\n",[990,2488,2489,2491],{"class":1297,"line":1420},[990,2490,1451],{"class":1301},[990,2492,2493],{"class":1305}," chunks\n",[990,2495,2496],{"class":1297,"line":1431},[990,2497,1333],{"emptyLinePlaceholder":1332},[990,2499,2500,2502,2504,2507,2510],{"class":1297,"line":1442},[990,2501,2003],{"class":1305},[990,2503,1342],{"class":1301},[990,2505,2506],{"class":1354}," \"这是一段很长的文档内容...\"",[990,2508,2509],{"class":1301}," *",[990,2511,2512],{"class":1379}," 100\n",[990,2514,2515,2518,2520,2523,2526,2528,2531,2533,2536,2538,2541],{"class":1297,"line":1448},[990,2516,2517],{"class":1305},"chunks ",[990,2519,1342],{"class":1301},[990,2521,2522],{"class":1305}," fixed_size_chunk(text, ",[990,2524,2525],{"class":1348},"chunk_size",[990,2527,1342],{"class":1301},[990,2529,2530],{"class":1379},"500",[990,2532,2197],{"class":1305},[990,2534,2535],{"class":1348},"overlap",[990,2537,1342],{"class":1301},[990,2539,2540],{"class":1379},"100",[990,2542,1358],{"class":1305},[990,2544,2545,2547,2549,2551,2554,2556,2559,2561,2563],{"class":1297,"line":1463},[990,2546,1588],{"class":1379},[990,2548,1591],{"class":1305},[990,2550,1594],{"class":1301},[990,2552,2553],{"class":1354},"\"分块数量: ",[990,2555,1600],{"class":1379},[990,2557,2558],{"class":1305},"(chunks)",[990,2560,1606],{"class":1379},[990,2562,1609],{"class":1354},[990,2564,1358],{"class":1305},[896,2566,2567,2569,2570,2572],{},[900,2568,1231],{}," 实现简单，效率高\n",[900,2571,1235],{}," 可能在句子中间截断，破坏语义完整性",[925,2574,2576],{"id":2575},"句子级分块sentence-based-chunking","句子级分块（Sentence-based Chunking）",[896,2578,2579],{},"以句子为基本单位进行分块，保证每个分块都由完整的句子组成。",[905,2581,2583],{"className":1290,"code":2582,"language":1292,"meta":11,"style":11},"import re\n\ndef sentence_chunk(text: str, max_chunk_size: int = 500) -> list[str]:\n    \"\"\"基于句子的分块\"\"\"\n    # 按中英文句号、问号、感叹号分句\n    sentences = re.split(r'(?\u003C=[。！？.!?])', text)\n    sentences = [s.strip() for s in sentences if s.strip()]\n\n    chunks = []\n    current_chunk = \"\"\n    for sentence in sentences:\n        if len(current_chunk) + len(sentence) \u003C= max_chunk_size:\n            current_chunk += sentence\n        else:\n            if current_chunk:\n                chunks.append(current_chunk)\n            current_chunk = sentence\n    if current_chunk:\n        chunks.append(current_chunk)\n    return chunks\n",[912,2584,2585,2592,2596,2622,2627,2632,2662,2687,2691,2699,2709,2722,2745,2756,2764,2772,2777,2785,2792,2797],{"__ignoreMap":11},[990,2586,2587,2589],{"class":1297,"line":1298},[990,2588,1309],{"class":1301},[990,2590,2591],{"class":1305}," re\n",[990,2593,2594],{"class":1297,"line":1315},[990,2595,1333],{"emptyLinePlaceholder":1332},[990,2597,2598,2600,2603,2605,2607,2610,2612,2614,2616,2618,2620],{"class":1297,"line":1329},[990,2599,1369],{"class":1301},[990,2601,2602],{"class":1372}," sentence_chunk",[990,2604,1376],{"class":1305},[990,2606,1380],{"class":1379},[990,2608,2609],{"class":1305},", max_chunk_size: ",[990,2611,2384],{"class":1379},[990,2613,1388],{"class":1301},[990,2615,2389],{"class":1379},[990,2617,1394],{"class":1305},[990,2619,1380],{"class":1379},[990,2621,1400],{"class":1305},[990,2623,2624],{"class":1297,"line":1336},[990,2625,2626],{"class":1354},"    \"\"\"基于句子的分块\"\"\"\n",[990,2628,2629],{"class":1297,"line":1361},[990,2630,2631],{"class":1565},"    # 按中英文句号、问号、感叹号分句\n",[990,2633,2634,2637,2639,2642,2645,2648,2651,2654,2657,2659],{"class":1297,"line":1366},[990,2635,2636],{"class":1305},"    sentences ",[990,2638,1342],{"class":1301},[990,2640,2641],{"class":1305}," re.split(",[990,2643,2644],{"class":1301},"r",[990,2646,2647],{"class":1354},"'",[990,2649,2650],{"class":1301},"(?\u003C=",[990,2652,2653],{"class":1379},"[。！？.!?]",[990,2655,2656],{"class":1301},")",[990,2658,2647],{"class":1354},[990,2660,2661],{"class":1305},", text)\n",[990,2663,2664,2666,2668,2671,2673,2676,2678,2681,2684],{"class":1297,"line":1403},[990,2665,2636],{"class":1305},[990,2667,1342],{"class":1301},[990,2669,2670],{"class":1305}," [s.strip() ",[990,2672,1545],{"class":1301},[990,2674,2675],{"class":1305}," s ",[990,2677,1551],{"class":1301},[990,2679,2680],{"class":1305}," sentences ",[990,2682,2683],{"class":1301},"if",[990,2685,2686],{"class":1305}," s.strip()]\n",[990,2688,2689],{"class":1297,"line":1409},[990,2690,1333],{"emptyLinePlaceholder":1332},[990,2692,2693,2695,2697],{"class":1297,"line":1420},[990,2694,2415],{"class":1305},[990,2696,1342],{"class":1301},[990,2698,2420],{"class":1305},[990,2700,2701,2704,2706],{"class":1297,"line":1431},[990,2702,2703],{"class":1305},"    current_chunk ",[990,2705,1342],{"class":1301},[990,2707,2708],{"class":1354}," \"\"\n",[990,2710,2711,2714,2717,2719],{"class":1297,"line":1442},[990,2712,2713],{"class":1301},"    for",[990,2715,2716],{"class":1305}," sentence ",[990,2718,1551],{"class":1301},[990,2720,2721],{"class":1305}," sentences:\n",[990,2723,2724,2727,2729,2732,2734,2736,2739,2742],{"class":1297,"line":1448},[990,2725,2726],{"class":1301},"        if",[990,2728,2444],{"class":1379},[990,2730,2731],{"class":1305},"(current_chunk) ",[990,2733,2459],{"class":1301},[990,2735,2444],{"class":1379},[990,2737,2738],{"class":1305},"(sentence) ",[990,2740,2741],{"class":1301},"\u003C=",[990,2743,2744],{"class":1305}," max_chunk_size:\n",[990,2746,2747,2750,2753],{"class":1297,"line":1463},[990,2748,2749],{"class":1305},"            current_chunk ",[990,2751,2752],{"class":1301},"+=",[990,2754,2755],{"class":1305}," sentence\n",[990,2757,2758,2761],{"class":1297,"line":1468},[990,2759,2760],{"class":1301},"        else",[990,2762,2763],{"class":1305},":\n",[990,2765,2766,2769],{"class":1297,"line":1498},[990,2767,2768],{"class":1301},"            if",[990,2770,2771],{"class":1305}," current_chunk:\n",[990,2773,2774],{"class":1297,"line":1504},[990,2775,2776],{"class":1305},"                chunks.append(current_chunk)\n",[990,2778,2779,2781,2783],{"class":1297,"line":1513},[990,2780,2749],{"class":1305},[990,2782,1342],{"class":1301},[990,2784,2755],{"class":1305},[990,2786,2787,2790],{"class":1297,"line":1523},[990,2788,2789],{"class":1301},"    if",[990,2791,2771],{"class":1305},[990,2793,2794],{"class":1297,"line":1532},[990,2795,2796],{"class":1305},"        chunks.append(current_chunk)\n",[990,2798,2799,2801],{"class":1297,"line":1537},[990,2800,1451],{"class":1301},[990,2802,2493],{"class":1305},[896,2804,2805,2807,2808,2810],{},[900,2806,1231],{}," 保持句子完整性，语义连贯\n",[900,2809,1235],{}," 分块大小不均匀",[925,2812,2814],{"id":2813},"语义分块semantic-chunking","语义分块（Semantic Chunking）",[896,2816,2817],{},"根据文本的语义变化进行分块——当相邻句子的语义相似度低于阈值时，在此处进行切分。",[905,2819,2821],{"className":1290,"code":2820,"language":1292,"meta":11,"style":11},"from sentence_transformers import SentenceTransformer\nimport numpy as np\n\ndef semantic_chunk(text: str, model, threshold: float = 0.5) -> list[str]:\n    \"\"\"基于语义相似度的分块\"\"\"\n    # 先按句子分割\n    sentences = re.split(r'(?\u003C=[。！？.!?])', text)\n    sentences = [s.strip() for s in sentences if s.strip()]\n\n    if len(sentences) \u003C= 1:\n        return sentences\n\n    # 计算每个句子的嵌入\n    embeddings = model.encode(sentences, normalize_embeddings=True)\n\n    # 计算相邻句子的相似度\n    chunks = []\n    current_chunk = [sentences[0]]\n    for i in range(1, len(sentences)):\n        similarity = np.dot(embeddings[i-1], embeddings[i])\n        if similarity \u003C threshold:\n            # 语义变化较大，开始新的分块\n            chunks.append(\"\".join(current_chunk))\n            current_chunk = [sentences[i]]\n        else:\n            current_chunk.append(sentences[i])\n\n    if current_chunk:\n        chunks.append(\"\".join(current_chunk))\n    return chunks\n",[912,2822,2823,2833,2843,2847,2874,2879,2884,2906,2926,2930,2946,2954,2958,2963,2981,2985,2990,2998,3012,3036,3053,3065,3070,3081,3090,3096,3101,3105,3111,3120],{"__ignoreMap":11},[990,2824,2825,2827,2829,2831],{"class":1297,"line":1298},[990,2826,1302],{"class":1301},[990,2828,1951],{"class":1305},[990,2830,1309],{"class":1301},[990,2832,1956],{"class":1305},[990,2834,2835,2837,2839,2841],{"class":1297,"line":1315},[990,2836,1309],{"class":1301},[990,2838,1320],{"class":1305},[990,2840,1323],{"class":1301},[990,2842,1326],{"class":1305},[990,2844,2845],{"class":1297,"line":1329},[990,2846,1333],{"emptyLinePlaceholder":1332},[990,2848,2849,2851,2854,2856,2858,2861,2863,2865,2868,2870,2872],{"class":1297,"line":1336},[990,2850,1369],{"class":1301},[990,2852,2853],{"class":1372}," semantic_chunk",[990,2855,1376],{"class":1305},[990,2857,1380],{"class":1379},[990,2859,2860],{"class":1305},", model, threshold: ",[990,2862,1397],{"class":1379},[990,2864,1388],{"class":1301},[990,2866,2867],{"class":1379}," 0.5",[990,2869,1394],{"class":1305},[990,2871,1380],{"class":1379},[990,2873,1400],{"class":1305},[990,2875,2876],{"class":1297,"line":1361},[990,2877,2878],{"class":1354},"    \"\"\"基于语义相似度的分块\"\"\"\n",[990,2880,2881],{"class":1297,"line":1366},[990,2882,2883],{"class":1565},"    # 先按句子分割\n",[990,2885,2886,2888,2890,2892,2894,2896,2898,2900,2902,2904],{"class":1297,"line":1403},[990,2887,2636],{"class":1305},[990,2889,1342],{"class":1301},[990,2891,2641],{"class":1305},[990,2893,2644],{"class":1301},[990,2895,2647],{"class":1354},[990,2897,2650],{"class":1301},[990,2899,2653],{"class":1379},[990,2901,2656],{"class":1301},[990,2903,2647],{"class":1354},[990,2905,2661],{"class":1305},[990,2907,2908,2910,2912,2914,2916,2918,2920,2922,2924],{"class":1297,"line":1409},[990,2909,2636],{"class":1305},[990,2911,1342],{"class":1301},[990,2913,2670],{"class":1305},[990,2915,1545],{"class":1301},[990,2917,2675],{"class":1305},[990,2919,1551],{"class":1301},[990,2921,2680],{"class":1305},[990,2923,2683],{"class":1301},[990,2925,2686],{"class":1305},[990,2927,2928],{"class":1297,"line":1420},[990,2929,1333],{"emptyLinePlaceholder":1332},[990,2931,2932,2934,2936,2939,2941,2944],{"class":1297,"line":1431},[990,2933,2789],{"class":1301},[990,2935,2444],{"class":1379},[990,2937,2938],{"class":1305},"(sentences) ",[990,2940,2741],{"class":1301},[990,2942,2943],{"class":1379}," 1",[990,2945,2763],{"class":1305},[990,2947,2948,2951],{"class":1297,"line":1442},[990,2949,2950],{"class":1301},"        return",[990,2952,2953],{"class":1305}," sentences\n",[990,2955,2956],{"class":1297,"line":1448},[990,2957,1333],{"emptyLinePlaceholder":1332},[990,2959,2960],{"class":1297,"line":1463},[990,2961,2962],{"class":1565},"    # 计算每个句子的嵌入\n",[990,2964,2965,2968,2970,2973,2975,2977,2979],{"class":1297,"line":1468},[990,2966,2967],{"class":1305},"    embeddings ",[990,2969,1342],{"class":1301},[990,2971,2972],{"class":1305}," model.encode(sentences, ",[990,2974,2020],{"class":1348},[990,2976,1342],{"class":1301},[990,2978,2025],{"class":1379},[990,2980,1358],{"class":1305},[990,2982,2983],{"class":1297,"line":1498},[990,2984,1333],{"emptyLinePlaceholder":1332},[990,2986,2987],{"class":1297,"line":1504},[990,2988,2989],{"class":1565},"    # 计算相邻句子的相似度\n",[990,2991,2992,2994,2996],{"class":1297,"line":1513},[990,2993,2415],{"class":1305},[990,2995,1342],{"class":1301},[990,2997,2420],{"class":1305},[990,2999,3000,3002,3004,3007,3009],{"class":1297,"line":1523},[990,3001,2703],{"class":1305},[990,3003,1342],{"class":1301},[990,3005,3006],{"class":1305}," [sentences[",[990,3008,1457],{"class":1379},[990,3010,3011],{"class":1305},"]]\n",[990,3013,3014,3016,3019,3021,3024,3026,3028,3030,3033],{"class":1297,"line":1532},[990,3015,2713],{"class":1301},[990,3017,3018],{"class":1305}," i ",[990,3020,1551],{"class":1301},[990,3022,3023],{"class":1379}," range",[990,3025,1591],{"class":1305},[990,3027,1756],{"class":1379},[990,3029,2197],{"class":1305},[990,3031,3032],{"class":1379},"len",[990,3034,3035],{"class":1305},"(sentences)):\n",[990,3037,3038,3041,3043,3046,3048,3050],{"class":1297,"line":1537},[990,3039,3040],{"class":1305},"        similarity ",[990,3042,1342],{"class":1301},[990,3044,3045],{"class":1305}," np.dot(embeddings[i",[990,3047,2480],{"class":1301},[990,3049,1756],{"class":1379},[990,3051,3052],{"class":1305},"], embeddings[i])\n",[990,3054,3055,3057,3060,3062],{"class":1297,"line":1557},[990,3056,2726],{"class":1301},[990,3058,3059],{"class":1305}," similarity ",[990,3061,2441],{"class":1301},[990,3063,3064],{"class":1305}," threshold:\n",[990,3066,3067],{"class":1297,"line":1562},[990,3068,3069],{"class":1565},"            # 语义变化较大，开始新的分块\n",[990,3071,3072,3075,3078],{"class":1297,"line":1569},[990,3073,3074],{"class":1305},"            chunks.append(",[990,3076,3077],{"class":1354},"\"\"",[990,3079,3080],{"class":1305},".join(current_chunk))\n",[990,3082,3083,3085,3087],{"class":1297,"line":1585},[990,3084,2749],{"class":1305},[990,3086,1342],{"class":1301},[990,3088,3089],{"class":1305}," [sentences[i]]\n",[990,3091,3092,3094],{"class":1297,"line":1618},[990,3093,2760],{"class":1301},[990,3095,2763],{"class":1305},[990,3097,3098],{"class":1297,"line":1623},[990,3099,3100],{"class":1305},"            current_chunk.append(sentences[i])\n",[990,3102,3103],{"class":1297,"line":1629},[990,3104,1333],{"emptyLinePlaceholder":1332},[990,3106,3107,3109],{"class":1297,"line":1640},[990,3108,2789],{"class":1301},[990,3110,2771],{"class":1305},[990,3112,3113,3116,3118],{"class":1297,"line":1649},[990,3114,3115],{"class":1305},"        chunks.append(",[990,3117,3077],{"class":1354},[990,3119,3080],{"class":1305},[990,3121,3122,3124],{"class":1297,"line":1657},[990,3123,1451],{"class":1301},[990,3125,2493],{"class":1305},[896,3127,3128,3130,3131,3133],{},[900,3129,1231],{}," 分块边界与语义边界对齐，检索质量最高\n",[900,3132,1235],{}," 需要额外的嵌入计算，处理速度较慢",[925,3135,3136],{"id":3136},"分块策略对比",[1021,3138,3139,3158],{},[1024,3140,3141],{},[1027,3142,3143,3146,3149,3152,3155],{},[1030,3144,3145],{},"策略",[1030,3147,3148],{},"实现复杂度",[1030,3150,3151],{},"语义完整性",[1030,3153,3154],{},"处理速度",[1030,3156,3157],{},"适用场景",[1052,3159,3160,3177,3194],{},[1027,3161,3162,3165,3168,3171,3174],{},[1057,3163,3164],{},"固定大小",[1057,3166,3167],{},"低",[1057,3169,3170],{},"一般",[1057,3172,3173],{},"快",[1057,3175,3176],{},"快速原型、结构简单的文档",[1027,3178,3179,3182,3185,3188,3191],{},[1057,3180,3181],{},"句子级",[1057,3183,3184],{},"中",[1057,3186,3187],{},"较好",[1057,3189,3190],{},"较快",[1057,3192,3193],{},"通用场景",[1027,3195,3196,3199,3202,3205,3208],{},[1057,3197,3198],{},"语义分块",[1057,3200,3201],{},"高",[1057,3203,3204],{},"最好",[1057,3206,3207],{},"慢",[1057,3209,3210],{},"对检索质量要求高的场景",[925,3212,3213],{"id":3213},"分块参数调优建议",[983,3215,3216,3222,3228],{},[935,3217,3218,3221],{},[900,3219,3220],{},"chunk_size（分块大小）","：通常设置在 200~1000 字符之间。过小会丢失上下文，过大会引入噪音",[935,3223,3224,3227],{},[900,3225,3226],{},"overlap（重叠大小）","：通常为 chunk_size 的 10%~20%，用于保持上下文连贯性",[935,3229,3230,3233],{},[900,3231,3232],{},"建议做法","：根据实际数据和检索效果反复调试，没有放之四海而皆准的最优参数",[1278,3235,3236],{},"\nLangChain 提供了丰富的文本分割器（Text Splitters），包括 `RecursiveCharacterTextSplitter`、`MarkdownHeaderTextSplitter` 等，建议在实际项目中使用这些成熟的工具而非自己从头实现。\n",[892,3238,3239],{"id":3239},"维度与性能权衡",[896,3241,3242],{},"嵌入向量的维度是一个重要的设计决策，需要在质量和效率之间进行权衡：",[1021,3244,3245,3263],{},[1024,3246,3247],{},[1027,3248,3249,3251,3254,3257,3260],{},[1030,3250,1038],{},[1030,3252,3253],{},"存储空间（100万条）",[1030,3255,3256],{},"检索速度",[1030,3258,3259],{},"语义质量",[1030,3261,3262],{},"建议",[1052,3264,3265,3281,3295,3310,3326,3341],{},[1027,3266,3267,3270,3273,3276,3278],{},[1057,3268,3269],{},"256",[1057,3271,3272],{},"~1 GB",[1057,3274,3275],{},"最快",[1057,3277,3170],{},[1057,3279,3280],{},"资源极度受限时使用",[1027,3282,3283,3285,3288,3290,3292],{},[1057,3284,1110],{},[1057,3286,3287],{},"~2 GB",[1057,3289,3173],{},[1057,3291,3187],{},[1057,3293,3294],{},"移动端、边缘设备",[1027,3296,3297,3299,3302,3304,3307],{},[1057,3298,1149],{},[1057,3300,3301],{},"~3 GB",[1057,3303,3190],{},[1057,3305,3306],{},"好",[1057,3308,3309],{},"大多数场景的平衡选择",[1027,3311,3312,3314,3317,3320,3323],{},[1057,3313,1107],{},[1057,3315,3316],{},"~4 GB",[1057,3318,3319],{},"中等",[1057,3321,3322],{},"很好",[1057,3324,3325],{},"质量优先的场景",[1027,3327,3328,3330,3333,3336,3338],{},[1057,3329,1087],{},[1057,3331,3332],{},"~6 GB",[1057,3334,3335],{},"较慢",[1057,3337,1113],{},[1057,3339,3340],{},"OpenAI 默认维度",[1027,3342,3343,3345,3348,3350,3353],{},[1057,3344,1065],{},[1057,3346,3347],{},"~12 GB",[1057,3349,3207],{},[1057,3351,3352],{},"最优",[1057,3354,3355],{},"追求极致质量",[1011,3357,3358],{},"\n存储空间估算基于 float32（4 字节\u002F维）。实际使用中可以通过量化（如 int8、binary）大幅压缩存储空间，通常能减少 4~32 倍，但会略微牺牲检索精度。\n",[892,3360,3361],{"id":3361},"小结",[896,3363,3364],{},"文本嵌入是 RAG 系统中连接文本世界和向量世界的桥梁。选择合适的嵌入模型和分块策略，对 RAG 系统的整体检索质量至关重要。建议从以下几个方面进行决策：",[932,3366,3367,3373,3379,3385],{},[935,3368,3369,3372],{},[900,3370,3371],{},"语言需求","：中文场景优先选择 BGE 系列，多语言场景选择 BGE-M3",[935,3374,3375,3378],{},[900,3376,3377],{},"部署方式","：快速原型选 OpenAI API，生产环境考虑本地部署开源模型",[935,3380,3381,3384],{},[900,3382,3383],{},"分块策略","：从句子级分块开始，根据效果逐步优化",[935,3386,3387,3390],{},[900,3388,3389],{},"维度选择","：768 维是大多数场景的良好起点，根据实际需求调整",[3392,3393,3394],"style",{},"html pre.shiki code .s8jYJ, html code.shiki .s8jYJ{--shiki-light:#D73A49;--shiki-default:#D73A49;--shiki-dark:#F97583}html pre.shiki code .sxrX7, html code.shiki .sxrX7{--shiki-light:#24292E;--shiki-default:#24292E;--shiki-dark:#E1E4E8}html pre.shiki code .sP4rz, html code.shiki .sP4rz{--shiki-light:#E36209;--shiki-default:#E36209;--shiki-dark:#FFAB70}html pre.shiki code .sIIMD, html code.shiki .sIIMD{--shiki-light:#032F62;--shiki-default:#032F62;--shiki-dark:#9ECBFF}html pre.shiki code .snPdu, html code.shiki .snPdu{--shiki-light:#6F42C1;--shiki-default:#6F42C1;--shiki-dark:#B392F0}html pre.shiki code .sBjJW, html code.shiki .sBjJW{--shiki-light:#005CC5;--shiki-default:#005CC5;--shiki-dark:#79B8FF}html pre.shiki code .sCsY4, html code.shiki .sCsY4{--shiki-light:#6A737D;--shiki-default:#6A737D;--shiki-dark:#6A737D}html .light .shiki span {color: var(--shiki-light);background: var(--shiki-light-bg);font-style: var(--shiki-light-font-style);font-weight: var(--shiki-light-font-weight);text-decoration: var(--shiki-light-text-decoration);}html.light .shiki span {color: var(--shiki-light);background: var(--shiki-light-bg);font-style: var(--shiki-light-font-style);font-weight: var(--shiki-light-font-weight);text-decoration: var(--shiki-light-text-decoration);}html .default .shiki span {color: var(--shiki-default);background: var(--shiki-default-bg);font-style: var(--shiki-default-font-style);font-weight: var(--shiki-default-font-weight);text-decoration: var(--shiki-default-text-decoration);}html .shiki span {color: var(--shiki-default);background: var(--shiki-default-bg);font-style: var(--shiki-default-font-style);font-weight: var(--shiki-default-font-weight);text-decoration: var(--shiki-default-text-decoration);}html .dark .shiki span {color: var(--shiki-dark);background: var(--shiki-dark-bg);font-style: var(--shiki-dark-font-style);font-weight: var(--shiki-dark-font-weight);text-decoration: var(--shiki-dark-text-decoration);}html.dark .shiki span {color: var(--shiki-dark);background: var(--shiki-dark-bg);font-style: var(--shiki-dark-font-style);font-weight: var(--shiki-dark-font-weight);text-decoration: var(--shiki-dark-text-decoration);}",{"title":11,"searchDepth":1315,"depth":1315,"links":3396},[3397,3398,3402,3409,3415,3422,3423],{"id":894,"depth":1315,"text":894},{"id":923,"depth":1315,"text":923,"children":3399},[3400,3401],{"id":927,"depth":1329,"text":927},{"id":961,"depth":1329,"text":961},{"id":1016,"depth":1315,"text":1016,"children":3403},[3404,3405,3406,3407,3408],{"id":1019,"depth":1329,"text":1019},{"id":1218,"depth":1329,"text":1219},{"id":1239,"depth":1329,"text":1240},{"id":1257,"depth":1329,"text":1258},{"id":1272,"depth":1329,"text":1273},{"id":1283,"depth":1315,"text":1283,"children":3410},[3411,3412,3413,3414],{"id":1286,"depth":1329,"text":1287},{"id":1839,"depth":1329,"text":1840},{"id":1938,"depth":1329,"text":1939},{"id":2155,"depth":1329,"text":2156},{"id":2351,"depth":1315,"text":2352,"children":3416},[3417,3418,3419,3420,3421],{"id":2358,"depth":1329,"text":2359},{"id":2575,"depth":1329,"text":2576},{"id":2813,"depth":1329,"text":2814},{"id":3136,"depth":1329,"text":3136},{"id":3213,"depth":1329,"text":3213},{"id":3239,"depth":1315,"text":3239},{"id":3361,"depth":1315,"text":3361},"md",{},{"title":106,"description":107},"ai\u002Frag\u002Fembedding","I7xDG8OLNyf5b-hWNRUjAU_SB8NLQEGHlMiEHmHhB9w",1775474635197]