ytblog
首页博客关于

标签

RAG

共 6 篇文章

2026-06-075 min read

zvec: 阿里开源轻量级高性能向量数据库,单进程内极速向量检索

深入分析阿里开源的 zvec 向量数据库,探讨其轻量级架构、极致性能优化策略以及在 AI 应用中的应用场景。

GitHubVector DatabaseAIC++RAG
第 15 篇
2026-05-1928 min read

客户服务Agent:对话管理、知识库集成与多轮对话

深入探讨客户服务Agent的核心技术,包括对话状态管理、意图识别、知识库集成和多轮对话策略

Agent客户服务对话管理知识库RAG
第 3 篇
2026-05-173 min read

RAG 篇:基于知识库的智能问答系统设计

RAG 用检索把外部知识送进上下文,让模型基于企业文档、代码库、规范和数据库说明回答问题。

RAGLLM知识库向量检索
第 4 篇
2026-05-173 min read

向量数据库篇:Embedding 检索系统如何选型

向量数据库负责存储 embedding 并做相似度检索,是 RAG、语义搜索和推荐召回中的重要基础设施。

向量数据库EmbeddingRAG检索
第 10 篇
2026-05-172 min read

LLM 应用评测篇:如何判断模型回答是否靠谱

没有评测的 LLM 应用很难持续迭代,Prompt、模型和检索策略的每次修改都可能带来隐性回归。

LLM评测RAGAgent
第 15 篇
2026-05-176 min read

向量数据库在 RAG 系统中的应用:从 pgvector 到 Milvus、Qdrant

RAG 系统里的向量数据库负责语义召回,但真正的效果取决于切分、Embedding、索引、元数据过滤、重排和更新链路。

数据库系统向量数据库RAGpgvectorMilvus