标签 · tag

#AI 工程化实战

共 24 篇

LLM 不能替代运维工程师，但确实能把重复性、低价值的工作自动化掉。本文分享我在实际工作中用 Claude 落地的几个场景。

Agent不是更智能的ChatGPT调用，它是一个能自主规划和执行多步骤任务的循环系统。本文拆解ReAct推理循环、Tool调用设计原则、Multi-Agent协作模式、Human-in-the-loop设计，以及告警分 …

什么时候该微调、什么时候该用提示工程？本文给出决策框架，然后用Unsloth+QLoRA实战微调Qwen2.5-7B，覆盖数据格式、训练监控、权重合并、部署到vLLM测试，以及10个真实踩坑记录。

GPT-5.4、Claude Opus 4.6、Gemini 2.5 Pro、Llama 4 Scout、DeepSeek V3.2——2026年4月的大模型格局已经和一年前完全不同。本文从工程师视角梳理当前主力模型的真 …

同事第一次用 GPT-4 API 写代码时问我：为什么我发了一段中文，token 消耗比英文多那么多？为什么模型有时候会一本正经地胡说八道？这篇文章把我认为工程师必须理解的 LLM 概念系统整理了一遍，不涉及 …

RAG（检索增强生成）是目前企业落地 LLM 最主流的方式。本文覆盖 RAG 系统的完整设计：文档处理管线、分块策略、向量检索与关键词混合检索、Rerank 重排序、上下文压缩，以及用 RAGAS 框架评估 RAG 质量 …

覆盖向量数据库选型对比（Milvus/Qdrant/Weaviate/pgvector）、Milvus Standalone与Cluster部署、Collection Schema设计、HNSW/IVF_FLAT索引调优 …

AI 应用天然是 I/O 密集型的：等 LLM 响应、等向量数据库检索、等多个工具调用返回。同步写法在这里是性能杀手。这篇文章从 event loop 原理讲到实际的 AI 应用模式，重点是 asyncio.gather …