AI 工程化实战 on vishine

AI 工程化实战 on vishinehttps://blog.vishine.top/series/ai-%E5%B7%A5%E7%A8%8B%E5%8C%96%E5%AE%9E%E6%88%98/Recent content in AI 工程化实战 on vishineHugozh-CNFri, 03 Apr 2026 11:20:00 +0800运维工程师的 AI 工具实践https://blog.vishine.top/posts/%E8%BF%90%E7%BB%B4%E5%B7%A5%E7%A8%8B%E5%B8%88ai%E5%B7%A5%E5%85%B7%E5%AE%9E%E8%B7%B5/Fri, 03 Apr 2026 11:20:00 +0800https://blog.vishine.top/posts/%E8%BF%90%E7%BB%B4%E5%B7%A5%E7%A8%8B%E5%B8%88ai%E5%B7%A5%E5%85%B7%E5%AE%9E%E8%B7%B5/从写 Shell 脚本、解读错误信息到辅助故障排查，分享运维工程师真实使用 AI 工具的高效场景、无效场景和 Prompt 技巧，以及各工具的适合场景。Ollama 在 K8s 上跑大模型：本地 LLM 的运维实践https://blog.vishine.top/posts/ollama-kubernetes-llm/Mon, 30 Mar 2026 09:08:00 +0800https://blog.vishine.top/posts/ollama-kubernetes-llm/在 Kubernetes 上部署 Ollama 运行本地大模型，从 GPU 调度到 CPU 推理降级，再到运维场景的实际集成，记录完整的踩坑与实践过程。GitHub Copilot 工程化使用：不只是代码补全https://blog.vishine.top/posts/github-copilot-engineering/Sat, 28 Mar 2026 12:51:00 +0800https://blog.vishine.top/posts/github-copilot-engineering/GitHub Copilot不只是Tab补全。Copilot Chat的/fix /explain /tests命令、workspace上下文、Copilot for CLI、在Terraform/Dockerfile/K8s YAML中的实际用法，以及提高补全命中率的技巧。Cursor AI 编程助手深度使用指南https://blog.vishine.top/posts/cursor-ai-editor-guide/Wed, 25 Mar 2026 13:07:00 +0800https://blog.vishine.top/posts/cursor-ai-editor-guide/Cursor不是装了AI插件的VSCode，它重新设计了人机协作的交互模型。本文拆解Tab补全、@上下文引用、Composer、Agent模式、.cursorrules配置，并以重构运维脚本为例演示完整工作流。FastGPT 知识库问答系统：从部署到应用https://blog.vishine.top/posts/fastgpt-knowledge-base-practice/Fri, 20 Mar 2026 09:44:00 +0800https://blog.vishine.top/posts/fastgpt-knowledge-base-practice/FastGPT是专注知识库问答的开源平台，相比Dify上手更快。本文覆盖MongoDB+PgVector部署、知识库创建与文档导入、Flow工作流配置、相似度阈值调优、API接入钉钉，以及运维知识库的实战案例。Dify 私有化部署与 RAG 应用构建实战https://blog.vishine.top/posts/dify-self-hosted-rag-practice/Thu, 12 Mar 2026 13:37:00 +0800https://blog.vishine.top/posts/dify-self-hosted-rag-practice/Dify是当前私有化部署最成熟的LLM应用构建平台。本文覆盖Docker Compose部署、多模型Provider配置、知识库创建与切片调优、RAG对话应用构建、工作流编排，以及API发布与生产监控。多模态大模型实践：图像理解与视觉分析https://blog.vishine.top/posts/multimodal-llm-vision-practice/Mon, 09 Mar 2026 13:37:00 +0800https://blog.vishine.top/posts/multimodal-llm-vision-practice/覆盖主流多模态模型选型对比、图像理解API调用方式、OCR/文档理解/图表解析等实际场景，以及一个完整的运维场景实战：用多模态模型自动分析Grafana截图并生成告警摘要。Prompt Engineering 完全指南：从入门到工程化https://blog.vishine.top/posts/prompt-engineering-guide/Mon, 09 Mar 2026 11:37:00 +0800https://blog.vishine.top/posts/prompt-engineering-guide/Prompt Engineering 不是玄学，而是有规律可循的工程实践。从基础技巧到企业级工程化，本文覆盖提示词设计的完整方法论，包括 A/B 测试、版本管理、失效模式分析，以及在生产系统中管理提示词的最佳实践。OpenAI API 工程化实践：从 Hello World 到生产https://blog.vishine.top/posts/openai-api-engineering/Tue, 03 Mar 2026 11:41:00 +0800https://blog.vishine.top/posts/openai-api-engineering/OpenAI API 是大多数 LLM 应用开发者的起点，但从 Hello World 到真正可靠的生产系统，中间有很多工程细节需要处理。本文覆盖 Function Calling、Structured Output、Batch API、Embeddings 的完整实践，以及速率限制、错误处理和成本控制的系统方案。MCP 协议实战：给 AI Agent 接上运维工具https://blog.vishine.top/posts/mcp-protocol-devops/Fri, 27 Feb 2026 09:52:00 +0800https://blog.vishine.top/posts/mcp-protocol-devops/Model Context Protocol 让 AI 能够标准化地调用外部工具。本文用 Python 实现一个运维 MCP Server，接入 kubectl、Prometheus、Loki，让 AI 直接查集群状态。Claude Code CLI 使用指南：AI 驱动的终端编程助手https://blog.vishine.top/posts/claude-code-cli-guide/Thu, 26 Feb 2026 12:27:00 +0800https://blog.vishine.top/posts/claude-code-cli-guide/Claude Code是Anthropic推出的终端AI编程助手，不同于编辑器插件，它在终端里直接操作文件、执行命令、理解整个代码库。本文覆盖安装配置、核心交互模式、CLAUDE.md自定义、K8s排障和自动化脚本场景。Claude API 开发完全指南：从调用到生产应用https://blog.vishine.top/posts/claude-api-development-guide/Tue, 24 Feb 2026 11:26:00 +0800https://blog.vishine.top/posts/claude-api-development-guide/Claude API 的设计哲学和 OpenAI 有些不同，但一旦理解其模式，就会发现它在长文本、代码生成和工具调用上非常可靠。本文覆盖从 SDK 配置到 Prompt Caching、Tool Use、Vision 的完整开发实践，以及生产中的错误处理与成本控制策略。LangGraph 工作流编排：构建有状态的 AI 应用https://blog.vishine.top/posts/langgraph-workflow-orchestration/Sun, 15 Feb 2026 12:44:00 +0800https://blog.vishine.top/posts/langgraph-workflow-orchestration/从LangChain Chain的局限出发，讲清楚LangGraph的状态机模型、Graph/Node/Edge的设计方式，以及条件分支、循环、人工介入、Checkpoint持久化的工程实现，最后用一个运维诊断工作流串起来所有概念。Langfuse：LLM 应用可观测性平台实战https://blog.vishine.top/posts/langfuse-llm-observability/Sat, 14 Feb 2026 11:44:00 +0800https://blog.vishine.top/posts/langfuse-llm-observability/讲清楚为什么LLM应用必须要可观测性，以及如何用Langfuse从链路追踪、Prompt版本管理、评估实验到成本分析做到全覆盖，包含Docker自托管部署和Python SDK完整集成示例。LangChain 从入门到实战：构建 LLM 应用的工程框架https://blog.vishine.top/posts/langchain-practical-guide/Mon, 09 Feb 2026 11:01:00 +0800https://blog.vishine.top/posts/langchain-practical-guide/LangChain 是构建 LLM 应用最流行的框架，但也是踩坑最多的框架之一。本文从 LCEL 表达式、ReAct Agent、LangGraph 工作流到生产部署，梳理真正有用的部分，并指出哪些功能实际工程中应该避免。RAG 评估体系：RAGAS 指标与幻觉检测实践https://blog.vishine.top/posts/rag-evaluation-ragas/Thu, 05 Feb 2026 10:20:00 +0800https://blog.vishine.top/posts/rag-evaluation-ragas/RAG 系统上线后，'感觉回答质量还不错'不是一个可持续的评估方式。RAGAS 提供了一套可量化的评估框架，让你能追踪 Faithfulness、Answer Relevancy 等指标随时间的变化，并在每次改动后自动验证系统质量没有退化。大模型赋能运维：LLM 在故障排查和自动化中的实际应用https://blog.vishine.top/posts/aiops-llm-devops/Sat, 31 Jan 2026 12:06:00 +0800https://blog.vishine.top/posts/aiops-llm-devops/LLM 不能替代运维工程师，但确实能把重复性、低价值的工作自动化掉。本文分享我在实际工作中用 Claude 落地的几个场景。AI Agent 设计模式：从单步到复杂工作流https://blog.vishine.top/posts/ai-agent-design-patterns/Thu, 29 Jan 2026 09:17:00 +0800https://blog.vishine.top/posts/ai-agent-design-patterns/Agent不是更智能的ChatGPT调用，它是一个能自主规划和执行多步骤任务的循环系统。本文拆解ReAct推理循环、Tool调用设计原则、Multi-Agent协作模式、Human-in-the-loop设计，以及告警分析Agent和巡检Agent的实战实现。LLM 微调入门：LoRA 让大模型适配私有场景https://blog.vishine.top/posts/llm-finetuning-lora-practice/Wed, 14 Jan 2026 09:56:00 +0800https://blog.vishine.top/posts/llm-finetuning-lora-practice/什么时候该微调、什么时候该用提示工程？本文给出决策框架，然后用Unsloth+QLoRA实战微调Qwen2.5-7B，覆盖数据格式、训练监控、权重合并、部署到vLLM测试，以及10个真实踩坑记录。2026 大模型全景：主力模型横评与选型指南https://blog.vishine.top/posts/llm-landscape-2025/Fri, 09 Jan 2026 13:50:00 +0800https://blog.vishine.top/posts/llm-landscape-2025/GPT-5.4、Claude Opus 4.6、Gemini 2.5 Pro、Llama 4 Scout、DeepSeek V3.2——2026年4月的大模型格局已经和一年前完全不同。本文从工程师视角梳理当前主力模型的真实规格与适用边界，给出场景化选型矩阵，并讨论开源追平闭源、推理模型标配化、agent workload 崛起这三个2026年的核心判断。大模型核心概念：工程师需要理解的 LLM 基础https://blog.vishine.top/posts/llm-core-concepts/Mon, 17 Nov 2025 11:37:00 +0800https://blog.vishine.top/posts/llm-core-concepts/同事第一次用 GPT-4 API 写代码时问我：为什么我发了一段中文，token 消耗比英文多那么多？为什么模型有时候会一本正经地胡说八道？这篇文章把我认为工程师必须理解的 LLM 概念系统整理了一遍，不涉及 Transformer 数学，只讲对你写代码有帮助的部分。RAG 系统设计与实战：检索增强生成完全指南https://blog.vishine.top/posts/rag-system-design-practice/Tue, 11 Nov 2025 11:41:00 +0800https://blog.vishine.top/posts/rag-system-design-practice/RAG（检索增强生成）是目前企业落地 LLM 最主流的方式。本文覆盖 RAG 系统的完整设计：文档处理管线、分块策略、向量检索与关键词混合检索、Rerank 重排序、上下文压缩，以及用 RAGAS 框架评估 RAG 质量，最后分享生产环境踩坑记录。Milvus 向量数据库实战：从部署到生产应用https://blog.vishine.top/posts/milvus-vector-database-practice/Thu, 06 Nov 2025 09:52:00 +0800https://blog.vishine.top/posts/milvus-vector-database-practice/覆盖向量数据库选型对比（Milvus/Qdrant/Weaviate/pgvector）、Milvus Standalone与Cluster部署、Collection Schema设计、HNSW/IVF_FLAT索引调优、混合搜索实战，以及生产环境常见问题处理。Python 异步编程实战：asyncio 在 AI 应用中的使用https://blog.vishine.top/posts/python-async-programming/Fri, 22 Nov 2024 12:44:00 +0800https://blog.vishine.top/posts/python-async-programming/AI 应用天然是 I/O 密集型的：等 LLM 响应、等向量数据库检索、等多个工具调用返回。同步写法在这里是性能杀手。这篇文章从 event loop 原理讲到实际的 AI 应用模式，重点是 asyncio.gather 并发调用、SSE 流式输出处理和常见陷阱排查。