我的博客

技术博客

这里记录了一些我的学习笔记

ProjectsMay 9, 202611 分钟/阅读时间

Agentic科研服务平台 - Project Detail

经过系统性的工程实施，Research Agent 平台取得了以下可量化的成果： **功能完整性方面：** 平台成功实现了全部 6 种 AI 工作流的端到端运行。QA 工作流可在 30-90 秒内完成从问题输入到带引用答案输出的全流程，每项证据均附带来源论文、段落定位与置信度标注。Compare 工作流支持从 5+ 维度（方法论、实验结果、创新点、局限性、适用场景）进行多论文并行对比，并自动生成标准 BibTeX 导出。Related Work 工作流内建 LLM 自动评判→人类复审→定向修订的闭环，最大修订次数可配置。Compute 工作流完整支持 Python 代码沙箱执行、matplotlib/seaborn 图表生成、pandas 表格分析、Jupyter Notebook 模板执行 4 种计算模式。所有工作流均支持可选的 Judge 质量评判与完整的 Trace 执行追踪。 **架构灵活性与可扩展性方面：** Provider Mode 系统被证明是一个关键的架构决策。通过 `mock / real / hybrid` 三级抽象，开发人员可以在不配置任何外部 API 密钥的情况下完整运行和调试全部工作流；切换到 real 模式时可以无缝接入 OpenAI、Azure、火山引擎等任意 OpenAI 兼容 API；hybrid 模式提供了真实调用失败时的优雅降级。18 个第三方集成的标准化接口设计使得添加新的学术搜索引擎或 LLM 提供商仅需实现对应的 Provider 接口，无需修改任何核心工作流代码。 **协作与知识管理方面：** 平台实现了完整的研究团队协作功能——三级角色权限（OWNER/EDITOR/VIEWER）的项目成员管理、论文库的收藏与笔记标签系统、基于论文或主题自动生成结构化 Wiki 条目的知识沉淀机制、以及任务完成/失败/项目共享等事件驱动的通知系统。这使得一个实验室的集体知识不再分散在各成员的本地工具中，而是统一沉淀在平台的知识库内。 **可观测性与质量保障方面：** 三层 Trace 系统实现了对每次工作流执行的完整记录——包含每个图节点的输入输出摘要、每个工具调用的参数与返回值、LLM 调用的模型/Token/费用、Judge 评判的各维度评分等。Trace 查看器提供了从任务创建到最终答案的全链路时间线回放。Eval Runner 支持对不同模型变体和 Prompt 变体进行系统性的 A/B 对比评测，为 Prompt 优化和模型选型提供了数据驱动的决策依据。 **工程交付物方面：** 项目产出包括：约 220+ Python 源文件、80+ Java 源文件、60+ TypeScript/TSX 源文件、6 个 Flyway 数据库迁移脚本、5 份完整的技术文档（总计约 11 万字）、GitHub Actions CI/CD 流水线、以及 Docker Compose 一键部署配置。平台在 mock 模式下可实现"零外部依赖"的完整本地运行，在 real 模式下支持从开发环境到生产环境的平滑迁移。

阅读全文

ProjectsMay 9, 202628 分钟/阅读时间

智慧食堂订餐管理平台 - Project Detail

阅读全文

ProjectsApr 3, 202616 分钟/阅读时间

智能股票分析Agent - Project Detail

经过这一轮工程化改造，系统最终形成了完整的“训练—评估—在线分析”闭环，核心链路都具备了标准化入口、统一治理机制和可追踪输出。从线上运行结果来看，系统在一次典型分析任务中可在 188.45 秒内完成 6 个智能体协作和 5 次模型交互，且工具失败率、无效输出率、报告空白率均为 0；在另一组更高耗时的执行配置下，虽然总耗时上升，但整体失败率依然保持为 0，说明系统已经具备在稳定性不下降的前提下继续优化执行策略的空间。更重要的是，训练与评估入口在引入数据契约之后，能够在问题数据进入模型前就完成拦截并给出明确反馈，显著提升了结果可信度；而统一日志、质量指标和持续集成基线的建立，也让系统从“功能堆叠”走向“可治理的工程系统”，为后续迭代和规模化应用打下了基础。

Python

阅读全文

ProjectsApr 1, 20264 分钟/阅读时间

在线点单平台 - Project Detail

下单链路在高峰场景下更平稳，主流程从同步强依赖转为异步削峰，系统吞吐与响应稳定性显著提升。库存扣减与提交幂等机制落地后，超卖和重复下单风险得到有效控制，交易一致性增强。订单分表与全局 ID 方案提升了数据增长下的查询与写入可扩展性，为后续业务扩容预留空间。缓存治理体系显著降低数据库热点压力，并在高并发下保持较好的可用性与一致性。统一化基础能力与自动填充机制提升了研发效率；WebSocket 实时提醒增强了商家端订单处理时效。

JAVASpring MVCRabbitMQRedisMySQLJWTWebSocket

阅读全文

ProjectsApr 1, 20266 分钟/阅读时间

基于Graph Agent的智能聊天助手 - Project Detail

系统从“模型自由发挥”升级为“策略驱动执行”，多工具协作过程更可控，路由与执行链路具备可解释性。复杂任务具备了稳定的状态流转和恢复能力，减少了因中间步骤失败导致的整体任务崩溃。长会话下的上下文效率显著提升：通过摘要压缩和分层记忆降低 token 负担，同时保持关键用户事实的可持续利用。工具调用质量与安全性提升：越权/误用工具被及时拦截，关键副作用可被验证，降低“看似完成、实际失败”的风险。整体工程稳定性与可维护性增强：评估与容错逻辑可测试、可回归、可迭代，为后续扩展更多 Worker/工具提供了可复用框架。

JAVASpring AIRAGRedis，LLM

阅读全文

C++Mar 21, 20265 分钟/阅读时间

《C++程序设计》阅读笔记【1-函数】

C++程序设计中的函数部分

C++

阅读全文

latexMar 21, 202610 分钟/阅读时间

LaTeX技能-专题1

这份文档是关于 LaTeX 基础入门的实用指南，涵盖了从基本结构到字体设置及篇章布局的核心内容

latex

阅读全文