专业成就

科研与项目

我在研究生阶段进行过的科研以及做过的一些项目

科研经历

2
GDP-Net: Global Dependency-Enhanced Dual-Domain Parallel Network for Ring Artifact Removal

GDP-Net: Global Dependency-Enhanced Dual-Domain Parallel Network for Ring Artifact Removal

第三作者

In Computed Tomography (CT) imaging, the ring artifacts caused by the inconsistent detector response can significantly degrade the reconstructed images, having negative impacts on the subsequent applications. The new generation of CT systems based on photon-counting detectors are affected by ring artifacts more severely. The flexibility and variety of detector responses make it difficult to build a well-defined model to characterize the ring artifacts. In this context, this study proposes the global dependency-enhanced dual-domain parallel neural network for Ring Artifact Removal (RAR). First, based on the fact that the features of ring artifacts are different in Cartesian and Polar coordinates, the parallel architecture is adopted to construct the deep neural network so that it can extract and exploit the latent features from different domains to improve the performance of ring artifact removal. Besides, the ring artifacts are globally relevant whether in Cartesian or Polar coordinate systems, but convolutional neural networks show inherent shortcomings in modeling long-range dependency. To tackle this problem, this study introduces the novel Mamba mechanism to achieve a global receptive field without incurring high computational complexity. It enables effective capture of the long-range dependency, thereby enhancing the model performance in image restoration and artifact reduction. The experiments on the simulated data validate the effectiveness of the dual-domain parallel neural network and the Mamba mechanism, and the results on two unseen real datasets demonstrate the promising performance of the proposed RAR algorithm in eliminating ring artifacts and recovering image details.

IEEE Transactions on Medical Imaging医学影像领域顶刊 / IF=11.3

工具:Computed tomography, ring artifact removal, parallel neural network, global dependency, Mamba mechanism

查看详情
NERVE: A Near-Real-Time Three-Dimensional Reconstruction Approach for Interventional Devices and Surrounding Vessels Using a Monoplane C-arm Cone-Beam CT

NERVE: A Near-Real-Time Three-Dimensional Reconstruction Approach for Interventional Devices and Surrounding Vessels Using a Monoplane C-arm Cone-Beam CT

第一作者

Real-time three-dimensional (3D) reconstruction of interventional devices, such as stents and embolization coils, together with surrounding vessels, using a monoplane C-arm cone-beam CT (CBCT) has emerged as a critical capability in modern neurovascular interventions. Due to the slow gantry rotation speed of current CBCT systems, real-time 3D recon struction of interventional devices and surrounding vessels has never been accomplished. In this work, we propose a framework for near-real-time 3D reconstruction of interventional devices and vasculature, termed NERVE, which integrates deep structure extraction (DSE) model and deep backprojection filtration (DBF) model together to accomplish 3D reconstruction of interventional devices and vasculature using data acquired at three projection views over a 60◦ angular range. DSE is trained to extract targets from acquired projection data by removing irrelevant anatomical background. DBF is trained to transform direction backpro jection image volumes to final 3D image volumes accordingly. DBF is designed to learn prior regularization that captures the distribution-level characteristics of ideal interventional devices and vasculature to eliminating limited view angle artifacts and high-attenuation-induced artifacts. Extensive numerical simula tions (1000 samples for testing) validate the feasibility and effec tiveness of NERVE. NERVE explicitly leverages subject-specific measured data, ensuring near-real-time 3D reconstruction with high fidelity, potentially facilitating image-guided interventional navigation for patients with neurovascular diseases.

poster9th International Conference on Image Formation in X-Ray Computed Tomography

工具:Interventional Devices; Real-Time Three Dimensional Reconstruction; Deep Learning

查看详情

项目经历

5
Agentic科研服务平台

Agentic科研服务平台

结果:经过系统性的工程实施,Research Agent 平台取得了以下可量化的成果: **功能完整性方面:** 平台成功实现了全部 6 种 AI 工作流的端到端运行。QA 工作流可在 30-90 秒内完成从问题输入到带引用答案输出的全流程,每项证据均附带来源论文、段落定位与置信度标注。Compare 工作流支持从 5+ 维度(方法论、实验结果、创新点、局限性、适用场景)进行多论文并行对比,并自动生成标准 BibTeX 导出。Related Work 工作流内建 LLM 自动评判→人类复审→定向修订的闭环,最大修订次数可配置。Compute 工作流完整支持 Python 代码沙箱执行、matplotlib/seaborn 图表生成、pandas 表格分析、Jupyter Notebook 模板执行 4 种计算模式。所有工作流均支持可选的 Judge 质量评判与完整的 Trace 执行追踪。 **架构灵活性与可扩展性方面:** Provider Mode 系统被证明是一个关键的架构决策。通过 `mock / real / hybrid` 三级抽象,开发人员可以在不配置任何外部 API 密钥的情况下完整运行和调试全部工作流;切换到 real 模式时可以无缝接入 OpenAI、Azure、火山引擎等任意 OpenAI 兼容 API;hybrid 模式提供了真实调用失败时的优雅降级。18 个第三方集成的标准化接口设计使得添加新的学术搜索引擎或 LLM 提供商仅需实现对应的 Provider 接口,无需修改任何核心工作流代码。 **协作与知识管理方面:** 平台实现了完整的研究团队协作功能——三级角色权限(OWNER/EDITOR/VIEWER)的项目成员管理、论文库的收藏与笔记标签系统、基于论文或主题自动生成结构化 Wiki 条目的知识沉淀机制、以及任务完成/失败/项目共享等事件驱动的通知系统。这使得一个实验室的集体知识不再分散在各成员的本地工具中,而是统一沉淀在平台的知识库内。 **可观测性与质量保障方面:** 三层 Trace 系统实现了对每次工作流执行的完整记录——包含每个图节点的输入输出摘要、每个工具调用的参数与返回值、LLM 调用的模型/Token/费用、Judge 评判的各维度评分等。Trace 查看器提供了从任务创建到最终答案的全链路时间线回放。Eval Runner 支持对不同模型变体和 Prompt 变体进行系统性的 A/B 对比评测,为 Prompt 优化和模型选型提供了数据驱动的决策依据。 **工程交付物方面:** 项目产出包括:约 220+ Python 源文件、80+ Java 源文件、60+ TypeScript/TSX 源文件、6 个 Flyway 数据库迁移脚本、5 份完整的技术文档(总计约 11 万字)、GitHub Actions CI/CD 流水线、以及 Docker Compose 一键部署配置。平台在 mock 模式下可实现"零外部依赖"的完整本地运行,在 real 模式下支持从开发环境到生产环境的平滑迁移。

智能股票分析Agent

智能股票分析Agent

这是一个面向金融投研场景的智能分析系统,目标是将数据获取、模型训练、离线评估和多智能体在线分析串联成一条可复用的工程链路。项目整体覆盖三个核心方向:一是基于新闻文本的情绪与风险识别训练,二是面向股票分析的数据服务能力建设,三是多智能体协同分析与报告生成。 随着系统从单点功能逐步演进为端到端流程,工程问题开始集中暴露:训练入口对脏数据敏感,外部数据调用缺少稳定性保障,多智能体协作过程缺乏统一日志和质量指标,导致系统虽然能够运行,但难以验证结果质量,也难以支撑持续扩展。因此,这项工作的核心目标不再只是“把功能做出来”,而是进一步推动系统实现工程可控、质量可追踪、运行可度量。

结果:经过这一轮工程化改造,系统最终形成了完整的“训练—评估—在线分析”闭环,核心链路都具备了标准化入口、统一治理机制和可追踪输出。 从线上运行结果来看,系统在一次典型分析任务中可在 188.45 秒内完成 6 个智能体协作和 5 次模型交互,且工具失败率、无效输出率、报告空白率均为 0;在另一组更高耗时的执行配置下,虽然总耗时上升,但整体失败率依然保持为 0,说明系统已经具备在稳定性不下降的前提下继续优化执行策略的空间。 更重要的是,训练与评估入口在引入数据契约之后,能够在问题数据进入模型前就完成拦截并给出明确反馈,显著提升了结果可信度;而统一日志、质量指标和持续集成基线的建立,也让系统从“功能堆叠”走向“可治理的工程系统”,为后续迭代和规模化应用打下了基础。

Python
在线点单平台

在线点单平台

该项目是一个面向“本地生活/餐饮外卖”场景的后端系统,目标是支撑商家端运营与用户端下单的完整闭环。随着业务从课程级 Demo 向真实高并发场景演进,系统需要同时解决三类问题:一是交易链路稳定性(高峰期下单、支付回调、订单状态流转);二是性能与扩展性(热点查询、订单数据持续增长);三是工程可维护性(分层清晰、通用能力复用、异常与鉴权统一治理)。因此项目在保留核心业务功能的基础上,重点围绕“高并发可用、数据可扩展、架构可治理”进行了系统化改造。

结果:下单链路在高峰场景下更平稳,主流程从同步强依赖转为异步削峰,系统吞吐与响应稳定性显著提升。 库存扣减与提交幂等机制落地后,超卖和重复下单风险得到有效控制,交易一致性增强。 订单分表与全局 ID 方案提升了数据增长下的查询与写入可扩展性,为后续业务扩容预留空间。 缓存治理体系显著降低数据库热点压力,并在高并发下保持较好的可用性与一致性。 统一化基础能力与自动填充机制提升了研发效率;WebSocket 实时提醒增强了商家端订单处理时效。

JAVASpring MVCRabbitMQRedisMySQLJWTWebSocket
基于Graph Agent的智能聊天助手

基于Graph Agent的智能聊天助手

该项目是一个面向复杂业务问答与工具执行的企业级智能体系统,核心目标是让大模型在“检索问答(RAG)+ 数据库分析(SQL)+ 外部工具调用(TOOL)”混合场景下稳定完成多步骤任务。项目早期采用单模型串行调用,随着任务复杂度上升,逐步暴露出路由不准、工具误用、长对话记忆退化和异常恢复能力弱等问题,因此我主导了多智能体图架构、分层记忆和策略化容错的重构工作。

结果:系统从“模型自由发挥”升级为“策略驱动执行”,多工具协作过程更可控,路由与执行链路具备可解释性。 复杂任务具备了稳定的状态流转和恢复能力,减少了因中间步骤失败导致的整体任务崩溃。 长会话下的上下文效率显著提升:通过摘要压缩和分层记忆降低 token 负担,同时保持关键用户事实的可持续利用。 工具调用质量与安全性提升:越权/误用工具被及时拦截,关键副作用可被验证,降低“看似完成、实际失败”的风险。 整体工程稳定性与可维护性增强:评估与容错逻辑可测试、可回归、可迭代,为后续扩展更多 Worker/工具提供了可复用框架。

JAVASpring AIRAGRedis,LLM