基于大模型特定垂直领域术语解析的技术笔记

研究背景概览

摘要： 本项目旨在探索国产大语言模型（如Qwen, GLM等）在特定垂直领域（生命科学与医学英语）中的术语解析能力。通过构建自动化解析流程，实现对复杂医学术语的精准提取、翻译及上下文语义分析，为跨语言医学研究提供技术支持。

随着大语言模型（LLM）技术的飞速发展，其在通用领域的表现已令人瞩目。然而，在高度专业化的垂直领域，尤其是涉及复杂术语体系的生命科学与医学领域，LLM的性能仍面临挑战。目前正在整理 Surgimeds（外科与医药）相关的英语词料库。由于垂直领域术语的特殊性，通用模型往往会出现幻觉（Hallucination），计划通过 LoRA 微调来改善这一问题。本技术博客记录了我作为一名研究者，在此领域进行的技术探索与编程实践。

最新技术笔记

2026年3月15日 | 分类: 多模态AI

基于视觉语言模型(Qwen-VL)的医疗图像自动化分析实践

探讨如何将多模态大模型（如 Qwen-VL-Max）引入医学文本流水线，实现化验单的图片OCR解读与结构化临床语义提取...

VLM Vision Medical Imaging

阅读全文 →

2026年2月10日 | 分类: 模型评估

国产大模型在医学术语翻译中的准确性对比：Qwen-Max vs GLM-4

本文通过选取500个高频医学术语，分别测试了通义千问（Qwen-Max）与智谱GLM-4的翻译准确率与幻觉率。实验结果显示，在特定提示词工程（Prompt Engineering）优化后，两者在术语解析上的差异...

Model Evaluation Medicine Prompt Engineering

阅读全文 →

2026年1月25日 | 分类: 架构设计

构建基于LangChain的医学术语自动化解析流水线

探讨如何利用LangChain框架构建一个自动化的术语解析Pipeline。从PDF文档的预处理、文本分块（Chunking），到利用RAG（检索增强生成）技术提高解析精度...

LangChain Python Automation

阅读全文 →