基于视觉语言模型(Qwen-VL)的医疗图像自动化分析实践
探讨如何将多模态大模型(如 Qwen-VL-Max)引入医学文本流水线,实现化验单的图片OCR解读与结构化临床语义提取...
阅读全文 →Exploring LLM-based Terminology Parsing in Vertical Domains (Life Sciences & Medicine)
摘要: 本项目旨在探索国产大语言模型(如Qwen, GLM等)在特定垂直领域(生命科学与医学英语)中的术语解析能力。通过构建自动化解析流程,实现对复杂医学术语的精准提取、翻译及上下文语义分析,为跨语言医学研究提供技术支持。
随着大语言模型(LLM)技术的飞速发展,其在通用领域的表现已令人瞩目。然而,在高度专业化的垂直领域,尤其是涉及复杂术语体系的生命科学与医学领域,LLM的性能仍面临挑战。目前正在整理 Surgimeds(外科与医药)相关的英语词料库。由于垂直领域术语的特殊性,通用模型往往会出现幻觉(Hallucination),计划通过 LoRA 微调来改善这一问题。本技术博客记录了我作为一名研究者,在此领域进行的技术探索与编程实践。
探讨如何将多模态大模型(如 Qwen-VL-Max)引入医学文本流水线,实现化验单的图片OCR解读与结构化临床语义提取...
阅读全文 →本文通过选取500个高频医学术语,分别测试了通义千问(Qwen-Max)与智谱GLM-4的翻译准确率与幻觉率。实验结果显示,在特定提示词工程(Prompt Engineering)优化后,两者在术语解析上的差异...
阅读全文 →探讨如何利用LangChain框架构建一个自动化的术语解析Pipeline。从PDF文档的预处理、文本分块(Chunking),到利用RAG(检索增强生成)技术提高解析精度...
阅读全文 →