摘要: 本文探讨了如何通过构建基于LangChain的知识库和利用LMDeploy推理加速技术,提升大语言模型在解答高中数学题目中的正确性和响应速度。通过OCR技术将解析卷转化为LaTeX格式,结合BGE-M3模型进行文本向量化并存储于Faiss数据库,模型在解答时通过动态检索知识库内容来增强准确性;同时,通过LMDeploy量化加速推理技术,显著提升了模型的推理效率。实验结果表明,多个大模型在构建知识库前后的得分有显著差异,总体回答正确率提升了71.84%;在回答速度上,自部署模型总体第一题回答速度提高了121.10%,后续题目回答速度提高了259.94%。这些改进显著提升了大语言模型在解答高考数学题时的正确率和速度。