关于匠芯云链
传承千年匠心,智联文化未来
项目基本简介
匠芯云链智能非遗文化讲解助手基于ERNIE-4.5-VL多模态大模型和自主训练的PP-HGNetV2-B6模型(识别30类非遗技艺,准确率89.73%),结合RAG检索增强和知识图谱技术,实现非遗图像精准识别、专业讲解生成和智能问答功能。创新点在于将多模态AI与传统文化深度融合,通过知识图谱提供文化关联性,助力非物质文化遗产的数字化传承与普及。系统提供两种识别方式:ERNIE-4.5-VL通用识别和PaddleX专业非遗识别,满足不同场景需求。
核心技术
- 多模态识别:ERNIE-4.5-VL-28B-A3B-Paddle
- 专业识别模型:PP-HGNetV2-B6(准确率89.73%)
- 知识增强:RAG检索增强生成技术
- 知识关联:基于NetworkX的知识图谱
- 文本处理:TF-IDF、FAISS向量数据库
核心功能
- 非遗图像识别:精准识别非遗技艺类型
- 专业讲解生成:提供深度文化解读
- 知识图谱展示:可视化文化关联性
- 智能问答:回答用户各类非遗问题
- 非遗浏览:系统化展示非遗项目
项目创意
创意思考过程
我们的创意源于两个关键观察:一方面,中国拥有丰富多彩的非物质文化遗产,但年轻一代对传统文化的了解和兴趣正在减少;另一方面,大语言模型和多模态AI技术正在迅速发展,为文化传承提供了新的可能性。作为热爱传统文化的大学生,我们希望利用所学的AI技术知识,搭建一座连接传统与现代的桥梁。
在一次参观地方非遗展览时,我们发现游客对展品充满好奇,但由于缺乏专业讲解,往往只能走马观花。这让我们思考:如果能有一个智能助手,通过拍照就能识别非遗项目并提供专业讲解,同时回答游客的各种问题,将会大大提升文化传播效果。这一思考促使我们决定开发匠芯云链智能非遗文化讲解助手。值得一提的是,我们团队仅用两周时间就完成了整个项目的开发,包括模型训练、系统设计和功能实现。
创新点
自主训练的非遗识别模型
基于PaddleX平台训练的PP-HGNetV2-B6模型,针对30类中国代表性非遗技艺进行专门优化,识别准确率达89.73%
多模态交互
结合图像识别和自然语言处理,用户可通过拍照和对话两种方式探索非遗文化
知识图谱支持
构建非遗知识图谱,展示非遗项目之间的关联性,提供更全面的文化背景
RAG检索增强
通过检索增强生成技术,确保AI回答的专业性和准确性
个性化体验
根据用户兴趣和问题深度,提供不同层次的文化解读
双引擎识别系统
结合ERNIE-4.5-VL和PP-HGNetV2-B6两种模型,实现通用识别和专业识别的互补
社会价值
文化传承价值
- 通过数字技术记录和保存非遗知识,防止传统技艺失传
- 建立非遗数字档案,为后代留下宝贵的文化记忆
- 降低传统文化的认知门槛,吸引更多年轻人了解非遗
- 搭建老中青三代的文化交流桥梁
技术创新价值
- 将最新的多模态AI技术应用于文化遗产领域
- 探索大模型在专业领域知识服务的有效方法
- 构建高质量的非遗图像数据集,填补行业空白
- 建立结构化的非遗知识图谱,促进知识共享
教育与社会价值
- 为学校提供生动的传统文化教学工具
- 提升文化场所的智能化服务水平
- 增强公众对传统文化的认同感和自豪感
- 促进不同地域文化的相互了解和尊重