·部分信息内容如下:
知识图谱建设及资源检索适应性升级意向公开(2024-JH18-F1003)(第1包)
我部就以下项目进行预研,欢迎广大供应商提出意见建议并参与采购活动。如对该项目采购方式、供应商资格条件、技术指标要求存在意见建议的,请将相关材料加盖公章后于公示截止时间前递交至我部。
一、 项目名称:知识图谱建设及**检索适应性升级
二、 项目编号:****-JH**-F****
三、 项目概况:
包号 服务名称 服务要求 采购数量 服务地点 服务期限 备注 * 知识图谱建设及**检索适应性升级 详见商务、技术要求 * ** 签订合同之日起至****年**月**日 说明 *.投标供应商须对本项目内所有产品和数量进行唯一报价,否则视为无效投标
*.投标报价应包括所有货物供应、运输、安装调试、技术培训、售后服务、备品备件和伴随服务等价格。
*.投标供应商必须保证所投产品为全新、未使用过的产品。
*.最高限价:***万元。投标报价超过招标最高限价的为无效投标。
注意:关键指标参数和要求以★标记,★项供应商须提供相应承诺。(有*项★不满足即按无效投标处理)。
四、商务要求:
★(一)交货时间、地点与方式
*.交货地点:** 。
*.交货期: **** 年 ** 月**日前完成项目建设。
*.交货方式: 驻场开发实施,整体完成后现场验收交付 。
★(二)售后服务
*.质量保证期:项目验收完毕之日算起,质保期为 ** 个月。
*.投标供应商须承诺履行安全义务。
*.投标供应商须承诺提供项目的技术培训、技术支持和维修巡检服务,服务内容包括 系统使用培训、系统维护培训 ,并在投标文件中提供书面方案。
*.项目验收后,质保期内投标供应商应向用户提供的免费总体技术支持和定期巡检服务。超出质保期后,供应商应当继续提供技术支持服务,可视情收取必要的人力成本费。必须要有专门队伍从事此项工作,并提供热线技术支持服务,针对用户所反映的重大问题应立即响应,在**小时之内赶到现场实地解决问题。
★(三)知识产权和安全要求
对采购单位提供的人员、地址、采购情况等信息要保守秘密,不得向外界透露。中标通知书发出后,采购单位将与中标供应商签订安全协议。
(四)付款及结算方式
项目无预付款,交付验收合格后,采购单位支付至合同金额**%,质保期满,采购单位支付质保款 *%。
五、技术要求
(一)总体情况
图书馆已有统一检索平台,构建了基础的**画像、人物画像、机构画像,本项目建设目标是进一步提高图书馆信息**利用率,提高检索的准确性和相关性,为统一检索赋予基础自然语言处理能力,让信息**从被动发现到主动推送、从自主挖掘到自动挖掘,降低知识获取成本。建设需从多维度图书馆信息**发现角度深入展开,完善**画像、人物画像、机构画像,依托数据平台数据建立学科专业画像,构建各画像间的关系,为用户提供多维的信息**发现服务。项目中所涉及到的服务器、操作系统、基础基础数据库由甲方依相关规定提供。
(二)知识图谱建设
本次建设数据来源主要有两方面,一方面是智慧校园数据平台的结构化、半结构化数据,包括图书馆信息**元数据(含纸质**数据、数字图书馆数据、教材数据等)、人力**数据、机构数据、教务数据、站群系统数据等,数据总量约*亿条;另一方面是非结构化数据,包括电子期刊、电子图书、电子教材、法规库等信息**数据,数据总量约*亿个文档(含特殊文件格式数据,如超星电子书、知网CAJ)。项目需通过对上述数据的知识抽取,完成知识图谱的搭建。
★*、知识图谱系统总体需符合国家、J队发布的法规标准及行业规范。平台软件要求采用B/S体系架构设计,所采用数据库应在瀚**全版数据库系统V*.*.*、优炫数据库管理系统V*.*、金仓数据库管理系统V*.*.*、华库安全数据库管理系统GBase *S-JY V*.*四款中选用。。
★*、系统本地化部署,适配飞腾S****CPU服务器,支持虚拟化部署,所部署服务器操作为银河**高级服务器操作系统V**(GF版)。客户端支持运行在Linux上的主流浏览器(Chrome **+、firefox **+、***浏览器**+(速模式等)进行访问。
*、知识图谱系统具备对智慧校园数据平台的关系型数据进行抽取的功能,同时具备对图书馆数字化**的PDF、Word等通用格式文本的知识抽取功能。本次知识图谱系统开发应将能够工具化的模块尽可能工具化,便于学科领域专家在后续工作中辅助完成更多的**组构建。
*、知识图谱系统主要通过知识获取、知识表示、知识存储、知识融合、知识建模、知识计算、知识运维等技术完成建设,至少包含知识管理、知识抽取、知识应用、图谱可视化等模块。
知识图谱系统运行速度性能指标:正常业务执行时间<*s、非统计性查询响应时间≤*s、统计性查询响应时间≤**s。
*、知识管理模块主要是设置图谱相关的主数据信息以及基础配置,应包括实体标签、关系库、语料库管理、知识建模、知识存储等功能。
*.*、系统应具备通过分类器对实体进行标签分类,设定图书、教材、人员、机构等领域标签分类体系,且管理员可对实体标签进行手动标注或者对系统已有标签进行修改。
*.*、系统应具备可靠的算法自动获取准确度比较高的实体关系,形成系统关系库,形成**、人物、机构、学科专业等之间的关联关系,且用户可通过手动勾选的方式补充完善关系库。
*.*、系统应提供语料库,作为系统分词检索的基本依据,可专家自定义语料库,在通过审核后同基础语料库一并提供系统服务。
*.*、应具备对领域图谱模式体系的构建能力。具备通过图可视化及列表方式进行知识图谱模式编辑的能力,包括概念编辑、属性编辑、边属性编辑、私有属性编辑等。具备**种以上知识表示能力,包括但不限于概念、实体、属性、关系、事件、时序、gis、标签、规则、多模态等。具备知识图谱模式的发布与引用功能,支持图谱模式的复用。具备自动建模功能,支持对知识图谱中的实体属性以及概念进行自动合并与规约功能,实现对知识图谱模式进行优化,包括概念规约、数值属性实例化、私有属性公有化和多属性合并等。具备通过rdf/owl或excel模板方式对知识图谱模式的批量导入导出功能。
*.*、系统应具备对领域图谱知识内容的编辑管理能力。具备实体、属性、关系等知识编辑管理能力,并支持多模态知识存储,包括图片,音视频及文档等。支持*种或以上查询语言,至少包含Sparql、Gremlin和Cypher等。具备对图谱中所获取的实体、属性、关系等信息的溯源与定位功能,包括数据来源、操作者、入图方式,并支持按照数据来源、入图方式、实体名称、置信度进行实体筛选。
*.*、支持TB级图谱数据的存储;单机支持亿级节点、十亿级关系和属性图谱的存储,分布式支持百亿级别节点、千亿级关系和属性图谱的存储。
*、知识抽取模块主要是为了兼容不同维度、不同粒度、不同语义的数据来源,支持用户根据自身需求,选择通过接入不同数据库或者不同接口的方式对数据进行抽取整合。
*.*、具备从原始数据库等数据介质进行数据接入、加工及管理。从获取数据**库中接入数据,应具备对数据库连接的配置能力,全量与增量更新数据。对自建知识库中接入数据,并进行数据加工入图等。
*.*、构建图谱最基础的部分,系统通过词性标注、句法分析、语义分析识别出文本中不同词汇的不同义项,对数据中的每个词语进行义项划分和语义解析,将实体和属性归类到正确的节点上。
*.*、系统通过自然语言处理技术,包括词性标注、命名实体识别、实体链接等多动作结合的方式,从领域**中识别出实体。
*.*、系统能够自动提取实体之间的语义关系,减少人工干预的成本和误差,提高知识图谱的准确度和完整度,提升知识管理和应用的效率。
*.*、系统具备从不同数据源或不同知识图谱的信息进行整合,以创建一个更一致、更完整的知识图谱。具备基于规则的多源数据自动融合计算,规则包括实体名称相同或同义、属性相同、标签相同及存在相连关系。具备冲突检测功能,支持基于属性对实体进行对比。
*.*、实体抽取,在标注语料数量>****时,抽取结果平均准确率大于**%,平均召回率大于**%。
*.、*属性抽取,在标注语料数量>****时,抽取结果平均准确率大于**%,平均召回率大于**%。
*.*关系抽取,在标注语料数量>****时,抽取结果平均准确率大于**%,平均召回率大于**%。
*.*、两节点融合时间小于*秒。
*、知识应用模块主要是基于构建完成的知识图谱提供知识检索与咨询服务。
*.*、系统通过检索界面输入关键词,系统应精准解构和分析查询者输入的语句或关键词,在海量数据中迅速寻找与搜索内容有相关性的知识。基础性检索,主要包括内容全文检索、精确检索、模糊检索、同义词检索、拼音检索、检索统计、组合搜索、联想搜索等基础服务。搜索纠错,或称拼写检查,如果输入错误,可纠错提示用户。意图识别,将搜索内容分到相应的意图种类。语义搜索提供按照自然语言的方式对知识进行检索,对用户输入的自然语言基于知识图谱进行意图识别生成、查询转换和查询计算等。图谱视图检索,具备图谱视图形式的检索服务。支持知识卡片式展示,对命中的实体结果以知识卡片的方式提供信息摘要展示。搜索结果聚合展示,具备搜索结果展示、排序、统计等功能,提供对搜索结果进行聚合筛选,提供对搜索结果进行列表展示,支持标题、简介、时间、作者等多字段展示。具备对各类搜索指标统计分析,包括pv及转化率、uv及转化率、无结果词、少结果词等。
*.*、系统通过需要询问的问题,应对其语言进行语义分析,自动抽取与问题相关的信息与数据,按照关联性、时间性等指标整理排列后进行展示。具备不少于*类实体类问题的问答,包括单实体问题,实体属性问题,实体对比类问题。具备*种以上的条件约束问答功能,至少包括时间约束、数值约束、关系约束、边属性约束。具备*种以上的最值约束问答功能,至少包括时间最值、数值最值、边属性最值。具备*种以上多轮会话要素补全功能,至少包括实体的替换、属性的替换、时间替换、统计维度替换。具备基于知识图谱模式的二跳、三跳以及多跳查询类问答。具备基于模板的语义解析配置。具备多策略问答能力的统一集成,包括知识图谱问答、FAQ问答以及阅读理解问答的单独调用与集成调用,支持第三方问答能力接入。
*.*、记录数不高于****W的条件下(无索引写入),搜索吞吐量(TPS)为***,单次搜索响应时间小于*.*s。
*.*、基础搜索的召回率和准确率不低于*.**,top*准确率不低于*.*。
*.*、语义搜索的召回率和准确率不低于*.**,top*准确率不低于*.*。
*.*、智能问答响应时间小于*秒。
*.*、问句中实体识别准确率大于**%,需识别文本中的数字、时间、人名、地名、机构名等信息。
*、图谱可视化模块主要是根据用户搜索的内容对用户进行智能推荐,以多种维度的关系图对搜索实体进行展示,更直观更清晰的了解到搜索内容的主要信息与相关的重要信息。
*.*、图谱搜索功能可以在多个维度上进行检索,如实体、属性、关系等。
*.*、图谱搜索功能可以根据不同的查询条件,进行精准匹配,从而返回最符合用户需求的结果。
*.*、图谱搜索功能可以通过挖掘实体内部和实体之间的关系,实现深度挖掘和分析。
*.*、可视化展示:图谱搜索功能可以将查询结果以图形化的方式展示给用户,具备图谱探索、路径发现、多节点关联分析、基于时序的动态事件分析等可视化展示能力。具备**种以上的图谱可视化布局方式,包括但不限于静态布局、动态布局、树形、环形、径向等布局方式。具备步长,条件过滤,方向,路径规则等分析条件配置。具备实体样式配置,包括颜色、大小、形状等配置。具备图谱可视化面板的实体聚合统计功能,支持按照节点类型、关系类型、数值属性等方式进行统计。
*.*、图谱搜索功能可以结合机器学习等技术,为用户推荐相关的实体和知识,提高搜索效率和精度。
*.*、亿级别节点,实体属性检索响应时间<*秒
*.*、亿级别节点的知识图谱中*步以内两节点路径发现平均响应时间小于*秒
*.*、支持千级别的实体及关系渲染,*千实体、*千关系的渲染时间不超过*秒。
*.*、供应方提供满足以上需求的整体解决方案,包括但不限于:项目理解、解决方案概述、技术方案、实施方案、质量保证、风险管理、服务支持等。
(三)**检索适应性升级
现有统一检索平台具备全部源码,本建设内容需对图书馆现有统一检索平台进行适应性改造,将知识图谱融合到统一检索平台中,进一步提高检索结果的准确性以及智慧推送的智能化。
*、检索系统适应性升级
*.*、检索词联想
提供检索词联想,运用知识图谱技术实现检索词联想,为用户提供更精准的检索关键词,获取准确的数据**。
*.*、语义检索
基于图书馆现有搜索引擎,提供语义级检索,丰富检索功能,通过精细化标引后,在已加工基础上可实现主题、人物、机构、同义词扩展等更加精细化检索。
*.*、跨语言检索
提供跨语言检索能力,实现自动将检索条件扩展转化为多种语言进行检索操作。
*.*、关联知识服务
提供按搜索词进行相关知识的关联功能。包括相关热搜词服务、对应词条数据、相似词、下位词等。提供相关文献关联功能。**提供某文献的同类主题文献或包含有相同关联知识的文献等关联功能。为前端服务网站展现搜索词关联知识服务提供数据基础。
*.*、热点发现功能。支持按搜索词提供相关研究领域的热点发现功能。**挖掘该研究领域的论文发表趋势;挖掘关联该领域相关领域的论文发表趋势;挖掘该领域的权威作者关系;挖掘该领域发表的刊物数据;挖掘该研究领域具有影响力或有较高相关性的研究机构等。为前端服务网站展现搜索结果相关的可视化研究热点提供数据基础和展示。
*、精准推送
基于知识图谱建设精准推送模块,对图书馆信息**进行知识标引,并分析建立数据**到知识图谱的关联关系,再综合运用知识图谱、搜索引擎、人工智能等技术实现为读者用户提供更加精准的纸书服务功能。
*、知识图谱可视化
实现学术统计功能,依托多维知识对象数据模型构建主题、人物、机构的知识脉络关系,使**与每个知识对象紧密结合,**能够连点成线、连线成网,从任何知识对象出发均能快速找到与其高度相关的知识节点与**。支持以下功能:近十年发文趋势、研究领域河道图、相关成果分布、优质成果收录、主要学科分布、主要发文期刊、第一作者发文占比、学术影响力排名、学者影响力排名、相关成果文献等。
六、投标供应商资格条件
(一)符合《中华人民**国政府采购法》第二十二条资格条件:
*.具有独立承担民事责任的能力;
*.具有良好的商业信誉和健全的财务会计制度;
*.具有履行合同所必需的设备和专业技术能力;
*.有依法缴纳税收和社会保障资金的良好记录;
*.参加政府采购活动前*年内,在经营活动中没有重大违法记录;
*.法律、行政法规规定的其他条件。
(二)国有企业;事业单位;军队单位;成立三年以上的非外资控股企业。
(三)单位负责人为同一人或者存在直接控股、管理关系的不同供应商,不得同时参加同一包的采购活动。生产型企业的生产场经营地址或者注册登记地址为同一地址的,非国有销售型企业的股东和管理人员(法定代表人、董事、监事)之间存在近亲属、相互占股等关联的,也不得同时参加同一包的采购活动。近亲属指夫妻、直系血亲、三代以内旁系血亲或近姻亲关系。
(四)未被列入政府采购失信名单、军队供应商暂停名单,未在军队采购失信名单禁入处罚期内,未被“信用中国”网站列入失信被执行人、重大税收违法案件当事人。
(五)近*年没有发生过重大质量安全事故。
(六)本项目不接受联合体投标。
(七)具有武器装备科研生产单位保密资格(二级及以上)或具有涉密信息系统集成乙级及以上资质证书。
(八)投标企业应当具备服务履约的能力。
七、公示时间:自公告发布之日起**个工作日。
八、意见反馈方式及有关说明
*.在公示有效期内提出,并加盖单位公章的《预研意见、建议反馈表》采取邮寄、电子邮件(***********,标题:项目编号+预研建议反馈表)等方式书面递交我部,提出的意见建议应当详细具体、理由充分、实事求是,不得有意排斥其他潜在供应商。反馈材料应当写明供应商名称并加盖单位公章,必要时可提供有关证明材料。
*.对于项目整体需求不满足三个品牌产品或三家供应商的;需求个别条款的描述具有倾向性或排斥性的,当事人应明确指出可能涉及的品牌或供应商。
*.对于本项目的供应商资格要求,有国家强制性要求但未写明的,当事人可以明确指出并提供依据材料。
*.供应商提出的意见建议,将作为我部进一步论证完善需求参数和资格条件要求的必要参考,是否采纳均不影响供应商参与本项目后续采购活动,我部也不作书面回复。
*.技术参数等有关需求最终以本项目招标公告和招标文件为准。
九、招标人联系方式
联 系 人:王老师 电 话:****-*******
电 话:***********
附件*.pdf