亚洲精品视频免费_黄色在线网站视频_人人九九精_国产成人精品一区_99热精品免费_91.com在线

首页 > 互联网 > 正文

世界观察:大模型在工业领域探索仍处于初级阶段

2023-07-06 08:53:31来源:人民邮电报  


【资料图】

图片来源:中国工业互联网研究院

近日,中国工业互联网研究院(以下简称“工联院”)针对人工智能大模型在中文工业领域的应用性能、技术架构、标准体系进行系统性评测,并发布系列报告。评测对象涵盖GPT-4、GPT-3.5、文心一言、ChatGLM等国内外具有代表性的头部大模型。

本次工业知识问答测试主要分为客观题与主观题两大类,总计超过1100个问题。主观题主要考察四大维度:基础能力、语句能力、概括能力和逻辑能力。评测结果显示,GPT-4表现最佳。国内头部大模型表现亮眼,整体与GPT-3.5相当。其中百度文心一言在国内大模型中排名第一。

在客观题方面,GPT-4与文心一言表现优于其他大模型。但评测结果也同时指出,大模型在准确率方面有较大的提升空间。在主观题方面,国内大模型的基础能力、语句能力与GPT-4接近,概括能力、逻辑能力与GPT-4存在一定差距。

评测数据集由工业领域八大行业的相关数据构成。包括电子设备制造业、装备制造业、钢铁行业、采矿行业、电力行业、石化化工行业、建材行业和纺织行业。工联院根据工业经验,结合外部数据源,按行业构建行业知识测试集。

从行业维度看,大模型在八个行业知识问答能力上差异明显,个别行业需进一步优化提升。其中,电子、装备行业评价指数较高,纺织、采矿行业综合评价指数相对较低。

分析大模型落地垂直行业痛点,丰富特定行业专业知识。虽然国内大模型在本次评测中表现较好,甚至在部分行业评分优于GPT-3.5,但工联院评测报告指出,国内外通用大模型在工业知识问答领域探索仍处于初级阶段,国内大模型与GPT-4有差距,行业间的泛化能力有待加强。对此,工联院评测报告给出的建议是进一步丰富相关专业领域的数据训练集,进行专业化的微调。 

标签:

相关阅读

相关词

推荐阅读

主站蜘蛛池模板: 成人午夜视频免费 | 久久精品美女 | 唐人社电亚洲一区二区三区 | 久久精品国产精品亚洲婷婷 | 久久99热66这里只有精品一 | 人人揉揉香蕉 | 久久和欧洲码一码二码三码 | 青青草原精品国产亚洲av | 亚洲欧美日韩国产综合 | 天天拍久久 | 亚洲精品国产av成拍色拍 | 久久免费成人 | 国产精品久久亚洲一区二区 | 日韩综合| 91成人爽a毛片一区二区 | 欧美激情视频一区二区 | 青青国产成人久久91 | 欧美一级毛片免费高清的 | 国产精品欧美久久久久无广告 | 亚洲精品一区二区久久这里 | 免费可以看黄的视频 s色 | 在线不卡一区二区三区日韩 | 手机看片久久国产免费不卡 | 久草综合在线观看 | 国产av无码专区亚洲av麻豆 | 国产91精品一区二区麻豆网站 | 91亚洲精品成人一区 | 日日舔夜夜摸 | 特别黄的免费视频大片 | 亚洲熟区 | 国产成人av一区二区三区 | 888午夜不卡理论久久 | 久久精品人人做人人爽 | 国产一级精品视频 | 制服丝袜人妻中文字幕在线 | 亚洲jjzz | 2o2o天天看夜夜看狠狠看 | 日本免费一区二区三区在线看 | 久久久久国产精品无码免费看 | 日本强在线播放一区 | 欧美亚洲国产视频 |