新闻中心

以专业服务与客户满意度的最高境界为目标而不懈努力

你当前位置 奇异果体育 > 新闻中心 > 行业新闻

baet365海天瑞声获5家机构调研:海天瑞声的价值主要体现在多版权数据的汇集、版权数据的清洗、以及基于客户大模型的后续服务(附调研问答)

发布时间:2023-09-14 15:23:04    阅读量:

  baet365官方网站海天瑞声9月13日发布投资者关系活动记录表,公司于2023年9月8日接受5家机构调研,机构类型为其他、基金公司、证券公司。 投资者关系活动主要内容介绍:

  答:强化学习标注和传统的文本类标注两者在单一标注形式上基本趋同,都包括文本评分、文本改写、文本分类等。但相比于传统文本标注,强化学习标注的颗粒度更细、标注的维度更加广泛、涉及的学科更加丰富、规模更大。

  问:2、目前公司是否有数据集挂到数据交易所进行交易?目前数据交易所方面具体有什么进展?

  答:目前海天瑞声已与北数所baet365、上数所、深数所等3家交易所建立联系,并在北数所、上数所完成数据产品的挂牌上市,并成为北数所战略合作伙伴。未来,公司将继续拓展、加强与各地数交所的合作,积极加入数据要素生态圈,助力国家数字经济和数据要素市场快速发展。

  问:3、目前已经有很多大模型陆续发布,未来数据需求是会持续增长还是下降?原因是什么?

  答:随着更多大模型产品面向公众推出上线、以及不断进行版本迭代,未来的大模型相关数据需求会持续、显著增长,这符合当AI进行应用侧后,对数据的需求才会规模性增长的规律。预期该类增长将主要体现在预训练阶段对高质量、大规模的版权数据、公共数据、多模态数据、垂直领域的实际场景数据等方面的需求,以及不断提升其交互精准度的强化学习阶段各类数据需求等。例如,若某大模型应用领域为文学创作,就会需要来自版权方的散文、小说、诗词等数据进行创作能力训练;若某大模型拟提升其在民生政务领域的客服能力,则来自民生政务服务平台的此类对话数据将产生重要价值。未来,随着大模型向更高级、更多维、更广泛垂向拓展,大模型数据需求将呈现快速增长趋势。

  问:4、大模型预训练会涉及到版权数据,在版权数据方面,海天的价值是什么?

  答:海天瑞声的价值主要体现在多版权数据的汇集、版权数据的清洗、以及基于客户大模型的后续服务。首先,海天瑞声可以汇聚不同版权方的数据,针对客户需求进行不同版权数据的提供。同时,海天瑞声可以针对客户具体定制化需求,对版权数据进行精细化清洗。虽然版权数据本身已为高质量数据,但仍无法直接用于模型训练,需经过高质量清洗后才能使用baet365。例如,通常需将版权数据中重复数据以及不符合法律法规的相关内容进行清洗,以更好帮助大模型节约训练算力以及使大模型在训练后具备良好的法律道德价值观。

  问:5、客户也在做自己的算法,也可以用算法做预标注,海天瑞声的价值在哪里?

  答:目前行业内确实存在少量客户自身利用算法进行预标注的情况,但该类客户仍有大量数据需求依赖第三方数据服务商解决。一方面,对于已经过客户算法预标注的数据,仍将依赖第三方服务商在其预标注结果基础上进行更高难度、更加精细化的处理,以达到更高的数据准确率。相比于客户的预标注算法,海天瑞声在部分场景下具有更优的算法预标注能力,因为公司算法迭代速度更快,我们是以人机藕合的方式进行数据处理,我们的预标注算法能够第一时间、甚至以近乎实时的方式得到人工处理的反馈,使得预标注算法能够在最短的时间内实现快速迭代,最大程度提升对数据的预标注效果。另一方面,由于其预标注范围仅局限于其过往积累的数据现象,客户算法通常无法覆盖所有类型的数据标注需求,因此,对于行业较为前沿、愈加丰富的数据需求或标注场景,客户仍将依赖专业的第三方数据服务机构进行数据处理;

  惠誉评级将信用挂钩票据(CLN)的11个评级从“AAAsf”下调至“AA+”

  已有39家主力机构披露2023-06-30报告期持股数据,持仓量总计1214.76万股,占流通A股29.99%

  近期的平均成本为75.62元。该股资金方面呈流出状态,投资者请谨慎投资。该公司运营状况尚可,暂时未获得多数机构的显著认同,后续可继续关注。

  限售解禁:解禁1907万股(预计值)baet365,占总股本比例31.62%,股份类型:首发原股东限售股份。(本次数据根据公告推理而来,实际情况以上市公司公告为准)

  投资者关系关于同花顺软件下载法律声明运营许可联系我们友情链接招聘英才用户体验计划

  不良信息举报电话举报邮箱:增值电信业务经营许可证:B2-20090237