拓尔思林松涛：发挥高质量数据积淀优势打通大模型落地关键路径

21世纪经济报道

2023-06-08 22:28:07

21世纪经济报道记者雷晨北京报道

6月6日，由21世纪经济报道、北京人工智能产业联盟元宇宙专业委员会、中国文化产业协会文化元宇宙专业委员会主办的“21世纪卓越董事会人工智能闭门会”召开，主题为“AI领域上市公司创新涌现、技术难题与发展路径”。

会上，拓尔思（300229.SZ）副总裁林松涛介绍了“拓天”大模型及行业应用。他表示，大模型技术场景落地中的挑战，主要是质量、可控、时效和成本。

(资料图)

质量方面，他认为，个人服务用ChatGPT，提示词不准可以换一个，如果图片生成不好也可以再换一个，可以说个人对AIGC的容忍度是很高的。但是企业不一样，给政府写顾问报告，数据来源必须是准确的。

可控层面，一是内容安全，数据是有价值观的，模型没有价值观。二是私域数据安全，中国大模型要数据化落地，如何在保证用户私有数据安全的同时将大数据较好地运用也是一个问题。

时效方面，在大数据训练上，灾难性的遗忘一直都是训练的问题，所以需要大模型解决这个问题。另外，怎样输入即时数据，类似Chat GPT，数据最新只到2021年9月，因此在To B服务的时候用不好。

成本方面，千亿模型私有化落地的时候需要训练好，在企业端落地还需要让企业用得起。拓尔思做To B服务，垂直场景落地成为“百模大战”的核心要点。

据林松涛介绍，大模型出来以后颠覆了拓尔思此前积累的NLP技术，公司发现，在大模型的基础上再去结合知识图谱、自然语言处理技术效果更好。与此同时，公司拥有长期数据采集和高质量数据资产积累优势，可将数据迅速投入到大模型当中。

“现在拓尔思拥有全网数据1500亿，有人工整理、专家整理的数据库达30多个，主题数据110亿个，这是拓尔思能够做大模型很重要的优势。”林松涛称。

据了解，拓尔思在大模型应用方面首先选择政府、媒体和金融三个优势赛道。

在林松涛看来，做垂直领域首先要选好大模型基座，国内头部厂商自己做基座，也有一些厂商选择开源，同时还需要有数据以及在专业领域的积累，最后在大模型落地时，不仅要有技术、数据、还需要让用户知道如何应用，包括真实场景的闭环、基于用户反馈的学习等等。

“我们现在要解决的三个问题，一是实现大模型与专业知识库的融合。二是如何提升AIGC的内容质量和数据安全，特别是在内容事实核查方面。三是如何降低百亿级大模型落地的成本。”林松涛表示。

责任编辑：263

热点新闻

拓尔思林松涛：发挥高质量数据积淀优势打通大模型落地关键路径

《行动计划》提出：到2025年重庆市将建成全国一流千兆光网城市当前播报

华如科技：在脑机方面的应用目前主要涉及文化展览领域-世界微头条

五大模型解高考数学：阿里通义千问、360智脑10题全错得0分；讯飞星火答对一半_焦点快报

工夫茶香，茗扬四海，来文博会茶阅世界分会场畅享茶文化盛宴！

超模来了第一场城市海选赛深圳龙华圆满落幕

【财经分析】欧元区陷入技术性衰退欧洲央行加息前景不确定性增大_环球动态

钾矿储量超白亿吨老挝官员称还有投资机会今日观点

奥特维(688516)签订4.8亿元订单，单晶炉业务有望成为第二增长点-最新资讯

平安银行：行长胡跃飞辞任聘任冀光恒为行长

完全性大动脉错（关于完全性大动脉错介绍）

科技部火炬中心公布国家级科技企业孵化器名单：福建2家孵化器上榜_快看

全球快资讯丨成果丰硕丨惠达上海厨卫展招商峰会圆满成功

23海资03票面利率为3.6300%

当前热议!项目投运盈利能力进一步增强山河药辅可转债募资不超3.2亿元

精工科技获2家机构调研：公司与新疆隆炬、吉林化纤、吉林国兴签署的合同约定的碳纤维生产线均已确认收入，与浙江宝旌签署的合同约定的碳纤维生产线目前正在安装中（附调研问答）当前独家

平安银行聘任冀光恒为行长，胡跃飞因年龄原因辞职

阳新县15个试点入选湖北省优化营商环境先行区创建名单

天天百事通！小李补胎23周年庆暨夏季轮胎安全节盛大启幕

环球最资讯丨第三届中国工艺美术博览会在南京举办河北省48家企业参展

重磅！2023年中国·廊坊国际经济贸易洽谈会将首次发布权威报告|全球快看

滚动：每日机构分析：6月8日

蹉跎辗转怎么读？蹉跎是什么意思？|每日信息

潍柴动力(000338.SZ)：在500马力以上干线物流运输市场的占有率持续攀升

资讯：赤坎区将举行“百日千万招聘专项行动”暨餐饮行业招聘会

深圳热线版权所有 Copyright © 2022 SZONLINE(SZONLINE.CN) All Rights Reserved.邮箱：56 26 623@qq.com

粤ICP备18025786号-54 营业执照公示信息