用于大模型的首批中文基础语料库发布
中新网北京12月21日电 中国网络空间安全协会人工智能安全治理专业委员会20日在北京召开发布会,用于语料面向社会发布用于大模型的大模首批中文基础语料库。
据悉,首批网安协会人工智能安全治理专委会会同国家权威机构,中文发挥企业、基础高校和科研单位协同优势,用于语料通过“共建-共享”机制,大模汇聚一批高质量可信数据,首批经过去重、中文过滤等技术手段,基础形成并对社会发布首批120G中文基础语料,用于语料包括1亿余条数据,大模500亿个token。首批用户登录中国网络空间安全协会网站,中文点击“中文基础语料库”链接,基础通过注册、认证等程序,就能够下载相关语料。
网安协会人工智能安全治理专委会负责人表示,语料库建设是一项长期性、专业性的工作,需要遵循相应法规、标准和规范,需要合力共建、突破创新,推动形成科学有效的语料库汇聚、处理、使用机制,为国家人工智能技术创新和产业发展赋能。
来自专委会成员单位、大模型备案机构和相关领域科研、企业、社会组织代表近100人参加发布会。
-
文章
787
-
浏览
32
-
获赞
92
热门推荐
-
男生制止校园霸凌遭同学辱骂围堵?北京政法职业学院回应
梦词古筝李媛媛,氧气少女空灵绝响走红网络!
李媛媛,毕业于中央音乐学院音乐教育专业,自6岁开始学习古筝,15岁在音乐专业艺术院校学习古筝,对一些有代表性的现代筝曲有很好的掌握,并曾创作及改编多首古筝独奏曲,在中国古筝领域有着极高的造诣。2007AQHA中国青少年西部马术体系今年全面推出
AQHA中国青少年西部马术比赛体系今年全面推出,并且获得北京市马术运动协会认证,采纳北京马术协会青少年西部马术赛事标准。本体系各科目均为以运动员马术水平高低评判的评分制比赛,比赛分为两大类四个项目:地如何构建京津冀环卫固废处理一体化大格局
推动京津冀协同发展,是意义深远的国家重大战略。生态环境保护与共建共享公共服务体系,是京津冀协同发展的基本前提和重要内容,而构建京津冀环卫与 “固体废弃物处理(以下简称固废处理)&rdquo中国人民大学部分学生信息被非法获取,警方通报
针对“中国人民大学部分学生信息被非法获取”的情况,海淀警方接到报警后,立即开展调查。经查,嫌疑人马某某男,25岁,该校毕业生)涉嫌非法获取该校部分学生个人信息等违法犯罪行为。目前,马某某已被海淀公安分【思考】张益:垃圾面前没有旁观者
前言测试接触器专利侵权案陪审团裁定Johnstech International公司获
Marketwired 2016年11月13日美国明尼苏达州明尼阿波利斯—/明通新闻专线/— Johnstech International Corporation重视知中国贸易报:第27届中国国际渔业博览会在青岛举办
青岛2024年11月5日 /美通社/ -- 10月30日,由农业农村部农业贸易促进中心中国贸促会农业行业分会)主办的第27届中国国际渔业博览会和中国国际水产养殖展览会以下简称"渔博会&quo“空姐和乘客被抛向天花板”!国航最新回应
7月10日,多位网友在社交平台发文称,当天从上海飞往北京的国航CA1524航班在空中经历了2次严重颠簸,有空姐和乘客被抛到了天花板,事件引发关注。今天11日),国航发布情况说明:该航班在飞行过程中突遇垃圾放对路谁都有好处 南京试点垃圾分类市场化运作
核心阅读观点:“垃圾围村”不能成为社会治理的边缘地带
“发展旅游业,对环境的要求自然比较高。”全国政协委员、云南省德宏州监察局副局长梁晓丹曾经担任过乡镇干部,她在工作中发现,许多村寨长期受到生活垃圾的困扰,“有些特色旅奥动新能源参加「第四届电动汽车充换电设施技术创新大会」
北京2024年11月5日 /美通社/ -- 10月31日,由中国电力企业联合会电动交通与储能分会、能源行业电动汽车充电设施标准化技术委员会主办的第四届电动汽车充换电设施技术创新大会在北京举办。奥动新能大火力为爆炒而生,万事兴燃烧系统究竟有多牛?
【建材网】民以食为天!中国人重视爆炒好滋味,火力不够猛,爆炒绝 对不够味;火力不够稳,煲汤绝 对不入味。万事兴历经20多年的技术沉淀,坚持用科技创新和匠心制造说话,在燃烧技术方面专研,一步步突 破,意广东联通:体验经营打开通信产业新空间,随行网络创造智慧生活新体验
伊斯坦布尔2024年11月5日 /美通社/ -- 广东联通分析挖掘细分市场,针对不同细分市场通过静态QoS等方式来提升用户体验,以此寻求新的业务增长点。5G直播套餐和随行网络通过提升用户体验,有效帮助燕龙马业马术课堂丨由野马培育而成——美国阿帕卢萨马
阿帕卢萨马是美国常见而著名的马品种,据说是在北美的内兹佩尔塞人印第安领地由野马培育而成的,这些野马是西班牙探险者带来的西班牙马的后裔。因该马产于爱达荷州及华盛顿州的帕卢斯河(Palouse River