孙茂松:要对生成式人工智能的数据集进行安全评测
孙茂松:要对生成式人工智能的数据集进行安全评测
4 月 26 日,2024 中关村论坛——数据安全治理与发展论坛在北京举办。清华大学人工智能研究院常务副院长孙茂松围绕人工智能大模型安全治理发表演讲。他深入剖析了当前人工智能,特别是生成式人工智能在发展过程中所面临的机遇与挑战,并建议要对生成式人工智能的数据集进行安全评测。

孙茂松表示,生成式人工智能是发展新质生产力的重要引擎,但同时也存在一些不安全的因素,比如幻觉现象,在使用过程中会发生这样或那样的问题。因此,需要对生成式人工智能进行治理。
" 对生成式人工智能进行治理在全球已经形成了共识,总的原则我觉得是差不多的,但存在技术挑战。" 孙茂松举例说," 我以前有个研究是做机器翻译,机器翻译一个很重要的依据就是从互联网上抓取大量的人工翻译的双语段。后来我们发现机器翻译产生了大量的双语段,其实那个质量是不行的,拿它来训练机器翻译系统反而搞坏了,这个时候必须靠技术去甄别。"
孙茂松指出,生成式人工智能的生成能力非常强,一旦可以批量生产,如果不进行治理,很快会超越人类写的内容。" 但是它写的内容有很多与事实不符的现象。我们的大模型如果用它再来训练,这就麻烦了。所以,这块确实提出很多深层次的挑战,需要全世界各国政府和学者,方方面面共同努力,才能从技术上把这个事做好。"
孙茂松认为,要对生成式人工智能的数据集进行安全评测,将来所有要上线的大模型,首先要对它的数据集进行把关,不权威不行,要能反映正能量。同时,要明确数据集的 " 负面清单 "。" 构造这个数据集还是非常有挑战性的,因为它涉及到方方面面。但这一块可能是我们应该即时就要做的,马上就要做的。" 孙茂松说。
与此同时,他也提到,生成式人工智能其实也能为数据安全治理提供新的更有效的手段。他表示,生成式人工智能能够生成符合真实情况的数据,但同时规避隐私问题。同时,通过给大模型增加某些特定条件,它可以生成尚未出现过的一些情景的数据,以便可以预先做出研判。
文 | 记者 王莉
图 | 2024 中关村论坛新闻中心
-
- 巴厘岛在哪个国家(巴厘岛其实是隶属于印度尼西亚)
-
2025-10-07 19:07:03
-
- 十五运广东赛区已明确办赛场馆78个,推动重点场馆绿色低碳改造
-
2025-10-07 19:04:47
-
- 通辽市境内正在建设(或规划)中的铁路项目有6个
-
2025-10-07 19:01:42
-
- 陶方启在宁国市督导疫情防控工作时强调毫不松懈抓好疫情防控 统筹做好改革发展
-
2025-10-07 18:59:27
-
- 日本女星入江纱绫成长经历
-
2025-10-07 18:57:11
-
- 日本的概述
-
2025-10-07 18:54:55
-
- 曲沃代翼:公元前678年的权力游戏
-
2025-10-07 18:52:40
-
- 平潭跨海大桥:海上的“巨龙”
-
2025-10-07 18:50:24
-
- 目前在拍的4部唐朝背景古装剧,你们看好哪对?
-
2025-10-07 18:48:08
-
- 栾树,经常看到但是叫不出名的树
-
2025-10-07 18:45:53
-
- 金融巨震!重庆农商行前高管舒静挪用公款案曝光,贪婪终酿苦果
-
2025-10-07 03:44:20
-
- 老人临终前,为何会突然说一些胡话?来看看科学的解释
-
2025-10-07 03:42:05
-
- 少有!产量翻番、价跌谷底,最便宜32元一斤!鲜掉眉毛的便宜籽虾还不赶紧尝尝
-
2025-10-07 03:39:49
-
- 尸兄:最搞笑的三处剧情,奥特曼尸兄上榜,取虫子那一幕笑出腹肌
-
2025-10-07 03:37:33
-
- 世界最强十大拳王排名出炉,美国邹市明登顶中量级泰森第三
-
2025-10-07 03:35:17
-
- 限时领取——儿童益智游戏【数独】高清图片可打印
-
2025-10-07 03:33:02
-
- 智慧树上智慧果~下一句是什么?独属于90后孩子的记忆,你知道吗
-
2025-10-07 03:30:46
-
- 「发明创造的故事」(90)——法拉第发现电磁感应定律
-
2025-10-07 03:28:30
-
- 4本超好看高质量古言,你最爱哪本?
-
2025-10-07 03:26:15
-
- 艾哈迈多夫在泰达队是干脏活力气活的领袖,第六外援来自波尔图?
-
2025-10-07 03:23:59



芬兰人为什么是黄种人,为什么地处北欧的芬兰人长得像中国人
南宁铁路局集团领导班子成员