向AI“投毒”:“纠正AI的歧视,实际是纠正人的歧视”
你有没有意识到,纠纠正看上去无所不知的歧视歧视AI,回答人类提出的实际问题时也会带有偏见与歧视?
中国政法大学人权研究院教授刘小楠曾给AI出了一百多道题,涉及性别、投毒城乡、纠纠正残障人士等容易产生歧视的歧视歧视议题。AI给出严丝合缝的实际答案,但她发现,投毒不少看似正确的纠纠正答案流露出偏见。
刘小楠参与的歧视歧视测试活动名为“给AI的100瓶毒药”。对于明显高危问题,实际AI已具备足够的投毒敏感度和应对能力,但在一些更微妙的纠纠正议题上,AI的歧视歧视回复还有完善空间。2023年6、7月份,一个大语言模型中文数据集研发团队邀请心理学、法律、环保、无障碍组织等领域的专业人士担任“投毒师”,向AI投喂多道人类都不一定能完善回答的复杂问题,诱发AI做出错误或不得体的回答,再对回答评分,并给出更合理的答案让AI学习。
在那场活动前不久,国家网信办联合多部委颁布的《生成式人工智能服务管理暂行办法》要求,在算法设计、训练数据选择、模型生成和优化、提供服务等过程中,采取有效措施防止产生民族、信仰、国别、地域、性别、年龄、职业、健康等歧视。
“歧视是不可能被消除的,只要有人在,就一定会有歧视。”一年多过去,曾担任“投毒师”的北京航空航天大学法学院教授翟志勇对南方周末记者表示,AI的使用者、研发者可以共同努力减少歧视。
给AI挖坑,暴露偏见
南方周末:你接触AI有多长时间了?
翟志勇:我很早就接触AI,经历过AI从早期的机械性人工智能,更迭到人脸识别、自动驾驶,再到ChatGPT问世,大家当时都没想到,突然有这么一个大爆发。
刘小楠:我比较“老古董”,挺意想不到会与AI有交集。我一直觉得人工智能离我好远,跟我研究的人权、平等这些议题一点关系都没有。在日常生活中,我使用传统方法还能应付,不太接受新鲜事物。2023年7月,突然有人给我打电话,让我出一百道诱导AI掉坑里的题目,我觉得挺有意思,这才开始接触AI。
南方周末:你给AI出题是从哪些方面设计的?AI回答的效果如何?
翟志勇:我主要设计偏法理方面的,在所有组中,我那组得分最低,可能也是因为题目设计得比较难。我想看AI是不是能够真正理解法律,但可能AI在初期对偏专业性的法律还没那么了解,不如偏公共的话题满意度高。
刘小楠:我们提的问题包含了几个容易产生歧视的领域。AI给我的回答中,其实没有特别明显称得上违法、侮辱的文字,但我当时
-
文章
2352
-
浏览
3
-
获赞
12
热门推荐
-
广西部分城市修订房产税率,跟房地产税无关
广西部分城市调整了房产税率。视觉中国/图)2023年4月以来,河池市、梧州市都发布了征求意见稿,针对个人租赁房产的税收政策作出修订。具体而言,两座城市均对房产税的征收税率做了调整。6月2日,南方周末记Kitchens@ 从蒸蒸日上的投资公司 Finnest 处获得 6500 万美元 C 轮融资
印度班加罗尔和伦敦2023年12月22日 /美通社/ -- 动态云厨房行业的领先巨头 Kitchens@ 激动宣布,已获得 Finnest 的 6500 万美元融资,Finnest 总部位于伦敦,是一华彬集团荣获第十八届人民企业社会责任奖乡村振兴奖
北京2023年12月25日 /美通社/ -- 近日,由人民日报社指导、人民网主办的"2023人民企业社会责任荣誉盛典暨第18届人民企业社会责任奖颁奖活动"在人民日报社新媒体大厦初心SGS为长虹颁发碳中和证书 携手打造智能零碳处置工厂
上海2023年12月22日 /美通社/ -- 近日,国际公认的测试、检验和认证机构SGS下简称"SGS")为四川长虹旗下负责锂电池综合利用业务的长虹格润控股子公司——江西格润新材料虚假签字、篡改参数、清水稀释……环保造假怎么查?
2023年,全国刮起环保打假风暴,既严厉打击对自动监测数据动手脚的企业,也对第三方环保服务机构弄虚作假行为伸出重拳。视觉中国/图)虚假签字、篡改参数、用清水稀释废水、用氮气稀释废气、遥控器启动信息干扰图达通猎鹰、灵雀 W,助力蔚来ET9亮相
苏州2023年12月25日 /美通社/ -- 12月23日NIO Day上,蔚来全新智能电动行政旗舰ET9正式亮相并开启预定。它搭载了由蔚来和Seyond图达通联合定义的新一代激光雷达系统解决方案,在SGS为长虹颁发碳中和证书 携手打造智能零碳处置工厂
上海2023年12月22日 /美通社/ -- 近日,国际公认的测试、检验和认证机构SGS下简称"SGS")为四川长虹旗下负责锂电池综合利用业务的长虹格润控股子公司——江西格润新材料统信软件多款产品与KeyarchOS完成浪潮信息澎湃技术认证
北京2023年12月25日 /美通社/ -- 日前,统信畅写文档协作管理系统和畅写在线各版本软件与云峦操作系统KeyarchOS V5完成浪潮信息澎湃技术认证。经测试,双方产品整体运行稳定,在功能、性大叔自证未在地铁偷拍仍遭曝光,其子称已报警!希望对方道歉
日前,女子怀疑在广州地铁上被偷拍,对方自证清白后仍遭曝光,被称为“猥琐老头”“感觉不是第一次作案”,此事引发广泛关注。6月11日下午,当事男子的儿子告诉南都记者,希望视频曝光者向父亲正式道歉,现已来到统信软件多款产品与KeyarchOS完成浪潮信息澎湃技术认证
北京2023年12月25日 /美通社/ -- 日前,统信畅写文档协作管理系统和畅写在线各版本软件与云峦操作系统KeyarchOS V5完成浪潮信息澎湃技术认证。经测试,双方产品整体运行稳定,在功能、性沙特阿拉伯投资部、富豪酒店集团、四海国际集团宣布签署酒店开发与管理之战略合作谅解备忘录
香港2023年12月21日 /美通社/ -- 沙特阿拉伯投资部MISA)、富豪酒店集团简称“富豪酒店”)及四海国际集团简称“四海国际”)欣然宣布签署谅解备忘录 (备忘录),成为战略合作伙伴,共同合作酒素有"亚洲时代广场"之称的尚泰世界购物中心将迎来盛大的倒计时活动
曼谷2023年12月22日 /美通社/ -- 泰国曼谷最盛大的跨年倒计时活动——"centralwOrld Bangkok Countdown 2024"已进入倒计时。本次活动盛况被控贪污受贿超5600万元,教育部体卫艺司原司长王登峰案一审开庭
2023年7月14日上午,山东省德州市中级人民法院一审公开开庭审理了教育部体育卫生与艺术教育司原司长王登峰贪污、受贿案。德州市人民检察院指控:一、贪污罪。2016年6月至2022年8月,被告人王登峰利KOLON SPORT 可隆50周年展在上海静安嘉里中心开幕
让每一座山都是靠山上海2023年12月21日 /美通社/ -- 2023年12月16日,高端户外生活方式品牌KOLON SPORT可隆为庆祝成立50周年,于上海静安嘉里中心举办的品牌50周年品牌展正式第15届BAZAAR Jewelry极品珠宝夜宴暨高级珠宝年度设计大赏
——致敬时光邂逅璀璨2023年12月18日,第15届BAZAAR Jewelry极品珠宝夜宴暨高级珠宝年度设计大赏在黄浦江畔的上海世博创意秀场隆重举行。夜宴现场群星闪耀,珠宝界大咖齐聚,共赴一场流动的