策无遗算网

策无遗算网

全部分类娱乐

向AI“投毒”:“纠正AI的歧视,实际是纠正人的歧视”

向AI“投毒”:“纠正AI的歧视,实际是纠正人的歧视”

改绘自美国画家诺曼·洛克威尔揭露种族歧视的投毒作品《我们共视的难题》。 (谭畅使用AI工具生成/图)

你有没有意识到,纠纠正看上去无所不知的歧视歧视AI,回答人类提出的实际问题时也会带有偏见与歧视?

中国政法大学人权研究院教授刘小楠曾给AI出了一百多道题,涉及性别、投毒城乡、纠纠正残障人士等容易产生歧视的歧视歧视议题。AI给出严丝合缝的实际答案,但她发现,投毒不少看似正确的纠纠正答案流露出偏见。

刘小楠参与的歧视歧视测试活动名为“给AI的100瓶毒药”。对于明显高危问题,实际AI已具备足够的投毒敏感度和应对能力,但在一些更微妙的纠纠正议题上,AI的歧视歧视回复还有完善空间。2023年6、7月份,一个大语言模型中文数据集研发团队邀请心理学、法律、环保、无障碍组织等领域的专业人士担任“投毒师”,向AI投喂多道人类都不一定能完善回答的复杂问题,诱发AI做出错误或不得体的回答,再对回答评分,并给出更合理的答案让AI学习。

在那场活动前不久,国家网信办联合多部委颁布的《生成式人工智能服务管理暂行办法》要求,在算法设计、训练数据选择、模型生成和优化、提供服务等过程中,采取有效措施防止产生民族、信仰、国别、地域、性别、年龄、职业、健康等歧视。

“歧视是不可能被消除的,只要有人在,就一定会有歧视。”一年多过去,曾担任“投毒师”的北京航空航天大学法学院教授翟志勇对南方周末记者表示,AI的使用者、研发者可以共同努力减少歧视。

翟志勇。(受访者供图/图)

给AI挖坑,暴露偏见

南方周末:你接触AI有多长时间了?

翟志勇:我很早就接触AI,经历过AI从早期的机械性人工智能,更迭到人脸识别、自动驾驶,再到ChatGPT问世,大家当时都没想到,突然有这么一个大爆发。

刘小楠:我比较“老古董”,挺意想不到会与AI有交集。我一直觉得人工智能离我好远,跟我研究的人权、平等这些议题一点关系都没有。在日常生活中,我使用传统方法还能应付,不太接受新鲜事物。2023年7月,突然有人给我打电话,让我出一百道诱导AI掉坑里的题目,我觉得挺有意思,这才开始接触AI。

南方周末:你给AI出题是从哪些方面设计的?AI回答的效果如何?

翟志勇:我主要设计偏法理方面的,在所有组中,我那组得分最低,可能也是因为题目设计得比较难。我想看AI是不是能够真正理解法律,但可能AI在初期对偏专业性的法律还没那么了解,不如偏公共的话题满意度高。

刘小楠:我们提的问题包含了几个容易产生歧视的领域。AI给我的回答中,其实没有特别明显称得上违法、侮辱的文字,但我当时

友情链接: 广州市质监局抽查给水用塑料管材管件 未发现不合格产品华北陶瓷市场六大品类盛装起航建筑五金型材产品竞争力的提高全球聚丙烯产能将持续提升回归消费者价值是涂料企业竞争的王道广东省住房城乡建设厅召开全省散装水泥工作会议中国地板控股全球品牌加盟商签约仪式在沪举行实力与社会责任是新神洲逆势降价的依托水泥价格涨跌互现 天气成主导因素地板瓷砖和涂料 三大类主材成本大探底国内乙二醇市场走势小幅上涨建筑五金型材产品竞争力的提高中国门窗幕墙产品在国际市场上具明显竞争力地板瓷砖和涂料 三大类主材成本大探底佛山陶瓷卫浴博览交易会展位预订接近尾声涂料依照一定的配套原则才能提升性能华北陶瓷市场六大品类盛装起航波士胶聚氨酯木地板胶黏剂检测不到MDI涂料企业逆势“超车”须规避风险焦点:涂料业现唯美情感主题品牌故事泉州日用陶瓷出口逆市增长中国酚醛树脂行业市场需求分析闽奇石材园31家企业同时开工奠基富佰得集成吊顶昆山站大型专场团购会2012国际钛白粉持续上涨 生产商开足马力华北陶瓷市场六大品类盛装起航2012中国国际混凝土周在北京隆重开幕欧洲乙二醇市场价格下滑买方呈观望态势短期内纯苯市场有望维持僵持盘整房企频陷“质量门”源起成本压缩房企频陷“质量门”源起成本压缩国内乙二醇市场走势小幅上涨灯具市场异常的火爆 潜在危机不可忽视2012年家居市场平淡开局恐难有突破国产进口家具价格虚高 消费者需选择理性消费水泥价格涨跌互现 天气成主导因素建筑五金型材产品竞争力的提高北京:绿色旅游饭店废旧电器循环利用启动2012年家居市场平淡开局恐难有突破焦点:涂料业现唯美情感主题品牌故事

外链: