导语:亚(yà)马逊(xùn)与国家科学基金会合作,投资(zī)千万美金开发(fā)AI公平性系统(tǒng),实现人(rén)工智(zhì)能系统更广泛的接(jiē)受度(dù)。
智东西3月26日(rì)消(xiāo)息,亚马逊昨日宣布将与美国(guó)国家科学基金会(NSF)合作,在未来三年内(nèi)投(tóu)入1000万美元的研(yán)究经费,开(kāi)发专注于人工智能和机器学习公平性的(de)系统(tǒng)。
亚马逊Alexa AI 团队的自然理解副总裁 Prem Natarajan 表示,人工智能的普及使(shǐ)其公(gōng)平性(xìng)问题在学术(shù)界、政(zhèng)府部门(mén)和企业界都(dōu)变得(dé)越来越重要,公平性(xìng)问题对于建立和维(wéi)护客户的信任(rèn)也是至关重要的。
为实现(xiàn)人工智能系(xì)统更广泛的接(jiē)受度,亚(yà)马逊与(yǔ)NSF的合作将针对人工(gōng)智能(néng)的可解释性、潜在的不利偏见和影响、缓解策略、公(gōng)平性验证(zhèng)以及包容性考虑(lǜ)。美(měi)国将继续发挥(huī)人工(gōng)智(zhì)能技术的潜力,希望(wàng)到5月10日他们接受的(de)人(rén)工智能公平(píng)性验证提案能够带来新的开放源码(mǎ)工具(jù)、公开可用(yòng)的数据集和出版物(wù)。
亚马逊将为该计划提供部(bù)分资金,NSF根据(jù)其绩效评估流程独立地做出奖(jiǎng)励(lì)决定。 该计划预计将在2020年和2021年继(jì)续进行(háng),并附加征集意向书(shū)。
美国国家(jiā)科学基金会计算机和信息科学与工(gōng)程负责人Jim Kurose表示(shì),与亚马逊合作进行人工(gōng)智能公(gōng)平性(xìng)研(yán)究将(jiāng)支持有(yǒu)关开发和实施可(kě)靠的人工智能系统的研究,这些系统从一(yī)开始(shǐ)就(jiù)将透明度、公平性和问责制融入设计中。
亚马逊与国家科学(xué)基金会(huì)合作的消息发布后,越(yuè)来越多的企业、学(xué)术(shù)机构和(hé)行业协会(huì)开始加入(rù),进行人工智能道德(dé)研究(jiū)。他们的共(gòng)同工作已经产生了算(suàn)法偏差缓解工具,这些工具有(yǒu)望加速向更公正的模(mó)型(xíng)迈进。
亚马逊(xùn)与科学基金会合作,专注于开(kāi)发AI和(hé)机器学习公平性的(de)系统
去年5月,Facebook 发(fā)布了公平流(liú)程,如果算(suàn)法(fǎ)根据种族、性别或(huò)年龄对(duì)某人做出不公(gōng)平的判(pàn)断,它会自动发(fā)出警告。埃森哲咨询(xún)公司发布了可以(yǐ)自(zì)动检测AI算法偏差的工具包(bāo),为数据科学家减轻算法偏差提供帮助。微(wēi)软也在去年5月推(tuī)出了自己的解决方案(àn),同(tóng)年9月谷歌推出了 What-If 工具(jù),这是 TensorBoard 网络仪表板上的一个偏见检测功能,用于(yú) TensorFlow 机器学习(xí)框架的网络(luò)仪表板的偏置检(jiǎn)测功能。
IBM也在去年秋(qiū)天发(fā)布(bù)了AI Fairness ,这是一款基于云计算的全产品,可(kě)以帮(bāng)助了解AI系统(tǒng)如何做出决策并给出调整建(jiàn)议——例如算法调整(zhěng)或平衡数据。最近IBM的Watson和(hé)Cloud Platforms小(xiǎo)组(zǔ)的研(yán)究重(chóng)点是减轻AI模型(xíng)中的偏差,特别(bié)是在(zài)面部识别方面。
麻省理工(gōng)学院的研究(jiū)人(rén)员发现 Rekognition ——亚马逊网络服务(wù)(AWS)的目标检(jiǎn)测 API——无法可靠地确定特定情况下女性和深肤色面孔的性别。在2018年进行(háng)的实验中,RekogniTIon 的面部分析功能(néng)错误地将女(nǚ)性(xìng)的(de)照片识别(bié)为男性,将(jiāng)深(shēn)色皮肤的女性的照(zhào)片识(shí)别为男性的比例分别为19% 和31% 。
亚马逊对(duì)研究(jiū)结果提出异议,对于(yú)实(shí)验(yàn)结果(guǒ)是(shì)否准确仍存在(zài)争议。亚(yà)马逊表示(shì)在RekogniTIon更(gèng)新版本的测试中,所有种族的性别分(fèn)类准确(què)性“无(wú)差异”,并提出研究结果的论文没有清楚地说明(míng)实(shí)验中使用的置信阈值。