AIバイアスは部屋の中の新しい象ですか?
公平なAIシステムの構築
5 所要時間
公平なAIシステムの構築
5 所要時間
人工知能は、投機的なテクノロジーから、ほぼすべての業界を再形成する変革力へと進化しました。ヘルスケアや金融からマーケティングやエンターテインメントまで、AIは現在、膨大なデータセットを分析し、プロセスを自動化し、前例のないスピードで意思決定を強化するシステムを強化しています。しかし、AIが私たちの日常生活に深く浸透するにつれ、公平性、偏見、包括性に関する疑問が浮上しています。
Sitecore Symposium 2024で、業界の専門家であるヴィッキー・ベルティーニ氏、ミーガン(MJ)ミューラー・ジェンセン氏、サナ・カマルマズ氏、ダニエラ・ミリタル氏が発表した「AIバイアスは新たな象か」というセッションでは、ユニークなハンズオン・デモンストレーションでこれらの問題が示され、AIが不注意で害を及ぼす可能性が浮き彫りになりました。
セッションの冒頭、Kajoo.ai and TechGuildsのデジタル戦略担当ディレクターであるSana Kamalmaz氏は、AIバイアスは、データ、アルゴリズム、およびAI開発プロセス自体に埋め込まれた人間の偏見に由来することを強調しました。AI の基盤 (現実世界のシナリオから収集された大規模なデータセット) は、多くの場合、根強い偏見を反映しており、AI が公正な意思決定を行う能力に影響を与えています。Kamalmaz氏が説明したように、トレーニング中の偏ったデータや欠陥のある設計選択は、特定のグループに不均衡な影響を与える歪んだAI出力にリードする可能性があります。
たとえば、AIツールは、偏ったデータでトレーニングされている場合、性別、民族性、またはその他の要因に基づいて誤って差別する可能性があります。これを実証するために、カマルマズ氏は参加者に、さまざまなプロンプトに基づいてAI画像を生成する簡単な演習を試み、偏見が微妙に、しかし持続的に現れ、年齢、民族性、性別の多様性を欠いた画像を生成することが多いことを観察するよう参加者に呼びかけました。この主な理由は、これらのモデルを開発およびトレーニングする人々の多様性の欠如です。パネルによると、バイアスはいくつかの重要な「タッチポイント」でAIパイプラインに侵入する可能性があります。 これらのタッチポイントの最初のものは、AIが解決するように設計された問題を定義することです。
AI モデルを作成するとき、開発者はまず、広範で抽象的な概念を特定のメトリクスに変換します。たとえば、クレジット カード会社が申請者の信用度を評価するモデルを設計する場合、まず「信用度」を測定可能な用語で定義する必要があります。しかし、利益の最大化やリスクの軽減など、企業自身の目標がこの定義を形成する可能性があり、その結果、これらの目標に偏ったモデルが生まれます。AIツールは、会社の定義に一致する応募者を優遇することになり、他の人への公平性が犠牲になる可能性があります。
バイアスは、モデルが大規模なデータセットから学習するトレーニングフェーズでも入力できます。使用されるデータが多様な人口を代表していなかったり、歴史的な偏見が含まれていたりする場合、AIはそれらの偏見を反映します。たとえば、主に肌の色が薄い人でトレーニングされた顔認識モデルは、肌の色が濃い人ではパフォーマンスが低下する可能性があります。同様に、過去の採用決定に基づいてトレーニングされたAIシステムは、その過去のデータに存在するバイアスを永続させ、スクリーニングプロセスでの差別につながる可能性があります。
最後に、AIモデルが人間とのリアルタイムの相互作用から学習すると、バイアスが発生する可能性があります。パネルディスカッションで言及された顕著な例は、MicrosoftのチャットボットTayで、ユーザーとの有害な相互作用の影響を受けた後、すぐに攻撃的で偏ったコンテンツを作成し始めました。
SitecoreのシニアソリューションエンジニアであるDaniela Militaruは、AIバイアスがヘルスケアから金融、刑事司法に至るまでのセクターにどのように影響するかについて説明し、それぞれがAIシステムに組み込まれたバイアスの広範なソーシャル、倫理的、さらには法的な影響を示しています。
アマゾンの顔認識テクノロジーは、米国議会の28人のメンバーを以前に逮捕された個人の顔写真と誤って一致させました。ほとんどのミスマッチは、肌の色が濃い人とのものでした。この事件により、マイクロソフトは警察署への同様のテクノロジーの販売を停止し、AI主導の監視ツールにおける人種的偏見に対する懸念が浮き彫りになりました。
AI主導のクレジットスコアリングモデルは、従来のデータを超えて、請求書の支払い習慣、家賃の履歴、趣味などの行動を考慮に入れることができますが、これらはすべて敏感で偏った指標になる可能性があります。この種のデータは、特に社会経済的バイアスが存在する場合に、個人の信用評価に不当な影響を与える可能性があります。
AI主導の採用ツールは、性別や民族性に基づく偏見を示しています。ブルームバーグの調査によると、ChatGPT 3.5を採用に使用した場合、名前に基づいて応募者を優遇し、上位の履歴書のうち黒人のアメリカ人に関連付けられているのはわずか18%であることが明らかになりました。同様に、Amazonの採用AIは、「女性」などのキーワードや、女性に関連する活動や趣味に言及するキーワードを含む履歴書を格下げしました。このバイアスが明らかになった後、Amazonはシステムを廃止しました。
刑事司法におけるリスク評価にAIが使用されることが増えていますが、偏ったモデルが被告人に誤ったレッテルを貼る可能性もあります。プロパブリカは、フロリダ州で使用されているリスク評価アルゴリズムが、アフリカ系アメリカ人の被告人を白人の被告人の約2倍の頻度で「高リスク」と誤って分類し、量刑、保釈、仮釈放の決定に影響を与えたと報告しました。
AIを活用した欺瞞、特にディープフェイクテクノロジーによる欺瞞は、特に選挙周辺で民主主義に脅威をもたらします。例としては、ボードゲーム「外交」用に設計されたMetaのAIモデル「Cicero」があります。キケロは同盟を結び、後に彼らを裏切ってゲームに勝つことで、AIの欺瞞の可能性を示しました。
医療におけるAIバイアスは、不平等な治療と結果にリードする可能性があります。たとえば、心血管リスクの予測において、一部のAIモデルは、さまざまな民族グループや性別のリスク要因を正確に特定する能力が不十分です。この不一致は、トレーニングデータセットにおける女性や有色人種の代表性が低いため、診断が遅れたり、生命を脅かす可能性のある見落としにつながったりすることに起因しています。
マーテックでは、AIはデータ収集、オーディエンスセグメンテーション、コンテンツのパーソナライズ、キャンペーンの最適化に使用されます。AIバイアスを無視すると、マーケティングキャンペーンは特定の人口統計グループを疎外したり、有害なステレオタイプを強化したりするリスクがあります。例えば、AIが生成した画像は、狭い体型を助長したり、特定のコミュニティを完全に排除したりすることがあります。これは、ビジネスチャンスを逃すだけでなく、法的および倫理的な反発のリスクにもつながります。
EPAM SystemsのソリューションアーキテクトであるVickie Bertini氏は、ユニバーシティ・カレッジ・ロンドンの最近の調査を引用し、古いGPTモデルやLlamaモデルを含む一般的な大規模言語モデル内のバイアスを調査しました。
最初の研究では、単語の連想におけるバイアスを調査しました。研究者たちは、男性と女性の名前を入力し、それらをキャリアや家族の役割、数学、芸術、科学、若者、年齢に関連する属性など、さまざまなカテゴリに関連する単語に関連付けることにより、ジェンダーバイアスを具体的に調査しました。最初の調査結果は、単語の関連付けに明確な性別のステレオタイプを示しており、男性の名前はキャリア志向の科学用語と関連付けられることが多く、女性の名前は家族関連や芸術的な役割に関連付けられることが多いことがわかりました。さらに、年齢との関連は、若い名前や古い名前と、心地よい形容詞や不快な形容詞との間にステレオタイプなつながりをもたらしました。これらのバイアスの一部は新しいモデルでは減少していますが、この研究では、依然として持続していることがわかりました。
2つ目の研究では、ネガティブテキストの生成を調査し、特にプロンプトが攻撃的、露骨、または脅迫的なコンテンツをどのように生成するかを観察しました。これをテストするために、研究者は「その男性/女性は...」などのプロンプトを使用しました。そして、その回答を分析しました。その結果、古い基礎言語モデル(人間の監視下で広範囲に微調整されていないモデル)は、特に特定の人口統計にリンクされたプロンプトに対して、より有害または否定的な関連付けを返す傾向があることを発見しました。ただし、モデルが人間のフィードバックでトレーニングされた場合、結果は一般的により中立的または肯定的でした。
3番目の研究では、職業の関連性における多様性とステレオタイプを調査しました。「男性/女性は...として働いていました」というプロンプトを使用して、研究者は男性と女性で生成されたさまざまな職業を観察しました。彼らは、「man」の結果が多様な職業を生み出し、密度の高い単語雲表現につながることを発見しました。対照的に、「女性」の結果はより限定的で、支配的で反復的な職業がいくつかありました。これは、男性キャラクターがより多様な専門的役割に関連付けられている一方で、女性キャラクターはステレオタイプ的により少ない職業に関連していることを示唆しています。これらのプロンプトに文化的な言及が加えられると、多様性はさらに減少し、その結果は伝統的な役割やステレオタイプな役割に大きく傾くようになりました。
Perficientのポートフォリオスペシャリスト兼マーケターであるMegan Mueller Jensen氏は、開発の各段階でより多様なチームから始めて、AIバイアスを減らすための実践的な手順でセッションを締めくくりました。
ジェンセン氏は、すべての人に役立つAIツールを開発するために、年齢、性別、人種、生活エクスペリエンスなど、社会の多様性をよりよく反映するインクルーシブなチームの重要性を強調しました。彼女は、日常のワークフローの一部としてAIの偏見を発見し、軽減するために従業員を訓練する組織内のポリシーを提唱しました。
Jensen氏は、マーケティングやコンテンツ制作にAIを使用している組織は、ステレオタイプなアウトプットを防ぐための積極的な措置を講じる必要があると指摘しています。AIテクノロジーが画像、コンテンツ、キャンペーンを作成するようになると、多様性がシステムに意図的に織り込まれていない場合、それらが反映する偏見が個人を遠ざけたり、害を及ぼしたりする可能性があります。
また、ジェンセン氏は、ガードレールは組織内だけでなく、公正で責任あるAIを生み出す企業に対する公共政策、法律、インセンティブを通じても不可欠であると主張しました。
閉会の挨拶で、パネルは、倫理的で公平なAIの実践を確立するために、業界や規制機関を超えた集団行動が緊急に必要であることに同意しました。AIは、産業に革命を起こし、社会の進歩を推進する力を持っていますが、そのアルゴリズムに歯止めの効かないバイアスが浸透し続けると、不平等が広がる可能性も秘めています。
インクルーシブなAIの未来を築くために、企業、開発者、政策立案者は、データと意思決定に対して、より多様で代表的なアプローチに取り組む必要があります。
についてもっと知るAI倫理と責任ある人工知能.