AI가 그리는 직업적 고정관념, '타겟 기반 프롬프팅'으로 해결한다
한 줄 요약: 텍스트-이미지(T2I) 생성 모델에서 발생하는 직업별 인구통계학적 편향을 해결하기 위해, 모델 재학습 없이도 공정한 표현을 가능하게 하는 가벼운 '타겟 기반 프롬프팅' 기법을 제안합니다.
연구 배경
Stable Diffusion 및 DALL-E와 같은 텍스트-이미지 생성 모델은 AI의 대중화를 이끌었으나, 사회적 편향을 그대로 복제한다는 문제점이 있습니다. 특히 '의사'나 'CEO'와 같은 전문직/고지위 역할은 밝은 피부색 위주로 묘사되는 반면, '청소부'와 같은 저지위 역할은 상대적으로 더 다양하게 묘사되는 등 기존의 사회적 고정관념을 강화하는 경향이 발견되었습니다.
주요 내용
기존의 편향 완화 방법들은 모델을 재학습시키거나 엄격하게 큐레이션된 데이터셋을 필요로 했기 때문에 일반 사용자가 적용하기에는 진입 장벽이 높았습니다. 본 연구는 이러한 한계를 극복하기 위해 가벼운 방식의 '타겟 기반 프롬프팅(Target-Based Prompting)'을 제안하여, 모델 수정 없이도 인구통계학적 표현의 다양성을 확보하고 편향성을 줄이는 접근법을 제시합니다.
시사점 및 기대 효과
모델 전체를 다시 학습시키지 않고 프롬프트 수준에서 제어할 수 있는 경량화된 방법론을 제시함으로써, 일반 사용자와 개발자가 보다 쉽고 빠르게 공정한 생성 AI 결과물을 얻을 수 있는 환경을 조성할 수 있을 것으로 기대됩니다.
주의 사항
본 연구는 프롬프팅을 통한 경량화된 해결책을 제안하고 있으나, 제공된 요약문 상으로는 해당 기법이 모든 형태의 편향을 완전히 제거하는지 혹은 생성 이미지의 품질에 어떤 영향을 미치는지에 대한 상세한 결과는 포함되어 있지 않습니다.
논문 정보
- Original Title: Who Defines Fairness? Target-Based Prompting for Demographic Representation in Generative Models
- URL: https://arxiv.org/abs/2604.21036