Trustworthy
Artificial Intelligence
Lab
중앙대학교 산업보안학과
신뢰할 수 있는 인공지능 연구실
중앙대학교 산업보안학과
신뢰할 수 있는 인공지능 연구실
신뢰할 수 있는 인공지능(Trustworthy AI)이란 인공지능 기술이 인간의 가치와 사회·윤리적 원칙을 존중하여 사회 전반에 긍정적인 영향을 제공하기 위한 개념입니다.
인공지능 기술은 현재 전분야에 빠르게 도입・활용되고있으나, 이와 관련된 우려 역시 확대되고 있습니다. EU, 미국, 일본 등 선진국은 인공지능 신뢰성을 핵심요소로서 강조하고 있으며 GDPR(’18), AI Act(’21) 등 다양한 법률 및 가이드라인을 제정하고 있습니다.
본 연구실은 신뢰할 수 있는 인공지능을 통해 인류와 사회의 지속 가능한 발전을 핵심 가치로 삼아, 궁극적으로는 누구나 인공지능을 '믿을 수 있는 동료'로서 함께할 수 있는 사회를 추구합니다.
본 연구실은 신뢰할 수 있는 인공지능(Trustworthy AI)을 위해 아래의 핵심 개념⁺들을 연구 및 개발하고 있습니다.
⁺"Trustworthy AI: From Principles to Practices," Bo Li et al.(’23); "인공지능 신뢰성을 높이는 Trustworthy AI," Deloitte(’22); "Strategy to realize trustworthy artificial intelligence," MSIT(’21);
강건성은 인공지능 기술이 악의적으로 조작된 입력이나 개인정보 탈취 공격에도 안전하게 작동할 수 있는 능력입니다. 강건한 인공지능 기술은 시스템의 안정성을 보장합니다.
일반화는 인공지능 기술이 훈련 시 본 적 없는 새로운 데이터에 대해서도 정확하게 예측할 수 있는 능력입니다. 실제 환경의 다양한 시나리오에서 사용되기 위한 필수 요소입니다.
설명성은 인공지능 기술의 과정이 및 결과를 인간이 이해할 수 있는 형태로 제공하는 것입니다. 설명성은 인간 중심의 사회에서 법적 및 윤리적 책임을 이행하기 위한 토대입니다.
본 연구실은 다양한 연구·교육·협업을 통해 강건성, 일반화, 설명성을 증진시켜 신뢰할 수 있는 인공지능(Trustworthy AI)을 추구합니다.
본 연구실은 NeurIPS, ICML, AAAI, IEEE TPAMI 등 인공지능 학회 및 SCI(E) 저널에 다수의 논문을 게재하고 있습니다.
총 논문 중 78.5%의 논문이 세계 최고 권위의 인공지능 학회(BK21, IF=4) 및 Impact Factor 상위 10% SCI(E)에 게재되었습니다.
Fantastic Robustness Measures: The Secrets of Robust Generalization [NeurIPS ’23]
GradDiv: Randomized Neural Networks via Gradient Diversity Regularization [TPAMI ’23]
Understanding Catastrophic Overfitting in Single-step Adversarial Training [AAAI ’21]
본 연구실은 신뢰할 수 있는 인공지능 관련 다수의 소프트웨어(SW) 및 특허를 보유하고 있습니다.
소프트웨어 최대 소셜 커뮤니티인 Github에서 2700개 이상의 Star를 보유하고 있습니다.
본 연구실은 다양한 기관과의 공동 연구 및 교육을 통해 융합 분야의 연구와 인재 육성에 참여하고 있습니다.
서울대, UNIST, 한양대, 동국대, 세종대 및 중국 雲南大, 호주 Macquarie Univ. 등 국내외 10개 이상의 기관과 함께하고 있습니다.