[데일리한국 장정우 기자] 크래프톤이 지난 10일 미국에서 개최된 인공지능(AI) 학술대회 ‘NeurIPS 2023’(신경정보처리시스템학회, 뉴립스)에 참가, 5편의 논문을 발표해 게임업계의 관심을 모으고 있다. 특히 뉴립스는 논문 채택률이 26%로 까다로운 심사가 이뤄지는 곳으로 알려져 있다.
13일 크래프톤은 자사 블로그를 통해 뉴립스 컨퍼런스서 발표되는 논문 2종과 관련된 인터뷰를 공개했다.
이번에 소개된 논문의 주제는 ‘이미지 생성 AI 모델 사용시 부적절한 이미지 생성 방지’ (Censored Sampling of Diffusion Models Using 3 Minutes of Human Feedback)와 ‘절차적 생성 환경에서 안정적으로 작동하며 계층적 작업구조를 효율적으로 학습하는 강화학습 기법 개발’(Discovering Hierarchical Achievements in Reinforcement Learning via Contrastive Learning)이다.
이 건 AI 리서치 센터 연구원은 “디퓨전 모델 학습에 사용한 데이터와 학습방법에 따라 모델에서 입력하는 텍스트가 전혀 상관없는 부적절한 이미지가 생성되는 경우들이 빈번했다”고 설명했다.
그는 이어 “이를 해결하기 위해 본 논문에서는 디퓨전 모델을 재학습하는 큰 비용을 발생시키지 않고 모델에서 생성된 이미지에 대한 소량의 휴먼 피드백(human feedback) 활용만으로도 부적절 이미지 생성을 방지하는 이미지 센서링 기법을 개발했다”고 덧붙였다.
이 건 연구원은 관련 이미지 센서링 기법을 통해 생성형 AI를 활용하는 게임 개발자들의 모델 활용도가 올라갈 것으로 기대하고 있다.
'절차적 생성 환경에서 안정적으로 작동하며 계층적 작업구조를 효율적으로 학습하는 강화학습 기법 개발' 논문에서는 AI 학습 방법 중 하나인 ‘강화학습’을 다루고 있다. 게임 에이전트가 복잡한 여러 단계를 스스로 이해하고 학습, 게임의 시각적 변화에도 안정적으로 작동하는 알고리즘을 소개하고 있다.
박범수 AI 리서치 센터 연구원은 “게임 에이전트 강화학습은 게임 내 이용자 역할을 하는 시스템인 에이전트가 스스로 게임 환경을 탐색하며 게임을 어떻게 플레이하는지 배우는 방법론”이라며 “게임이 시각적으로 계속 변하거나 여러 단계의 복잡한 과제를 해결해야 하는 경우 에이전트 학습은 여전히 어려운 문제”라고설명했다.
그는 이어 “우리 연구에서는 대조학습(Contrastive learning) 기법을 강화학습에 통합해 이를 해결하고자 했다”며 “이번 연구 결과가 대규모 오픈 월드 게임에서도 잘 동작하는 강화학습 에이전트 개발에 도움이 될 것으로 기대하고 있다”고 강조했다.
이번 인터뷰에선 논문을 작성하면서 어려웠던 점이나 연구과정을 소개했고, 크래프톤이 딥러닝(Deep Learning) 분야의 연구 결과를 학회에 발표하는 이유에 대해서도 밝혔다.
조제웅 크래프톤 딥러닝 본부 코어 리서치 팀장은 “저명한 딥러닝 학회의 피어 리뷰(Peer review) 과정을 통해 크래프톤의 기술을 전세계 딥러닝 연구자들로부터 검증받을 수 있다”며 “학회 제출을 통해 딥러닝 분야의 최신 연구 트렌드를 파악하고 연구 방향을 적절히 조정하는 데 중요한 역할을 했다”고 말했다.