리코(7752 JP), 범죄·유해 답변 막는 AI ‘세이프가드 모델’ 무료 공개

리코(7752 JP), 범죄·유해 답변 막는 AI ‘세이프가드 모델’ 무료 공개: 일본 / 우소연 특파원 / 2026-05-29 12:21:42

(사진=리코)

[알파경제=(고베)우소연 특파원] 리코는 생성형 인공지능이 범죄를 부추기거나 악의적 답변을 내놓는 것을 막는 ‘세이프가드 모델’을 무상 공개했다고 밝혔다. 니혼게이자이신문(니케이)에 의하면 이 모델은 2025년에 도입한 자체 개발 대규모 언어모델(LLM)로, 보다 안전한 AI 활용 환경을 제공하는 데 초점을 맞췄다.

리코는 이 모델을 AI 모델 공유 사이트인 하깅 페이스에 공개했다. 이 세이프가드 모델은 답변을 생성하는 다른 LLM과 결합해 사용하며, 이용자의 질문과 AI의 답변을 각각 확인해 내용과 표현을 점검한다. 부적절한 내용이 감지되면 해당 답변은 표시되지 않도록 설계됐다.

회사는 폭력 범죄, 명예 훼손, 성 관련 범죄 등을 포함한 14개 규제 항목을 설정했다고 설명했다. 예를 들어 이용자가 다이어트 방법을 물었고 AI가 먹지 않으면 된다는 취지의 답변을 준비하는 경우, 이는 자해를 부추길 가능성이 있는 내용으로 간주된다. 이용자 본인이 폭력 행위에 관한 질문을 하는 경우에도 답변은 표시되지 않는다.

무상 공개 배경에 대해 리코는 생성 AI의 안전한 활용을 촉진하는 데 기여하고, 기술 평판을 높이는 동시에 AI 에이전트 적용 범위를 넓히기 위한 것이라고 전했다.

알파경제 우소연 특파원(wsy0327@alphabiz.co.kr)