리코(7752 JP), 범죄·유해 답변 막는 AI ‘세이프가드 모델’ 무료 공개

일본 / 우소연 특파원 / 2026-05-29 12:21:42
(사진=리코)

 

[알파경제=(고베)우소연 특파원] 리코는 생성형 인공지능이 범죄를 부추기거나 악의적 답변을 내놓는 것을 막는 ‘세이프가드 모델’을 무상 공개했다고 밝혔다. 니혼게이자이신문(니케이)에 의하면 이 모델은 2025년에 도입한 자체 개발 대규모 언어모델(LLM)로, 보다 안전한 AI 활용 환경을 제공하는 데 초점을 맞췄다.


리코는 이 모델을 AI 모델 공유 사이트인 하깅 페이스에 공개했다. 이 세이프가드 모델은 답변을 생성하는 다른 LLM과 결합해 사용하며, 이용자의 질문과 AI의 답변을 각각 확인해 내용과 표현을 점검한다. 부적절한 내용이 감지되면 해당 답변은 표시되지 않도록 설계됐다.

회사는 폭력 범죄, 명예 훼손, 성 관련 범죄 등을 포함한 14개 규제 항목을 설정했다고 설명했다. 예를 들어 이용자가 다이어트 방법을 물었고 AI가 먹지 않으면 된다는 취지의 답변을 준비하는 경우, 이는 자해를 부추길 가능성이 있는 내용으로 간주된다. 이용자 본인이 폭력 행위에 관한 질문을 하는 경우에도 답변은 표시되지 않는다.

무상 공개 배경에 대해 리코는 생성 AI의 안전한 활용을 촉진하는 데 기여하고, 기술 평판을 높이는 동시에 AI 에이전트 적용 범위를 넓히기 위한 것이라고 전했다.

 

알파경제 우소연 특파원(wsy0327@alphabiz.co.kr)

주요기사

소니생명(8729 JP) 영업사원 4명, 고객돈 1억2000만엔 부정수취 논란
히타치(6501 JP), AI 자율공장 도입...결함까지 발견 후 수정
일본·필리핀 회담, 에너지·안보 협력 확대와 EPA 개정 검토...GSOMIA 협상 착수 합의
후지쯔(6702 JP), AI·반도체·양자에 3조엔 투입
[특파원] 日 정부, 러시아에 자산 보호 요청…진출 기업 사업환경 개선 협의
뉴스댓글 >

건강이 보이는 대표 K Medical 뉴스

SNS