삼성전자가 자체 개발한 AI 업무 생산성 벤치마크 ‘트루벤치(TRUEBench, Trustworthy Real-world Usage Evaluation Benchmark)’를 공개했다.이번 벤치마크는 삼성전자 DX부문 선행 연구조직인 삼성리서치가 사내 생성형 AI 적용 경험을 바탕으로 개발한 것으로, AI 모델이 실제 업무에서 어느 정도 생산성을 발휘할 수 있는지를 측정하는 데 초점을 맞췄다.삼성전자는 많은 기업이 AI를 도입하고 있지만 기존 벤치마크만으로는 업무 생산성 성능을 정확히 가늠하기 어렵다는 점에 주목했다. 특히 시중 벤치마크 대부분이 영어 중심에 머물고, 제한된 횟수의 대화 평가에 그친다는 한계가 있었다.트루벤치는 이와 달리 실제 기업 환경을 반영한