FlagEval(Libra) 대형 모델 검토
FlagEval(Libra) 대형 모델 평가 시스템 및 개방형 플랫폼은 연구자가 기본 모델 및 훈련 알고리즘의 성능을 종합적으로 평가할 수 있도록 과학적이고 공정하며 개방적인 평가 벤치마크, 방법 및 도구 세트를 구축하는 것을 목표로 합니다. 또한 주관적 평가를 지원하기 위한 AI 방법의 사용을 탐구하여 평가의 효율성과 객관성을 크게 향상시킵니다.
Introduction
Oops! Something went wrong
Sorry, the content could not found
