AI模型评测

讯飞星辰Agent平台

AI智能体平台 AI模型评测 AI编程工具 AI算力平台 AI热门工具 AI提示词

新一代智能体Agent开发平台，支持通过提示词Prompt、工作流Workflow灵活创建专业智能体。平台已整合丰富的模型、插件、MCP Server，支持一站式效果测评，助力开发者快速搭建生产级智能体。创建后可发布到讯飞星火App、微信公众号，或发布成API、MCP Server。

阿杰塔

AI智能体平台 AI模型评测 AI热门工具 AI提示词

人工智能团队的开源提示管理和评估

AGI-Eval

AI模型评测

AGI-Eval评测社区，AI大模型评测社区

Arena.ai（前身为 LMSYS）

AI模型评测

arena.ai 评测竞技场排行榜,是一个由加州大学伯克利分校 SkyLab 和 LMSYS 的研究人员开发的评测平台，用于通过人类偏好评估人工智能

Artificial Analysis AI基准测试平台

AI模型评测

Artificial Analysis平台是一家领先的独立AI基准测试和分析平台

Chirpz 代理

AI智能体平台 AI模型评测 AI热门工具 AI绘画工具

发现未曾见过的文学的最聪明的方式

CLiB中文大模型能力评测榜单

AI模型评测

是一个关于中文大模型能力评测的榜单仓库，涵盖 195 个商用及开源大模型，进行多维度能力评测（包括医疗、教育、法律等众多领域），有多种排行榜分类且记录详细更新信息。

CLUE中文语言理解基准测评

AI模型评测

中文语言理解测评基准，包括代表性的数据集、基准(预训练)模型、语料库、排行榜。选择一系列有一定代表性的任务对应的数据集，做为我们测试基准的数据集。这些数据集会覆盖不同的任务、数据量、任务难度。

斑纹

AI模型评测 AI热门工具 AI绘画工具

管理奖项、竞赛和申请的智能平台

FlagEval （天秤）大模型评测

AI模型评测

FlagEval （天秤）大模型评测体系及开放平台，旨在建立科学、公正、开放的评测基准、方法、工具集，协助研究人员全方位评估基础模型及训练算法的性能，同时探索利用AI方法实现对主观评测的辅助，大幅提升评测的效率和客观性。

Kitty 积分排行榜

AI模型评测 AI社区 AI热门工具

寻找有趣的社区成员，看看你的表现如何

Livebench LLM模型的基准测试平台

AI模型评测

LiveBench 是一个针对大型语言模型（LLM）的权威基准测试平台，提供一个公平、客观且无污染的评测环境，以评估和比较不同 LLM 的性能

Category

Explore by categories

All

AI热门工具

AI对话聊天

AI绘画工具

AI视频工具

AI编程工具

AI智能体平台

AI文本工具

AI图片处理

AI办公工具

AI搜索引擎

AI大模型

AI音频工具

AI开发者社区

AI算力平台

AI学习网站

AI提示词

AI资讯

AIGC博主

AI社区

AI内容检测

AI竞赛

其他AI工具

讯飞星辰Agent平台

阿杰塔

AGI-Eval

Arena.ai（前身为 LMSYS）

Artificial Analysis AI基准测试平台

Chirpz 代理

CLiB中文大模型能力评测榜单

CLUE中文语言理解基准测评

斑纹

FlagEval （天秤）大模型评测

Kitty 积分排行榜

Livebench LLM模型的基准测试平台

讯飞星辰Agent平台

阿杰塔

AGI-Eval

Arena.ai（前身为 LMSYS）

Artificial Analysis AI基准测试平台

Chirpz 代理

CLiB中文大模型能力评测榜单

CLUE中文语言理解基准测评

斑纹

FlagEval （天秤）大模型评测

Kitty 积分排行榜

Livebench LLM模型的基准测试平台