清华 KEG 实验室联合智谱 AI 推出图像理解大模型 CogAgent

来源: 巴比特2023-12-27
据 IT 之家 12 月 27 日消息,清华 KEG 实验室近日和智谱 AI 合作,联合推出了新一代图像理解大模型 CogAgent。该模型基于此前推出的 CogVLM,通过视觉 GUI Agent,使用视觉模态(而非文本)对 GUI 界面进行更全面直接的感知,从而作出规划和决策。据悉,CogAgent 可以接受 1120×1120 的高分辨率图像输入,具备视觉问答、视觉定位(Grounding)、GUI Agent 等多种能力,在 9 个经典的图像理解榜单上(含 VQAv2,STVQA, DocVQA,TextVQA,MM-VET,POPE 等)取得了通用能力第一的成绩。
利好利好
0
利空利空
0
交易平台最新公告查看更多>
成交额排行榜
  • 交易所
  • 币种
排名 交易所 成交额
1 币安网币安网 ¥5,017.83亿
2 欧易OKX欧易OKX ¥1,768.33亿
3 火币全球站火币全球站 ¥156.69亿
4 抹茶抹茶 ¥329.01亿
5 芝麻开门芝麻开门 ¥336.56亿
6 库币库币 ¥160.05亿
7 Coinbase ProCoinbase Pro ¥144.26亿
8 bitFlyerbitFlyer ¥7.02亿
9 BitMEXBitMEX ¥0
10 BitstampBitstamp ¥14.97亿