清华 KEG 实验室联合智谱 AI 推出图像理解大模型 CogAgent
来源: 巴比特2023-12-27
据 IT 之家 12 月 27 日消息,清华 KEG 实验室近日和智谱 AI 合作,联合推出了新一代图像理解大模型 CogAgent。该模型基于此前推出的 CogVLM,通过视觉 GUI Agent,使用视觉模态(而非文本)对 GUI 界面进行更全面直接的感知,从而作出规划和决策。据悉,CogAgent 可以接受 1120×1120 的高分辨率图像输入,具备视觉问答、视觉定位(Grounding)、GUI Agent 等多种能力,在 9 个经典的图像理解榜单上(含 VQAv2,STVQA, DocVQA,TextVQA,MM-VET,POPE 等)取得了通用能力第一的成绩。
热门新闻
- 1下周必关注|BounceBit将上线主网并空投代币;LayerZero将公布官方女巫检查结果(5.13-5.19)
- 2BounceBit主网已上线,推出节点质押和委托等多项新功能
- 3以太坊近期事件解析:香港加密ETF影响、美国ETH ETF前景、ETH是否会被认定为证券?
- 4特朗普“蹭”上加密圈:买4653美元NFT即可参与晚宴 相关MEME币飞涨
- 5Bitget研究院:加密市场全线反弹,Blast 6月26日确定空投
- 6全览FHE赛道:25个值得关注的项目
- 7特朗普和拜登,打响“加密大选”之战
- 8链游周报 | MATR1X阿波罗计划即将上线;超90%游戏代币下跌(5.6-5.12)
- 9Coinbase加密周报:市场或迎来拐点 Aave透露V4计划
交易平台最新公告查看更多>