AI解读清明上河图--Caption Anything 细粒度可控的图像描述 热议
来源: 商业新知网2023-04-21 00:11:57
(资料图片)
清明上河图
近日南方科技大学和腾讯ARC Lab开源了一款交互式图像描述工具, 基于Segment Anything, BLIP-2 Captioning和chatGPT实现, 通过视觉控制(鼠标点击)获取特定区域的object, 并以多样化的语言风格描述出来.
传统图像描述或密集描述通常以解析全图为目的, 如果遇到清明上河图等场景丰富且object交互特别复杂的图像, 一个简单的句子或非常长的段落, 对用户阅读很不友好. Caption Anything想看哪里即点击哪里, 根据用户需求定制化地关注局部区域, 进行细节描述及后续推理任务. 同时具有速度优势.
描述一幅图是一对多的映射, 不同用户对图像区域关注重点不同, 语言风格需求也不同. 面对如此多样的文本输出空间, 交互式控制模型输出可以与用户的需求更加对齐. 如下图所示, Caption Anything提供了视觉控制和语言控制.
Caption Anything支持视觉控制和语言控制
用户界面: 支持鼠标点击(连续或单次点击), 输出描述的语言风格控制(情感, 语种, 想象), 利用chatGPT输出物体对应的wiki知识, 同时支持chatGPT进行对话. 代码同时支持Linux和Windows平台.
用户界面
本文为粉丝投稿。 投稿邮箱 amos@52 cv.net。
标签:
查看更多滚动
2022-12-23
银燕飞临帕米尔高原 喀什旅游业迎来腾飞新机遇
2022-11-28
拥抱智能新变化,MAXHUB 全新赋能企业新发展
2022-11-21
端点科技携手晶科能源,推进能源供应链数字化转型
2022-11-02
今日聚焦!美国高校研发出锂电池"完美替代者"
2022-11-02
每日简讯:不惧风雨,山地骑行
2022-11-02
当前速递!湖南大学无锡半导体先进制造创新中心正式揭牌
2022-11-02
即时:通过数字化转型实现环境可持续发展
2022-11-02
新资讯:3GW太阳能光伏组件项目:致力于成为行业领先专家 用光伏智造引领产业发展
2022-11-02
快看:乘联会数据显示磷酸铁锂电池装机量反超三元锂
2022-11-02
环球热点!丰田研发新型电动汽车电池续航提升15%
- 04-21AI解读清明上河图--Caption Anything 细粒度可控的图像描述 热议
- 04-20华润三九(000999.SZ):未来零售市场集中度有望进一步提升,将围绕业务领域进行全方位产品布局-焦点速讯
- 04-20新疆精河5万千伏光伏发电项目主体工程完成
- 04-20报道:iPhone 15曾有Lightning接口丨苹果升级Apple Trade In换购计划~
- 04-20国内商品期货夜盘开盘 玻璃涨近3%_全球聚焦
- 04-20【全球速看料】涉5区!北京这12个诉求集中老旧小区有望优先改造,有你家吗?
- 04-20中国LPR连续8个月不变 4月百城首套房贷利率微降 滚动
- 04-20教育部公布本科新增专业,包括孤独症儿童教育、未来机器人等|焦点资讯
- 04-20世界看热讯:一批中小学项目将有新进展,葛店加快对接武汉新城建设
- 04-20中国华能首次实现海上风电机组不停机巡检 要闻速递
- 04-20湖北樊城:探寻地球奥秘 焦点
- 04-20市场监管总局:加大标准化工作力度 引领产业发展|热门
- 04-20雨生百谷耕种忙,去农大一起抓住春天的尾巴!|我的节节·谷雨篇
- 04-20国际油价跌创逾两周新低,两大信号暗示需求可能已经疲软 世界微动态
- 04-20北京治疗斑秃检查医院-治疗斑秃需要哪些检查
- 04-20看热讯:如何给 Brother VX710 缝纫机穿线
- 04-20天天热文:山西太原“物联网智能燃气表”上线
- 04-20当前简讯:美媒将大规模枪击事件称为美国的“国家耻辱” 外交部回应
- 04-20欧洲中世纪政治制度(关于欧洲中世纪政治制度介绍)
- 04-20世界球精选!张家港市金港街道:春风十里海棠红,“植”此青绿美家园
- 04-20全球热推荐:乙肝怎么得的
- 04-20每日信息:欧盟巨额芯片法案只差最后一步,欧美“芯片大战”一触即发?
- 04-204月20日西北地区地炼汽柴油报价下滑 环球速看
- 04-20世界视讯!家巴金每一章的梗概(家巴金每一章概括)
- 04-20对浪费粮食的“大胃王”比赛说“不”
- 04-20北京航空航天大学成立国内高校首个数字化飞行器科教协同创新平台
- 04-20富贵庄园好玩吗 富贵庄园玩法简介
- 04-20每日头条!非法同居后果是什么
- 04-20如何把数字月份转换成英文的月1-12缩写快速 环球最新
- 04-20咨询chatGPT关于c#脚本的方案,全文无任何修改。