(资料图片仅供参考)
编程客栈(www.cpythonppcns.com)5月30日 消息:在2023中关村论坛平行论坛之一的人工智能大模型发展论坛上,北京智源人工智能研究院推出通用分割模型 SegGPT(Segment Everything In Contex),这是一个利用视觉提示(prompt)完成任意分割任务的通用视觉模型。
SegGPT 编程客栈是智源通javascript用视觉模型 Painter 的衍生模型,可针对分割一切物体的目标做出优化。
该模型具备上下文推理能力,训练完成后无需微调,只需提供示例即可自动推理并完成对应分割任务,包括图像和视频中的实例、类别、零部件、轮廓、文本、人脸、医学图像等。
如下图所示,标注出一个画面中的彩虹,SegGPT可批量化分割其他画面中的彩虹。
它的灵活推理能力支持任意数量的视觉提示。自动视频分割和追踪能力以第一帧图像和对应的物体掩码作为上下文示例,SegGPT 能够自动对后续视频帧进行分割,并且可以用掩码的颜色作为物体的ID,实现自动追踪。
值得一提的是,此前Meta发布了其新的基于 AI 的 Segment Anything Model (SAM),该模型具有识别和分离图像和编程客栈视频中的特定对象的功能。通过使用SAM,用户可以通过点击物体或输入文字提示选中编辑的物体。
威斯康辛麦迪逊、微软、港科大等机构的研究人员也提出SEEM模型,通过不同的视觉HLxjPk提示和语言提示,一键分割图像、视频。SEEM模型是一种新型的分割模型,这一模型可以在没有提示的开放集中执行任何分割任务,比如语义分割、实例分割和全景分割。
另外,南科大发布视频分割模型TAM,可轻松追踪视频中的任意物体并消除,操作简单友好。TAM的出现为解决传统视频分割模型需要人工标记培训数据和初始化参与数据的问题提供了之前提供,将改变CGI行业的游戏游戏规则。
SegGPT相关代码发布在 github 上,论文发表在预印本平台 arXiv 上。论文地址:https://arxiv.org/abs/2304.03284
关键词:
类脑芯片能取代人类工作吗?来看这份最新发布的报告
中国目前基础研究成果以及技术研发成果,在数量上均居全球首位,但论文
李天元(对于李天元简单介绍)
聊聊一篇天元,对于李天元简单介绍的文章,网友们对这件事情都比较关注
开放世界仙侠RPG《扶摇录》首曝,开启你的九州之旅
由天心同游研发、bilibili游戏独家代理的开放世界国风仙侠RPG游戏于今
9月8日基金净值:嘉实价值发现三个月定开混合最新净值0.9447,跌0.4%
9月8日,嘉实价值发现三个月定开混合最新单位净值为0 9447元,累计净值
宜宾九彩虹公司举办第二十一届“感恩教育 尊师重教”表彰活动
为弘扬尊师重教的良好风尚,9月6日,四川宜宾九彩虹生态农业科技有限公
理想汽车在扬州成立新公司,经营范围含太阳能发电技术服务
近日,扬州车和家能源服务有限公司成立,注册资本100万,法定代表人为
今年8月全国受理网络违法和不良信息举报同比增长15.1%
今年8月全国受理网络违法和不良信息举报同比增长15 1%---中央网信办举
《极限竞速:地平线5》三星巅峰赛9月9日火热启动
《极限竞速:地平线5》与三星电子联袂举办的三星杯秋季赛巅峰赛即将拉
功率信号源的用途和作用有哪些
功率信号源是一种重要的电子设备,用于生成具有特定功率水平、波形和频
新澳股份(603889)每日收评(09-08)
新澳股份603889时间:2023年9月8日星期五54 46分综合得分较强趋势方向主