您的位置:首页资讯厂商动态 → 谷歌推Scenic:可识别视频内容 并生成详细描述

谷歌推Scenic:可识别视频内容 并生成详细描述

时间:2024/4/7 12:24:20来源:www.pc6.com作者:学臣我要评论(0)

4月7日 消息:Scenic 是谷歌推出的模型,一个专注于计算机视觉领域的代码库,主要用于研究基于注意力的模型。

该库提供了一系列共享的轻量级库,解决训练大规模视觉模型时常见的任务,并包含了几个使用这些库的问题特定训练和评估循环的项目。Scenic 使用 JAX 和 Flax 进行开发,支持开发人员在图像、视频、音频和多模态组合方面开发分类、分割和检测模型。Scenic能识别任意长度的视频内容,并生成详细描述。针对长视频,可以在处理完整个视频前,流式预测视频内容。

Scenic 提供了一些功能,包括用于启动实验、摘要编写、日志记录、性能分析等的样板代码;优化的训练和评估循环、损失函数、度量、双部分匹配器等;以及用于流行视觉数据集的输入管道和强大的非注意力基线模型。

在 Scenic 中,有一些 SOTA 模型和基线模型,这些模型可能是使用 Scenic 开发的,也可能是在 Scenic 中重新实现的。一些项目包括 ViViT、OmniNet、Attention Bottlenecks for Multimodal Fusion 等。此外,Scenic 还提供了一些重现的基线模型,如(ViT)An Image is Worth16x16Words、(DETR)End-to-End Object Detection with Transformers 等。

Scenic 的目标是促进大规模视觉模型的快速原型设计。为了保持代码简单易懂且易于扩展,Scenic 更倾向于通过复制粘贴而非增加复杂性或增加抽象来解决问题。只有当功能被证明在许多模型和任务中广泛有用时,才可能将其上游到 Scenic 的共享库中。


相关阅读 谷歌如何在人工智能竞赛中失利:内部组织文化是最大障碍谷歌在Pixel 8上禁用自家大模型!会占用大量手机内存如何注册谷歌账号 手机上如何注册谷歌账号新版谷歌浏览器如何安装第三方插件 新版谷歌浏览器安装第三方插件Chrome浏览器新老版本插件安装教程 谷歌浏览器新老版本插件安装方谷歌相机闪退怎么解决如何禁止谷歌浏览器隐藏url的www前缀 禁止chrome浏览器隐藏url的谷歌浏览器怎么安装离线插件 Chrome浏览器安装.crx离线插件教程

文章评论
发表评论

热门文章 2016淘宝造物节怎么玩人生日历新增小插件—2014年双11淘宝销售额

最新文章 谷歌推Scenic:可识别跑分超175万!Redmi T 小米集团开盘大涨近15% 小米汽车SU7大定近9苹果今年或推出低价AirPods 率先在印度工厂内存减产涨价 三星Q1营业利润大增931.3%!结谷歌如何在人工智能竞赛中失利:内部组织文

人气排行 2014年双11淘宝销售额及排行榜扫描文件怎么转换成word 扫描文件转换成wor如何将pdf转换成jpg pdf转jpg图文教程360粉碎文件如何恢复win7回收站清空了怎么恢复 win7回收站清空恢pdf怎么转换成excel pdf文件转Excel格式方法设备管理器有叉号、问号、感叹号?驱动人生迅捷pdf转换成word转换器怎么用