文章导航PC6首页软件下载单机游戏安卓资源苹果资源

pc软件新闻网络操作系统办公工具编程服务器软件评测

安卓新闻资讯应用教程刷机教程安卓游戏攻略tv资讯深度阅读综合安卓评测

苹果ios资讯苹果手机越狱备份教程美化教程ios软件教程mac教程

单机游戏角色扮演即时战略动作射击棋牌游戏体育竞技模拟经营其它游戏游戏工具

网游cf活动dnf活动lol周免英雄lol礼包

手游最新动态手游评测手游活动新游预告手游问答

您的位置:首页资讯厂商动态 → 谷歌宣布Gemini 1.5 Pro开放API 新增多项功能

谷歌宣布Gemini 1.5 Pro开放API 新增多项功能

时间:2024/4/10 14:04:04来源:www.pc6.com作者:学臣我要评论(0)

4月10日 消息:Google宣布开放其AI模型Gemini1.5Pro的API,这一版本在原有基础上进行了大幅度的功能扩展,现已在180多个国家提供。

Gemini1.5Pro引入了对原生音频(语音)的理解能力,以及文件API和系统指令等新功能。这使得Gemini模型能够直接处理音频输入,而无需先将音频转换为文本。这为AI模型带来了全新的应用可能性,如音频和视频模态的处理。

Gemini1.5Pro大大扩展了输入模态的范围,现在它不仅能理解文本,还能理解音频(语音)。此外,Gemini1.5Pro还可以对上传到Google AI Studio中的视频进行图像(帧)和音频(语音)的同时推理,这意味着这个模型具备了理解和处理视频内容的能力,不仅限于视频的视觉部分(如图像帧),也包括音频部分(如对话、背景音乐等)。

这一改进的应用潜力巨大,包括多模态理解、内容索引和搜索、增强的交互体验、视频内容分析以及创意内容生成等方面。例如,通过综合分析视频中的视觉信息和音频信息,Gemini1.5Pro可以更全面地理解视频内容,从而帮助创建更详细的内容索引,使用户能够基于视频内容的视觉和听觉信息进行搜索。

此外,Gemini API也进行了一些重要的改进。比如,引入了系统指令引导模型响应,现已在Google AI Studio和Gemini API中提供。开发者可以通过定义角色、格式、目标和规则来指导模型的行为,以适应特定用例。同时,新的JSON模式指示模型仅输出JSON对象,该模式支持从文本或图像中提取结构化数据。

Google还推出了新的嵌入模型,性能得到了显著提升。从今天开始,开发者将能够通过Gemini API访问Gemini下一代文本嵌入模型。这个新模型在MTEB基准测试中取得了更强的检索性能,超过了具有可比维度的所有现有模型。


相关阅读 ​谷歌AI研究人员提出噪声感知训练方法(NAT)用于布局感知谷歌推Scenic:可识别视频内容 并生成详细描述谷歌如何在人工智能竞赛中失利:内部组织文化是最大障碍谷歌在Pixel 8上禁用自家大模型!会占用大量手机内存如何注册谷歌账号 手机上如何注册谷歌账号新版谷歌浏览器如何安装第三方插件 新版谷歌浏览器安装第三方插件Chrome浏览器新老版本插件安装教程 谷歌浏览器新老版本插件安装方谷歌相机闪退怎么解决

文章评论
发表评论

热门文章 2016淘宝造物节怎么玩人生日历新增小插件—2014年双11淘宝销售额

最新文章 谷歌宣布Gemini 1.5 P马云内网肯定阿里变革 苹果新AI模型研究Ferret-UI:或将提升Siri,暴雪游戏回归国服 网易暴雪合作新变化:开启华为MateBook X Pro官宣!余承东:首次支持暴雪官宣回归 暴雪国服玩家数据完整保留

人气排行 2014年双11淘宝销售额及排行榜扫描文件怎么转换成word 扫描文件转换成wor如何将pdf转换成jpg pdf转jpg图文教程360粉碎文件如何恢复win7回收站清空了怎么恢复 win7回收站清空恢pdf怎么转换成excel pdf文件转Excel格式方法设备管理器有叉号、问号、感叹号?驱动人生迅捷pdf转换成word转换器怎么用