取消
搜索历史
热搜词
原创
活动
产业创新
转型理念
ENI专访
当前位置:首页 >文章发布 > 正文
微软Copilot重磅升级,图文代码能力暴涨
来源:智东西  作者: 佚名 2023-12-08 09:53:38
在旗下 AI 助手 Copilot 发布一周年之际,微软宣布 Copilot 迎来三大重磅更新,包括新模型、新搜索以及代码解释器,图文能力、代码能力大幅升级。简单来说,就是 ChatGPT Plus 能干的活,升级后的 Copilot 几乎都能干,并且还免费。

在旗下 AI 助手 Copilot 发布一周年之际,微软宣布 Copilot 迎来三大重磅更新,包括新模型、新搜索以及代码解释器,图文能力、代码能力大幅升级。简单来说,就是 ChatGPT Plus 能干的活,升级后的 Copilot 几乎都能干,并且还免费。

此次更新,Copilot 不仅即将支持 OpenAI 最新的 GPT-4 Turbo 模型,还将文生图模型DALL-E 3 进行了全面升级,从而提供更高质量、更准确的图像。

搜索方面,Copilot 推出两项新功能,分别从多模态、意图理解方面对搜索引擎进行加强。代码解释器目前推出简单版,可以自然语言生成代码,并支持在沙盒环境中运行,后续还将支持上传和下载文件。

AI 邮件自动化工具 Answera 创始人保罗 · 库弗特(Paul Couvert)于社交平台 X 上分享了此次升级后的 Copilot 与 ChatGPT Plus 的功能对比。从图中可以看出,Copilot 几乎提供了所有 ChatGPT Plus 的功能,甚至在生成图像数量、网页搜索速度等方面更胜一筹。

最关键的是,Copilot 仍然免费,这让月费 20 美元(约合人民币 143 元)的 ChatGPT Plus 显得有些缺乏性价比。

一、接入 OpenAI 最新模型 GPT-4 Turbo,DALL-E 3 大升级

模型方面,Copilot 即将接入 OpenAI 的最新模型 GPT-4 Turbo,这意味着 Copilot 将升级至 128k 上下文窗口。微软称,该模型目前正在小范围测试,并在未来几周内广泛集成到 Copilot 中。

Copilot 还将提供升级后的 DALL-E 3 模型,生成图像质量更高、更准确。

升级后的 DALL-E 3 对剑龙的皮肤纹理、皱纹的刻画更加细致和逼真,背景中的建筑更具立体感,整张图像的光影层次也有所提升。

升级后的 DALL-E 3 为图像赋予了更多细节,描绘出了水下的景象,也通过光影表现出了皮艇与鲸鲨之间的距离感。相比之下,左边的画面有些过于平面。

二、AI 搜索推出两大更新,深度搜索提效 10 倍

在搜索功能上,Copilot 此次推出了两项更新。

首先是多模态搜索(Multi-Modal with Search Grounding)。微软基于自主开发的 AI 模型 Prometheus,将 GPT-4V 的视觉能力、Bing 图像搜索以及网络搜索数据相结合,以提供更好的图像理解体验。

在微软提供的示例中,用户上传了一张火箭发射的图像,并询问发射时间。

Copilot 首先对图像进行分析,并提示 " 出于隐私保护,将隐藏图中的人脸 "。在识别出图中的信息后,Copilot 开始搜索 " 月船 3 号(Chandrayaan-3)的发射时间 "。

最后,Copilot 生成回答:" 根据您提供的信息,这张图片中的火箭来自月船 3 号任务。它于 2023 年 7 月 14 日由印度空间研究组织(ISRO)从萨蒂什 · 达万航天中心发射。"

微软称,传统的多模态系统能够以通用的方式描述图中的内容,但结合在线搜索,Copilot 可以在识别图像信息的基础上提供更多问题的答案。该功能目前已经推出。

第二项新功能为深度搜索(Deep Search)。

微软称,推出该功能主要的原因是在遇到一些复杂、细致或具体的问题时,现在的搜索引擎有时无法理解用户的期望。

深度搜索建立在 Bing 现有的网络索引和排名系统之上,并基于 GPT-4 进行增强,将搜索查询扩展为更全面的描述,包括理想的结果集应包含的内容。

当遇到一些不明确或有歧义的查询时,例如 " 积分系统在日本如何运作 ",这里的积分可能有多种含义。深度搜索会利用 GPT-4 来查找所有可能的意图,提供一个消歧窗格,用户可以从中选择自己所需要的描述来代替。

微软称,深度搜索使用各种信号来确定每个结果的相关性和质量,并考虑主题匹配程度、详细程度,来源的可信度、新鲜度和受欢迎程度等因素,其搜索效率是普通搜索的 10 倍,但速度上最多可能需要 30 秒才能完成。

该功能目前仍在测试和改进中,微软将在全球范围内随机选取用户试用。

三、推出代码解释器,Edge 可一键总结视频内容

Copilot 还推出了代码解释器(Code Interpreter),支持更准确的计算、编码、数据分析、可视化、数学等任务。

据介绍,Copilot 代码解释器将编写代码来回答用户的自然语言请求,并支持在沙盒环境中运行代码,同时预装了许多流行的数据科学工具和库,包括 Pandas、NumPy、Matplotlib 等。

用户也可以向 Copilot 上传和下载文件,将自己的数据和代码与网络搜索结果相结合。

代码解释器目前推出了简单版本,暂时还不支持上传文件或是复杂的代码功能,预计将在几周时间内逐步升级新版本。

在 Edge 浏览器中,Copilot 侧边栏即将推出带重写菜单的内联撰写功能,可一键将生成的文本填入网页输入框,还可选择想要更改的文本要求 Copilot 重写;同时推出视频理解和问答功能,通过侧边栏,用户可以总结或询问当前观看的视频,该功能目前已开放。

此外,据微软 CVP、Bing 工程和产品主管乔迪 · 里巴斯(Jordi Ribas)透露,还有一个 " 令人兴奋的新功能 ":笔记本(Notebook)界面。该界面的入口位于搜索、对话旁边,用户可以专注于提示创建、细化和迭代输出。它具有记忆功能,还接受长达 18k 字符的长文本提示。

该功能目前也在小范围测试,尚未完全推出。

上周,ChatGPT 刚刚过完一周年纪念日,现在 Copilot 也迎来 " 一岁生日 "。从此次发布的更新可以看出,Copilot 的功能日益强大,几乎能媲美月费 20 美元的 ChatGPT Plus。

在此前的 OpenAI" 政变 " 事件中,微软一边为其 " 撑腰 ",一边力争董事会席位。虽然最后,微软只获得了一个无投票权的观察席位,但也算是争取到了一些掌控权。目前二者仍保持紧密合作的联盟关系。

而另一边,微软长期的竞争对手谷歌在 AI 方面虽然暂时落后,但也传出最快将在本周公开预览大模型 Gemini 的消息。作为谷歌十年来最大的 AI 项目,Gemini 的能力能否赶上 GPT-4,让我们拭目以待。

免责声明:本文系网络转载,版权归原作者所有。本文所用图片、文字如涉及作品版权问题,请联系删除!本文内容为原作者观点,并不代表本网站观点。
编辑:乔帅臣
关键词:   Copilot  AI助手  OpenAI 
活动 直播间  | CIO智行社

分享到微信 ×

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。