谷歌Android手机,听我的,AI要这么做
作者 | 芯芯
编纂 | 靖宇
争先苹果一个月,Google 将 AI+手机的可能性,全都展现在了本身的 Pixel 新机之中。
本地光阴 8 月 13 日,Google 宣布了 Pixel 9、Pixel 9 Pro 以及二代折叠屏 Pixel 9 Fold、智能腕表、耳机等硬件新品。相比于硬件,人们更存眷,在 AI+手机如斯火热确当下,作为 Android 体系的治理者,Google 将会若何将端侧 AI 用于 Android 手机之中。

差不多在10个月前,谷歌推出了第一代 AI 手机,现在不到一年,这家巨擘再次更新 Gemini、Android 和 Pixel 的产物组合,这一次,主打的是「竞争敌手有的,我也有」模式。
自 OpenAI 推出 ChatGPT 语音模式,以及苹果下一代 iPhone 的 AI 功效曝光以来,同业们能做到的,谷歌都不肯落下,包含 AI 语音对话、搜刮屏幕截图中的信息等。与此同时,谷歌也在让 AI 进一步集成进自身的利用生态。
谁才是 AI 手机领头羊,Google 必定要和苹果掰掰手段。
回应 OpenAI,
Gemini Live上线
Gemini 是谷歌各类 AI 产物的基石,也是谷歌 Pixel 9 系列手机上的默认助手,Gemini 在集成进手机时有哪些进级,是宣布会上的一年夜核心。
谷歌 Pixel 手机上的 Gemini 按下电源按钮即可唤出。据谷歌高管称,从本日开端,用户可以在使用的利用法式上方调出 Gemini 的笼罩层,扣问有关屏幕上内容的问题。例如,用户可以扣问正在旁观的 YouTube 视频的相关问题,用户还可以直接从 Gemini 的笼罩层天生图像,并将它们拖放到 Gmail 和 Google Messages 等利用法式中。
谷歌还方案在「将来几周」让 Gemini 衔接更多利用法式,包含日历、 Keep 和 YouTube Music 等。详细的功效用途如,让 Gemini「制造一份让我想起 90 年月末的歌曲播放列表。」「拍下演唱会传单的照片,并让 Gemini 查看那天是否有空——乃至设置提示来购置门票。」「让 Gemini 在你的 Gmail 中找到一份食谱,并要求它将配料添加到 Keep 中的购物清单中。」
Gemini 使用截图提守信息与更多利用法式互动|图片起源:谷歌
除了这些集成体验外,谷歌还正式上线了 Gemini Live,这一功效可以说是谷歌对 OpenAI 推出的 GPT-4o 高档语音模式的回应。该功效此前在谷歌 2024 年的 I/O 开发者年夜会上曝光过,本日开端正式推出。
用户可以用手机与谷歌的天生式AI谈天机械人 Gemini 进行语音对话,可以半途打断,提出跟进的问题,对话可以随时停息和规复。一些详细用途例子包含,让 Gemini Live 陪你预备事情口试、演习演讲,随意聊聊关怀的话题等。
Gemini Live 显著要对标 GPT-4o 的语音交互|图片起源:谷歌
那么,Gemini Live 相较于 ChatGPT 的语音模式有上风吗。
据称,支撑 Live 的天生式 AI 模子架构——Gemini 1.5 Pro 和Gemini 1.5 Flash,拥有比均匀程度更长的「上下文窗口」,这意味着它们可以在天生相应之前处置和推理年夜量数据,理论上可以进行长达数小时的对话。
Gemini Live 还可免提使用,用户可以在利用后台或手机锁准时继续进行语音对话,有10 种新声音可以选择。
但值得注意的是,Gemini Live 今朝还未上线「多模态输入」功效,据称将于「本年晚些时刻」推出。
几个月前,谷歌曾经宣布了预录视频,展现了 Gemini Live 若何经由过程手机摄像头捕获的照片和视频辨认用户四周情况,并做出相应,好比指出毁坏自行车的某个部件,或解释计算机屏幕上一段代码的功效,这些都未获得现场的真实演示。
并且,Gemini Live 在 Android 手机上的 Gemini Advanced 订阅用户中推出,并不是免费的。今朝它仅提供英文版本,谷歌称「将来几周」将扩大到更多语言,还要经由过程利用法式扩大到 iOS。
谷歌高管直播演示 Gemini Live|图片起源:谷歌
谷歌 Gemini 体验与谷歌助手方面的高管称「谷歌正处于摸索AI驱动助手各类有效方式的早期阶段——就像 Pixel 手机一样,Gemini 将会越来越好。」
另外,在隐私问题方面,谷歌 Android 生态体系方面的高管称,Gemini 支撑来自几十个装备制作商的数百款手机型号,在处置用户数据时,数据不会分开手机。
「Gemini 可以基于你私家锻练的邮件赞助创立逐日熬炼方案,或应用你 Google Drive 中的简历撰写事情简介。只有 Gemini 可以或许经由过程这种平安的、一体化的办法做到这统统,而不必要将数据交给你可能不熟悉或相信的第三方AI提供商。」谷歌 Android 生态体系总裁 Sameer Samat 称。
「因为 Android 是首个拥有年夜型装备内多模态 AI 模子的移动操作体系——名为 Gemini Nano——在处置一些最敏感的用例时,你的数据不会分开你的手机。」
AI 进一步交融进 Android
谷歌推广 AI 手机的最年夜上风无疑是自家的多种利用对象,以及 Android 生态,谷歌如今稀有十亿 Android 用户,能施展的空间,显然比一个谈天机械人利用法式更多。
客岁,作为首款以 AI 为焦点的智能手机,谷歌的 Pixel 8 系列带来了各类 AI 功效。例如,用户可以移除、移动或编纂照片中的单个元素,可以在照片之间移动脸色以得到最佳的合成照片,可以基于截图或屏幕上的某个「圈选部门」进行搜刮等。
所有这些功效都初次呈现在 Pixel 8 系列上,随后在整个 Android 生态体系中获得必定推广。
像谷歌的「圈选搜刮」功效,现实上初次呈现在三星的 Galaxy AI手机上,作为谷歌的 Android 生态互助伙伴,三星的手机还添加了很多相似的AI功效。前述 AI 助手 Gemini 也呈现在三星的 Galaxy Z Fold6、摩托罗拉 Razr+等手机里。
与此同时,其他制作商也发布要推出本身的手机 AI,曩昔几个月最受存眷的莫过于苹果,雷同的一个偏向和理念是交融自家的利用法式生态。
在这差不多一年光阴里,「AI 手机」可以说已经成了市场对待手机的焦点视角,不仅仅是谷歌手机。若何再用AI让人面前目今一亮,对谷歌来说是个挑战。今朝来看,与推出第一代AI手机Pixel 8时相似,谷歌输出最多的照样各类 AI 功效小对象。
在本年的 Made By Google 运动上,谷歌重点推出的AI新功效包含:
「Add Me」,纵然是摄影的人也能把本身拍进合照里;
「Pixel Studio 」,一款AI图像天生器,与苹果即将推出的Image Playground利用异常类似;
「Pixel Screenshots」,它可以扫描用户图库中的截图,将它们改变为一个易于搜刮的数据库;
「Call Notes」,可以保留通话记载中的信息择要,激该死功效后通话中的每小我都邑收到关照。
此中,假如想实现「Add Me」的功效,拍照师起首拍摄一张没有本身的照片,然后由另一小我当拍照师,再拍一张照片。Pixel 会将两张照片归并,确保每小我都在一张照片里,无需找生疏人协助摄影。
集体合照功效|图片起源:谷歌
谷歌给 Pixel 9 系列定位的一年夜卖点还有AI相机,自封为「天下第一个 AI 驱动的相机」。谷歌高管还称「Pixel 是第一个在照片和视频中使用夜视功效的手机,如今它也是第一个在低光情况下拍摄绚丽全景景致和城市景观的手机。」在宣布会上,谷歌高管还将 Pixel 9 Pro XL 拍摄的照片与苹果的 iPhone 15 Pro Max 进行对照。
谷歌手机 vs 苹果手机夜晚摄影后果|起源:谷歌
超年夜屏的折叠款 Pixel 9 Pro Fold 还有一个「Made You Look」功效,能用来吸引用户的注意力,让他们对着镜头笑。用该功效时,睁开手机,一侧外屏上会播放惹人注目标视觉动画,好比一个亮黄色的小鸡,或者其他搞怪的动画。
吸引用户注意的屏幕功效|图片起源:谷歌
拍完照之后,还有修图对象,谷歌图片的 Magic Editor 本年又推出了一些新功效。好比 「Auto Frame」功效,用于校订倾斜照片的角度,同时使用天生式AI填补主体四周的空缺,形成更辽阔的视野。还有「Reimagine」功效,在文本框中描写想要的后果,就可以用天生式 AI 来 P 图,好比将地上的草酿成野花,在天空的某个部门加个热气球等。
此外,谷歌紧随苹果的脚步,推出一种在紧迫环境下使用「卫星 SOS」功效,这项功效让用户可以在没有蜂窝服务的环境下,接洽紧迫救援职员并共享地位信息。据谷歌高管称,Pixel 9 系列将是「首批可以或许使用卫星 SOS 的 Android 手机。」
卫星 SOS 功效|图片起源:谷歌
从功效上看,Pixel 9+ Gemini 的组合,并没有在 AI 方面领先如今海内 Android 厂商太多。但要注意的是,与苹果分歧,Google 既有本身的体系和终端,又有年夜模子和云计算,是今朝所有公司中在「软硬芯云」真正完成闭环的公司。
一旦终端 AI 呈现突破口,万事俱备的 Google 「再次巨大」的可能性,要比竞争敌手年夜异常多。
大概,Google 欠缺的,只是一个更年夜的野心。
*头图起源:谷歌
本文为极客公园原创文章,转载请接洽极客君微信 geekparkGO