IT之家 6 月 6 日消息,蘋果公司在周一的 WWDC 2023 主題演講中,除了發(fā)布了備受期待的 Mac Pro 和 Vision Pro 等新產(chǎn)品外,還展示了其在機(jī)器學(xué)習(xí)領(lǐng)域的最新進(jìn)展。不過IT之家注意到,與微軟和谷歌等競爭對手大力宣傳生成式人工智能不同,蘋果公司在演講中并沒有提及“人工智能”這個詞,而是更多地使用了“機(jī)器學(xué)習(xí)”和“ML”這樣的術(shù)語。
例如,在 iOS 17 的演示中,軟件工程高級副總裁 Craig Federighi 介紹了自動糾錯和語音識別的改進(jìn):
自動糾錯是由設(shè)備上的機(jī)器學(xué)習(xí)驅(qū)動的,多年來,我們不斷地提升這些模型。鍵盤現(xiàn)在利用了一種 transformer 語言模型,這是目前最先進(jìn)的詞預(yù)測技術(shù),使得自動糾錯比以往更加準(zhǔn)確。而且,借助 Apple Silicon 芯片的強(qiáng)大性能,iPhone 可以在你每次按下一個鍵時運行這個模型。
值得注意的是,蘋果公司在其主題演講中提到了人工智能領(lǐng)域的一個術(shù)語“transformer”。該公司具體談到了一種“transformer 語言模型”,這意味著其人工智能模型使用了 transformer 架構(gòu),這是近期許多生成式人工智能所使用的底層技術(shù),例如 DALL-E 圖像生成器和 ChatGPT 聊天機(jī)器人。transformer 模型(一個于 2017 年首次提出的概念)是一種用于自然語言處理(NLP)的神經(jīng)網(wǎng)絡(luò)架構(gòu),采用了自注意力機(jī)制,使其能夠優(yōu)先處理序列中不同的單詞或元素。其能夠并行地處理輸入,從而顯著提高了效率,并在 NLP 任務(wù)中取得了突破性的進(jìn)展,如翻譯、摘要和問答。
據(jù)蘋果公司介紹,iOS 17 中的新 transformer 模型可以實現(xiàn)句級別的自動糾錯,當(dāng)你按下空格鍵時,它可以完成一個單詞或整個句子。還會根據(jù)你的寫作風(fēng)格進(jìn)行學(xué)習(xí),從而指導(dǎo)其建議。蘋果公司還表示,語音識別“采用了一種基于 transformer 的語音識別模型,利用神經(jīng)引擎使語音識別更加準(zhǔn)確”。
在主題演講中,蘋果公司還多次提到了“機(jī)器學(xué)習(xí)”,比如在描述新 iPad 鎖屏功能(“當(dāng)你選擇一張 Live Photo 時,我們使用一種先進(jìn)的機(jī)器學(xué)習(xí)模型來合成額外的幀”);iPadOS PDF 功能(“利用新的機(jī)器學(xué)習(xí)模型,iPadOS 可以識別 PDF 中的字段,讓你可以使用自動填充功能快速填寫信息,比如從你的聯(lián)系人中獲取的姓名、地址和電子郵件等?!保籄irPods 自適應(yīng)音頻功能(“通過個性化音量,我們使用機(jī)器學(xué)習(xí)來了解你的收聽偏好隨時間的變化”);以及 Apple Watch 小部件功能 Smart Stack(“Smart Stack 使用機(jī)器學(xué)習(xí)在你需要的時候向你展示相關(guān)信息”)。
蘋果公司還推出了一款叫做 Journal 的新應(yīng)用,可利用設(shè)備端機(jī)器學(xué)習(xí)提供個性化建議,為用戶帶來日記靈感。這些建議根據(jù)用戶近期活動智能生成,包括照片、人物、地點、體能訓(xùn)練等,幫助用戶更輕松地開始記錄。
最后,在演示 Vision Pro 頭顯時,該公司透露,用戶眼睛上的動態(tài)圖像是由掃描你的臉部創(chuàng)建的一個特殊的 3D 頭像 —— 當(dāng)然,這也是機(jī)器學(xué)習(xí)的功勞。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。