數(shù)據(jù)科學(xué)家生成朋友間的聊天記錄,說話方式、奇聞趣事全學(xué)了!
在如今這個時代,微信等通訊軟件已經(jīng)成為了日常生活必不可少的組成要素。
而數(shù)據(jù)科學(xué)家伊茲-米勒(Izzy Miller)又進(jìn)一步認(rèn)為,群組聊天在當(dāng)今社會是一件「神圣」的事情。
無論是在哪個社交軟件上,它都是你和你最好的朋友一起玩耍的地方,我們會在群組中分享各種關(guān)于生活的消息或者趣聞。
米勒表示,我在的群聊對我來說,算是一種慰藉,是一個連接點(diǎn)。
接著他開始了奇思妙想:有沒有可能模仿我和我的平臺,生成一些群聊記錄呢?
robo boys!
米勒使用了與微軟的 Bing 和 OpenAI 的 ChatGPT 等聊天機(jī)器人相同的技術(shù),克隆了他和他朋友的群組聊天。
自從他和五個朋友在大學(xué)里第一次認(rèn)識開始,已經(jīng)過去了七年。七年里,他們每天都在聊天。
他表示,克隆群聊記錄這件事出乎意料的簡單,整個項(xiàng)目只花了幾個周末的時間和一百美元就搞定了。
而最終的結(jié)果并沒有因此打折扣,反倒質(zhì)量很高。
米勒對這個結(jié)果感到驚訝。這個模型在很大程度上了解到了關(guān)于他和他的五個朋友的大部分事情,不僅僅包括說話的方式。
甚至,這個模型還知道他們們在和誰約會,在哪里上學(xué),住在哪里。
該模型可以說是 AI 最新發(fā)展的衍生品。而主人公米勒其實(shí)是一名數(shù)據(jù)科學(xué)家,他醉心于這項(xiàng)技術(shù)已經(jīng)有一段時間了。
「我在一家名叫 Hex 的創(chuàng)業(yè)公司上班,Hex 正好有我需要的工具來實(shí)現(xiàn)這個模型?!?/p>
他在一篇博客中詳細(xì)講解了該模型所需的所有技術(shù)步驟,并把這個模型叫做「robo boys」。
「robo boys」從一個大語言模型開始,從網(wǎng)絡(luò)上的各種來源中搜刮來大量的文本進(jìn)行訓(xùn)練,并且該大語言模型具有一些語言技能。
然后米勒對「robo boys」進(jìn)行細(xì)致的調(diào)整,輸入更加具有針對性的數(shù)據(jù)集,以實(shí)現(xiàn)某一特定的任務(wù)。
不過,米勒表示,該系統(tǒng)仍然存在一些問題。最主要的就是,群聊中的六個人性格不同,但是「robo boys」在處理上可能會有一些模糊,也就是說六個人在聊天記錄中展現(xiàn)的區(qū)別沒有那么大。
造成這一問題的主要原因是,AI 模型沒有時間概念 —— 時間會對我們?nèi)祟惍a(chǎn)生影響。具體點(diǎn)說,同一個人在不同的時間點(diǎn)對其他人的意義不同,他們自身可能也會有不同。
另外米勒指出,「robo boys」生成的聊天記錄并不是基于其對聊天記錄內(nèi)容本身的理解,而是基于聊天記錄中某一話題出現(xiàn)的次數(shù)的頻繁程度。
比方說,生成的聊天記錄好像這六個好朋友還在上大學(xué),正是因?yàn)檫@六個人在大學(xué)期間聊天聊得最多。
朋友,還是真的好!
有些網(wǎng)友認(rèn)為,「robo boys」可能會有一些意想不到的負(fù)面影響。
他們認(rèn)為,AI 可以通過大量文本進(jìn)行學(xué)習(xí),然后輸出對話,也許有一天,有些人會利用 AI 來應(yīng)付采訪、問詢,甚至來自警察的詰問。
還有人認(rèn)為,AI 既然能生成聊天記錄,興許有一天人們會更依賴于和 AI 建立友情。畢竟,我們?nèi)缃袼幍臅r代的最大特點(diǎn),就是大量交流都存在于線上。而來自 AI 的陪伴會更加的可靠。
然而主人公米勒卻不這么認(rèn)為。
雖說「robo boys」能生成他和他五個朋友的聊天記錄,但根源在于,他們六個人本身的關(guān)系好,他們才是這些充滿生活味兒的對話的創(chuàng)作者,而不是 AI。
他表示,他正打算邀請他的五個好朋友聚一聚。他們六個人已經(jīng)很久沒有聚在一起過了。
而在聚會上,他會展示由「robo boys」生成的聊天記錄。
他相信,他們會像過去那樣暢快地聊天,看著生成的聊天記錄,喝著酒,聊著天,開懷大笑。
畢竟,友誼是真的,六個好朋友是真的,情感是真的。
而這些東西,人工智能顯然是不可能取代的。
參考資料:
https://www.theverge.com/2023/4/13/23671059/ai-chatbot-clone-group-chat
本文來自微信公眾號:新智元 (ID:AI_era)
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。