設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

【IT之家評(píng)測室】訊飛星火大模型 V4.0 體驗(yàn):全面進(jìn)化,體驗(yàn)不輸 GPT-4o

2024/7/5 14:46:05 來源:IT之家 作者:汐元 責(zé)編:汐元

在 6 月 27 日舉辦的訊飛星火 V4.0 發(fā)布會(huì)上,科大訊飛發(fā)布了訊飛星火大模型 V4.0,以及在醫(yī)療、教育、商業(yè)等多個(gè)領(lǐng)域的人工智能應(yīng)用。

訊飛星火大模型 V4.0 基于全國首個(gè)國產(chǎn)萬卡算力集群“飛星一號(hào)”訓(xùn)練而成,全面提升了大模型底座的七大核心能力。整體超越 GPT-4 Turbo,特別是針對(duì)復(fù)雜指令、復(fù)雜邏輯推理、空間推理、數(shù)學(xué)、基于邏輯關(guān)系的多模理解等方面有著顯著的提升。

20240703142006

同時(shí)科大訊飛還帶來了全新升級(jí)的訊飛星火 App / Desk,發(fā)布“個(gè)人空間”,打造每個(gè)人的 AI 助手。

為了進(jìn)一步了解訊飛星火大模型 V4.0 的實(shí)際體驗(yàn),IT之家也對(duì)其做了一番體驗(yàn)評(píng)測,今天就為大家送上體驗(yàn)報(bào)告。

一、訊飛星火 App / Desk 功能升級(jí)

隨著訊飛星火大模型 V4.0 到來,星火 App / Desk 也迎來了功能升級(jí)。先以訊飛星火 Desk 為例,進(jìn)入主界面,可以看到元素更加豐富,左上角多了“創(chuàng)建智能體”的功能入口,左側(cè)欄還有新的“智能體中心”,右側(cè)多了“個(gè)人空間”界面。

微信圖片編輯_20240704214404

點(diǎn)擊左下角的頭像可打開“我的”標(biāo)簽,在底部中間的輸入框則可以進(jìn)行對(duì)話。

20240703142237

App 端的界面也有大變化,底部變成了“對(duì)話”、“智能體”、“空間”、“個(gè)人”四個(gè)選項(xiàng)卡,每個(gè)選項(xiàng)卡對(duì)應(yīng)的功能界面也各不相同,更加豐富。

20240703143030

1、對(duì)話功能

在“對(duì)話”功能中,增加了長文本問答的能力,點(diǎn)擊對(duì)話框右側(cè)的上傳文件按鈕即可上傳文件進(jìn)行對(duì)話。

20240703143201

IT之家上傳了一份關(guān)于中國通信標(biāo)準(zhǔn)化協(xié)會(huì)有關(guān)擴(kuò)展現(xiàn)實(shí)產(chǎn)業(yè)的調(diào)查報(bào)告,讓它幫忙進(jìn)行摘要,它果然很快就能給出準(zhǔn)確的摘要,和文檔本身的主要內(nèi)容也是貼合的。

20240703143402

然后小編還針對(duì)文檔中的一些內(nèi)容對(duì)訊飛星火 V4.0 進(jìn)行提問,比如小編問它“文檔中對(duì) MR 的定義是什么?”它也給出了準(zhǔn)確的答案,對(duì)照文檔中的相關(guān)解釋,回答得沒毛病。

20240703143446

點(diǎn)擊對(duì)話界面頂部的返回按鈕,就能進(jìn)入對(duì)話列表界面,你創(chuàng)建的對(duì)話都能在這里顯示,還可以進(jìn)行置頂或刪除。

20240703143530

通過頂部的搜索功能,還可以用關(guān)鍵詞搜索相關(guān)的智能體、“我的空間”中的文檔以及待辦事項(xiàng)等信息。

8acda730f221fff665c040883c37acee-side

2、智能體

隨著生成式 AI 的發(fā)展,智能體將成為大模型在應(yīng)用層面的重要方向。而目前,訊飛星火開放了超過 16000 智能體,覆蓋職場、生活、創(chuàng)作等多場景,打造開箱即用的大模型應(yīng)用。

面向?qū)I(yè)垂直場景,訊飛星火 App / Desk 目前首批上線 14 個(gè)智能體,包括訊飛曉醫(yī)、曉知、星火合同助手、訊飛智作、訊飛智文等。

20240703144356

以搭載訊飛星火醫(yī)療大模型的“訊飛曉醫(yī)”為例,它可以為你提供癥狀自查、藥物查詢、中醫(yī)辨證、報(bào)告解讀、醫(yī)院和科室推薦以及飲食建議等功能。

比如在報(bào)告解讀中,小編選擇一份血常規(guī)檢測報(bào)告中的兩個(gè)異常指標(biāo),來讓訊飛星火 V4.0 進(jìn)行判斷,分別是“紅細(xì)胞壓積微 50.80”和“紅細(xì)胞 6.01(10^12 / L)”,訊飛星火 V4.0 給出的判斷和原來檢測報(bào)告給出的判斷是一樣的,并且還給出了可能造成指標(biāo)異常的原因。

20240703144518

日常生活中,當(dāng)我們吃藥時(shí)經(jīng)常會(huì)遇到“不知道這兩種藥能不能一起吃”的困擾,專門為此去詢問醫(yī)生也比較麻煩,這時(shí)就可以用“訊飛曉醫(yī)”的拍照功能,同時(shí)拍下兩個(gè)藥盒,“訊飛曉醫(yī)”就會(huì)結(jié)合自身的專業(yè)知識(shí)來告訴你這兩個(gè)藥是否可以一起吃。

這里小編用自己之前起帶狀皰疹時(shí)醫(yī)生開的兩種藥來對(duì)其進(jìn)行測試,同時(shí)拍下兩個(gè)藥盒,當(dāng)小編說出胳膊起皰疹時(shí),“訊飛曉醫(yī)”初步判斷為帶狀皰疹,然后給出了帶狀皰疹的相關(guān)科普以及用藥建議,在用藥建議中能看到這兩個(gè)藥可以一起吃,這和醫(yī)生開出來的結(jié)果也是一樣的。

20240703144624

除了拍藥品,你還可以將你的體檢報(bào)告拍照上傳,讓“訊飛曉醫(yī)”來幫你分析,比如小編將自己過去做過的肝膽脾臟超聲體檢單拍照讓“訊飛曉醫(yī)”來看,它給出了詳細(xì)的分析結(jié)果,其中特別是肝臟的分析是很準(zhǔn)確的,有輕微的脂肪肝。

不過小編還是要提醒大家注意,最后結(jié)果和治療放肆還是要聽專業(yè)醫(yī)生的建議。訊飛曉醫(yī)主要為大家提供有用的健康科普信息。

20240703144729

再測試一個(gè)比較實(shí)用的智能體:星火合同助手,它支持合同智審、合同生成、合同比對(duì)和合同概要等功能,這里以合同智審為例,小編通過拍照上傳一份駕校陪練簽的合同,通過 AI 識(shí)別,訊飛合同助手成功幫我鑒別出合同中有關(guān)培訓(xùn)時(shí)間進(jìn)度安排、費(fèi)用跳關(guān)、補(bǔ)考費(fèi)、電子路考訓(xùn)練費(fèi)、教練員資質(zhì)、違約責(zé)任等方面的風(fēng)險(xiǎn)點(diǎn),這些點(diǎn)我們?cè)诤炗喓贤瑫r(shí)很有可能考慮不到,因此有了星火合同助手,顯然可以幫我們有效規(guī)避這些風(fēng)險(xiǎn)。

20240703145625

3、個(gè)人空間和人設(shè)標(biāo)簽功能體驗(yàn)

過去很多時(shí)候我們使用 AI 大模型產(chǎn)品輸入輸出得到的結(jié)果都是公開的信息,而對(duì)于我們個(gè)人的信息,那些公開的大模型就無能為力。但其實(shí)無論是學(xué)習(xí)、工作還是生活,我們往往需要大模型能更懂我們個(gè)人的需求,有一個(gè)屬于我們個(gè)人的知識(shí)庫,全新升級(jí)的訊飛星火也考慮到了這一點(diǎn),特別推出了“個(gè)人空間”的功能。

“個(gè)人空間”相當(dāng)于是為用戶打造的專屬私域知識(shí)庫,通過上傳個(gè)人文檔,讓大模型進(jìn)行更精確的知識(shí)問答和內(nèi)容生成;并且通過人設(shè)標(biāo)簽、日程管理、信息訂閱、創(chuàng)建發(fā)音人,為用戶提供更加個(gè)性化和趣味化的服務(wù)。

在個(gè)人空間里,上傳的文檔默認(rèn)會(huì)按時(shí)間順序進(jìn)行排列,你也可以切換到不同文件分類的條目下進(jìn)行查看。

20240703145839

選擇對(duì)應(yīng)的一個(gè)或多個(gè)文件,你就可以針對(duì)這些選中的文件進(jìn)行翻譯、總結(jié)、理解、分析或者其他形式的問答,

20240703145956

比如小編上傳了自己手機(jī)里關(guān)于最近日程安排待辦事項(xiàng)的截圖,選擇這個(gè)截圖,點(diǎn)擊“更多問答”,就可以進(jìn)入對(duì)話界面,然后小編詢問“我未來幾日有什么安排”?訊飛星火就能準(zhǔn)確地將我未來幾天需要完成的事情一一列出,還很準(zhǔn)確,和小編原來在手機(jī)上設(shè)定的一樣。

20240703150128

再比如小編上傳了一份過去某個(gè) 10 月份自己所寫的文章統(tǒng)計(jì) EXCEL 表格,選中后點(diǎn)擊“Excel”分析選項(xiàng),進(jìn)入對(duì)話界面,小編首先問它“我這個(gè)月寫了多少篇文章”,它準(zhǔn)確地回答出了 21 篇文章。然后小編又問它“我寫的所有文章一共有多少字”,它則給出了 50563 個(gè)字。小編算了一下,也是正確的。

20240703152127

另外,在小編的個(gè)人空間里還有幾篇和新能源汽車“三電”系統(tǒng)相關(guān)的研報(bào)資料,測試時(shí),小編同時(shí)選擇 5 個(gè)資料文檔,讓訊飛星火根據(jù)這 5 個(gè)資料文件寫一篇關(guān)于介紹新能源汽車“三電”系統(tǒng)的文章,文章內(nèi)容需要包含:

(1)什么是新能源汽車的“三電”系統(tǒng)。

(2)新能源汽車的“三電”系統(tǒng)各自有什么技術(shù)門類?

(3)我國在新能源汽車“三電”系統(tǒng)方面的發(fā)展現(xiàn)狀。

20240704164217

可以看到,訊飛星火同樣很快就給出了一篇小短文,短文語義流暢,要求的內(nèi)容都包含在內(nèi)了,結(jié)構(gòu)也比較清晰,不過整體略顯程式化,拿來使用的話可以稍做修改。

另外在短文中,訊飛星火 V4.0 還給出了引用來源的標(biāo)注,某段話來自于資料的那部分,都有來源說明,讓文章更加有理有據(jù),減少了大模型幻覺的情況。

除了個(gè)人空間,訊飛星火 App / Desk 現(xiàn)在還可以通過人設(shè)標(biāo)簽,日程管理、信息訂閱、創(chuàng)建發(fā)音人等,帶來更加個(gè)性化和趣味化的服務(wù)。

以 App 為例,在“我的”欄目里,現(xiàn)在可以設(shè)置自己的人設(shè)標(biāo)簽,選定某個(gè)人設(shè)標(biāo)簽后,大模型會(huì)根據(jù)你的標(biāo)簽提供個(gè)性化的內(nèi)容和回答。

20240703153722

比如小編首先在未設(shè)定任何標(biāo)簽的情況下,讓訊飛星火寫一篇探討什么是最有意義的生活的短文,然后在設(shè)置中把自己的標(biāo)簽設(shè)定為“引經(jīng)據(jù)典,文化內(nèi)涵”,然后同樣的要求再讓訊飛星火寫一篇。對(duì)比兩篇短文:

20240703153703

20240703153650

可以看到,在設(shè)定“引經(jīng)據(jù)典,文化內(nèi)涵”的標(biāo)簽后,訊飛星火輸出的短文確實(shí)加入了不少名言典故,包括《孟子?告子下》、《論語?陽貨》、《論語?述而》等等。

總體來說,全新升級(jí)的訊飛星火 App / Desk 功能更強(qiáng)大、更豐富,但在交互布局上并沒有顯得凌亂,無論是星火 App 還是星火 Desk 各項(xiàng)功能層級(jí)都有序、清晰,而且豐富的智能體的加入讓訊飛星火更好用、更實(shí)用,個(gè)人空間以及個(gè)性標(biāo)簽等個(gè)性化的功能,則讓訊飛星火能夠成為更懂你的大模型 AI 助手。

二、訊飛星火大模型 V4.0 通用能力體驗(yàn)

正如前文所說,本次訊飛星火 V4.0 在通用能力方面全面提升了大模型底座的七大核心能力,特別是針對(duì)復(fù)雜指令、復(fù)雜邏輯推理、空間推理、數(shù)學(xué)、基于邏輯關(guān)系的多模理解等方面有著顯著的提升。同時(shí)在多模態(tài)能力上也得到了再升級(jí)。

這里IT之家也針對(duì)這些通用能力做了體驗(yàn)測試,測試過程中小編用 GPT-4o 來進(jìn)行對(duì)比,方便大家對(duì)訊飛星火 V4.0 的體驗(yàn)有深入的認(rèn)知。

1、視頻理解能力體驗(yàn)

訊飛星火 V4.0 在多模態(tài)能力上目前已經(jīng)可以支持視頻的分析、理解能力,在測試時(shí),IT之家上傳了一段此前發(fā)布過的視頻節(jié)目,來讓他進(jìn)行分析。這段視頻是關(guān)于 2023 年蘋果 WWDC 快速回顧的內(nèi)容,小編讓訊飛星火 V4.0 簡述一下視頻內(nèi)容,它的回答很準(zhǔn)確,完整給出了視頻的核心內(nèi)容。

20240702104603

而 GPT-4o 目前還不支持視頻分析的功能,同樣的問題讓 GPT-4o 來回答,會(huì)出現(xiàn)“無法處理”的信息。

20240702132206

還是針對(duì)這段視頻,小編又問了兩個(gè)問題,分別是視頻的作者是誰,以及作者來自哪里,訊飛星火 V4.0 的回答又是完全正確。

20240702134547

然后小編又問視頻作者是如何看待蘋果 Vision Pro 這款產(chǎn)品的?訊飛星火 V4.0 也給出了正確的回答,說明它確實(shí)是在理解這段視頻的內(nèi)容。

20240702153137

2、圖文能力測試

除了視頻理解能力,圖文能力也是大家使用大模型比較多的功能。這里IT之家首先考察圖片理解能力。

小編先上傳一張網(wǎng)絡(luò)搞笑圖片,一只小狗戴著奧特曼的面具,問訊飛星火 V4.0 這張圖片的笑點(diǎn)在哪里。訊飛星火 V4.0 準(zhǔn)確分析出了圖片的笑點(diǎn)。

20240702154526

然后再問 GPT-4o,它的回答和訊飛星火 V4.0 差不多,也準(zhǔn)確解釋了圖片的笑點(diǎn)。

20240702154514

接著IT之家用一道幾何證明題來考驗(yàn)訊飛星火 V4.0:

20240702171230

上傳這張圖片,直接讓訊飛星火 V4.0 進(jìn)行解答,可以看到,它給出的答案是正確的,解題的過程也沒有什么問題。

20240702171554

再讓 GPT-4o 來解答一下這道題,結(jié)果就有點(diǎn)奇怪了,雖然最終答案是正確的,但 GPT-4o 輸出的內(nèi)容中有 2/3 都是錯(cuò)誤的解題步驟,自我發(fā)現(xiàn)后又重新整理思路,最后輸出正確答案中所用的中位線定理也是錯(cuò)的。

iShot_2024-07-02_17.18.47

再看文生圖的能力,這也是目前很多人都會(huì)用到的功能。小編首先讓訊飛星火 V4.0 畫一張賽博朋克風(fēng)格的鬧市街頭,它生成的圖片還是很貼切的:

20240704164807

緊接著小編讓它換成中國風(fēng)的風(fēng)格,給出的圖片也很不錯(cuò),很好的展現(xiàn)了中國古代風(fēng)格的鬧市,畫面精致清晰、符合要求。

20240704164835

再看 GPT-4o,生成的圖片也很好看。

20240702174101

還是讓它換成中國風(fēng)的風(fēng)格,畫面整體風(fēng)格和上一張區(qū)別不大,里面多了一些中國風(fēng)建筑的元素。

20240704165109

3、邏輯推理能力測試

邏輯推理能力是這次訊飛星火 V4.0 的一大升級(jí)看點(diǎn),測試時(shí)IT之家也重點(diǎn)考察了訊飛星火 V4.0 在邏輯思維方面的表現(xiàn)。

首先是生活常識(shí)推理方面,小編問了一個(gè)問題:

1991 年 1 月 25 日至 2024 年 3 月 2 日一共多少天(首尾都算)

訊飛星火 V4.0 給出了詳細(xì)的演算步驟,小編看了一下,思路很清晰,結(jié)果是 12091 天,正確。

未命名 3

而同樣的問題,使用 GPT-4o 來算,它直接給出了答案,也是正確的。小編繼續(xù)追問計(jì)算的步驟,沒想到 GPT-4o 在運(yùn)算步驟里給了一段 Python 的代碼,算是美中不足。

未命名

接著小編問了一個(gè)對(duì)邏輯思維要求更高一些的題目:

假設(shè)有一個(gè)池塘,里面有無窮多的水,現(xiàn)有兩個(gè)空水壺,容積分別是 5 升與 6 升。問如何用這兩個(gè)水壺從池塘里取得 3 升的水?

對(duì)于這個(gè)問題訊飛星火 V4.0 的回答步驟清晰,邏輯清楚,實(shí)際可操作性也沒有問題。

20240702215552

GPT-4o 方面,邏輯思維也挺清楚,實(shí)際可操作性也沒有問題,不過生成的答案重復(fù),說明的文字較多,步驟也略繁瑣些,也算是美中不足吧。

未命名 2

然后小編又問了一個(gè)推理聯(lián)想類的題目:

找規(guī)律:1=2,2=6,3=12,4=?

對(duì)于這個(gè)問題,訊飛星火 V4.0 給出了詳細(xì)的思考步驟,還給出了規(guī)律的公式,結(jié)果當(dāng)然也是正確的。

20240702220358

GPT-4o 方面給出的思考步驟和答案也沒什么問題:

未命名 4

4、數(shù)學(xué)能力測試

前面我們測試過兩款大模型的邏輯推理能力,與之相似的其實(shí)還有數(shù)學(xué)答題的能力,可以更進(jìn)一步檢測大模型的“智商水平”。測試時(shí),我們直接上今年全國高考卷的真題。

比如這一題:

數(shù)學(xué)題1

這是一道函數(shù)解析幾何的題目,訊飛星火 V4.0 成功做出了回答,小編看了一下答案,是正確的。

20240702221501

至于 GPT-4o,一頓操作猛如虎,一看答案沒算出。

未命名 5

接著看更難一點(diǎn)的單選題最后一題:

20240702222423

訊飛星火 V4.0 給出的答案很簡潔,雖然小編殘存的數(shù)學(xué)知識(shí)不多,但看解題步驟,還是沒問題的,最后的結(jié)果也是正確的。

20240703093439

GPT-4o 這次也給出了正確的答案,不過解題步驟稍顯復(fù)雜,有些步驟并沒有太大的必要。

未命名 6

5、語言理解能力測試

在語言理解能力方面,IT之家主要測試大模型的文本信息抽取能力、情感分析能力、翻譯能力和歧義理解能力。

首先文本信息抽取能力方面,我們選擇了IT之家此前發(fā)布的兩篇新聞進(jìn)行雜糅,讓大模型從中提取信息,問題如下:

20240703094534

先看訊飛星火 V4.0 的回答,前兩個(gè)問題的回答都是準(zhǔn)確的,最后一個(gè)問題需要繞個(gè)彎,訊飛星火 V4.0 已經(jīng)知道了 5 月和 1-5 月的出口數(shù)據(jù),只差相減這一步。

20240703094713

GPT-4o 的回答同樣也是前兩個(gè)問題回答得很準(zhǔn)確,但第三個(gè)問題直接輸出了錯(cuò)誤的答案。

20240703095004

接著看情感分析能力,小編在這里抽取了 2022 年江蘇連云港終稿語文試卷的一道閱讀理解題目,題目如下:

未命名 7

對(duì)于這兩個(gè)問題,訊飛星火 V4.0 分別給出了答案。IT之家將訊飛星火 V4.0 的回答和標(biāo)準(zhǔn)答案做比對(duì),雖然語言表達(dá)上有出入,但整體意思是沒問題的,標(biāo)準(zhǔn)答案中需要體現(xiàn)的點(diǎn)訊飛星火 V4.0 在回答中也覆蓋到了。

20240703102656

GPT-4o 給出的回答也沒什么問題,對(duì)文章作者的情感把握也是比較準(zhǔn)確的,第二題的回答相對(duì)來說也更有條理性一些。

20240703102809

翻譯能力方面,IT之家從外媒 tomshardware 找來一段新聞的節(jié)選,其中有許多科技專有名詞,考驗(yàn)兩款大模型的翻譯能力:

20240703104531

訊飛星火 V4.0 的翻譯整體來說語言通順流暢,意思也比較清晰明確,其中的專業(yè)名詞也沒有錯(cuò)翻、漏翻。

20240703104049

GPT-4o 這邊的翻譯效果也很好,和訊飛星火 V4.0 差不多。

最后是語言歧義的理解能力,IT之家找來一句可能產(chǎn)生歧義的句子讓大模型去分析:

分析并修改下面這句話中可能產(chǎn)生歧義的問題:

縣里的通知說,讓趙鄉(xiāng)長本月 15 日前去報(bào)到。

訊飛星火 V4.0 準(zhǔn)確分析出了居中可能存在歧義的原因,在于時(shí)間表述不清楚,給出的兩種修改方案都可以讓句子沒有歧義。

20240703104944

GPT-4o 對(duì)這句話的歧義問題分析就出現(xiàn)了偏差,修改的結(jié)果也不對(duì),有點(diǎn)不知所云。

20240703105021

6、內(nèi)容生成能力測試

內(nèi)容生成可能是大家使用大模型最常用的功能,用來輔助我們進(jìn)行一些文案創(chuàng)作。這里小編也對(duì)兩款大模型進(jìn)行了測試。

首先小編想讓他們幫我寫一篇招聘文案:

招聘要求: 有經(jīng)濟(jì)學(xué)專業(yè)背景,有傳媒方向工作經(jīng)驗(yàn),文筆優(yōu)秀,能接受經(jīng)常出差。

招聘待遇: 有五險(xiǎn)一金,月薪 15K 起,工作環(huán)境新適優(yōu)雅,節(jié)假日還有禮品,一年一次旅行團(tuán)建。

文案要求: 風(fēng)格輕松幽默,500 字以內(nèi)。

訊飛星火 V4.0 給出的文案基本上沒有什么扣分點(diǎn):

20240703113106

GPT-4o 寫的文案也很優(yōu)秀,要求的點(diǎn)都滿足了。

未命名 8

上班族們經(jīng)常會(huì)需要寫一些方案、活動(dòng)計(jì)劃之類的,這時(shí)候也可以借助大模型的內(nèi)容生成能力來幫助自己更快地完成任務(wù)。這里IT之家以“我司計(jì)劃開展一個(gè)讀書活動(dòng),幫我寫一個(gè)活動(dòng)方案”為需求,來進(jìn)行測試。

訊飛星火給出的方案則是比較完整的,時(shí)間、地點(diǎn)、目標(biāo)、流程、前期準(zhǔn)備、人員配置、預(yù)算評(píng)估、結(jié)果評(píng)估等環(huán)節(jié)都有,而且不缺細(xì)節(jié),可用性很高。

未命名 9-side

GPT-4o 的計(jì)劃書相對(duì)簡潔一些,但也比較完整,該有的地方都有了。

未命名 11-side

7、代碼生成能力測試

用 AI 大模型輔助寫代碼也是一些程序員常遇到的使用場景,這也可以視為大模型內(nèi)容生成能力的重要組成。

測試時(shí),小編首先用下面這個(gè)問題來考驗(yàn)兩個(gè)大模型:

請(qǐng)用 c# 語言生成以下代碼:給你一個(gè)字符串 s,找到 s 中最長的回文子串。

如果字符串的反序與原始字符串相同,則該字符串稱為回文字符串。

代碼請(qǐng)遵循以下模板:

public class Solution {

public string LongestPalindrome(string s) {

}

}

我們以代碼能直接拿來使用為準(zhǔn)則,將大模型生成的代碼用程序運(yùn)行工具進(jìn)行檢測,看是否能直接完美運(yùn)行。

首先還是看訊飛星火 V4.0,它給出的代碼格式標(biāo)準(zhǔn),算法也比較簡潔,看起來很清爽。

未命名 13

由于小編自己不懂代碼,所以直接拿到檢測工具中運(yùn)行檢測,發(fā)現(xiàn)這段代碼可以直接運(yùn)行,輸出結(jié)果也是準(zhǔn)確的,也就是說可以直接拿來用。

20240703115403

GPT-4o 這邊,給出的代碼同樣有規(guī)范的格式,也比較簡潔.

gpt

拿到檢測軟件中運(yùn)行,也可以成功運(yùn)行,表現(xiàn)同樣不錯(cuò)。

各平臺(tái)

總體來說,在大模型的通用能力方面,訊飛星火 V4.0 和目前 ChatGPT 最先進(jìn)的 GPT-4o 模型相比,從小編測試的情況來看已經(jīng)不相上下,在多模態(tài)、邏輯思維、數(shù)學(xué)能力等方面甚至還要好于 GPT-4o,在日常生活和工作中,大家完全可以只用訊飛星火 V4.0,就能帶來非常大的效率提升和其他方面的助益。

結(jié)語

訊飛星火大模型從去年 5 月份正式發(fā)布,到目前迭代到第四個(gè)大版本,僅僅只有一年多的時(shí)間,這一年多里,訊飛星火的進(jìn)步可以說是神速,從最基礎(chǔ)的開放式問答到 AI 智能助手、再到多模態(tài)能力、全語音交互,還有訊飛友伴等,再到如今智能體、個(gè)人空間等功能的上線,訊飛星火的功能在變得越來越全面且強(qiáng)大的同時(shí),也關(guān)注到用戶對(duì)于內(nèi)容生成“個(gè)性化”的需求,如今的訊飛星火 V4.0 目前最全能、應(yīng)用屬性最強(qiáng)的 AI 大模型產(chǎn)品之一了。

在發(fā)布會(huì)上,科大訊飛還談到了訊飛星火大模型在國家能源集團(tuán)、中國石油、中國移動(dòng)、中國人保、太平洋保險(xiǎn)、交通銀行等重點(diǎn)行業(yè)的應(yīng)用,可見訊飛星火已經(jīng)在 AI 大模型領(lǐng)域構(gòu)建起自主可控的獨(dú)特優(yōu)勢(shì),而通過對(duì)訊飛星火 V4.0 的體驗(yàn),IT之家也對(duì)訊飛星火未來在 AI 領(lǐng)域的表現(xiàn)充滿期待,相信他們能夠持續(xù)進(jìn)化,讓國產(chǎn) AI 大模型技術(shù)和應(yīng)用生態(tài)真正實(shí)現(xiàn)國際化的引領(lǐng)。

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:訊飛,訊飛語音

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知