當(dāng)今時代,健康已成為人們生活中最為關(guān)注的核心議題之一。從日常的健康管理到疾病的早期篩查與精準(zhǔn)治療,除了傳統(tǒng)的醫(yī)療服務(wù),通過更先進(jìn)的技術(shù)手段,實現(xiàn)高效、精準(zhǔn)且個性化的健康管理來滿足大家對醫(yī)療健康服務(wù)的需求已經(jīng)不是不可能。比如說 AI,就為這種需求的滿足帶來了前所未有的變革機(jī)遇。
而就在最近,訊飛醫(yī)療基于星火 X1 首發(fā)的星火醫(yī)療大模型 X1,就讓我們看到了通過 AI 為每個人帶來個性化健康管理和醫(yī)療咨詢服務(wù)的可能。
我們知道,當(dāng)前生成式 AI 行業(yè)正在從 AI 訓(xùn)練向大規(guī)模推理和應(yīng)用轉(zhuǎn)型,DeepSeek 今年以來的火熱出圈就是很好的例證。而大規(guī)模推理模型和健康醫(yī)療領(lǐng)域的結(jié)合,自然也很令人期待。
具體來說,大家現(xiàn)在打開訊飛曉醫(yī) App,就能看到曉醫(yī)已經(jīng)正式上線了“星火醫(yī)療大模型 X1”,該模型進(jìn)一步提升了多步循證推理能力,為用戶提供更加個性化、更專業(yè)、更實用的健康咨詢服務(wù)。
訊飛曉醫(yī),是科大訊飛推出的首款面向居民提供的 AI 健康助手應(yīng)用,它依托訊飛星火醫(yī)療大模型億級高質(zhì)量權(quán)威醫(yī)學(xué)知識數(shù)據(jù)庫,可以為大家提供癥狀自查、藥物查詢、報告解讀和個性化健康檔案管理等一系列醫(yī)療健康服務(wù)。
那么,有了星火醫(yī)療大模型 X1 加持的訊飛曉醫(yī)如今體驗如何呢,今天大家不妨就和IT之家一同來通過實際體驗了解一下。
一、深度分析能力測試
對于普通消費(fèi)者來說,當(dāng)我們使用 AI 來輔助健康管理和咨詢醫(yī)療相關(guān)的信息時,最看重的自然就是 AI 模型的專業(yè)性,也就是它給我們的信息是否專業(yè)、可信。其次,集成這樣的 AI 能力的產(chǎn)品應(yīng)該好用、實用,能夠真正給我們帶來切實可行的醫(yī)療建議。
不僅如此,我們還需要 AI 能夠更懂我們,了解我們長線的健康狀況,從而能針對我們每個人提供個性化的服務(wù)。
這些應(yīng)該是我們評判一段大模型在健康醫(yī)療方面服務(wù)能力時需要重點(diǎn)關(guān)注的點(diǎn)。
接下來,我們不妨通過一些問題來進(jìn)行測試,看看他們在面對一些醫(yī)療和健康問題時會有怎樣的表現(xiàn)。
測試前需要說明的是,小編會分別在開啟和關(guān)閉星火醫(yī)療大模型 X1(以下簡稱“大模型 X1”)的情況下進(jìn)行測試,從而讓大家可以更直觀地感受到大模型 X1 能夠?qū)τ嶏w曉醫(yī)尋醫(yī)問診體驗帶來的變化。
首先,小編問了一個問題:血栓患者吃利伐沙班的藥一年了,能長期吃嗎?對身體有什么影響?
在開啟星火醫(yī)療大模型 X1 的情況下,訊飛曉醫(yī)回答這個問題耗時 15 秒,在回答時展現(xiàn)出詳細(xì)的思考過程,先查看了我提交的病史檔案,然后分析利伐沙班藥物藥理,接著結(jié)合藥理和我的病史和用藥史先后分析了藥物相互作用的問題和長期用藥的問題,整個邏輯鏈條是比較通順的。
而給出的回答條理也很清晰,先后給出了利伐沙班的適應(yīng)癥和療程、長期使用的風(fēng)險監(jiān)測等信息,我在問題中沒有提到藥物相互作用的考慮,它也主動給出了相關(guān)參考建議。不僅如此,訊飛曉醫(yī)還針對我的個體情況給出了針對性的血栓治療建議,考慮到了我病史中高血脂和脂肪肝的風(fēng)險因素。此外,還主動給出了日常管理建議。
可以看到,訊飛曉醫(yī)給出的回答在專業(yè)性和實用性上都很強(qiáng),同時讓人驚艷的是它完整全面的邏輯思考,將我問題中提到的和沒提到的因素都考慮到了,并給出了相應(yīng)的醫(yī)學(xué)建議。
另外值得一提的是,通過這個問題,訊飛曉醫(yī)識別到我可能患有血栓,還主動建議我添加到既往病史中以完善健康檔案,這一點(diǎn)很細(xì)節(jié)。
然后小編把大模型 X1 關(guān)閉,同樣的問題再問一遍。
這一次,訊飛曉醫(yī)并沒有展現(xiàn)出細(xì)致的思考推理過程,而是結(jié)合我的檔案和 2 篇醫(yī)學(xué)知識,給出了兩個方面的參考信息,首先是利伐沙班可以長期服用的特定情況,這個過程并沒有特別針對我個體的情況細(xì)致分析,其次,曉醫(yī)列出了長期服用利伐沙班對身體可能產(chǎn)生的影響,總體來說都是偏知識性的回答,盡管答案都是正確的,也具有不錯的參考價值,但整體實用性、個性化方面確實不如開啟大模型 X1 時的回答。
接下來,小編問了第二個問題:我?guī)滋靵砼紶柍霈F(xiàn)頭暈,但沒有伴隨旋轉(zhuǎn)感、惡心、嘔吐、視力模糊或走路不穩(wěn)等其他癥狀,請問如何緩解頭暈癥狀?
這一次我們先不開啟大模型 X1,可以看到曉醫(yī)主要是參考了丁香醫(yī)生的一篇醫(yī)學(xué)知識,提示頭暈可能是由低血壓、貧血、耳內(nèi)平衡器官等問題造成,同時結(jié)合我描述的病癥給出了生活調(diào)理、物理治療和藥物治療三方面的改善建議??梢哉f具有一定的參考價值。
然后,小編開啟大模型 X1。這一次,訊飛曉醫(yī)結(jié)合我的病史、手術(shù)史等情況做了詳細(xì)分析,在回答中考慮到了小編高血脂、脂肪肝可能間接帶來的頭暈癥狀。在緩解性建議中,也是結(jié)合我自身的情況給出了針對性的建議,比如提醒我少吃高油脂、動物內(nèi)臟等食物,控制血脂。
此外曉醫(yī)給給出了醫(yī)學(xué)監(jiān)測和干預(yù)的建議以及藥物緩解的建議,特別是就醫(yī)指征中提示若出現(xiàn)頭痛、言語不清徐排出腦血管問題,還建議完善頸動脈超聲排查血管狹窄,心電圖檢查排查心率失常,這些建議都是非常具體可操作且很明確的,實用性很高,通常情況下,我們?nèi)メt(yī)院,一般也會先做這些檢查以逐步排除病因。
然后,小編又詢問了一個問題:手部腳腕部出現(xiàn)極癢疹子,越撓越癢,5,6 天后漸老化,但會留下一個小硬包,已有半個月了,什么原因?怎么辦?
在開啟大模型 X1 的情況下,你可以看到訊飛曉醫(yī)在思考中是如何根據(jù)小編的病史情況和問題中描述的癥狀一步步排除各種因素,分析可能導(dǎo)致手部出現(xiàn)疹子的原因的,整個過程思路很是清晰,而在處理建議方面,也考慮了各種適合或者不適合的處理方式。
最后給出的回答中,首先列出了對小編這個個體情況來說最可能導(dǎo)致起疹的誘因,處理方案中,也列出了急性止癢、外用藥物、生活方式干預(yù)等三種類別下各自具體可操作的建議,還提示需要警惕的情況。另外訊飛曉醫(yī)還針對我的高血脂和脂肪肝給出了需要特別注意的事項,以及藥理上避免自行使用強(qiáng)效激素或偏方的建議。
關(guān)閉大模型 X1 再問一遍,這次訊飛曉醫(yī)追問了一些關(guān)于病癥的一些細(xì)節(jié)癥狀,包括起疹的詳細(xì)部位、大小形狀、是否做過相關(guān)檢查等問題,小編需要一一做回答。
經(jīng)過多輪問診解答后,訊飛曉醫(yī)也給出了準(zhǔn)確的病因分析和處置建議,整體看起來和開啟大模型 X1 時直接給出的分析結(jié)果也差不多,只是在回答中涉及的知識的全面性上相比開啟大模型 X1 有所不足。
整體來說,如果說開啟星火醫(yī)療大模型 X1 之前的訊飛曉醫(yī)是一個知識淵博的人在根據(jù)現(xiàn)有的資料為你答疑解惑,那么開啟大模型 X1 之后的訊飛曉醫(yī)則更像是一個真實的私人醫(yī)生在根據(jù)對你的了解來分析病癥、給出健康管理的建議。
小編在體驗的過程中,基本沒遇到大模型醫(yī)療幻覺的問題,在回答復(fù)雜問題時,他也能像真實的醫(yī)生那樣逐步解釋循證,因此在面對一些復(fù)雜問題時也展現(xiàn)出很高的邏輯正確性、專業(yè)性和可解釋性。同時它還能讀取你的健康檔案,給出獨(dú)屬于你自己的、不是適用于所有人的答案,這一點(diǎn)也讓訊飛曉醫(yī)的實用性和可信賴性大大增強(qiáng)。
二、多模態(tài)解讀報告單、醫(yī)學(xué)影像能力測試
除了上面這些大家日常生活中可能會經(jīng)常遇到的有關(guān)健康管理、尋醫(yī)問診的問題,還有一些痛點(diǎn)場景也很值得一說,就是很多人在體檢之后拿到報告單,面對一些異常指標(biāo)里的各種專業(yè)術(shù)語往往會不知所措,這時候就迫切需要一位專業(yè)的健康助手來答疑解惑。
那么 AI 是否能很好地?fù)?dān)任這一角色呢,IT之家也做了一波測試。
首先,小編在訊飛曉醫(yī)中上傳了一張 PDF 體檢報告單,然后訊飛曉醫(yī)就可以直接幫我進(jìn)行報告解讀。
解讀完成后,可以看到訊飛曉醫(yī)給出的解讀內(nèi)容非常豐富,先是在總體評估中準(zhǔn)確判斷出報告中純在的各項異常指標(biāo),然后又針對每一項異常指標(biāo)進(jìn)行醫(yī)學(xué)原理解讀和就醫(yī)指導(dǎo),在就醫(yī)指導(dǎo)中又根據(jù)異常項目的嚴(yán)重情況區(qū)分了“立即就診”、“定期復(fù)查”、“日常關(guān)注”三個類別,由于這部分內(nèi)容很詳細(xì),小編截取其中片段供大家參考,不難發(fā)現(xiàn)呈現(xiàn)的方式很直觀、細(xì)致,甚至指明了復(fù)查科室。
不僅如此,訊飛曉醫(yī)還列出了根據(jù)這份報告的異常指標(biāo),給出了報告主體在日常生活中需要關(guān)注飲食和運(yùn)動方面的建議。整體來說非常專業(yè)、詳盡。
另外,訊飛曉醫(yī)還直接提供了找醫(yī)院的選項,點(diǎn)開后能夠看到我所在地附近可以去的醫(yī)院,小編看了一下,都是本地評價比較好的醫(yī)院。
用訊飛曉醫(yī)測試完之后,IT之家也很好奇,目前另外兩個比較熱門的大模型 DeepSeek 和 GPT-o1 會有怎樣的表現(xiàn)呢?于是又把同樣的問題拋給 DeepSeek 和 GPT-o1,來進(jìn)行一波對比。
首先是 DeepSeek,它給出的解讀結(jié)果要簡單不少,不過核心的異常指標(biāo)也都提煉了出來,也有對應(yīng)的健康管理建議,整體上專業(yè)性上還是不如訊飛曉醫(yī)。
GPT-o1 方面,結(jié)果和 DeepSeek 比較類似,異常項目判斷的是比較全的,也有簡單的應(yīng)對建議,但整體來說還是訊飛曉醫(yī)更專業(yè)和詳盡。
很多時候我們拿到的報告單可能不止一份,而且彼此是有關(guān)聯(lián)的,這時候訊飛曉醫(yī)能不能同時解讀兩張報告單并進(jìn)行分析呢?小編也做了測試。
測試時,小編將一份血液常規(guī)報告單連同當(dāng)時做的腹部 B 超影像一起交給訊飛曉醫(yī)進(jìn)行解讀??梢钥吹?,訊飛曉醫(yī)不僅清楚列出了血液檢測中的異常項目,也識別出腹部 B 超報告中存在中度脂肪肝、膽囊多發(fā)結(jié)石的問題。訊飛曉醫(yī)還列出了 4 條應(yīng)對建議,每一條都是針對異常項目的,其中還包括針對我個人的脂肪肝病史給出了專門的建議,很實用,可以讓我們更有方向地了解報告內(nèi)容,便于進(jìn)一步就醫(yī)問診。
接著,小編也用 DeepSeek 做了測試,同樣的問題給 DeepSeek,可以看到 DeepSeek 將正常項目和異常項目混在一起,看起來不夠清晰直觀,也不能結(jié)合本人的病史檔案進(jìn)行分析,整體來說屬于比較機(jī)械的解讀,雖然沒有錯誤,但實用性稍低一些。
再看 GPT-o1,這次 GPT-o1 給出的解讀能直接找出報告中的異常項目,相對來說實用性比 DeepSeek 要好一些,也有針對異常項目的應(yīng)對建議,和 DeepSeek 相比屬于是差不多的水平。
接下來,小編在自己最近一次血常規(guī)檢測中找到兩項異常指標(biāo),讓訊飛曉醫(yī)分析一下這兩項指標(biāo)異常意味著什么。
在訊飛曉醫(yī)的回答中,對這兩項異常指標(biāo)都做了比較專業(yè)的解讀,結(jié)合小編報告單中醫(yī)生給出的解釋,訊飛曉醫(yī)的回答都是正確的,這說明訊飛曉醫(yī)確實具有出色的專業(yè)性。
DeepSeek 方面,給出的回答也是比較專業(yè)且全面的,同時也有針對性的應(yīng)對建議。
最后,小編上傳了兩年間不同時間拍攝的兩張甲狀腺彩超報告單照片,考驗大模型能否根據(jù)多報告單進(jìn)行時序?qū)Ρ冉庾x。
訊飛曉醫(yī)面對這兩張照片,直接幫我將報告單中的照片的相關(guān)醫(yī)學(xué)指標(biāo)整理成了一份圖表,指標(biāo)情況的變化一目了然,這一點(diǎn)好評。當(dāng)然,它給出的判斷分析也是準(zhǔn)確的,甲狀腺左葉低回聲結(jié)節(jié)有所增大,但惡性風(fēng)險較低,同時給出了定期復(fù)查的建議,以及提醒關(guān)注血脂和脂肪肝的情況。
DeepSeek 的回答雖然不那么直觀,但整體上也是沒問題的。
整體來說可以看到,在多模態(tài)解讀報告單、醫(yī)學(xué)影像方面,訊飛曉醫(yī)的表現(xiàn)依然是非常專業(yè)且實用的,并且給出的建議也能夠根據(jù)用戶自己的健康檔案做到個性化、有針對性。DeepSeek 在這方面有著相似的專業(yè)性和實用性,但在部分場景下的回答還是略微不夠清晰明了,并且也不能根據(jù)用戶以往病史進(jìn)行個性化分析。但總體來說,訊飛曉醫(yī)和 DeepSeek 的表現(xiàn)都是明顯優(yōu)于 GPT-o1 的。
當(dāng)然,除了對報告單、醫(yī)學(xué)影像的解讀,作為一款專門針對醫(yī)療場景的健康助手應(yīng)用,訊飛曉醫(yī)還是利用 AI 大模型能力圍繞醫(yī)療場景做了一些更細(xì)化、更獨(dú)特的功能體驗。比如在拍一拍中,你可以通過拍藥盒來讓訊飛曉醫(yī)來給你用藥建議。
這里小編用自己之前起蕁麻疹時醫(yī)生開的兩種藥來對其進(jìn)行測試,同時拍下兩個藥盒,當(dāng)小編說出胳膊起疹時,“訊飛曉醫(yī)”初步判斷為蕁麻疹,然后給出了蕁麻疹的相關(guān)科普以及用藥建議,在用藥建議中能看到這兩個藥可以一起吃,這和醫(yī)生開出來的結(jié)果也是一樣的。
再比如訊飛曉醫(yī)還有個性化的健康空間,這里匯總了你上傳的所有病歷、報告單、使用的藥物和體檢報告等信息,同時你還可以在這里完善你的健康史、包括既往病史、個人吸煙和飲酒情況以及家族病史等,這些都會成為你向訊飛曉醫(yī)咨詢時重要的參考信息。
不僅如此,訊飛曉醫(yī)還會根據(jù)你填寫的健康史信息主動幫你生成一份飲食建議,比如小編有高脂血癥、脂肪肝,它就幫我生成了對應(yīng)的健康飲食計劃,早餐、午餐、晚餐適合吃什么都安排得好好的。當(dāng)然,除了飲食計劃,訊飛曉醫(yī)還可以給你提供對應(yīng)的運(yùn)動建議,包括適合的運(yùn)動、運(yùn)動中需要注意的事項等等。
你還可以為你的家庭成員建立健康檔案,所有的這些功能也都適用于家庭成員。這些都是 DeepSeek 等通用類大模型產(chǎn)品所無法提供的,可見,訊飛曉醫(yī)確實是更適合普通用戶的 AI 健康助手。
結(jié)語
通過上面的一系列體驗和測試,相信大家已經(jīng)能夠發(fā)現(xiàn),在引入星火醫(yī)療大模型 X1 后,訊飛曉醫(yī)首先是和自己相比,在面對健康醫(yī)療問題時整個應(yīng)對的專業(yè)性、邏輯性和完善性都有了質(zhì)的提升,這也是推理模型為訊飛曉醫(yī)帶來的新能力。
而對比 DeepSeek、GPT-o1 這樣的明星推理大模型產(chǎn)品,訊飛曉醫(yī)在健康醫(yī)療領(lǐng)域也展現(xiàn)出了足夠強(qiáng)的競爭力,和 DeepSeek 相比在很多細(xì)節(jié)回答上表現(xiàn)更優(yōu),對比 GPT-o1 則有比較明顯的優(yōu)勢。
同時小編要著重強(qiáng)調(diào)的是,得益于構(gòu)建個人數(shù)字健康空間的能力,訊飛曉醫(yī)能夠結(jié)合你和家人的健康檔案提供針對性的健康建議,從而讓訊飛曉醫(yī)的個性化和實用性大大增強(qiáng)。
而像 DeepSeek / GPT-o1 等由于是通用模型,給出的回答自然也是面向所有用戶的,缺乏針對性,不僅如此,在更多的醫(yī)療細(xì)節(jié)場景需求上也不太能滿足,比如主動幫你制定健康飲食、運(yùn)動計劃等等。
升級后的訊飛曉醫(yī)使用久了,你會覺得他好像就是一個懂你的私人健康管家,能掌握你的健康狀況,幫你解決醫(yī)療上的一些問題,并給出可行的建議。普通人平時有個頭疼腦熱的小毛病,如果只想要網(wǎng)上搜一搜了解身體狀況的時候,不妨用更實用更靠譜的健康 AI 助手訊飛曉醫(yī)。當(dāng)然,同時也需要說明的是,目前 AI 給出的信息終究也只起到輔助參考的作用,它能夠為我們應(yīng)對健康問題時提供便利,但訊飛曉醫(yī)不能代替醫(yī)生,醫(yī)生的臨床經(jīng)驗還是至關(guān)重要哦,建議大家以醫(yī)生的建議為準(zhǔn)。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。