設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

ChatGPT 教你寫 AI 包教包會,準(zhǔn)確度最高達 99.7%

量子位 2023/2/8 19:32:08 責(zé)編:夢澤

原文標(biāo)題:《ChatGPT 教你寫 AI 包教包會,7 段對話寫個識別模型,準(zhǔn)確度最高達 99.7%》

現(xiàn)在,AI 小白甚至都不需要看教程,僅憑 ChatGPT 就可以創(chuàng)建模型。

它不僅幫你找數(shù)據(jù)集、訓(xùn)練模型寫代碼,還能評估準(zhǔn)確性、創(chuàng)建程序一步到位。

就有這么一個 25 歲小哥,讓 ChatGPT 幫他創(chuàng)建了個地理位置識別程序,最終準(zhǔn)確率最高達 99.7%。

而且各種細(xì)節(jié)步驟全在,一邊干活還一邊教你學(xué)習(xí)。

這一波,被 ChatGPT 感動到了。

更貼心的是,在每次答疑解惑完,ChatGPT 都會說上一句:如果你有任何疑問,請告訴我。

具體實現(xiàn)

項目一開始,這位小哥開宗明義:我不想努力了,你可以幫我創(chuàng)建一個 AI 程序嗎?

以兩個坐標(biāo)為輸入,并預(yù)測他們在哪個國家。

而 ChatGPT“欣然”接受挑戰(zhàn),還提醒這位小哥,需要相應(yīng)數(shù)據(jù)集,否則模型無法訓(xùn)練。另外要是還有更多信息,就更好了。

首先,需要找到合適的數(shù)據(jù)集。

小哥再問 ChatGPT,結(jié)果它到是二話不說直接扔出了三個供其選擇,介紹鏈接都有。

從三個數(shù)據(jù)集來看,自然地球數(shù)據(jù)集顯然更好,而且還有“邊界”、海岸線等信息,這也就意味著要向模型解釋“邊界”概念,分隔標(biāo)簽。但作為新人而言,第一個數(shù)據(jù)集與任務(wù)相關(guān)的數(shù)據(jù)更多,模型更容易實現(xiàn),作者最終選擇了第一個數(shù)據(jù)集。

將這個決定告訴 ChatGPT 之后,緊接著它就來教你創(chuàng)建 DataFrame(數(shù)據(jù)框架),并給出了示例代碼。

執(zhí)行成功后,就來到了第二階段:模型訓(xùn)練。ChatGPT 也二話不說地給了份代碼,甚至還附上了詳細(xì)解釋。

該代碼將使用 k-NN 算法根據(jù)給定的坐標(biāo)來預(yù)測國家。KNN 算法是一種簡單的算法,它根據(jù)輸入的 k 個最近鄰的大多數(shù)類對輸入進行分類。

在這個例子中,數(shù)據(jù)被分成訓(xùn)練集和測試集,比例為 80-20。然后用訓(xùn)練集對 KNN 分類器進行訓(xùn)練,并用測試集對模型的精度進行測試。

請記住,這是一個簡單的示例,模型的準(zhǔn)確性可能不高。您可以嘗試使用不同的算法和 k 的不同值進行實驗,看看是否可以提高模型的準(zhǔn)確性.

在丟棄一些空白數(shù)據(jù)(沒有坐標(biāo)的國家)之后,首次執(zhí)行 k-NN 訓(xùn)練成功,并有 99.7% 的準(zhǔn)確率。

不過這個結(jié)果并不是那么滿意,作者歸結(jié)了這幾個方面的原因:不同國家之間的數(shù)據(jù)分布不均;存在一些數(shù)據(jù)錯誤;偏見等問題。

這樣也就來到了第三步:重新評估。

在這段代碼中,我使用 OpenCage 地理編碼 API 從坐標(biāo)中獲取國家信息。您需要使用 API 密鑰替換 YORBAPI _ KEY 以獲得對 API 的訪問權(quán)限。你可以在 OpenCage 網(wǎng)站上注冊一個免費的 API 密鑰。

按照說明,作者修改了代碼,結(jié)果顯示出現(xiàn)了很多 NA 錯誤,相當(dāng)于只剩下 30% 數(shù)據(jù)。不過這個地球確實大部分都是水。(也沒毛病,Doge)

最終模型準(zhǔn)確性下降了一些,有 98.6%,但這個結(jié)果作者表示很滿意,畢竟只有 7 個對話回合就幫忙造出來一個 AI 模型來。

還嘗試了其他算法

不過這不是小哥的第一次嘗試。第一次談話時,他用了同一來源的較小數(shù)據(jù)集,需要更多數(shù)據(jù)集校正,而 ChatGPT 提供的第一個模型訓(xùn)練代碼是邏輯回歸,只有 51% 的準(zhǔn)確性。

而后它又嘗試了不同的“求解器”(準(zhǔn)確率約為 65%),以及其他算法,包括隨機森林和 k-NN,準(zhǔn)確率分別為 93% 和 92%。

這位 25 歲小哥在 SentinelOne 擔(dān)任高級安全研究員,研究和開發(fā)惡意軟件檢測邏輯。

他因為對機器學(xué)習(xí)很感興趣開始自學(xué)有一定基礎(chǔ),在本次對話中其實他特意以小白的身份與 ChatGPT 對話,結(jié)果被強大的效果驚艷到。

最后他還表示,真的在考慮用“他們”而不是“它”來稱呼 ChatGPT。

所以 AI 小白們,ChatGPT 快用起來吧。(Doge)

完整對話:

https://sharegpt.com/c/7zLivmp

參考鏈接:

  • https://xrl1.sh/posts/coordinates-model-with-ChatGPT/

本文來自微信公眾號:量子位 (ID:QbitAI),作者:白交

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:ChatGPT,代碼

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應(yīng)用 魔方 最會買 要知